key什么意思(key的多种意思)
一 前言
在Redis的使用过程中,我们经常会遇到BigKey(下文将其称为"大key")及HotKey(下文将其称为"热key")。大Key与热Key如果未能及时发现并进行处理,很可能会使服务性能下降、用户体验变差,甚至引发大面积故障。二 大Key与热Key的定义
我们经常能够在公司内部的Redis开发使用规范手册,或网络中大量的Redis最佳实践文章里看到有关大Key、热Key的定义,然而这些资料中的大Key热Key判定标准却不尽相同,但可以明确的是,它们的判定维度是一致的:大Key通常都会以数据大小与成员数量来判定,而热Key则以其接收到的请求频率、数量来判定。
1 什么是大Key
通常我们会将含有较大数据或含有大量成员、列表数的Key称之为大Key,下面我们将用几个实际的例子对大Key的特征进行描述:一个STRING类型的Key,它的值为5MB(数据过大)一个LIST类型的Key,它的列表数量为20000个(列表数量过多)一个ZSET类型的Key,它的成员数量为10000个(成员数量过多)一个HASH格式的Key,它的成员数量虽然只有1000个但这些成员的value总大小为100MB(成员体积过大)
需要注意的是,在以上的例子中,为了方便理解,我们对大Key的数据、成员、列表数给出了具体的数字。为了避免误导,在实际业务中,大Key的判定仍然需要根据Redis的实际使用场景、业务场景来进行综合判断。
2 什么是热Key
在某个Key接收到的访问次数、显著高于其它Key时,我们可以将其称之为热Key,常见的热Key如:某Redis实例的每秒总访问量为10000,而其中一个Key的每秒访问量达到了7000(访问次数显著高于其它Key)对一个拥有上千个成员且总大小为1MB的HASH Key每秒发送大量的HGETALL(带宽占用显著高于其它Key)对一个拥有数万个成员的ZSET Key每秒发送大量的ZRANGE(CPU时间占用显著高于其它Key)三 大Key与热Key带来的问题
在Redis的使用中,大Key及热Key会给Redis带来各种各样的问题,而最常见的问题为性能下降、访问超时、数据不均衡等。
1 大Key带来的常见问题Client发现Redis变慢;Redis内存不断变大引发OOM,或达到maxmemory设置值引发写阻塞或重要Key被逐出;Redis Cluster中的某个node内存远超其余node,但因Redis Cluster的数据迁移最小粒度为Key而无法将node上的内存均衡化;大Key上的读请求使Redis占用服务器全部带宽,自身变慢的同时影响到该服务器上的其它服务;删除一个大Key造成主库较长时间的阻塞并引发同步中断或主从切换;
2 热Key带来的常见问题热Key占用大量的Redis CPU时间使其性能变差并影响其它请求;Redis Cluster中各node流量不均衡造成Redis Cluster的分布式优势无法被Client利用,一个分片负载很高而其它分片十分空闲从而产生读/写热点问题;在抢购、秒杀活动中,由于商品对应库存Key的请求量过大超出Redis处理能力造成超卖;热Key的请求压力数量超出Redis的承受能力造成缓存击穿,此时大量强求将直接指向后端存储将其打挂并影响到其它业务;四 大Key与热Key的常见产生原因
业务规划不足、Redis不正确的使用、无效数据的堆积、访问突增等都会产生大Key与热Key,如:将Redis用在并不适合其能力的场景,造成Key的value过大,如使用String类型的Key存放大体积二进制文件型数据(大Key);业务上线前规划设计考虑不足没有对Key中的成员进行合理的拆分,造成个别Key中的成员数量过多(大Key);没有对无效数据进行定期清理,造成如HASH类型Key中的成员持续不断的增加(大Key);预期外的访问量陡增,如突然出现的爆款商品、访问量暴涨的热点新闻、直播间某大主播搞活动带来的大量刷屏点赞、游戏中某区域发生多个工会间的战斗涉及大量玩家等(热Key);使用LIST类型Key的业务消费侧代码故障,造成对应Key的成员只增不减(大Key);五 找出Redis中的大Key与热Key
大Key与热Key的分析并不困难,我们有多种途径和手段来对Redis中的Key进行分析并找出其中的"问题"Key,如Redis的内置功能、开源工具、阿里云Redis控制台中的Key分析功能等。
1 使用Redis内置功能发现大Key及热Key
Redis内置的一些命令、工具都可以帮助我们来发现这些问题Key。当你对Redis的大Key热Key已有明确的分析目标时,可以通过如下命令对对应Key进行分析。
通过Redis内置命令对目标Key进行分析
可能你会选择使用debug object命令对Key进行分析。该命令能够根据传入的对象(Key的名称)来对Key进行分析并返回大量数据,其中serializedlength的值为该Key的序列化长度,你可能会选择通过该数据来判断对应Key是否符合你的大Key判定标准。
需要注意的是,Key的序列化长度并不等同于它在内存空间中的真实长度,此外,debug object属于调试命令,运行代价较大,并且在其运行时,进入Redis的其余请求将会被阻塞直到其执行完毕。而该命令的运行的时间长短取决于传入对象(Key名)序列化长度的大小,因此,在线上环境中并不推荐使用该命令来分析大Key,这可能引发故障。
Redis自4.0起提供了MEMORY USAGE命令来帮助分析Key的内存占用,相对debug object它的执行代价更低,但由于其时间复杂度为O(N)因此在分析大Key时仍有阻塞风险。
我们建议通过风险更低方式来对Key进行分析,Redis对于不同的数据结构提供了不同的命令来返回其长度或成员数量,如下表:
通过以上Redis内置命令我们可以方便且安全的对Key进行分析而不会影响线上服务,但由于它们返回的结果非Key的真实内存占用数据,因此不够精确,仅可作为参考。
通过Redis官方客户端redis-cli的bigkeys参数发现大Key
如果你并无明确的目标Key用于分析,而是希望通过工具找出整个Redis实例中的大Key,此时redis-cli的bigkeys参数能够方便的帮你实现这个目标。
Redis提供了bigkeys参数能够使redis-cli以遍历的方式分析整个Redis实例中的所有Key并汇总以报告的方式返回结果。该方案的优势在于方便及安全,而缺点也非常明显:分析结果不可定制化。
bigkeys仅能分别输出Redis六种数据结构中的最大Key,如果你想只分析STRING类型或是找出全部成员数量超过10的HASH Key,那么bigkeys在此类需求场景下将无能为力。
GitHub上有大量的开源项目能够实现bigkeys的加强版使结果能够按照配置定制化输出,另外你可也以动手使用SCAN TYPE并配合上文表格中的命令自己实现一个Redis实例级的大Key分析工具。
同样,该方案的实现方式及返回结果使其不具备精确性与实时性,建议仅作为参考。
通过Redis官方客户端redis-cli的hotkeys参数发现热Key
Redis自4.0起提供了hotkeys参数来方便用户进行实例级的热Key分析功,该参数能够返回所有Key的被访问次数,它的缺点同样为不可定制化输出报告,大量的信息会使你在分析结果时复杂度较大,另外,使用该方案的前提条件是将redis-server的maxmemory-policy参数设置为LFU。
通过业务层定位热Key
指向Redis的每一次访问都来自业务层,因此我们可以通过在业务层增加相应的代码对Redis的访问进行记录并异步汇总分析。该方案的优势为能够准确并及时的分析出热Key的存在,缺点为业务代码复杂度的增加,同时可能会降低一些性能。
使用monitor命令在紧急情况时找出热Key
Redis的monitor命令能够忠实的打印Redis中的所有请求,包括时间信息、Client信息、命令以及Key信息。在发生紧急情况时,我们可以通过短暂执行monitor命令并将输出重定向至文件,在关闭monitor命令后通过对文件中请求进行归类分析即可找出这段时间中的热Key。
由于monitor命令对Redis的CPU、内存、网络资源均有一定的占用。因此,对于一个已处于高压状态的Redis,monitor可能会起到雪上加霜的作用。同时,这种异步收集并分析的方案的时效性较差,并且由于分析的精确度取决于monitor的执行时间,因此在多数无法长时间执行该命令的线上场景中本方案的精确度也不够好。
2 使用开源工具发现大Key
Redis的高度流行使我们能够方便的找到大量开源方案来解决我们当前遇到的难题:在不影响线上服务的同时得到精确的分析报告。
使用redis-rdb-tools工具以定制化方式找出大Key
如果你希望按照自己的标准精确的分析一个Redis实例中所有Key的真实内存占用并避免影响线上服务,在分析结束后得到一份简洁易懂的报告,redis-rdb-tools是非常好的选择。
该工具能够对Redis的RDB文件进行定制化的分析,但由于分析RDB文件为离线工作,因此对线上服务不会有任何影响,这是它的最大优点但同时也是它的最大缺点:离线分析代表着分析结果的较差时效性。对于一个较大的RDB文件,它的分析可能会持续很久很久。
3 依靠公有云的Redis分析服务发现大Key及热Key
如果你期望能够实时的对Redis实例中的所有Key进行分析并发现当前存在的大Key及热Key、了解Redis在运行时间线中曾出现过哪些大Key热Key,使自己对整个Redis实例的运行状态有一个全面而又准确的判断,那么公有云的Redis控制台将能满足这个需求。
阿里云Redis控制台中的CloudDBA
CloudDBA是阿里云的数据库智能服务系统,它支持Redis大Key与热Key的实时分析、发现。
大Key及热Key分析底层为阿里云Redis内核的Key分析功能,该功能通过Redis内核直接发现并输出大Key热Key的相关信息,因此,该功能的分析结果准确性高效且对性能几乎无任何影响,你可以通过点击CloudDBA中的"Key分析"进入该功能,如下图1-1:
图1-1:阿里云Redis控制台CloudDBA
Key分析功能共有两个页面,它们允许在不同的时间维度对对应Redis实例中的Key进行分析:实时:对当前实例立即开始分析当前实例,展示当前存在的所有大Key及热Key。历史:展示该实例近期曾出现过的大Key及热Key,在历史页面中,所有出现过的大Key及热Key都会被记录,哪怕这些Key当前已经不存在。该功能能够很好的反映Redis的历史Key状态,帮助追溯过去或现场已遭破坏的问题。六 大Key与热Key的处理
现在,我们已经通过多种手段找到了Redis中的问题Key,那么我们应当立即着手对他们进行处理,避免它们在之后的时间中引发问题。
1 大Key的常见处理办法
对大Key进行拆分
如将一个含有数万成员的HASH Key拆分为多个HASH Key,并确保每个Key的成员数量在合理范围,在Redis Cluster结构中,大Key的拆分对node间的内存平衡能够起到显著作用。
对大Key进行清理
将不适合Redis能力的数据存放至其它存储,并在Redis中删除此类数据。需要注意的是,我们已在上文提到一个过大的Key可能引发Redis集群同步的中断,Redis自4.0起提供了UNLINK命令,该命令能够以非阻塞的方式缓慢逐步的清理传入的Key,通过UNLINK,你可以安全的删除大Key甚至特大Key。
时刻监控Redis的内存水位
突然出现的大Key问题会让我们措手不及,因此,在大Key产生问题前发现它并进行处理是保持服务稳定的重要手段。我们可以通过监控系统并设置合理的Redis内存报警阈值来提醒我们此时可能有大Key正在产生,如:Redis内存使用率超过70%,Redis内存1小时内增长率超过20%等。
通过此类监控手段我们可以在问题发生前解决问题,如:LIST的消费程序故障造成对应Key的列表数量持续增长,将告警转变为预警从而避免故障的发生。
对失效数据进行定期清理
例如我们会在HASH结构中以增量的形式不断写入大量数据而忽略了这些数据的时效性,这些大量堆积的失效数据会造成大Key的产生,可以通过定时任务的方式对失效数据进行清理。在此类场景中,建议使用HSCAN并配合HDEL对失效数据进行清理,这种方式能够在不阻塞的前提下清理无效数据。
使用阿里云的Tair(Redis企业版)服务避开失效数据的清理工作
如果你的HASH Key过多,同时存在大量的成员失效需要被清理的问题。由于大量Key与大量失效数据的叠加,在此类场景中定时任务已无法做到对无效数据进行及时的清理,阿里云的Tair服务能够很好的解决此类问题。
Tair是阿里云的Redis企业版,它在具备Redis所有特性(包括Redis的高性能特点)的同时提供了大量额外的高级功能。
TairHash是一种可为field设置过期时间和版本的hash类型数据结构,它不但和Redis Hash一样支持丰富的数据接口和高处理性能,还改变了hash只能为key设置过期时间的限制:TairHash允许为field设置过期时间和版本。这极大地提高了hash数据结构的灵活性,简化了很多场景下的业务开发工作。
TairHash使用高效的Active Expire算法,实现了在对响应时间几乎无影响的前提下,高效完成对field过期判断和删除的功能。此类高级功能的合理使用能够解放大量Redis的运维、故障处理工作并降低业务的代码复杂度,让运维将精力投入到其它更有价值的工作中,让研发有更多的时间来写更有价值的代码。
2 热Key的常见处理办法
在Redis Cluster结构中对热Key进行复制
在Redis Cluster中,热Key由于迁移粒度问题造成请求无法打散使单一node的压力无法下降。此时可以将对应热Key进行复制并迁移至其他node,例如为热Key foo复制出3个内容完全一样的Key并名为foo2,foo3,foo4,然后将这三个Key迁移到其他node来解决单一node的热Key压力。
该方案的缺点在于代码需要联动修改,同时,Key一变多带来了数据一致性挑战:由更新一个Key演变为需要同时更新多个Key,在很多时候,该方案仅建议用来临时解决当前的棘手问题。
使用读写分离架构
如果热Key的产生来自于读请求,那么读写分离是一个很好的解决方案。在使用读写分离架构时可以通过不断的增加从节点来降低每个Redis实例中的读请求压力。
然而,读写分离架构在业务代码复杂度增加的同时,同样带来了Redis集群架构复杂度的增加:我们不仅要为多个从节点提供转发层(如Proxy,LVS等)来实现负载均衡,还要考虑从节点数量显著增加后带来的故障率增加的问题,Redis集群架构变更的同时为监控、运维、故障处理带来了更大的挑战。
但是,这一切在阿里云Redis服务中显得极为简单,阿里云Redis服务以开箱即用的方式提供服务。同时,在业务的发展发生变化时,阿里云的Redis服务允许用户通过变配的方式调整集群架构来轻松应对,如:主从转变为读写分离,读写分构转变为集群,主从转变为支持读写分离的集群,以及由社区版直接转变为支持大量高级特性的企业版Redis(Tair)。
读写分离架构同样存在缺点,在请求量极大的场景下,读写分离架构会产生不可避免的延迟,此时会有读取到脏数据的问题,因此,在读写压力都较大写对数据一致性要求很高的场景下,读写分离架构并不合适。
使用阿里云Tair的QueryCache特性
QueryCache是阿里云Tair(Redis企业版)服务的企业级特性之一,它的原理如下图2-1:
图2-1:Tair QueryCache原理
阿里云数据库Redis会根据高效的排序和统计算法识别出实例中存在的热点Key,开启该功能后,Proxy点会根据设定的规则缓存热点Key的请求和查询结果(仅缓存热点Key的查询结果,无需缓存整个Key),当在缓存有效时间内收到相同的请求时Proxy会直接返回结果至客户端,无需和后端的Redis分片执行交互。在提升读取速度的同时,降低了热点Key对数据分片的性能影响,避免发生请求倾斜。
至此,来自客户端的同样的请求无需再与Proxy后端的Redis进行交互而由Proxy直接返回数据,指向热Key的请求由一个Redis节点承担转为多个Proxy共同承担,能够大幅度降低Redis节点的热Key压力,同时Tair的QueryCache功能还提供了大量的命令来方便用户查看、管理,如通过querycache keys命令查看所有被缓存热Key,通过querycache listall获取所有已缓存的所有命令等。
Tair QueryCache智能化的热Key判定与缓存联动功同样能够降低运维及研发的工作负担。
与传统的Redis同步中间件相比,阿里云Redis全球分布式缓存具有高可靠性、高吞吐低延迟、同步正确性高等特点。
作者 | 烟圈
原文链接:http://click.aliyun.com/m/1000291945/
本文为阿里云原创内容,未经允许不得转载。
韩国面积相当于中国哪个省(韩国财阀到底有多恐怖)放眼全球,东亚人真是太优秀了!东亚包括5个国家中国蒙古朝鲜韩国日本。蒙古人在古代建立了庞大的蒙古帝国成吉思汗是蒙古的骄傲。蒙古牧民养牛放羊,吃得起肉。很多人不知道的是,内陆国蒙古人
韩国立安倍下跪像什么情况?韩国立安倍下跪像怎么回事?韩国立安倍下跪像据外媒报道,近日,韩国平昌一家私营植物园在园区内新建了一座名为ldquo永恒赎罪rdquo的雕像。雕像由两部分组成,一位男子跪伏在地,向另一名端坐在一旁的ldquo
韩统一部朝鲜全境遭洪灾条件允许将提供援助据韩国媒体8月10日消息,韩国统一部发言人吕尚基10日在例行记者会上表示,朝鲜全境遭遇洪灾,治水面临严峻挑战。吕尚基说,本月16日,朝鲜江原道平康郡降雨量达854毫米,几乎接近朝鲜
外媒朝鲜运动员撑杆跳入韩境内这两天关于外媒朝鲜运动员撑杆跳入韩境内在网上的热度是非常高的,很多网友们也都是非常关注外媒朝鲜运动员撑杆跳入韩境内这个事情,为此小编也是在网上进行了一番搜索查阅相关的信息,那么如果
信乐团海阔天空歌词(经典老歌100首怀旧连播)信乐团海阔天空歌词(经典老歌100首怀旧连播)我们知道,香港殿堂级摇滚乐队BEYOND有首作品海阔天空,自1993年发表,被传唱至今,成为华语乐坛史上一首难以逾越的经典之作。凑巧的
贵阳酒博会(2021年成都春季糖酒会)贵阳酒博会(2021年成都春季糖酒会)9月8日下午,记者来到贵阳国际会议展览中心,对今年贵州酒博会现场展馆进行探访,发现各个展馆都在有序地搭建展台,部分参展商已经摆好酒器,多样化的
徐悲鸿妻子(徐悲鸿真迹值多少钱)徐悲鸿妻子(徐悲鸿真迹值多少钱)我国的民国时期,发生许多大事且非常精彩,虽然比较动乱,但是确实才子佳人出现的年代。他们在不同的领域发挥着自己的光和热,将自己才华提现的淋漓尽致。他们
徐悲鸿夫人(徐悲鸿的四个女人)徐悲鸿夫人(徐悲鸿的四个女人)孙多慈燕子矶头叹水逝,秦淮艳迹已消沉。荒寒剩有台城路,水月双清万古情。1930年,徐悲鸿在夫人即将回到南京之际,满含苦闷地写下了这样的诗句,并且给诗命
陈华亭赔了东奥多少钱(注会东奥和中华哪个好)从中级到注会,考试了好几年,中华东奥会计在线的课都买过,也听过不少老师的课。个人观点,考证最重要的是老师!选好老师有多重要?别的不说,你看现在孩子读小学,还非要挤个名校上就知道了。
鬼城是哪里(中国鬼城在哪儿)近年来,随着房地产行业的火热升温,不少城市都高楼平地起,可是因为不是每个城市都外来人口众多,而本地户有大多有住的房子,所以不少城市房子有了,却没有买的人,时间长了,整个城市也就越来
高铁提前多久到(高铁二等座选座技巧)高铁出行已经成为了旅游,商务,探亲等的主要交通工具,有以下几个优势相比飞机,时间可控,一般不晚点,费用较低,一般火车站也比去机场方便。相比汽车,安全性好,乘坐舒适,节约时间。总之,
白银美食(白银市特色美食及制作方法)白银美食(白银市特色美食及制作方法)烧锅子简介饭锅子是一种汉族面食小吃,属于甘肃永登地段农户经常食用的糇粮某某,因它有自己的独特气韵,故遭受人人欢迎。做法糖锅子形似选用亡好小麦面炮
甘肃属于哪个省(甘肃挨着哪个省最近)中国位于亚欧大陆的东部,太平洋的西部,是世界上邻国最多的国家,那么你知道中国有哪些边境省吗?其实大多数人在算边境省的时候,经常会漏掉一个省份,它就是甘肃。我将和大家一起了解一下甘肃
泉州在哪个省(甘肃泉州在哪里)澎湃新闻高级记者王俊正朝着万亿元俱乐部迈进的福建省经济强市泉州官方近日答复网友问询的该市行政区划调整问题时表示,目前正在进行大泉州行政区划调整的前期基础性工作。6月26日,有网友在
石家庄是哪个省的(贵州是属于哪个省份)人均GDP是衡量是否为发达城市的重要标准之一,也就是人均GDP2万美元以上,在2020年我国人均GDP已经达到7。24万元,已经连续两年超过1万美元。由于地理位置历史等各方面因素,
绍兴是哪个省的(绍兴属于哪个省份)绍兴浙江地级市,古称越州,越国于公元前490年建都于绍兴,距今已有近2500年的历史。绍兴市位于浙江省中北部杭州湾南岸,东连宁波,南临台州和金市,西接杭州,北隔钱塘江与嘉兴相望,绍
杭州哪个省的(上海市属于哪个省份)NO。1上海上海,简称沪或申,是中华人民共和国直辖市,国家中心城市,超大城市,中国的经济交通科技工业金融贸易会展和航运中心,首批沿海开放城市。上海NO。2杭州杭州,简称杭,浙江省省
兰州属于哪里(兰州归哪个省份管)来源前沿涨姿势上个月,甘肃省会兰州的地铁开通,结束了兰州没有地铁的城市。在甘肃省境内,兰州市是最大的城市,2018年的经济总量达到了2700多亿。但是如果与周边其他省份相比,省会兰
深圳属于哪个市(河北省深圳市在哪里)本人在深圳工作已经4年多了,对深圳还是有感情的,今天来谈谈深圳历史变革情况一先秦百越之地先秦时期,深圳属于百越中的南越。二秦南海郡秦始皇二十六年(公元前221年)秦灭六国,统一中国
东莞属于哪个市(东莞市县级市还是地级市)东莞,是广东省地级市国务院批复确定的中国珠江三角洲东岸中心城市。截至2018年,全市下辖4个街道28个镇,总面积2465平方千米,常住人口839。22万人,城镇人口763。86万人
辽阳属于哪个市(辽宁省辽阳市是地级市吗)辽阳,辽宁省地级市。辽阳是东北地区最早的城市。是以石化产业为主的现代工业城市,辽中南地区的中心城市之一。辽阳,两千多年的历史,古代,辽阳是东北地区的经济政治军事中心。辽阳能有今天的
莱芜属于哪个市(莱芜市是地级市吗)齐鲁网1月9日讯(记者张伟尹承谦王安琪)今天下午3时,山东省政府举行新闻发布会,省政府秘书长申长友介绍济南莱芜行政区划调整有关情况。记者从发布会上获悉,根据国务院批复,济南莱芜行政