在 redis 中,對(duì)于已經(jīng)過(guò)期的數(shù)據(jù),Redis 采用兩種策略來(lái)處理這些數(shù)據(jù),分別是惰性刪除和定期刪除
惰性刪除
惰性刪除不會(huì)去主動(dòng)刪除數(shù)據(jù),而是在訪問(wèn)數(shù)據(jù)的時(shí)候,再檢查當(dāng)前鍵值是否過(guò)期,如果過(guò)期則執(zhí)行刪除并返回 null 給客戶(hù)端,如果沒(méi)有過(guò)期則返回正常信息給客戶(hù)端。
它的優(yōu)點(diǎn)是簡(jiǎn)單,不需要對(duì)過(guò)期的數(shù)據(jù)做額外的處理,只有在每次訪問(wèn)的時(shí)候才會(huì)檢查鍵值是否過(guò)期,缺點(diǎn)是刪除過(guò)期鍵不及時(shí),造成了一定的空間浪費(fèi)。
源碼
robj *lookupKeyReadWithFlags(redisDb *db, robj *key, int flags) {
robj *val;
if (expireIfNeeded(db,key) == 1) {
/* Key expired. If we are in the context of a master, expireIfNeeded()
* returns 0 only when the key does not exist at all, so it's safe
* to return NULL ASAP. */
if (server.masterhost == NULL) {
server.stat_keyspace_misses++;
notifyKeyspaceEvent(NOTIFY_KEY_MISS, "keymiss", key, db->id);
return NULL;
}
/* However if we are in the context of a slave, expireIfNeeded() will
* not really try to expire the key, it only returns information
* about the "logical" status of the key: key expiring is up to the
* master in order to have a consistent view of master's data set.
*
* However, if the command caller is not the master, and as additional
* safety measure, the command invoked is a read-only command, we can
* safely return NULL here, and provide a more consistent behavior
* to clients accessign expired values in a read-only fashion, that
* will say the key as non existing.
*
* Notably this covers GETs when slaves are used to scale reads. */
if (server.current_client
server.current_client != server.master
server.current_client->cmd
server.current_client->cmd->flags CMD_READONLY)
{
server.stat_keyspace_misses++;
notifyKeyspaceEvent(NOTIFY_KEY_MISS, "keymiss", key, db->id);
return NULL;
}
}
val = lookupKey(db,key,flags);
if (val == NULL) {
server.stat_keyspace_misses++;
notifyKeyspaceEvent(NOTIFY_KEY_MISS, "keymiss", key, db->id);
}
else
server.stat_keyspace_hits++;
return val;
}
定期刪除
定期刪除:Redis會(huì)周期性的隨機(jī)測(cè)試一批設(shè)置了過(guò)期時(shí)間的key并進(jìn)行處理。測(cè)試到的已過(guò)期的key將被刪除。
具體的算法如下:
- Redis配置項(xiàng)hz定義了serverCron任務(wù)的執(zhí)行周期,默認(rèn)為10,代表了每秒執(zhí)行10次;
- 每次過(guò)期key清理的時(shí)間不超過(guò)CPU時(shí)間的25%,比如hz默認(rèn)為10,則一次清理時(shí)間最大為25ms;
- 清理時(shí)依次遍歷所有的db;
- 從db中隨機(jī)取20個(gè)key,判斷是否過(guò)期,若過(guò)期,則逐出;
- 若有5個(gè)以上key過(guò)期,則重復(fù)步驟4,否則遍歷下一個(gè)db;
- 在清理過(guò)程中,若達(dá)到了25%CPU時(shí)間,退出清理過(guò)程;
雖然redis的確是不斷的刪除一些過(guò)期數(shù)據(jù),但是很多沒(méi)有設(shè)置過(guò)期時(shí)間的數(shù)據(jù)也會(huì)越來(lái)越多,那么redis內(nèi)存不夠用的時(shí)候是怎么處理的呢?這里我們就會(huì)談到淘汰策略
Redis內(nèi)存淘汰策略
當(dāng)redis的內(nèi)存超過(guò)最大允許的內(nèi)存之后,Redis會(huì)觸發(fā)內(nèi)存淘汰策略,刪除一些不常用的數(shù)據(jù),以保證redis服務(wù)器的正常運(yùn)行
在redis 4.0以前,redis的內(nèi)存淘汰策略有以下6種
- noeviction:當(dāng)內(nèi)存使用超過(guò)配置的時(shí)候會(huì)返回錯(cuò)誤,不會(huì)驅(qū)逐任何鍵
- allkeys-lru:加入鍵的時(shí)候,如果過(guò)限,首先通過(guò)LRU算法驅(qū)逐最久沒(méi)有使用的鍵
- volatile-lru:加入鍵的時(shí)候如果過(guò)限,首先從設(shè)置了過(guò)期時(shí)間的鍵集合中驅(qū)逐最久沒(méi)有使用的鍵
- allkeys-random:加入鍵的時(shí)候如果過(guò)限,從所有key隨機(jī)刪除
- volatile-random:加入鍵的時(shí)候如果過(guò)限,從過(guò)期鍵的集合中隨機(jī)驅(qū)逐
- volatile-ttl:從配置了過(guò)期時(shí)間的鍵中驅(qū)逐馬上就要過(guò)期的鍵
- 在redis 4.0以后,又增加了以下兩種
- volatile-lfu:從所有配置了過(guò)期時(shí)間的鍵中驅(qū)逐使用頻率最少的鍵
- allkeys-lfu:從所有鍵中驅(qū)逐使用頻率最少的鍵
內(nèi)存淘汰策略可以通過(guò)配置文件來(lái)修改,redis.conf對(duì)應(yīng)的配置項(xiàng)是maxmemory-policy 修改對(duì)應(yīng)的值就行,默認(rèn)是noeviction
LRU(the least recently used 最近最少使用)算法
如果一個(gè)數(shù)據(jù)在最近沒(méi)有被訪問(wèn)到,那么在未來(lái)被訪問(wèn)的可能性也很小,因此當(dāng)空間滿(mǎn)的時(shí)候,最久沒(méi)有被訪問(wèn)的數(shù)據(jù)最先被置換(淘汰)
LRU算法通常通過(guò)雙向鏈表來(lái)實(shí)現(xiàn),添加元素的時(shí)候,直接插入表頭,訪問(wèn)元素的時(shí)候,先判斷元素是否在鏈表中存在,如果存在就把該元素移動(dòng)至表頭,所以鏈表的元素排列順序就是元素最近被訪問(wèn)的順序,當(dāng)內(nèi)存達(dá)到設(shè)置閾值時(shí),LRU隊(duì)尾的元素由于被訪問(wèn)的時(shí)間線(xiàn)較遠(yuǎn),會(huì)優(yōu)先踢出
但是在redis中,并沒(méi)有嚴(yán)格實(shí)行LRU算法,之所以這樣是因?yàn)長(zhǎng)RU需要消耗大量的額外內(nèi)存,需要對(duì)現(xiàn)有的數(shù)據(jù)結(jié)構(gòu)進(jìn)行較大的改造,近似LRU算法采用在現(xiàn)有數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上使用隨機(jī)采樣法來(lái)淘汰元素,能達(dá)到和LRU算法非常近似的效果。Redis的 LRU算法給每個(gè)key增加了一個(gè)額外的長(zhǎng)度為24bit的小字段,記錄最后一次被訪問(wèn)的時(shí)間戳。
redis通過(guò)maxmemory-samples 5配置,對(duì)key進(jìn)行采樣淘汰。同時(shí)在Redis3.0以后添加了淘汰池進(jìn)一步提升了淘汰準(zhǔn)確度。
但是LRU算法是存在一定的問(wèn)題
例如,這表示隨著時(shí)間的推移,四個(gè)不同的鍵訪問(wèn)。每個(gè)“〜”字符為一秒鐘,而“ |” 最后一行是當(dāng)前時(shí)刻。
~~ B ~~ B ~~ B ~~ B ~~ B ~~ B ~~ B ~~ B ~~ B ~~ B ~~ B ~~ B〜|
~~~~~~~~~~ C ~~~~~~~~ C ~~~~~~~~~ C ~~~~~~ |
~~~~~ D ~~~~~~~~~ D ~~~~~~~ D ~~~~~~~~ D |
在上圖中,按照LRU機(jī)制刪除的話(huà)刪除的順序應(yīng)該是C->A->B->D 其實(shí)這并不是我們想要的,因?yàn)锽被訪問(wèn)的頻率是最高的,而D被訪問(wèn)的頻率比較低,所以我們更想讓B保留,把D刪除,所以我們接下來(lái)看另一種策略 LFU
**LFU(leastFrequently used 最不經(jīng)常使用)**
如果一個(gè)數(shù)據(jù)在最近一段時(shí)間內(nèi)很少被訪問(wèn)到,那么可以認(rèn)為在將來(lái)他被訪問(wèn)到的概率也很小。所以,當(dāng)空間滿(mǎn)時(shí),最小頻率訪問(wèn)的數(shù)據(jù)最先被淘汰
Redis使用redisObject中的24bit lru字段來(lái)存儲(chǔ)lfu字段, 這24bit被分為兩部分:
1:高16位用來(lái)記錄訪問(wèn)時(shí)間(單位為分鐘)
2:低8位用來(lái)記錄訪問(wèn)頻率,簡(jiǎn)稱(chēng)counter
16 bits 8 bits
+----------------+--------+
Last decr time | LOG_C |
但是counter 8bit很容易就溢出了,技巧是用一個(gè)邏輯計(jì)數(shù)器,給予概率的對(duì)數(shù)計(jì)數(shù)器,而不是一個(gè)普通的遞增計(jì)數(shù)器
```
uint8_t LFULogIncr(uint8_t counter) {
if (counter == 255) return 255;
double r = (double)rand()/RAND_MAX;
double baseval = counter - LFU_INIT_VAL;
if (baseval 0) baseval = 0;
double p = 1.0/(baseval*server.lfu_log_factor+1);
if (r p) counter++;
return counter;
}
```
對(duì)應(yīng)的概率分布計(jì)算公式為
```
1.0/((counter - LFU_INIT_VAL)*server.lfu_log_factor+1);
```
其中LFU_INIT_VAL為5,其實(shí)簡(jiǎn)單說(shuō)就是,越大的數(shù),遞增的概率越低
嚴(yán)格按照LFU算法,時(shí)間越久的key,counter越有可能越大,被剔除的可能性就越小。counter只增長(zhǎng)不衰減就無(wú)法區(qū)分熱點(diǎn)key。為了解決這個(gè)問(wèn)題,redis提供了衰減因子server.lfu_decay_time,其單位為分鐘,計(jì)算方法也很簡(jiǎn)單,如果一個(gè)key長(zhǎng)時(shí)間沒(méi)有訪問(wèn)那么他的計(jì)數(shù)器counter就要減少,減少的值由衰減因子來(lái)控制
到此這篇關(guān)于Redis 對(duì)過(guò)期數(shù)據(jù)的處理方法的文章就介紹到這了,更多相關(guān)Redis過(guò)期數(shù)據(jù)的處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Redis中的數(shù)據(jù)過(guò)期策略詳解
- Redis數(shù)據(jù)導(dǎo)入導(dǎo)出以及數(shù)據(jù)遷移的4種方法詳解
- lua讀取redis數(shù)據(jù)的null判斷示例代碼