主頁(yè) > 知識(shí)庫(kù) > Redis主從集群切換數(shù)據(jù)丟失的解決方案

Redis主從集群切換數(shù)據(jù)丟失的解決方案

熱門(mén)標(biāo)簽:日本中國(guó)地圖標(biāo)注 北京400電話辦理收費(fèi)標(biāo)準(zhǔn) 山東外呼銷(xiāo)售系統(tǒng)招商 貴州電銷(xiāo)卡外呼系統(tǒng) 魔獸2青云地圖標(biāo)注 鄭州人工智能電銷(xiāo)機(jī)器人系統(tǒng) 十堰營(yíng)銷(xiāo)電銷(xiāo)機(jī)器人哪家便宜 超呼電話機(jī)器人 宿遷便宜外呼系統(tǒng)平臺(tái)

一、數(shù)據(jù)丟失的情況

異步復(fù)制同步丟失

集群產(chǎn)生腦裂數(shù)據(jù)丟失

1.異步復(fù)制丟失

對(duì)于Redis主節(jié)點(diǎn)與從節(jié)點(diǎn)之間的數(shù)據(jù)復(fù)制,是異步復(fù)制的,當(dāng)客戶(hù)端發(fā)送寫(xiě)請(qǐng)求給master節(jié)點(diǎn)的時(shí)候,客戶(hù)端會(huì)返回OK,然后同步到各個(gè)slave節(jié)點(diǎn)中。

如果此時(shí)master還沒(méi)來(lái)得及同步給slave節(jié)點(diǎn)時(shí)發(fā)生宕機(jī),那么master內(nèi)存中的數(shù)據(jù)會(huì)丟失;

要是master中開(kāi)啟持久化設(shè)置數(shù)據(jù)可不可以保證不丟失呢?答案是否定的。在master 發(fā)生宕機(jī)后,sentinel集群檢測(cè)到master發(fā)生故障,重新選舉新的master,如果舊的master在故障恢復(fù)后重啟,那么此時(shí)它需要同步新master的數(shù)據(jù),此時(shí)新的master的數(shù)據(jù)是空的(假設(shè)這段時(shí)間中沒(méi)有數(shù)據(jù)寫(xiě)入)。那么舊master中的數(shù)據(jù)就會(huì)被刷新掉,此時(shí)數(shù)據(jù)還是會(huì)丟失。

2.集群產(chǎn)生腦裂

首先我們需要理解集群的腦裂現(xiàn)象,這就好比一個(gè)人有兩個(gè)大腦,那么到底受誰(shuí)來(lái)控制呢?在分布式集群中,分布式協(xié)作框架zookeeper很好的解決了這個(gè)問(wèn)題,通過(guò)控制半數(shù)以上的機(jī)器來(lái)解決。

那么在Redis中,集群腦裂產(chǎn)生數(shù)據(jù)丟失的現(xiàn)象是怎么樣的呢?

假設(shè)我們有一個(gè)redis集群,正常情況下client會(huì)向master發(fā)送請(qǐng)求,然后同步到salve,sentinel集群監(jiān)控著集群,在集群發(fā)生故障時(shí)進(jìn)行自動(dòng)故障轉(zhuǎn)移。

此時(shí),由于某種原因,比如網(wǎng)絡(luò)原因,集群出現(xiàn)了分區(qū),master與slave節(jié)點(diǎn)之間斷開(kāi)了聯(lián)系,sentinel監(jiān)控到一段時(shí)間沒(méi)有聯(lián)系認(rèn)為master故障,然后重新選舉,將slave切換為新的master。但是master可能并沒(méi)有發(fā)生故障,只是網(wǎng)絡(luò)產(chǎn)生分區(qū),此時(shí)client任然在舊的master上寫(xiě)數(shù)據(jù),而新的master中沒(méi)有數(shù)據(jù),如果不及時(shí)發(fā)現(xiàn)問(wèn)題進(jìn)行處理可能舊的master中堆積大量數(shù)據(jù)。在發(fā)現(xiàn)問(wèn)題之后,舊的master降為slave同步新的master數(shù)據(jù),那么之前的數(shù)據(jù)被刷新掉,大量數(shù)據(jù)丟失。

在了解了上面的兩種數(shù)據(jù)丟失場(chǎng)景后,我們?nèi)绾伪WC數(shù)據(jù)可以不丟失呢?在分布式系統(tǒng)中,衡量一個(gè)系統(tǒng)的可用性,我們一般情況下會(huì)說(shuō)4個(gè)9,5個(gè)9的系統(tǒng)達(dá)到了高可用(99.99%,99.999%,據(jù)說(shuō)淘寶是5個(gè)9)。對(duì)于redis集群,我們不可能保證數(shù)據(jù)完全不丟失,只能做到使得盡量少的數(shù)據(jù)丟失。

二、如何保證盡量少的數(shù)據(jù)丟失?

在redis的配置文件中有兩個(gè)參數(shù)我們可以設(shè)置:

min-slaves-to-write 1
min-slaves-max-lag 10

min-slaves-to-write默認(rèn)情況下是0,min-slaves-max-lag默認(rèn)情況下是10。

以上面配置為例,這兩個(gè)參數(shù)表示至少有1個(gè)salve的與master的同步復(fù)制延遲不能超過(guò)10s,一旦所有的slave復(fù)制和同步的延遲達(dá)到了10s,那么此時(shí)master就不會(huì)接受任何請(qǐng)求。

我們可以減小min-slaves-max-lag參數(shù)的值,這樣就可以避免在發(fā)生故障時(shí)大量的數(shù)據(jù)丟失,一旦發(fā)現(xiàn)延遲超過(guò)了該值就不會(huì)往master中寫(xiě)入數(shù)據(jù)。

那么對(duì)于client,我們可以采取降級(jí)措施,將數(shù)據(jù)暫時(shí)寫(xiě)入本地緩存和磁盤(pán)中,在一段時(shí)間后重新寫(xiě)入master來(lái)保證數(shù)據(jù)不丟失;也可以將數(shù)據(jù)寫(xiě)入kafka消息隊(duì)列,隔一段時(shí)間去消費(fèi)kafka中的數(shù)據(jù)。

通過(guò)上面兩個(gè)參數(shù)的設(shè)置我們盡可能的減少數(shù)據(jù)的丟失,具體的值還需要在特定的環(huán)境下進(jìn)行測(cè)試設(shè)置。

補(bǔ)充:Redis Cluster 會(huì)丟數(shù)據(jù)嗎?

Redis Cluster 不保證強(qiáng)一致性,在一些特殊場(chǎng)景,客戶(hù)端即使收到了寫(xiě)入確認(rèn),還是可能丟數(shù)據(jù)的。

場(chǎng)景1:異步復(fù)制

client 寫(xiě)入 master B

master B 回復(fù) OK

master B 同步至 slave B1 B2 B3

B 沒(méi)有等待 B1 B2 B3 的確認(rèn)就回復(fù)了 client,如果在 slave 同步完成之前,master 宕機(jī)了,其中一個(gè) slave 會(huì)被選為 master,這時(shí)之前 client 寫(xiě)入的數(shù)據(jù)就丟了。

wait 命令可以增強(qiáng)這種場(chǎng)景的數(shù)據(jù)安全性。

wait 會(huì)阻塞當(dāng)前 client 直到之前的寫(xiě)操作被指定數(shù)量的 slave 同步成功。

wait 可以提高數(shù)據(jù)的安全性,但并不保證強(qiáng)一致性。

因?yàn)榧词故褂昧诉@種同步復(fù)制方式,也存在特殊情況:一個(gè)沒(méi)有完成同步的 slave 被選舉為了 master。

場(chǎng)景2:網(wǎng)絡(luò)分區(qū)

6個(gè)節(jié)點(diǎn) A, B, C, A1, B1, C1,3個(gè)master,3個(gè)slave,還有一個(gè)client,Z1。

發(fā)生網(wǎng)絡(luò)分區(qū)之后,形成了2個(gè)區(qū),A, C, A1, B1, C1 和 B Z1。

這時(shí) Z1 還是可以向 B 寫(xiě)入的,如果短時(shí)間內(nèi)分區(qū)就恢復(fù)了,那就沒(méi)問(wèn)題,整個(gè)集群繼續(xù)正常工作,但如果時(shí)間一長(zhǎng),B1 就會(huì)成為所在分區(qū)的 master,Z1 寫(xiě)入 B 的數(shù)據(jù)就丟了。

maximum window(最大時(shí)間窗口) 可以減少數(shù)據(jù)損失,可以控制 Z1 向 B 寫(xiě)入的總數(shù):

過(guò)去一定時(shí)間后,分區(qū)的多數(shù)邊就會(huì)進(jìn)行選舉,slave 成為 master,這時(shí)分區(qū)少數(shù)邊的 master 就會(huì)拒絕接收寫(xiě)請(qǐng)求。

這個(gè)時(shí)間量是非常重要的,稱(chēng)為節(jié)點(diǎn)過(guò)期時(shí)間。

一個(gè) master 在達(dá)到過(guò)期時(shí)間后,就被認(rèn)為是故障的,進(jìn)入 error 狀態(tài),停止接收寫(xiě)請(qǐng)求,可以被 slave 取代。

小結(jié)

Redis Cluster 不保證強(qiáng)一致性,存在丟失數(shù)據(jù)的場(chǎng)景:

異步復(fù)制

在 master 寫(xiě)成功,但 slave 同步完成之前,master 宕機(jī)了,slave 變?yōu)?master,數(shù)據(jù)丟失。

wait 命令可以給為同步復(fù)制,但也無(wú)法完全保證數(shù)據(jù)不丟,而且影響性能。

網(wǎng)絡(luò)分區(qū)

分區(qū)后一個(gè) master 繼續(xù)接收寫(xiě)請(qǐng)求,分區(qū)恢復(fù)后這個(gè) master 可能會(huì)變?yōu)?slave,那么之前寫(xiě)入的數(shù)據(jù)就丟了。

可以設(shè)置節(jié)點(diǎn)過(guò)期時(shí)間,減少 master 在分區(qū)期間接收的寫(xiě)入數(shù)量,降低數(shù)據(jù)丟失的損失。

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 深入淺析Redis 集群伸縮原理
  • 基于Docker搭建Redis主從集群的實(shí)現(xiàn)
  • Docker上實(shí)現(xiàn)Redis集群搭建
  • Redis6.0搭建集群Redis-cluster的方法
  • Redis5之后版本的高可用集群搭建的實(shí)現(xiàn)
  • 在K8s上部署Redis集群的方法步驟
  • Redis cluster集群模式的原理解析
  • Redis Cluster集群主從切換的踩坑與填坑
  • 詳解Redis集群搭建的三種方式

標(biāo)簽:大慶 江蘇 臺(tái)州 楊凌 果洛 北京 吉安 朝陽(yáng)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Redis主從集群切換數(shù)據(jù)丟失的解決方案》,本文關(guān)鍵詞  Redis,主從,集群,切換,數(shù)據(jù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Redis主從集群切換數(shù)據(jù)丟失的解決方案》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于Redis主從集群切換數(shù)據(jù)丟失的解決方案的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章