国产亚洲5388在线观看,亚洲AV无码无线在线观看,蘑菇成品人app下载

主頁 > 知識(shí)庫 > MySQL主從同步機(jī)制與同步延時(shí)問題追查過程

MySQL主從同步機(jī)制與同步延時(shí)問題追查過程

前言

作為一名DBA，在工作中會(huì)經(jīng)常遇到一些MySQL主從同步延遲的問題，這些同步慢的問題，其實(shí)原因非常多，可能是因?yàn)橹鲝牡木W(wǎng)絡(luò)問題導(dǎo)致，可能是因?yàn)榫W(wǎng)絡(luò)帶寬問題導(dǎo)致，可能是因?yàn)榇笫聞?wù)導(dǎo)致，也可能是因?yàn)閱尉€程復(fù)制導(dǎo)致的延遲。

今天遇到一個(gè)問題，Mysql持續(xù)報(bào)錯(cuò)，主從同步延時(shí)數(shù)過大或錯(cuò)誤。所以這篇文章給大家分享下主從同步的機(jī)制原理以及問題排查思路。

故障表現(xiàn)

最直觀的表現(xiàn)為：

mysql> show slave status\G;
 // 狀態(tài)一
 Seconds_Behind_Master: NULL
 // 狀態(tài)二
 Seconds_Behind_Master: 0
 // 狀態(tài)三
 Seconds_Behind_Master: 79

連續(xù)查詢，大部分時(shí)間該屬性值=0，偶發(fā)性出現(xiàn)Null或者79等延時(shí)值。導(dǎo)致觀察主從同步延時(shí)的監(jiān)控持續(xù)報(bào)警。

故障原因及解決方案

多臺(tái)備機(jī)的server-id一致，導(dǎo)致主機(jī)無法長(zhǎng)時(shí)間同某一臺(tái)備機(jī)連接，進(jìn)而無法正常同步。

修改server-id后，重啟數(shù)據(jù)庫恢復(fù)。

主從同步機(jī)制

MySQL的主從同步，又稱為復(fù)制（replication），是一種內(nèi)置的高可用高性能集群解決方案，主要功能有：

數(shù)據(jù)分布：同步不需要很大帶寬，可以實(shí)現(xiàn)多數(shù)據(jù)中心復(fù)制數(shù)據(jù)。
讀取的負(fù)載均衡：通過服務(wù)器集群，可以通過DNS輪詢、Linux LVS等GSLB（全局負(fù)載均衡）方式，降低主服務(wù)器的讀壓力。
數(shù)據(jù)庫備份：復(fù)制是備份的一部分，但并不能代替?zhèn)浞荨＿€需要與快照相結(jié)合。
高可用性和故障轉(zhuǎn)移：從服務(wù)器可以快速切換為主服務(wù)器，減少故障的停機(jī)時(shí)間和恢復(fù)時(shí)間。

主從同步分為3步：

主服務(wù)器（master）把數(shù)據(jù)更改記錄到二進(jìn)制日志（binlog）中。
從服務(wù)器（slave）把主服務(wù)器的二進(jìn)制日志復(fù)制到自己的中繼日志（relay log）中。
從服務(wù)器重做中繼日志中的日志，把更改應(yīng)用到自己的數(shù)據(jù)庫上，達(dá)到數(shù)據(jù)的一致性。

主從同步是一個(gè)異步實(shí)時(shí)的同步，會(huì)實(shí)時(shí)的傳輸，但存在執(zhí)行上的延時(shí)，如果主服務(wù)器壓力很大，延時(shí)也會(huì)相應(yīng)擴(kuò)大。

通過上面的圖，可以看到一共需要3個(gè)線程：

主服務(wù)器的日志傳送線程：負(fù)責(zé)將二進(jìn)制日志增量傳送到備機(jī)
從服務(wù)器的I/O線程：負(fù)責(zé)讀取主服務(wù)器的二進(jìn)制日志，并保存為中繼日志
從服務(wù)器的SQL線程，負(fù)責(zé)執(zhí)行中繼日志

查看MySQL線程

我們可以使用show full processlist;命令來查看MySQL的狀態(tài)：

主機(jī)的狀態(tài)：

備機(jī)的狀態(tài)：

可以看到，我的集群架構(gòu)為1臺(tái)主機(jī)、4臺(tái)備機(jī)，所以在主機(jī)中有4個(gè)同步線程（已經(jīng)發(fā)送所有的binlog數(shù)據(jù)到備機(jī)，等待binlog日志更新），1個(gè)查看命令線程（show full processlist）。在備機(jī)中有1個(gè)查看命令線程，1個(gè)I/O線程（等待主機(jī)發(fā)送同步數(shù)據(jù)事件），1個(gè)SQL線程（已經(jīng)讀取了所有中繼日志，等待I/O線程來更新它）。

查看同步狀態(tài)

因?yàn)橹鲝耐绞钱惒綄?shí)時(shí)的，也就是會(huì)存在延時(shí)的情況，我們可以通過show slave status;來查看備機(jī)上的同步延時(shí)：

在主從同步中我們需要關(guān)注的一些屬性，已經(jīng)給大家標(biāo)紅了：

Slave_IO_State: 當(dāng)前I/O線程的狀態(tài)
Master_Log_File: 當(dāng)前同步的主服務(wù)器的二進(jìn)制文件
Read_Master_Log_Pos: 當(dāng)前同步的主服務(wù)器的二進(jìn)制文件的偏移量，單位為字節(jié)，如圖中為已經(jīng)同步了12.9M(13630580/1024/1024)的內(nèi)容
Relay_Master_Log_File: 當(dāng)前中繼日志同步的二進(jìn)制文件
Slave_IO_Running: 從服務(wù)器中I/O線程的運(yùn)行狀態(tài)，YES為運(yùn)行正常
Slave_SQL_Running: 從服務(wù)器中SQL線程的運(yùn)行狀態(tài)，YES為運(yùn)行正常
Exec_Master_Log_Pos: 表示同步完成的主服務(wù)器的二進(jìn)制日志偏移量
Seconds_Behind_Master: 表示從服務(wù)器數(shù)據(jù)比主服務(wù)器落后的持續(xù)時(shí)長(zhǎng)

同樣可以通過show master status;命令來查看主服務(wù)器的運(yùn)行狀態(tài)：

正常運(yùn)行的主從同步狀態(tài)：

Slave_IO_Running: YES
Slave_SQL_Running: YES
Seconds_Behind_Master: 0

問題排查

在理解了主從同步的機(jī)制后，再來看今天遇到的問題，通過查看備機(jī)狀態(tài)，我們觀察在三種狀態(tài)下的幾個(gè)關(guān)鍵屬性值：

mysql> show slave status\G;
#狀態(tài)一：
 Slave_IO_State: Reconnecting after a failed master event read
 Slave_IO_Running: No
 Slave_SQL_Running: Yes
 Seconds_Behind_Master: NULL
#狀態(tài)二：
 Slave_IO_State: Waiting for master to send event
 Slave_IO_Running: Yes
 Slave_SQL_Running: Yes
 Seconds_Behind_Master: 0
#狀態(tài)三：
 Slave_IO_State: Queueing master event to the relay log
 Slave_IO_Running: Yes
 Slave_SQL_Running: Yes
 Seconds_Behind_Master: 636

通過MySQL主從復(fù)制線程狀態(tài)轉(zhuǎn)變，我們可以看到三種狀態(tài)的不同含義：

# 狀態(tài)一
# 線程正嘗試重新連接主服務(wù)器，當(dāng)連接重新建立后，狀態(tài)變?yōu)閃aiting for master to send event。
Reconnecting after a failed master event read
# 狀態(tài)二
# 線程已經(jīng)連接上主服務(wù)器，正等待二進(jìn)制日志事件到達(dá)。如果主服務(wù)器正空閑，會(huì)持續(xù)較長(zhǎng)的時(shí)間。如果等待持續(xù)slave_read_timeout秒，則發(fā)生超時(shí)。此時(shí)，線程認(rèn)為連接被中斷并企圖重新連接。
Waiting for master to send event

# 狀態(tài)三
# 線程已經(jīng)讀取一個(gè)事件，正將它復(fù)制到中繼日志供SQL線程來處理。
Queueing master event to the relay log

在這里，我們可以猜測(cè)，由于某些原因，從服務(wù)器不斷的和主服務(wù)器進(jìn)行斷開并嘗試重連，重連成功后又再次斷開。

我們?cè)倏纯粗鳈C(jī)的運(yùn)行情況：

發(fā)現(xiàn)問題出在10.144.63.*和10.144.68.*兩臺(tái)機(jī)器上，我們查看其中一臺(tái)的錯(cuò)誤日志：

190214 11:33:20 [Note] Slave: received end packet from server, apparent master shutdown:
190214 11:33:20 [Note] Slave I/O thread: Failed reading log event, reconnecting to retry, log 'mysql-bin.005682' at postion 13628070

拿到關(guān)鍵字Slave: received end packet from server, apparent master shutdown: Google搜索一下，在文章Confusing MySQL Replication Error Message中可以看到原因?yàn)閮膳_(tái)備機(jī)的server-id重復(fù)。

One day it happen to me, and took me almost an hour to find that out.
Moving foward I always use a base my.cnf to I copy to any other server and the first thing is to increase the server-id.
Could MySQL just use the servername intead of a numeric value?

問題修復(fù)

定位了問題，我們確認(rèn)下是否重復(fù)，發(fā)現(xiàn)兩臺(tái)備機(jī)的該字段確實(shí)相同：

vim my.cnf

#replication
log-bin=mysql-bin
# 這個(gè)隨機(jī)數(shù)字相同導(dǎo)致的
server-id=177230069
sync_binlog=1

更改一個(gè)其他不同的數(shù)字，保存，重啟MySQL進(jìn)程，報(bào)警恢復(fù)。

總結(jié)

最終來看，這個(gè)問題的解決非常簡(jiǎn)單，但從剛開始的迷茫到最后的思路清晰，都是我們排查問題所常見的，這篇文章的主要收獲是讓你明白主從同步的機(jī)制和追查問題的思路，希望下次我們都能很快的解決主從同步帶給我們的問題。

好了，以上就是這篇文章的全部?jī)?nèi)容了，希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，如果有疑問大家可以留言交流，謝謝大家對(duì)腳本之家的支持。

參考資料

《MySQL基礎(chǔ)內(nèi)幕 InnoDB存儲(chǔ)引擎第2版》P8.7 復(fù)制
MySQL主從復(fù)制線程狀態(tài)轉(zhuǎn)變
Confusing MySQL Replication Error Message

您可能感興趣的文章:

MySQL 主從同步,事務(wù)回滾的實(shí)現(xiàn)原理
MySQL數(shù)據(jù)庫主從同步實(shí)戰(zhàn)過程詳解
MySQL主從同步中的server-id示例詳解
Centos7系統(tǒng)下Mysql主從同步配置方案
MySQL主從同步延遲的原因及解決辦法
MySQL數(shù)據(jù)庫的主從同步配置與讀寫分離
Mysql主從同步Last_IO_Errno:1236錯(cuò)誤解決方法
Mysql主從同步的實(shí)現(xiàn)原理
詳解Mysql主從同步配置實(shí)戰(zhàn)
詳解windows下mysql的主從同步
詳解MySQL數(shù)據(jù)庫設(shè)置主從同步的方法
Mysql數(shù)據(jù)庫的主從同步配置

標(biāo)簽：洛陽葫蘆島安徽拉薩甘南嘉峪關(guān) 吐魯番

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《MySQL主從同步機(jī)制與同步延時(shí)問題追查過程》，本文關(guān)鍵詞 MySQL,主從,同步,機(jī)制,與,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。