下面讓我們來細(xì)致看一下這三種服務(wù)器系統(tǒng)崩潰的詳細(xì),并辨別簡介一下防止它們的最好方法。
殺毒軟件
到當(dāng)前為止,最罕見的Windows Server崩潰是由舊版殺毒軟件所致。一切的殺毒軟件都是運(yùn)用裝備驅(qū)動順序,更詳細(xì)地說是“過濾驅(qū)動”來阻攔I / O(讀/寫)懇求并執(zhí)行額定的檢驗(yàn)。殺毒軟件驅(qū)動順序?qū)z驗(yàn)的內(nèi)容與已知的病毒定義文件實(shí)行比較,以確保沒有感染病毒。
過濾驅(qū)動包括內(nèi)核方式的代碼,它們會與操作系統(tǒng)底層的內(nèi)核函數(shù)和數(shù)據(jù)結(jié)構(gòu)相互作用這些函數(shù)和數(shù)據(jù)結(jié)構(gòu)包括那些預(yù)期會在相應(yīng)裝備驅(qū)動調(diào)用時呈現(xiàn)的預(yù)定義參數(shù)和數(shù)據(jù)類型。假設(shè)函數(shù)傳遞的數(shù)據(jù)類型錯誤或參數(shù)數(shù)目不對,就會發(fā)作導(dǎo)致內(nèi)核方式中系統(tǒng)崩潰的錯誤。
當(dāng)開發(fā)人員在不一樣版本的操作系統(tǒng)之間(如服務(wù)包更新或新版本操作系統(tǒng)揭曉)修正這些內(nèi)核函數(shù)或數(shù)據(jù)結(jié)構(gòu)時,疑問就呈現(xiàn)了。雖然微軟在測試裝備驅(qū)動順序?qū)σ磺胁僮飨到y(tǒng)改動的兼容性方面做得很好,但它顯然沒有測試第三方裝備驅(qū)動順序來確保它們可兼容。因此,當(dāng)舊版殺毒驅(qū)動順序巧合遭遇了這些修正,最后就會導(dǎo)致系統(tǒng)崩潰。其它過濾驅(qū)動也簡單遭到這種疑問影響,但是殺毒軟件驅(qū)動順序是最簡單受影響的一個。
讓我們來看一個例子:
下面是一個Stop 0x8E bugcheck -KERNEL_MODE_EXCEPTION_NOT_HANDLED的系統(tǒng)崩潰。在Windows debugger中用命令!analyze –v顯示了它的堆棧方式。從下往上讀,我們就看到一個NtCreateFile的函數(shù)調(diào)用,最后引入了buggydrv,從而導(dǎo)致bugcheck。運(yùn)用命令!lmi buggydrv能夠顯示出驅(qū)動順序的日期是2006年,而操作系統(tǒng)Windows Server 2003 SP2是2007年揭曉的。如今我們就知曉,舊版的殺毒驅(qū)動順序并沒有對新版的操作系統(tǒng)實(shí)行測試。
在這個例子中,此種系統(tǒng)崩潰曾經(jīng)被廠商標(biāo)識為已知疑問并文檔化,新版殺毒軟件曾經(jīng)能夠用來防止系統(tǒng)崩潰。真實(shí)上,絕大非少數(shù)你遇到的Windows Server崩潰,都曾在別人身上發(fā)作過,它們的處理方法通常曾經(jīng)記載在互聯(lián)網(wǎng)上的某個地點(diǎn)。因此,很主要的一點(diǎn)是,必須要記得即使只是一個服務(wù)包更新。在更新操作系統(tǒng)時也該第一時間與第三方廠商確認(rèn)能否有相應(yīng)的軟件更新。
存儲驅(qū)動順序不兼容
另一種最罕見的系統(tǒng)崩潰是由不兼容的存儲驅(qū)動順序所致。如你所知,第三方存儲廠商提供裝備驅(qū)動順序來控制它們的主機(jī)總線適配器(HBA)并用于訪問存儲裝備。像Qlogic、Emulex和惠普(HP)等廠商都有不一樣的裝備驅(qū)動順序,但它們都依托于微軟的Storport驅(qū)動順序。Storport驅(qū)動順序提供一套通用順序,這些特定的廠商驅(qū)動順序在執(zhí)行I / O操作時運(yùn)用它們。
這種疑問的呈現(xiàn)方式與殺毒軟件驅(qū)動順序的不兼容性很相似。當(dāng)廠商修正其自用的驅(qū)動順序時,它們必需重新與如今版本的Storport實(shí)行測試,以確保仍然兼容。一樣的道理,當(dāng)更新Storport版本時,一切的HBA驅(qū)動順序也必需重新測試,以保證它們?nèi)匀慌c新版的Storport驅(qū)動順序兼容。在Windows Server 2003中當(dāng)你須要思索Storport的50多個修補(bǔ)順序時,這才是一個真實(shí)的挑戰(zhàn)。
體會次序是,在更新Storport驅(qū)動之前與你的第三方廠商確認(rèn)HBA驅(qū)動順序能否有相應(yīng)的更新,反之亦然。如何才干知曉哪個存儲驅(qū)動順序依托于Storport?幸運(yùn)的是,有一個叫Dependency Walker(depends.exe)的無償工具,能夠揭示驅(qū)動順序間的依托聯(lián)系。
下載并解緊縮后,運(yùn)轉(zhuǎn)depends.exe,運(yùn)用文件下拉菜單挑選你所注重的驅(qū)動順序。在這個例子中,我挑選了驅(qū)動順序Hpcisss2.sys,它運(yùn)用于HP的硬盤陣列。正如你下面能夠看到的,該工具顯示,驅(qū)動順序Hpcisss2依托于STORPORT.SYS和Ntoskrnl.exe。
過多的過濾驅(qū)動
第三種最罕見的Windows Server崩潰類型與安裝了太多的過慮驅(qū)動時的堆棧溢出條件相關(guān)。任何能夠阻攔I / O懇求并執(zhí)行額定功用的驅(qū)動順序都被以為是一個過濾驅(qū)動。我們曾經(jīng)知曉,殺毒驅(qū)動順序就是一個過濾驅(qū)動。其它過慮驅(qū)動包括硬盤配額維護(hù)、硬盤鏡像和備份代理等,在這里我只列舉了多個。
雖然安裝多個過濾驅(qū)動本身不會有疑問,但是在當(dāng)這些驅(qū)動順序以遞歸的方式相互調(diào)用并因此耗盡了有限的內(nèi)核堆棧空間時,狀況就會發(fā)作改動。依據(jù)計(jì)算機(jī)體系結(jié)構(gòu)((x86=12 KB,x64=24 KB),一切裝備驅(qū)動順序運(yùn)用的內(nèi)核堆??臻g是有限的。當(dāng)內(nèi)核堆??臻g耗盡時,就會呈現(xiàn)一個Stop 0x7F bugcheck導(dǎo)致系統(tǒng)崩潰,就像微軟數(shù)百篇文檔的描述一樣。
基本沒有方法提供額定的內(nèi)核堆??臻g來容納更多的過慮驅(qū)動。獨(dú)一的挑選是辨認(rèn)這些過濾驅(qū)動,禁用或卸載其中不須要的那些。有一個內(nèi)置在Windows Server操作系統(tǒng)中的工具叫FLTMC(過濾器維護(hù)器控制順序),它能夠讓你辨認(rèn)出安裝的過濾驅(qū)動。
正如你看到的,有許多原由會導(dǎo)致Windows Server崩潰。但是絕大非少數(shù)服務(wù)器停機(jī)都是由上述的原由構(gòu)成的。你完全能夠議決兩種方式處理這些疑問,它們是在升級Windows操作系統(tǒng)或更新相關(guān)的熱修補(bǔ)順序的同時更新第三方驅(qū)動順序和限定未運(yùn)用的過濾驅(qū)動的數(shù)目。