作者:香農青島數據恢復中心 2010-01-04 15:40
文章首頁 |
---|
冬天硬盤更受傷:硬盤在低溫下的故障機制 |
一、硬盤的結構 |
1、硬盤的機械結構:主軸電機 |
硬盤的機械結構:磁碟 |
硬盤的機械結構:磁頭和音圈馬達 |
2、硬盤的固件結構 |
二、硬盤的初始化 |
三、硬盤的缺陷表和缺陷調整 |
四、低溫環境下的硬盤故障機制 |
五、溫度梯度的影響 |
結論 |
全部頁面 |
硬盤對工作環境的溫度要求一般是0 °C-60 °C之間(運轉時)。但是我們發現,某些使用液態軸承的硬盤,例如Maxtor Diamond Plus 8和Maxtor Diamond Plus 9在環境溫度低于15 °C是就會發生故障。在低溫環境下,(香農青島數據恢復中心)軸承中的液體需要一段時間的預熱才能達到正常工作所需的粘度。因此,在硬盤啟動時,盤片就會發生上下振動,導致讀/寫頻繁出錯,最終導致硬盤損壞。
硬盤運轉時,磁頭與磁盤的距離只有幾十納米,哪怕是極微小的振動,也會導致磁頭與磁盤發生碰撞。
硬盤在加電后的初始化階段,首先會讀取固件區的固件數據——微代碼和數據模塊。固件區一般位于磁盤的外圈(OD),而正是在磁盤的外圈(OD),磁盤的振動幅度最大。如果此時磁頭與磁盤發生碰撞,就會直接導致固件數據的損壞和丟失。我們觀察到,無論是微代碼模塊還是數據模塊,都有因為碰撞而損壞的現象——此種情況下,主機的BIOS不能檢測到硬盤,有的甚至發出敲擊聲。
硬盤在完成初始化并報告準備就緒后,主機就會開始從硬盤上引導操作系統。我們發現在此階段,硬盤會頻繁的產生缺陷(如圖八所示)。
圖八:硬盤的起始LBA遭到了嚴重的損壞
圖八為一個由于低溫導致起始LBA區域遭到的損壞硬盤。,而這一區域通常是操作系統的引導區和系統文件夾所在的區域。這會造成操作系統引導失敗,不過這并不是造成硬盤失敗的直接原因。
實際上當硬盤在低溫環境下啟動,由于液態軸承中的酯油未達到工作所需的粘度,造成盤片微小的振動、磁頭在進行讀/寫操作時出錯并產生缺陷,硬盤的微代碼(microcode)就會啟動“缺陷調整”機制,將缺陷扇區寫入到G-List中。但是此時硬盤仍然處于不穩定的工作狀態,從而在執行寫入G-表的操作過程中進一步導致G- 表損壞。我們發現無論是G-表的表頭還是內容都會出現因此而損壞的情況。
圖九:G-表的數據結構示意圖
如果G-表損壞,硬盤在重新初始化時,就會停止將其載入從而進入失敗狀態。此時只有微代碼啟動,在計算機的BIOS中會將硬盤識別為錯誤的標識。
上述兩種故障機制發生的概率是不相等的。首先,固件區的數據密度(每磁道只有不到300個扇區)只有用戶區數據密度(每磁道有500到600個扇區)的一半。(香農青島數據恢復中心)其次,固件區通常只包含不到10M字節的數據,從硬盤加電到初始化完成所用時間不超過10秒;另外,磁頭進行讀操作時發生故障的概率也小于寫操作發生故障的概率。因此實踐中,低溫環境下硬盤表面產生缺陷和由于缺陷調整導致發生故障的概率遠遠高于硬盤初始化階段由于磁頭讀取固件數據而造成固件區損壞的概率。