淺談硬盤“冷數(shù)據(jù)”問題&簡單測試
一直以來,“數(shù)據(jù)保持時(shí)間”都是談?wù)摴虘B(tài)硬盤可靠性時(shí)繞不開的話題。西部數(shù)據(jù)的“冷數(shù)據(jù)”事件更是鬧得沸沸揚(yáng)揚(yáng),令不少用戶們提心吊膽、人人自危。
什么是“數(shù)據(jù)保持時(shí)間”?什么是“冷數(shù)據(jù)”問題?要將它們介紹清楚,還得從固態(tài)硬盤的工作原理說起。
何為“數(shù)據(jù)保持時(shí)間”?
傳統(tǒng)固態(tài)硬盤使用的是NAND“與非門”,通過電子來存儲記錄數(shù)據(jù)。存儲單元中帶有電子即為“1”,不帶電荷則為“0”。但在不通電時(shí),NAND中的電子會隨著時(shí)間的推移而逐漸泄露。
隨著硬盤擦寫次數(shù)的增加,電子泄露的速度也會逐漸加快。同時(shí),硬盤斷電后的環(huán)境溫度,也會顯著影響電子的泄露速度。就像人類的記憶一般,硬盤中的數(shù)據(jù)也將隨著時(shí)間而逐漸模糊。當(dāng)電子泄露積累到一定程度時(shí),就可能引發(fā)錯誤。
所幸,如今的硬盤主控大都有專門應(yīng)對“冷數(shù)據(jù)”的算法,最大限度地降低數(shù)據(jù)損壞的可能。但是,這些算法勢必對讀取速度有著不小影響,它們也并非萬無一失。
早在2012年,第一代商用TLC硬盤——三星840EVO就曾爆出過“冷數(shù)據(jù)門”,三星通過固件更新解決了部分問題。而在2020年前后,西部數(shù)據(jù)與閃迪的SATA硬盤也出現(xiàn)了大范圍的“冷數(shù)據(jù)”情況。

越早寫入的數(shù)據(jù),讀取越是緩慢。原本可用500MB/S速度打開大文件的硬盤,在“冷數(shù)據(jù)”面前,就只剩下不到50MB/S。
這次風(fēng)波主要涉及西部數(shù)據(jù)SATA藍(lán)盤、SN500 M.2硬盤與閃迪Ultra系列SATA固態(tài)硬盤。
反復(fù)讀取并不能讓硬盤的“冷數(shù)據(jù)”恢復(fù)如初。消費(fèi)者們唯一的應(yīng)對方法,便是定期將全盤文件擦除、重寫。但是,也會顯著增大存儲單元的磨損,可能將進(jìn)一步惡化“冷數(shù)據(jù)”問題,最終落入“冷數(shù)據(jù)”越來越嚴(yán)重、擦除重寫愈發(fā)頻繁的死循環(huán)。
存儲可靠性,是硬盤的關(guān)鍵所在。如此種種關(guān)乎“數(shù)據(jù)保持時(shí)間”的異常情況,一次次刺激著所有人的敏感神經(jīng)。雪上加霜的是,隨著技術(shù)不斷迭代,存儲顆粒的類型從MLC、TLC再發(fā)展到QLC。每個(gè)單元所存儲的電子越來越多,硬盤的數(shù)據(jù)保存能力也越來越差。
逐漸普及的QLC存儲介質(zhì),也因此被推上了風(fēng)口浪尖:它是否也有“冷數(shù)據(jù)”問題?是否能經(jīng)受住時(shí)間的考驗(yàn)?
簡單測試
懷著對這些問題的好奇,我進(jìn)行了一次簡單的“斷電保持時(shí)間”測試。
我選用的硬盤,是一塊特殊的INTEL 670p SSD,容量為512G。這款SSD搭載了由英特爾研發(fā)的QLC顆粒,堆疊層數(shù)為144層。

英特爾是QLC商業(yè)化應(yīng)用的先驅(qū),這款144層顆粒已是其第二代產(chǎn)品。
英特爾曾不止一次地強(qiáng)調(diào),其QLC顆?!坝兄cTLC一樣的品質(zhì)與可靠性”。仿佛為了證明這一點(diǎn),英特爾甚至將QLC技術(shù)用在了極為重視可靠性的企業(yè)級市場。并解釋稱自己的QLC顆粒使用浮動?xùn)艠O結(jié)構(gòu),擁有更好的電子保持能力。

但在不少消費(fèi)者看來,英特爾的說法十分蒼白——“再強(qiáng)也只是個(gè)QLC”。消費(fèi)者們依然沒有認(rèn)可英特爾的QLC顆粒。連續(xù)虧損之下,英特爾的NAND部門最終于2020年被整體出售。這塊670p SSD便成為了英特爾的最后一款消費(fèi)級產(chǎn)品。
為了盡可能地模擬真實(shí)使用環(huán)境,這塊QLC硬盤事先經(jīng)過處理。我希望它的磨損情況,能夠貼近消費(fèi)者日常使用一段時(shí)間后的水準(zhǔn)。因此,在測試時(shí),它已被寫入了超過45TB數(shù)據(jù),并經(jīng)過了大量通電與斷電循環(huán)。

整盤寫入次數(shù)超過80次。剩余健康度便下降至62%——可以證明,QLC顆粒確實(shí)不耐擦寫。那么,一塊重度擦寫的QLC硬盤,是否能保證數(shù)據(jù)的長期完整性呢?
這塊硬盤是特殊的QS“質(zhì)量驗(yàn)證”樣品,工作在PCIE 3.0X2通道下。如今,我就將驗(yàn)證這塊硬盤的質(zhì)量到底如何。
2022年10月28日,我使用urwtest軟件向這塊硬盤填滿測試數(shù)據(jù)文件,并就此將其封存。不接入電腦、不進(jìn)行通電,并保存在沒有陽光直射的室溫環(huán)境之下。

直到8個(gè)月后的2023年6月28日,我再度將這塊硬盤接入電腦。運(yùn)行Urwtest進(jìn)行校驗(yàn),檢測數(shù)據(jù)是否完整。
由于運(yùn)行在PCIE 3.0X2通道,這塊硬盤的最大讀取速度僅在1000MB/S上下,而此時(shí)正保持著這個(gè)數(shù)值,表明硬盤沒有發(fā)生掉速。Urwtest的校驗(yàn)過程很快結(jié)束,硬盤內(nèi)的數(shù)據(jù)完整性沒有問題。

為了確保萬無一失,我將原有的數(shù)據(jù)全部擦除,并再一次進(jìn)行全盤寫入,以檢測硬盤的工作是否正常。
QLC硬盤的全盤寫入是個(gè)極為漫長的過程,512G的小容量型號更是如此。在SLC緩存消耗殆盡后,它的寫入速度會迅速下跌至不足100MB/S,堪比“大號U盤”,比機(jī)械硬盤還要緩慢。在經(jīng)歷了無比漫長的一個(gè)小時(shí)后,數(shù)據(jù)寫入終于完成了。
隨后再次進(jìn)行數(shù)據(jù)校驗(yàn),硬盤依舊保持在1000MB/S的最大速度上下。校驗(yàn)結(jié)果表明,剛剛寫入的數(shù)據(jù)沒有問題。

測試結(jié)束,檢查硬盤S.M.A.R.T數(shù)據(jù)??梢钥吹?,0E“媒體與數(shù)據(jù)完整性錯誤計(jì)數(shù)”沒有增加,03“可用備用空間”沒有異常下降。一切正常。

看來,在8個(gè)月的靜置時(shí)間里,這塊擦寫量不算少的QLC硬盤并無異常。數(shù)據(jù)的讀取速度并沒有明顯下降,更沒有文件發(fā)生丟失或損壞。硬盤也依然能正常擦、寫數(shù)據(jù),仿佛此前的“休眠”從未發(fā)生。
當(dāng)然,這并不代表著QLC硬盤一定萬無一失,但或許能說明“冷數(shù)據(jù)”離我們還有一段距離。除了個(gè)別爆出嚴(yán)重缺陷的硬盤型號以外,大部分SSD并無必要對此過于擔(dān)憂——真的如此嗎?
在這篇文章的編輯過程中,我重新檢查了一些經(jīng)常通電使用的TLC硬盤。然而,令我驚異的是,它們竟然出現(xiàn)了不同程度的冷數(shù)據(jù)問題。


這塊東芝RD500是一塊系統(tǒng)盤,讀取頻繁但很少進(jìn)行大文件寫入。從Refresh前后的情況推斷,它出現(xiàn)了輕微的冷數(shù)據(jù)問題。
RD500已經(jīng)隨著東芝的重組而更名。它便是如今的“鎧俠RD20”。

相比于東芝的“輕微掉速”,這塊放在硬盤盒上使用、主要存儲較大文件的SSD,就更顯夸張了——從HD TUNE曲線來看,這或許已是極為明顯的“冷數(shù)據(jù)”問題!
后記
長時(shí)間靜置、重度擦寫的QLC硬盤相安無事,而頻繁使用、寫入較少的TLC硬盤卻出現(xiàn)了“冷數(shù)據(jù)”的征兆。這樣的情況大大超出了我的預(yù)期,實(shí)在是令人費(fèi)解。
唯一能夠解釋的,可能只有INTEL那獨(dú)特的“浮動?xùn)艠O”結(jié)構(gòu)了。從理論上說,這種結(jié)構(gòu)確實(shí)有著更好的數(shù)據(jù)保持能力。而我們頻繁使用的TLC顆粒,是工藝更為簡便的“電荷俘獲”結(jié)構(gòu)。
英特爾早已退出存儲領(lǐng)域。目前市場上的大部分產(chǎn)品,都采用了“電荷俘獲”的結(jié)構(gòu)。或許,“冷數(shù)據(jù)”離我們并不遙遠(yuǎn),只是程度各不相同。
我會持續(xù)關(guān)注手中硬盤的“冷數(shù)據(jù)”情況,各位值友也可以檢查常用SSD的“冷數(shù)據(jù)”問題。這篇文章到這里就結(jié)束了。如果你對文章中的內(nèi)容有疑問,歡迎隨時(shí)與我交流!
希望這篇文章能幫到你!