Intel® Optane™ 技術提供新等級的耐用性

Intel® Optane™ DC SSD 提供的耐用性以指數倍數高於類似容量的 NAND 型 SSD,而 Intel® Optane™ DC 持續性記憶體提供的耐用性則更高。

Intel® Optane™ 媒體是獨特的記憶體技術,具有凌駕其他量產記憶體的眾多重大優勢。其中一項重大優勢是耐用性:在記憶體受判定為耗盡而無法提供持續可靠的使用之前,可以寫入的次數。Intel® Optane™ 媒體能提供更多的使用壽命期間寫入週期次數,因此耐用性遠高於 NAND 記憶體。此外,Intel® Optane™ 媒體能進行同一位址寫入更新,避免 NAND 系統必須以耐用性為代價而執行的額外寫入。(請參閱技術簡介「Intel® Optane™ 技術: 內存還是存儲?都.」(Intel® Optane™ 技術:是記憶體或儲存裝置?兩者兼具。)) 基於這兩個理由,以 Intel® Optane™ 媒體為基礎的 Intel® Optane™ DC 固態硬碟 (SSD),其耐用性遠高於 NAND SSD。此外,Intel® Optane™ 媒體較高的耐用性使它能作為系統持續性記憶體使用,因此目前已可作為 Intel® Optane™ DC 持續性記憶體使用。

本報告討論 NAND SSD 和傳統記憶體的耐用性問題和屬性,並說明當 Intel® Optane™ 媒體用於 Intel® Optane™ DC SSD 或 Intel® Optane™ DC 持續性記憶體模組時,如何順利克服這些問題且提供更高的耐用性。

何謂耐用性?

簡言之,耐用性就是系統在其使用壽命期間能接受且能可靠記住的資料寫入總次數。耐用性不應和容量混淆:任何時刻儲存裝置能容納的寫入總次數。可重複寫入的儲存技術其耐用性比容量高得多,有時是以可以寫入容量的次數來表示。

我們可以把耐用性類比為汽車輪胎的磨損和裂縫。一組輪胎只能提供一定的行駛里程數。輪胎過度磨損時,就無法依賴它們提供安全行駛。輪胎能維持多久,取決於其品質(它們設計的耐用性),以及您使用它們的頻率(每天的行駛里程數)。如果是輕度使用,即使中等品質的輪胎也可以使用好幾年。但如果是重度使用,輪胎可能一年內就磨損殆盡。非揮發性記憶體就像是輪胎,在「磨損殆盡」且無法支援更多寫入之前,它們只能接受有限的資料寫入次數。如同輪胎一樣,不同的媒體技術對於使用壽命期間的寫入次數有不同的限制。

圖 1.磁碟機耐用性有如輪胎磨損:特定年份內的磨損量取決於輪胎的使用方式、類型,和品質。

一般而言,非揮發性記憶體通常作為 SSD 較大子系統的一部分進入運算系統。SSD 耐用性說明在磁碟機變成不可靠之前,其完整容量可以覆寫的次數。基本上 SSD 的耐用性限制來自於用以製造 NAND SSD 的非揮發性記憶體單元。除了 SSD 本身的設計,NAND 快閃記憶體設計所選擇的架構也會影響 SSD 的耐用性限制。耐用性通常以每天平均磁碟機寫入次數 (DWPD),或使用壽命期間的總寫入次數來表示。這兩種指標在 SSD 使用壽命期間(通常是五年)是相等的,且 SSD 的容量亦需列入考慮。

資料中心安裝 SSD 時,工作負載所要求的耐用性及資料中心所期待的續航力,是必須考量的關鍵因素。總而言之,耐用性決定了 SSD 的可使用壽命,成為可靠資料中心操作成本當中的重要因素。若要選擇耐用性等級,操作員必須瞭解預期工作負載所要求的寫入負載,然後將該負載乘上 SSD 汰除之前的預期壽命。如果選擇的磁碟機無法滿足預期的負載,將會產生額外的費用,而且更換 SSD 時也可能影響系統的正常運作時間。

NAND SSD 架構如何影響耐用性

NAND SSD 耐用性是一個複雜的課題,需要瞭解 NAND 記憶體本身如何運作。對於 NAND 記憶體,寫入操作只能把 1 翻轉為 0,而沒有其他方式。在能執行任何寫入之前,快閃記憶體單元內現有的資料首先必須清除,將所有位元設定為 1。NAND 媒體內的清除單位各自不同,但在所有狀況下,都大於相對最小的寫入或讀取單位。清除區塊的大小是以多個百萬位元組 (MB) 為單位,寫入頁面是千位元組 (KB) 的數 10 倍,讀取大小則僅 4 個千位元組,這些是目前常見的狀況。清除操作會刪除整個區塊,包括許多寫入頁面。這增加了 SSD 操作的複雜度。

圖 2.就像簡單的繪圖玩具一樣,在單元中寫入新資料之前,NAND SSD 必須清除快閃記憶體單元內的現存資料。

NAND SSD 是專為管理這個基本架構並同時提供充足效能和耐用性而設計。從系統讀取就能存取正確頁面。寫入 SSD 的動作一律是針對已經清除的區塊執行。多個 SSD 寫入會持續收集,直到成組的 4 KB 磁區足夠填入寫入頁面,此時資料才會寫入。接著 SSD 的間接表格(通常保留在 DRAM 中)會更新,以追蹤每一磁區的位置,使得後續的存取能找到磁區。這個程序繼續執行,直到整個區塊均寫入。

在 SSD 等級,其中一個磁區以新資料重新寫入時,狀況變得更為複雜。NAND 記憶體不允許資料更新如此簡單;相反地,是將其寫入到已經清除的不同區塊中。現在原始區塊保留著過時資料。但是清除區塊內的其他資料可能仍然有效,所以無法清除區塊。保留過時資料的頁面暫時變成無法動彈,沒有保留有用資料,卻又無法重新寫入。最後這個空間必須以經常稱為「垃圾資料回收」(garbage collection) 的程序來回收。在這項程序中,剩餘的有效資料頁面會由內部 SSD 邏輯複製到已經清除的區塊。現在,原始區塊沒有保留必要資料,所以可以清除以備寫入。無效的空間以這種方式回收了。

寫入動作很重要。耐用性等於系統在其使用壽命期間能接受而且能可靠記住的資料寫入總次數。為什麼只算寫入而不算讀取?因為從媒體讀取是非破壞性的操作,因此系統架構師較少關切。

請注意,上一段所描述的程序在 SSD 中產生寫入動作。這些寫入沒有出現在對於 SSD 的輸入中;這些是額外的寫入。用於描述這個現象的術語是寫入放大率 (WA)。WA 等於寫入 NAND 媒體的資料量,除以系統寫入到 SSD 的資料量。耐用性是以 SSD 等級來標示,所以這些寫入動作並未包含在該數據中。但是仍然必須考量它們,因為媒體耐用性是不能超越的基本可靠性限制。

在此可以發現,主機的寫入工作負載特性能對 WA 會造成負面影響。需要大量隨機寫入的工作負載,特別是像 4 KB 這種小量寫入,是最糟糕的狀況。這是因為隨機寫入會橫跨許多不同的清除區塊來集中無效的 4 KB 資料區塊,這會產生較高的「垃圾資料回收」負擔。WA 等於 3 或以上並不少見。WA 若等於 3,則只有三分之一的基本 NAND 記憶體耐用性可供系統存取。

若要啟用「垃圾資料回收」,NAND SSD 必須維持使用者不可見的若干備用空間,以供資料複製到此空間。磁碟機總空間相對於使用者可見空間的比率,稱為超容量快取 (OP) 空間。OP 空間越大,SSD 越可能發現含有少量有效資料的區塊,降低 WA 的負擔。較大的 OP 空間會增加 SSD 成本。因為這個原因,耐用性較高、寫入效能較高的 SSD 會造成較大的 OP,因此成本也隨之攀升。

因此耐用性是由基本 NAND 記憶體的功能、SSD 的 OP、SSD 用來辨識清除區塊演算法的效率,以及工作負載本身所決定。基於這個原因,NAND SSD 的耐用性差異可從成本最低 SSD 的數十分之一 DWPD,到最昂貴 SSD 的 10 DWPD。1 在下一段將看到,如果使用 Intel® Optane™ 媒體來實現較高的耐用性,狀況會簡單得多。

Intel® Optane™ 媒體如何與眾不同

Intel® Optane™ 技術問世時,是二十多年來,首項嶄新的量產記憶體技術。Intel® Optane™ 技術以完全獨特的記憶體媒體所打造,採用具備各種強化耐用性屬性的新材料。此外,以該技術為核心的 Intel® Optane™ 媒體和 SSD 或平台記憶體子系統,係秉持高耐用性的理念而專門打造。Intel® Optane™ DC SSD 和記憶體模組大體上能提供優於 NAND SSD 的效能和耐用性。

Intel® Optane™ 媒體擁有與耐用性密切相關的各種優勢,和 NAND 媒體截然不同。截至目前最重要的第一點是:優勢在於單元本身。Intel® Optane™ 媒體單元以專為實現更高耐用性的材料和操作方式來打造。Intel® Optane™ 媒體以具備選擇器和記憶體材料的許多個別單元來打造。單元在記憶體材料的大量屬性中儲存「1」或「0」。其使用程序的彈性橫跨數十年,比 NAND 媒體所用的捕捉電荷程序承受更多週期。

Intel® Optane™ 技術突破了 NAND 障礙

Intel® Optane™ 技術以完全嶄新的記憶體媒體為基礎來打造,像 DRAM 一樣可位元組定址、像 NAND 一樣非揮發,而讀/寫延遲則介於兩者之間。

Intel® Optane™ 技術結合了 Intel® Optane™ 媒體、Intel 控制器、軟體和系統互連,可作為記憶體或儲存裝置來部署。

事實上這項耐用性優勢相當優異,因此 Intel® Optane™ 媒體具備充足的耐用性,可作為系統記憶體,這與 NAND 媒體不同。其次 Intel® Optane™ 媒體具備位元組存取性和同一位址寫入功能。這項記憶體沒有「寫入前先清除」的要求,只有讀取和寫入。這一點大幅簡化系統設計,代表基本媒體的所有耐用性可在系統等級提供,如下所述。

Intel® Optane™ DC SSD 可省略 NAND 的負擔

Intel® Optane™ DC SSD 以 4 KB 為單位維護資料,配合現有作業系統儲存堆疊所用最常見的配額。透過媒體的同一位址寫入功能,不需要 NAND SSD 在寫入時重新配置的程序。再次寫入現有的儲存磁區時,可在現有位置上直接更新。這是項重大差異,因為這表示:

  • 不需要「垃圾資料回收」
  • 不需要分配使用者不可見的額外空間
  • 不會產生額外的寫入動作

所以對於 Intel® Optane™ DC SSD 而言,WA 等於 1(無)而 OP 等於 1(無)。「垃圾資料回收」操作沒有會消耗記憶體耐用性的背景寫入動作,能提升 SSD 提供的耐用性。也不會有由「垃圾資料回收」推動的寫入動作來妨礙主機產生的存取動作,能為系統提供更多媒體效能。

Intel® Optane™ DC SSD 落實專屬的平均抹寫演算法,來確保抹寫動作在 Intel® Optane™ 媒體的所有單元上平均分配。這項間接操作能確保特定位址的重複寫入,不會讓 SSD 提早耗盡。對一個區域進行不成比例的寫入動作,會使那些寫入動作映射到不同的實體位置。SSD 在資料的舊位置和新位置之間簡單切換,且在無形中處理這個動作,再次地,完全不需要進行垃圾資料回收。

透過這些記憶體等級和 SSD 架構等級的創新開發,系統將能使用 Intel® Optane™ 媒體完整的高耐用性功能。Intel® Optane™ DC SSD 目前提供最高 60 DWPD,2 遠遠凌駕 NAND SSD。

使用壽命期間的耐用性非常重要

SSD 的壽命常以計算 DWPD 預期平均數的方法測量。超過預期 DWPD 的使用方式將會縮短 SSD 的可用壽命。這就是為何計算資料中心工作負載通常產生的平均 DWPD 是非常重要的。

例如,儲存快取記憶體的使用方式較接近 CPU,而且其容量比擴充的儲存裝置小,寫入將更頻繁進行。其他應用程式需要的寫入操作可能非常稀少。

磁碟機能維持的最大寫入次數,是由 DWPD 乘上 SSD 容量,再乘上製造商保固書所載的磁碟機壽命(以年計)。將這個簡單的公式套用到 NAND SSD 和 Intel® Optane™ DC SSD,能清楚顯示兩種記憶體媒體架構差異所產生的影響:

  • 一個保證五年 3 DWPD 的 ½ TB NAND 磁碟機將可支援五年期間最大 3 PB 的總寫入(1 TB = 1012 bytes 且 1 PB = 1015 bytes)。
  • 一個保證五年 60 DWPD 的 ½ TB Intel® Optane™ DC SSD 將可支援五年期間最大 55 PB 的總寫入。2

比較這兩款 SSD 即凸顯出 Intel® Optane™ 媒體提供的卓越耐用性優勢。若要匹配單一 Intel® Optane™ DC SSD 的預期壽命容量,則需要超過 18 部 NAND SSD。

對許多資料中心操作來說,同時部署 Intel® Optane™ DC SSD 和 Intel® NAND SSD 能獲得效能與成本的最佳平衡。例如,具備充足資料位置的工作負載可能獲得如下資料中心的最佳支援:少量的 Intel® Optane™ DC SSD 專用於處理百分之 90 的寫入操作,而剩餘的 10% 交給 NAND SSD。這可能造成系統內的 SSD 總數較少,而可能減少必須安裝 SSD 的系統數量,進一步改善總持有成本 (TCO)。Intel® Optane™ DC SSD 和 Intel® NAND SSD 經過良好規劃組合可能可以提升成本效益,同時確保不會超過兩者的保證使用壽命期間 DWPD。

進一步提升耐用性:Intel® Optane™ DC 持續性記憶體

打從一開始 Intel® Optane™ 媒體的構想即是可用於儲存系統 (SSD) 和記憶體系統。系統記憶體是由 CPU 負載存取,並透過系統記憶體匯流排,而非系統輸入/輸出 (I/O) 匯流排來儲存指示。當 Intel® Optane™ 媒體的位元組可定址性和同一位址寫入屬性作為系統記憶體使用時,耐用性的需求也必須獲得滿足。記憶體匯流排能提供高於 I/O 匯流排的讀寫率。這些較高寫入率衍生出的耐用性需求將遠高於 SSD 所需。所以 Intel® Optane™ DC 持續性記憶體需要遠高於 SSD 的耐用性,以便在五年期間持續可用。

Intel® Optane™ DC 持續性記憶體的耐用性經特別指定,能讓系統在其使用壽命期間寫入記憶體模組,而不需擔心提早耗盡。耐用性是以記憶體模組的最大功率等級來指定,其中寫入頻寬是最大值。若要提供數據,Intel® Optane™ DC 持續性記憶體指定能使用 5 年,全年無休,使用壽命期間寫入的總資料量大於 350 PB(以 256 GB 模組而言)。這遠高於 Intel® Optane™ DC SSD 的 55 PB 使用壽命期間。就像 SSD,記憶體模組計數朝向這個使用壽命期間限制演進,並向系統管理軟體提供寫入計數,以回應智慧型指令的要求。配上高等級耐用性,讓這項獨特技術可作為記憶體使用,持續革新系統記憶體和儲存裝置階層架構。

Intel® Optane™ 媒體能為資料中心帶來哪些優勢

Intel® Optane™ 媒體為資料中心提供增加耐用性,同時降低成本和提高效能的能力。耐用性直接影響操作成本:提升的耐用性能直接轉化為較低的 TCO,而不需犧牲效能。

SSD 在其使用壽命期間能接受的寫入次數,亦即其耐用性,是系統使用的關鍵決定因素,長期而言則與系統成本相關。透過媒體進步和 SSD 架構最佳化,Intel® Optane™ DC SSD 能提供超過許多 NAND SSD 10 倍的耐用性。1 2

Intel® Optane™ DC SSD 提供大於10 倍的 NAND SSD 耐用性2

最後,Intel® Optane™ DC 持續性記憶體允許將 Intel® Optane™ 媒體作為系統記憶體來存取,且同樣地能提供較高等級的新系統耐用性。3 這些嶄新的耐用性等級在系統等級提供新的用途和新方式,以降低成本並提高系統效能。

關於作者:Frank Hady

Frank Hady 是 Intel 院士,也是 Intel 非揮發性記憶體解決方案事業群 (NSG) Optane 系統架構長。他帶領 Intel® Optane™ 技術產品的研究與定義,以及如何將其整合至運算系統中。

Frank 的經歷:

  • 擔任領導平台 I/O 架構師
  • 為 Intel® QuickAssist 技術 (Intel® QAT) 提供研究基礎
  • 撰寫或共同撰寫以網路、儲存裝置和 I/O 創新為主題的 30 份已公開報告
  • 擁有 30 多項美國專利
  • 維吉尼亞大學電機工程學位及馬里蘭大學博士

進一步瞭解

歡迎探索記憶體與儲存裝置技術系列中的其他報告,進一步瞭解 Intel® Optane™ 技術如何為資料中心的記憶體和儲存裝置階層架構帶來革命。

若要進一步瞭解 Intel® Optane™ DC 持續性記憶體,請造訪:https://www.intel.com.tw/content/
www/tw/zh/products/memory-storage/optane-dc-persistent-memory.html

若要進一步瞭解 Intel® Optane™ DC SSD,請造訪:https://www.intel.com.tw/content/www/tw/zh/products/memory-storage/solid-state-drives/data-center-ssds/optane-dc-ssd-series.html

產品與效能資訊

1依據常見 NAND SSD 的發佈規格。
2Intel,「Breakthrough Performance Expands Datasets, Eliminates Bottlenecks.」(突破性的效能擴展資料集並消除瓶頸) 2019 年 1 月。https://www.intel.com/content/dam/www/public/us/en/documents/product-briefs/optane-ssd-dc-p4800x-p4801x-brief.pdf
3Intel,「Intel® Optane™ DC persistent memory product brief.」(Intel® Optane™ DC 持續性記憶體產品簡介。) https://www.intel.com.tw/content/www/tw/zh/products/docs/memory-storage/optane-persistent-memory/optane-dc-persistent-memory-brief.html。所述之成本降低情境,用意是要提供範例,指出搭載特定 Intel® 處理器的產品,在特定情況與配置,可能會如何影響未來各項成本以及提供成本節省。實際情況可能有所差異。對於各項成本,或是成本降低幅度,Intel 不提供任何保證。Intel 並不控制或審核第三方的資料。您應檢閱本內容、查閱其他來源,並確認提及的資料是否正確。Intel® 技術的功能與優勢端視系統組態而定,可能需要用到支援該技術的硬體、軟體,或啟用相關服務。實際效能會依系統組態而異。沒有產品或元件能提供絕對的安全性。詳情請洽詢購入系統的製造商或零售商,或是上網參閱 intel.com.tw。結果係採用內部 Intel 分析或架構模擬或模型進行預估或模擬,僅供您參考之用。系統硬體、軟體或配置如有任何差異,都可能會影響實際的效能表現。Intel、Intel 圖誌及 Intel Optane 是 Intel 公司或其子公司在美國及/或其他國家的商標。*其他名稱與品牌可能業經宣告為他人財產。