中文简体版   English   星期六 ,12月 7日, 2019 (台北)
登入  申請試用  MY DIGITIMES153
 
科技產業報訂閱
活動+

Flash與SSD產業的挑戰─可靠度與總成本

  • DIGITIMES企劃

華騰國際科技產品經理部總監曾德彰

當跨入10nm製程以下,NAND Flash即將面臨到嚴苛的ECC即時修正位元的暴增、使用壽命的減短,讀取速度等會影響到品質、耐受度的嚴苛考驗。記憶體╱固態硬碟廠商以可靠度與總成本(Total Cost of Ownership;TCO)為設計理念,掌握快閃記憶體與其他非揮發性記憶體技術進程,並搭配自家專屬的防護技術,使快閃記憶卡、隨身碟與SSD等產品避免因操作過程突然斷電所造成的資料遺失,延長使用壽命並提昇品質…

快閃記憶體即將面臨物理製程的極限

華騰國際科技(ATP)產品經理部總監曾德彰(Alex Tseng)指出,目前NAND Flash已經發展到20nm與19nm,2013年即將看到15nm的樣品,他大膽假設在10nm之後即將面臨製程上的挑戰。以64word-lines為一個Cell,32nm製程採用單價十億元的浸潤式機台的多重曝光顯影技術(Multiple Patterning),2D-NAND(MLC)做到2,564nm2,3D(SLC 4Layers)則是1,475nm2,3D(MLC 4Layers)為867nm2;3D(MLC 8Layers)做到433.5nm2;25nm製程使用Airgap(Spacer)降低干擾的技術,2D-NAND(MLC)可做到1,775nm2,3D(SLC四層)做到1,202nm2,3D(MLC四層)作到726nm2,3D(MLC八層)做到323nm2

20nm製程採High-K Metal Gate(High-K金屬閘極)技術,2D-NAND(MLC)可做到1,434nm2,3D(四層SLC)為940nm2,3D(四層MLC)為584nm2,3D(八層MLC)做到292nm2;15nm製程採EUV或其他技術,2D-NAND(MLC)做到965nm2,3D(四層SLC)為764nm2,3D(四層MLC)為492nm2,3D(八層MLC)為246nm2

各NAND Flash大廠即將於2013∼2014年陸續推出採3D垂直或堆疊技術的快閃記憶體,可以在32nm製程就將成本下降到以往需15nm製程才能達到的水準。

目前三星主要有TCAT與VG-NAND等技術,東芝有P-BiCS( Pipeline Bit Cost Scalable Solution)技術,美光有DG TFT(Dual gate TFT)技術,海力士則是S-FG(Surrounding FG)技術;台灣旺宏(Macronix)也在2009年發表BESONOS技術,交大R. Shirota教授發表相容2D製程的3D TFT SONOS技術等。ATP與這些快閃記憶體業者有長期的合作,掌握技術趨勢並提供穩定且成本有效下降的產品。

至於其他像是磁阻記憶體(ReRAM)、強鐵記憶體(FeRAM),相位變化記憶體(PCRAM)等非揮發性記憶體,Alex Tseng認為除非它們的製造成本能快速下降到每1GB等於或小於1美元,不然要取代NAND Flash的機會非常低。以電腦記憶體金字塔結構來看,最頂端SRAM做為CPU Cache,第2層則是DRAM做為系統運作快取(System Cache);金字塔底層 NAND Flash/HDD做為主流儲存裝置,前述的MRAM/PC RAM,在2015年前頂多可做為NVM Cache等利基型應用。

快閃記憶體可靠性對控制晶片的挑戰

從NAND Flash耐受度(Endurance)與所需ECC修正位元數的趨勢來看,過去SLC僅使用1bit ECC,P/E Cycles為100K,到了2xnm就降到60K,MLC則隨著製程的演進,Endurance呈現巨幅下降,ECC修正位元數呈現指數曲線的暴增;從5xnm製程的MLC的P/E Cycles有10K、需4bit ECC,到3xnm製程的MLC其P/E Cycles已下降到5K,且需要 8bit ECC;2xnm製程的MLC則降為3K、ECC修正位元提高到15∼24bit。而TLC記憶體的P/E Cycles更降到1K以下,需72bit甚至上百位元的ECC。因此Flash控制晶片的編碼技術,將從BCH編碼技術,逐漸轉向LDPC(Low Density Parity Check)。

從去年蘋果併購以色列Anobit公司,到今年希捷與DensBits公司策略聯盟,代表大廠亟欲掌控快閃記憶體訊號處理技術。以讀寫區間示意圖來看,SLC只有一個Program區間及Erase區間,Endurance與Retention Margin較大;在同樣的電壓準位下,MLC區分成三個Program區間及Erase區間,Endurance與Retention Margin變小也變窄;當跨入TLC,同樣的電壓準位被區分成七個 Program區間及Erase區間,每個Program區間已經沒有margin使得read retry成為必須,Endurance與Retention Margin也變得最小。

另外NAND Flash有Read Disturb(讀取擾動)的效應。從一個NAND Flash陣列電路圖可看出,即便只有讀取某一個Page,在跟該讀取Page處於同一條Vdd電壓連接的相鄰Page都會被干擾到,估計MLC累積100K次相鄰讀取,或SLC累積1KK次相鄰讀取之後,會開始產生無法ECC修正的錯誤。

因此ATP與控制晶片合作,提供了三∼五年後依然維持穩定的唯讀資料應用。一個NAND Flash儲存裝置,會有LBA mapping table,以及區分成較常反覆讀寫的Hot data Zone,以及較少讀寫的Cold data Zone,其中hot data zone有一小部份區域是存放著開機的OS/Boot-up Sector,控制晶片隨時偵測每個區塊的健康狀況,當累積讀取到了一定次數,會將OS/Boot-up Sector從搬移到Cold data Zone,以避免累積超讀取擾動的上限次數,造成ECC無法修正讀取錯誤,進而延長該裝置的使用壽命。

協助客戶依照其應用、壽命與最低TCO去規劃其Flash產品

ATP會依照客戶對產品品質與耐受度的需要,考量故障返修率,規劃出長期總持有成本(TCO)最低的加值應用方案。假使客戶在產品評估階段假設花10美元,此階段選擇正確的記憶體組件相當重要,因為接下來萬一該組件停產需要變更時,此時以精要花費達到50美元;而當該產品如果評估的壽命未到時就被要求替換,往往得花費100美元,最可怕的就是因品質以及電源因素造成的失效,此時返修成本可能高到500美元,從一開始沒選擇正確的產品組件,到最後增加的總持有成本高達2,000美元或更高。

要如何確保產品生命週期與品質,ATP從BOM表控制,到長期供應相同製程、同等級endurance/retention的組件,與記憶體、控制晶片供應商長期緊密的夥伴關係,長期提供可選擇的不同來源的組件,以因應一級大廠客戶所需要的三∼五年長期供應合約上的品質需求。

曾德彰同時提到,對於SSD耐受度的評估,除了主要因素取決於選用MLC(3K)或SLC(60~100K)記憶體之外,另外像是WAI、Data Pattern與SSD Cache大小也是關鍵因素。像是客戶的Data Pattern是隨機雜亂的寫1KB,其對Flash的耐受度反而比循序寫16KB到各Block的耐受度還低,ATP以總寫入位元組數(Total Byte Written ,TBW)為評估,以發揮每一個區塊100%的儲存效益,進而協助客戶選擇正確的產品,以符合其成本、預算下對實際應用的耐受度需求。

Flash記憶體所儲存的電荷位元電壓值,會隨時間及周遭溫度影響而逐漸偏移降低,當降低於一個臨界值就會出現判讀錯誤的情況。而Flash的P/E Cycles與壽命,會隨著其容量被佔用的百分比的增加而逐步降低,例如MLC Flash僅用到10%容量時,整體P/E Cycles可以100%達到3K,使用壽命達到5年;當Flash使用50%容量,此時P/E Cycles、使用壽命可能減半成為2年,在一個頻繁使用到近100%容量的環境下,其P/E Cycles數與使用壽命就會降到一年。

Flash儲存裝置的真實應用特性,可能是第1年到第N年,用戶會經常性的寫入,從第N年到第M年則降為一般性的讀寫,到M年以後僅能唯讀,直到M+R年為止,因此ATP分析客戶真實應用的特性,為客戶規劃並量身打造出適合其使用產品週期的產品。

降低電源突然失效╱中斷的風險

曾德彰指出,對Flash記憶體產品在進行寫入時,像是正在寫入控制器鍊結表(Linktable)或磁碟檔案配置表(File Allocation Table;FAT)時,會造成產品失效需要返修的風險,甚至是整個磁碟資料的遺失,以及開機後無法辨識該裝置的風險。

ATP針對企業用戶所需Power Cycling(電源長期間歇中斷)的嚴苛應用,提供ATP PowerProtector功能,當面對突然的電壓突波(power glitch)時仍可繼續運作。在傳統頁讀取(read page)、頁程式化(program page)、區塊抹寫(erase block)僅能容忍0.2ms、1ms與2ms的中斷,啟用ATP Power防護機制後,容忍間隔值增加到5ms以上。

ATP電源防護可以智慧偵測電源失效,並在關鍵斷電時候,提供充足電源直到控制器╱Flash完成最後一道program/erase命令為止;ATP Power Protector在電源失效的情況下可以中止從主控端後續下的cmd/write命令,正在做program或Erase的區塊則讓它繼續到完成為止。避免控制器進行鍊結表( Link table、address map of LBA)更新,或磁碟FAT表寫入時被中斷,而導致整個Flash儲存裝置的失效。

他總結ATP提供全系列不同尺寸、不同速率的Flash儲存應用產品。從體積最小,傳輸速度10∼30MB的SD、miniSD與microSD記憶卡產品,到傳輸速度從10∼150MB/s的UFD、CF、DOM、CFast等隨身碟、記憶卡產品;以及傳輸速度從100MB起跳,SlimSATA、mSATA尺寸設計SSD模組,以及SATAⅡ、SATAⅢ的SSD,即便從早期512MB∼32GB記憶卡,以及小容量4GB∼480GB的SLC/MLC SSD產品仍持續提供。

SSD產品並提供ATP Power Protector 以強化power cycling應用時的安全防護與軍用級防摔防震(MIL_STD-810G)認證,並具有AES/Military Secure Erase Tool。以最高達8,000 TB (TBW) 寫入壽命的SATAIII SSD提供企業級與寬溫使用環境下高達十年以上的產品使用壽命。