巨量資料助製造業改善製程縮短交期

DIGITIMES企劃
2013-10-21
分享

製造業意欲建立競爭優勢，先決條件即是良好的製程、迅捷的交期，因此必須竭盡所能提前找出生產瓶頸，儘速排除種種難題；此一應用情境，著實蘊含了莫大的巨量資料分析應用空間。

製造業在從事生產製造的過程中，必然需要借助大量機器設備，而這些機器在長期運轉之下，必然產出為數眾多的底層資料(Row Data)，然礙於資料分析技術的欠缺，導致這些資料經常淪為視而不見的龐雜垃圾；殊不知只要透過細微的觀察分析及萃取，即可望從中找出有助於提高生產力、縮短產品交期的關鍵因子！

在過去，製造業者對於這些製程資料的平白耗損，莫不備感無奈，只因工廠內部動輒數百個、甚至數千個生產機台，而這些機台所產生的資料量不僅龐大，且格式屬性互不相同，要想善加分析，實為非常艱困的任務，所以長期以來，只能任憑大量製程資料被束之高閣，難以被萃取成為有價值的資訊，更無從轉化為製程智慧。

因此當巨量資料分析議題現身，製程業者無不大感振奮，只因若能善加運用此技術，那怕再怎麼大量且多樣化的資料，都能夠在最短時間內，予以有效處理，從而在良率改善(Yield Improvement)、虛擬量測(Virtual Metrology；VM)，乃至於預測性維護(Predictive Maintenance；PdM)等各個面向，產生立竿見影的綜效；所以若說巨量資料是帶動製造業提振生產力的關鍵路徑，一點也不為過。

製程不斷演進　帶動資料量飛速增長
根據分析機構預測，2015年全球資料量將爆增至7,910 Exabytes，相較於2005年的130 Exabytes，足足爆增5,984.62%，成長速度之驚人不在話下，但很現實的問題，包括製造業在內的任何型態企業，同樣在這十年間的資訊預算增長幅度，比起這個超過5,000的百分點，肯定遠遠瞠乎其後；因此有製造業者認為，若不先針對IT架構加以全盤改造，根本無法駕馭巨量資料。

就以深具舉足輕重地位的晶圓製造業來說，回顧十年前，IC製程不過是90奈，此後才短短數年，製程即從65奈米、40奈米一路進展到28奈米，導致業者所需蒐集與分析的製程資料，也伴隨著製程的進化而一路爆增。最早期，晶圓製造業者所需處理的生產資訊，僅停留在lot這個層次，此後隨著製程演進，致使資料處理需求更顯細膩，光是lot已經不夠，於是推移到了lot的下一階層、也就是wafer，時至今日，就連wafer都顯得太過粗略，必須再從wafer下探到die階層。

透過資料處理單元從lot、wafer推進到die，即意謂資料處理量呈現數以千倍計的成長！很簡單的道理，一個lot等同於25片wafer，至此資料量先是增長了25倍，到了die層次，則由於一片wafer內含100個die，所以資料量必須再乘上100倍，按照這個邏輯推演，晶圓製造業在十年期間所需處理的資料量，便已增加2,500倍之多。

但光是蒐集到以die為基準的製程資料，夠嗎？答案是否定的！進入28奈米、甚至是20奈米的新紀元，製造業者已不容等到生產作業結束後，再來估算Machine資料的平均值，而必須因應不同參數，每秒至少產出一次Machine資料，這個變數一旦加入，其資料量增長幅度可就不像上述的2,500倍如此簡單，而是猛漲到令人不敢想像的地步；在此前提下，晶圓製造業意欲沿用舊法，先將資料蒐集完成，再送進資料庫執行分析比對，必然不可行！

著眼於此，開始有業者深入鑽研Hadoop、MapReduce等巨量資料技術，並據以建立全新的巨量資料處理機制，另外再搭配資料儲存、資料檢索與資料探勘等其他技術，建構出巨量資料分析平台，期望藉此匯聚豐沛的分析能量，為爾後僅能以「可怕」二字形容的資料分析需求，做足萬全準備。

Big Data分析加資料探勘　從龐雜資料理出頭緒
也可歸類為半導體製造範疇的LED製造業，亦面臨與晶圓代工相似的難題。以20奈米製程為例，單單一天機台所產生的資料量，便多達20~30 TB、甚至更大，且箇中涉及十分繁雜的資料屬性，這些資料皆與Yield Improvement、VM、PdM甚至是Process Drift等應用主題至為相關，絕無可能棄之不顧。

眾所周知，LED製造業最關鍵的生產設備為MOCVD(Metal Organic Chemical Vapor Deposition)機台，一家中大型規模的業者，通常都擁有超過100台、甚至200台的MOCVD，而其最關鍵的製程，乃是落在磊晶製程，也就是從藍寶石基板變為磊晶片的過程，這段歷程的配方(Recipe)極為複雜，內含多達60個手續、及100個參數，兩兩相乘即構成6,000個手續參數，另外還得再乘上各個參數所對應的不同區間範圍，因此初估MOCVD機台每運行8小時所產生的資料量，少說也到達600萬筆之譜。

Recipe如此，wafer則更加複雜，由於需考量多達1萬個以上的LED電器特性，以及不同的參數、各參數的區間範圍，把這些維度予以相乘，又將衍生駭人聽聞的巨量資料。舉例來說，有關異地(Ex-Situ)製程部分，針對光致發光光譜成像(PL Mapping)，其量測項目即包括波長、強度與光學分辨率，範圍區間各為435~454 nm、1.2~7.3 V、25~37 nm，在區間之內每一個看似微小數值的變動，都將衍生數以倍計的資料，更何況除了PL Mapping外，尚有EL Mapping、Thickness Mapping等其餘量測項目，所以資料變動的因子，實已到達深不可測的地步。

面對如此龐大資料量，單憑傳統處理模式，絕對無法有效支撐，因此意欲提升MOCVD良率，別無他法，肯定需要借助巨量資料分析技術。有鑑於台灣LED晶粒市佔率甚高，不管在於紅黃光(AlGaInP)或藍綠光(GaN)等不同規格的LED磊晶片及晶粒製造，都堪稱是全球生產重鎮，影響台灣整體經濟產值甚鉅，因此工研院遂以巨量資料分析技術為主軸，與某家LED磊晶製造商合作推動製程改善計畫，從而透過「主成份分析(Principal. Component Analysis；PCA)」、「關聯法則探勘(Association Rule Mining；ARM)」、「反應曲面法(Response Surface Method；RSM)」等技術，針對配方參數執行關聯性分析，再藉由「隱藏式馬可夫模型(Hidden Markov Model；HMM )」與「迴歸(Regression)」等方法論，基於良率提升目的而進行配方預測，終至展現成效。

上述案例，頗值得製造業予以參考借鏡，且無論是從事LED、晶圓代工、太陽能板或顯示面板等半導體製程的業者，從事煉油、塑膠原料、人造纖維或紡織纖維之石化製造商，抑或以工具機為首的機械製造業，都可倚靠巨量資料分析技術，針對良率改善、虛擬量測或預測性維護等不同面向，獲得關鍵性的優化方案。

專家指出，前述所列的不同型態製造商，都經常與時間賽跑，必須致力將等待時間降至最低，以避免延誤交期，然往往事與願違，偏偏就有頗高比例的機台，其等待時間總是逾越預設的標準；值此時刻，若能夠借助巨量資料的分析方法，再搭配資料探勘等相關技術，即可望藉由相關資料的分析，洞悉上下游資料之間的關聯因素，從而找到足以改善問題的重點與方法，並據此設計可供持續追蹤的KPI，凡此種種，可謂巨量資料分析應用的價值所在。

而製造業另一個關注的主題，則在於致力提升生產效率，此時亦可運用巨量資料分析技術，探索各生產機台實際上發生的問題為何，繼而透過相關監視報告，讓一些出現異常的機台、以及造成異常的真因浮出檯面，接著針對異常機台的關鍵部件進行優化，並設法降低輸出損耗，如此一來，便可望讓所有機台恆常維持健康狀態，發揮最佳生產力。

加入已選取到「關鍵字追蹤」什麼是「關鍵字追蹤」

商情專輯－製造與醫療業巨量資料應用專輯