巨量資料助製造業改善製程縮短交期 智慧應用 影音
工研院
ADI

巨量資料助製造業改善製程縮短交期

  • DIGITIMES企劃

製造業意欲建立競爭優勢,先決條件即是良好的製程、迅捷的交期,因此必須竭盡所能提前找出生產瓶頸,儘速排除種種難題;此一應用情境,著實蘊含了莫大的巨量資料分析應用空間。

製造業在從事生產製造的過程中,必然需要借助大量機器設備,而這些機器在長期運轉之下,必然產出為數眾多的底層資料(Row Data),然礙於資料分析技術的欠缺,導致這些資料經常淪為視而不見的龐雜垃圾;殊不知只要透過細微的觀察分析及萃取,即可望從中找出有助於提高生產力、縮短產品交期的關鍵因子!

在過去,製造業者對於這些製程資料的平白耗損,莫不備感無奈,只因工廠內部動輒數百個、甚至數千個生產機台,而這些機台所產生的資料量不僅龐大,且格式屬性互不相同,要想善加分析,實為非常艱困的任務,所以長期以來,只能任憑大量製程資料被束之高閣,難以被萃取成為有價值的資訊,更無從轉化為製程智慧。

因此當巨量資料分析議題現身,製程業者無不大感振奮,只因若能善加運用此技術,那怕再怎麼大量且多樣化的資料,都能夠在最短時間內,予以有效處理,從而在良率改善(Yield Improvement)、虛擬量測(Virtual Metrology;VM),乃至於預測性維護(Predictive Maintenance;PdM)等各個面向,產生立竿見影的綜效;所以若說巨量資料是帶動製造業提振生產力的關鍵路徑,一點也不為過。

製程不斷演進 帶動資料量飛速增長
根據分析機構預測,2015年全球資料量將爆增至7,910 Exabytes,相較於2005年的130 Exabytes,足足爆增5,984.62%,成長速度之驚人不在話下,但很現實的問題,包括製造業在內的任何型態企業,同樣在這十年間的資訊預算增長幅度,比起這個超過5,000的百分點,肯定遠遠瞠乎其後;因此有製造業者認為,若不先針對IT架構加以全盤改造,根本無法駕馭巨量資料。

就以深具舉足輕重地位的晶圓製造業來說,回顧十年前,IC製程不過是90奈,此後才短短數年,製程即從65奈米、40奈米一路進展到28奈米,導致業者所需蒐集與分析的製程資料,也伴隨著製程的進化而一路爆增。最早期,晶圓製造業者所需處理的生產資訊,僅停留在lot這個層次,此後隨著製程演進,致使資料處理需求更顯細膩,光是lot已經不夠,於是推移到了lot的下一階層、也就是wafer,時至今日,就連wafer都顯得太過粗略,必須再從wafer下探到die階層。

透過資料處理單元從lot、wafer推進到die,即意謂資料處理量呈現數以千倍計的成長!很簡單的道理,一個lot等同於25片wafer,至此資料量先是增長了25倍,到了die層次,則由於一片wafer內含100個die,所以資料量必須再乘上100倍,按照這個邏輯推演,晶圓製造業在十年期間所需處理的資料量,便已增加2,500倍之多。

但光是蒐集到以die為基準的製程資料,夠嗎?答案是否定的!進入28奈米、甚至是20奈米的新紀元,製造業者已不容等到生產作業結束後,再來估算Machine資料的平均值,而必須因應不同參數,每秒至少產出一次Machine資料,這個變數一旦加入,其資料量增長幅度可就不像上述的2,500倍如此簡單,而是猛漲到令人不敢想像的地步;在此前提下,晶圓製造業意欲沿用舊法,先將資料蒐集完成,再送進資料庫執行分析比對,必然不可行!

著眼於此,開始有業者深入鑽研Hadoop、MapReduce等巨量資料技術,並據以建立全新的巨量資料處理機制,另外再搭配資料儲存、資料檢索與資料探勘等其他技術,建構出巨量資料分析平台,期望藉此匯聚豐沛的分析能量,為爾後僅能以「可怕」二字形容的資料分析需求,做足萬全準備。

Big Data分析加資料探勘 從龐雜資料理出頭緒
也可歸類為半導體製造範疇的LED製造業,亦面臨與晶圓代工相似的難題。以20奈米製程為例,單單一天機台所產生的資料量,便多達20~30 TB、甚至更大,且箇中涉及十分繁雜的資料屬性,這些資料皆與Yield Improvement、VM、PdM甚至是Process Drift等應用主題至為相關,絕無可能棄之不顧。

眾所周知,LED製造業最關鍵的生產設備為MOCVD(Metal Organic Chemical Vapor Deposition)機台,一家中大型規模的業者,通常都擁有超過100台、甚至200台的MOCVD,而其最關鍵的製程,乃是落在磊晶製程,也就是從藍寶石基板變為磊晶片的過程,這段歷程的配方(Recipe)極為複雜,內含多達60個手續、及100個參數,兩兩相乘即構成6,000個手續參數,另外還得再乘上各個參數所對應的不同區間範圍,因此初估MOCVD機台每運行8小時所產生的資料量,少說也到達600萬筆之譜。

Recipe如此,wafer則更加複雜,由於需考量多達1萬個以上的LED電器特性,以及不同的參數、各參數的區間範圍,把這些維度予以相乘,又將衍生駭人聽聞的巨量資料。舉例來說,有關異地(Ex-Situ)製程部分,針對光致發光光譜成像(PL Mapping),其量測項目即包括波長、強度與光學分辨率,範圍區間各為435~454 nm、1.2~7.3 V、25~37 nm,在區間之內每一個看似微小數值的變動,都將衍生數以倍計的資料,更何況除了PL Mapping外,尚 有EL Mapping、Thickness Mapping等其餘量測項目,所以資料變動的因子,實已到達深不可測的地步。

面對如此龐大資料量,單憑傳統處理模式,絕對無法有效支撐,因此意欲提升MOCVD良率,別無他法,肯定需要借助巨量資料分析技術。有鑑於台灣LED晶粒市佔率甚高,不管在於紅黃光(AlGaInP)或藍綠光(GaN)等不同規格的LED磊晶片及晶粒製造,都堪稱是全球生產重鎮,影響台灣整體經濟產值甚鉅,因此工研院遂以巨量資料分析技術為主軸,與某家LED磊晶製造商合作推動製程改善計畫,從而透過「主成份分析(Principal. Component Analysis;PCA)」、「關聯法則探勘(Association Rule Mining;ARM)」、「反應曲面法(Response Surface Method;RSM)」等技術,針對配方參數執行關聯性分析,再藉由「隱藏式馬可夫模型(Hidden Markov Model;HMM )」與「迴歸(Regression)」等方法論,基於良率提升目的而進行配方預測,終至展現成效。

上述案例,頗值得製造業予以參考借鏡,且無論是從事LED、晶圓代工、太陽能板或顯示面板等半導體製程的業者,從事煉油、塑膠原料、人造纖維或紡織纖維之石化製造商,抑或以工具機為首的機械製造業,都可倚靠巨量資料分析技術,針對良率改善、虛擬量測或預測性維護等不同面向,獲得關鍵性的優化方案。

專家指出,前述所列的不同型態製造商,都經常與時間賽跑,必須致力將等待時間降至最低,以避免延誤交期,然往往事與願違,偏偏就有頗高比例的機台,其等待時間總是逾越預設的標準;值此時刻,若能夠借助巨量資料的分析方法,再搭配資料探勘等相關技術,即可望藉由相關資料的分析,洞悉上下游資料之間的關聯因素,從而找到足以改善問題的重點與方法,並據此設計可供持續追蹤的KPI,凡此種種,可謂巨量資料分析應用的價值所在。

而製造業另一個關注的主題,則在於致力提升生產效率,此時亦可運用巨量資料分析技術,探索各生產機台實際上發生的問題為何,繼而透過相關監視報告,讓一些出現異常的機台、以及造成異常的真因浮出檯面,接著針對異常機台的關鍵部件進行優化,並設法降低輸出損耗,如此一來,便可望讓所有機台恆常維持健康狀態,發揮最佳生產力。