智慧應用 影音
產業垂直整合要多深? (二)
智慧型手機問世後,產業又重啟考慮垂直整合的議題。 PC有較長的歷史,而且CPU寡頭壟斷企業的地位近乎無可撼動,電腦業者可以藉垂直整合主要半導體元件入價值鏈,差異化本身系統產品的機會並不大。 相對的,智慧型手機當時才開始起步,主要廠商藉其銷售量來支持其手機CPU的設計,用以差異化其產品的功能,如蘋果(Apple)、三星(Samsung Electronics)、華為等。垂直整合的考慮再度浮上檯面。 不過這次的價值鏈垂直整合只及於IC產品設計這一層,而半導體製造環節則選擇利用已逐漸發展成熟的代工平台。手機IC設計主要在CPU這一塊,CPU大幅度決定手機功能,是手機企業核心競爭力的重中之重。垂直整合止於IC設計此一環節,能避開半導體製造環節必須自已持續投入巨額研發費用的無底洞,這是手機系統業者最合宜的價值鏈垂直整合長度。 後來的汽車產業也有類似的企圖,特別是在電動車/自駕車的領域,包括Tesla、比亞迪、小米等企業。這些電動車的終極目標自然是自駕車,包括各級別的自駕晶片,譬如Tesla的FSD(Full Self-Driving)晶片及軟體,也許會更積極擴張至AI平台,譬如Tesla的Dojo晶片及超級電腦系統。能設計車用的核心晶片及其運作統統,似乎也可掌握未來汽車產業的核心競爭力。 但是汽車與其它電子系統有根本性的差別。雖然未來電動車/自駕車有時候被戲稱行動的電腦,但是它基本上它是人的載具,牽涉到人身安全,因而引發後續的法律、風險與保險等相關問題。人命牽涉到文化中最基本的價值問題,而各國在此方面的認知存有分歧,這些分歧也可能造成市場的碎片化。另外,這些價值的認知即便在同一國家中亦可能存有差異,也可能造成市場發展緩慢。 從這個問題出發,統一半導體元件標準也許是建立規模經濟的解決方案。雖然在統一標準的過程中由於各地法律和文化的差異會比較困難,但是在標準統一之後,在各地的法律修定、保險規章費率、系統環境支持等方面可以快速發展,這是擴大整體規模經濟的方式。也就是說,對於攸關安全的半導體零件以及人工智慧、運行平台制定統一的標準,而產品的差異化及競爭力則置於其他面向。目前已有幾個機構正在推動制定汽車半導體元件的標準,譬如國際半導體產業協會(SEMI)。這也許是Tesla在此階段就將FSD軟體公開授權的原因,目前已經有許多車廠宣布支持此一方案。Tesla在此階段始推動統一標準無疑是深思熟慮的結果:目前尚未達到需要大幅牽動法律修改的自駕程度,此時先推動標準的統一,阻力會少很多,最多只是商業考量,而非汽車企業較難著力的修法程序。等到統一標準形成、變成既成事實後,修訂法律也會比較容易進行。而Tesla Dojo晶片和系統,也專注於影像識別的AI,這是自駕車系統最基礎的平台功能之一。 有些汽車企業甚至垂直整合入晶圓製造廠的環節,譬如博世(Bosch)和比亞迪。這會重蹈以前系統廠商與半導體廠終歸分離的覆輒嗎?不一定。 這幾家的晶圓廠都是以功率元件為主要產品,包括 power MOSFET、IGBT和SiC等。功率元件的獲利方程式與前述典型的藉持續投入研發、快速推進製程以獲取超額利潤的手段不一樣。這不是說功率元件不需要研發,只是比較集中在元件的結構與材料,而呈現的結果主要是耐壓、電的性能和可靠性的提升。  功率元件的製造主要在8吋廠,製程也還停留在0.20~0.25微米以上,這是因為要耐高壓、電需要較寬的線幅,提高元件性能只能靠元件結構和材料。以IGBT為例,從1980年代出現迄今,總共也只經歷7個世代。它的演進遠較邏輯和記憶體產品緩慢,研發經費可以在較多年限攤提。 在功率元件的領域,研發的規模經濟門檻較低,這也解釋在此領域還存有大小不等的IDM公司的原因。 汽車企業垂直整合功率元件半導體製造廠在,短期間內可以緩解過去幾年在車規功率半導體供需不平衡的問題。但是長期來看,汽車的核心價值會往AI與網路傾斜,能源的變換會變成標配,這個垂直整合是否合理還有待觀察。 另一個有趣的議題是有些IC設計公司宣稱他們是系統公司—另外的其實只是不做聲響、悄悄在做而已,在異質整合成為技術演進主流的年代,這個趨勢幾乎無可避免。電子系統的核心功能將被整合在單一的先進封裝內。電子系統產業與半導體產業如何在長價值鏈中分工或融合,這是企業該開始問一問自己的議題。
產業垂直整合要多深? (一)
一個產業的加值鏈通常包含多個加值節點,一個產品/服務的最後價值,即是這些個別加值的總合。傳統的企業競爭策略理論會告訴你一個企業能夠整合進比較多的主要加值環節、成為企業核心能力的一部分,企業的競爭力會比較強。而且,在面臨產業加值鏈變遷時,企業比較有韌性,更能爭取時間以及資源去因應變遷。  半導體自成一個產業,2023年產值到達約6,000億美元,與PC、手機、伺服器等電子系統產業是同一個數量級的產值;另一方面,半導體又是各電子系統產品產業加值鏈的一環。於是電子系統與半導體的垂直整合,便反覆地成為產業內的策略考慮之一。  70年代主要的美國半導體業者是英特爾(Intel)、德儀(TI)和摩托羅拉(Motorola),其中TI有消費性產品,也有政府契約的產品;摩托羅拉是通訊公司。當時系統公司投入半導體產業有兩主要目的:1.投入新興的關鍵科技;2.公司核心能力的垂直整合。這兩個主旋律在產業內重複出現。  80年代日本主要的半導體公司如NEC、東芝(Toshiba)、日立(Hitachi)、富士通(Fujitsu)、三菱(Mitsubishi)等,以及南韓的三星(Samsung Electronics)、現代(Hyundai)和Gold Star,其背後無不有電子系統公司的身影。倒是台灣80、90年代的主要半導體公司絕大部分都是單從投資新興關鍵科技的觀點出發,這對於後來的發展影響巨大。  垂直整合當然不是企業在產業內競爭的唯一致勝手段,如規模經濟等也會影響競爭的結果。  半導體產業是高科技產業,獲得超額利潤的主要手段,是藉先於同儕利用尖端技術推出性能更優越的產品,而這種型態的競爭是持續的。持續的技術研發需要巨大資金不間斷的投入,商業機構的資金自然是來自於營業利潤的累積,營業額的規模大致決定能投入持續研發經費的尺度。在愈接近物理尺度極限時的研發工作變得更為複雜艱難,此時規模經濟的因素就變得格外顯著。  對於此規模經濟考量的因素下,80、90年代最大的次產業DRAM以及邏輯晶片分別演化出不同的樣態,以取得在規模經濟考量下的最適應模式。  DRAM次產業採取在產品介面標準化策略,促進規模經濟的發生—DRAM變成大宗商品(commodity)。大宗商品在流通、用量上較諸專用商品上有天然的數量優勢,進一步確立規模經濟。  如果半導體產品與電子系統廠商垂直整合,半導體產品的銷售原先有競業的問題—很難想像,譬如,三星手機設計的CPU晶片蘋果(Apple)願意使用。但是因為DRAM介面採用統一標準,競業因素變得不重要,因此半導體廠產品的總體潛在市場(TAM)擴大了。如此也有負面效果。DRAM產品介面標準化後,原先在系統價值鏈垂直整合的綜效就被打了折扣:大宗商品可從市場中擇優取得。  另外,領先的DRAM公司還利用DRAM與2D NAND Flash製程的相似性,跳躍性的擴大記憶體製程的研發規模經濟,一次性的拉開與記憶體產業中第二梯隊的差距,形成今日記憶體產業三足鼎立的態勢。  邏輯產品品類比較分散,過去主要產品CPU處於寡佔狀態,近乎虛擬的統一標準;其他產品次市場的份額較小,即便統一產品介面標準也難以形成有效的規模經濟。所以邏輯產品採取不同的途徑來取得規模經濟:共用相同或相容的製程平台,這就是代工次產業概念的濫殤。  記憶體產業以統一的產品介面標準,以及代工產業以共用的製程平台,形成各自規模經濟,也反轉電子系統產業垂直整合半導體的原先企圖。
智慧城鄉應用永續經營三關鍵
新竹縣政府主辦一場「智慧城鄉論壇」,我受邀擔任下半場綜合討論的與談人。題目為「以公私合作推動智慧城鄉發展」,由行政處長周秋堯及都市發展與環境教育基金會榮譽會長林建元共同擔任主持人,分享智慧城市發展前景與趨勢,及新竹縣面臨的機會與挑戰。會場聽眾詢問,新竹縣發展智慧城鄉的策略為何? 對於智慧城鄉應用的永續經營,我認為應該考慮3個問題:首先,要清楚區分必要與非必要(Must-have or Nice-to-have)。將智慧城市應用區分為「必備」或「可有可無」反映它們對日常生活產生影響的不同程度。在某些情況下,這些應用的存在或缺乏可能不會顯著改變城市居民的日常體驗。然而,必須承認這些應用的成功或失敗取決於它們的功能性以及它們是否能夠融入城市結構。以智慧家庭應用而言,電動窗簾大家都感新奇。但要花大錢建置,可能就無人問津。因此這是一個「可有可無」的應用,而非「必備」的應用。第二,需分析維運成本(CAPEX vs OPEX)。很多應用勉強建置,無力維護。智慧城市應用的失敗案例包括未能滿足期望或缺乏必要基礎設施的情況。此類缺陷可能包括使用者界面不足、數據處理效率低下或連接性不足。這些挫折強調在部署智慧城市解決方案之前,進行健全規劃和充分測試的重要性。台灣的失敗案例不勝枚舉,一個成功案例是YouBike,很務實地在許多台灣的城鎮提供服務。在中國大陸,很多類似YouBike的服務太過花俏,OPEX太高而失敗。第三,要能夠選擇有用數據(To data or not to data)。不知如何使用數據,就不會有智慧城鄉。我提出智慧農業的成功案例,是我們幫蘭花工廠進行非影像蘭花黑頭偵測的應用。城市最應該運用的數據是交通數據。而智慧路燈是最好的載具,應在現有的路燈掛上智慧平台,而非取代現有路燈系統。在台灣,許多智慧城市應用的存在與否並未對居民的日常生活產生顯著影響,他們的生活維持著往常的方式。而很多「必備」的智慧城市應用都是因為政府法規要求。在衛福部一個顯著而成功的案例是在醫療應用中推廣快速醫療互通資源(FHIR)。FHIR已成為醫療保健領域的一股變革力量,促進電子健康記錄的安全交流,並在各種醫療系統之間促進互操作性。其成功是對設計良好且有效實施的智慧城市應用在關鍵領域(尤其是醫療保健)中可能產生積極影響的明證。智慧城市應用失敗的主要原因是將簡單的問題複雜化,同時缺乏解決問題的實際行動力。很務實的解決上述3個問題,智慧城市有永續經營的機會。我給的答案,應該都適用於所有城市。
寧可信其有的迷信
台積電熊本廠(亦可稱為日積電,Japan Advanced Semiconductor Manufacturing;JASM)日前不久舉行開幕儀式,一時冠蓋雲集,台日雙方重要的政經人士均出席開幕盛會,見證此歷史性的一刻。媒體對此重要的事件有諸多的報導,在此不再贅述,但是不知讀者是否注意到日積電的英文標示,是用英文小寫的,尤其是j上面畫龍點睛的一紅點,也正象徵日本國徽。如果讀者注意到日本對外重要的活動,其中的J都一律用英文的大寫,我尤其喜歡大谷翔平代表日本國家棒球隊時,隊衣上那非常流線英文大寫的J,形貌近似於日本的國土。也許讀者會說台積電的英文也是用小寫的,這就是關鍵所在。台積電tsmc為何捨棄英文的大寫,而改用小寫?台積電蔣爸(指蔣尚義)曾跟我說,這是經過高人的指點,因為大寫的T出不了頭,小寫的t可以出頭。雖說是迷信,但是台積電決策者能從善如流,寧可信其有,也是美事一樁。所以日積電大寫的J出不了頭,小寫的j可以做到。在此不禁想到AT&T也將商標由原先大寫的T,增加了小寫的版本,難道是受到台積電成功的影響?在科技產業中如果說起迷信事件,綠色的乖乖算是其中最為人所談論的,你很難想像在先進半導體的機房中,擺了為數不少的綠色乖乖。綠色代表機台在正常的運轉,為了保持機台的穩地度及妥善率,綠色乖乖是絕對少不了的。這一開始也許只是個別的行為,但是在心理作用的慫恿下,逐漸擴展為全民運動。就連超微(AMD)的蘇媽(指蘇姿丰)來台會見在台員工,也要跟綠色乖乖合照張相。這個習慣也曾被英國BBC所報導,當時還有人戲稱,我們真正的護國神山祕密,被別人給揭穿了。前不久我們公司在中國工廠的機台一直有狀況,我就請要去中國維修的工程師隨身帶幾包綠色乖乖,大概效果不錯,中國的工廠隨後通知我們,要寄一大箱的綠色乖乖給他們。這類避邪趨吉的做法,如果善用的話,倒也可以振奮人心激勵士氣。美國在獨立戰爭中,有段時間陷入與英軍的苦戰。但當戰事延伸到紐澤西州時,華盛頓(George Washington)將軍率軍在惡劣的天候下勇渡德拉瓦河,突襲英軍逆轉戰事,被視為是美國獨立扭轉乾坤的一役。但是在行前卻人心惶惶,華盛頓將軍於是召集相關的軍官及士兵,從口袋掏出一枚硬幣,說擲幣的結果如果是人頭面朝上,代表得到上天的祝福,會打勝仗。果然擲幣結果是人頭面朝上,且一連幾次都如此,軍心因而大振,最後取得關鍵勝利。事後華盛頓將軍拿出那枚硬幣,結果硬幣的兩面都是人頭。在軍中不僅有很多迷信甚至是禁忌,個人服役時是海軍的雷達部隊。海軍最忌諱的是餐桌上吃魚不能翻身,因為這意謂著會翻船。有回我不小心將魚給翻了身,身旁的軍官看我一臉驚嚇樣,連忙說我們是陸上部隊,不信這一套。至今我還感謝這位幫我解圍的軍官。 
羅夏克測試與大型語言模型
我一直嘗試將不同的工具和大型語言模型(LLM)結合,這是將傳統軟體工具進行數位轉型最快的方式。例如曾將魚骨圖管理加上ChatGPT,效果甚佳。接下來我想嘗試將LLM和羅夏克墨漬圖結合,進行心理投射測試時。然而,我嘗試將ChatGPT和羅夏克墨漬圖」(Rorschach Inkblot Test)結合,進行心理投射測試時,ChatGPT的表現就有點荒腔走板,言不由衷。羅夏克測試使用10個墨漬圖案,每個墨漬圖案幾乎具有完美的對稱性。其中5個墨漬是黑墨,2個是黑墨和紅墨,另外3個是彩色的。這些墨漬圖並非隨機或偶然的設計,羅夏克(Hermann Rorschach, 1884~1922)精心設計每一個墨漬圖,使其儘可能具有模棱兩可和「矛盾」的特點。羅夏克將墨漬圖開發為診斷精神分裂症的工具。後繼者則擴大使用於一般的個性測試。無論是在心理學還是文化上,這個測試本身有著驚人的生命力。羅夏克測試不僅僅關於你看到什麼,更重要的是你如何看待它。大多數的墨水渲染看起來像無意義的形狀,但羅夏克墨漬圖確實可以看出不同的東西,給個人的創造力留下空間,但這些墨水渲染也有一種真實的結構,可以客觀地檢查你所看到的東西是否符合標準或超出範疇。羅夏克是一位瑞士精神科醫生,曾師從榮格(Carl Gustav Jung)。相較於羅夏克,弗洛伊德是一位文字型的人,他的心理學完全關乎言語療法,因此早期如ChatGPT的LLM較容易插入(plug in)弗洛伊德的測試。羅夏克認為,看見比說話更深刻,我們如何看待事物更能展示出我們是誰。最近,多模式學習模型(Multimodal LLM)就更能適應羅夏克的測試。羅夏克在發明測試後不久就去世了,此測試在他無法控制的情況下朝著各種不同的方向發展。在美國,神祕的內在風格、個人魅力,是什麼讓你在人群中脫穎而出等特性,皆以不同羅夏克測試的變形版進行測驗。第二次世界大戰爆發,羅夏克測試被大量運用於臨床心理學領域。它被用於紐倫堡的納粹審判,也被用於越戰期間叢林中的農民。專家對於不同被測者的反應會有奇妙的解讀。例如,您如果在10張卡片中有4個以上的性(Sexual)回應,可能暗示存在精神分裂症;如果被測試者的性回應過少,可能暗示性挫折。羅夏克在墨點卡片濕潤的狀態下將它們沿中心軸對摺,使它們都具有對稱性,被測者很容易將它們旋轉90度,解讀它們像是水中的倒影。若被測者是罪犯,則鏡像回應被用來區分精神病患者和非精神病患者。對圖形細節的關注可以解釋為衝動或警覺性,亦即能夠看到他人忽視的事物。然而,如果過於關注細節,則可能表示對平凡事物的著迷,僵化的強迫性思維,有時還可能涉及偏執狂。之後有大量論文發表對各種對象的測試,有些光怪陸離,有些還頗為搞笑。羅夏克測試引發許多爭議,一些嚴謹的學者開始展開研究。一項於2013年進行的重要研究,回顧所有與該測試所聲稱測量的方面相關的研究,剔除不夠嚴謹的部分後,證實當前的羅夏克測試的可行性。這些墨水測試具有客觀的視覺特性,測試本身有著具體的歷史和用途,只要按照特定的方式運作,其結果就有意義。羅夏克測試顯然不是容易駕馭的工具,若能巧妙地以微調模型或檢索增強生成(RAG)融入LLM,其威力必然大增。
核融合電能何時能商業運轉? (二) —產業的進程
核融合反應爐的研發起始於50年代。相較於英國在1956年已經開始商業運轉的核分裂反應爐是晚了不少。  早期核融合反應爐的最大問題在於電漿的約束:哪種機制可以約束住溫度高到幾乎可以融毀一切物質的電漿? 延伸報導名人講堂:核融合電能何時能商業運轉? (一)—核融合反應爐的工程挑戰當時的核融合是當成基礎科學議題來研究的。核融合反應爐何時可以商業運轉發電?這個問題在上世紀的標準回答都是30年後—意思是還早著呢,一次一次接著跳票。  最近的氛圍已有顯著變化,近年來市場資金總計投入近50億美金用於核融合反應爐的研發,目前以此為主題的新創已接近40餘家。  近年來最令人振奮的消息之一,是2022年12月5日美國勞倫斯利佛摩國家實驗室(Lawrence Livermore National Lab;LLNA)與國家點火設施(National Ignition Facility;NIF)合作的核融合反應有淨能量收益(net energy gain)。  此次實驗採用的約束機制為ICF,共192管紅寶石雷射以圓對稱射向置於圓心的原料顆粒(pellet)均勻加溫。投入的雷射能量為2.05百萬焦耳(MegaJoules;MJ),產出的核融合能量為3.15MJ,能量增益係數Q=3.15/2.05>1.5,核融合反應本身的確能釋放出能量!這是個里程碑式的實驗。  負責任的媒體還會加注其實那2.05MJ是由300MJ的電能產生的,遑論若依傳統能量轉換途徑,核融合能得先轉換成熱能、熱能再轉換成電能,轉換成電能的效率還得打一個大折扣。若真能成為發電設施,不只是反應爐,整個系統要有淨能量增益。這樣算來,粗估的核融合反應爐的淨能量增益至少要Q>10才能涵蓋系統中其他的能量消耗。商用系統還有一段路要走。 無論如何,原來是基礎科研的問題轉變成工程問題。工程問題可以分而治之(divide and conquer),研發速度因而加快。譬如LLNL與NIF的計畫中的紅寶石雷射若換成二極體雷射,能源輸出效率可以提升30倍,這樣就是穩穩向前邁一步。  另一個促使進展加快的因素是新創的投入。這些新創與公共機構形成夥伴關係(public-private partnership),專注於一些特殊核融合反應爐發電的機構、機制或原料等技術,可以基於公共機構較周延的基礎科研結果,快速進入商業運轉階段。  當商業資金開始投入一個新技術時,由獲利動機驅動的研發顯示加速進展的可能。最近一個例子是量子電腦的發展。  IBM在發展出第一代、第二代量子電腦時,預計的量子算力是以每年倍增的指數成長,這已是比摩爾定律—每18個月倍增—更積極的技術路標。發展迄今其實現狀比這技術路標快多了!  另外一個看起來比較不顯著,實質上很重要者,是機器學習已經投入核融核反應爐的研發,最主要的兩個領域是在材料開發和反應爐結構,以及核融合反應參數的優化。  所以,核融合反應爐何時可以開始商業化?最樂觀的是2030年初期,這個日期出現在一些新創公司網頁和新聞。保守些的呢,有生之年。但是這不是以前談的30年後,因為持這樣主張的人也同時談2050年的碳淨零排放,核融合反應爐發電不再是遙遙無期的。 (作者為DIGITIMES顧問) 
香儂的智慧
香儂(Claude Shannon, 1916~2001)被譽為資訊理論之父。圖靈(Alan Turing, 1912~1954)則被稱為計算機科學之父。1943年,香儂和圖靈相遇於紐約市的貝爾實驗室。儘管他們的研究題目不同,他們討論彼此的工作,其中包括有關圖靈的「通用機器」。圖靈相當驚訝,香儂在一片程式碼和計算機的海洋中,將藝術和文化視為數字革命不可或缺的部分,將之稱為「數字DNA」。香儂在1943年告知圖靈夢幻般的想法,如今已經成為現實,因為所有媒體都以數位化呈現,涵蓋數百萬的「文化事物」和龐大的音樂收藏。香儂在藝術、訊息和計算之間建立的早期聯繫,直觀地描繪我們今天正在經歷的未來。圖靈在1950年發表論文〈計算機與智慧〉(Computing machine and Intelligence),首次談到人工智慧(AI),並提出「圖靈測試」,為資訊研究領域創建智慧設計的標竿。圖靈測試說,如果一台計算機能夠欺騙人類相信它是人類,那麼它就應該被稱為智慧計算機。香儂則直接訂出機器學習的目標: 「創造出擊敗世界冠軍的象棋程式;撰寫出能夠被知名文學期刊選用的優美詩歌;編寫能夠證明或反駁黎曼猜想(Riemann hypothesis)的數學程式;設計一款收益超過50%的股票選擇軟體。」今日,香儂的第一個目標已在2017年由AlphaGo達成。機器學習常見的做法,是將隨機事件相關聯的預期資訊量(expected amount of information)加以量化,並衡量概率分布之間的相似度。今日則被用作衡量概率分布訊息內容的指標,則是香儂提出的資訊熵(Shannon entropy)。香儂熵背後的基本概念是所謂事件的自資訊(self-information),有時也稱為驚奇性(surprisal)。自資訊的直覺是這樣的。當觀察到一個不太可能發生的隨機事件時,我們將其與大量訊息相關聯(這代表當不太可能發生的事件發生時,我們獲得極大的資訊量)。相反,當觀察到一個很有可能的結果時,我們將其與較小的資訊量相關聯。將自資訊視為「事件發生會造成我們多大的驚奇」非常有幫助。例如,考慮一個始終會落在正面的硬幣。任何硬幣投擲的結果都是完全可預測的,我們永遠不會對結果感到驚訝,這意味著我們從這樣的實驗中獲得的資訊為零。換句話說,其自資訊為零。如果硬幣的落地面的隨機性增加,則每次投擲硬幣時都會有一些驚奇,儘管超過50%的時間我們仍然會看到正面。因此,自資訊大於零。最大的驚奇量是在硬幣是公平不偏的情況下獲得的,即落在正面或反面的機會都是50%,因為這是硬幣投擲結果最不可預測的情況。基於上述非正式的需求,我們可以找到一個合適的函數來描述自資訊。對於一個具有可能值 x1, . . . , xn 和概率質量函數 P(X) 的離散隨機變量 X,任何介於0和1之間的正單調遞減函數都可以用作衡量資訊的指標。還有一個額外且重要的性質,那就是獨立事件的可加性;兩次相繼的硬幣投擲的自資訊應該是單次硬幣投擲的兩倍。對於獨立變量來說,這是有意義的,因為在這種情況下,驚奇或不可預測性的數量變為兩倍。藉由上述特性,香儂熵被應用於測量與一組概率相關的不確定性或資訊內容。香儂熵通常用於決策樹(decision tree)和其他AI模型,以量化數據集的不純度或混亂度。例如在決策樹算法中,香儂熵用作在每個節點上對數據進行分割的依據。目標是最小化熵,熵較低的節點被認為更「純粹」或更具資訊。為每種可能的分割計算熵,選擇導致熵最大程度減小的分割。這個過程在決策樹不斷增長的情況下進行遞歸性地重複,得到我們想要的答案。香儂在1948年提出資訊熵的概念,影響到80年後的今日機器學習的發展,真奇人也。 
核融合電能何時能商業運轉? (一)—核融合反應爐的工程挑戰
 原子是以原子核中的帶正電質子的數目來決定原子序的。原子核中除了質子外,還有數量大致相仿的中子,這些質子與中子以強作用力(strong interaction)束縛在一起,這就是核結合能(nuclear binding energy)。  核結合能的物理基礎強作用力,在短距離內比化學作用的物理基礎電磁作用強100倍,因此核反應的能量遠大於化學作用的能量。  鐵(原子序26)的同位素群與鎳(原子序28)是元素中平均核結合能最高的,也就是最穩定的元素。以鐵同位素群為例,核結合能可以高達8.8百萬電子伏特(MeV)。物理驅使物質轉變成較穩定的結構,所以原子序比鐵高的原子就會透過核分裂(nuclear fission)轉變成較小的原子;而分子序較小的原子則傾向透過核融合(nuclear fusion)轉變成原子序較高的原子。前者已應用於現今的核能發電,而後者就是目前全世界研發開始升溫的核融合發電。  核融合為什麼比核分裂更具吸引力呢?第一個原因是核融合的過程及其廢料有較低的幅射性。第二個原因是如果核融合反應爐無法正常運作,它不會如核分裂反應爐因連鎖反應(chain reaction),導致核反應爐融毀(nuclear reactor meltdown)而近乎無法收拾。核融合反應爐無法正常運作時,核融合反應停了就停了。另外還有個原因是核融合反應的原料,近乎取之不竭、用之不盡。  最常使用的核融合反應的原料是氘(Deuterium)和氚(Tritium),二者都是氫的同位素,也就是說和氫原子一樣,每個原子核都含有一個質子,但是氘和氚的原子核還分別具有1個和2個中子。使用氘和氚當成核融合反應原料的原因是它的散射截面(scattering cross section)—也就是核融合反應發生的機率最大,所釋出的能量最多,高達17.6MeV。  氘在自然中穩定存在,可以從海水中提取。但是氚具有放射性,而且半衰期很短,只有12.3年,自然界中只存有30~40kg,所以核融合反應爐必須在反應的過程中自己產生足夠的氚,以維持連續的核融合反應。這是核融合反應爐設計時必須考慮的因素之一。  核融合反應時需要較高的溫度,氘和氚在此環境下以離子的形態存在,也就是氘和氚中的原子核和電子是分離的,這就是電漿態(plasma)。氘離子和氚離子都帶有一個正電荷,它們之間存有庫侖排斥力。這就解釋為什麼氘和氚被選為核融合反應原料的原因:其排斥力最小,但是原子核較大,較容易碰撞,而且碰撞機率高。  要克服電磁互斥力讓氘離子和氚離子進行核融合反應必須符合一定的條件。基本上要離子的密度、溫度和其能量約束時間(energy confinement time)的乘積大於一定數值,這是核融合反應爐能維持穩定運作的條件,術語叫「點火」(ignition)。  能持續維持核融合反應的溫度大概在10~20keV之間,約等於8,000萬度到1.6億度之間,這比太陽核心的溫度還高。要維持這樣高的溫度,以及高的離子密度,必須把離子束縛在一個有限的空間中,這就是核融合最核心的工程問題之一:約束(confinement)。約束的方法比較多的是用磁場(Magnetic Confinement Fusion;MCF)來約束離子的行徑;另一個是靠慣性(Inertial Confinement Fusion;ICF),利用震波(shock wave)來壓縮及點燃離子;還有二者的混合形態MTF(Magnetized Target Fusion)。為了提高磁場,高溫超導(High Temperature Superconducting;HTS)膠帶被用於磁約束核融合反應爐上。 由於離子的集體形態電漿比較接近液體,而處於特殊狀況的液體會產生較為激烈的行徑,譬如擾流(turbulence)。離子的穩定性一直是核融合反應爐的一個工程挑戰。  氘離子和氚離子反應後產生氦離子(即是阿爾法粒子)和中子,其中氦離子擕帶核融合約5分之1能量,之後轉移能量讓原料能維持在高溫、可以持續核融合反應。但是氦離子得想法排掉,避免影響後續核融合反應的發生。  中子以動能的形式攜帶約5分之4的核融合能量,這是核融合反應爐產生能源的主要形態。中子不帶電,不受磁場束縛,會四向逃逸。想利用它的動能轉化成一般渦輪機可以使用的能量,得用防護牆先攔著,將其轉化成熱能。  另外由於前述的原因,氚必須在核融合反應爐中自己產生,防護牆上得覆蓋含鋰元素的繁殖氈(breeding blanket)。當中子撞擊到鋰時,會產生氚。中子在整個核融合過程中可能會消耗、流失掉一部分,繁殖氈上還必須加入鈹或鉛元素。當中子撞擊到這些元素之後,會產生2個中子,這樣中子的數目就得以增加,讓核融合反應爐中的氚得以持續補充,維持反應爐的持續運作。  這大概就是主流的氘-氚磁約束核融合反應爐所需面臨的主要工程挑戰。  
半導體的經濟學思維
最近讀了幾本關於經濟學的書籍,對於經濟學家利用邏輯分析、數學模型或田野調查等方法來解釋或預測人類或社會的經濟行為,如成長、衰退、貧富等,留下深刻的印象。不免起心動念東施效顰,想要對自己所理解的半導體產業及人才做一番解析。眾所周知,半導體產業鏈可略分為上中下游,在此上游定義為晶圓製造,中游為IC設計,下游則為系統應用。愈往上游走,知識所需的層面就愈基礎且深入,也愈硬體導向;往下游走所需的知識就愈廣泛,愈偏應用及軟體。半導體人才的培養彷彿也有上中下游的概念。以前在學生時代,聽過老師們提起如何培養一位最適切的半導體人才,就是在大學時念物理,碩士時讀材料,最後再攻讀電機博士。由理科到工科,也由基礎到應用。先來談人才的養成。有不少半導體領域的專家,都是在大學時念物理,之後在博士時轉念電機,而卓然有成。前國立陽明交大校長張懋中院士便是此思維下的翹楚,經由物理及材料的訓練,最後拿到電機博士,並成為半導體界國際知名學者。順流而下似乎是水到渠成,但是逆流而上呢?大學時念電機,而博士研究轉攻物理,甚至是理論物理,沒有太多成功的案例。約莫二十年前,台大物理系的招生廣告中,曾高調地宣傳,當時在台積電任職副總以上人士,畢業最多的學校是來自於台大物理系。最近材料專家彭宗平教授,也在媒體表達了,在園區半導體業很多的主管是材料系畢業的。這些都說明了,順流而下是趨勢,也是個好的選擇。產業界又如何呢?先經過了晶圓廠或IDM廠的歷練,轉而從事IC設計,而成就一番事業者大有其人。之前在IC設計領域紅極一時的晨星半導體,其創業團隊就是來自於世大積體電路,從事晶圓代工。但是在IC設計表現優異的公司,轉而往上游晶圓製造發展,鍛羽而歸者卻時有所聞。十幾年前矽統科技自建晶圓廠,就是個失敗的例子;最近又有專攻功率IC設計的公司,在蓋自己的晶圓廠。畢竟IC設計所需的半導體製程技術種類繁多,不是一座晶圓廠就能夠涵蓋的;此外兩者的文化差異頗大,晶圓廠需要嚴謹的態度及做事方法,要經營的好需要有高的產能利用率,在在都與IC設計的思維不相符。但是中游的IC設計與下游的系統應用間的隔閡,卻不是這麼顯著,兩者之間存在著既合作又競爭的態勢。IC設計公司已不再是單純地提供晶片,而是要提供一個解決方案。蘋果(Apple)就是鮮明的例子,不論是電腦所使用的CPU,或是智慧型手機內的AP處理器IC,都是自己所設計。近來雲端服務業者,也開始自行設計AI的晶片。只要是量夠大掌握出海口,且能找到合適的團隊,系統應用業者是可以往中游的IC設計去發展。但是也有失敗的例子,如不久前Oppo便結束旗下的IC設計公司。華為這幾年受到美國的制裁影響不小,創辦人任正非曾公開表示,未來就是要用錢來砸數學家或物理學家,回過頭來把自家屬於上游的根基做好做穩。我在美國留學期間,參加過一場光電領域的研討會,會議最後的問答時間,來自加州理工學院(Cal Tech)的光電大師Amnon Yariv教授,就在黑板上寫了馬克斯威爾(Maxwell)的4個方程式,然後說所有的解答都在裡面。事實上,在電機半導體領域最常使用的歐姆定律,就只佔這4個方程式的一小篇幅。Open AI 創辦人Sam Altman最近宣稱,要花費巨資自建多座先進的晶圓廠,生產AI晶片。換言之就是由下游,直接挑戰上游。經濟學有趣的地方在於,永遠都會有另外一隻手(on the other hand)。有原則就會有例外,這是在處理經濟問題,經常會發生的。Altman是否會成功,且拭目以待。 
美輸中縮水版AI晶片沒人要,誰是最大獲益者?
近期DIGITIMES有幾則報導與評論,談及NVIDIA推出特供中國的2度降規AI晶片H20,但中國客戶意願缺缺一事。值得探討的是,商業潛力龐大的中國內需市場缺口,究竟會由哪家半導體業者得利呢?2023年10月,美國商務部BIS更新先進計算晶片和半導體製造設備出口管制規則,規範總算力及效能密度(總算力/晶粒面積)上限,受限制晶片包括NVIDIA的A100/A800/H100/H800/L40S系列、超微(AMD)的MI250/MI300系列,以及英特爾(Intel)的Gaudi2系列,之所以中國客戶對採購H20意興闌珊,是因為大語言/多模態基礎模型,已然成為兆級參數的軍備競賽,以H20組建的AI算力叢集,難以支持這般規模的訓練任務。中系業者的因應之道有四,一是透過各種管道購買更多的A100等受限晶片/模組/板卡;二是透過各種管道購買更多的受限繪圖晶片/板卡;三是自研AI晶片;四是購買中國國內業者的AI晶片。解法一是建制算力最理想的解方,解法二是沒魚蝦也好的應對作法,但從日前圖森未來被疑偷運NVIDIA A100晶片給中國遭美方阻止並調查,以及阿布達比人工智慧/雲端服務集團G42出脫所投資中國公司股份及切斷中國供應鏈這兩事例看來,美國的圍堵力道只會愈來愈緊。解法一與解法二或早或晚會遭斷糧,並非長遠之計。解法三為雲端業者自研晶片,中國AI公有雲有阿里雲、百度智能雲、騰訊雲與華為雲等四大巨頭,真正僅供自家雲端服務使用而未對外商業販售者,僅有騰訊採12奈米製程的紫霄,但其與阿里平頭哥的含光800均為AI推論晶片,非供AI訓練使用。歸納解法一、二、三後可發現,針對雲端/互連網業者及伺服器業者需求的商業AI訓練晶片,才是中國AI算力產業鏈的發展關鍵,參與者包括雲端業者旗下的華為海思、百度崑崙芯及騰訊持股21.37%的燧原科技,以及海光、寒武紀、沐曦、天數智芯、璧仞、摩爾線程、登臨等業者。會脫穎而出接收這龐大市場缺口的業者,我認為有2個條件:一是在晶片層次,取得中國擁有先進技術的晶圓代工廠、封測廠與記憶體廠的策略性支持;二是在硬體/軟體/應用層次能建立完整的供應鏈/生態系。對獨立的晶片業者來說,即便取巧推動「類CUDA平台」模式,我認為仍具有高度挑戰性,而在大集團旗下,擁有雲端/互連網龍頭業者在後強力支持的業者會更有機會,這其中我最看好華為。華為與中芯的先進晶片合作,已然成為中國突破美國封鎖的關鍵所繫,海思昇騰910b採中芯7奈米N+2製程,下一代昇騰920則可望推進至5奈米,成為中國內部與NVIDIA H100算力落差最小的晶片。若從生態系角度來看,華為自己在伺服器主機板上除了AI晶片外,也包括鯤鵬CPU、基板管理控制器(BMC)晶片、網通晶片、與SSD控制晶片等。在其上有對標NVIDIA CUDA+cuDNN的CANN(Compute Architecture for Neural Networks)混合式運算架構,支持主流的PyTorch及TensorFlow及華為自己的昇思MindSpore等多個AI架構,更上層也有完整的算法開發與應用開發的軟體堆疊。華為伺服器硬體合作夥伴包括華鯤振宇、神州數碼、清華同方、寶德計算機等業者,以及多家應用軟體與SI業者。觀察其客戶名單,已拿下包括百度、科大訊飛及360等指標性雲端/互連網/AI公司及三大電信業者。此外,中國各地都在積極建立AI計算中心,多數的標案均由華為昇騰方案得標,其中包括北京、天津、廣州、杭州、重慶、成都等重點城市等。在外有美國管制難出海,內逢經濟疲軟影響籌資的大環境下,再加上建立軟硬體生態系的高門檻讓業績拓展無法一蹴可幾,中國新創AI晶片業者普遍面臨營運上的挑戰,2023年陸續傳來寒武紀與摩爾線程裁員、壁仞科技2位創辦人離職的消息。相較之下,作為中國事業範疇最廣、掌握雲端服務/電信網路到終端裝置、軟硬體垂直整合程度最高、公司也最賺錢的華為,看來是最有底氣接收美國管制下所讓出中國算力市場缺口的業者。若中國政府想要與NVIDIA CUDA脫勾,建立起全然自主可控的算力生態系,除華為外還有更好的選擇嗎?