美輸中縮水版AI晶片沒人要，誰是最大獲益者？

黃逸平
2024-02-21
分享
Line

NVIDIA GPU出口中國遭到限制，反倒讓中國的替代產品商機成為令外界注目的焦點。

近期DIGITIMES有幾則報導與評論，談及NVIDIA推出特供中國的2度降規AI晶片H20，但中國客戶意願缺缺一事。值得探討的是，商業潛力龐大的中國內需市場缺口，究竟會由哪家半導體業者得利呢？

2023年10月，美國商務部BIS更新先進計算晶片和半導體製造設備出口管制規則，規範總算力及效能密度（總算力／晶粒面積）上限，受限制晶片包括NVIDIA的A100/A800/H100/H800/L40S系列、超微（AMD）的MI250/MI300系列，以及英特爾（Intel）的Gaudi2系列，之所以中國客戶對採購H20意興闌珊，是因為大語言／多模態基礎模型，已然成為兆級參數的軍備競賽，以H20組建的AI算力叢集，難以支持這般規模的訓練任務。

中系業者的因應之道有四，一是透過各種管道購買更多的A100等受限晶片／模組／板卡；二是透過各種管道購買更多的受限繪圖晶片／板卡；三是自研AI晶片；四是購買中國國內業者的AI晶片。

解法一是建制算力最理想的解方，解法二是沒魚蝦也好的應對作法，但從日前圖森未來被疑偷運NVIDIA A100晶片給中國遭美方阻止並調查，以及阿布達比人工智慧／雲端服務集團G42出脫所投資中國公司股份及切斷中國供應鏈這兩事例看來，美國的圍堵力道只會愈來愈緊。解法一與解法二或早或晚會遭斷糧，並非長遠之計。

解法三為雲端業者自研晶片，中國AI公有雲有阿里雲、百度智能雲、騰訊雲與華為雲等四大巨頭，真正僅供自家雲端服務使用而未對外商業販售者，僅有騰訊採12奈米製程的紫霄，但其與阿里平頭哥的含光800均為AI推論晶片，非供AI訓練使用。

歸納解法一、二、三後可發現，針對雲端／互連網業者及伺服器業者需求的商業AI訓練晶片，才是中國AI算力產業鏈的發展關鍵，參與者包括雲端業者旗下的華為海思、百度崑崙芯及騰訊持股21.37%的燧原科技，以及海光、寒武紀、沐曦、天數智芯、璧仞、摩爾線程、登臨等業者。

會脫穎而出接收這龐大市場缺口的業者，我認為有2個條件：一是在晶片層次，取得中國擁有先進技術的晶圓代工廠、封測廠與記憶體廠的策略性支持；二是在硬體／軟體／應用層次能建立完整的供應鏈／生態系。對獨立的晶片業者來說，即便取巧推動「類CUDA平台」模式，我認為仍具有高度挑戰性，而在大集團旗下，擁有雲端／互連網龍頭業者在後強力支持的業者會更有機會，這其中我最看好華為。

華為與中芯的先進晶片合作，已然成為中國突破美國封鎖的關鍵所繫，海思昇騰910b採中芯7奈米N+2製程，下一代昇騰920則可望推進至5奈米，成為中國內部與NVIDIA H100算力落差最小的晶片。

若從生態系角度來看，華為自己在伺服器主機板上除了AI晶片外，也包括鯤鵬CPU、基板管理控制器（BMC）晶片、網通晶片、與SSD控制晶片等。在其上有對標NVIDIA CUDA+cuDNN的CANN（Compute Architecture for Neural Networks）混合式運算架構，支持主流的PyTorch及TensorFlow及華為自己的昇思MindSpore等多個AI架構，更上層也有完整的算法開發與應用開發的軟體堆疊。

華為伺服器硬體合作夥伴包括華鯤振宇、神州數碼、清華同方、寶德計算機等業者，以及多家應用軟體與SI業者。觀察其客戶名單，已拿下包括百度、科大訊飛及360等指標性雲端／互連網／AI公司及三大電信業者。此外，中國各地都在積極建立AI計算中心，多數的標案均由華為昇騰方案得標，其中包括北京、天津、廣州、杭州、重慶、成都等重點城市等。

在外有美國管制難出海，內逢經濟疲軟影響籌資的大環境下，再加上建立軟硬體生態系的高門檻讓業績拓展無法一蹴可幾，中國新創AI晶片業者普遍面臨營運上的挑戰，2023年陸續傳來寒武紀與摩爾線程裁員、壁仞科技2位創辦人離職的消息。

相較之下，作為中國事業範疇最廣、掌握雲端服務／電信網路到終端裝置、軟硬體垂直整合程度最高、公司也最賺錢的華為，看來是最有底氣接收美國管制下所讓出中國算力市場缺口的業者。若中國政府想要與NVIDIA CUDA脫勾，建立起全然自主可控的算力生態系，除華為外還有更好的選擇嗎？