英特爾Gaudi 2特供版現搶貨潮 中國業者傳「有多少拉多少」 智慧應用 影音
Vicor
DForum0620

英特爾Gaudi 2特供版現搶貨潮 中國業者傳「有多少拉多少」

  • 陳玉娟聖荷西

英特爾為中國市場定製了一張AI大型語言模型的「入場券」。英特爾
英特爾為中國市場定製了一張AI大型語言模型的「入場券」。英特爾

NVIDIA的AI GPU系列需求噴發,卻因台積電CoWos先進封裝產能嚴重不足,致使伺服器供應鏈訂單不斷湧入,至今卻無法滿足客戶需求,遭美國封鎖高階AI晶片的中國,即使多家大廠傾全力加價下單 ,也搶不到足夠的NVIDIA GPU。

近期出乎預期的是,伺服器供應鏈透露,英特爾(Intel)執行長Pat Gelsinger於7月前往中國訪問期間,所推出的特供版AI處理器Habana Gaudi 2訂單快速飆升,以往NVIDIA有多少拉多少的榮景,正複製在英特爾身上。

2022年9月,美國禁止先進AI晶片出口至中國及俄羅斯,受影響的是NVIDIA H100及A100晶片,及超微(AMD)MI250,NVIDIA為滿足中國市場龐大需求,調整規格推出降規版的A800與H800晶片。

過去半年來,NVIDIA的AI GPU價量噴發,若非台積電CoWoS產能不足,NVIDIA與相關伺服器供應鏈成長爆發力將不僅於此。

值得注意的是,先前傳出要連A800、H800一起入列封鎖名單,更禁止NVIDIA的AI GPU系列銷往中東國家,以防遭轉銷中國。雖然至今未獲證實,但原本就拚命下單囤貨的中國業者急尋替代方案,至少在未來2年能儲備足夠AI晶片。

供應鏈業者表示,不只是Meta、微軟(Microsoft)、Google、AWS北美四大雲端服務供應商(CSP)相當期待超微MI300系列面市抗衡NVIDIA獨大地位,給予NVIDIA價格壓力,中國業者亦期望超微推出降規版晶片。

MI300採用3D小晶片(Chiplet)設計,採用台積電5奈米製程,結合CDNA 3架構GPU、6奈米IO晶片和HBM小晶片,整體性價比不輸NVIDIA,但在GPU串聯與生態系仍遠不及NVIDIA,最重要是盛傳2024年上半才會放量,因此現階段完全難以登板救援。

據供應鏈業者透露,由於NVIDIA未來出口中國全面遭禁的可能性不低,而超微MI300系列至未面市,也使得英特爾搶下好機會。 英特爾在中國市場推出的「特供版」Gaudi 2連月來訂單不斷急升。

Gaudi 2採用台積電7奈米製程,英特爾現已向台積電大追單,據了解,訂單能見度已至2024年中,下一代採用台積電5/4奈米製程Gaudi 3也加速2024年上市時程。以此估算,Gaudi 2等系列可望助力英特爾在AI戰局有所發揮,對於資料中心平台營收止跌功不可沒。

以往業界普遍認為,生成式AI和大型語言模型(LLM)僅能在NVIDIA GPU上執行,對此英特爾也釋出數據資料指出,英特爾的AI解決方案可為希望擺脫封閉生態系的客戶,提供極具競爭力的選項。

以Habana Gaudi 2為基礎的軟體和系統,其訓練成熟度在GPT-3上獲得大規模的證實,相較NVIDIA H100而言,也為客戶提供極具競爭力的伺服器和系統成本優勢。

英特爾15年前就投入AI研發,2019年砸20億美元收購以色列Habana Labs,Habana號稱Gaudi晶片處理能力是GPU數倍,再加上既有資料中心平台優勢,英特爾正全力加速追趕NVIDIA。

值得注意的是,NVIDIA、超微MI300,及英特爾Gaudi 2與下一代晶片,皆由台積電7/5奈米家族所代工,未來3/2奈米亦在洽淡中,三大廠亦與台伺服器供應鏈緊緊相依。

另外,英特爾的Gaudi 2/3延續過去Habana與世芯的合作,台積大聯盟也成為此波AI平台大戰受益者。


責任編輯:朱原弘