解析NVIDIA GTC 2026潛在謀略 黃仁勳如何封鎖ASIC對手?
NVIDIA GTC自2023年以來,已升級為制定AI時代「技術標準與產業規則」的核心場域。AI革命全面爆發後,現今已從單純硬體算力競賽,演變為「誰能定義代理式AI(Agentic AI)」的底層規則。
GTC 2026上,各方認為最具謀略的布局,莫過於NVIDIA宣布以200億美元達成與AI晶片新創Groq的深度交易。透過授權Groq的LPU技術、聘用其核心團隊成員,讓NVIDIA在不觸發反壟斷審查的前提下,將其推理能力整合進Vera Rubin伺服器堆疊,此舉也被認為是現階段阻斷Google等特用晶片(ASIC)對手進逼的絕佳妙計。
黃仁勳的主題演講與公開受訪時,顯見四大主軸:
其一:實體AI(Physical AI),算力延伸至實體場景如人形機器人,實體設備將爆發性增加對算力的剛性需求。
其二:AI工廠(AI Factory)不斷強調,其將資料中心定位為生產Token的運算單位,讓投資報酬率(ROI)可量化。
其三:代理式AI(Agentic AI),讓AI轉化為自主決策的數位員工,帶動更複雜的推論需求。
其四:推論(Inference),產業重心由「訓練」正式轉向「規模化部署」,象徵AI進入實際應用階段。
部分供應鏈人士認為,在NVIDIA、台積帶領下,迎來新成長動能與轉型機會,但複雜的上下游產業鏈之間,也顯見微妙的求生掙扎。
有伺服器代工大廠就表示,這是一場「現金與意志」的存亡賽,一個Vera Rubin機櫃從300萬至700萬美元起跳:
現在大家在比誰的現金多,因為若沒跟上這波科技覺醒,公司可能像當年網路泡沫中的 Yahoo!一樣消失。這就是戰爭,贏者全拿。
伺服器業者亦指出,假設以前一櫃20萬美元,我們能賺10%,也就是2萬美元;現在一櫃300萬美元,客人怎麼可能還給你10%?那可是30萬美元利潤!
簡單說,就是單價飆升,也導致代工廠毛利率被極度稀釋,且客戶對產能的要求相當緊迫盯人,「現在是誰能交貨誰就贏」。
廣達、鴻海都在搶訂單,但最後還是看誰的製造自動化能支撐短時間內爆量的產能衝刺。
另有供應鏈業者提及,此次NVIDIA力拱Vera CPU,說明其重要性,讓英特爾(Intel)、超微(AMD)賺到CPU紅利,但長線仍堪憂。
目前英特爾高階多核心CPU仍是缺貨漲價,而超微買下ZT Systems後,收購效益仍不明,欲挑戰NVIDIA的AI霸主地位,難度又再拉升。
供應鏈業者表示,NVIDIA在硬體端,揭示了Vera Rubin平台,包含Vera CPU、Rubin GPU,以及深度整合Groq LPU授權技術的「三位一體」系統。
LPU優勢在於針對AI推論進行極致優化,強調低延遲與高能效,整體而言,LPU代表AI運算由高吞吐導向轉向即時回應,成為NVIDIA在推論時代的重要補強架構。
進一步來看,黃仁勳透過策略性授權與人才聘用,成功將Groq的技術融入產品線,避開了反壟斷風險,現階段截斷Google TPU、Amazon Trainium欲藉由推理效率進行反擊的可能性。
軟體應用方面,NVIDIA發布適用於OpenClaw代理平台的NemoClaw堆疊。
透過單一指令,用戶即可安裝Nemotron模型與最新發表的NVIDIA OpenShell執行環境,並加入隱私與安全控制機制,使這些具備自我演進能力的自主AI代理,提高NemoClaw執行信賴度、更具可擴展性,也更易於被全球使用者採用,尤其是注重安全的企業用戶。
黃仁勳指出,Mac與Windows是PC的作業系統,而OpenClaw則是個人AI的作業系統,這正是整個業界期待已久的時刻,也是軟體新文藝復興的起點。而NemoClaw可與任何程式設計代理搭配使用。
只不過,AI伺服器技術應用快速推進,也讓供應鏈面臨極大挑戰,包括高壓供電與良率極限。伺服器業者表示,單顆AI晶片功耗現突破2,300瓦,整機架構已完全發生變革,如供電已是「800V轉換為48V輸入」高壓直流,對電源管理模組的功率密度要求極高。
散熱技術也強制轉型,Rubin世代全液冷是標配,任何接頭滲漏都可能讓高達300萬美元的設備報廢。NVIDIA力推的全液冷與高壓供電架構,合作夥伴必須進行巨大的研發投入,而當廣達、鴻海等將資源全部投入時,ASIC對手群能分到的資源與試錯機會就會被壓縮。
責任編輯:何致中










