經典與量子的嫁接

林育中
2026-05-25
AI語音摘要
00:50

人工智慧的浪潮正在襲向社會的每一角落,重新塑造生活與工作的方式。先是從AI伺服器,接著就是現在快速興起的代理式AI(agentic AI),以及開始要進入部署階段的實體AI。 

這些都是以高效能計算(HPC)為核心的進展及延伸。目前HPC的主要象微就是AI伺服器,其中核心元件包括過去PC的核心CPU、專用於人工智慧張量(tensor)計算的GPU,以及高頻寬記憶體(HBM)。HPC的進展除了在晶片、先進封裝以及系統組裝的技術的持續推進外,另外最可能的進展就是將再幾年可能就要商業量產的通用容誤量子計算機(general fault-tolerant quantum computers)整合在HPC的體系之中,這就是混合量子經典計算(Hybrid Quantum-Classical Computing;HQCC)。

量子計算機依賴的是量子世界的疊加(superposition)和糾纒(entanglement)現象,而AI伺服器的原理盡在經典(classical)之中。理論上量子理論是較一般的理論,說量子理論涵蓋經典理論一點也不為過,但是實務上為了處理兩種物理極限的現象,計算機存在的物理架構迥然相異。

雖然NVIDIA在軟體層架構層面已經用CUDA-Q為軟體架構為之鋪路。CUDA-Q將量子處理器(Quantum Process Unit;QPU)當成某一種加速器(accelerator)來處理,並且相容各種類型的量子位元計算機,但是AI伺服器和量子計算機在硬體層面存在極具挑戰性的橋接問題。 

主要的問題大概落在兩種系統中間關於延遲(latency)、訊號類型和低溫限制(cryogenic constraints)這些範疇中二者之差異所衍生出的不同結構。

延遲是指AI伺服器從起始訊號至完成效果的時間。AI的核心晶片CPU及GPU的延遲雖是奈秒等級,但是整個系統的延遲是微秒(us)甚至是釐秒(ms)等級。 

AI伺服器要能與量子計算機協作,必須要與量子計算機的基本時間尺度相干時間(coherence)比較。相干時間是指2個量子位元之間的量子糾纒能維持的時間;量子計算基本上是靠量子位元之間的相互糾纏來完成平行計算的。加上如果AI伺服器的延遲時間比量子計算機相干時間長,則經典和量子計算無法形成有效的封閉循環、反覆運算,現在有些已經展示其效能的演算法如變分量子本徴值求解器(Variational Quantum Eigensolver;VQE)、量子近似優化演算法(Quantum Approximation Optimization Algorithm;QAOA)等就無法有效使用。

值得注意的是這個問題並非所有類型的量子位元都有,這個問題之所以被提出來是因為目前商業發展最迅速的超導量子位元有這個問題。

也許是恰巧、也許不是,NVIDIA選擇直接投資的PsiQuantum(光子量子位元;photonic qubits)、Quantinuum(離子陷阱;trapped ions)以及QuEra(中性原子;neutral atoms)量子位元的相干時間都遠高於AI伺服器的延遲時間。也就是說,採用適合的量子位元類型可以避免經典與量子計算橋接時的延遲問題。

AI伺服器與量子電腦訊號的性質與行為存在相當大的差異。針對這些訊號差異,二者的硬體都有因為優化訊號處理的結構特化。要能整合這兩種截然不同的需求於單一架構之下,這是另一個挑戰的來源。

AI伺服器的訊號是數位的,量子計算的訊息是量子位元。要將數位訊息以振幅(amplitude)或相位編碼在量子位元上,做為量子計算的起始輸入,要耗費很多量子閘(gate)的運算。

大部分量子位元的運算是靠微波來操控量子位元的旋轉,控制的訊息是類比(analog)訊息。AI伺服器與量子計算機之間的資料傳遞,另外還得有數位/類比之間頻繁相互轉換的額外負擔(overhead)。

二者的訊號性質和行徑差別也很巨大。AI伺服器,如同眾所周知,是高頻寬的張量(tensor)資料;QPU的資料速率低但重複率高(high repetition)。二者所需要的連線是高頻、決定性(deterministic)、小有效荷載控制訊號(small payload control signal)。但是AI伺服器的架構是為了非同步(asynchronous)、批量導向(batch-oriented)、優化資料輸送量(throughput)的目的而設計的,這就是連線設計挑戰的來源。

溫度是另外一個問題。在網路上尋找量子計算的圖片時,典型的照片是金碧輝煌類似吊燈的圖片,但那其實是稀釋冰機(dilution refrigerators)。有幾個類型的量子位元需要在10~20mK的極低溫下操作,這需要稀釋冰機來維持極低溫。另一方面,AI伺服器今日所面臨的最大挑戰之一是散熱,從晶片的運作、資料傳導等步驟所產生的高溫及熱耗散已需要液態冷卻的系統工程來處理。將二者整合於一個HQCC系統中,如何處理此二者系統高達7個數量級的溫度差距就是天大的挑戰。但是這問題也是依量子位元種類而異。

理論上,離子陷阱和光子量子位元都可以在室溫的環境下工作。

除了以上範疇的問題,還有電磁波干擾、實體層面整合等諸多問題。

如果放下各類量子位元目前發展成熟程度的考慮,整合成HQCC我首先選擇的量子計算機是使用光子量子位元的計算機。 

首先,延遲的問題對於光子是不存在的。光子量子位元有它自己的問題,譬如光子的非線性作用(nonlinear interaction)機率很小,不易發生作用;在波導(waveguide)中傳導可能會有光子損失(photon loss)的問題,但是光子的退相干(decoherence)基本上不算是問題。而且光子之間不會相互作用,光子量子位也不會有電磁波干擾的問題。

AI伺服器熱耗散的問題也不太影響光子量子計算機。光子量子計算機目前還用冰機的部分只有在超導奈米線單光子感測器(Superconducting Nanowire Single-Photon Detector;SNSPD),溫度在1~4K,目的在於提高光子感測成功的機率至95%。至於光子量子位元本身,置於室溫環境即可。

AI伺服器也可以透過邊緣AI與量子計算機橋接,減少延遲、熱耗散、資料互傳的問題。這個方法適用於所有種類的量子位元計算機。

光子量子計算機還有3個產業發展的理由成為HQCC喜愛的選擇。 

一個是光子的QPU製程與半導體相容,這使得一個新興技術的商業化量產技術門檻驟然降低。這也是為什麼光子量子電腦公司敢於一剛開始就將擴容(scaling)的目標設定於百萬量子位元。 

另一個是AI伺服器由於能耗、散射的諸種原因,正逐漸將系統朝全光學(all-optics)的方向推動。如此趨勢當然更有利於與光子量子計算計的互聯,一併整合入HQCC。

雖然目前各國目前都將量子計算列為國家戰略目標,投入大量資金。但是相較於目前的AI發展是舉全球資金市場的力度,對於量子計算的投資只能算是零頭。依AI伺服器較有利的方向去發展HQCC的量子計算部分,算是搭便車、乘勢而起。

現為DIGITIMES顧問,台灣量子電腦暨資訊科技協會常務監事。1988年獲物理學博士學位,任教於國立中央大學,後轉往科技產業發展。曾任茂德科技董事及副總、普天茂德科技總經理、康帝科技總經理等職位。曾於 Taiwan Semicon 任諮詢委員,主持黃光論壇。2001~2002年獲選為台灣半導體產業協會監事、監事長。
智慧應用 影音