D talk
order

晶片速度是唯一競爭優勢?

  • 徐宏民

在雲平台的重要應用中,GPU逐漸扮演重要角色。法新社

原本每年3月在矽谷召開的GTC–NVIDIA GPU技術大會,今年因疫情關係,轉為線上會議。最能揭示NVIDIA未來技術走向以及眾人期待的執行長黃仁勳主題演說,也在矽谷居家防疫下,改到5月中以他家的廚房為主舞台展開。從2016年開始參加GTC會議,當大家這幾天討論嶄新的Ampere技術讓A100 GPU速度提升多少時,反而嗅到在這酷炫技術展示之外的商業企圖心。

從幾年前強調深度學習技術的突破,今年展現貼近商業情境的技術手法。全自駕的時程未知,除了持續精進自駕開發平台外,也將晶片拆分為目前市場必備的先進駕駛輔助系統(ADAS),商業應用的無人計程車(Robotaxi),以及自動駕駛。另一有趣的應用是利用深度學習來突破電腦動畫的瓶頸,光線追蹤(Ray Tracing)技術,讓精細的高解析度畫面可以即時運算。原理是讓耗時的Ray Tracing只在較小畫面上計算,接著使用技術成熟的深度畫面超解析技術放大畫面。這樣的混合作法也可以提供急著提升畫面品質的內容以及顯示晶片業者參考。

迎接5G時代提出智慧閘道伺服器EGX,讓大量的物聯網(IoT)設備可以在地域內的節點運算。工廠、智慧城市、大賣場中的大量感測器不間斷的送出訊號,所要求的智慧服務(安全、監控等)會有即時性的要求,而且資料龐大,必須在地即時處理。走出資料中心,與5G基地台的連結,甚至與電信公司合作加速5G核心通訊,尋找即將翻轉通訊方式的5G服務機會。

這幾年GPU幾乎主宰了資料中心的深度學習運算,可是能否擺脫配角而在資料中心扮演更重要的角色?如果GPU有高速傳輸可以直接連結儲存設備甚至是各個伺服器間的GPU,對於資料中心的業務,會有更大的主導性,特別是目前龐大資料(視訊、語音、網頁等)成為資料中心主要負載,帶來運算、IO瓶頸。Mellanox的收購就展現了這樣的企圖心。在演說中也使用網路公司常見的PageRank演算法(利用網路連結評鑑網頁品質優劣),來展示新的GPU資料平台可以大大降低傳統CPU為主的資料中心成本。

布局機器學習甚至資料分析的軟硬體平台。2019年的GTC主題演說已經推出RAPIDS來加速機器學習(深度學習為其子領域之一)的常用套件,因為這些領域進展快速,所以開源社群所扮演的角色就十分重要。今年更進而與分散式資料處理、機器學習的主流Spark開源合作,使用GPU加速。可以想像除了深度學習之外,在雲平台的幾個重要資料應用,GPU也會逐漸扮演重要角色。

GPU加速更多關鍵資料服務。SQL資料庫幾乎是所有軟體服務都會使用的功能。推薦系統是廣告、電子商務、社群經營、內容服務必備的核心。語音、機器人對話又是接下來即將普及的人機介面(特別使用者接觸的機器不再只是桌上型電腦)。GPU能否最終成為這些關鍵核心應用的軍火庫,但是由GPU擴展出的軟硬體開發套件,與開源社群合作。這不正是GPU、CUDA鞏固在深度學習領域所走過的路嗎?當然這些服務都有既有的軟體供應商存在,但是與主流的開源社群合作,如果效益顯現,或許也會驅使其他提供機器學習、資料分析的業者思考GPU資料平台的效益。

NVIDIA或許是與台灣電子產業最類似的矽谷公司,未來難以預測,但是市場的需求可能是拓展版圖的探針。正如幾年前黃執行長所說的,他們察覺GPU對於深度學習的重要,是遇見了學術界中所進行的研究計畫,好奇加以瞭解,才發現這個可能改變技術典範的機會,因而持續開發軟硬體平台來支援。建立競爭障礙不只是讓晶片跑越快或是價格越低,而是加強在關鍵服務平台上的必要性。眼光不是專注在競爭者身上而是未來客戶的需求。

徐宏民(Winston Hsu)現任台大資工系教授及NVIDIA AI Lab計畫主持人。哥倫比亞大學電機博士,專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員,慧景科技(工業智能新創)共同創辦人;曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會;十餘年產學合作及新創經驗,近年致力將深度學習技術落實到產業,並協助成立研究開發團隊。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。