DForum1108

NVIDIA GTC 2018觀察(二):深度學習市場的期待

  • 徐宏民
深度學習技術已有極大突破,但是落地為產品還是有諸多挑戰。預料接下來的重心將會轉移到誰的產品技術策略正確、客戶願意買單。NVIDIA Corporation

接續在GTC 2018的觀察。這個在矽谷聖荷西舉辦,近年來人工智慧(深度學習)技術最火熱的產業會議,今年人數爆增到8,500人。

和去年相比,市場的期望是什麼?我的觀察:前幾年大家想瞭解什麼是深度學習技術、可以做什麼?今年明顯感受到,大家在乎的是如何將技術落地為產品。

深度學習技術有極大的突破,但是落地為產品還是有諸多挑戰。比如,如何設計符合需求的網路?具有關鍵角色的訓練資料在哪裡?目前的網路模型過大(數百萬個參數)、耗費記憶體、運算資源,如何提升訓練跟推理時的效率?終端環境的硬體設計呢?跟既有的軟體工程系統如何銜接?

比如說,訓練資料是大家產品開發上第一個遇到的問題。在這次會場上我們發表了50分鐘的技術演說,分析如何有效率的採集關鍵性的深度(機器)學習訓練資料以及訓練方式,在現場也滿滿感受到這股強烈的需求。

我們整理了四種策略:首先由社群媒體上的公開影像、視訊、對話等下載所需的資料,再透過群眾外包完成標註。其次是利用弱監督(weakly supervised)或是半監督(semi-supervised)的算法,利用少量的標註資料(或是包含其它未標註的大量資料)進行學習訓練,以降低昂貴費時的資料標註。再來是使用不同(接近線性)的轉換方式,產生更多(但是近似)的資料。最後,也是目前看來最有機會的,善用3D圖像生成,或是生成對抗網路(GAN)來生成跟多互補性的訓練資料。

NVIDIA也呼應這個訓練資料、訓練環境的主軸,分別推出針對自駕車以及機器人訓練的圖形模擬平台。當然對於客戶急需部署深度學習推論功能在大型數據中心,也將技術擴及到Kubernetes開源系統;在終端環境加速推理效率的TensorRT。

我料想,接下來在深度學習的技術浪潮中,重心會從炫目的展示,轉換到誰的產品技術策略正確、誰的解決方案願意讓客戶買單才是!

徐宏民(Winston Hsu)現任台大資工系教授及NVIDIA AI Lab計畫主持人。哥倫比亞大學電機博士,專精於機器學習、大規模影像視訊搜尋與辨識、前瞻技術商業模式等領域。為訊連科技研發團隊創始成員,曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會;十餘年產學合作以及新創經驗,近年與國內外企業合作,將深度學習技術落實到產品上,並且協助成立深度學習(人工智慧)團隊。曾獲ACM MM 2014 Grand Challenge Multimodal Award、傑出資訊人才獎、吳大猷先生紀念獎等多項國內外大獎。