生成式AI技術發展與應用趨勢 智慧應用 影音
DForum0809
ADI

生成式AI技術發展與應用趨勢

  • 陳婉潔DIGITIMES企劃

隨著ChatGPT聊天機器人的應用逐漸普及,生成式人工智慧(Generative AI)歷經快速發展,其在各行各業的應用正在日益擴展。根據DIGITIMES最新的《AI Special Report》指出,全球生成式AI市場規模將在2024年達到400億美元,2030年將成長至1.5兆美元,此領域至今已經湧現大量技術名詞和應用場景,不僅對傳統產業與工作角色造成衝擊,也為世人帶來前所未有的機遇。

超越自我的人工智慧新技術

作為人工智慧領域的重要分支,生成式AI能夠通過學習資料的分佈模式來生成新的資料,而不僅僅是對現有資料進行分析和預測。該技術乃奠基於各種生成模型(Generative Models),例如OpenAI公司的GPT系列模型,這些模型接受大量未標記資料的訓練,能夠在沒有明確指導的情況下生成創造性的內容。
當前最先進的生成模型通常具備多模態(Multimodal)能力,即能處理多種不同類型的資料,如文字、圖像、聲音、程式碼等,在跨媒體內容的生成和理解上擁有驚人潛力,使得人工智慧能夠勝任許多創意工作,例如文章寫作、繪圖、作曲,甚至是軟體設計。然而,生成式AI可以實現如此卓越的「特異功能」,乃得益於近年來的三項重大進展。

提供生成式AI發展動能的三股力量

資料工程的進步:訓練AI模型需要大規模且高品質的資料,這些資料的來源多取自網路,為了收集與清理高達幾兆位元組(Terabyte)的龐大數據,現代化的資料工程發展出許多大數據治理技術,為AI模型的建置提供了可靠資源。

電腦算力的提高:生成式AI模型的訓練與推理需要大量的電腦運算資源,以NVIDIA為首的科技大廠競相投入加速器硬體技術的研發,強固的資訊基礎建設提供超高速的叢集運算能力,甚至讓人類實現通用人工智慧(AGI)的夢想成為可能。

AI演算法的突破:近年來,深度學習技術取得重大突破,例如生成對抗網路(GAN)與擴散模型(Diffusion Model)的提出,使得AI能夠生成逼真和充滿創意的圖像內容;採用注意力機制的變換器(Transformer)網路則是大型語言模型(LLM)的主流架構,在自然語言處理(NLP)領域已取得巨大的成功。

生成式AI匯集資料、算力、算法等工程技術的強勁動能,創造出百花齊放的研究成果,雖然早期市場投資與產業鏈發展仍以AI運算硬體為主,隨著AI相關軟體與服務逐漸打入B2B與B2C市場,生成式AI勢必也要走出實驗室,在生活中尋求落地應用。

生成式AI的應用趨勢

觀察2024年的生成式AI應用,其涵蓋範圍越來越廣,型態也愈發多樣化,以下是幾個具代表性的應用場景:

藝術與設計:生成式AI能夠快速產出圖像、轉換藝術風格或提供配色建議,可以提升藝術家或設計師的工作效率,甚至改變傳統的設計流程,利用AI解析客戶數據,激發創作靈感,讓作品更符合市場期待。

影視娛樂:生成式AI被應用於影視特效、遊戲開發等領域,透過深偽(Deepfake)或虛擬人技術,創造出極為逼真的視覺效果和互動體驗。尖端的影片生成模型,例如OpenAI的Sora甚至號稱擁有模擬物理世界的能力。

教育:國內外已有學校利用ChatGPT輔助教學的例子,例如批改學生作業、製作學習歷程檔案或多媒體教材等。透過與聊天機器人對話,老師可以獲得教學靈感,學生則像是擁有全年無休的虛擬教師,增加自主學習的機會。

醫療保健:在醫療領域,生成式AI被用於醫學影像處理、疾病診斷、新藥研發等任務。最先進的生命科學模型能夠精準模擬蛋白質,協助製藥公司創造新的蛋白質結構;各式智慧醫療器材與AI輔助臨床流程的創新,則為健康照護事業帶來顯著的效益。

行銷客服:生成式AI可提供精準的客戶分析,並自動生成各種行銷內容,如社群貼文、電子郵件、廣告文案等,有效減輕行銷人員的工作負擔。有些企業則開發客服聊天機器人,提供即時、個人化的客戶支援服務,不僅節省人力,也提升顧客滿意度。

展望未來 生成式AI商機無限

除了前述的應用情境,還有不少值得關注的新趨勢在萌芽當中,包括多模態AI進入嗅覺、味覺和3D空間理解的新領域;新的神經網路架構出現(例如Mamba);穿戴式智能設備的革新;支援多元任務、人機協作的AI代理(AI Agent);便宜易用的小型開源模型崛起;因應AI基礎設施沉重能耗而發展的新能源技術……等,充分顯示生成式AI迅猛發展的態勢,展望未來,商機無限。


商情專輯-COMPUTEX 2024