林一平
國立陽明交通大學資工系終身講座教授暨華邦電子講座
現為國立陽明交通大學資工系終身講座教授暨華邦電子講座,曾任科技部次長,為ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究興趣為物聯網、行動計算及系統模擬,發展出一套物聯網系統IoTtalk,廣泛應用於智慧農業、智慧教育、智慧校園等領域/場域。興趣多元,喜好藝術、繪畫、寫作,遨遊於科技與人文間自得其樂,著有<閃文集>、<大橋驟雨>。
AI大語言模型無法馴服π
和一個人一生中相關的數字,都可以在圓周率的某一個位數找到。這是因為圓周率(π)是一個無理數,也就是說,它的十進制展開既不終止也不循環,並且其數字序列是隨機的。儘管目前沒有證據能證明圓周率的數字完全隨機,數學家普遍認為圓周率的數字分布沒有任何規律或模式,每個數字序列都有可能在某一位數中隨機出現。這意味著,無論選擇哪個數字組合,包括個人的生日、電話號碼或重要年份等,理論上都能在圓周率的某個位置找到。這些數字可能會在圓周率的某個長段中出現一次或多次,具體位置由數字的隨機分布決定。這種現象與數學中的均勻分布有關,這表示所有數字(0~9)在圓周率的各個位數上出現的機率理論上是相等的。因此,任何有限長度的數字組合都有可能出現在圓周率的某個位置。以最奇特方式運用圓周率的人,應屬高德納(Donald Ervin Knuth)。1969年時他開始發展一種計算機語言,讓使用者能夠以數位方式排版數學公式。接下來高德納花十年功夫,設計一套論文排版系統TeX,並以圓周率來當開發版本編號,由TeX3開始,現在的版本是TeX 3.141592653。人類於四千年前就嘗試找出π,但直到今日,我們仍然只是接近其實際數值。首次對π進行嚴格計算的,是西元前287至212年的希臘古數學家阿基米德Archimedes),他利用畢達哥拉斯定理計算內接於圓的正多邊形與外接於圓的正多邊形的面積,因為圓的實際面積必然介於這兩者之間,因此這些多邊形的面積提供了圓面積的上、下界。他明白這樣只能得到π的近似值,而非其確切數值。透過這種方法,阿基米德推導出π介於3.1429與3.1408之間。2021年8月19日,瑞士格里松應用科技大學(University of Applied Sciences of the Grisons)計算出圓周率最精確的數值達62,831,853,071,796位數。有趣的是,神奇的AI大語言模型無法馴服π。我問7種大語言模型,卻都給我不同答案。我詢問和我相關的4個數字:「May I ask at which digit position 1026 appears in the digits of pi? 」結果每個LLM給我的答案都不同。過去的測試中,總會有幾個LLM給出相同的答案,但這次完全沒有共識。我先試GPT,得到答案6284。接著要求GPT自我驗證:「What is the four-digit sequence starting at position 6284 in the digits of pi?」結果,得到的回覆是7590,而非1026。我試Grok,得到的回覆是1639,反向驗證,也沒得到1026,而是5807。我試Le Chat(Mistral.ai),得到的回覆是176451,反向驗證,得到3141。我試Qwen2.5-Max,得到的回覆是39,反向驗證,得到7169。我試DeepSeek,得到的回覆是8580,反向驗證,得到3099。我試Tulu 3,得到的回覆是2480,反向驗證,得到3282。我再試Gemini,得到的回覆是175319,反向驗證,他不告訴我答案,建議我找數學工具來算出。我最後試Claude,他不告訴我答案。這些大語言模型給錯答案的原因是,它們試圖自行編寫程式來找答案,但程式未能正確運行。我詢問Pi-Search頁面,它回答說:「字串1026出現於位置14678。這個字串在π的前2億位數字中出現20,130次。」這應該是正確答案。我的測試是在2025年2月24日。在告知GTP或Grok網路上特定數學工具可給答案時,它們的確會認錯,並依我建議,運用工具找到正確答案。隨著大語言模型的進化,也許未來能在第一次詢問時給出正確答案。
2025-04-14
AI程式開發助理—Devin與Cursor
蘋果(Apple)創辦人Steve Jobs 曾說:「Everybody should learn to program a computer, because it teaches you how to think.」隨著人工智慧(AI)技術的快速發展,AI撰寫程式的能力已逐漸變強,可擴增人類的能力。許多AI輔助工具開始進入軟體開發領域,幫助開發者提高效率、減少錯誤,甚至自動完成部分重複性任務。終極目標是協助一般人像電腦工程師一樣,利用「 learn to program a computer」來達到「how to think」的理想。目前較為熱門的2款AI程式開發助理是Devin和Cursor,它們各自具備不同的特點與優勢,適合不同的使用情境。Devin由Cognition開發,主要定位為一個自主的AI開發助手,能夠執行完整的軟體開發流程,甚至能夠獨立完成某些開發任務。它具備高度的自主決策能力,可以設定開發環境、重現錯誤並進行修復,甚至執行軟體測試,無需開發者過多干預。使用者與Devin主要透過對話介面進行互動,開發者可以像管理人類工程師一樣,指派任務並監控其進度。此外,它在一個安全的沙盒環境內執行,內建開發工具,能夠與不同的技術堆疊無縫整合。Devin最大的優勢在於高自主性,能夠有效地幫助開發者處理從程式碼撰寫到測試的完整開發流程,適合希望讓 AI 執行較為獨立開發工作的團隊或個人。Cursor則是一款AI強化的程式碼編輯器,設計理念與 Devin不同,主要專注於提供即時AI協助,而非完全獨立執行開發任務。Cursor的AI代理能夠理解開發者的指令,並透過推理與工具整合,執行程式開發相關的任務,減少開發者的負擔。其 AI 代理基於Composer平台運作,使其可以與各種開發工具無縫連接。此外,它允許開發者導入擴充功能、主題、快捷鍵等,使其保持與傳統開發環境一致的使用體驗。同時,它提供隱私模式,確保程式碼不會被遠端儲存,並符合SOC 2安全標準,適合對程式碼隱私有高度要求的開發者。Cursor更適合習慣使用傳統編輯器的開發者,能夠提供即時的AI協助,減少開發過程中的繁瑣工作,提高編碼效率。這兩款工具在自主性、使用方式與環境整合方面存在明顯差異。Devin具備高度自主性,能夠獨立執行完整開發任務,而Cursor則更專注於即時AI輔助,適合需要持續手動操作的開發者。如果需要AI獨立完成開發流程,Devin是更好的選擇。如果希望在程式碼編輯器內獲得 AI 協助,並維持熟悉的開發環境,Cursor 是更理想的選擇。Devin和Cursor代表2種不同的 AI 助理設計理念Devin 偏向於自動化與自主開發,Cursor則著重於輔助開發者完成日常編碼工作。最終的選擇取決於開發者的需求——如果希望 AI 來執行完整的開發任務,Devin 更具優勢;如果更需要一款能夠提高編碼效率的AI編輯器,Cursor會是更合適的選擇。隨著 AI 技術的不斷進步,這兩款工具也將持續發展,未來可能會帶來更多令人期待的功能與應用。
2025-03-21
伊莉莎白女王的虛實整合
2022年6月英國白金禧年(Platinum Jubilee)慶祝女王登基70周年活動中,伊莉莎白二世女王(Elizabeth II;1926~2022)的3D全像(Holography)被投射在金輝燦爛的皇家金馬車(Gold State Coach)窗戶上,這場景迅速吸引全球觀眾的目光,成為當天慶典的亮點之一。透過結合尖端科技與歷史文物,這次盛事展現虛實整合(Cyber-Physical Integration)的非凡潛力。這項技術讓歷史融入現代生活,創新地連結過去與未來,為文化遺產的展示開啟新篇章。虛實整合技術能即時監控、調整並優化現實世界的運作。這一技術已廣泛應用於自動駕駛、智慧城市與醫療等領域,而此次全像投影與金馬車的結合,則將其創意應用拓展到文化與娛樂產業。女王3D影像投射於擁有260年歷史的馬車上,參與白金禧年遊行,展現科技與歷史的完美融合。伊莉莎白二世女王的3D影像取材自1953年女王26歲時加冕典禮的珍貴存檔畫面,經過數位化處理與解析度提升後,這段影像得以在現代投影設備上清晰呈現。經由精密的投影技術,影像被準確映射到馬車窗戶上,營造出女王仿佛親臨現場的真實感。這種虛實結合的手法讓觀眾彷彿回到1953年,見證女王加冕的歷史時刻。金馬車本身是一件藝術與工程的雙重傑作。它於1762年完成,整體以鎏金木材製成,並飾有精美的天使、海神與獅子頭雕刻,象徵英國的國家力量與海上霸權。這輛馬車長約7米、高約3.7米,重達4噸,由8匹馬以步行速度拉動。馬車內部同樣豪華,以絲綢與天鵝絨裝飾。這一歷史文物多次經歷修復,至今仍然完好,成為英國皇室的重要象徵。將3D影像技術與擁有高度歷史價值的金馬車結合,是一項極具挑戰性的技術工程。由於金馬車的歷史價值極高,工程師設計了非侵入性的安裝方式,避免對文物造成損害。輕量化的投影設備被巧妙安裝在馬車內部及其周邊,確保整體視覺效果不受干擾。為確保虛實完美融合,工程師需克服影像穩定性與同步性等技術難題。他們利用高精度追蹤技術,確保影像與馬車移動完美同步,並特別設計投影系統以降低窗戶反光對影像品質的影響。這些技術突破為未來類似應用樹立新標杆。伊莉莎白二世女王3D影像與金馬車的結合,是虛實整合如何重新定義文化遺產的最佳例證。展望未來,虛實整合有望成為文化遺產保存與傳承的核心技術。透過更多元的數位手段,歷史文物可以超越地理與時間的限制,成為全球共享的資產。
2025-03-11
潛艇發展:從傳統到數位時代的轉變
隨著科技的快速發展,潛艇技術也經歷顯著變革。從最早的陽春設計,到現代核動力潛艇(下稱核潛艇)搭載先進的人工智慧(AI)系統,潛艇的發展不僅改變海軍戰術,也推動全球海上安全與作戰方式的變革。美國海軍的首艘潛艇是由霍蘭(John Philip Holland)發明,並於1900年正式服役,命名為「USS Holland;SS-1」。這艘潛艇長54英尺,對外通訊需浮出水面打旗語,雖然並不完美,但成功實現水下航行如魚般的夢想。霍蘭設計這艘潛艇,使其能夠使用內燃機在水面行駛,並在潛水時切換到電動馬達。她還配備艦首魚雷發射管和氣動砲(Dynamite gun,使用壓縮空氣發射砲彈)。最終,霍蘭的設計贏得美國海軍的青睞,並於1900年4月1日被正式購入,成為美國海軍的第一艘實用型潛艇。二戰期間,美國的潛艇部隊發揮巨大的戰鬥潛力,儘管當時僅佔海軍兵力的1.6%,卻成功擊沉日本海軍的3分之1及其近3分之2的商船隊,對日本戰爭能力造成嚴重損害。貓鯊級(Gato class;與水面艦艇不同,彼時美國海軍潛艇命名皆取名自水生動物)潛艇是美國在第二次世界大戰期間首次大量生產的潛艇,生產期間為1941年至1943年。雷達、電子監視技術和通信技術的快速發展改變貓鯊級指揮塔水面部分的設計,以容納新設備的桅杆和天線。戰後,潛艇技術進入數位化的新時代。1950年代,美國海軍推出了以流線型艦體設計的青花魚號潛艇(USS Albacore;AGSS-569),突破水下航速限制。隨後,1955年,美國海軍的鸚鵡螺號(USS Nautilus;SSN-571)以核動力成功突破續航能力的瓶頸,標誌著核潛艇時代的到來。而「移動聲學通訊系統(MACS)」是鸚鵡螺號上的最後一項重大實驗,將潛艇帶入數位資通訊時代。核潛艇發展使得美國海軍能夠長時間保持隱匿行動,並在極深的海域潛行。這些潛艇不僅能在冰層下航行,甚至能在北極點浮出水面。1960年,美國核潛艇「USS Triton」(SSRN/SSN-586)成功完成環繞地球一周的水下航行,為潛艇戰術的未來奠定基礎。Triton的數位資通訊設計具創新性,配備先進的電子監視與通訊技術,176名船員更展示首代核潛艇在不被偵測的情況下,進行長程水下作戰的能力。隨後的洛杉磯級(Los Angeles class;自此級開始,美國海軍潛艇改以城市命名之)攻擊型核潛艇以及後來的戰略核潛艇(指搭載可裝載核彈頭的潛射彈道飛彈的核潛艇),成為美國海軍強大作戰力量的一部分。這些潛艇更安靜,配備更先進的數位資通訊子設備、感測器和降噪技術。進入21世紀,隨著數位化和AI技術的發展,潛艇的操作與戰術也在持續進化。現代潛艇配備先進的自動化系統,從導航到攻擊,都能依賴高效的數位技術來提升作戰精度與反應速度。例如,現代潛艇的聲納系統結合深度學習技術,能精確識別水下目標並作出即時反應。此外,AI技術使潛艇能進行更有效的資料分析與處理,為指揮官提供即時戰場情報,增強決策能力。
2025-02-04
卜瓦松:計數型AI分析的萬靈丹
人工智慧和機器學習中使用到卜瓦松分布(Poisson Distribution)。在貝葉斯推論(Bayesian inference),機率分布經常被用來解決原本難以處理的問題。其中一個具體的應用是卜瓦松迴歸,這是一種專門用於建模計數數據的迴歸分析方法。例如,卜瓦松迴歸可用於估算與搭乘飛機相關的感冒次數,或預測某個事件期間的緊急服務呼叫次數。卜瓦松迴歸是一種廣義線性模型,其使用對數作為(典型)連結函數,並假設反應變數遵循卜瓦松分布作為其機率分布函數。卜瓦松分布提供簡單而有效的數學框架,使得計數型AI分析變得更加精準和可解釋。這個分布以發明者卜瓦松(Siméon Denis Poisson, 1781~1840)命名。我2015年參訪巴黎的法蘭西科學院(Académie des Sciences) 時,意外地看到卜瓦松的手稿。卜瓦松出生於法國的皮蒂維耶,自幼展現出非凡的數學才能,迅速成為19世紀最具影響力的數學家之一。他在機率論和解析力學方面做出突破性貢獻,在數學和物理學界留下深遠影響。他的卓越才能、謙遜和對知識的奉獻繼續激勵著數學家和科學家,改變我們對機率、數理物理和解析力學的理解。1838年,他發表卜瓦松分布,這是一種適合描述單位時間內隨機事件發生次數的機率分布。起初,卜瓦松分布並未有很多實際應用。波特凱維茨(Ladislaus Bortkiewicz, 1868~1931) 利用卜瓦松分布公式計算在20年的期間裡,每年普魯士軍隊每14名騎兵中被馬踢死的人數。這是一個有趣的例子,但並非日常生活中適切的應用。後來,科學家發現卜瓦松分布可以廣泛用於描述隨機離散事件的發生,在物理學、生物學和金融學等領域證明其實用性。例如,在分析電話網路的效能時,卜瓦松分布如同萬靈丹。我在處理單位時間的通話次數時,總是先套用卜瓦松分布,事後驗證,結果總是正確無誤。1798年,卜瓦松以第一名成績考進巴黎綜合理工學院,追隨老師拉普拉斯(Pierre-Simon Laplace) 的足跡,兩人情同父子。卜瓦松和拉普拉斯合作促成開創性的研究論文和各自領域的進一步發展。卜瓦松往往能將拉普拉斯的研究成果加以擴展。例如,我在進行電話系統效能評估時,常會用到拉普拉斯方程式及卜瓦松方程式。拉普拉斯方程式沒有源項(source term),這意味著它是齊次的(homogeneous)。卜瓦松方程式有源項,這意味著拉普拉斯算子(Laplacian) 應用於一個標量值函數(scalar valued function) 時不一定為零。卜瓦松方程式本質上是拉普拉斯方程式的一種廣義形式。儘管擁有巨大的才華和成就,卜瓦松以其謙遜、低調和對工作的奉獻著稱。他保持謙遜,專注於知識的追求。卜瓦松的遺產超越他的數學和科學成就,對學習的熱情和對知識追求的奉獻激勵著全世界有志於數學和科學的人。 人生只有兩樣美好的事情:發現數學和教數學。—卜瓦松
2025-01-08
AI也難突破哥德爾不完備定理
哥德爾(Kurt Friedrich Gödel;1906~1978)在現代邏輯上的成就是獨特而偉大的。事實上,哥德爾的成就不僅是一座學術紀念碑,更是長久屹立於學術歷史中的地標。邏輯學科因為哥德爾的成就而徹底改變其本質與發展可能性。在哥德爾的偉大成就中,他的不完備定理(Incompleteness Theorems)是數理邏輯中的基本結果,宣示形式系統的內在局限性,尤其是那些能夠表達基本算術的系統。第一定理表明,任何足夠強大且一致的形式系統都不可能完備,這意味著該系統內會有無法使用自身證明的真命題。第二定理進一步指出,沒有一個系統能夠證明自身的一致性。大型語言模型(LLM),如GPT-4,可以協助數學定理的證明,但與傳統方法相比,它們仍有明顯的限制。這些模型可以提出想法、建議步驟或提供解釋,這些都可能在證明構建過程中發揮作用。它們能處理某些符號運算並形式化某些證明,特別是那些遵循已知模式或來自數學文獻中的證明。然而,LLM無法從零開始進行複雜或新穎定理的深度推論,因為它們的回應基於數據模式,而非形式邏輯推導。一些專門設計來證明定理的AI系統,如Coq、Lean和Isabelle,依賴嚴格的形式邏輯,並能生成完全形式化的證明,且這些證明可經過驗證確保其正確性。相比之下,大型語言模型缺乏對邏輯和數學結構的形式理解。然而哥德爾的定理表明,某些真理無法由這些AI系統確立,且複雜系統的一致性無法從系統內部證明。AI無法「打破」哥德爾定理,因為這些定理是邏輯學的基本結果。它們適用於任何具有一定複雜性的形式系統,並且已被證明無誤。由於AI運行依賴形式邏輯,它同樣受到哥德爾不完備定理的根本限制。儘管AI無法打破哥德爾的定理,但它能幫助探討這些定理的影響,模擬不同的邏輯系統,並研究這些限制在各類數學框架中的具體表現。然而,AI無法獨立證明複雜或新穎的定理,也無法突破哥德爾不完備定理所設下的限制。哥德爾說:「我只相信先驗的真理。世界的意義在於願望與事實的分離。數學要麼對人類心智而言過於龐大,要麼人類心智不僅僅是一部機器。事物本身與談論事物之間是有區別的(I only believe in a priori truth. The meaning of world is the separation of wish and fact. Either mathematics is too big for the human mind or the human mind is more than a machine. There is a difference between a thing and talking about a thing.)在AI的協助下,我們或許能夠進一步探索數學的深邃領域,擴展人類心智的理解範圍。
2024-11-29
讓MusicTalk訴說敲擊的故事
2024年10月6日,我到國家戲劇院觀賞朱宗慶打擊樂團擊樂劇場《六部曲》。打擊音樂水準極高,讓觀眾感受到洗滌心靈的音樂饗宴。國家戲劇院是一座智慧劇院,舞台背後設有巨型銀幕,能與表演者進行虛實結合的互動。表演過程中,銀幕上出現浮雲、瀑布、抽象光影等動畫。感覺上打擊樂器與銀幕圖像較無即時地關聯。在我腦海中浮現的是各種打擊樂器的即時梅爾頻譜圖 (mel spectrogram)。梅爾頻譜圖是一種變形的頻譜圖,常運用於語音處理和機器學習。它與頻譜圖類似,顯示音頻信號隨時間變化的頻率內容,但其頻率軸不同。我發展一套AI工具MusicTalk,其中一個功能可以即時分辨出一首樂曲中同時演奏的樂器種類。MusicTalk將樂器的聲音轉換為梅爾頻譜,並以特殊AI演算法分析,準確度接近95%,是迄今最準確的方法。我在開發MusicTalk時,研究許多打擊樂器的梅爾頻譜圖,因此在《六部曲》的演奏過程中,各種變化多端的梅爾頻譜圖不斷在我腦海中浮現。將抽象動畫與敲擊聲音連結並不容易,若能將敲擊聲音與科學結合,將更具意義。第一位以科學系統化賦予敲擊聲意義的是奧恩布魯格(Leopold Auenbrugger, 1722~1809)。他是旅館老闆的兒子,在維也納大學接受醫學教育,深受Gerard van Swieten影響。1761年,他出版小書《新發明》(Inventum novum),成為以叩診法(percussion in the diagnosis)診斷胸部疾病的第一人。儘管傳說他的發現靈感來自童年敲打父親酒桶的經歷,但更可能的是他敏銳的音樂耳朵讓他能分辨出胸部病變過程中的音調變化。他描述各種病變如何導致叩診時音調轉變為不同音色,如「高音」(sonus altior 或鼓音)、「低音」(sonus obscurior 或模糊音)、或「鈍音」(sonus carnis percussae 或肉叩音)。這些發現後來得到臨床診斷的實證。奧恩布魯格一生酷愛音樂,經常在家中舉行午後音樂聚會,莫札特 (Wolfgang Amadeus Mozart, 1756~1791) 一家也曾受邀參加。他的2個女兒都很會彈鋼琴,賓客們曾評論說:「她們兩人,尤其是姐姐,彈得非常好,並且極具音樂天賦。」10年後,莫札特為薩爾茨堡(Salzburg)創作一些新歌劇,其中之一是日耳曼喜劇《煙囪清潔工》(Der Rauchfangkehrer)。該劇於1781年首次在維也納國家歌劇院上演,劇本正是由奧恩布魯格撰寫。奧恩布魯格的音樂藝術天分無庸置疑,能以極具創意的方式將器具的敲擊聲賦予科學 (醫學) 的意義。奧恩布魯格的成就,影響我對利用敲擊工具(樂器)解釋科學現象的興趣。我開發出 AI 工具 WatermelonTalk,能將拍打西瓜的聲音分為4類,代表不同的成熟度,準確度高達94%,是迄今最精準的成熟度判定方法。在聆聽《六部曲》時,我期望編劇者能充分利用如MusicTalk這類AI工具,以科學方式利用未來劇院的智慧銀幕,呈現敲擊樂器的特徵,使觀眾更能理解樂器所表達的內涵,進一步促進音樂與科技的深度結合。
2024-10-31
物聯網醫療復健機
中風是全球導致死亡和致殘的主要原因之一,其中由運動障礙引起的功能性殘疾是中風後常見的問題。約60%的中風患者在中風後失去行走能力,20%的患者在1年後仍無法獨立行走。恢復行走能力在中風康復中至關重要,直接影響患者的生活品質。傳統的物理治療和職能治療計畫,歷來支持中風後的神經和功能恢復,但結果往往難以預測。為改進康復策略,機器人輔助步態訓練(Robot-assisted gait training;RAGT)這種創新方法應運而生,專注於改善行走能力。RAGT透過重複特定任務,促進運動學習和功能改進。這項技術使患者能夠參與高強度的訓練,例如在10分鐘內完成300步,減少依賴物理治療師。結合物聯網技術,RAGT進一步強化中風後的神經和功能恢復。RAGT有2種方法:末端效應器法和外骨骼法。在末端效應器法中,患者的腳放在足板上,模擬步態的站立和擺動階段;在外骨骼法中,外骨骼裝置透過驅動裝置,在擺動階段彎曲髖部和膝蓋,並配合跑步機模擬站立階段。綜合研究深入探討這些方法的臨床、技術和監管層面的應用,為臨床醫生提供了有關機器人康復潛在恢復機制的寶貴見解。被動訓練模式和重力補償功能為處於急性或亞急性階段的中風患者提供早期康復,使他們能夠專注於運動控制。透過病歷查閱,收集參與者特徵、中風細節和合併症信息,同時透過腦部CT或MRI提供病變位置和中風類型的信息。為評估治療前日常生活活動(ADLs)的獨立性,須對病人進行多項評估,包括Berg平衡量表(BBS)、Brunnstrom階段、匹茲堡睡眠品質指數、Fugl-Meyer下肢功能評估(FMA-LE)和總分(FMA-total)。在慢性中風患者的研究中,常使用POMA的行動性能評估來衡量平衡和步態,並使用BBS來測量姿勢控制和平衡。這些參數在評估和定制康復干預計畫以達到最佳結果。下肢運動功能主要涉及平衡和步態,這些元素是相互關聯的,在中風後經常下降。BBS以其在衡量平衡功能中的高信度和重測信度而著稱,特別適用於中風倖存者的評估。步態分析是下肢運動功能的重要評估工具,推薦用於評估和增強中風後的行走能力。結合BBS和步態分析可全面評估平衡和步態,作為衡量康復干預效果的重要參數。這一綜合方法提供了對患者在恢復行動能力和執行日常任務進展的全面理解。利用物聯網技術,我們在中國醫藥大學開發出一套系統MRGtalk,這是一款針對中風及神經障礙引起的下肢康復的應用輔助前端系統,提升老年人的肢體活動和身體健康。MRGtalk使用普適計算(Pervasive Computing)進行下肢康復,強調肌肉力量的改善和行走能力的增強,包含:1. 增強感官反饋的三點支撐設計促進全負重的站立踏步訓練;2.根據個人能力,可通過具有網頁瀏覽器的固定或移動設備遠程調整訓練參數(步長、頻率、軌跡和持續時間);3.多患者獨立訓練模式優化時間和精力的使用。作為應用輔助前端,MRGtalk輸出關鍵的訓練參數。臨床實驗顯示,其在改善中風患者的下肢肌肉功能、平衡和行走能力方面具有良好效果。MRGtalk簡化RAGT過程,減少了治療師提供手動輔助的需求,是資通訊技術運用於復健的一個典範。
2024-09-25
透過物聯網技術 搶救小豬大作戰
在豬養殖業中,仔豬死亡率是一個需要仔細處理的嚴重問題。特別是,在頭三天裡,有7.5%的仔豬會被母豬意外壓死。平均每天有1.2頭仔豬被母豬壓死。具體來說,仔豬壓死可能發生在母豬躺下或翻身時。這樣的事故更容易發生在較弱的仔豬身上,因為較弱的仔豬更有可能靠近母豬吸乳。此外,當產房溫度較低時,仔豬也會更靠近母豬保暖。因此,為了防止仔豬被母豬壓死,我們應該避免仔豬餓和受冷。或者,可以使用產房籠來限制母豬的姿勢變化,並為仔豬提供更安全的空間。當一頭仔豬被壓死時,養豬者必須在太遲之前迅速採取行動。一位技術嫻熟的養豬者可以通過仔豬的尖叫聲來檢測仔豬的死亡,並強迫母豬站起來或將被壓死的仔豬與母豬分開。然而,監控產房籠對養豬者來說是一項全天候的工作,而勞動成本過高。物聯網技術可由麥克風感應器中收集豬的聲音數據,並在仔豬被壓死時自動採取行動。我的研究團隊利用 IoTtalk 的物聯網設備管理平台,提出了 PigTalk 技術,來解決仔豬被壓死的問題。透過對產房收集的聲音數據進行即時分析,PigTalk 檢測是否有任何仔豬尖叫事件發生,並自動啟動母豬警報器進行應急處理。PigTalk利用一種音頻轉換方法來預處理原始聲音數據,並在機器學習中利用最小-最大標度化來檢測仔豬的尖叫聲。PigTalk以上述數據預處理方法與機器學習模型微妙的參數設置將仔豬尖叫檢測準確度提高到了 99.4%,比以前的解決方案(最高達 92.8%)更好。PigTalk 可以在 0.05 秒內拯救 99.93% 的仔豬。這樣的結果已在商業化的產房得到驗證。PigTalk 是一種新方法,可以自動減輕仔豬被壓死的情況,這是過去無法實現的。PigTalk提供一個遠距操控的GUI (graphical user interface),豬場飼主可用手機控制強迫母豬站起來的致動器(Actuator)。圖(a)提供的致動器包括振動地板、氣流噴射、灑水系統和電極(有些不太人道,並未真正實作)。當豬場飼主收到警報時,他/她通過手機觀看從攝像機 (圖(b)) 發送來的視頻,並可操作攝影機放大影像,清楚觀察(圖(c)) 。如果仔豬的尖叫聲不是由於被壓死引起的,那麼養豬者可以遠程停止致動器 (圖 (f))。如果確實發生了仔豬壓死,則他/她應該跑到籠子處理這個仔豬壓迫事件。養豬者可以選擇打開或關閉致動器 (圖 4 (a)),當危險情況得到緩解時停止致動器。在PigTalk中,環境致動器例如加熱燈可以手動打開/關閉 (圖 4 (d)),或者在溫度變化時自動打開/關閉 (圖 4 (e))。PigTalk搶救小豬大作戰是運用AI及物聯網技術的很好範例。關於技術的詳細信息,請參閱W. E. Chen, Y.-B. Lin, L.-X. Chen (2021, June). PigTalk: an AI-based IoT Platform for Piglet Crushing Mitigation. IEEE Transactions on Industrial Electronics, 17(6): 4345-4355。
2024-08-20
妖姬的跳頻
台灣中山科學研究院在無線通訊的跳頻技術(Frequency Hopping)上有很深的著墨。這項技術能有效地防止敵人的無線電干擾。今日烏俄戰爭中,高檔的無人空中載具都充分運用跳頻技術,讓士兵能遠距操作無人機,不受干擾。很多人可能想像不到,跳頻技術的發明人是電影《霸王妖姬》(Samson and Delilah)的女主角「妖姬」海蒂·拉瑪(Hedy Lamarr, 1914~2000)。這部電影獲得第23屆奧斯卡金像獎。拉瑪發明跳頻技術的動機並非要運用於空中的飛機,而是水中的魚雷(Torpedo)。第一款魚雷是白頭魚雷(Whitehead Torpedo),製造於1866年,以其發明者懷海德(Robert Whitehead)命名。過去的漂移水雷必須被動等待敵艦撞上,而白頭魚雷內建動力,可主動攻擊敵人目標。1895年的甲午戰爭,日本帝國海軍以魚雷重創清朝北洋艦隊定遠號戰艦,證明了魚雷以小博大的實際戰果。日俄戰爭期間,俄羅斯帝國海軍與日本帝國海軍互相使用魚雷攻擊敵方艦艇。然而軍事專家在日俄海戰過程中發現,魚雷實在是無甚作用。日俄共發射近600枚魚雷,只擊沉數艘船艦,其餘80多艘船艦是被傳統炮火擊沉。特斯拉(Nikola Tesla;1856~1943)很早就發現魚雷的缺點,向美國軍方遊說無線電導引魚雷的可行性,但遭到拒絕。特斯拉的想法超前軍方太多,而日俄戰爭證實特斯拉建議的必要性。美國海軍恍然大悟,開始在第一次世界大戰時研發無線電控制的魚雷,稱之為哈蒙德魚雷(Hammond Torpedo)。1930年代的拉瑪白天忙著拍電影,晚上則一直想點子,希望幫助盟軍打贏第二次世界大戰;她向休斯(Howard Hughes, Jr., 電影《鋼鐵人》中男主角爸爸的原型)提出飛機機翼的設計,並被休斯採用;她也構想出發泡片劑,讓在前線作戰的軍人將片劑融入水中,就可以變成可樂暢飲。1940年,拉瑪在宴會上遇到鋼琴家安瑟(George Antheil, 1900~1959)。在鋼琴邊閒聊之際,拉瑪忽然想到一個祕密通訊的方法,可發展出抵擋敵人電波干擾魚雷的控制。當時的無線通訊使用固定頻率,除了容易被攔截干擾外,還時常有斷訊問題。拉瑪看著安瑟手邊的琴鍵,靈機一動:「就像彈奏鋼琴的不同琴鍵一樣,時常改變通訊的頻率就可以達到防止敵人電波干擾的目的。」安瑟按照拉瑪的想法,藉由他所熟悉的自動鋼琴,開發出一個能夠自動編譯密碼的模型,也就是今天我們熟悉的跳頻技術。這項技術不但擴大通訊量,並且成功將通訊內容加密,並於1942年取得美國專利。拉瑪將這個貢獻提供給美國軍方。軍方不認為電影明星和鋼琴家的奇思妙想能夠真的實現,勸拉瑪將發揮她其他方面的天分,利用她的美貌幫軍方募款。拉瑪只好將她偉大的發明擱置一旁,到處宣傳,幫政府募到2,500萬美元的戰爭債券。拉瑪說:「希望和對未來的好奇心,似乎比保證的事物更好。這就是我的方式。未知的事物對我總是如此有吸引力……現在依然如此 (Hope and curiosity about the future seemed better than guarantees. That's the way I was. The unknown was always so attractive to me... and still is)。」
2024-08-07
智慧應用 影音