科技產業報訂閱
order

出賣你的文字、照片與設備

  • 徐宏民

照片傳遞豐富資訊。照片的分享,搭配影像辨識,很容易知道使用者喜好,出沒地點、類型等。by.yuyang

目前絕大部分的軟硬體服務都竭盡所能的收集使用者資料,包括網路瀏覽紀錄、對話、參加的群組、喜好文章、照片、購物紀錄、打卡位置、音樂歌單等。透過這些資訊可以推估使用者屬性、喜好、甚至政治傾向,富含商業應用。而快速發展的智慧技術,更推升了使用者資料的價值。

瞭解使用者,甚至可以利用各種技術進而改變其行為,比如購物、粉絲、瀏覽、音樂、電影、娛樂、電子商務、黏滯性、甚至政治喜好、投票行為等。所以背後隱藏了許多商業價值,甚至有人不惜侵犯使用者隱私,非法銷售客戶資料,如病毒軟體公司出售用戶資料,包括使用者屬性以及到訪的網頁。

智慧技術精進,更能由非結構性的資料中瞭解使用者的行為喜好。這就是為什麼許多社群通訊軟體樂意提供「免費」的服務,因為透過這些對話文字、加入的群組、討論主題等,可以清楚瞭解,社群、通訊軟體使用者每個人的特性、偏好,自然可以優化商業的用途,進一步提供廣告、購物、甚至販售用戶資料給第三者。

位置在瞭解使用者的行為至關重要,甚至連結實體世界,按照使用者所在地推送相關廣告、瞭解實體世界的活動、使用者的屬性等。這就是為什麼許多軟硬體服務,竭盡所能的擷取使用者位置。在2010年時Facebook的研究已發現,利用網路好友的位置以及彼此互動,可以猜測出每個人的所在位置,正確率高於一般利用IP位置的推估方式。

一畫勝千言 (A picture is worth a thousand words),照片傳遞豐富資訊。照片的分享,搭配影像辨識,很容易知道使用者喜好,出沒地點、類型等。按照相片中的人臉可以建構出社群網路,我們之前的研究也發現,利用照片人臉的相對位置等可以推測照片中人物關係,比如家人聚會照片年齡差距較大,而且人臉位置較緊密;同儕、同事、好朋友等則年齡差異較小而且喜歡往兩側排列。

視訊會議系統更需關注隱私保護。因為疫情,許多實體會面都轉移到線上,工作會議的敏感內容,不管是語音討論、投影片、或是設計樣本都有可能被紀錄、轉譯(OCR)為文字,清楚呈現每個人的專業、討論內容。甚至會議中的人臉、語音等可以作為生物識別的重要依據。更有甚者,可以「生成」虛擬的人臉以及聲音。目前的技術發展,給予足夠數量的語音可以模擬出每個使用者講話的語調,透過語音合成,以逼真的方式講出特定的文字。擷取足夠的人臉,也可以模擬出人物的表情。

設備安全性更顯重要。之前大家所關注的GDPR,影響到各個產業在歐盟資料管控的問題。同時設備會面臨更多的攻擊,特別是上網的IoT設備,所以在作業系統、線上更新(OTA)、加密技術等必需加碼。順應趨勢,更有不少廠商在edge端加入加密以及各種安全機制,相關技術極有可能成為終端設備不可或缺的功能。 

終端設備需要配備各種感測器,上網、雲端資料儲存需求大。服務營運商急需瞭解使用者的狀態(context),使用者在那裡?車子、廚房、浴室、書房?他在做什麼?所以,目前各種設備都希望可以利用各種感測器:攝影機、麥克風、Wi-Fi、藍牙、GPS來偵測各種訊號,配合智慧演算法,進而瞭解使用者的狀態。 硬體設備需要配置越來越多的感測器。

新型服務持續影響硬體價格。近來增加許多免費軟體服務甚至低價格的硬體,所專注的是透過硬體提供給消費者更精緻的服務或是交換消費者的潛在價值來獲利。免費的服務越來越多,單單製造硬體的價格絕對會被持續壓縮。

智慧技術不單影響運算設備,對於資料的強烈需求,推升新型態應用等,也會影響電子零組件、以及資通訊產品的製造。隱私與資料收集可能會以動態的方式均衡,身為提供許多硬體設施的台灣產業,該如何在這之間尋求適合的平衡點,甚至超前部署,著實考驗經營者的智慧。

徐宏民(Winston Hsu)現任台大資工系教授及NVIDIA AI Lab計畫主持人。哥倫比亞大學電機博士,專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員,慧景科技(工業智能新創)共同創辦人;曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會;十餘年產學合作及新創經驗,近年致力將深度學習技術落實到產業,並協助成立研究開發團隊。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。