做好巨量資料分析 城市安防才有保障 智慧應用 影音
Microchip
Event

做好巨量資料分析 城市安防才有保障

  • DIGITIMES企劃

PhthoMap研究計畫透過華爾街日報網站提供互動地圖,讓使用者可以用來觀看特定車站的微生物研究成果。graphics.wsj.com,華爾街日報網站
PhthoMap研究計畫透過華爾街日報網站提供互動地圖,讓使用者可以用來觀看特定車站的微生物研究成果。graphics.wsj.com,華爾街日報網站

隨著雲端運算及物聯網等科技的不斷發展,巨量資料(Big Data)在智慧城市扮演的角色也越來越重要。但事實上,資料本來就是城市治理非常重要的依據,尤其是與城市安防的相關業務,舉凡人口統計、犯罪率、交通流量等資料,政府治理單位本來就會定時蒐集並加以分析,作為施政的參考,如果不能先了解巨量資料與傳統資料的差別,掌握巨量資料的分析與工具的特性,就算擁有巨量資料,也可能只是「入寶山空手而回」,無法將資料轉換成價值,自然也無法對城市安防產生貢獻。

了解巨量資料才能有效運用

PredPol應用巨量資料分析技術,預測出犯罪機率高甚至下一次可能發生犯罪情況的區域,並於地圖上標示出一塊塊500平方英尺的區域,供警察參考。Predpol

PredPol應用巨量資料分析技術,預測出犯罪機率高甚至下一次可能發生犯罪情況的區域,並於地圖上標示出一塊塊500平方英尺的區域,供警察參考。Predpol

相較於傳統資料,巨量資料至少具有三個差異極大的特性。首先是資料量(Volume),如果換算成數位資料單位,基本單位通常已經是TB、PB等級,不但要考量收集及儲存成本,如何迅速傳遞這麼龐大的資料,也是巨量資料應用必須思考的重點;其次是時效性(Velocity),即使是這麼大的資料量,仍然要在最短的時間內產生分析結果,如傳統的年報統計,往往是在今年收集去年的資料,卻在隔年才出版,曠日廢時的結果,往往會讓資料分析結果失真。

最後也是最大的差別,就是資料的多樣性(Variety),傳統的資料通常有明確的結構性,選項也比較少,如年齡、性別、等級等,但巨量資料可能會有各種形式,包括文字、影音、圖像、網頁等,不但沒有明顯的結構,而且巨量資料還常常出現形式交錯的現象,如Youtube上的影片除了有點擊數外,同時還有留言討論。

由此可知,傳統的資料收集方式,顯然已經不能滿足城市安防對於巨量資料的需求,所幸在物聯網(Internet of Things;IoT)、雲端運算及4G無線寬頻等技術的發展下,要取得物與物、物與人、人與人的互聯互通資料,技術上已不是問題,但必須得先迅速建構起收集、傳遞及儲存巨量資料的基礎建設,才有可能建立全面感知的能力,成為城市安防決策的最佳後盾。

但只是從感知層獲取資訊是不夠的,因為想要做好巨量資料深度分析,就必須要有能力針對複雜且開放式的問題尋找答案,並藉由視覺化分析工具,透過連續性的篩選和抽象化,才能洞悉重要資訊。然而巨量資料具有的超大量半結構化?非結構化資料的特性,往往會造成傳統關聯式資料庫管理系統(RDBMS)的運作瓶頸,必須要導入全新的巨量資料分析工具,方能真正靈活運用巨量資料。

此外,巨量資料的價值既然遠超過傳統資料,巨量資料的真實、安全及穩定性,就必須加以重視。尤其是現在的網路應用無所不在,舉凡機場、銀行、捷運、車站、水電油氣供應機制等,都可能被駭客入侵,加上政府為了能讓掌握的資料更有價值,必須要採取公開透明的資料使用機制,當公共事業的資料開放愈多,可能被入侵的機會也愈高,因此想要利用巨量資料來解決城市安防的問題,首先就得先做好巨量資料的保護,因此資安技術的導入及專業人員的配置,絕對不能輕忽。

巨量資料對城市公共衛生及治安的幫助

目前已有許多歐美城市開始藉由蒐集及分析大量資料、預知可能出現的危機,進而作為城市安防的參考。如紐約的康乃爾大學威爾醫學院(Weill Cornell Medical College)計算與系統生物醫學助理教授Christopher E. Mason的研究團隊,花了18個月的時間在紐約400多個地鐵站的車廂、樓梯扶手、座椅、燈桿、垃圾桶等地方蒐集樣本,總共發現15,152種微生物,其中來自於人類的DNA只佔0.2%,將近一半的樣本是人類未知的有機生物,27%是活性且具有抗生素抗藥性的細菌,所幸其中僅有12%會讓人生病。

這項名為PhthoMap的研究計畫,還透過華爾街日報網站提供互動地圖,讓使用者可以用來觀看特定車站的研究成果,如收集的樣本來源、微生物來源比例、細菌種類與說明等,也可利用搜尋細菌的種類,了解那些車站有這些細菌的存在,等於也展示了公衛資料開放使用的過程。

有趣的是,在研究過程中也發現在某些地鐵站找到的DNA,與其周圍的人口狀況相符合,這些都是過去從來沒有想過的資訊,未來若能將以分門別類,並且深入研究,對於城市公共衛生的防護工作,將會有莫大的助益。

洛杉磯警局則是導入預測性警務軟體「PredPol」,用來預測可能發生犯罪情況的地點。據PredPol(名稱取自「預測監控」Predictive Policing)團隊指出,該公司先是蒐集過去10年的公開犯罪統計資料,以及從大量的新聞中蒐集犯罪的發生狀況及時間,可預測的犯罪行為除了自殺外,還包括槍殺、闖空門、竊盜、竊車等,再根據前述資料中的犯罪行為模式,開發出獨特的運算系統,再將犯罪機率高甚至下一次可能發生犯罪情況的區域,於地圖上標示出一塊塊500平方英尺的區域,供警察參考,就是典型的將傳統資料變成巨量資料加以運用的範例。

事實上,許多城市的治安單位早已擁有累積數十年的犯罪記錄資料檔,甚至早己針對犯罪可能性較高的區域或場所加強巡邏。但PredPol利用巨量資料分析技術,從容易滋養犯罪事件的場所(如曾經發生鬥毆事件的酒吧)、多次受害地區(如屢遭竊賊闖空門的社區)及受害地區的鄰近地區,計算出10至20個最有可能發生犯罪的地點。PredPol宣稱,警察只要在地圖標明的區域,只需要花過去巡邏時間的5%至15%,就能夠阻止更多犯罪活動。

目前全美共有將近60間警局使用Predpol,其中規模最大的是洛杉磯警局和亞特蘭大警局。其中加州Santa Cruz闖空門的竊盜案在系統建置第一年就下降了11%、搶劫案更減少了27%。洛杉磯Foothill區在2011年導入PredPol後,4個月後的犯罪率就降低了13%,反觀沒有導入PredPol的區域,還微幅增加了0.4%。

在2012年一項針對美國近200所警局的研究指出,有70%的警局計畫在未來2至5年開始或增加使用類似PredPol的預測性警務技術,包括IBM、Palantir及Motorola也開始涉足相關領域。

雖然將巨量資料分析技術應用在犯罪治安方面,還不是百分之百的準確,經驗豐富的警察可能也不見得需要預測性警務技術,但對於新進的警務人員而言,預測性警務技術可以幫助他們及早進入狀況,尤其在城市預算吃緊之際,人力又相對缺乏的情況下,運用巨量資料顯然可以提升城市安防的工作效率。

更多資料關聯產生更多的價值

城市安防建設至今,影像監控的重要性也日漸提升,但龐大的影像資料要如何分析,卻也成為城市治理者的一大難題。所幸巨量資料技術,正可以針對影像這種非結構性資料加以分析,讓視訊監控資料得以有效利用。

巨量資料可說是智慧城市運作的基礎,除了城市安防,其他如智慧交通、智慧醫療等應用,也都需要以巨量資料為基礎,而這些不同類型的資料產生更多的關聯,自然也需要更深入的資料分析能力,如智慧交通與智慧安防相結合,可以指引警消人員在最短的時間內趕到事故現場,更可看出巨量資料在城市安防的應用潛力。