智慧應用 影音

投入數據分析 慎防陷於迷思與誤區

2017/03/08 - 魏淑芳

毋庸置疑,儘管幾個年頭過去,「Big Data」熱度依舊不減,稱得上是當今企業不容輕忽的顯學。究其主因,乃在於這門經常翻譯為「巨量資料」或「大數據」的課題,委實創造了許多讓人動容的傳奇故事,包括老生常談的Target預測女性消費者懷孕、Walmart發現啤酒與尿布的銷售量呈現高度正相關,以及Netflix藉由大數據分析觀眾收視習慣,決定紙牌屋劇情走向,進而創造收視熱潮。

影響所及,舉凡精準行銷、精準醫療、智慧製造、智慧交通、智慧家庭、智慧建築、智慧社區、智慧城市等偉大題材,都拜Big Data畫龍點睛所賜,因而漫天飛舞。

撇開前述若干流於高遠的意境不談,不可否認,無論Target、Walmart或Netflix所挖掘的任何一項發現,似乎都足以讓一家原本平庸的企業,頓時間挖到滿坑滿谷的金礦,因而扶搖直上躍居市場贏家;而這個巨大的期望,正是驅使各行各業對大數據分析絡繹於途的主因。

當心!大數據存在諸多陷阱

只不過,大數據是一門超乎大家想像的艱深學問,因為它裡頭埋藏了太多陷阱,絕對不是僅憑著隨機分組的簡單實驗,便可捕捉到不同變數之間的真正因果關係,若未經過驗證與確認,就冒然把一些看似驚喜的發現,當做重大商業決策的參考依據,可能無法導致成功。

曾有專家指出,儘管懷孕、啤酒與尿布、紙牌屋等故事太過引人入勝,但絕不能只憑這些表象來妄下斷語,主要是因為,如果純粹只看兩件風馬牛不相干的變數,例如美國雞蛋銷售量與道路交通意外事故,冰淇淋銷售量與溺斃人數,甚至是IE瀏覽器與美國謀殺案件的發生率,彼此間都存在著出人意表的高度正相關,難道大家就可以冒然做出某某商品只要銷路暢旺,就可能為社會帶來不幸的詮釋?當然不是!

換言之,企業在衷心期盼可藉由Big Data無限改善決策品質之際,不妨先收拾起雀躍心情,先退後一步,想想自己有沒有掉入陷阱。

首先,大家解讀Big Data,往往把Volume(容量)、Variety(速度)、Veracity(多樣性)、Veracity(真實性)、Value(價值)等幾個V掛在嘴邊,基於華人從左到右的閱讀習性,不自覺地把Volume當成箇中第一要項,所以台灣翻譯為巨量資料、對岸翻譯為大數據,便是落入這個迷思,彷彿要想挖掘Insight,一定得從「巨量」或「大」的數據洪流裡面鑽,殊不知不管自己想要做的題目為何,不問三七二十一硬把滿堆資料納入分析,很容易導致雜訊太多,影響數據的真實性品質,最終產生的結果,參考價值恐怕有待商榷。

對岸講的「大」數據,或許還可解讀成為重大之意,並非絕對偏頗,反觀台灣講的「巨量」資料,便很難擺脫數大便是美的迷思。總之,要做好Big Data分析,不妨先拋開數量,如果真有價值,甚至經由Nano Data或小數據而來也無妨,因為重點是要設法端倪出數據核心,意即挖出從前看不見的細微徵兆,才不枉做數據分析的初衷。

當然,前面提到的Nano Data或小數據,倒未必是只取小量樣本,而是必須根據想要分析的題目,從滿堆數據中抓出重要的相關屬性來加以分析,避免在一開始就製造太多垃圾;最明顯的例子,Target如果只想分析出懷孕的消費者,絕不會把男性顧客、及小於18歲或高於45歲的女性顧客等無用的累贅樣本,都納入分析。

至於其他重要風險,還包括了要避免犯下樣本偏差的錯誤,以及莫要輕信沒有理論基礎的分析結果。有關Online Ranking,在多數情況下,僅反應出對某項議題極端贊同、或極端反對的看法,如果依此偏頗結論,驟然解讀為整個社會大眾的意向,難免有所偏差。

針對理論基礎部份,有一個曾被專家表述的傳神之例,在2009年以前,Google的流感預測趨勢(GFT)被喻為佳話,其宣稱可從人們在搜尋引擎上留下的訊息,對流感進行即時預報,只因唯有罹患流感的人,才會急忙搜尋相關訊息,聽來乍有道理,詎料GFT不知不覺已犯了大數據的傲慢,自認為只靠大數據,即使未有扎實理論基礎支撐,仍足以戰勝嚴謹科學實驗,無奈從2009年後開始顯露破綻,預測準確度急轉直下,最終GFT黯然失敗收場,此例相當發人深省。

態度與高度  決定專案成敗

即便避開了前述陷阱,但態度與高度決定一切,企業投入數據分析的態度與高度不對,可能造成後續成果遠遠不如預期,淪於失敗收場。

一個出身於北歐的平價時尚品牌,就是典型的失敗之例。該公司曾興致勃勃想要推動大數據應用,力求及時掌握各個區域市場的顧客意見,作為驅動生產與經營決策改良的依據。

然而與此同時,其並未同步改善總部與亞洲、中南美洲等生產基地之間的訊息溝通效率,所以縱然數據分析系統產出多麼擲地有聲的好結論,也無法快速有效傳達到產地,彷彿大數據的視角是孤立的、靜止的,不過是徒然產出一堆數據洞察結果而已,其餘管理機制卻依然故我,也不檢討主導大數據專案的經理人層級位階,其實是不足的。

後續就不難想像,這家知名服飾商悻悻然稱大數據實在言過其實,白走了這一遭,事實上癥結在於這一遭走得並不踏實、也不正確。

同樣是平價時尚品牌,ZARA則被喻為大數據應用的經典案例,只因其將數據的蒐集、分析等事項做得十分到位,包括透過偏佈全球的企業網絡,把每一件售出商品的價格、部門、時段、客戶等資料,全都記錄得詳實清楚,接著借助自動化程式分析系統,抓出顧客的消費偏好,並以此作為經營決策的關鍵參考依據,甚至預知未來市場流行基因,而非繼續迷信高層主管的主觀判斷。

在此前提下,ZARA得以精確地抓準消費者的胃口,並憑藉快速反應的作風,制定對應的生產銷售策略,成功席捲時尚服飾業界。對比ZARA與另一家同業的大數據應用歷程,儘管成果南轅北轍,但不管成或敗,都值得台灣企業借鏡學習。

至於最糟的一種情況,便是企業只想跟流行,讓自己沒有在大數據風潮中缺席,卻連自身想靠它解決什麼問題、創造哪些新穎商業模式,都渾然不知,彷彿是沒有靈魂、沒有目標地在推動相關計畫專案,自然無法創造出任何令人欣慰的成果。


圖說:ZARA的數據分析應用之路,走得平穩扎實,並確實反應於經營決策制定,因而成功席捲時尚服飾業界,被喻為Big Data的典範案例。