科技產業報訂閱
Advantechline
 

擁抱機器學習 資料科學家、必要基礎設施和工具缺一不可

物聯網及AI趨勢下,企業對數據的理解、分析、演算模型設計等工作將更形重要。法新社

隨著過去10年數位化和大數據的興起,企業正在實施機器學習策略,並僱用更多資料科學家。然而單單作用資料科學家無法讓業務流程更有效率,而需要配套基礎設施和工具軟體來處理數據。

根據富比士(Forbes)報導,追求數位化的企業目前很需要資料科學家擁有的知識和專業技能。但資料科學家仍面臨許多挑戰,資料科學家雖喜歡分析數據,但不喜歡整理雜亂數據的任務。這些任務目前消耗其日常工作的8成時間,使其沒有多少時間完成從分析數據中提取見解、對業務產生正面影響的實際工作。

許多企業認為培訓模型完全依賴於演算法和編碼技能。實際上,培訓過程是由完整的系統組成,該系統包含許多可單獨影響最終模型開發的子組件。因此,這些企業未能使用數據工具為資料科學家提供有效管理和分析數據所需的連網數據庫。

資料科學家擁有組織內部最先進的技能組合,但若無適當的基礎設施使其高效地工作,其知識就會被浪費在組織數據而不是理解數據上。現今有太多數據,就算最出色的資料科學家也難以有效管理。加上不穩定的基礎設施及缺乏工具,可能導致資料科學家因為工作負擔太重而經常離職。

為避免數據變得陳舊或無法使用,企業應儘早實施機器學習服務和工具,好以高效、及時的方式分析數據。企業應將更穩定、高效的機器學習策略方案視為可實施的服務,而不僅是可僱傭的更多技能。

招聘能管理這些任務的資料科學家對企業很重要。但更重要的是,企業須提供發揮其專業知識所需的工具和資源,而這些工具可從專注於機器學習的合適技術夥伴處取得。