不少業內人士注意到,在新近公布的十四五規劃中,數據一詞出現60余次,并由此研判,數據已成為國民經濟和社會發展的重要風向標。
數據將如何部署到實際應用中并產生價值?長期從事數據分析領域研究的Gartner研究總監孫鑫向記者預測了未來幾年數據在中國市場的應用趨勢并指出,后疫情時代大數據應用中的小數據值得關注。
從十三五開始,就提到要把數據作為生產要素來進行延伸和開發,孫鑫指出,在后疫情時代的十四五期間,以數據為代表的新技術將在產業應用中迎來加速變革,并通過規劃部署真正有效利用起來。
一項針對企業高管的最新行業調查顯示,高達82%的受訪CEO認為,毋庸置疑將追加在數字化舉措上的投資。因為疫情的到來,越來越多的業務不得不搬到線上。
據Gartner最新發布的《2021年數據和分析十大趨勢》,更智能、更負責、可拓展的人工智能(AI),組裝式數據和分析,數據編織,從大數據到小而寬的數據,決策智能工程化,圖形聯通萬物,邊緣數據和分析等將成為未來幾年數據和分析領域的全球行業熱點趨勢。
孫鑫特別指出,在備受關注的人工智能(AI)領域中,隨著企業逐漸認識到大數據作為分析和人工智能關鍵推動者的局限性,被稱為小數據和寬數據的方法正在慢慢涌現。
小數據的方法是指應用相對較少的數據,但仍能提供有見解的分析技術。其中包括有針對性的使用數據要求比較低的模型,比如一些時間序列分析的技術,而不是用一刀切的方式去使用數據要求較高的深度學習的技術,孫鑫指出,小數據的方法拋開了對于大型單體數據的依賴,實現了對于小型、大型、結構化、非結構化的數據源的分析和協同。
據Gartner《2021年數據和分析十大趨勢》預測,到2025年,70%的企業將把關注點從原先的大數據轉向現在的小數據或是寬數據,從而為數據分析提供更多背景;人工智能對數據的需求將進一步減少,超過85%的技術供應商將在人工智能解決方案當中加入讓數據變得更豐富的方法和模型訓練技術,以提高模型的彈性和敏捷性,而在2020年,這樣做的供應商只有不到5%。
孫鑫認為,疫情是小數據變得更為流行的重要因素之一。去年的疫情讓之前的很多數據都過時了,我們需要通過更少的數據去建立AI和分析的技術,并收集足夠多的歷史數據和標簽數據用于分析和AI,這將是很多企業面臨的挑戰。
此外,未來數據的來源、質量以及數據偏見和隱私保護都會被提上議程并成為重要挑戰,傳統的大數據解決問題的成本將被推高,也將推動企業考慮,如何利用小數據去完成更深度、更實用的分析。