1、隨著企業資料基礎的提公升,大資料分析帶來的價值將進一步提公升
近年來,隨著各國和地區大資料產業政策的鼓勵和數字經濟的深入發展,全球大資料市場呈現出快速發展態勢,數字技術已經滲透到各行各業,從超市、物流快遞等基於地理資訊的數字追蹤等數位化支付方式, 到智慧型製造企業中基於數字孿生技術的零部件設計、生產和裝配,任何企業都會在生產經營過程中產生、加工、分析和輔助決策。
近年來,Hadoop、MPP等大資料處理技術發展迅速,湧現出一大批以大資料平台和軟體產品為核心的大資料企業,但主要解決底層儲存或計算問題。
未來,隨著下游行業資料基礎設施的進一步完善和企業管理者數位化意識的不斷提高,將為大資料分析提供良好的資料基礎,大資料分析帶來的商業價值將進一步凸顯。
2、決策指導分析、可解釋機器習、多模態資料融合將成為行業技術演進方向
在當前的大資料分析市場中,描述性、診斷性、一流分析的應用較多,決策指導分析應用等深度分析的應用較少,在與人類生命、財產、發展、安全等密切相關的領域尚不發達。 未來,隨著大資料分析技術應用領域的拓展、技術的提公升、資料共享開放機制的完善、產業生態的成熟,具有更大潛在價值的決策指導的應用將是發展的重點。 為了實現決策指導,有必要在分析中包含有關業務物件的盡可能全面的資訊。 來自同一物件不同維度的資訊通常包含在不同模態的資料中(例如文字、音訊、影象、**等)。
這些互補資訊的整合是進一步提高模型分析能力、實現決策指導應用的重要途徑之一。 多模態資料融合對不同模態資料中包含的資訊進行提取、編碼和整合,實現異構資訊的互補性,從而提高演算法模型的效果。 多模態資料融合將成為未來大資料分析和挖掘應用的重要發展方向。
決策指導分析模型在國民經濟各個重要領域的應用,需要評估演算法模型的決策對實際業務的影響,可解釋性將成為大資料演算法模型的重要需求。 演算法模型的可解釋性是指演算法模型的內部工作原理和輸出結果的具體原因,可以用人類可以理解的方式進行解釋或呈現。
目前,廣泛使用的機器習和深度學習習演算法(如各種神經網路演算法)中有很大一部分是“黑盒”演算法,其內部機制無法直接用人類語言邏輯來描述。 在大多數複雜的應用場景中,可解釋演算法的效果與這種“黑盒”演算法的效果有些不同。 如何通過技術手段使“黑盒”演算法模型具備必要的可解釋性,如何開發出與目前廣泛使用的“黑盒”演算法模型具有同等效果的可解釋演算法模型,將是未來大資料分析與挖掘的重點研究領域之一。