12 月 6 日,谷歌突然宣布推出“最大、最強、最通用”的原生多模態大模型 Gemini10,挑戰 GPT-4,GPT-4 是競爭對手 Open AI 的大型模型,據稱在一系列智力測試中表現優於 GPT-4 模型和人類專家。
我們越來越接近新一代人工智慧模型的願景。 經過一系列演示後,谷歌Deepmind產品副總裁Eli Collins告訴第一財經,這是谷歌迄今為止功能最強大、用途最廣泛的模型。
1.雙子座多模態功能或 hyper-GPT-4,有望進一步拓展應用場景
作為多模態模型,Gemini 可以同時識別和理解文字、影象、音訊和五種資訊,對資訊的理解非常準確。 Gemini 有三個版本:Gemini Ultra 用於高度複雜的任務,Gemini Pro(用於各種任務的最佳型號)和 Gemini Nano 用於裝置端裝置。 Gemini Ultra 是第乙個在 MMLU 任務中表現優於人類專家的大型模型,達到 9004% 的結果。 相比之下,人類專家得分為 89 分GPT-8 為 86% 和 4%4%。從評估資料來看,geminiGPT-4V在多模態任務中效能全面超越,或進一步拓展多模態大模型的應用場景。 此前,OpenAI 在 11 月發布了 GPT-4 Turbo,並開放了 GPTS,隨後谷歌發布了 GEMINI,海外科技巨頭在多模態大模型方面的競爭日趨激烈,同時帶動底層多模態大模型能力不斷突破,疊加 GPTS 等 AI 應用形態,AI 應用有望迎來快速增長期。
2. 多模態人工智慧產業發展前景
在人工智慧技術不斷突破的背景下,多模態模型的應用和發展呈現出前所未有的勢頭。 隨著越來越多的公司和機構投身於這一領域,我們可以期待看到更多創新和突破性的成果。 同時,多模態模型的應用也將對企業和消費者產生廣泛而深遠的影響,推動人工智慧技術的進一步發展。 隨著海外科技巨頭在多模態大模型領域競爭的加劇,底層多模態大模型的能力也在不斷提公升,垂直應用領域蓬勃發展,AI應用有望迎來快速爆發。
資料顯示,全球人工智慧(AI)市場規模預計為1197家預計到 2030 年將達到 8 億美元,達到 15,971 億美元,復合年增長率為 38 美元1%。北美人工智慧市場價值為14758億美元。
2022 年的北美年獲得最大市場份額。各個最終用途垂直領域對自動化和技術先進的硬體和軟體產品的更高需求以及鼓勵北美行業採用人工智慧的有利政策極大地促進了人工智慧市場的增長。 2024年,美國**發起了一項美國倡議,以推動美國成為人工智慧技術的領導者。 該計畫通過為人工智慧技術在各個行業和領域的實際應用提供指導,重點關注基於人工智慧的系統的採用。 北美是Facebook、亞馬遜、谷歌、IBM、Microsoft、蘋果等領先科技巨頭的發源地,這些巨頭為北美AI市場的增長做出了重大貢獻。
預計亞太地區將成為增長最快的人工智慧市場。各種組織對採用人工智慧的投資不斷增加,推動了對人工智慧技術的需求。 總部位於中國的科技巨頭已與投資者達成協議,剝離提供消費信貸、財富管理和其他商業相關服務的金融服務集團。 此外,人工智慧在汽車、醫療保健、零售、食品和飲料等各個行業的日益普及正在推動亞太地區人工智慧市場的增長。
3.AI市場格局:多模態是主要方向
在OpenAI宣布Chat GPT將實現組網與支援**、語音通訊、文字轉換等多模態更新後,國內外各大廠商持續部署跨文字、圖片、音訊**的AI模型,行業應用也在不斷公升級。
目前,國內外廠商仍專注於多模態大模型,開發與GPT-4競爭的產品。 人工智慧初創公司 Anthropic 開發了一款基準 AI 聊天機械人 Claude。 谷歌正在投資Anthropic,並且還在開發自己的語言模型Palm2和聊天機械人Bard。 谷歌擁有多個跨模態AI模型,提供了多個功能服務模組。
Meta 另闢蹊徑,開源了自己的大模型 Llama,後來越來越多的公司開源了自己的大模型,包括 Vicuna、Wizardlm、Guanaco 等模型Microsoft 的 KOSMOS-1 模型擁有 16 億個引數,解鎖了多模態功能。 海外大模型加速迭代,多模態為主攻方向:國產大模型百花齊放,版本和效能不斷迭代。
隨著國外AI大模型的激烈競爭,國內許多網際網絡公司和科技公司也開始自主研發大模型,如阿里巴巴、科大訊飛、百川等,與國外相比,國產大模型的版本和效能更新迭代更快。 發布文心一言,持續迭代;騰訊混合模式迎來全新公升級,正式開通“文盛地圖”功能;盤古為客戶提供100億、380億、710億、1000億引數的一系列基礎模型,可以匹配客戶在不同場景、不同時延、不同響應速度下的多樣化需求。 國內多家廠商也在多模態產業鏈上下游布局,包括蘇州科達、內塔軟體、當紅科技、精業達、盛訊股份有限公司、維易嘉禾、英賽集團、博匯科技、數字政務通訊、大華股份、雲控科技、中科創達、拓斯、新世界、恆盛電子、易clickWorld、360、嘉都科技、捷成股份有限公司、 崑崙萬維、科大訊飛、萬興科技、湯姆貓、中文**、數字政通等
四、中國的多模態人工智慧相關上市公司發展現狀
據南方財富網統計,目前A股多模態AI相關上市公司27家,2024年整體營業收入約1109家78億元,同比下降-318%。2024年,27家A股多模態人工智慧相關上市公司歸母公司整體淨利潤為27家4億元,同比減少7751%,低於 2021 年的水平。 從多模態AI行業利潤率來看,2024年平均毛利率為4872%,較2024年有所下降,平均淨利潤率為1159%,低於 2021 年。 從上市公司區域分布來看27家A股多模態AI相關上市公司分布在北京、浙江、廣東、上海、江蘇等省市,主要集中在華東地區。
5. 總結
隨著雙子座的落地,谷歌希望鞏固“強者強者”在大模型領域的優勢。 對於 OpenAI 的 GPT 和 Meta 的 Llama 來說,Gemini 在模型規模、訓練資料、優化策略等方面都表現出了領先優勢,這無疑帶來了壓力和挑戰。 與此同時,騰訊、阿里巴巴等國內廠商也在積極投入大模型的研發,在底層技術上不斷創新。 未來,越來越多的優質大模型將進入生成式AI的“深水區”,這將推動各大廠商在技術研發方面的投入和技術角力,引領行業迎來發展的良性迴圈。