阿里雲堅定支援大模型開源的原因、思路和邏輯。
近日,阿里雲為通益千問召開新聞發布會,開源了同益千問720億引數模型QWEN-72B。 此外,通益千文還開源了18億引數模型QWEN-18b 和音訊模型 qwen-audio。 截至目前,同益千問已經開源了18億、70億、140億、720億引數的四大語言模型,以及視覺理解和音訊理解的多模態大模型,實現了“全尺寸、全模態”的開源。
阿里雲CTO周靜仁表示,開源生態對於推動中國大模型的技術進步和應用至關重要,通益千文將持續投入開源,希望成為“AI時代最開放的大模型”,與合作夥伴一起推動大模型生態的建設。
開源並不是乙個新話題,開源和閉源之間的爭論在科技界已經存在了很多年。 例如,PC和伺服器作業系統有開源的Linux和閉源的Windows,移動作業系統也有開源的Android和閉源的iOS。 如今,最熱門的大型模型也不例外。
在國外,開源大模型 Meta 的 LLAMA2 已成為閉源大模型 OpenAI 的 GPT-4 的有力競爭對手。 在中國,智付AI、百川智慧型等創業公司紛紛開發開源模式,如今隨著阿里雲模式積極擁抱開源路線,成為唯一選擇開源路線的各大廠商,將走上與騰訊雲、智慧型雲不同的發展道路。
對於大型模型的開源和閉源,兩條路線都有自己的支持者。
開源愛好者認為,與以往的開源軟體不同,開源可以加速大模型的迭代公升級,為使用者提供一整套技術服務,簡化使用者模型訓練和部署的過程,使用者只需微調即可快速構建高質量的模型。 而且,開源還可以帶動一大批開發者共同實現生態繁榮。
閉源支持者認為,閉源的優勢在於,大型模型產品來自強大的研發團隊,產品相對更加成熟穩定,使用者體驗會更好。
這兩條路線存在爭議,各有各的原因。 牛路透認為,大模型的各種未知數和不確定性,已經推導出了開源和閉源兩種模型,兩者哪個優劣,現在下結論還為時過早,但不應該是對立的,它們都是新事物在發展初期所需要的不同探索和嘗試, 而這兩條路線將像Linux、Windows、Android、iOS一樣長期存在,相輔相成、相輔相成、相輔相成,共同使大模式盡快找到成熟的商業模式,成為“水、電、煤”等不可或缺的新基建。
至於阿里雲大模型的開源,在牛路透看來,今年動作頻繁、受到外界廣泛關注的阿里雲,難免會選擇大模型的開源路線。 接下來,我們來分析一下阿里雲堅決支援大模型開源的原因、思路和邏輯。
首先,阿里雲大模型的開源直接關係到他們的“開放”戰略。 在最近的雲棲大會上,阿里最強調的關鍵詞是“開放”。 據阿里巴巴集團董事局主席蔡崇信介紹,如今,隨著大型模型技術的快速發展,智慧型化時代正在開啟。 阿里雲正在針對AI時代進行全面的技術公升級和創新,打造“AI時代最開放的雲”。 ”
在2023世界網際網絡大會烏鎮峰會上,阿里巴巴集團CEO吳永明提出了阿里巴巴的最新定位:在AI時代,阿里巴巴將成為服務全社會的AI創新開放的“技術平台企業”。 在這個新的定位下,阿里巴巴將堅持做兩件事,“一是提供穩定高效的AI基礎服務體系,二是打造開放繁榮的AI生態。 ”
從阿里高層的這些話中可以明顯感受到,在阿里看來,“沒有開放”就是“沒有生態”,只有完全開放才能構建出最活躍的生態,在大模型時代也是如此——開源是開放的重要前提和關鍵步驟,只有開源大模型才能降低大模型的使用門檻, 並能啟用國內大模型產業,從而帶動阿里雲影響力的不斷提公升。
事實上,阿里雲有著悠久的技術開放傳統,包括雲原生、資料庫、作業系統、搜尋引擎、基礎軟體和工具在內的一系列產品都已開源。 此外,去年,阿里雲在飛天大會上推出了AI開源社群“Magic Ride”,證明他們早就為各種AI產品和大模型的開源做好了準備。
其次,大模型的開源直接關係到阿里雲豐富的雲服務經驗和充足的計算資源。 早在2024年,阿里雲就開始了大模型的研發,目前已形成基礎設施即服務(IaaS)、平台即服務(PaaS)、模型即服務(MaaS)三層架構。
眾所周知,大模型的構建絕非易事,涵蓋算力、演算法、網路、大資料、機器習學習等多個領域,而大模型的訓練是一項系統工程,包括算力基礎、儲存、AI框架、AI模型等複雜技術。
小路透此前在與業內人士交流大模型話題時,曾有過乙個感覺,為什麼國內很多企業不適合走開源大模型路線?乙個重要原因是,無論是雲服務商還是大模型服務商,都受到大模型開發所需的計算資源的限制,因為大模型的開源需要經過訓練和推理,在這個過程中會消耗大量的算力,開發成本非常高, 所以並不是所有的企業都有這樣的能力。
換句話說,只有在強大的雲計算系統和超大規模基礎設施的支援下,通過AI與雲計算的深度融合,才能開發出高質量的大模型。 雲服務是阿里雲的基礎,底層資源和算力儲備無需贅述,選擇“讓算力更普惠,AI更普及”的開源路線是理所當然的。
第三,大模型的開源也與阿里雲的效能壓力有關。 近兩年來,阿里雲增速放緩,阿里巴巴上個月發布的最新財報顯示,其營收增速僅為2%。 從阿里雲公布的訊息來看,雖然選擇不再分拆上市來體現雲業務的價值,但阿里雲的發展戰略將聚焦在“AI驅動、公有雲優先”兩大方向上。 可想而知,在這樣的策略下,阿里雲的短期表現將持續低迷。
然而,在“AI驅動”的理念下,阿里雲考慮的不是規模和增長,而是如何更好地把握AI帶來的前所未有的新機遇,這就要求阿里雲首先重構自己的產品。技術與服務架構,打造AI明星專案,帶來新市場,增強生態吸附力,從而聚集更多的企業和開發者,擁有大模型模型的主導地位,以更加開放的姿態和豐富的生態建立新的競爭力,讓AI技術及相關生態建設能力成為新的競爭標準,從而體現阿里雲在這一領域的影響力, 還可以改變雲服務的傳統規則。
此外,阿里雲的開源大模型也將對其潛在的大模型競爭對手,尤其是非阿里巴巴大模型初創公司產生衝擊,並進一步鞏固阿里雲的主導地位。
在這一點上,阿里雲開源模式的邏輯非常清晰——作為一家“技術平台企業”,阿里巴巴希望為各行各業提供基礎設施服務和各種數位化服務。開源路線提供一整套服務,從雲服務的底層資源,到豐富的應用場景,再到開放的AI生態,從而形成新的商業模式,加速效能增長飛輪的旋轉。雖然理想很好,但阿里雲真的能在大模型開發中佔據上風嗎?這些競爭對手會拿出什麼樣的策略來與他們競爭?