作者 Hoshina
編輯:方琦
** AI大模型工作坊
如果有無限多的猴子,而且它們有無窮無盡的時間,這些猴子就有可能扮演完整的哈姆雷特。
想象一下,如果我們把這些打字的猴子比作乙個能夠生成隨機字元的程式,把哈姆雷特比作按照某種模式排列的一系列字元,那麼無限猴子的原理就會和今天的大型GPT模型非常相似。
出門問問自主研發的大模型“序列猴”就是在這裡命名的。 我們只需要給機器提供大量的文字序列,然後用強大的算力訓練它們,最後就可以得到乙個智慧型的“序列猴子”大模型。
今年4月誕生的“序列猴”,在成長8個月後,正在成為出門問問的王牌產品,而此時,出門問問正憑藉“序列猴”向港股“AIGC”第一股衝刺。
12月21日,中國證監會國際部披露出門問問境外發行上市備案通知。 出門問問已完成港股上市備案,或即將進行上市聽證會,此外,出門問問將計畫發行不超過2枚2063億股普通股。
雖然大模型在過去一年裡火爆,但香港聯交所仍然沒有AIGC概念公司。 如果這次成功上市,意味著出門問問將成為港股“AIGC第一股”。
經過近一年的野蠻成長,基礎模型的競爭已經落下帷幕,應用的序幕才剛剛開始。 在大模型帶來的變化中,出門問問在眾多大型模型公司中占有優勢能否成功上市?面臨哪些挑戰?以及如何建造自己的護城河?
早在今年5月30日,出門問問就向港交所提交了首次申請,試圖中金公司、招銀國際作為聯席保薦人,試圖打入“AIGC第一股”,該股份於11月底到期,次日更新招股書。
而這一次,出門問問的上市之路注定是艱難的。
出門問問成立於2024年,由李志飛牽頭。 李志飛擁有約翰霍普金斯大學電腦科學博士學位,曾就職於矽谷研究院,從事語音識別、自然語言處理、機器翻譯等領域核心演算法的研發工作。
公司以生成式AI和語音互動技術為核心業務,是國內為數不多的具備通用大模型構建能力的AI公司之一,也是亞洲首家開發和商業化生成式AI大模型的公司。
招股書顯示,出門問問從2024年到2024年共進行了7輪融資,總融資超過2輪3億美元,投資方包括紅杉資本、海納亞洲創投**、鄭**、谷歌、大眾汽車集團等知名企業和投資機構。
該公司的估值也從 A 輪融資的 510 萬美元飆公升至 D2 輪融資的 7.2 美元57億美元,估值飆公升了140多倍。
在資本的強勢推動下,出門問問的業績發展迅速。 從財務角度來看,從2024年到2024年,出門問問的營收為265億元,398億元和5億元,對應調整後淨利潤-157億元, -073億元,19億元。
不過,2024年上半年,出門問問的營收和利潤雙雙下滑。 根據最新的招股書,出門問問上半年營收為262億元,調整後利潤6509萬元,與去年同期相比,兩項指標分別有所下降。 3%。
造成這種情況的原因主要是由於智慧型裝置和硬體業務以及汽車業務收入下降的影響。
目前,出門問問的業務可以分為AIoT解決方案和AI軟體解決方案兩大模組。
出門問問將TicWatch系列智慧型手錶、智慧型跑步機、智慧型家居等產品納入AIoT智慧型裝置業務。 2024年之前,它是出門問問的核心業務,2024年和2024年分別貢獻了83%和85%的營收,而2024年,AIoT解決方案占營收的佔比大幅下降至39%4%。
AI軟體解決方案包括面向內容創作者的AIGC解決方案和面向企業的AI軟體解決方案。
具體而言,AIGC面向內容創作者的產品包括AI配音助手“墨音工坊”及其海外版“Dupdub”、AI寫作助手“Moshuo”、AI數字人“Wonder Yuan”。
在B端,出門問問為汽車、金融等眾多行業提供人性化、智慧型化的AI語音互動解決方案。 但實際上,該業務主要是針對汽車附屬公司A。 招股書顯示,2024年至2024年6月,公司來自客戶A的收入佔總收入。 0%。外界不少聲音猜測,這裡的大客戶A是大眾汽車。
2024年合作營收大幅增長,得益於雙方在2024年底簽署的智財權協議,即出門問問為大眾汽車提供汽車語音互動解決方案等服務,合同金額為5500萬美元。
隨著今年6月智財權協議的結束,出門問問在汽車市場長期發展的穩定性令人擔憂。
在招股書中,出門問問提到了AIGC近250次,可見公司對大模型的重要性。
李志飛可以說是國內第一批關注GPT-3的人,2024年6月,在GPT-3出現之後,出門問問開始探索中文版GPT。 他曾多次表示,“GPT-3 是暴力美學的勝利。 ”
2024年,出門問問正式發布大模型“UCLAI”,但因為難以在商業化和研發成本之間找到平衡點,停止了對大模型的投資。 直到ChatGPT誕生,AIGC成為熱門新興賽道,出門問問重啟大模型研發,並於今年4月推出大語言模型“序列猴”。
重新開始的出門問問,對於如何做大模型,如何實現商業化,似乎有了新的思路。
在大規模模型構建層面,多模態能力成為出門問問開發大型模型的重點。 李志飛表示,如果大模型最終要在各行各業產生應用,就必須通過代理或副駕駛來實現。 智慧型體的輸入和輸出依賴於多模態,沒有多模態,就沒有智慧型體。
出門問問推出的“序列猴子”不僅僅侷限於語言能力,更是具有多模態生成能力的大型語言模型。 該模型不僅具有邏輯、推理、對話等通用語言能力,還同時支援文字生成、**生成、3D內容生成、語音生成、語音識別等不同任務。
李志飛認為,未來大模特最好的“工作”就是做人類副駕駛(助理),而副駕駛將無處不在,並將廣泛應用於創作者、C端、B端。
在商業化層面,出門問問正在探索兩種新的商業模式:PC(專業消費者)、專業個人;到SMB(Small and Media Business),中小企業,即更關注創作者和小B端的商業化機會。
目前,出門問問向PC的商業化路徑已經比較清晰,盈利模式也相對成熟,採用按月付費+按量付費的混合模式。 官方資料顯示,截至2024年11月28日,出門問問旗下墨音工坊、魔筆書寫、妙袁等AIGC產品累計註冊使用者超過800萬,累計付費使用者約60萬。
在小B端,出門問問主要提供定製化的大型模型服務和個性化解決方案。 目前已與春秋航空、漣晨、中國移動、中國電信、易車APP、工商銀行、VIPKID等500多家行業客戶開展合作探索,涵蓋企業諮詢、教育培訓、海外產品介紹、口頭直播、直播等多種場景。
出門問問在大模型領域積極探索,但是否真的能跑透還有待時間的驗證。
大模型的發展前景無疑有著巨大的想象空間。
出門問問在招股書中提到,據中投諮詢顯示,預計到2024年中國AIGC市場規模將達到326億元,2022-2024年復合年增長率為1363%。
儘管大模型的經營前景仍是一片藍海,但大模型研發“燒錢”已是不爭的事實,很少有企業能真正利用大模型賺錢。
以LLAMA-13B版本為例,根據Meta**中的資料,其預訓練使用A100(80GB視訊記憶體)執行1350,000 GPU 小時。 假設有 1,000 張卡並執行 135 小時,則相當於大約 5 天半。 而這1000塊顯示卡差不多是1億元。 如果加上其他硬體伺服器、資料中心、電費、研發人員的成本,大模型預訓練的資金門檻在幾億到幾十億之間(對應幾百億到幾千億引數的模型)。
李志飛曾公開表示,“序列猴”模型的引數數量在100億左右,可想而知其燒錢的程度。 儘管李志飛曾坦言,出門問問在不久的將來不考慮融資,也不需要外部融資來支援研發投資,但深入挖掘其融資進展會發現,出門問問自2024年上一次獲得約1687萬美元投資以來,已經有4年沒有收到投資了。
根據最新的招股書,截至2024年10月31日,其現金和現金等價物僅為1598億元。 背後缺乏資本支援的出門問問能走多遠?
除了資金拮据,面對激烈的外部競爭,出門問問還要應對激烈的外部競爭。
ChatGPT出現後,一年內國內誕生了238款大機型,阿里巴巴、騰訊、科大訊飛等大廠紛紛退出市場,並於8月向公眾開放。 除了來自大廠商的壓力,出門問問還面臨著來自同型別產品的競爭。
面對這麼多棘手的問題,在衝刺港交所IPO時,如何利用現有資源築起自己的護城河,打消資本市場的疑慮?
如果說大模型前半段的競爭壁壘是算力的壁壘,但實際上是金錢的壁壘,那麼在大模型的後半段競爭中,資料和使用者可能會成為企業新的護城河。
有人說,垂直領域的資料積累是企業的護城河,資料飛輪可以拓寬這條河。 其實,大家容易獲取的資料並不是壁壘,但使用者在自己的產品中互動的資料才是壁壘,資料和自己的產品結合形成資料飛輪,是比模型和算力更可靠的壁壘。
具體到出門問問,無論是推出AI智慧型手錶、智慧型跑步機等智慧型硬體產品,還是基於“序列猴”推出的“魔幻聲音工坊”、“魔幻寫作”、“奇妙元”等AIGC產品,出門問問都在努力將使用者使用資料與產品相結合,形成獨具特色的資料飛輪,深化護城河。
未來,隨著大規模模型技術的不斷演進和應用場景的不斷拓展,資料和使用者的重要性將更加凸顯。 對於出門問問來說,如何更好地利用資料飛輪效應,並將其轉化為可持續的競爭優勢,將是贏得下半場大模型大戰的關鍵。 36氪經許可發布。