**:狩獵雲選,溫王飛
在OpenAI的文生**模型SORA備受關注的當下,中國90後清華學霸創立的大型模型公司,繼續受到知名機構的追捧。
今日,Moonshot AI被曝完成新一輪超10億美元融資,投資方包括紅杉中國、小紅書、美團、阿里巴巴等,老股東緊隨其後,投後估值約25億美元。
2月3日,春節前夕,《月亮的暗面》被曝出正在籌措2億美元,由螞蟻金服和阿里巴巴集團聯合投資,投前估值15億美元。
針對“最新一輪融資”,文志典對 Lieyun.com 表示,“謝謝大家的關注! 公司暫不便對具體融資資訊發表評論。 月亮的暗面在過去和未來一直堅持推動中國AGI領域底層的關鍵技術進步和產品創新,並將繼續匹配公司發展階段對應的資本戰略,期待未來與大家分享更多好訊息。 ”
事實上,成立於 2023 年 4 月的月球黑暗面在融資披露方面“幾乎沒有明確的說法”。 針對成立僅兩個月就完成的首輪融資,創始人楊志林在2023年10月“更正”稱,公司已獲得紅杉資本、今日資本、麗絲資本等知名機構近20億元投資。
而這也是自近一年前月球暗面成立以來唯一一次準確的融資披露。
月亮的暗面之所以能夠在成立之初就拿到頭VC的賭注,與90後楊志林的“學者”身份和豐富的閱歷有很大關係。
在清華大學學習期間,楊教授師從清華大學電腦科學系知識工程實驗室(KEG)主任、智源教育學院學術副院長、啟蒙工程負責人唐杰教授。 最終,他以滿分的成績通過了所有程式設計課程,並以全年級第一名的成績畢業。
然後,在 2015 年,Yang 加入了卡內基梅隆大學 (CMU) 的語言技術研究所 (LTI),在那裡他師從蘋果人工智慧主管 Ruslan Salakhutdinov 和谷歌人工智慧首席科學家 William W.科恩正在攻讀博士學位。
畢業後,曾在谷歌腦研究所和Meta(Facebook)人工智慧研究所工作,是Transformer-XL和XLNet的第一作者。 其中,XLNet模型在18個自然語言任務中取得了優於Google BERT的成績,是當時NLP領域最流行的國際前沿模型之一。
據不完全統計,楊志林在ICLR、NEURIPS、ICML、ACL、EMNLP等計算機峰會上發表文章20餘篇,研究成果累計被Google Shcolar引用超過17000次。
目前,楊先生還是清華大學交叉資訊科學研究院的助理教授,研究方向為大規模預訓練、自然語言處理、自然語言理解與生成、小樣本學習、零樣本學習和多模態學習。
楊志林,90後出生,在大型模型領域有名氣:迴圈智慧型、智普AI、致遠研究院......他的名字和身影無處不在。
同時,楊志林團隊還作為核心研發成員參與了Google Bard、Gemini、Einstein、Pangu、五道等大型模型的研發,發明了Transformer XL、XLNet、Rope、Detectron2、Group Normalization等AI領域的里程碑式成果,已被Google Palm、LLAMA等模型採用。
天眼查APP資訊顯示,月亮的暗面是楊志林擁有的7897% 具有絕對控制。 他身邊的創業夥伴也都不平凡,不容小覷。
月亮黑暗面的聯合創始人周新宇擁有該公司10%的股份,他與楊志林和張玉濤一起是清華大學電腦科學與技術系2011年的本科生。 大四那年,周新宇加入了各方面都符合自己標準的曠視實習,畢業後正式加入,工作內容是演算法的量產,就是將演算法的生產效率提高很多倍。
作為賭注 5第三大股東吳宇欣96%的股份,月暗面聯合創始人,畢業於清華大學和卡內基梅隆大學,並在2018年歐洲計算機視覺大會(ECCV)上被提名為最佳中的佼佼者。 2018 年 10 月,Iyswim 是 GeekPWN 國際安全極客大賽六支隊伍中唯一破解面部識別演算法的隊伍。 吳宇欣當時以iyswim隊的身份參加比賽,據他介紹,“我(以自己的名義報名參加比賽,隊友沒有到場)使用谷歌的Facenet開源**模型破解了演算法。
此外,楊志林的同胞兄弟張玉濤目前持有公司5%的股份。 據公開資料顯示,張玉濤曾就讀於清華大學計算機系。 研究方向為異構資料融合與知識圖譜構建,在KDD、CIKM等頂級計算機會議上發表多篇文章。 作為技術負責人,他參與了技術大資料分析平台aminer的開發。
豪華的團隊陣容和深厚的積澱,月暗面成立不到半年,2023年10月宣布在“長文”領域取得突破。
據楊志林介紹,針對“大模型輸入長度有限導致的應用難”,月亮暗面正式推出首款支援20萬漢字輸入的大模型Moonshot,以及搭載該模型的智慧型助手產品Kimi Chat。
隨後,他詳細介紹了Kimi Chat的一些實際用例。 以整本書《月亮與六便士》為例,Kimi Chat可以和使用者一起閱讀,幫助他們更好地理解和應用書中的知識:
與目前市面上基於英語培訓的大模型服務相比,Kimi Chat具有很強的多語言能力。 例如,Kimi Chat在中文方面具有顯著優勢,實際使用效果可以支援約20萬個漢字的上下文,2是 Anthropic 的 Claude-100K(測量值約為 80,000 字)的 5 倍,是 OpenAI 的 GPT-4-32K(測量值約為 2.)的 8 倍。50,000字)。
同時,通過創新的網路結構和工程優化,Kimi Chat實現了千億引數下的無損遠端注意力機制,不依賴滑動視窗、下取樣、小模型等效能損失較大的“快捷方式”解決方案。
今年1月26日,Kimi Chat發布了最新的“V13春節版“:全面公升級基礎模型能力,......了用友的線上搜尋能力、語境學習能力、文學創作能力、語言翻譯能力Kimi智慧型助手的小程式版本已經支援中英文語音輸入。
需要的是,近日,OpenAI的文生**模型SORA以其突破性的一分鐘時長,加上演示的高真實感和高質量,持續備受關注。
據多方透露,月球暗面也在暗中開發通用多模態模型,預計今年內推出。
換言之,在基於文字的大語言模型領域取得階段性進展的“月亮暗面”,未來也將在基於影象和**的多模態模型領域與OpenAI等國內外同行展開競爭。
資本市場“月亮暗面”的“頻頻行動”,似乎正在為更高的培訓成本、更大的資金和人才需求做更充分的準備。
以團隊規模為例,2023年10月月亮暗面有50人左右,公司團隊有80多人。
未來,我們將繼續關注月球的暗面能否在“多模態模型”領域占有一席之地。