2月19日,有訊息稱,AI創業公司“月之暗面”近日完成新一輪融資,融資額超10億美元(目前約合人民幣72億元),投資方均為中國龍頭企業,包括紅杉中國、小紅書、美團、阿里巴巴等。 這也是自ChatGPT爆火以來,國內AI模型公司迄今為止獲得的最大一筆單輪融資。
Moonshot AI成立於2023年3月,2023年已獲得超過2億美元(約合人民幣14億元)的融資,投資者包括紅杉中國、鄭**等。 經過本輪融資,《月球暗面》的估值已達到約25億美元(約合人民幣180億元),成為中國大型模型領域的龍頭企業之一。
如此高的估值和融資,除了得益於AI大模型熱潮外,也離不開創始團隊。
公開資料顯示,公司核心成員大部分來自清華大學,創始團隊核心成員曾參與谷歌雙子座、谷歌巴德、盤古NLP、物道等多款大型機型的研發,多項核心技術被谷歌Palm等主流產品採用, Meta Llama 和 Stable Diffusion。
公開資料顯示,共同創始核心團隊主要有5人。
第一位是主要創始人兼CEO楊志林(78歲96%),清華大學交叉資訊研究院助理教授,32歲。高中時,沒有程式設計經驗的楊志林被選中參加奧林匹克競賽,並順利拿到清華大學的錄取通知書。 由於招生限制,楊志林一開始沒有學電腦科學,直到大二才轉入電腦科學系,師從IEEE院士唐杰。 2015年,他以全年級第一名的成績畢業於清華大學電腦科學系。
後來,楊志霖進入卡內基梅隆大學電腦科學學院(美國第一所計算機學院)。 2019 年,蘋果人工智慧研究總監 Ruslan Salakhutdinov 和谷歌首席科學家 William W.科恩在他的指導下獲得了博士學位。 通常,卡內基梅隆大學的電腦科學博士生往往需要 6 年才能畢業,而他只花了 4 年時間。
在攻讀博士學位期間,2018年,楊志林還與圖靈獎得主楊樂坤合著了《Glomo: Unsupervised Learning of Transferable Relational Graphs》。
與圖靈獎得主 Yoshua Bengio 合作開發“Hotpotqa: A Dataset for Diverse, Explainable Multi-Hop Question Answering”。
2019 年,作為第一作者,他與谷歌和卡內基梅隆大學共同出版了《XLNet:語言理解的廣義自回歸預訓練》。 以及:Transformer-XL:超越固定長度上下文的細心語言模型**。
其中,Transformer-XL成為第乙個全面超越RNN的注意力語言模型,並成為Neurips 2019和ACL 2019的頂級引用之一。 XLNet 在 20 個任務中超過了 Google 的 BERT 模型。
同時入選2019年度北京致遠青年科學家。 2020年11月入選“2020富比士中國30位30歲以下精英榜單”。 2022年4月入選AI中國青年學者名單。
在美國期間,楊還曾在 Meta AI 和 Google Brain 工作,分別與 Meta AI 研究科學家 Jason Weston 和 Google Brain 創始成員 Quoc V. 合作le 一起工作。
天才總是善於突破。 楊志霖曾說:“我希望有一種更徹底、更徹底的方式,打破學術界和工業界的壁壘。 ”
早在大二(2016年)時,楊志林就開始了自己的第一筆生意,並創立了Recurrent AI。 2019年,楊志林畢業後回國,回到母校清華大學,擔任交叉資訊科學研究院助理教授。 2021年,迴圈智慧型還與華為雲合作,開發了千億級NLP模型——盤古模型,涉及NLP、CV等多個方向。
楊志霖雖然長期戴著天才的光環,但並非一帆風順。 楊志林的**Transformer-XL也一度被ICLR 2019拒絕,理由是評委們認為大語言模型的改進在實際場景中不會有更大的價值。 但楊志林一直認為,他已經看到了人工智慧的第一原理。
回到國內後,楊志林也一直在嘗試整合和重新建立一家相關的AI公司,由自己的團隊提供技術,對方提供算力等資源,但一直受到限制。 隨著ChatGPT的爆火,楊志林也看到了機會,獨自一人出海兩個月,這讓他堅信有機會成為亞洲的大型樣板企業。
它於2023年3月1日正式成立,至於為什麼公司被稱為“月亮的黑暗面”。 楊志霖本人曾透露,自己在學生時代就組建了樂隊,在他看來,搖滾樂的精神與科技創業精神相似。 該公司的成立恰逢英國搖滾樂隊 Pink Floyd**The Dark Side of the Moon 發行 50 周年。 同時,“月球的陰暗面”也意味著神秘、好奇和令人嚮往,但登上月球是一件非常困難和具有挑戰性的事情。
除了楊志林,公司的創始團隊還有兩位聯合創始人,周新宇和吳宇欣,他們也是清華大學畢業的同學。
其中,周新宇作為第二股東持有公司10%的股份。 周心宇是乙個冒險愛好者,對他來說挑戰越大,他就越興奮。 大三快結束時,我決定工作或學習,最終選擇了工作。 大四那年,周新宇加入人工智慧產品和解決方案公司曠視科技實習,畢業後正式加入,從事演算法量產工作。 他剛加入曠視後,做了很多工作,別人也以為他做了很多工作,但統一在他的邏輯體系裡,也就是為了提高生產力。
周新宇曾經說過:“我們在深度學習中所做的90%的事情可能是試錯,因為從本質上講,我們做技術是在與天空作鬥爭。 ”
在工作期間,他還與曠視研究院基礎科研負責人張翔宇合作研究移動終端模型,並合著了《SHUFFLENET:一種用於移動裝置的極其高效的卷積神經網路》,該書贏得了CVPR的競標。 後來,它還影響了各種用於手機的毫秒級人臉解鎖技術,包括蘋果的3D人臉解鎖。
吳宇欣持有5第三大股東96%的股份,與楊志林基本有著相同的人生軌跡,畢業於清華大學和卡內基梅隆大學,都曾在Google Brain(研究基礎模型)和Meta AI(計算機視覺)工作,是Meta人工智慧實驗室FAIR團隊的一員。
他在 Fair 的工作獲得了 ECCV 2018 的最佳榮譽獎、CVPR 2020 的最佳提名和 ICCV 2021 的 Mark Everingham 獎。 它還建立了 Meta AI 最受歡迎的專案之一 Detectorron2,這是乙個廣泛使用的視覺開源專案,已整合到 Meta 的全系列 VR AR 產品中。
2018年10月,在GeekPWN國際安全極客大賽上,iyswim是六支參賽隊伍中唯一破解人臉識別演算法的隊伍。 吳宇欣當時以iyswim隊的身份參加比賽,據他介紹,“我(以自己的名義報名參加比賽,隊友沒有到場)使用谷歌的Facenet開源**模型破解了演算法。
張玉濤和楊志林一樣也師從唐杰教授,持有5%的股份。 此前,他還與楊志林一起建立了迴圈情報。 據悉,張玉濤曾就讀於清華大學計算機系。 清華大學資料科學研究所大資料科技研究中心首席研究員。 他的研究興趣包括異構資料融合和知識圖譜構建。 在資料探勘領域的重要國際會議上發表論文多篇,如KDD、CIKM、VAST等。
作為核心開發者,開發了全球知名的科技大資料分析平台AMINER,其產品服務於BATHH等科技巨頭和科技部等一流科研管理機構。 曾獲北京市科學技術獎一等獎、吳文軍人工智慧技術進步獎一等獎、阿里巴巴天池大資料大賽二等獎。
除了清華四人組,還有一位畢業於復旦大學計算機系的王震,在月亮暗面的股東名單中。 復旦大學畢業後,他前往新加坡南洋理工大學學習計算機工程。 他擁有 20 年的軟體開發經驗,目前正致力於人工智慧在法醫學中的應用。
據悉,王震曾擔任谷歌高階軟體工程師、iHealth Labs系統架構師、Ised Ventures副總裁、新加坡科技局Smart Nation Fellow特聘工程師。 他還是新加坡人工智慧驅動型獨角獸公司Advance AI的首席技術官。 他還曾在投資機構工作過。
除了這四大核心人員外,月亮暗面還吸引了一大批研發人才,他們曾參與谷歌雙子座、谷歌巴德盤古NLP、物道等多款大模型。 2023年10月,大約有50人,現在的團隊有80多人。
雖然團隊不大,但在2023年10月,也就是公司成立幾個月後,就推出了全球首款支援20萬漢字輸入的智慧型助手產品。 核心特點是,相較於市面上基於英語訓練的大模型服務,Kimi Chat具有較強的多語言能力,20萬漢字的輸入在中文中也更具優勢。
目前,月球暗面正在開發通用的多模態模型,預計將在年內推出。 對於如今的大型創業公司來說,多模式模式確實是核心競爭點。 尤其是OpenAI首款AI**模型Sora的發布,再次為賽道增添了一把火。 然而,與文字相比,影象和**等多模態模型的訓練成本更高,需要更多的資金和人才。