“堅持原創,讓人工智慧引領人類進步。 ”文丨何乾明、程曼琪、張家豪編輯丨程滿琪
12月16日,商湯科技發布訃告,宣布商湯科技創始人湯曉鷗於2024年12月15日晚去世,享年55歲。 清華大學智慧型科學講座教授張雅琴在微信群中表示,他得知唐曉鷗因呼吸暫停在睡夢中死亡。
唐曉鷗是享譽全球的人工智慧科學家,在職業生涯中經歷了三個身份:AI研究者、培養了一批AI人才的教育家、創立AI公司商湯科技的創業者。
商界關注唐曉鷗創立的商湯科技的跌宕起伏:一度快速增長的估值、鉅額資金和持續的商業化探索。
學術界為失去一位承載了許多年輕一代的導師而感到遺憾。 “唐老師最大的財富,就是培養了一批像何凱明這樣非常優秀的人才,大大提公升了中國計算機視覺在世界上的影響力。 “唐的一位博士後說。
商湯科技聯合創始人、董事長兼CEO徐力在朋友圈哀悼:“遇見你的時候,我們度過了最美好的時光。 商湯科技高管、唐曉鷗學生徐冰表示:“他不僅是商湯科技的靈魂,更是無數學子心中的燈塔。 ”
在他去世前的五年裡,唐先生逐漸從商湯科技退休,回歸教育研究,擔任浦江實驗室主任、上海人工智慧實驗室主任、香港中文大學教授。
他最後一次參加大型公開活動是在7月在上海舉行的世界人工智慧大會上。 他用三位學生的研究故事來總結自己的研究生涯,說他的團隊的18項工作是世界上第一次將深度科學的習應用於視覺問題,相當於“在深度學習的習門口按了18次門鈴”。
唐小鷗說話幽默,喜歡調侃。 談及科學家的骨幹,他說,雖然不會為了“五桶公尺”而彎腰,但“如果是六桶......這比五個桶多乙個桶。 有人稱他為科學家中的“小丑”。
他說,幽默就是看事物的本來面目:“事物的本質有兩面性,一面是荒謬的,一面是更荒謬的”。
在今年7月的演講結束時,他提到自己經常聽著余謙的相聲睡覺,心想:“一台機器怎麼能超越這麼有趣的靈魂呢?我不相信。 ”
現在,世界又少了乙個有趣的靈魂。
科學家唐曉鷗:“在深色原色中尋找光明”。
唐曉鷗,2024年出生於遼寧省鞍山市,17歲時從鞍山市第一中學考入中國科學技術大學精密機械與精密儀器系。 2024年畢業後,他前往美國留學,在那裡他花了一年時間在羅切斯特大學獲得碩士學位,然後在麻省理工學院攻讀博士學位。
在此期間,他的研究興趣轉向了用計算機處理影象。 唐曉鷗最早發表的公開文章發表於2024年,比較了三種基於紋理的聲吶影象分類方法。 這個**的合作者是最早登上鐵達尼號的深海考古科學家之一。
2024年畢業後,鄧博士赴香港任教,花了20多年時間將香港中文大學打造成計算機視覺研究中心。 一開始,他的研究繼續朝著博士的方向發展,比如如何讓機器自動識別海底的浮游生物。
2024年在香港中文大學成立MMLAB後,Tang的研究重點開始轉向更接近日常生活的影象處理,例如人臉識別。 在接下來的三年裡,唐的團隊在各種學術會議和期刊上發表了50多篇文章**。
這是大多數研究者一輩子都覺得很難取得的成就,但對於唐曉鷗來說,這才剛剛開始。
2024年,他還是Microsoft亞洲研究院視覺計算小組的負責人,這導致了頂級學術會議的高峰**。 唐曉鷗把科研的動力歸結於生活。 他後來在接受採訪時提到:“我一直想在日常生活中使用計算機視覺和人工智慧。 他自己做到了。
當他接手Microsoft亞洲研究中心工作時,他的兒子只有兩歲,唐曉鷗不得不往返於北京和香港之間。 “總覺得和明明(唐小鷗兒子的昵稱)在一起的時間太少了,我想把每一分鐘都記錄下來。 他在乙份自我報告中寫道。 每次見到兒子,唐小鷗都會拍大量的**,不到兩年的時間,他已經儲存了上萬張照片,根本整理不出來。
唐曉鷗的解決辦法是“自私地號召大家做**管理研究”,比如如何快速找到影象如何從多張影象中分割肖像?
事實上,這些都是計算視覺研究中罕見的高質量資料。 在Microsoft Research Asia期間,Tang的團隊在各種頂級學術期刊上發表了60多篇文章,他調侃他的兒子是“世界第一的名字”。
唐曉鷗經常把做研究比作一場武術比賽,認為要把重點放在頂級學術會議的目標上。 “你要是要去太行山談劍,進軍大別山,別人只能把你當游擊隊了。 ”
2024年,唐曉鷗迎來了學術生涯的高光時刻。 今年,他被任命為IEEE Fellow,這是計算機資訊領域的最高榮譽之一。 他和他的學生何凱明(Kaim Ho)當時是亞洲研究中心(Microsoft Research Asia)的科學家,以及孫健(Jian Sun)被評為CVPR的最佳學生。 這是CVPR25年歷史上首次有亞洲團隊獲得最高獎項。
一年後,唐曉鷗回到母校中國科學技術大學講學,談起了這篇文章。 他們發現了自然影象的乙個基本屬性,稱為“暗通道先驗”——在任何正常影象的任何色塊中,總是至少有乙個畫素的紅色、綠色或藍色值接近於零。 有了這一發現,他們能夠幾乎完美地去除影象中的煙霧、霧霾和其他元素,並恢復真實場景。
唐曉鷗說,自然影象研究幾十年了,仍然可以發現影象的新基本特徵,研究者應該堅持這個態度:在深色的原色中尋找光明。
CVPR是唐曉鷗學術生涯的代表作之一,也是他研究理念的體現。
2024年,唐曉鷗在中國科學技術大學講學。 **來自中國科學技術大學。
導師唐曉鷗:針對提前深入學習習,帶出中國半壁AI產業的技術帶頭人
在今年的世界人工智慧大會上,唐曉鷗自豪地介紹了他的三位學生:王曉剛、何凱明和林大華。
2024年,作為商湯科技聯合創始人,王曉剛帶領團隊研發了GaussianFace演算法,在人臉識別方面首次超越了人類水平。
2015 年,何凱明發表了基於 Transformer 架構的深度殘差網路 (Resnets)** 大型模型,這些模型現在被何凱明廣泛使用。
2014 年,他領導了 OpenMMLAB 的推出,這是目前世界上最具影響力的計算機視覺開源專案。
早年,他談起這些天才學生,還不忘加幾句調侃的話:“小剛是我見過的第乙個天才學生......”他的才華和性格非常出色,我毫不猶豫地將我的妹妹嫁給了他。 後來,我的另一位天才學生大華發表了更多的文章,但我已經沒有妹妹再婚了。 ”
唐曉鷗老師培養出的優秀學生遠不止這三位。 Xiaogang Wang、Kaim He、Dahua Lin和更多的人工智慧科學家都曾在唐曉鷗創立的MMLAB學習或工作。
優秀導師的特徵之一是他或她對技術方向有敏銳的把握,並提出正確的問題。
2024年,唐曉鷗開始關注人工智慧中的深度學習習型別。 幾年前,習的深度科學方法在2024年史丹福大學贊助的機器視覺識別競賽ImageNet上震驚了學術界。
不久之後,唐曉鷗決定將MMLAB的研究重點轉移到深習。 在隨後的幾年裡,mmlab是將深度學習習方法用於計算機視覺的主要領導者。
從2024年到2024年,CVPR中的29個深度習**中有14個來自MMLAB。 例如,在2024年,CVPR中僅有的兩篇深入的習文章都來自mmlab。
2024年,mmlab入選全球十大AI先鋒實驗室之一,亞洲唯一一家。
唐老師的一位學生說:“唐老師是一位冷靜、耐心、有指導的導師。 即使離開實驗室的學生在開會時遇到唐曉鷗,他也會抽出時間與他們交流:“他很擅長引導學生放大自己的能力,所以他培養了一大批優秀的人才。 ”
除了以上特質,唐曉鷗還具備大多數教授所不具備的能力:策略、人性理解、解決問題的能力。
2024年唐曉鷗回港任教時,香港大學的師生關係緊張:當時,香港**正在推動香港大學從教育轉向研究,一批歐美資深科學家被高薪聘用,這些人想在香港培養自己的博士;但是,來香港的學生一般只想在香港攻讀碩士學位,然後去歐美深造。
在創辦mmlab並招收學生後,唐曉鷗反其道而行之:他不介意學生以mmlab為跳板,甚至“鼓勵他們這樣做”。
唐曉鷗認為,當老師的核心是找到好學生,而不是博士生導師的名字。 他在清華大學、中國科學技術大學等中國大陸高校講課時,會告訴考生:MMLAB不介意你來這裡唯讀碩士,但在碩士畢業之前,一定要努力才能取得成績如果之後想去歐美留學,“我幫你一起申請”。
王曉剛, 林大華, 李雪龍, 閆水成 ......我經常去實驗室,然後去麻省理工學院、史丹福大學和牛津大學。
兄妹倆的口口相傳吸引了更多的人才,其中就包括清華大學、中國科學技術大學相關院系的佼佼者,何開明是2024年廣東省高考狀元,本科就讀於清華大學物理系基礎科學班。
何開明在MMLAB攻讀碩士學位期間發表的第一篇文章,就是獲得世界頂級計算機視覺大會CVPR 2009最佳文章的文章。
順勢而為的策略,讓唐曉鷗實現了一些導師一直無法要求的目標:一些人才選擇留在香港完成博士學位。 何啟明就是乙個例子,他最初在香港申請中文碩士學位,但後來轉為博士學位,並在4年內完成了碩士和博士學位。 MMLAB的結果給了他信心,他不需要依靠學校來增加他的氣場。
唐曉鷗和何凱明。 **來自香港中文大學。
後來走出MMLab的同學們,豐富了中國人工智慧的研究和產業,特別是在計算機視覺領域,被譽為“黃埔軍校計算機視覺”:除了今年唐曉鷗演講中提到的三名同學,還有曾擔任依圖CTO的嚴水成, Shopee首席技術官,現任崑崙萬維天工智慧型聯席CEO重慶郵電大學校長高新波;華為諾亞方舟計算機視覺實驗室主任徐春景;趙德利,阿里佛法學院前基本觀負責人;商湯科技聯合創始人徐冰;中國科學院先進計算與數字工程研究所所長喬宇;陶大成,前 JD.com 頂級技術科學家;趙聰,大疆前AI視覺負責人等
人才密度高也是商湯科技起步時最大的優勢。 在深度學習習爆發和業界關注之後,唐曉鷗將開啟另乙個身份:企業家。
一位了解MMLab組織方式的人,對唐曉鷗的創業有著不同的看法:“教授們普遍不看好創業。 但唐小鷗確實有創業成功的潛質。 ”
創業者唐曉鷗:創立了商湯科技,但不僅僅是商湯科技的創始人
2014 年 6 月,唐曉鷗團隊發布了一款名為 DeepID 的人臉識別模型,該模型在人臉識別資料庫 LFW(Labeled Faces in the Wild)上的識別率超過 99%,擊敗了 Facebook 的 Deepface。
當時,被Facebook吸引到“人臉識別”的全球業務**發現,Facebook大力推廣的Deepface,居然輸給了來自中國的一家實驗室。
再加上IDG投資人牛奎光的推動,唐曉鷗於同年年底創立了商湯科技。 相較於2024年成立的曠視和2024年成立的依圖,商湯科技的創業起步稍晚一些。 但此後,在人才密度和估值方面,它已成為中國人工智慧領域排名第一的公司。
唐曉鷗為商湯科技制定了乙個崇高的公司使命:“堅持原創,讓人工智慧引領人類進步。 ”
商湯科技最初選擇的模式,也是一種看似能夠高效引領各行業進步的方式:做乙個技術平台,即商湯科技主要做計算機視覺的通用軟體技術,讓下游應用或合作夥伴可以應用到自己的場景中。
2024年之後的積極氛圍支撐了商湯科技的早期繁榮,尤其是在2024年AlphaGo戰勝李士琪之後,掀起了新一輪的AI熱潮。 一群投資者已經從過去為流量增長付費,變成了為最佳數量付費。
在2024年左右的巔峰時期,商湯科技擁有近300名醫生,以至於內部有乙個笑話:“如果你是三人行,你必須有乙個醫生”。
今年,唐曉鷗在發布會上公布了過去幾年全球各機構在頂級計算機視覺學術會議上發布的對比圖數量,商湯科技排名第三,僅次於Microsoft和卡內基梅隆大學。
BAT都說自己是一家AI公司,但在國際上,只有商湯科技存在。 唐曉鷗說。
商湯科技曾是全球融資最多的人工智慧公司,在2024年底上市前,共籌集了52億美元的資金,估值為120億美元。
但隨著時間的流逝,基於技術理想的“平台”的想法在商業競爭中遭受了挫折。
由於軟體技術的快速擴散,AI演算法的競爭力不容易保持;行業內企業所持有的大規模製造能力、業務關係或行業意識是更深層次的障礙。 當時,計算機視覺技術本身還不夠普及,在很多場景下都無法低成本遷移。
從海康威視到位元組再到特斯拉,該行業的公司正在從人工智慧技術中獲益。 商湯科技想要賦能自己的物件就是賦能自己,這是一群純AI公司共同面臨的商業化困境。
商湯科技的一位高管表示,他最初認為“科學技術是第一生產力”,但後來發現這並不適用於所有場景和階段。 在中國市場,技術要想產生收入,就必須要麼沉入基礎設施,要麼束縛應用。
近年來,商湯科技調整了業務戰略。 它包括“賦能萬行百業”的範圍,包括智慧城市、智慧汽車、智慧商業和智慧生活“垂直整合”不僅做軟體演算法,還做計算基礎設施和應用向下做,比如在上海建立3萬多個GPU的大型算力裝置抓住機會打造大模型。
商湯科技的商業化探索仍在繼續。 財報顯示,商湯科技今年上半年營收為1433億元,毛利648億元,同比均略有增長;淨損失 3143億元,同比微降2%;上半年應收賬款高達7726 億美元,是收入的五倍。
多位商湯科技高管表示,在整個創業過程中,唐曉鷗的管理風格就是把握巨集觀層面,“只管好幾個商湯科技的共創”。 不過,也有商湯科技的人表示,唐曉鷗會關心公司的外在形象,親自審閱公司的宣傳資料。
一位前商湯科技員工告訴晚郵報,唐曉鷗也是商湯科技的導師,大家都叫他“唐先生”,他不會在公司年會上談公司的發展戰略,而是聊聊生活,分享最近剛看到的好書。
唐曉鷗在商湯科技倡導“害群之馬文化”:要求員工要有同理心,但絕不能陷入“羊群效應”,做別人沒有做過的事情,甚至是別人想不到的事情。
2024年前後,唐曉鷗逐漸淡出商湯科技,只保留了執行董事的身份。 在後來的**報道中,唐小鷗與商湯相關的訊息,基本只是商湯市值的下跌,從而減少了他的財富。
在他去世前的四五年裡,唐曉鷗作為上海人工智慧實驗室的主任,在行業內更加活躍。 該機構成立於2024年7月,由唐曉鷗擔任實驗室主任,領軍科學家還包括姚馳志院士和陳傑院士。 除了人工智慧研發,上海人工智慧實驗室還與國內多所知名高校合作培養博士生。
唐曉鷗又回到了他熟悉的研究者和導師的角色。
過去幾年,上海人工智慧實驗室在機器視覺、自動駕駛、機器學習等多個領域取得了成果,習:2024年,實驗室自動駕駛團隊開源了Bevformer架構;今年6月,上海人工智慧實驗室、武漢大學和商湯科技聯合提出了自動駕駛通用模型**,該模型在CVPR 2023**中榮獲最佳,這也是近十年來首篇以中國學術機構為單位的頂級計算機視覺大會最佳文章**。
2024年7月在上海舉行的世界人工智慧大會是唐曉鷗的最後一次公開演講。 在演講的最後,唐曉鷗再次感謝了自己的同學們。
他借用了電影《好老師》中的一句台詞:“我沒有在最好的時間遇見你。 當我遇見你時,我度過了最美好的時光。 ”
在今年7月的世界人工智慧大會上,唐曉鷗借用了《好老師》結尾的台詞。
標題圖片**:視覺中國。