12 月 16 日,Geek Park 創始人、董事長兼首席執行官 Robin Li 和創始人兼總裁 Peng Zhang 共同探討了“AI Native,我們需要什麼樣的產品和開發者?這個話題引發了一場對話,並輸出了很多想法,這篇文章展示了最好的部分。 同時,在文章末尾附上了 17 個檢視的集合。
問:近日,谷歌發布了 Gemini,據說是 GPT4 下的 OpenAI5也要發了,最近有各種傳聞。 我們非常擔心,確實正如您所說,最先進的基礎車型只有少數幾個,從國內來看,與國外的距離,我們在過去一段時間裡是縮小還是擴大了?我們如何評價追趕他們,甚至有機會在未來創造屬於自己的不同價值?
李彥巨集:中美兩國的市場環境差異較大,尤其是在應用層面,中美兩國的發展方向可能相對不同。 美國在企業級軟體方面一直有很大的市場,應該說更先進,中國在to C領域會更先進。
如果我們回到中美之間的技術差距,我的觀點一直是,技術仍然需要服務於應用。 當你說技術是好的,或者技術是壞的時,你到底是什麼意思?今天我們圖書館的PPT生成能力,我覺得是全球最好的,它是基於文心一顏模型的,這個時候你說我們和世界領先水平差距有多大,我覺得沒有差距。但是,如果具體談企業應用,中國的市場太小了。 因此,我們不準備做任何事情來優化這些事情,而且確實有可能落後。 或者各種小語言,我們沒有精力去做那些優化,所以也有可能它們落後了。 所以當我看模型的技術層面時,我是在看它的應用,你在哪裡比較,簡單地刷一下列表,跑乙個分數,我覺得這個東西挺無聊的。 如果你訓練乙個大模型,你需要投入多少資源!10000張GPU卡,你要訓練很久才能練出來,你說我考高考,我得多少分,你高考得了高分,能賺多少錢?你刷乙個榜單,你排名第一,那個榜單的主人,他能給你多少獎金?
李彥巨集:我認為模型的先進技術更多地取決於模型所處的應用場景和作用。 想清楚這件事後,就可以判斷模型的好壞了。 有時我講的是模型質量的評價,這是做模型的企業的核心競爭力。 如果你不知道,你就得靠第三方給你評價,給你打分,這東西不靠譜,你不知道自己在做什麼
問:最近有一種說法,大模型本身就是在技術上“大力衝出奇蹟”,看來這個東西,就好像我們想做大模型的創新,還要靠奇蹟的力量,這張牌可以重注,有足夠的決心和足夠的錢去上去, 這個距離能通過堅決的努力拉近嗎?如何理解這個強大的奇蹟?依靠它不行嗎?
李彥巨集:我認為“武力奇蹟”這句話更多地是指從 0 到 1 探索大模型的過程。 OpenAI在別人不知道這條路可以通行的時候,用了足夠的算力和足夠的資料進行訓練,最後跑出了這條路。 其實他們並沒有發明新的演算法,他們用的是transformer,最後他們做了很好的效果,因為它用了足夠多的卡片,我看到美國學術界有人在調侃美國所有的大學都不能用他們的卡片訓練GPT35.確實,這裡使用的計算能力非常大。
但我認為,再往前追溯,這個遊戲不是這種玩法,它不是大力創造奇蹟的法則,它更像是走向它的對立面。 反之亦然?我認為這和所有的商業競爭都一樣,誰更有效率,誰就贏了。 你可以融資,我也可以融資,最後我用10美元做100分的效果,你用10美元做120分的效果,久而久之你就贏了。 或者為了做出100分的效果,我用100美元,你用80美元,你就贏了。 我認為這就是大模型的價值最終在應用程式中體現的方式。
現在**和大眾都在關注訓練大模型,在實際訓練完成後應用推理的成本是多少?不管你的推理成本在同等效果下比別人低,還是你的效果在同等成本下比別人好,這都是未來競爭的主線,我覺得是大力創造奇蹟的反面。 而是你真的必須能夠比其他人更有效地製作這些東西。
這也是為什麼我們在這個領域有很好的積累,我們在晶元層、在框架層、在模型層、在應用層都有布局,這麼多年,所以我可以端到端地優化。 剛才講了生成PPT的例子,有需求的時候就傳下去,文心模型一定要針對這個東西進行優化。 在優化時,有人說呼叫次數太大,成本非常高,我們負擔不起計算能力。 往下看,你的框架,也就是槳的框架,應該完全針對文心大模型的需求進行優化。 再往下看,就是晶元如何適應球拍的框架和文心模型。 逐層、端到端優化,我們發現從3月份發布到現在,我們基本上可以將推理成本降低到1%。 以前你只敢打10000次,現在一天敢打100萬次,完全是另一回事的感覺。 我認為這方面是未來競爭的主線。
問::如果你看一下,如果你想身處其中,中國發展依靠大模型的新一代AI產業的核心問題是什麼?如果我們要列出三個核心問題,那麼在一天中的這個時候,哪些問題最值得關注?是算力的問題嗎?
李彥巨集:不能說有三個,最關鍵的,甚至唯一的,就是應用。 大模型是基礎的東西,如果上面有有價值的應用,那麼就算行業跑了,也能越做越大。 你可能想問的是,你怎麼能開發乙個好的應用程式,這個關鍵因素就在於**??我認為有幾個方面:一方面是我國的產業政策。 如果你看看中國相對領先的產業,很多時候國家在產業政策上是有遠見的。 比如太陽能光伏,再是動力電池,直到現在的新能源汽車,新能源汽車似乎佔全球出貨量的60%還是多少,這是為什麼呢?如果中國是燃油車,就會限制購買和通行,還要繳納車輛購置稅,所以有各種打壓需求的伎倆,但是對新能源汽車沒有這樣的限制,自然會發展得更好。 在大模型方面,如果國家能夠出台相關產業政策,鼓勵開發基於大模型的AI原生應用,我認為這是乙個非常重要的成功因素。
二是當前**環境。 **現在主要關注的是基礎模型,有這個能力和那個能力,這個東西真的不重要,重要的是我們現有的企業,它是否利用大模型對其業務核心關鍵指標產生積極影響。 也就是說,我們現有的企業,不管是大企業、中小企業,還是創業公司,不管是做什麼的,使用大模型後,能不能對其關鍵業務指標產生積極的影響,就是這個領域關注度比較低,我覺得如果這個關注度能提高的話, 對於製作大型模型或做大模型來說,這也是非常重要的一點。這件事說起來容易,做起來卻不容易。 其實大公司反應很慢,甚至我有時也會說,大公司代表著落後的生產力,你一定不要看大公司在做什麼。
以下是李彥巨集觀要點的合集,值得細細品味。
1.我認為這波大型模型技術的不同之處在於它的通用性。 我們稱之為“智力湧現”,它已經學會了沒有教過的東西。 有了這個功能,當你擁有一套基礎技術,可以做得非常好,非常領先的時候,就可以在各種場景下快速做出有價值的應用。 這是人工智慧在過去70年中沒有做過的事情,所以這是乙個完全不同的機會。
2、今年絕大多數時間,全社會的焦點都放在大模型本身,放在基礎模型上。 但我的觀點一直是,在基本模型之上,必須有數千甚至數百萬個 AI 原生應用程式,才能體現大模型的價值。 我看到**、社會、大眾的主要興奮點還停留在基礎模型上,並沒有轉移到AI原生應用上,這或多或少是焦慮的。 這就是為什麼我一直強調,我們必須推出 AI 原生應用程式,並且我們必須製作這個東西,這樣你的模型才有價值。
3、模型技術的進步,更多地取決於什麼應用場景,模型是做什麼用的想清楚這件事後,就可以判斷模型的好壞了。 對模型質量的評價是製造模型的企業的核心競爭力。 你知道什麼是好的,什麼是不好的,所以你可以做乙個好的模型。 如果你不知道,依靠第三方給你乙個評價,給你乙個分數是不可靠的。
4.“大力創造奇蹟”,更多是指從0到1探索大模型的過程。 再往前追溯,這個遊戲不是這種玩法,而是更傾向於它的相反。 反之亦然?這和所有商業競爭的規律是一樣的,誰更有效率誰就贏了。 你可以融資,我也可以融資,最後我用10美元做100分的效果,你用10美元做120分的效果,久而久之你就贏了。 或者為了做出100分的效果,我用100美元,你用80美元,你就贏了。
5. 在同等效果下,你的推理成本是否低於其他人?還是在相同的成本下,你的表現是否比其他人更好?這是未來競爭的主線。 我們在晶元層、框架層、模型層和應用層都有布局,因此我們可以進行端到端的優化。 從3月份文心一言上映到現在,我們基本把推理成本降到了原來的1%,過去我們只敢打1萬次,但現在一天敢打100萬次,完全是不一樣的感覺。
6. 我確實認為數百個基本模型是對社會資源的巨大浪費,尤其是在我們的計算能力仍然有限的情況下。 應該投入更多的資源去探索與各行各業的結合,探索任何新的超級應用的可能性。
7.基礎模型的迭代過程不依賴於執行分數或刷這些東西。 乙個做應用、做業務的人真正關心的,是他業務的核心指標,他的需求導致文心模型朝著真正符合市場需求的方向演進迭代,這是乙個良性迴圈。
8、隨著大模型時代的到來,真正的價值在於原生應用,原生應用對於大廠商、中小企業、創業者來說都是巨大的機遇。
9、大模型開發只有乙個關鍵點,那就是應用開發好的應用有三個關鍵因素:一是有相關的產業政策鼓勵開發基於大模型的AI原生應用;其次,是利用大模型對其業務核心關鍵指標產生積極影響的現有企業三是超級應用,什麼時候會出現,會出現在哪些領域?更多的創業公司需要努力工作,嘗試各種事情。
10、大模型的最大價值究竟是新的超級應用,還是對現有應用的改造尚無定論,當然一定是後者。 如果你今天看看Microsoft的Office365Copilot,它每月花費30美元,每年可能收取50億美元,這比整個OpenAI的年收入還要大很多倍。 事實上,它通過改造現有產品創造了如此多的新價值,所以我認為每個人都應該更多地關注與現有業務的結合。 這波生成式AI可以為現有業務的轉型創造更大的價值,Microsoft就是乙個例子,Adobe也是乙個例子,它對大模型的擁抱,導致它能為現有產品產生的收入和利潤大幅增加。
11、我認為,這些在現有幾乎所有行業都已經形成的公司,一旦出現轉機,能夠很好地利用大模型的能力,他們獲得的收益和價值收益一定是最大的。 當然,這並不意味著創業公司沒有機會,創業公司很有可能做出三五個超級應用,以及成百上千個非常有價值的垂直應用,這也是很有可能的。
12. PM和R&D的比例正在發生變化。 過去,我們必須在PM中做大量的研發工作,今天可能是1比1。 換句話說,許多實踐在早期測試中不需要研發干預,PM可以通過自己攢錢來做到這一點,這與以前不同。
13.真正成功的AI原生應用產品經理,很可能不是某一類人,而是各種人的綜合,有人可能不是計算機專業,但他有很強的學習習能力,他有產品和市場意識,同時不怕技術, 即使他沒有學過,讀了最新的**,也能明白說了什麼,用了什麼方法,這類人最有可能成為乙個成功的產品經理。
14.為什麼我在為“訪問”這個詞而苦苦掙扎,事實上,我正在為你的肌肉記憶而苦苦掙扎。 因為訪問是最簡單的,但也是最低的價值。 你的業務與大模型有什麼關係,大模型能不能幫助你增加你的DAU,你的留存率增長多少,你的使用者時長增長多少,你的收入增長多少,你的利潤增長多少?這些是業務的關鍵指標。 但要在這些關鍵指標上有所作為並不容易。 它不依賴於慣性,也不依賴於肌肉記憶。
15.我們今天的認知與乙個月、半年或一年後的認知大不相同。 這種認知是如何產生的?這不是你坐在房間裡憑空想到的,也不是我讀**來理解的東西。 的確,有無數的開發者在嘗試的過程中知道這條路通,這條路行不通。 今天,絕大多數的可能性都沒有嘗試過,創業者和開發者都要嘗試,無論這條路行不通,都是寶貴的經驗和教訓。 即使你沒有通過,你也知道你沒有通過,如果你通過,這是乙個很大的機會。
16.我認為這是乙個長期的機會,但如果你不及早抓住這個機會,你很可能會在競爭中落後。 今年有機會,今年有機會,明年有機會,如果五年有機會,我認為會有機會。 但為什麼不早點呢?為什麼不比同行和競爭對手更早地發揮技術的價值和技術的潛力呢?特別是當你的指標,當你的北極星指標時,它們對核心業務的關鍵指標有積極的影響嗎?當你仔細考慮時,其他一切都會得到解決。
17、隨著大模型時代的到來,真正的價值在於原生應用,原生應用對於大廠商、中小企業、創業者來說都是巨大的機遇。