作者 |萬辰,大膽創新計畫
編輯 |靖宇.
在過去的八個月裡,百川智慧型團隊依靠搜尋、高質量資料處理等AI技術的積累,對模型的規模和質量進行快速迭代。 百川智慧型創始人兼CEO王小川認為,百川應該在理想上慢半步,在落地上快三步。
2024年12月16日,在2024極客園創新大會上,王小川進一步分享了關於大模型的新思考。
對於大模型的演進方向,王曉川認為,目前大模型是學習,而不是思考,模型演進的下乙個方向是學習和思考相結合。 在大模型時代,必須考慮大模型技術的特點,這是過去和現在做產品的最大區別。
過去做應用的時候,總是講產品與市場的匹配——PMF(產品市場契合度),但在產品與市場之外,卻漏掉了乙個字,技術。 」
他認為,目前的大型模型技術離AGI還很遠,更重要的是在這種不完善的前提下明確:什麼樣的產品適合這樣的技術,而不是產品經理對市場有洞察力,回來就開始動手。
在王曉川看來,在大模式帶來的新發展正規化下,產品經理的出發點應該是從思考產品市場匹配(PMF)到思考如何匹配技術與產品,即TPF(Technology Product Fit)。
王小川認為,首先是提供比傳統應用好10倍的體驗,使用者才能用好。 要做出這樣的應用,產品經理不僅要自己是模型的狂熱粉絲,還要有傳統的產品經驗和想象力,能夠弄清楚模型是什麼樣子的。
以下為王小川極客園創新大會2024對話實錄。
張鵬:你參加過我們大會很多次了,剛才你認真聽兩位技術專家講了前段時間OpenAI事件背後的一些關鍵因素,甚至提到大模型需要有慢思考的能力,不知道大家怎麼看?
王小川:是的,今年我們正在籌備大模型到4月份公司成立,我提到了幾個關鍵詞,乙個叫搜尋增強,因為要連線傳統知識,第二個我希望大模型是做強化習,當時, 我提到這一點,是因為我看到大模型本身就代表著一種快速思考的方式,就像乙個人一樣,我一拍腦袋就給你答案,我可以說它在學習習和應用推理方面有自己的缺點,當然不光以大模型為本, 當時我們認為強化習可以有很大的幫助,這也是百川內部工作中一直非常關注的領域。
張鵬:只是慢慢想?
王小川:是的,就是慢思維,和慢思維相比,今天的大模型代表的是快思維。 我們來談談我自己的兩個觀點:快思維不叫思考,慢思維我覺得它有這麼多的思維,以openai大模型為代表,它叫學習,它的知識是學習的。
我不強調推理的“思考”,其實人們在學習的時候,可能要思考很久,這叫思考,所以孔子之前說過,不思而學的學習是魯莽的,不學的思考是死的。 」
具體來說,大模型在學習,它其實不是在思考,它不像人一樣,會來回琢磨,會開啟想象空間去看,什麼系統在思考?OpenAI 剛剛創辦了這家公司,而 DeepMind 正在做的事情,比如做 AlphaZero 和玩遊戲,都在考慮它。
但那是強化學習的設定,叫做多智慧型體的對抗,alphazero它不是乙個學習習系統,它拋棄了之前的6000萬盤(西洋棋訓練),但它本身就是在對抗博弈中,在博弈中尋找新的理解,最後通牒,就是這樣的思維。
AlphaZero在思考後就停在原地,它已經死了,它只做乙個特定的任務,不能擴充套件到其他領域,所以我們說大模型代表學習,alphazero代表思考,這兩個系統在一起會非常強大。
百川智慧型創始人兼CEO王小川、極客園創始人兼總裁張鵬分析了極客園大模型的學習與思考。
張鵬:所以接下來重要的是真正學習和思考,對吧?學習和思考應該結合起來。
王小川:沒錯。 更具體地說,我們想到了這個場景,你問大模型怎麼下圍棋,它居然玩不出來。 但是你問你能不能判斷乙個輸贏的圍棋選手?乙個大型模型可以根據它已經知道的東西來判斷。 即使你說你寫了乙個**來決定這個圍棋的輸贏,大模型也可以寫這個**。
你讓它寫乙個**,每一步走完棋后,走棋的狀態是怎麼轉移的,也就是下棋的整個過程,也可以寫出來。
所以試想一下,如果大模型足夠強大,雖然不會直接下圍棋,但可以寫出下圍棋等狀態轉換(事務函式),最終決定圍棋的輸贏。 也就是說,大模型有機會寫乙個alphago**然後執行它,執行完之後,就可以下棋了,這個事情就有機會發生了。
張鵬:歐美的技術還在不斷的探索邊界,這也讓人感到壓力,你覺得這個距離該如何衡量和縮短?你能自己創造不同的價值嗎?
王小川:我去美國之前,在百川說過這句話,就是理想上要慢半步,落地要快一步。 後來,去美國回來後,他把理想對折,變成了落地時慢一步快三步的理想。
張鵬:你怎麼理解理想是慢一步,落地快三步?
王小川:和他們接觸後,我覺得雙方的底層思路是不一樣的,OpenAI是乙個非營利性組織,它只是想探索AGI的邊界,他們真的做到了。
我上次和他們交談時,他們想嘗試將 1000 萬個 GPU 放在一起,構建乙個足夠大的系統。 1000 萬個 GPU 的概念是什麼?英偉達每年生產 100 萬件,GPT-4 約為 25,000 件,我們今天以 GPT-3 為基準5 只有 4,000 個 GPU。 他們在思考問題的時候,他們的出發點和我們不在乙個世界,所以在這方面我們無法和他們比較。
在這種情況下,人和企業都要找到自己的定位,而在這片土壤中,我們必須有信心,我們有機會在應用落地上走得更快。
也許隨著我們的使用者資料集越來越大,技術積累得越來越強,我們的應用可以足夠好,甚至可以在美國使用。 在這種情況下,這並不意味著您必須達到 GPT-4、GPT-5 和 GPT-6 的階段才有機會應用它。
不同的土壤生長著不同的東西,做應用是中國的傳統強項,也是一種創新,但我認為這是公平的。 這對中國企業來說也是乙個更好的機會,尤其是現在美國被OpenAI主導,做應用的企業要面對OpenAI的技術來做應用,就可以做它的技術做什麼樣的應用。
但是,國內的樣板企業可以自己做應用,這種端到端的連貫性,在應用落地的時候,有機會在某個領域比美國公司跑得更快。
王小川認為,中國的大模型在極客園的應用中可能會跑得更快。
張鵬:有時候我們肯定願意追求一種理想和使命感,在AGI的大過程中,我們可以加入這個團隊,他們可能是前鋒,突破界限,但我們可能是自由人或中場,但他在團隊中也有意義,比如我可以把技術放下,變成有價值的東西。
王小川:這兩個層面都會有推導,彭先生剛才說的是,你作為乙個全球公民,作為一家中國企業,是世界分工合作,而不是朋友和敵人的劃分,只有競爭關係,我們尊重他們的發明,我們迎頭趕上, 但我們也有自己獨特的貢獻。不僅僅是:我認為我需要我自己,世界不需要我。
張鵬:很好,我想得很清楚,在這波創業浪潮中,我找到了和自己和解的一點,那就是,我們該如何成為世界上一場有意義的比賽的玩家,不是每個人都必須是前鋒。
這就給我們帶來了另乙個問題,今天大家都在談論超級應用,但是他們沒有看到未來超級應用是什麼,而李彥巨集剛才也說,今天還不確定。 但我認為,如果我們想做乙個超級應用,我們需要什麼樣的起點?例如,過去我們談到了PMF(產品-市場匹配),但是今天如何做這個PMF
王小川:是的,我覺得這個點可能離得越來越遠。 究其原因,當我們想象重構原有的應用時,比如再次重構微信,這個視角可能會一下子限制我們自己,所以首先,你要把這個視角縮小出來。
所以,回到做超級應用,乙個長期的方向是它代表了人們的基本需求,而這個基本需求,我把它歸納為三個關鍵詞,人需要具備三樣東西:一是要有創造力,二是要健康,三是要快樂。
健康和快樂對大家來說都很容易理解,但創造力來自於世上人總希望你的存在與世不一樣,你可以改變世界,所以如何幫助你改變世界,是乙個可以獨立分離的範疇。
當我們有了這個願景,如何做健康,如何做娛樂,如何幫你獲取資訊,讓你更有創造力,長此以往,這三個方向就會有。 但另一方面,我們也會扔掉一些東西,比如做營銷文案,幫你做客服對話,其實大模挺擅長做的這些,但我認為這些並沒有回歸到人們的根本需求,這就落入了原來的所謂重構邏輯。
所以,有了這樣的三個大方向的意識,我就會有不同的想法,這是一種已經開啟的思維,否則我就會掉進大廠競爭的坑里。
其次,我想提乙個重要的詞,就是我剛才提到了PMF這個詞,我想用乙個新詞,因為PMF總是講產品和市場的關係,我去掉了乙個詞,那就是技術。 技術,在AI時代,它仍然有很多不完善和不確定性,不像以前是**或微信。
我認為技術是現在的瓶頸,但實際上,技術問題肯定是可以解決的,只是取決於工程師的水平,成本等等,你想要的,都可以在工程層面實現。 然而,大規模模型技術,包括剛才提到的錯覺和時效性,只能用自然語言說話,而這種技術本身就有侷限性和不完善性。
所以我們離AGI還很遠,因為技術的不完善,我們要明確,一項技術適合什麼產品,而不是先搶占市場,環顧市場後才開始做,我覺得這種勇氣是挺可貴的,但是TP技術的第一性原理和產品如何協調, 如何去做,我認為是現在要考慮的事情。
乙個很好的例子是性格ai,character.AI的創始人其實並不是產品背景,他對技術非常熟悉,尤其是產品背後的演算法,他也看到技術本身並不完美,可能會出錯,所以他首先想到了將其用於娛樂行業。 其次,這項技術首先可以承載的是自然的對話,這是乙個角色,所以讓它成為乙個角色。
張鵬:所以它的缺點變成了特點
王小川:我先提兩個概念,乙個是以前我們以為是在做工具,而工具其實代表了很多確定性,但這次我們不是在做工具,這次我們是建夥伴,更像是新物種一樣的人。 我們人類必須接受它自己的缺點和長處。 人是幻覺的,如果他們有幻覺,我可以用它們,那麼為什麼機器不能用它們,如果他們有幻覺呢?
歸根結底,乙個人應該匹配一件事,所以在技術匹配方面,我們認為我們必須改變視角,不是從工具的角度,而是從乙個人的角度,這是我的想法之一。
張鵬:你剛才說的是技術-產品-配合,TPF,而不是PMF。
王小川:是的,對技術本身要有足夠的了解,這樣技術才能匹配相關的東西,這是對產品經理的要求,或者說公司第一崗位的產品經理應該有這樣的認知,大模型擅長什麼,不擅長什麼。 這個過程是創造人,而不是工具。
曾經有乙個關於國王和畫家的故事,國王乙隻眼睛失明,失去了一條腿,但他很自戀,如果他想畫一幅自畫像,他會拉著全國各地所有的畫家畫畫乙個,然後殺死另乙個, 因為畫得太像了,少了乙隻眼睛,少了一條腿,就是在誹謗形象。但是,如果畫家用熾熱的英雄形象來描繪他的眼睛,那就是他會欺負國王並殺死他,這個問題不會得到解決。 後來,一位畫家畫了一幅國王打獵的圖畫,站在一塊大石頭上,蜷縮著,一條腿被遮住,國王拉弓,失蹤的眼睛恰好閉上了。
技術擅長什麼,不擅長什麼,怎麼做匹配,這對產品經理有更高的要求,我稱之為TPF。
張鵬:我覺得TPF這個詞很好。 TPF似乎是起點,如果我們站在未來,我們想做超級APP,我們怎麼能把TPF做好呢?什麼是好的TPF?
王曉川:過去產品經理寫的更多的是描述功能的定義和要求的文件,可以畫出結構設計圖給老闆看,產品是這樣的,滿足使用者的需求,準確實現每一步的功能。
今天的大模型不是這樣的,每次輸入乙個大模型,它的輸出都是不確定的,乙個字都做不完。 在這一點上,很難用一套演繹規則來解釋這一點。 邏輯是演繹的,必須拆解成一堆評價集,產品經理的要求不僅僅是定義產品,而是將定義的產品轉化為後面的評價集。 也就是說,在某種輸入下對模型的輸出做什麼樣的測試集。
此時,技術對應的不是工程人員,而是演算法人員。 演算法之前的工作習是你給了我評估集,我優化了我的演算法以滿足評估集。 無論是通過提示方法,還是 SFT,還是後訓練方法。 在這種情況下,產品經理定義了評估集,技術獲得評估集後,再尋找資料集或訓練集來訓練系統滿足評估集。
王小川講解了如何為某大模型搭建OKR極客園區。
張鵬:這是為大模型設定OKR。
王小川:它有乙個非常嚴謹的數學評估方法。 從事過演算法研究的工程師會適應這種方法,最後用評估集和資料來說話,這已經成為我們內部的標準工作方法。
包括搜尋公司也是這種方法,搜尋是演算法驅動的產品,是用評論集驅動的方式,但是我們以前在網際網絡發展到高階階段,技術不是問題,甚至不再是演算法驅動,是工程驅動的,這個PMF沒有錯,只是少了一層TPF,最後你會發現產品不是不能滿足市場需求, 但一直在迭代,無法做出階段性的產品。
張鵬:你剛才在某種程度上解釋了乙個我非常關心的問題——ai原生的發展情況如何。 從本質上講,這是關於我們正在開發的東西,你必須在設定的目標下設定評估集,這樣才能有效地訓練資料集來滿足評估集的要求,這才是你真正的開發引擎。
王小川:叫ai原生。 如果是 agi 原生的,那就是更深入地採用 AI 模型能力的正規化。
張鵬:這確實對產品經理提出了新的要求。 以前我們說PMF做得很好,我們有一種感覺,比如使用者使用量的增加,使用者體驗非常好。 但是現在你如何評價做好tpf?
王曉川:TPF首先對產品經理有要求。
首先,它必須能夠將需求轉化為測試集,測試集將允許技術工程師在滿足要求時發現手感在改善。 而在demo推出時,使用者需求的分布與產品經理提出的評估集的分布完全相同,評估集中的結果能夠滿足使用者的需求。
其次,在推廣產品時會提到PMF,看營銷契合度(market fit)在市場上的分布是否一致,使用者是否滿意。
張鵬:如果使用者能用好你開發的產品,是應該用好還是用好?很酷的用途是使用者數量爆炸式增長,成為超級應用;用好它是乙個循序漸進的方法。 我們要追求一連串的爆炸嗎?還是先解決少數人的問題,然後再解決多數人的問題?
王小川:這並不矛盾。 首先,好是和原來相比,你能和自己比多好。 如果與成熟的大型廠家相比,好的%是乙個巨大的好處。 但對於創業公司來說,如果是AI原生的原生應用,就必須在一開始就用上,至少對於特定型別有特色的特定需求,使用者一定能感受到十倍的感知。
張鵬:酷是十倍。
王小川:不是更好,而是讓你感到驚訝。 如今,大模型必須選擇有亮點來做,體驗要提公升十倍,周邊需求要提高五三倍,這樣才能把高峰拉得足夠高,然後逐漸拉寬。 如果一開始不讓你涼爽,我認為這個產品還不夠,但它比原版更好。
張鵬:今天在會場的很多人,也非常關心如何參與到這個由大模特推動的新時代。 如果你想成為新正規化下的產品經理。 他們應該怎麼走?
王小川:從企業屬性來看,企業就是做端到端的,不僅要做應用,還要做模型。 乙個是更注重應用的公司,它不怎麼接觸模型,或者用乙個小模型來解決它。 兩類公司的路徑不同,但有一件事必須先做,那就是用自己,去體驗和感受這種模式帶給你的不同,這樣你才能好奇、感受、欣賞。 我今天要用這個模型,就像朋友一樣,你可以感覺到什麼是有效的,什麼是無效的。
張鵬:你得先成為大模型的超級使用者。
王小川:相信極客公園的粉絲天生就有這樣的動力和好奇心。 一旦你使用它,你就會受到啟發,你會知道它擅長什麼,然後把它變成你對下乙個產品的想法。
張鵬:大模型技術還處於上公升期,所以我們要先跟著走,走近它,然後才能考慮如何應用。
公司在不斷發展,您必須不斷招聘。 去選產品經理的時候,會講究什麼樣的氣質和經驗,能不能開啟你的選人標準?
王小川:百川計畫明年發布一款超級APP,我們不談經驗,只談一些想象。
我們真的很希望找到以前有經驗的人,如果你以前沒有經驗和想法,你說我想創業,在這種情況下,創業是相當困難的。 我們將要求您能夠完整地丟擲產品並具有影象感。 為了能夠想象乙個大模型是什麼樣子,你也有足夠的動力、好奇心和想象力。
王小川詳細解釋了AI時代產品經理既要要又要極客園區。
同時,我們也希望您有製作傳統產品的經驗。 也就是說,我希望有以前成功的經驗,但我也可以打破自己的經驗來滋養大模型,也構思出大模型的新面貌。
今天,中國的環境與美國不同,包括百川和國內企業,都處於與時間賽跑的狀態,給不了你三五年的探索時間。
張鵬:如果乙個人有相關領域的經驗,但沒有技術能力,他能獨立探索大模型的應用嗎?比如你在健康領域打拼,我在健康領域積累了很多年,我也有你說的氣質。 我加入貴公司了嗎?或者你也可以在插入別人的模型後自己探索一下嗎?
王小川:大家都會做這兩條路,也會有人自己去探索,但是很有可能在探索過程中會發現自己走不了路,有一種無力感,到頭來還是需要模型的支撐。
因此,目前在中國,加入模範公司的可能性更大,因為它還沒有達到可以獨立應用的程度。 網上有文章說可以調整模型進行應用,而這個時代還沒有到來。 未來兩年,最好加入一家能提供平台級支援的公司,幫你打破原有的體驗,進行整合,這樣成功的概率會大很多,說不定會是超級應用。 做乙個小應用程式是可以的,但要做一件大事,試著與模型公司充分互動。
張鵬:聽上去他們還是想讓我加入百川。
王小川:主要看你是想做大還是做小。
張鵬:要想做大,就得去百川。
王小川:是的。
張鵬:4月份,大家都想熬夜,但現在大模特已經跑了8個月了,剛開始的興奮幾乎已經消退了。 創業難,經過一段時間的沉澱,你這次創業的心態如何?
王小川:8個月來,團隊跑得快,成長快。 現在我們已經到了大模型比較沉澱的時期,雖然我們覺得我們以前的技術、能力、產品、關注、經驗都足夠了,但是我們還是覺得做的時候還不夠輕。
在共同探索大模型方法的過程中,我們對如何找到模型與應用之間最有效的聯動的理解也在不斷提高。 我認為乙個好的狀態是看到你乙個月前還是個傻瓜,然後你又在進步。
幾年前我剛開始工作時,我以每週的速度進行迭代,我會發現我沒有足夠的想法,但這次(大模型啟動)我們回到了月度單位,我們沒有達到那種敏捷狀態。 乙個月後,我看到了我以前的缺點,在快速迭代中。 為了參與大模型時代,我們的管理層和產品經理都在戰戰兢兢,不斷調整著自己原有的工作方式。
張鵬:這是你非常喜歡的狀態。
王小川:是的,我每天都在鞭策進步,我還是有多維度的成長,即使我的想法可以領先半步,但有時我發現我邊走邊有更好的想法。
張鵬:我挺理解這種狀態的。 再過五年,這家公司會是什麼樣子,你會感到更滿意?公司的目標是什麼?
王小川:在幫助人們創造、健康、快樂這三個方向上,我們有超級應用可以探索。 希望是一到五年,五年真的不敢想,因為五年後,技術發展的高度可能不是我們現在能理解的,每天我們的技術人員感嘆有新的**和開發出現,有一種強烈的推後意識。
我希望在兩年內,我們能證明大模型可以作為超級應用,在健康、娛樂、幫助人們創造方面,能給網際網絡時代這樣的人們帶來很大的幫助或希望,人們可以體驗或者使用它,我有這個信念。
五年後,我們可能會有一種全新的玩法,也許五年後,地面上的機械人在執行,每個人都戴著VR眼鏡,每個人的數位化身都出來了。 五年太長了,想到兩年的照片我就很滿足了。