對話王曉川 大模型創業的核心是思考技術如何匹配產品

Mondo 科技 更新 2024-01-29

作者 |萬辰,大膽創新計畫

編輯 |靖宇.

在過去的八個月裡,百川智慧型團隊依靠搜尋、高質量資料處理等AI技術的積累,對模型的規模和質量進行快速迭代。 百川智慧型創始人兼CEO王小川認為,百川應該在理想上慢半步,在落地上快三步。

2024年12月16日,在2024極客園創新大會上,王小川進一步分享了關於大模型的新思考。

對於大模型的演進方向,王曉川認為,目前大模型是學習,而不是思考,模型演進的下乙個方向是學習和思考相結合。 在大模型時代,必須考慮大模型技術的特點,這是過去和現在做產品的最大區別。

過去做應用的時候,總是講產品與市場的匹配——PMF(產品市場契合度),但在產品與市場之外,卻漏掉了乙個字,技術。 」

他認為,目前的大型模型技術離AGI還很遠,更重要的是在這種不完善的前提下明確:什麼樣的產品適合這樣的技術,而不是產品經理對市場有洞察力,回來就開始動手。

在王曉川看來,在大模式帶來的新發展正規化下,產品經理的出發點應該是從思考產品市場匹配(PMF)到思考如何匹配技術與產品,即TPF(Technology Product Fit)。

王小川認為,首先是提供比傳統應用好10倍的體驗,使用者才能用好。 要做出這樣的應用,產品經理不僅要自己是模型的狂熱粉絲,還要有傳統的產品經驗和想象力,能夠弄清楚模型是什麼樣子的。

以下為王小川極客園創新大會2024對話實錄。

張鵬:你參加過我們大會很多次了,剛才你認真聽兩位技術專家講了前段時間OpenAI事件背後的一些關鍵因素,甚至提到大模型需要有慢思考的能力,不知道大家怎麼看?

王小川:是的,今年我們正在籌備大模型到4月份公司成立,我提到了幾個關鍵詞,乙個叫搜尋增強,因為要連線傳統知識,第二個我希望大模型是做強化習,當時, 我提到這一點,是因為我看到大模型本身就代表著一種快速思考的方式,就像乙個人一樣,我一拍腦袋就給你答案,我可以說它在學習習和應用推理方面有自己的缺點,當然不光以大模型為本, 當時我們認為強化習可以有很大的幫助,這也是百川內部工作中一直非常關注的領域。

張鵬:只是慢慢想?

王小川:是的,就是慢思維,和慢思維相比,今天的大模型代表的是快思維。 我們來談談我自己的兩個觀點:快思維不叫思考,慢思維我覺得它有這麼多的思維,以openai大模型為代表,它叫學習,它的知識是學習的。

我不強調推理的“思考”,其實人們在學習的時候,可能要思考很久,這叫思考,所以孔子之前說過,不思而學的學習是魯莽的,不學的思考是死的。 」

具體來說,大模型在學習,它其實不是在思考,它不像人一樣,會來回琢磨,會開啟想象空間去看,什麼系統在思考?OpenAI 剛剛創辦了這家公司,而 DeepMind 正在做的事情,比如做 AlphaZero 和玩遊戲,都在考慮它。

但那是強化學習的設定,叫做多智慧型體的對抗,alphazero它不是乙個學習習系統,它拋棄了之前的6000萬盤(西洋棋訓練),但它本身就是在對抗博弈中,在博弈中尋找新的理解,最後通牒,就是這樣的思維。

AlphaZero在思考後就停在原地,它已經死了,它只做乙個特定的任務,不能擴充套件到其他領域,所以我們說大模型代表學習,alphazero代表思考,這兩個系統在一起會非常強大。

百川智慧型創始人兼CEO王小川、極客園創始人兼總裁張鵬分析了極客園大模型的學習與思考。

張鵬:所以接下來重要的是真正學習和思考,對吧?學習和思考應該結合起來。

王小川:沒錯。 更具體地說,我們想到了這個場景,你問大模型怎麼下圍棋,它居然玩不出來。 但是你問你能不能判斷乙個輸贏的圍棋選手?乙個大型模型可以根據它已經知道的東西來判斷。 即使你說你寫了乙個**來決定這個圍棋的輸贏,大模型也可以寫這個**。

你讓它寫乙個**,每一步走完棋后,走棋的狀態是怎麼轉移的,也就是下棋的整個過程,也可以寫出來。

所以試想一下,如果大模型足夠強大,雖然不會直接下圍棋,但可以寫出下圍棋等狀態轉換(事務函式),最終決定圍棋的輸贏。 也就是說,大模型有機會寫乙個alphago**然後執行它,執行完之後,就可以下棋了,這個事情就有機會發生了。

張鵬:歐美的技術還在不斷的探索邊界,這也讓人感到壓力,你覺得這個距離該如何衡量和縮短?你能自己創造不同的價值嗎?

王小川:我去美國之前,在百川說過這句話,就是理想上要慢半步,落地要快一步。 後來,去美國回來後,他把理想對折,變成了落地時慢一步快三步的理想。

張鵬:你怎麼理解理想是慢一步,落地快三步?

王小川:和他們接觸後,我覺得雙方的底層思路是不一樣的,OpenAI是乙個非營利性組織,它只是想探索AGI的邊界,他們真的做到了。

我上次和他們交談時,他們想嘗試將 1000 萬個 GPU 放在一起,構建乙個足夠大的系統。 1000 萬個 GPU 的概念是什麼?英偉達每年生產 100 萬件,GPT-4 約為 25,000 件,我們今天以 GPT-3 為基準5 只有 4,000 個 GPU。 他們在思考問題的時候,他們的出發點和我們不在乙個世界,所以在這方面我們無法和他們比較。

在這種情況下,人和企業都要找到自己的定位,而在這片土壤中,我們必須有信心,我們有機會在應用落地上走得更快。

也許隨著我們的使用者資料集越來越大,技術積累得越來越強,我們的應用可以足夠好,甚至可以在美國使用。 在這種情況下,這並不意味著您必須達到 GPT-4、GPT-5 和 GPT-6 的階段才有機會應用它。

不同的土壤生長著不同的東西,做應用是中國的傳統強項,也是一種創新,但我認為這是公平的。 這對中國企業來說也是乙個更好的機會,尤其是現在美國被OpenAI主導,做應用的企業要面對OpenAI的技術來做應用,就可以做它的技術做什麼樣的應用。

但是,國內的樣板企業可以自己做應用,這種端到端的連貫性,在應用落地的時候,有機會在某個領域比美國公司跑得更快。

王小川認為,中國的大模型在極客園的應用中可能會跑得更快。

張鵬:有時候我們肯定願意追求一種理想和使命感,在AGI的大過程中,我們可以加入這個團隊,他們可能是前鋒,突破界限,但我們可能是自由人或中場,但他在團隊中也有意義,比如我可以把技術放下,變成有價值的東西。

王小川:這兩個層面都會有推導,彭先生剛才說的是,你作為乙個全球公民,作為一家中國企業,是世界分工合作,而不是朋友和敵人的劃分,只有競爭關係,我們尊重他們的發明,我們迎頭趕上, 但我們也有自己獨特的貢獻。不僅僅是:我認為我需要我自己,世界不需要我。

張鵬:很好,我想得很清楚,在這波創業浪潮中,我找到了和自己和解的一點,那就是,我們該如何成為世界上一場有意義的比賽的玩家,不是每個人都必須是前鋒。

這就給我們帶來了另乙個問題,今天大家都在談論超級應用,但是他們沒有看到未來超級應用是什麼,而李彥巨集剛才也說,今天還不確定。 但我認為,如果我們想做乙個超級應用,我們需要什麼樣的起點?例如,過去我們談到了PMF(產品-市場匹配),但是今天如何做這個PMF

王小川:是的,我覺得這個點可能離得越來越遠。 究其原因,當我們想象重構原有的應用時,比如再次重構微信,這個視角可能會一下子限制我們自己,所以首先,你要把這個視角縮小出來。

所以,回到做超級應用,乙個長期的方向是它代表了人們的基本需求,而這個基本需求,我把它歸納為三個關鍵詞,人需要具備三樣東西:一是要有創造力,二是要健康,三是要快樂。

健康和快樂對大家來說都很容易理解,但創造力來自於世上人總希望你的存在與世不一樣,你可以改變世界,所以如何幫助你改變世界,是乙個可以獨立分離的範疇。

當我們有了這個願景,如何做健康,如何做娛樂,如何幫你獲取資訊,讓你更有創造力,長此以往,這三個方向就會有。 但另一方面,我們也會扔掉一些東西,比如做營銷文案,幫你做客服對話,其實大模挺擅長做的這些,但我認為這些並沒有回歸到人們的根本需求,這就落入了原來的所謂重構邏輯。

所以,有了這樣的三個大方向的意識,我就會有不同的想法,這是一種已經開啟的思維,否則我就會掉進大廠競爭的坑里。

其次,我想提乙個重要的詞,就是我剛才提到了PMF這個詞,我想用乙個新詞,因為PMF總是講產品和市場的關係,我去掉了乙個詞,那就是技術。 技術,在AI時代,它仍然有很多不完善和不確定性,不像以前是**或微信。

我認為技術是現在的瓶頸,但實際上,技術問題肯定是可以解決的,只是取決於工程師的水平,成本等等,你想要的,都可以在工程層面實現。 然而,大規模模型技術,包括剛才提到的錯覺和時效性,只能用自然語言說話,而這種技術本身就有侷限性和不完善性。

所以我們離AGI還很遠,因為技術的不完善,我們要明確,一項技術適合什麼產品,而不是先搶占市場,環顧市場後才開始做,我覺得這種勇氣是挺可貴的,但是TP技術的第一性原理和產品如何協調, 如何去做,我認為是現在要考慮的事情。

乙個很好的例子是性格ai,character.AI的創始人其實並不是產品背景,他對技術非常熟悉,尤其是產品背後的演算法,他也看到技術本身並不完美,可能會出錯,所以他首先想到了將其用於娛樂行業。 其次,這項技術首先可以承載的是自然的對話,這是乙個角色,所以讓它成為乙個角色。

張鵬:所以它的缺點變成了特點

王小川:我先提兩個概念,乙個是以前我們以為是在做工具,而工具其實代表了很多確定性,但這次我們不是在做工具,這次我們是建夥伴,更像是新物種一樣的人。 我們人類必須接受它自己的缺點和長處。 人是幻覺的,如果他們有幻覺,我可以用它們,那麼為什麼機器不能用它們,如果他們有幻覺呢?

歸根結底,乙個人應該匹配一件事,所以在技術匹配方面,我們認為我們必須改變視角,不是從工具的角度,而是從乙個人的角度,這是我的想法之一。

張鵬:你剛才說的是技術-產品-配合,TPF,而不是PMF。

王小川:是的,對技術本身要有足夠的了解,這樣技術才能匹配相關的東西,這是對產品經理的要求,或者說公司第一崗位的產品經理應該有這樣的認知,大模型擅長什麼,不擅長什麼。 這個過程是創造人,而不是工具。

曾經有乙個關於國王和畫家的故事,國王乙隻眼睛失明,失去了一條腿,但他很自戀,如果他想畫一幅自畫像,他會拉著全國各地所有的畫家畫畫乙個,然後殺死另乙個, 因為畫得太像了,少了乙隻眼睛,少了一條腿,就是在誹謗形象。但是,如果畫家用熾熱的英雄形象來描繪他的眼睛,那就是他會欺負國王並殺死他,這個問題不會得到解決。 後來,一位畫家畫了一幅國王打獵的圖畫,站在一塊大石頭上,蜷縮著,一條腿被遮住,國王拉弓,失蹤的眼睛恰好閉上了。

技術擅長什麼,不擅長什麼,怎麼做匹配,這對產品經理有更高的要求,我稱之為TPF。

張鵬:我覺得TPF這個詞很好。 TPF似乎是起點,如果我們站在未來,我們想做超級APP,我們怎麼能把TPF做好呢?什麼是好的TPF?

王曉川:過去產品經理寫的更多的是描述功能的定義和要求的文件,可以畫出結構設計圖給老闆看,產品是這樣的,滿足使用者的需求,準確實現每一步的功能。

今天的大模型不是這樣的,每次輸入乙個大模型,它的輸出都是不確定的,乙個字都做不完。 在這一點上,很難用一套演繹規則來解釋這一點。 邏輯是演繹的,必須拆解成一堆評價集,產品經理的要求不僅僅是定義產品,而是將定義的產品轉化為後面的評價集。 也就是說,在某種輸入下對模型的輸出做什麼樣的測試集。

此時,技術對應的不是工程人員,而是演算法人員。 演算法之前的工作習是你給了我評估集,我優化了我的演算法以滿足評估集。 無論是通過提示方法,還是 SFT,還是後訓練方法。 在這種情況下,產品經理定義了評估集,技術獲得評估集後,再尋找資料集或訓練集來訓練系統滿足評估集。

王小川講解了如何為某大模型搭建OKR極客園區。

張鵬:這是為大模型設定OKR。

王小川:它有乙個非常嚴謹的數學評估方法。 從事過演算法研究的工程師會適應這種方法,最後用評估集和資料來說話,這已經成為我們內部的標準工作方法。

包括搜尋公司也是這種方法,搜尋是演算法驅動的產品,是用評論集驅動的方式,但是我們以前在網際網絡發展到高階階段,技術不是問題,甚至不再是演算法驅動,是工程驅動的,這個PMF沒有錯,只是少了一層TPF,最後你會發現產品不是不能滿足市場需求, 但一直在迭代,無法做出階段性的產品。

張鵬:你剛才在某種程度上解釋了乙個我非常關心的問題——ai原生的發展情況如何。 從本質上講,這是關於我們正在開發的東西,你必須在設定的目標下設定評估集,這樣才能有效地訓練資料集來滿足評估集的要求,這才是你真正的開發引擎。

王小川:叫ai原生。 如果是 agi 原生的,那就是更深入地採用 AI 模型能力的正規化。

張鵬:這確實對產品經理提出了新的要求。 以前我們說PMF做得很好,我們有一種感覺,比如使用者使用量的增加,使用者體驗非常好。 但是現在你如何評價做好tpf?

王曉川:TPF首先對產品經理有要求。

首先,它必須能夠將需求轉化為測試集,測試集將允許技術工程師在滿足要求時發現手感在改善。 而在demo推出時,使用者需求的分布與產品經理提出的評估集的分布完全相同,評估集中的結果能夠滿足使用者的需求。

其次,在推廣產品時會提到PMF,看營銷契合度(market fit)在市場上的分布是否一致,使用者是否滿意。

張鵬:如果使用者能用好你開發的產品,是應該用好還是用好?很酷的用途是使用者數量爆炸式增長,成為超級應用;用好它是乙個循序漸進的方法。 我們要追求一連串的爆炸嗎?還是先解決少數人的問題,然後再解決多數人的問題?

王小川:這並不矛盾。 首先,好是和原來相比,你能和自己比多好。 如果與成熟的大型廠家相比,好的%是乙個巨大的好處。 但對於創業公司來說,如果是AI原生的原生應用,就必須在一開始就用上,至少對於特定型別有特色的特定需求,使用者一定能感受到十倍的感知。

張鵬:酷是十倍。

王小川:不是更好,而是讓你感到驚訝。 如今,大模型必須選擇有亮點來做,體驗要提公升十倍,周邊需求要提高五三倍,這樣才能把高峰拉得足夠高,然後逐漸拉寬。 如果一開始不讓你涼爽,我認為這個產品還不夠,但它比原版更好。

張鵬:今天在會場的很多人,也非常關心如何參與到這個由大模特推動的新時代。 如果你想成為新正規化下的產品經理。 他們應該怎麼走?

王小川:從企業屬性來看,企業就是做端到端的,不僅要做應用,還要做模型。 乙個是更注重應用的公司,它不怎麼接觸模型,或者用乙個小模型來解決它。 兩類公司的路徑不同,但有一件事必須先做,那就是用自己,去體驗和感受這種模式帶給你的不同,這樣你才能好奇、感受、欣賞。 我今天要用這個模型,就像朋友一樣,你可以感覺到什麼是有效的,什麼是無效的。

張鵬:你得先成為大模型的超級使用者。

王小川:相信極客公園的粉絲天生就有這樣的動力和好奇心。 一旦你使用它,你就會受到啟發,你會知道它擅長什麼,然後把它變成你對下乙個產品的想法。

張鵬:大模型技術還處於上公升期,所以我們要先跟著走,走近它,然後才能考慮如何應用。

公司在不斷發展,您必須不斷招聘。 去選產品經理的時候,會講究什麼樣的氣質和經驗,能不能開啟你的選人標準?

王小川:百川計畫明年發布一款超級APP,我們不談經驗,只談一些想象。

我們真的很希望找到以前有經驗的人,如果你以前沒有經驗和想法,你說我想創業,在這種情況下,創業是相當困難的。 我們將要求您能夠完整地丟擲產品並具有影象感。 為了能夠想象乙個大模型是什麼樣子,你也有足夠的動力、好奇心和想象力。

王小川詳細解釋了AI時代產品經理既要要又要極客園區。

同時,我們也希望您有製作傳統產品的經驗。 也就是說,我希望有以前成功的經驗,但我也可以打破自己的經驗來滋養大模型,也構思出大模型的新面貌。

今天,中國的環境與美國不同,包括百川和國內企業,都處於與時間賽跑的狀態,給不了你三五年的探索時間。

張鵬:如果乙個人有相關領域的經驗,但沒有技術能力,他能獨立探索大模型的應用嗎?比如你在健康領域打拼,我在健康領域積累了很多年,我也有你說的氣質。 我加入貴公司了嗎?或者你也可以在插入別人的模型後自己探索一下嗎?

王小川:大家都會做這兩條路,也會有人自己去探索,但是很有可能在探索過程中會發現自己走不了路,有一種無力感,到頭來還是需要模型的支撐。

因此,目前在中國,加入模範公司的可能性更大,因為它還沒有達到可以獨立應用的程度。 網上有文章說可以調整模型進行應用,而這個時代還沒有到來。 未來兩年,最好加入一家能提供平台級支援的公司,幫你打破原有的體驗,進行整合,這樣成功的概率會大很多,說不定會是超級應用。 做乙個小應用程式是可以的,但要做一件大事,試著與模型公司充分互動。

張鵬:聽上去他們還是想讓我加入百川。

王小川:主要看你是想做大還是做小。

張鵬:要想做大,就得去百川。

王小川:是的。

張鵬:4月份,大家都想熬夜,但現在大模特已經跑了8個月了,剛開始的興奮幾乎已經消退了。 創業難,經過一段時間的沉澱,你這次創業的心態如何?

王小川:8個月來,團隊跑得快,成長快。 現在我們已經到了大模型比較沉澱的時期,雖然我們覺得我們以前的技術、能力、產品、關注、經驗都足夠了,但是我們還是覺得做的時候還不夠輕。

在共同探索大模型方法的過程中,我們對如何找到模型與應用之間最有效的聯動的理解也在不斷提高。 我認為乙個好的狀態是看到你乙個月前還是個傻瓜,然後你又在進步。

幾年前我剛開始工作時,我以每週的速度進行迭代,我會發現我沒有足夠的想法,但這次(大模型啟動)我們回到了月度單位,我們沒有達到那種敏捷狀態。 乙個月後,我看到了我以前的缺點,在快速迭代中。 為了參與大模型時代,我們的管理層和產品經理都在戰戰兢兢,不斷調整著自己原有的工作方式。

張鵬:這是你非常喜歡的狀態。

王小川:是的,我每天都在鞭策進步,我還是有多維度的成長,即使我的想法可以領先半步,但有時我發現我邊走邊有更好的想法。

張鵬:我挺理解這種狀態的。 再過五年,這家公司會是什麼樣子,你會感到更滿意?公司的目標是什麼?

王小川:在幫助人們創造、健康、快樂這三個方向上,我們有超級應用可以探索。 希望是一到五年,五年真的不敢想,因為五年後,技術發展的高度可能不是我們現在能理解的,每天我們的技術人員感嘆有新的**和開發出現,有一種強烈的推後意識。

我希望在兩年內,我們能證明大模型可以作為超級應用,在健康、娛樂、幫助人們創造方面,能給網際網絡時代這樣的人們帶來很大的幫助或希望,人們可以體驗或者使用它,我有這個信念。

五年後,我們可能會有一種全新的玩法,也許五年後,地面上的機械人在執行,每個人都戴著VR眼鏡,每個人的數位化身都出來了。 五年太長了,想到兩年的照片我就很滿足了。

相關問題答案

    王小川創業8個月,大模特還沒到談PMF的時候

    這是王小川創業大模的第個月。王小川認為,過去很多行業常識和慣性做法,已經不適用於當下大模型時代目前,很多大機型的應用並不能真正滿足使用者的需求,如果再做下去,就會捲入大廠的競爭賽道。曾經被紅杉和AZ高度重視PMF 產品市場契合度 創業標準,因為技術正規化的迭代和現狀,已經不再適用於大模型應用的創業。...

    AICC圓桌對話 打破以下突破,實現大模型創新能力的突破

    年,全球科技領域最重要的事情是新一輪的人工智慧模型競賽。隨著OpenAI發布ChatGPT,國產大模型如雨後春筍般湧現,百模大戰 的盛況備受全球矚目,大模型的發展速度日新月異。然而,大模型早已從單一的技術競爭公升級為整個系統生態的競爭,勝利的關鍵在於誰能打下堅實的基礎和系統布局,更好地滿足AI驅動的...

    古人的智慧 孟可與魏暉王的對話

    在古代鄒迪,有乙個偉人,他就是孟可。為了傳播他的哲學思想,他曾經千里迢迢去見魏慧王。在他們的談話中,孟可以其敏銳的洞察力和深刻的洞察力給魏暉王留下了深刻的印象。兩人交談時,魏回王開門見山地問道 老爺子,遠道而來,能給我的國家帶來什麼好處?這是乙個直接而實際的問題,也是當時許多君主關心的問題。然而,孟...

    四川-甘-青大環路自駕路線

    四川 甘 青大環路自駕路線 近年來,自駕遊成為越來越多人喜愛的出行方式,追求自由輕鬆的出行體驗,讓越來越多的遊客選擇自駕遊。在中國西部,有一條被稱為 自駕天堂 的路線 川甘青大環路。這條路線途經川西高原和青藏高原,風光秀麗,山水壯麗,吸引無數自駕遊愛好者前來探索。下面,讓我們一起走進這條壯麗的自駕之...

    西部高校排名“洗牌”,四川大學位列榜首,有7 985所大學位列前十

    進入大學標誌著學生新旅程的開始。與小學和中學不同,大學校園讓成年大學生有更多的自由,遠離父母的嘮叨,大學老師不太可能像高中老師那樣提供建議。在大學期間,學生能夠結識來自世界各地的同學,優秀的人相互吸引。他們也是大學生,在校園裡也能找到志同道合的朋友。但是,不同學校的大學生之間存在差距。許多 名校光環...