這是王小川創業大模的第8個月。
王小川認為,過去很多行業常識和慣性做法,已經不適用於當下大模型時代目前,很多大機型的應用並不能真正滿足使用者的需求,如果再做下去,就會捲入大廠的競爭賽道。
曾經被紅杉和A16Z高度重視PMF(產品市場契合度)。創業標準,因為技術正規化的迭代和現狀,已經不再適用於大模型應用的創業。 王小川認為,目前更需要尋找的是TPF(技術產品契合度)。與其一群產品經理先去調研市場,不如先思考什麼產品適合當下不完善(大模型)的技術。 」
過去,人們習開發工具,但我們用AI構建的不是工具,而是乙個新物種。
在2024極客園創新大會上,王小川分享了自己經過八個月的實踐,對大模型落地的新認識,以及自己在科技新浪潮下創業的思考和沉澱。
以下是百川智慧型創始人兼CEO王小川與極客園創始人兼總裁張鵬的對話,經過編輯整理。
國王與畫家
尋找 AI Native 的寓言
張鵬:Robin 還表示,我仍然不確定 AI 時代的超級應用是什麼,那麼我們應該從哪裡開始呢?
過去,當我們製造產品時,我們會首先制定PMF(產品與市場的契合度),但現在呢?
王小川:有兩個層次,乙個是拉開,另乙個是拉近。
拉離就是重構,對原有的應用進行改動,比如微信再重構,但這種視角會限制我們的思維。
所以,我想繼續拉開,如果不是市場是這個超級應用的長期目標,而是滿足人們的根本需求?
人們需要這三樣東西:健康、快樂、創意。前兩個無需多說。 說到創造力,人們希望他們的存在能夠改變世界。 那麼,人工智慧應用如何幫助人們改變世界呢? 就像DIKW模型(資料到資訊到知識到智慧模型)的概念一樣,它為人們提供資訊、知識,甚至智慧。 這是乙個巨集大的願景。
目前,許多AI應用,如營銷文案、客服對話......在我看來,這些並沒有回到人類的基本需求; 而且,如果大家還這樣做,他們也將捲入與大廠商的競爭賽道。
回到 Closer,您剛才提到了 PMF——產品與市場的契合度,現在我想提出乙個新詞TPF(技術-產品契合度)。過去,人們只關注產品與市場的匹配,而失去了技術。 以前做**和微信的時候,雖然技術是瓶頸,但只要工程師的水平上去,成本上去,基本上就能突破這個瓶頸。 而現在的人工智慧技術,它本身就有一些不完善和不確定性。 例如,幻覺和及時性等問題只能用自然語言,技術本身就有侷限性和不完善性。
既然AI技術有那麼多的不完善,就沒有必要派一堆產品經理去思考市場,洞察完成後再開始著手,而是去思考這樣乙個目前不完善的技術適合什麼產品。
在這裡我想談談性格AI,他們公司的創始人(Noam Shazeer),變形金剛**的作者之一,並非來自產品背景。 他非常清楚大模特的底層技術,知道肯定會出錯,所以他先用大模特做娛樂產品,然後,他認為這個技術可以先承載自然對話的形式,所以他把產品做成人物和個人設計。
張鵬:在娛樂場景中,缺點變成了特徵。
王小川:以前,我們是在構建工具,而工具具有很大的確定性; 現在,我們用人工智慧構建的不是乙個工具,而是乙個合作夥伴——乙個新物種,乙個更像人類的應用程式。 它有優點也有缺點,就像人一樣。 如果人們有幻覺,我們可以使用它們,那麼如果他們有幻覺,我們為什麼不使用機器呢? 最後,它又回到了特定技術應該滿足的需求。
這是對產品經理的要求,公司與產品經理的第一位應該與這項技術產生共鳴,它擅長什麼,不擅長什麼。
再講乙個故事,有個國王乙隻眼睛瞎了,一條腿瘸了,但是他很自戀,於是他從全國各地請來了畫家給他畫自畫像,結果就是畫乙個,殺了另乙個。 因為有些人畫得太像了,他們因為誹謗形象而被殺害; 有人故意美化,因欺騙國王而被殺害......直到有畫家畫了一幅國王打獵的肖像,因為國王站在一塊大石頭上,他瘸腿的缺陷就會被遮住,國王拉弓的那一刻眼睛就閉上了,這樣他既不能誹謗,也不能美化,他會立刻照顧它。
所以,我認為今天的產品經理應該清楚AI技術的優勢和AI技術的不足,做TPF這樣的匹配和考慮。
PMF 評估使用者數TPF 取決於測試集
張鵬:PMF我們會設定一定的目標,我可以看到我已經在一些指標上完成了PMF,而TPF是今天的起點,如果我們以後想做超級APP,在什麼情況下可以算是TPF做得好了?
王小川:過去,產品經理寫乙份檔案,描述功能、定義和要求,並繪製結構設計圖,向老闆展示:產品這樣可以滿足什麼樣的需求,以及每一步的功能是如何準確實現的。
但是,此方法不適用於大型模型場景。 因為每次給乙個大模型輸入的時候,它的輸出都是不確定的,面對這種非唯一對應關係,你很難用一套演繹規則做好。
那現在怎麼辦? 你必須把它分解成一組評估,這是一組關於模型可以提供哪些輸入和什麼輸出的測試。 產品經理不僅定義產品,還將定義的產品轉換為評論集。
此時,產品經理將評估集交給相應的演算法人員,由演算法人員通過提示、監督微調(SFT)、後訓練等不同方法對演算法進行優化。 也就是說,產品經理定義評估集,(技術)演算法找到資料集(或訓練集)來訓練系統滿足評估集。
張鵬:這就像為大型模型設定 OKR 一樣?
王小川:從事演算法研究的工程師已經適應了這種工作方式,並為他們提供了一種既評估集合又留下空白的方法,這已成為我們內部的標準工作方法。 演算法驅動的產品使用審查集驅動的方法。
在網際網絡快速發展的前一階段,技術不再是障礙因素,甚至產品開發也不再是演算法驅動,而是工程驅動,只是執行速度的差異。
在大模型時代),PMF沒有錯,但是我們缺少了一層TPF,這會讓我們最終發現,不是產品出來後市場不滿意,而是我們一直在迭代,無法做出階段性的產品出來。
張鵬:你剛才提到的,設定目標——改造評估集——讓資料集能夠得到有效的訓練,滿足評估集的要求,這是你開發的引擎嗎?
王小川:沒錯,這就是所謂的 AI Native。 如果是 agi 原生的,則需要更深入地整合 agi 的模型能力。
張鵬:再次,判斷TPF做得好,是不是意味著產品的使用者數量增加了? 還是使用者認為您的產品體驗不錯? 如何判斷?
王小川:TPF在產品發布之前對產品經理有兩個要求。
首先,能夠將需求轉換為測試集該測試集使技術工程師能夠看到結果在滿足過程(目標)的同時得到改善。
其次,演示完成後,還可以找到使用者提出的需求,可能是簡單一句話中提到的需求,而這個需求的分布與產品經理評價集的分布是一致的。
這裡用到乙個統計概率的概念,其中使用者需求的分布與產品經理測試集的分布一致,評估集的結果滿足使用者的需求。 所以TPF以測試集的形式得到滿足,一方面滿足內部指標,然後在發布時,PMF反饋會反映使用者的需求反饋是否與測試集的分布一致,使用者是否滿意。
張鵬:那麼使用者應該好好使用,還是好好使用呢? 前者是一下子爆炸和上公升,後者可以一步一步來完成。 我們今天應該追求力量的爆發嗎? 還是先解決少數人的問題,然後解決多數人的問題?
王小川:事實上,兩者並不矛盾。
但什麼是做得好的呢? 你很容易把自己和自己比較,比自己好,不小心掉進了大廠人的老習。 如果是成熟的大廠,那麼是20%到30%,已經有巨大的效益了; 但如果是創業公司,AI 原生應用程式從一開始就應該易於使用者使用。在滿足特定班級的需要時,您的產品必須提供競爭對手的 10 倍酷炫,不是更好,而是驚喜。
因為今天大模型不是萬能的,你只能選擇亮點,做出10倍的好,而外圍(功能)是5倍、3倍甚至更差,這樣你的波峰足夠高,以後再逐漸變寬。 如果乙個產品一開始不讓你涼爽,不到一定高度,只是比原來的好,這還不夠。
新時代的企業家首先,有大模型的超級玩家
張鵬:在產品正規化的演進下,面對新的變化(新正規化),創業者應該如何進入市場?
比如剛才,我非常興奮,因為做產品的正規化不同了,我們想成為新正規化下的產品經理。 他們應該如何開始? 不是每個人都像你一樣,做過搜尋,做過很棒的產品。 我們不能每個人都貼上這個標籤才能進入。 其他人應該如何進入?
王小川:我認為這取決於公司的屬性。 一家公司是端到端的,它(公司)自己既要做應用程式,又要做模型; 另一類公司不碰模型或者用小模型來解決問題,而是多做應用。 所以,我覺得在路徑上會有一些差異,但通常都有乙個必要的前提——成為大模型使用者,就是把自己當成大模型時代的粉絲,去熱情地去體驗,去感受大模型給(你)帶來了什麼樣的不同,去好奇, 去欣賞,去感受(它)是否做得好。
張鵬:在某種程度上,你必須首先成為大型模型的超級使用者。
王小川:[你]想用市面上的所有產品,極客公園的讀者自然是有動力的,充滿了這樣的好奇心。 一旦你使用它,你的靈感就會來到你身邊,你會知道它擅長什麼,你會把它變成你未來產品的想法。
我想在未來兩年內製作乙個超級應用程式我還要加入一家大型模特公司
張鵬:在如今的技術浪潮中,你可能要先跟著它走,也要走近它,才能考慮如何運用它。
如今,公司在不斷發展,當你選擇乙個人時,你會注意什麼氣質,或者說是什麼樣的歷史經歷?
王小川:百川明年將發布一款超級APP,目前還在進行中。 我認為我們取得的成就還不足以實現我們今天的目標,所以我們只能談談我們在這個過程中看到的缺點帶來的一些經驗和一些想象。
我們真的很想選擇有經驗的人,如果你真的沒有(產品)經驗,也就是新手,這種情況會比較苛刻。 例如,您需要能夠丟擲產品的全貌。
你需要為未來的大模型會是什麼樣子做好充分的準備,包括裡面的東西,也就是說,你要有好奇心、想象力來推動你去做一些東西,你必須有這樣的能力。 同時,我們希望您以前有過傳統經驗,我們必須將其分解以滋養大局。
我們遇到的許多產品經理都有一套非常完整的思維正規化和框架。 但是,在製作大模型時,他希望將大模型的技術帶入原始的框架正規化,而不是解構原始的東西,這將帶來巨大的挑戰。
因此,我們希望(你)擁有之前的成功經驗,也能夠打破自己的經驗,滋養大模特,想象大模特的新面貌,這是既想要又想要的階段。
如今,中美兩國面臨的環境不同,百川等國內大型模型公司都處於與時間賽跑的狀態,在這種情況下,公司很可能不會給你三五年的探索時間。 在主要方向的情況下,我們的要求是既要有以前的經驗,又要能夠推翻和整合。
張鵬:那麼如果我在某個領域有經驗,但我沒有技術能力,我可以自己做應用探索嗎? 比如我在健康領域有多年的經驗,我有你提到的特點,我選擇加盟你? 或者你也可以用別人的模型來探索這個嗎?
王小川:每個人都會走兩條路。
會有人自己去探索,但是在探索的過程中,很可能會遇到一種無力感,那就是模型的支援,提示的優化,發現自己邊走邊走,所以今天,我覺得在中國的環境裡, 如果機會多了,最好加入大型模特公司。因為今天,該應用程式尚未獨立推出。 雖然有文章說可以通過調整模型來製作自己的應用程式,但實際上,這個時代還沒有到來。
在我看來,未來兩年,更多的是加入一家(大模)公司,可以得到平台級的支援,幫你分解整合原有的體驗,讓超級應用成功的概率大很多。
今天的大模型是Think Fast人工智慧需要慢慢思考
張鵬:剛才你說了OpenAI Drama背後的關鍵因素,背後可能有一些技術,甚至還談到了Q*(Q-Star))可能思維遲鈍,不知道大家有沒有關注過這件事情?
王小川:今年,我正在為大模特(創業)做準備,4月份正式成立公司,當時我提到了幾個關鍵詞,乙個搜尋增強,第二個密集化學習。
當時我之所以提出這一點,是因為我看到大模型本身代表了一種快速的思維方式,變形金剛就像乙個人,拍了拍腦袋,我給了你答案,然後張開嘴說話。 它在學習習方法和應用推理方法方面有其自身的缺點,(所以)以大模型為原點肯定是不夠的。
所以當時我們認為,強化化學習對此有很大的幫助。
就慢思維而言,我在百川的工作中一直非常關注這個領域。 今天的大多數(技術路線)都代表著快速思考,它需要緩慢思考。
如果說自己的看法有兩點,一是快速思考其實不叫思考,慢思考不叫思考。 於是我提出了乙個新詞,以openai為代表的大模型,它的知識是學習的,並不強調推理時如何思考。 孔子有句名言:“不思而學,不計後果,不學則死”。
那麼在想什麼系統呢? 相反,當 OpenAI 剛開始創業時,以及 Deepmind (之前)所做的事情——比如 AlphaGo 和玩遊戲,這是在考慮中。 但那是強化學習,甚至是多方藥劑的對抗。 Alphago不是乙個學習習系統,它拋棄了之前6000萬的棋局,而是兩個Alphago自己內心對抗的博弈,在遊戲中找到新的理解,最後通牒,讓有思考。
但是在alphago想完之後,它只是停在了原地,只是做乙個特定的任務,無法擴充套件到其他領域。 因此,我們說大模型(LLM)代表學習,alphago代表思維,如果這兩個系統結合起來,那將是非常強大的。
張鵬:嗯,所以接下來重要的是真正讓學習和思考結合在一起。
王小川:讓我們想象乙個場景,但這並不意味著 Q* 是如何做到的。
你問大模圍棋是怎麼玩的,但它其實不知道怎麼玩,也做不好。 但是,大型模型可以確定圍棋的輸贏嗎? 可以判斷,大模型可以寫**來判斷圍棋的輸贏。 即使你讓它寫一段話,也可以在每一步之後寫出來判斷遊戲的狀態。
所以我們可以想象,如果大模型足夠強大,雖然不會直接下圍棋,但可以寫出下圍棋的交易函式,最終決定圍棋的輸贏,也就是說,大模型有機會寫出alphago的**,跑(**然後下棋,這個事情是可能的。
因此,當我們思考Q*時,我們有機會在內部推測,大模型有機會產生一些思考框架,然後以傳統的方式思考。
理想情況下,慢一步在地面上快速三步
張鵬:那邊的技術還在探索我們面前的邊界,讓人感到壓力很大,而且你還做大模型,壓力轉嫁到你身上,你覺得這個距離怎麼測量呢? 我們能不能縮短它,甚至說我們未來可以自己創造不同的價值?
王小川:我之前提到過,有句話說理想是慢一步,落地是快三步,其實一開始並沒有說,一開始是“理想慢半步,腳踏實地快一步”,然後去美國(習學)回來把理想折成兩半, 它變成了乙個緩慢的步驟,並在地面上乘以乙個 3,稱為“快三步”。
張鵬:如何理解在地面上慢一步、快三步的理想?
王小川:和他們接觸後,我覺得雙方的底心是不一樣的。
OpenAI 是乙個想要探索 AGI 邊界的非營利組織,他們確實做到了。 所以,他們在思考問題的時候,出發點根本不在同乙個世界,離他們還有一段距離,要為自己的理想而奮鬥。 在這種情況下,人們和公司必須找到自己的利基市場。 但是在這片土壤中,我們確實要有一種自信,那就是我們有機會在應用落地上走得更快。
就像華為製造GPU處理器一樣,它可能沒有這麼好的高精度裝置,但這並不意味著我們不能製造東西,甚至(也許)能夠在本地執行得更快。
也許隨著我們使用者規模的擴大,資料積累的規模越來越大,技術積累的應用已經足夠高了,甚至可以(拓展)到美國市場。 在這種情況下,並不意味著你必須等到 GPT-4、GPT-5 或 GPT-6 才有機會被使用,不同的東西可以在不同的土壤中生長。
我認為做應用是中國傳統的強項之一,也是創新。 相反,我認為這是公平的,與美國相比,我們在理想情況下的前進方向會比他們弱,但我們在應用上會更快,中國公司將面臨更好的機會。
尤其是在OpenAI佔主導地位的今天美國,做應用的公司要面對OpenAI,它做什麼樣的技術,能做什麼樣的應用。 然而,在中國,是模式企業自己在做應用,這種端到端的連貫性有機會在某些領域落地應用(比美國更快)。
張鵬:你說的挺鼓舞人心的,有時候我們一定很願意懷著非常的理想和使命感去追求一件偉大的事情。 但是,如果AGI是乙個很大的過程,我們可以加入球隊,他們可能是前鋒,我們可能是自由人或中場球員,在團隊中是有道理的。 例如,我們把[技術]拿下來,把它變成有意義的東西。 這就是成為團隊一員的感覺。
王小川:這兩個級別都可以用這種方式推導出來。
作為世界公民,作為中國企業,你在世界上有自己的分工,這不是朋友或敵人的關係,而只是競爭。 我們尊重他們的發明,我們應該迎頭趕上,但我們也可以有自己獨特的貢獻,我認為我不需要我自己,[但]世界不需要我。
張鵬:好在,看來這股創業浪潮找到了與自己的和解點:那就是,我們成為了乙個世界裡有意義的(AI創業)遊戲中的團隊成員,並不是每個人都要成為前鋒。
白川創業八個月開始沉澱大模型側**
張鵬:最後乙個問題,關於創業的心態,我們都知道大家在4月份的時候都很興奮,現在已經8個月了,一開始的興奮估計已經磨光了,創業還是很難的。 今天,經過一段時間的沉澱,你對這次冒險的心態是什麼? 目標呢?
王小川:從4月到12月,團隊確實跑得很快,成長得也很快。 現在,我認為是時候開始沉澱大模型了。 雖然我們覺得以前在技術能力和產品概念上的經驗已經足夠了,但是當我們實際工作時,我們覺得還不夠輕。
有時我發現有些團隊的資源相對較少,但因為他們找到了適合大模型的方法,他們可以更輕量級地使用現有模型,幫助他們構思想法,製作原型,然後與技術對接。
現階段,我認為我們在大模型方法的聯合探索中,正在探索大模型與應用之間最有效的聯動,我們的理解也在不斷提高。 我認為乙個好的狀態是,每次看著乙個月前的自己,我都覺得自己像個傻瓜。 以前我工作的時候,是以每週的速度迭代,但現在我沒有處於這樣的敏捷狀態,我以每月的狀態看待自己的不足。
在這裡,我們的管理層和產品經理一起調整他們原有的工作方法,以獲得大模型時代的公式。
張鵬:所以這就是你認為讓你享受它的狀態。
王小川:是的,我每天都在進步,我有多維度的成長,不僅說我知道這些事情,而且想得超前半步。 但有時,你會發現,當你四處走動時,你會想出更好的主意。
張鵬:公司的目標如何,未來 5 年您會發現什麼更滿意?
王小川:在幫助人們創造、健康和快樂方面,我們在這三個方面都有超級應用程式可供探索。 但不需要5年,5年真的不敢想,因為技術發展的高度可能不是我們今天能理解的。
我們的技術人員都感嘆,每天新的**和新的發展,讓大家有強烈的反抗意識。 在這種情況下,我認為在兩年內,可以證明大模型確實可以作為超級應用使用,就像網際網絡時代給人類帶來的巨大幫助和希望一樣,在兩年內幫助大家體驗和使用。 這是乙個可以堅持的信念。
5年後,我想所有的玩法都可能是全新的,比如機械人在地上奔跑,大家都戴著VR眼鏡,大家的**atar轉殖都出來了。 5年太長了,想想2年後會是什麼樣子,我就很滿意了。
本文原自:極客公園。