繼里程、車內大屏、智慧型駕駛之後,電動智慧型汽車捲起了高階人工智慧。
12月20日,星途星時代ES搭載奇瑞“雄獅AI”大車型10日,理想汽車5歲OTA 版本 0 召開發布會,重點介紹車上一款名為 Mind GPT 的大型模型;此前,GPT車型文心一妍已經分別搭載了極月01和銀河L6;文捷、小鵬汽車、蔚來汽車、長城汽車也紛紛研發或聯合開發自己的大車型,華為盤古、XGPT靈犀、諾公尺GPT、咖啡GPT計畫分別安裝在M9、X9、ET9、藍山車型上。 梅赫西迪-賓士正在探索在海外直接上車的ChatGPT模式。
但從功能上講,現階段的大多數GPT更像是車內的“娛樂專案”,回答問題,生成一段文字或一張圖片。 “我們還要做一輛與汽車相關的汽車,只是複製手機上可以實現的功能,感覺毫無意義。 某汽車公司的研發人員對目前在汽車上的GPT發表了評論。
公交車上的GPT,是時尚還是戰略布局?
可以“控制”汽車的理想 MIND GPT
它只能用作“娛樂專案”,因為大多數 GPT 目前更像是車上的乘客,只能聊天,而不是車輛的一部分。
在連線性方面,大多數GPT仍然在雲端,通過網際網絡“上車”,只能通過螢幕和音響系統接收人類的輸入,並輸出。 當有人說“我很冷”時,不可能像目前的語音助手那樣調高車內空調的溫度。
在《電動汽車觀察家》的不完全統計中,理想的MIND GPT相對領先,已經具備了一定的駕馭汽車的能力。
目前,Mind GPT在雲端和車端都有模型,規模不同,責任範圍也不同。 除了“聊天”。Mind GPT可以在車內呼叫“車輛控制、行駛、**”的API(應用程式設計介面),配合語音助手系統提供服務和響應。
比如想吃火鍋,只需要告訴理想中的同學,我們的車機介面就會生成火鍋的**供你選擇,自動計算出行路線等,實現一系列高效自然的操作。 理想汽車空間軟體負責人李濤在接受採訪時舉了乙個例子。
在這背後,語音助手感知到語音和視覺訊號後,mindgpt對其進行識別和理解,並自行判斷是否生成命令(呼叫搜尋導航功能)。 如果決定生成指令,則該指令用於呼叫外部介面或向車輛機器進行執行和語音反饋廣播。
MindGPT 必須考慮何時呼叫哪個 API,傳遞哪些引數,並根據 API 返回內容生成回覆,這是一套新的基於大型模型的代理(人工智慧**)架構。 理想汽車的一位研發工程師告訴《電動汽車觀察家》。
未來:從語音助手到人工智慧代理
以前,“呼叫哪個 API,傳遞什麼引數,根據 API 返回內容生成什麼樣的語音”都是由人類工程師完成的。
目前,包括智慧型手機、智慧型座艙在內的電子裝置或應用產品,基本上都是由工程師封裝成圖形化的UI,使用者可以按照一定的規則點選實現。
例如,點選“**模式”,點選二級頁面的“fm”模式,點選**頁面的“頻道”模式,實現“收聽廣播”的功能。
VOS(語音作業系統)模組架構。
目前,語音助手可以實現通過語音傳送人類指令,但底層仍然是應用封裝路徑對應的語音指令庫來實現功能。
在這種模式下,互動和功能是固定的和不靈活的,但約束和準則是明確的。 因此,新系統的學習成本對於人類來說是很高的,但一旦實現,功能實現的成功率就極高。
GPT 提供了另一種互動方式。
雖然GPT和VOS(語音作業系統)的核心模組屬於NLP(自然語言模型),但它們具有以往NLP模型所不具備的理解和推理能力。
以前,NLP模型主要用於識別“你在說什麼”。例如,“冷”、“開放”、“等”。 GPT具有通過上下文和環境資訊理解“單詞含義”的能力例如,在談話過程中,對“你(笑話)太冷了”的回應不是開啟空調,而是講乙個“溫暖的笑話”。
因為GPT可以根據提示進行擴充套件、完成、改進,從而生成新的文字內容,甚至可以將其轉換為**、語音等其他模態。
提示是向模型提供輸入以指導模型生成特定輸出的文字或指令。 然而,與通常需要明確甚至單一提示的語音助手不同,GPT 提示可能複雜而模糊。
就像人類經常忘記一樣,但當被提示時,他們會立即記住。 這個“提示”可以是一句話、乙個詞,甚至可以是乙個沒有直接關係的場景或物體。 提示用於幫助 GPT 回憶他們在預訓練期間“學到”的內容。 預訓練越豐富,對語言的理解就越深。
當這種理解與呼叫API的能力相結合時,人與機器之間的互動不再是通過手操作機器,而是與助手通訊以完成任務。
以原有的算力,沒有辦法解釋你的意圖,所以使用GUI來預設你的意圖。 現在有了 LUI(語言介面,基於 GPT 理解),它可以解釋您輸入的所有意圖,然後靈活匹配所有 API。 藍湖&Mastergo創始人任陽輝表示:“我認為未來所有的能力都可能同質化,比如可以買貨、訂機票、訂酒店等等......在任何應用程式中只要你說話,就沒事。 即使這個 API 在這個應用程式中不可用,它實際上可以在 API 市場中呼叫,並且可以隨時提取。 ”
演示:偽場景和基本準備
搭載新款梅赫西迪賓士e的“場景”功能。
事實上,除了聊天和畫畫之外,很多車企也在探索賦予GPT一定數量的車控能力,基於車內人的狀態和表情,自由組合一些基於場景的功能。 “但據我所知,GPT可以應用的場景是相對低頻的,不需要車機佔據手機能做的事情。 上述車企研發人員表示。
就像GPT本身還沒有形成商業模式一樣,GPT也還沒有找到乙個可以被人們高頻使用的場景。
另一方面,車輛的算力與GPT要求之間存在巨大差距,降低了模型的效能。 完全依賴雲計算能力意味著延遲增加,這對於高安全性的汽車來說是不可接受的。
然而,在探索過程中,汽車智慧型化和GPT的方向是一致的。 目前,小鵬汽車、智際、賓士等多家國內外車企推出的“場景”功能,車主只需簡單的程式設計,就可以組合成新的應用。 在它的背後,它由數百甚至數千個封裝的原子級 API 支援。 而這些原子級的能力,也將為GPT未來作為助手調動資源提供基礎。