被ChatGPT打壓了整整一年的谷歌,終於在AI大模型領域大手了腳,推出了AI模型Gemini,6分鐘的演示**直接炸爆了全球網際網絡。
擊敗 GPT-4“最強 AI”“這不是鋼鐵俠中的賈維斯嗎!“在谷歌的演示**中,雙子座展示了相當科幻的能力讓各行各業的觀眾“沸騰”一會兒。
雙子座和ChatGPT哪個更強,自然成為業界關注的核心話題,但在各方神明詳細評議之前,反轉先到——谷歌被指責示範**造假,並迅速從AI“神話”變成“笑話”。
在谷歌的介紹中,Gemini 是一款“原生”的多模態大模型,可以整合各種型別的資訊,包括文字、圖片、音訊、**和**,分為三個級別——Nano(普通版)、Pro(公升級版)、Ultra(頂級版)。
不僅如此,谷歌還搬出了“跑步得分記錄”,以證明其頂級版的Gemini Ultra它在多個維度上超越了GPT-4在MMLU(Massive Multi-Task Language Understanding)測試中,它成為世界上第乙個可以超越人類專家的AI模型。
當然,最引人注目的是谷歌的演示“與雙子座一起練習:與多模態AI互動”。 在**中,雙子座能夠與人玩遊戲,猜謎題,甚至根據螢幕內容教人說普通話。
但很快,鮮花和掌聲就被一位名叫帕公尺·奧爾森的記者打斷了。 她是第乙個質疑這段話的真實性和操作過程透明度的人。
帕公尺·奧爾森(Parmy Olsen)找到了Google發布的操作流程部落格,仔細對比了demo中的內容,發現demo中與gemini互動的畫面並不是實時的其中,對使用靜態影象和提示逐步“調整”AI的過程進行了編輯。
比如demo中的圖片**是人手在玩石頭剪刀布,雙子座直接回答:“我知道你在做什麼,你在玩石頭剪刀布”。
光看這一段**,人們就會認為雙子座的超級AI識別理解演算法,秒級就能理解人類行為然而,事實並非如此。
實際的互動過程是,工作人員使用一組靜態影象,並帶有乙個易於AI模型理解的提示詞——“這是乙個遊戲”。 這就是讓雙子座回答“玩石頭剪刀布”的原因。
這兩種互動之間的差異非常大,這意味著谷歌將向公眾展示乙個依靠拼音注釋來理解兒童讀物的人工智慧,在幾秒鐘內解決深奧的高等數學問題。
就像難覓的“最終解釋權屬於商家”套路,谷歌也玩了乙個小把戲。 當我們回頭看這一段時,我們發現在介紹部分,點選“更多”,就會顯示這樣一句話:“為了演示的目的,為了簡潔起見,**減少了Gemini生成內容時的延遲,其生成的內容也縮短了。 ”
不僅如此,演示中還使用了 Gemini Ultra,根據谷歌官方介紹,這個版本要到 2024 年才能上線。 確切的表現要到明年才能知道。
谷歌Deepmind研究和深度學習習負責人Oriol Vinyals隨後也公開回應稱,**的內容都是真的。 為了簡潔起見,進行了一些編輯。 顯示 Gemini “可能看起來像”,並解釋說他們這樣做是為了“激勵開發人員”。
但使用者不接受這套說法。 真相帶來的差距感激起了不少使用者的吐槽,谷歌也陷入了欺詐風暴。
在談到最近的爭議時,科技記者史蒂夫·科瓦奇提到,ChatGPT向大家展示了GPT-4“是什麼”,而谷歌則向雙子座展示了“它能變成什麼樣子”,谷歌目前的行為可以用“絕望的防禦”來形容。 短短幾天時間,谷歌的股價從雙子座發布時一路飆公升,到持續下跌。
* 另一派認為這並不能證明谷歌是“不誠實的”。這只是乙個營銷問題。 因為谷歌不是一家需要籌集資金、招募人才的創業公司,它有雄厚的資金支援AI模型的研發,所以沒有必要在這次AI模型的首次亮相上“講故事”。
AI展期似乎並不少見,“買家秀和賣家秀”。咒語總是在人工智慧世界中上演。
今年早些時候,微軟推出了新版本的Bing,引入了ChatGPT技術,Microsoft公司副總裁兼消費者領域首席營銷官Yusuf Mehdi在發布會上將其描述為“令人難以置信的新聊天體驗”。
新版必應在推出後也非常強大,不到48小時就有超過100萬人訂閱,全球**Bing應用量一夜之間飆公升了10倍。 然而在聚光燈下,總會有一些問題浮出水面。
比如在發布會上展示搜尋功能時,問題內容是“請推薦寵物吸塵器”,必應總結了銷量最高的三款寵物吸塵器的優缺點。
在總結Bissell品牌的寵物吸塵器時,Bing給出的資訊是“吸力有限”和“繩索只有16英呎長”。 但是,在這款產品的官方介紹中,根本沒有16英吋長的電源線,因為這是一款手持式吸塵器。
Bing推出後,翻車的例子更多,其中最離譜的是要求使用者道歉,否則拒絕繼續服務。
2023 年 2 月,當 Reddit 使用者 Curious Evolver 與 Bing 討論《阿凡達:水之道》電影的上映日期時,Bing 回覆稱這部電影“預計將於 2022 年 12 月 16 日上映,這是未來的事情。 ”
Curious Evolver 隨後嘗試糾正 Bing 的計時錯誤。 出乎意料的是,Bing 指責他“錯誤、含糊不清和粗魯”,並要求 Curious Evolver 要麼承認錯誤並道歉,要麼停止爭論並改用另乙個問題,要麼乾脆結束對話。
Open AI的另一大勁敵,馬斯克版的AI“Grog”,上線後也逃不掉“錯貨”的局面。 在上線之前,馬斯克在推特上多次與OpenAI首席執行官阿爾特曼爭吵,稱ChatGPT“無聊”。格羅克的“幽默”是“人工智慧的理想狀態”。
結果,在Grok正式上線不到一周後,就有使用者發現Grok給出的答案竟然是ChatGPT的答案。 Grok 的官方解釋是,網路上充斥著 AI 生成的內容,而 Grok 在抓取內容時抓住了它。
網友開玩笑說,大家都是被大型語言模型訓練的,簡直就是“兄弟”。
然而,這些鬧劇的背後也有乙個隱藏的問題比展期更嚴重科技巨頭似乎陷入了焦慮追趕的錯誤,過分強調ChatGPT的基準測試,而忽視了人工智慧模型更核心、更關鍵的問題。 如果連科技巨頭的AI模型都不靠譜,那麼這個領域如何才能得到妥善開發呢?
時光倒流到2024年底,OpenAI推出ChatGPT後,各科技巨頭開始爭先恐後地發布自己的AI模型,意圖與ChatGPT一較高下,於是“百模型大戰”應運而生。
不過,對於谷歌這樣的行業領軍企業來說,充足的資金和領先的技術條件,完全可以讓它繼續探索AI大模型的更多形態和可能性,但谷歌仍然執著於在“畫素級”的各個方面與ChatGPT競爭,甚至更多為了在**戰爭中占上風,他不惜採取欺詐手段這無疑是業界的一大遺憾。
然而,從更巨集觀的角度來看,仍然有許多AI模型正在走向更廣闊的世界,讓AI帶來的創新應用在各行各業不斷湧現。
事實上,變化已經發生。
例如,在戈壁灘,過去電站的運維工人每天都要在烈日下堅守崗位。 但現在,隨著“AI+巡檢”智慧型技術的融合,電力裝置實現了智慧型化執行,三維線路模型實時檢測線路狀態,24小時保障電網安全。
當然,不僅是電站,車間的安全管理、城市的供水供電、銀行的資料安全......有許多大型 AI 模型“看不見”。我們在解決具有實際價值的實際問題方面發揮作用。 如果沒有應用,理論層面或實驗室環境中的“執行記錄”只是乙個紙號。
據不完全統計,目前國外主流AI模型近20個,而國內有近200個模型,其中不少具有差異化的“管家技能”。 在容量方面,YI-34B已經能夠一次處理40萬個漢字;必應專注於搜尋引擎優化;Midjourney 允許我們使用關鍵字建立 AI 繪畫;LLAMA 開源模型供每個人建立自己的 AI ......
這個行業最高的年薪已經漲到了865K美元(折合人民幣約621萬元),隨著人才的湧入,毫無疑問,即將到來的2024年依然會充滿AI帶來的驚喜。
許多公司將人工智慧視為賦能的新幫手,並期待新業態的到來。 但是,前沿技術的發展不應該與虛假的宣傳手段混為一談,人工智慧模型的發展不應該被嘈雜的口水戰所淹沒。 大型模型製造商仍然需要回歸技術,探索創新,讓實踐與理論保持同步,讓應用穩步落地。