提供1000+AI效率工具丨歡迎關注。
AI Singularity.com-AI 工具特刊丨3月5日。
大洋彼岸的AI競爭越來越激烈,內卷撕裂也愈演愈烈。
春節剛過,谷歌就發布了新一代雙子座1號5 個模型,提供百萬級代幣上下文視窗吞吐量,猛烈碾壓 GPT-4 八條街。
上周五,人工智慧初創公司XAI的創始人埃隆·馬斯克(Elon Musk)以個人名義起訴OpenAI及其主要管理層,包括奧特曼,要求後者“恢復”公司成立的初衷——開源大模型。
新恨舊恨疊加,競爭對手的攻勢越來越猛烈。 螳螂抓到蟬,黃雀在後面,還有人偷偷加速。
當地時間3月4日,由OpenAI的叛逃者隊友創立的人工智慧初創公司Anthropic悄然發布了新一代大型語言模型Claude 3。
長期以來,Anthropic 一直被認為是 OpenAI 最強大的競爭對手之一。
其核心團隊是OpenAI的創始團隊成員,他們因為路線不同而分道揚鑣。
此次發布的Claude 3是該公司最引以為豪的新一代車型。
孤獨的GPT-4這次迎來了真正的對手
它也是乙個多模態大模型,支援影象和文件的解釋。 他們直接丟擲乙份超過46頁的技術報告,備受矚目的王坡賣瓜——
全面超越GPT-4!
還發布了乙份評估資料報告來支援它。 有趣的是,谷歌最新的雙子座也非常慘。 換句話說,GPT-4 是行業標桿。
這樣打臉不好玩......
除了一般的文字主旨領先,在多模態理解方面,該權利要求也超越了視覺大模型GPT-4V。
聽著克勞德的官方吹捧,網友們都高興起來。
也有有趣的人直接開始製作表情包,發推文(X)質疑奧特曼——GPT-5什麼時候發布?
與谷歌的 Gemini 類似,新一代的 Claude 3 分為三個版本,分別是俳句、十四行詩和 Opus。
從模型的引數尺寸來看,可以理解為中杯、大杯、超大杯。
十四行詩免費供所有人使用。
雖然 Anthropic 沒有給出模型的具體訓練引數,但它確實給出了模型的三種大小的粗略場景:
haiku:它是響應速度最快的模型,也是成本最低的選擇,它在大多數純文字任務以及多模態功能(如視覺識別)上仍然表現良好。從 Anthropic 的官方宣告來看,很明顯,超越 GPT-4 指的是 OPUS 的規模。SONNET:適用於需要平衡效能和成本的場景,在純文字任務上的表現與OPUS相當,但成本更經濟,適合需要稍好效能但預算有限的企業和個人使用者。
OPUS:較強的推理、數學、編碼能力,接近人類的理解力,適用於需要高度智慧型化和複雜任務處理的場景,如企業自動化、複雜財務**、研發等。
從本週開始,Claude 將向 159 個國家/地區開放——任何知道它的人,中國之環。
其中,OPUS和SONNET模型的API已經上線,開發者可以直接使用。
最全面的十四行詩版本可以通過註冊和登入免費試用,而 OPUS 可供 Claude Pro 訂閱者每月 20 美元使用,與 GPT-4 相當。
既然官方已經把話說出來了,那就來測試一下吧!
克勞德 3 動手經驗:GPT-4 最佳替代品
再一次,實踐是真正的篇章。
但是,所有評估都有其自身的主觀性和侷限性,因此結果僅供參考,因此請親自體驗。
首先,Claude 聲稱他的訓練資料集只到 2023 年 8 月,EVA 對這個回覆有些懷疑。
因為我馬上問了乙個關於“馬斯克和奧特曼”之間的恩怨的問題,它沒有回答。
雖然克勞德對兩人的身份沒問題,但這個過程是認真的胡說八道。
顯然,AI幻覺現象依然突出。
接下來,我問了乙個特別測試人工智慧聊天機械人的殺手級問題
傑克馬、小馬馬、馬克思和馬斯克,他們都有“馬”這個姓氏嗎?
這個問題,普通的AI機械人都答不上十分,在我的印象中只有GPT-4和崑崙萬維的天宮通過了測試。
克勞德 3 給我的答案是迄今為止最完美的答案。
詳細、詳細、邏輯清晰。
讓我們再問一次傳統的社會問題:為什麼中國足球越來越差?
除了大家都知道的前三點,後三點是我首先想到的,這是有道理的。
再問乙個AI行業近期的熱點話題:中美在AI方面的差距主要在**?
Claude 3給出了完整而詳細的答案,並明確指出了問題的關鍵——人才、算力和資料優勢。 此外,也凸顯了國內企業在AI商業化方面的滯後性。
接下來,讓我們來看看 Claude 3 的多模式功能。
我上傳了一張馬斯克和奧特曼的相框照片,讓他破譯他們的關係。
克勞德3認出了馬斯克,但不是奧特曼,也許在訓練資料集中,他不夠出名?
有一點要說,奧特曼後來出圈了。
再放乙個大氣水迴圈的科學圖,克勞德3號具有很強的分析能力。
擷取 Claude 自己網站的螢幕截圖,讓它生成乙個網路源**,而且沒有壓力。
猜猜地名,你在螢幕前猜到了嗎?
只提供作品的例子,讓它推理它背後的創意藝術家。
賓果遊戲,給出的答案也很準確,很難打敗它!
最後值得一提的是,克勞德3對乙個時間段內提出的問題數量也有限制,玩了一會兒後,伊娃的問題數量就會用完。 而且今天使用它的人太多了,反應很慢。
從目前所經歷的主觀感受來看,克勞德 3 確實達到了 GPT-4 的平均水平。 至於你,你不得不說碾壓或超越,因為考試中的問題還是太少了,無法客觀地證明。
此外,克勞德3和GPT-4在回答一些問題上各有長短,很難說誰更勝一籌,誰必然是最好的。
而從客觀的角度來看,GPT-4是乙個相對成熟的商業模式,它更注重穩定性和可靠性,而初出茅廬的克勞德3則不是。
克勞德3是技術上的一大突破,但商業化是難點
雖然Anthropic再次展現了技術實力,但時隔漫長的一年,大型車型的技術競爭已經從路線之戰走向了商業化之戰。
如何從模型走向實際產品落地,創造更大的商業價值,是懸在開發者頭上的達摩里斯之劍。
Anthropic 是 Google 和 Amazon 的幕後推手,OpenAI 是 Microsoft 的後盾,從實際角度來看,如果 Anthropic 今年不能實現商業突破,它將逐漸與 OpenAI 分離,甚至不排除被所有者收購。
2024年,Anthropic仍然承受著巨大的壓力。
根據The Information的最新報告,Anthropic對投資者的預期是,預計將產生超過8年化回報率為5億美元。
相比之下,OpenAI 現在每月能夠帶來 13,160 億美元的收入。 在Microsoft的加持下,OpenAI的商業化步伐仍在加快,這也直接引發了馬斯克的不滿和訴訟。
人工智慧系統的軍備競賽才剛剛開始,推出一款執行良好的大型模型只是長征的第一步。
【**丨ai奇點網路丨全網賬號同名丨歡迎關注】。
AI奇點丨提供1000+AI效率工具丨歡迎關注。