今天凌晨,GPT4再次全線超車。 沒有所謂的新聞發布會,沒有什麼華而不實**,只是在X(Twitter)上發了一條帖子。
此次推出的新型號Claude3與谷歌去年發布的Gemini非常相似,它包含了三個不同版本的中杯、大杯和超大杯。
該模型是由 Anthropic 公司發布的,該公司由 2021 年離開 OpenAI 的兩兄妹創立,因此有些人認為他們是 OpenAI 逃跑的叛徒。
Anthropic目前估值超過100億美元,在矽谷僅次於OpenAI,投資者包括谷歌和亞馬遜,顯然是想利用Anthropic來對抗Microsoft,而Anthropic誕生於OpenAI。 總的來說,這家公司的創始團隊確實掌握了GPT模型的很多內部秘密,所以他們產品的實力不容小覷。
去年,Claude1 和 Claude2 模型經常與 GPT3 一起使用5 和 GPT4。 與此同時,去年OpenAI內部發生了一場公開鬥爭,董事會甚至考慮將OpenAI出售給Anthropic,但對方不同意。
Claude3 有三個不同的版本:Haiku、Sonnet 和 Opus,從低到高都有,成本也相應增加。 評估標準與去年 GPT4 發布進行比較時的 Google Gemini 和 OpenAI 幾乎相同。 從資料來看,Claude3 的超大杯版本在紙面上優於 GPT4 和谷歌的 Gemini Ultra。
不同模型之間的比較主要包括幾個方面,包括基礎知識、大學學科知識、數學、能力和推理能力等,這些方面對於模型能力的評估仍然具有代表性,這也是這些公司廣泛使用的標準。
從這裡的資料來看,Claude3 其實是因為它有超大杯、中杯和大杯,所以其實似乎只有超大杯的能力比 GPT4 和谷歌的 Gemini Ultra 還要多。
另乙個重大改進是,Claude3 現在不太可能拒絕使用者的日常任務,因為 Anthropic 看重的一件事是,他們認為大型模型是為人類服務的,因此他們對人類的對齊非常嚴格。 他們過去一直被批評的特點之一是,他們會拒絕回答許多實際上很常見而不是有害的任務,並且在新版本中,他們降低了錯誤拒絕率並提高了相應的準確性。
從角度來看,Claude3 API 的產出是每百萬個代幣 75 美元,遠高於現在的 GPT4。 目前,它的兩個最強版本僅供 Claude Pro 訂閱者使用,而十四行詩的歌詞現在免費提供。
然而,雖然 Gemini Ultra 和 Claude3 的兩個版本現在都聲稱在測試中優於 GPT4,但他們在這裡使用的 GPT4 仍然是他們去年 2023 年 3 月發布的最早的 GPT 版本之一。 但實際上,我們現在在 OpenAI** 上使用的 GPT4 其實是 GPT4 Turbo,也就是說,這個新版本的能力其實比最初的 GPT4 更明顯。
因此,我們還不能確定 Claude 3 和 Gemini Ultra 是否比 GPT4 的實際線上版本更好。
畢竟,大多數人通常完成的不僅僅是他們在測試中展示的任務,因此他們在測試期間表現的小百分點差異對普通人來說可能並不那麼重要。
所以最後哪一款更好用,我覺得還是需要大多數使用者自己去體驗和感受的,那麼普通使用者哪一款更方便,哪一款推薦。 比如我在ChatGPT上調優提示的經驗比較豐富,現在OpenAI的整個生態系統也越來越完整和豐富,所以使用ChatGPT就滿足了我目前的需求。
這就是為什麼除非是谷歌的大模型或者Anthropic的模型與GPT4相比非常強大,否則我仍然看不出我必須切換到不同的平台才能使用它。 對於大多數人來說,只要你能向OpenAI支付每月20美元的會員費來繼續使用它,ChatGPT在很長一段時間內仍然是你的最佳選擇。
然而,我很高興看到 Anthropic 發布 Claude3,其中乙個重要原因是競爭和資料中的比較。
估計 OpenAI 不能再坐以待斃了,會希望早點發布他們的 ChatGPT 的下乙個版本,所以我想我們可以期待一下。
您如何看待 Claude3 模型? 您可以自己嘗試免費的十四行詩,歡迎我們互相交談。
**10,000粉絲獎勵計畫