AI Moment:GPT 4最強對手登場! 克勞德 3 AI 模型發布

Mondo 科技 更新 2024-03-05

就在我們還被 OpenAI 的 Sora 的實際效果所震撼,驚嘆於未來已經到來的時候。 短短乙個月時間,OpenAI的“家”被偷走了,北京時間昨晚凌晨,Anthropic宣布正式發布Claude-3,擁有三種高效能模型形態,並宣布在AI邏輯基準測試中超越ChatGPT-4。

可能很少有國內合作夥伴知道Claude,這是一款在海外備受關注、使用者基數龐大的AI模型,從GPT誕生之初就愛上了GPT,在AI效能排行榜上都在追趕它。 它也是乙個基於GPT(Generative Pre-trained Transformer)技術的大型語言模型,通過對大規模文字資料的預訓練,學會了理解和生成自然語言的能力。

亞馬遜今天宣布使用 Claude3 來優化其業務邏輯

該系列由三個獨特的型號組成:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,每個型號都專注於效能和功能,旨在滿足各種應用的需求。

claude 3 haiku

Haiku 模型以其極快的處理能力和具有成本效益的價格而著稱。 它能夠在短短三秒鐘內讀取資料密集的 ARXIV 研究**,其中包含大約 10,000 個標記,包括對圖表和圖形的理解。 Haiku 特別適用於需要極高處理速度但效能負載相對較輕的平台。

claude 3 sonnet

十四行詩模型在大多數工作負載上比 Claude 2 和 Claude 2 更快1、且模型效能與效能一致,並提供更高階別的智慧型分析能力。 它特別擅長處理需要快速響應的任務,例如知識檢索和銷售流程自動化等。

claude 3 opus

Claude 3 Opus 是該系列中的高階型號,具有與市場上其他頂級型號相媲美的複雜視覺處理能力,能夠處理各種視覺格式,包括圖表、圖形和技術。 相較於 Claude 21. OPUS使解決開放式問題的準確性翻了一番,同時也大大降低了錯誤答案的比例。

其他亮點:

全系列型號可處理超過 100 萬個標記輸入,為需要更多處理能力的客戶提供可靠的支援。 Claude 3 系列擅長執行複雜的多步驟指令,尤其是在遵循品牌基調和響應指南方面,創造使用者可以信任的客戶體驗。 此外,這些模型還擅長生成流行的結構化輸出格式,例如 JSON。

現在,OPUS 和 Sonnet 可以通過 API 獲得,開發人員現在可以註冊並開始體驗這些尖端模型的強大功能。 例如,PoE 已經支援 Claude-3-Opus 模式,購買 PoE“月卡”後即可體驗。

超越 GPT-4; 兼顧視覺功能

根據 Anthropic 的說法,Claude 3 OPUS 在 4 項 AI 標準測試中超過了 GPT-10,包括 MMLU(本科水平知識)、GSM8K(小學數學)、Humaneval(程式設計)和 hellaswag(常識)。

其中一些勝利的差距非常小,例如Opus,他在MMLU的五次嘗試中獲得了86分8 分,而 GPT-4 得到 86 分4. 有些差距較大,例如 90 在 humaneval opus 上7 分,而 GPT-4 得分 67 分0%。這可能意味著 Claude 3 對新手編碼員更友好。

與前代產品相比,Claude 3 系列在分析、內容建立、生成和多語言對話方面有所改進。 據報道,這些模型還具有增強的視覺功能,允許這些模型使用圖形、圖表和圖形等視覺格式,類似於 GPT-4V 和谷歌的 Gemini

在實際測試中,Claude 3 的 PDF 解釋速度比 GPT-4V 快,中文輸出的邏輯和優化明顯優於上一代,也達到了 GPT-4 替代的水平。

相關問題答案

    超越 GPT 4!谷歌發布最強大的多模態大型模型 Gemini

    月日凌晨,谷歌在其官網上發布了一款全新且功能最強大的多模態大模型 雙子座。據悉,Gemini 有 Ultra Pro Nano 三個版本,可以自動生成文字 總結內容等,並理解 音訊和 內容。在 MMLU Drop Hellaswag GSMK 等主流評測中,Gemini Ultra 的能力全面超越 ...

    接近 GPT 4 開源模型大洩密,AI 社群炸鍋! Mistral首席執行官透露,這是乙個舊模型

    編輯 埃涅阿斯已經破案了!讓不少抓心癢癢的全新開源模型Miqu,確實是Mistral訓練模型的老定量版本,在LLAMA 上進行了重新訓練。今天,Mistral的首席執行官親自證實了這一點。這位首席執行官表示,該模型是從搶先體驗客戶那裡洩露的過於熱情的員工。這幾天,這個在AI界引發熱議的懸而未決的案件...

    LLM 代理如何使 GPT 4V ision 成為通用 Web 代理

    開發seeact 一種通用 Web 代理,利用 GPT V 等大型多模態模型 LMM 的功能來整合 Web 視覺理解和操作。LMM 已被證明在通用 Web 代理方面具有巨大潛力,給定定位方法,在真實網站上的成功率為 GPT V 還展示了令人印象深刻的功能,例如糾錯和長期規劃。然而,細粒度的視覺定位仍...

    OpenAI 回答了 GPT 4 變得“沒有動力”的原因。

    根據使用者投訴,他們聲稱在高峰時段使用 GPT 或 ChatGPT 時收到了非常緩慢和敷衍的響應。有時甚至會出現對話中斷。有使用者指出,當他們要求一段 GPT 輸入時,系統通常只提供一些資訊,然後要求使用者自行完成其餘部分。有時,GPT 甚至會簡單地回答 你可以自己做 這種現象在高峰時段更為明顯,可...

    GPT 4 在《自然》雜誌上刊登!諾貝爾獎獲得者的複雜反應可以輕鬆完成

    近日,基於GPT 等大型語言模型的大型語言模型AI系統Coscientist成功登上 自然 雜誌。它可以快速準確地自主完成化學實驗的所有步驟,從檢索資訊到設計解決方案,再到控制裝置和分析資料,展示了AI大模型在化學領域的應用前景。據了解,CoScientist由卡內基梅隆大學研究團隊開發,由五個模組...