華科技大學發布AI大模型猴子部分超越GPT 4

Mondo 科技 更新 2024-01-29

法士特科技12月12日報道 華中科技大學官方發文稱,該校軟體學院團隊發布了多模態大模型“猴子”。

該模型擅長影象描述和視覺問答,能夠實現對世界的“觀察”,並進行深入的問答交流和準確的描述。

據官方介紹,在18個資料集的實驗中,MONKEY模型表現良好,特別是在影象描述和視覺問答任務方面,超越了許多現有的知名模型,如Microsoft的ll**a、谷歌的palm-e、阿里巴巴的mplug-owl等。

此外,Monkey 在文字密集型問答任務中表現出顯著優勢,甚至在一些樣本上超越了業界公認的領導者 GPT-4V。

Monkey 的顯著特點之一是其出色的“看圖片和說話”能力。 在詳細描述任務中,Monkey 展示了感知影象細節和感知其他多模態大型模型忽略的內容的能力。

另乙個亮點是能夠處理解像度高達 1344 x 896 畫素的影象,這是其他大型多模態模型可以處理的最大尺寸的六倍。

據悉,業界可處理的最大解像度為448 448畫素。

值得一提的是,該團隊在全球最大的託管平台 GitHub 上開源了 Monkey。

相關問題答案

    谷歌發布了最強大的AI模型Gemini,超越了GPT 4!

    當地時間月日,谷歌CEO桑達爾 皮查伊 Sundar Pichai 正式宣布雙子座號版本 正式上線。據報道,這是人工智慧模型的巨大飛躍,最終將影響幾乎所有谷歌產品。Gemini 型號包括三個數量級 最強大的 Gemini Ultra 可擴充套件的多工 Gemini Pro 和用於特定任務和移動裝置的...

    谷歌發布多模態AI大模型,可布局文化媒體三大細分領域

    谷歌最近發布了一款多模態AI模型Gemini,可以同時識別和理解文字 影象 音訊和五種型別的資訊。受此訊息影響,文化傳媒板塊日掀起漲潮,其中世紀天虹 山東出版 出版傳媒 龍傳媒等多條 漲停,全板塊漲 從兩市產業板塊資金流向來看,文化傳媒板塊重拾資金青睞,當日主要資金淨流入億元。盤面顯示,日中國 出版...

    谷歌發布AI模型雙子座 小公主還沒長大,就被逼出內閣

    在OpenAI高調發布GPT 的幾個月前,業內有傳言稱,谷歌旗下的人工智慧公司Deepmind坐不住了,終於要拿出藏在閨房裡很久的Gemini模型。當地時間月日,谷歌召開了雙子座發布會,這也是該公司迄今為止在人工智慧領域最高階別的發布會,正式向競爭對手OpenAI和Microsoft宣戰,爭奪人工智...

    Gemini,谷歌發布的最強AI模型

    近日,谷歌發布了其最強AI模型Gemini,標誌著人工智慧領域的新里程碑。作為產品經理,我深入研究了這個模型,並從產品的角度進行了分析。.產品概述。Gemini 是 Google Brain 團隊開發的最新 AI 模型,旨在解決自然語言處理領域的多項挑戰。與傳統的預訓練模型相比,Gemini 具有更...

    谷歌隆重發布,人工智慧AI大模雙子座,超越chatGpt,福還是詛咒

    Blockbuster,另乙個人工智慧AI模型誕生並風靡全球。 月 日,谷歌 CEO 桑達爾 皮查伊 Sundar Pichai 正式宣布了其最大 最強大的人工智慧模型 Gemini 正式推出。據介紹,Gemini 針對不同場景推出了不同的版本 最大 最強大的 Gemini Ultra,適用於高度複...