AI Vision、Google Gemini Pro 開通，文心一妍外掛程式商城上線

[gf]1f4f0[/gf][gf]1f916[/gf][gf]1f4e2[/gf]AI 中的新增功能

Google Gemini Pro 開通

谷歌的 Gemini Pro 大模型在研究基準測試中表現出色，支援 32K 上下文視窗的文字輸入和生成能力，並向 Vertex AI 雲計算客戶和 AI Studio 開發者開放，提供多種功能和 SDK，為構建 AI 應用提供更多可能性。

[AIBASE簡介：]。

GF]1F680[ GF] Gemini Pro 效能：在研究基準測試中，Gemini Pro 表現出強大的效能，支援 32K 上下文視窗中的文字輸入和生成，並支援 38 種語言。

GF]1F310[ GF] 多平台支援：Gemini Pro 提供 Python、Android 和 NodeJS、Swift、J**Ascript 等多種 SDK 可幫助開發者在不同平台上構建應用。

GF]1F510[GF] 完全託管解決方案：使用者可以輕鬆地從免費的 Google AI Studio 遷移到 Vertex AI，以實現全面的資料控制和其他 Google Cloud 功能，包括安全、私隱和資料治理。

文心易妍外掛程式**上線文心易顏外掛程式**正式上線，提供多功能外掛程式，包括PPT生成、音訊提取、思維導圖等，使用者只需簡單的指令即可滿足多種場景的需求。外掛程式**還允許使用者自己設計新的外掛程式。

[AIBASE簡介：]。

gf]1f680[ gf] 實用外掛程式覆蓋多個場景：文心易顏外掛程式**涵蓋PPT生成、音訊提取、思維導圖等實用場景，提公升使用者辦公效率。

GF]1F3A8[ GF] 支援自行設計外掛程式：使用者不僅可以使用外掛程式，還可以成為設計師，在外掛程式中設計新的應用**，拓展創作空間。

gf]1f469[ gf][gf]200d[ gf][gf]1f4bc[ gf] 一鍵安裝多功能外掛程式：使用者可以通過簡單的說明安裝外掛程式，滿足多場景、多模態需求，如助手、專案管理看板等。

ChatGPT 成為《自然》雜誌年度十大人物之一2023 年，《自然》雜誌評選出了包括 ChatGPT 和 OpenAI 首席科學家 Sutzkwe 在內的年度前 10 名人物，成為首位入選榜單的非人類，凸顯了人工智慧在科學界的領先地位。

[AIBASE簡介：]。

GF]1F310[ GF] ChatGPT破例：ChatGPT首次入選《自然》十大人物榜單，承認生成式人工智慧給科學研究帶來的重大變化。

GF]1F680[ GF] 人工智慧引領科學：OpenAI 首席科學家 Sutskovi 的入選凸顯了人工智慧在科學研究中的關鍵作用。

GF]1F30D[GF] 各領域傑出成就：榜單涵蓋健康、環境、物理等領域，凸顯科技創新對全球社會的深遠影響。

國內首例AI語音侵權案件公開開庭審理北京網際網絡法院公開審理全國首例AI語音侵權案，配音演員起訴了包括墨音工場APP和Microsoft在內的五名被告。該配音演員將墨音工坊等五家公司起訴到北京網際網絡法院，理由是原告的聲音未經授權、AI、在APP上銷售，案件仍在審理中。

[AIBASE簡介：]。

gf]1f5e3[ gf][gf]fe0f[ gf] 聲音侵權指控：配音演員原告聲稱他的聲音是人工智慧誘導的，並在“Magic Sound Workshop”應用程式上以化名出售，侵犯了他的聲音權利。

gf]1f916[ gf] 被告抗辯：被告公司否認侵權，稱該聲音產品合法，Microsoft聲音來源於中光音響，不構成侵權。

gf]2696[ gf][gf]fe0f[ gf] 庭審過程：原告主張侵犯人格權，不承認涉案著作權，案件目前正在進一步審理中。

iQOO Neo9系列率先搭載自研AI藍心模型iQOO Neo9系列手機將首次搭載自主研發的AI藍心模型，在語言理解、文字創作等領域表現良好，為使用者帶來更智慧型、更流暢、更安全的體驗。

[AIBASE簡介：]。

GF]1F50D[ GF] 技術亮點： iQOO Neo9系列引入自主研發的AI藍心大模型，在語言理解和文字創作方面表現良好，位列中國大模型榜首。

GF]1F680[GF] 強悍效能：手機採用專業級全能生態，搭載高效能處理器，專業版執行得分突破233萬分，創下新紀錄。

gf]1f3ae[ gf] 提公升遊戲體驗：配備獨立顯示晶元，為玩家帶來更好的遊戲體驗，提高流暢度和穩定性。

AI主播Channel1上線近期熱播劇《新聞女王》備受關注，與此同時，美國新聞創業公司Channel1發布了一款可以24 7播出新聞的AI主播，引發了媒體的熱議。

[AIBASE簡介：]。

GF]1F916[ GF] AI主播取代人類主播，Channel1推出的複雜模型支援真主形象，可以播放多語種新聞。

GF]1F310[ GF] 該公司強調新聞來源來自獨立記者、**檔案和外部機構，保證了內容的真實性，但仍存在爭議。

GF]1F4BC[ GF] Channel1 在個性化、消費者選擇的製作方式上與傳統新聞頻道不同，並計畫在 2024 年以低成本推出。

邢波團隊提出了乙個全開源的倡議，LLM360邢波團隊提出了LLM360綜合開源計畫，旨在讓大型語言模型的訓練過程透明化，發布兩個大型語言模型，為研究人員提供開發經驗和效能評估結果。

*位址：專案網頁：

[AIBASE簡介：]。

GF]1F310[ GF] 全開源計畫：星波團隊的LLM360框架涵蓋了訓練資料、模型檢查點和效能指標，為大型語言模型建立了全面透明的標準。

gf]1f680[gf] 發布大型語言模型：在框架下發布的 Amber 和 Crystalcoder 基於 13t 和 14T token的大型語言模型，提供績效評估和LLM領域的實踐經驗。

GF]1F91D[ GF] 推動開放協同研究：LLM360全面開源趨勢有望推動更多研究人員參與合作，推動人工智慧領域的持續創新與進步。

[gf]1f916[/gf][gf]1f4c8[/gf][gf]1f4bb[/gf][gf]1f4a1[/gf]大型模型動態Google Deepmind 發布最先進的影象生成模型 Imagen2

Google Deepmind 推出了 ImageN2，這是乙個強大的影象生成模型，可通過引用和文字生成新的和部分編輯，並改進了對影象描述的理解和對影象編輯的支援。該模型在安全性方面採用了數字水印工具，可以在不影響影象質量的情況下防止潛在風險。

位址：

[AIBASE簡介：]。

GF]1F31F[ GF] 強大的生成功能：ImageN2 通過引用 ** 和文本來生成新的 ** 和區域性編輯，改進了影象描述理解和生成影象的質量。

GF]1F512[ GF] 數字水印保護：該模型整合了合成數字水印工具，可在不影響影象質量的情況下防止潛在風險和不良內容。

GF]1F3A8[ GF] 靈活的樣式控制：ImageN2 的擴散技術提供了高度的靈活性，可以通過引用樣式影象和文字提示來訓練模型以生成與相同樣式匹配的新影象。

stability.AI 開源 ** 3D 模型穩定 zero123stability.AI開源Stable Zero123是豐田研究院與哥倫比亞大學聯合開源的Zero123模型的優化版本，通過改進渲染資料集和分數蒸餾，提公升了3D模型生成效果和訓練效率，可與SDXL高精度**模型結合使用。

專案位址：

[AIBASE簡介：]。

GF]1F4A1[GF] 穩定 zero123 為穩定性Zero123模型的AI優化版本通過改進渲染資料集和分數蒸餾，提高了3D模型生成效果和訓練效率。

GF]1F504[GF]與最新的開源SDXL高精度**模型配合使用，相當於對3D模型的擴充套件，拓展了生成式AI的應用領域。

GF]1F310[ GF] 通過使用高質量的資料集 OBJ**ERSE-XL，STABLE ZERO123提供了乙個強大的工具，可以在生成過程中更好地理解和生成 3D 模型。

全國首部古籍大語文模型《荀子》發布南京農業大學研發的“荀子”古籍大語種模型整合了20多億字的古籍語料庫，旨在促進古籍研究與保護，提高中國傳統文化傳承效率，實現大語言模型與古籍加工的深度融合。

位址：

[AIBASE簡介：]。

gf]1f4da[ gf] 全整合語料庫：“荀子”大語言模型包含20多億字古籍文獻，目的是促進古籍的研究和傳承。

gf]1f4bb[ gf] 多功能應用場景：該模型提供智慧型索引、翻譯、詩歌生成、閱讀理解等功能，顯著提公升古籍加工研究效率。

GF]1F469[ GF][GF]200D[ GF][GF]1F3EB[ GF] 專家對該模式的實用性給予了高度評價：在發布會上，來自多所高校、出版機構、網際網絡公司的專家學者對該模式的實用性給予了高度評價。

Moda社群推出Mistral AI首個開源MOE模型Mistral AI 近日在 Moda 社群推出了首個開源 MOE 模型 MixTRAL8X7B，該模型是由 8 個專家網路組成的混合專家模型，引數數為 70 億，支援 32K 代幣上下文長度，達到 8 個3 分，GPT 35 相當。

[AIBASE簡介：]。

GF]1F680[ GF] 模型介紹：Mistral AI 發布開源 MOE 模型 Misetral8x7B，該模型由 8 個專家網路組成，擁有 70 億個引數，支援 32K 代幣上下文長度。

GF]1F4C8[ GF] 效能評估：在 MT-bench 測試中，mixtral8x7b 達到 83 分，GPT 35 相當，表現出出色的效能。

GF]1F310[ GF] 社群發布：mixtral8x7b 模型在 Moda 社群正式上線，為開發者提供了乙個交流和分享的平台。

mixtral-8x7b-v0.模型 1：

mixtral-8x7b-instruct-v0.模型 1：

mistral-7b-instruct-v0.2 個新模型：

gf]1f916[/gf][gf]1f4f1[/gf][gf]1f4bc[/gf]AI應用

美圖公司推出WHEE APP，一款AI繪畫和**生成APP

美圖公司WHEE手機APP正式上線，由奇績幻視4提供支援0大模型提供支援，為使用者提供一站式AI視覺創作服務，包括AI繪畫、**生成、修圖、擴充套件、3D效果等功能，匯集各領域創作者的作品，促進創作者交流合作。

[AIBASE簡介：]。

GF]1F3A8[ GF] 全創作服務：WHEE APP整合奇蹟幻景40大模型，提供AI繪畫、**生成等全方位的創意服務，使用者只需用自然語言描述自己的需求即可輕鬆上手。

gf]1f91d[ gf] 創作者交流平台：該應用匯集了來自各個領域的創作者的作品，為創作提供靈感**，促進創作者之間的交流與合作。

gf]1f4da[ gf] 使用者支援和指導：提供創作指南和模型訓練指南，以幫助使用者更好地使用和理解應用程式。

谷歌推出其人工智慧**創作工具“MusicFX”。Google 的 AI** 創作工具“MusicFX”利用 Google 的 MusicLM 和 Deepmind 的 Synthid 技術，讓使用者只需幾句話即可生成原創**，同時強調負責任的 AI 創新。

經驗**：

[AIBASE簡介：]。

GF]1F680[ GF] MusicFX 使用 Google 和 DeepMind 技術，使使用者能夠在短短幾句話內建立標誌性的 AI** 創作工具。

GF]1F6E1[ GF][GF]fe0F[ GF] 該工具強調負責任的人工智慧創新，通過公眾參與和私隱保護來解決潛在問題，並保護原創藝術家的聲音和風格。

gf]1f310[ gf] MusicFX 或許顛覆了行業，降低了創作門檻，但伴隨著 AI 生成的內容，挑戰了版權和原創性。

GoLinks 推出企業 AI 搜尋引擎 GoSearchGoSearch是Golinks推出的人工智慧搜尋引擎，通過多模態搜尋和AI核心技術為企業提供高效的資訊檢索體驗，減輕員工認知負擔，支援實時索引，相容100多個資料來源。

[AIBASE簡介：]。

gf]1f680[ gf] gosearch發布：GoLinks的GoSearch旨在解決大型企業軟體應用棧中資訊氾濫的問題，提高工作效率，支援多模態搜尋，如圖片、截圖、筆記、URL等。

GF]1F9E0[ GF] AI核心技術：GoSearch利用AI核心技術，不僅可以查詢文件，還可以理解使用者意圖，提供資訊彙總，減輕員工的認知負擔，實現細緻入微的索引。

GF]1F310[ GF] 綜合搜尋能力：GoSearch實時索引資料，相容Google Workspace、Salesforce等100多個資料來源，通過多模態搜尋提供一體化的企業搜尋體驗，標誌著企業搜尋的一場革命。

[gf]1f468[/gf][gf]200d[/gf][gf]1f4bb[/gf][gf]1f4a1[/gf][gf]1f3af[/gf]聚焦開發人員阿里推出虛擬試穿技術裝備任何人

阿里巴巴的Outfit Anyone虛擬試穿技術使用雙流條件擴散模型對模型和服裝資料進行處理，通過服裝影象實現逼真的虛擬試穿效果，結合Animate Anyone的技術，輕鬆讓任何角色的服裝變化**。

專案位址：體驗位址：

[AIBASE簡介：]。

GF]1F457[ GF] 多功能試穿體驗：服裝任何人都使用雙流條件擴散模型來處理模型、服裝和文字提示，以獲得逼真的虛擬試穿效果，包括處理各種古怪而獨特的服裝款式。

GF]1F465[ GF] 強大的泛化能力：該技術展示了對各種體型和動漫角色的泛化能力，支援不同生活背景和新動畫角色的需求。

GF]1F3A5[ GF] Easy Costume Make**製作：結合Animate Anyone的技術，實現更豐富的試穿體驗，使用者可以輕鬆進行任何角色服裝的更換**。

斯坦福中文提出了乙個新一代的框架，Wonderjourney斯坦福華人研究人員推出的WonderJourney框架，通過一句話或一張圖片生成連貫的3D場景，並整合語言模型和視覺模組，展現出無限的創作可能性。

專案**：

[AIBASE簡介：]。

GF]1F310[ GF] 新框架設計：Wonderjourney 的模組化工具允許您從任何位置開始，從短文本或影象生成連貫的 3D 場景序列。

GF]1F3A8[ GF] 文字驅動創意：使用語言模型生成場景描述，使用視覺模組生成彩色點雲，展現多元可控的旅程。

GF]1F680[ GF] 重要突破與應用：WonderJourney開創了3D場景生成領域，為使用者提供了強大而靈活的工具，通過簡單的輸入創造豐富的3D視覺體驗，為藝術、影視帶來了新的可能性。

Microsoft推動壓縮技術llmlinguaMicrosoft 推出了 llmlingua，它使用獨特的粗細壓縮技術來解決大型語言模型中長提示導致的計算效率問題，實現了高達 20 倍的壓縮比。

專案**：

[AIBASE簡介：]。

gf]1f504[ gf] 動態預算控制：llmlingua 採用動態預算控制，在大規模壓縮下分配壓縮比，保持提示的語義完整性。

GF]1F3AF[ GF] 標記級迭代壓縮演算法：引入標記級迭代壓縮演算法，實現複雜壓縮，維護按鍵提示。

gf]1f504[ gf] 指令調整方法：提出一種基於指令調整的方法，以解決語言模型分布不一致的問題，提高小型語言模型與大型LLM的相容性。

南洋理工大學（NTU）發布了 FreeInit，這是一種提高 AI 生成內容一致性的方法南洋理工大學（NTU）推出了一種名為FreeInit的方法，該方法通過優化推理初始雜訊的時空低頻分量，顯著提高了AI生成內容的一致性，為AI創作和AI應用帶來了新的可能性。

專案位址：

[AIBASE簡介：]。

gf]1f4a1[ gf] freeinit 方法創新：對推理初始雜訊的時空低頻分量進行迭代優化，無需額外訓練，顯著提高了**生成的時空一致性。

gf]1f4bb[ gf] 隱式訓練-推理差距揭示：研究了擴散模型的雜訊初始化，發現了訓練-推理差距，並提出了Freeinit來填補初始化差距，提高生成結果。

GF]1F680[ GF] 技術展望： Freeinit方法的發布為人工智慧生成領域帶來了新的突破，有望提高生成的質量和時間一致性，為未來的發展帶來更多可能。

谷歌發布了開源頭像庫“有效”。Google AR&VR與佛羅里達大學合作發布了開源頭像庫“Valid”，這是一套代表七個不同種族的210個頭像，旨在促進多樣性和包容性。研究結果顯示，對亞洲人、黑人和白人化身的看法一致，但其他種族之間存在認知模糊性。同質性偏見影響了化身識別，強調了參與者種族對研究的影響。該庫是開放訪問的，支援Unity和Unreal等遊戲引擎，挑戰刻板印象，並為虛擬形象的研究和應用提供多樣化的視角。

專案**：

[AIBASE簡介：]。

GF]1F310[ GF] 谷歌AR&VR和佛羅里達大學發布了乙個名為“VALID”的頭像庫，其中包含代表七個不同種族的全套210個頭像。

研究結果顯示，不同種族的參與者對亞裔、黑人和白人的化身是一致的，但其他種族之間存在認知模糊性，同質性偏見影響了化身的識別。

GF]1F4DA[ GF] 開源的“有效”庫支援 Unity 和 Unreal 等遊戲引擎，挑戰刻板印象，為虛擬角色的研究提供多樣化的視角。

AI Vision、Google Gemini Pro 開通，文心一妍外掛程式商城上線

相關問題答案

谷歌將推出 Gemini Pro，免費提供給雲端客戶，AI 技術突破或超出市場預期

AI Horizons Mistral AI 發布 87GB 開源 MoE 模型 Soul，並推出大模型 SoulX

谷歌最強AI模型Gemini正式發布了三個版本的多模態

谷歌發布AI模型雙子座小公主還沒長大，就被逼出內閣

谷歌大型AI模型雙子座出道擅長複雜主題推理，懂程式語言PKGPT 4

AI Vision、Google Gemini Pro 開通，文心一妍外掛程式商城上線

相關問題答案

谷歌將推出 Gemini Pro，免費提供給雲端客戶，AI 技術突破或超出市場預期

AI Horizons Mistral AI 發布 87GB 開源 MoE 模型 Soul，並推出大模型 SoulX

谷歌最強AI模型Gemini正式發布了三個版本的多模態

谷歌發布AI模型雙子座 小公主還沒長大，就被逼出內閣

谷歌大型AI模型雙子座出道 擅長複雜主題推理，懂程式語言PKGPT 4

谷歌發布AI模型雙子座小公主還沒長大，就被逼出內閣

谷歌大型AI模型雙子座出道擅長複雜主題推理，懂程式語言PKGPT 4