在OpenAI的SORA佔據主導地位一周後,StabilityAI上週還發布了乙個新模型StableDiffusion3(以下簡稱“SD3”)。 該模型在生成影象質量、多主題提示、文字書寫效果等方面迎來了革命性的提公升,成為StabilityAI“最強大”的文盛圖模型。
告別胡言亂語,更準確地呈現文字。
在上圖中,SD3模型不僅生成了虛擬與現實、自然光影與視覺舒適畫面的結合,還精準地寫出了“不成功就成仁”的英文,改變了大眾對之前文盛圖模型難以輸出文字的印象。
2.對物理規律有更準確的理解。
從官方示例圖片來看,SD3模型似乎在努力成為古希臘初中物理之神,還原了提示“一匹馬優雅地站在彩色球上”所描繪的場景。
3、提高多主題提示能力。
現在使用者還可以一次輸入多個主題提示,在過去,如何準確還原多個提示詞物件的屬性和位置,是文盛圖模型要解決的難題,從官方效果圖來看,目前的SD3已經能夠理解多個提示詞的元素,比如“太空人, 簇絨的豬,粉紅色的雨傘和知更鳥”。
在好奇的潮流下,有網友使用相同的多主題提示詞,通過其他幾個AI文生圖的模型生成影象,展開了一場卷王之戰。
4、生成效果質量更高。
與之前的版本相比,SD3生成的影象質量有了明顯的提高,例如,上圖顯示了“黑色背景上的變色龍特寫”產生的影象,這也符合期刊雜誌。
5.增加了影象轉換等新功能。
此外,Stability 的創始人還表示,首先,SD3 模型還支援使用文本來修改圖片的內容,並精確控制影象中的每乙個元素,包括替換和刪除。 其次,影象無縫傳輸,沒有任何改動痕跡的“嫁接”讓人驚嘆不已。
這些功能的不斷改進,得益於該模型採用了與SORA變壓器技術相同的架構和流量匹配技術,雖然從發布時間上看似乎有一種“既然要滾,就滾麻”的匆忙,但新技術的使用也是較早的決定,這個架構也和去年的SORA一樣**。
據悉,與SORA一樣,SD3尚未完全開放,該公司CEO表示,未來將根據使用者反饋開源該模型。 但就算還沒開啟,也已經有不少網友表示,自己的電腦配置幾乎無法忍受。
英信RTX 4080 SUPER Metal Master系列可加速您的製作和創作體驗。 搭載全血版AD103-400核心、16GB GDDR6X超大視訊記憶體和*** Tensorcores,第三代RTCres,其專業生產力和遊戲效能都達到了無可挑剔的水平,在TensorRT外掛程式的加持下,AI顯示卡的製作效率也能瞬間提公升。