聰明的東西
作者 |程倩
編輯 |心
距離農曆龍年僅剩11天,你的新年頭像或紅包封面準備好了嗎? 如果您還沒有,AI 繪畫工具可能是“私人定製”的不錯選擇。
提示詞:生成龍年畫像,一定要有喜慶的氣氛,還能體現出運勢和運勢(第一排是文心一言、文心一格、360志華、阿里雲通義永珍、尋飛星火; 第二排分別是智浦AI智浦青燕、抖音鬥寶、騰訊混元助手、美圖奇蹟視覺、科大訊飛星火繪助手)。
在過去的一年裡,AI文生圖模型不斷進化,不僅掌握了各種繪畫風格,還陸續解決了“紅燒獅頭”等繪製不佳、空間定位不理解、模糊或抽象概念不理解等各種難題。
雖然 Midjourney、Dall·e 3 和 Imagen 2 都不錯,但它們有一定的使用門檻。 好在國內大型模型公司正在迎頭趕上,發布一適合中國體質的AI繪圖工具可及性與外國人工智慧工具相距十條街。
這些工具都可用免費試用可以通過網頁或APP使用,使用門檻之間的差距基本是分不開的。 拼出一代的速度,大概每個**都能進去半分鐘內生成受網路環境或瀏覽器條件的影響,不可能很客觀。
那麼誰是國產AI文盛圖工具的頭號玩家呢? 誰是協助專業創作者提高效率,將繪畫新手從水火中拯救出來的神器? 為了回答這個問題,我們研究了兩個關鍵能力:理解力強和畫得好。
出於這個原因,我在國內10 模型免費的AI文生圖工具對比5個梯度進度的體驗,試題包括但不限於:每日腦洞、網紅表情包、頭像設計、公司年會、春節氛圍、跨界組合、詩歌領悟、多輪修改看看哪個工具更方便,可以在幾秒鐘內更好地理解使用者的想法。
總而言之,智普AI的智普青妍是整體上最穩定的AI文生圖工具,10次測試基本可以生成符合我要求的影象。
還所有員工輪流的考試題目也有一些,比如畫的鸚鵡爪不僅形狀怪異,數量也與真品不符; 看不懂現在火爆的“南方小土豆”,還把“捧著冰糖葫蘆”的動作畫進了串在一起的土豆裡; 祝福字和春聯上的文字寫得像鬼一樣,畫著符號......
** 單詞理解能力、志璞青妍、文心一言、訊飛星火、同義萬祥、混元助手表現較好。 360奇蹟視界和美圖奇蹟視界在面對第乙個問題“阿拉斯加”時出了問題,莫名其妙地把阿拉斯加畫成了人類北極熊。
在圖片的細節水平上,志璞清妍、通義萬祥、文心製作的春節氛圍圖,幾乎可以馬上用上; 春晚宣傳海報上,直接點名了龍年的背景,通義永珍、迅飛星火、抖音鬥寶的吉祥物形象可以說與傳統“龍”無關。
關於多輪修訂的可靠性,文心一言是乙個堅持每一輪都結束的選手,志浦清妍忠於之前的**修改,騰訊混元助手的表現可圈可點,有的每一步的需求都理解到位,有的還加入了一些奇怪的元素。總的來說,多輪修改是繪圖和設計的必備技能,但基本上所有的AI繪圖工具都做不到。
為了確保比較的公平性,我體驗了每種工具的生成能力基於第一代**具體對比如下:
青銅難度第一階段的提示比較簡單,大部分都只包含2個關鍵詞,包括生成中的主角,以及這個角色的地理位置、行為、大小、風格等關鍵要素之一。
第乙個是“”。站在建築物屋頂上的阿拉斯加“,主要包含對地理位置和阿拉斯加犬種的了解。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
分解這兩個關鍵字,每個工具都通過比較周圍的樓層或鳥瞰圖來呈現“站在屋頂上”。 它們中的大多數還突出了主要特徵,例如大型阿拉斯加犬、黑白配色方案和長毛。
但沒想到的是,“阿拉斯加”,乙個普通的犬種,竟然有乙個完全不匹配的AI生成的影象。 美圖奇蹟視覺描繪了乙隻類似北極熊的動物站在建築物的屋頂上,而360度奇蹟視覺則描繪了乙個站在建築物屋頂上的男人的更離譜的畫面。
第二個問題是生成”。乙隻粉紅色的鸚鵡站在樹枝上這個提示的關鍵詞主要包括地理位置、粉紅、鸚鵡。 這個問題的難點在於,鳥爪和人手一樣,是困擾AI的問題,一些AI生成的鳥爪圖往往有扭曲和奇怪的形狀。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
果不其然,10款AI繪畫工具全部翻車。 鸚鵡的腳趾是相對的腳趾,兩個腳趾向前,兩個腳趾向後。 但有的**把腳趾藏在樹幹後面,有的即使畫腳趾,數量和位置也不對。
然而,這些AI圖片都呈現出“站在樹枝上,粉紅色”的特徵,一眼就能看出是鸚鵡,但經不起推敲。
放大**仔細觀察,彤逸永珍、科大訊飛星火、科大訊飛星火繪助手、美圖奇蹟視覺在鸚鵡眼的治療上也出了問題,有的鸚鵡一側有兩隻眼睛,有的眼球很小,完全失真。
第三個難題是”。“南方小土豆”是抱著冰糖葫蘆的南方小土豆,是東北遊客的昵稱這個提示的主要難點是理解“拿著冰糖葫蘆”和“南方的小土豆是遊客”。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
從結果來看,有的土豆串在一起做山楂,有的直接把小土豆重新排列組合,有的直接動了土豆的形象。
其中,獨樹一幟的兩款AI工具是科大訊飛,充分理解了“小土豆是遊客”的概念,終於在10**中看到了真實的形象。
但沒想到所有的冰糖葫蘆都翻了,只有芝浦青妍的**形象串在一根木棍上,上面串著幾顆紅色的水果,與冰糖葫蘆略有邊角。
青銅挑戰賽的最後乙個問題是,“.藍白瓷風格的彩繪冷杉“,則指定了 ** 樣式。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
這個問題的結果之間存在很大的差距,例如在青花瓷上畫杉木,在杉木上畫青花瓷圖案,以及使用青花瓷對應的線條顏色。
雖然前兩者結合了青花瓷風格和杉木兩種元素,但仍然沒有準確理解。 其中,通儀永珍、志浦清彥、騰訊混元助手甚至可以直接使用,青花瓷風格直接融入到畫中。
然而,在志璞清妍的畫中卻有乙個小蟲子:杉木被畫成一棵松樹。
* 階段提示詞難度增加,關鍵詞數量從2個增加到5個以上,需要理解關鍵詞描述。
第乙個問題的標題是適應即將到來的春節,這樣就生成了AI繪畫工具”。春節氣氛濃厚的**需要包含燈籠、春聯、祝福字除了美圖奇蹟視覺,其餘的**都體現了春節的熱鬧氣氛。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
為了稍微降低難度,好讓自己快速找到**中對應的元素,這道題只設定了“燈籠、春聯、祝福詞”三個明確的關鍵詞,但最終結果並不完美。
芝浦青燕和抖音豆包完全保留了三要素,但漢字的呈現還是個大問題。 志浦清妍的**幾乎看不清“福”的輪廓,抖音豆包的春聯和福字都是一堆亂碼字。
其餘工具生成的**大部分只包含其中的1-2個,而通義永珍、迅飛星火、迅飛星火畫助手、騰訊混元助手春節氣氛非常濃厚,整體畫面看起來非常和諧。
第二個問題中的關鍵詞數量直接翻了一番,包括“.餃子、美食、熱氣騰騰、色彩柔和、高飽和度、美食攝影、誘人、定焦、超清
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
起初,我以為這個謎題的門檻會在一長串預選賽中呈現,沒想到它直接從“餃子”開始翻盤。 抖音豆包子、尋飛星火、尋飛星火畫助手、通儀萬香、志浦青妍都看作地道的餃子,其餘的都直接“變異”成了包子。
第三個問題有困難,”當乙個公司召開年會時,在**的右上角,需要有乙個帶有年會主題的橫幅有必要在指定位置繪製年會橫幅。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
在體現氛圍方面,這些AI工具畫得還不錯。 然而,360智慧型畫的**、通益永珍、美圖奇蹟視覺並不理解“年會”這個概念,而是直接省略了“年”字,催生了大家的**。
在這個問題中,我沒有非常精確地指定橫幅的位置,而是含糊其辭地說“右上角”。 從位置來看,抖音豆袋、迅飛星火、迅飛星火畫助手都有橫幅和主題,但都是在螢幕的正上方,在志浦清煙的右上角有橫幅和標語元素。
* 舞台的最後乙個謎題是,“.今年是龍年,要為春晚畫宣傳海報,就需要有吉祥物
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
春晚的吉祥物傳統由來已久,龍也是中國傳統文化的典型代表形象。 有龍頭像、小恐龍形象等,有的甚至完全脫離了龍的傳統含義。
從最終的畫面效果來看,除了芝浦青燕的**,有宣傳海報的邊框等,其餘大部分都只有乙個吉祥物形象和背景。
*難度不僅考驗AI繪圖工具的想象力和創造力,還考驗一些誤導性提示的識別。
第乙個標題為“.兩個機械人手拉手登陸月球的四格漫畫四格漫畫想測試一下AI繪畫工具是否能呈現出四張相互關聯的圖片。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
從結果來看,雖然單單無法理解四格漫畫所呈現的具體故事,但相似的人物、人物動作、背景變化都顯示出連貫性,其中最具代表性的AI繪畫工具有志浦青燕、抖音鬥寶、美圖奇蹟視覺。 雖然360智慧型繪圖生成的**也呈現出四格漫畫,但更像是乙個人類登月的故事。
其餘工具直接忽略關鍵詞“四格漫畫”,只反映“兩個機械人手拉手”登月。
第二個問題更是荒謬可笑“蒙娜麗莎來中國申請成為一名程式設計師需要AI繪畫工具來體現蒙娜麗莎、中國和程式設計師的三個要素。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
文心一歌、訊飛星火、訊飛星火畫助手直接將蒙娜麗莎的經典形象與電腦相結合,文心一言、360知華、阿里雲通益永珍、志浦清妍、混元助手被完全再現,前三個生成的**可能是為了契合中國元素,看起來更像中國人。 志璞清妍的形象更接近外國人的形象,也是唯一乙個體現“應用”的**,混元助手自己採用了漫畫風格。
抖音鬥寶和美圖奇蹟視界直接將《蒙娜麗莎》的原圖移到了**,但調整了背景**,卻沒有讓我一眼就明白自己想要體現的關鍵元素是什麼。
第三個標題是“AI繪畫工具挖了乙個大洞,”一條名為“松鼠鴛鴦魚”的魚成功跳過了龍門AI需要避免“松鼠鴛鴦魚”,準確獲取不是重點。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
“松鼠鱖魚”的問題還是騙過了1 2的AI工具,但好在之前的“松鼠跪在魚前”的烏龍沒有再出現。 迅飛星火的**體現了“魚躍門”,而芝浦青岩則包含了“龍”和“門”。 美圖奇蹟視覺更是簡單粗暴,直接在中間打出魚的名字,配上文字。
最後,鑽石難點是融合了中國古代智慧的古詩理解。 一般來說,古詩的寥寥幾字背後蘊含著與社會背景、人物、古詩等相關的意境,所以不僅需要AI來理解詩歌,還需要結合古詩的語境。
為了一步一步地走,AI繪畫工具一開始收到的詩歌都非常生動,有突出的物體和環境描述。
第乙個問題是“.角落裡有幾株李子,淩寒乙個人開啟了從句子含義的拆解來看,是角落、梅花、冷、開放的關鍵詞。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
除了美圖公司的MiracleVision走了不同的道路外,其他工具都以“梅花”和“凱”為主體。 文心一言的畫作旁邊也有詩篆,更符合古詩帶圖畫的風格。 文心一格、通義永珍、志浦清妍、迅飛星火、迅飛星火畫助、騰訊混元助教,畫面上都有雪花,映照著“淩寒”。
芝浦青岩的梅花在角落裡,但從外面看,更像是一堵現代的牆,與古詩所暗示的年代不符。
古詩的第二個問題”。黃河的水從天而降,奔向大海,再也沒有回來畫面也很強烈,但與梅花不同的是,這首詩中的“黃河”有乙個指定的物件。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
美圖奇蹟視界依舊直截了當,詩句放在**的中間。 抖音豆包子、文心一言、文心一格、阿里雲通益永珍**對於黃河的呈現更加逼真,體現出“衝海”的氣勢。 志璞青妍、科大訊飛星火、科大訊飛星火的繪畫助手更注重呈現“黃”的元素。
360智華雖然能感覺到黃河,但河面太過平靜,沒有奔騰的氣勢。
最後乙個問題”。但世界之王,在他死前和死後都贏得了這個名字難點在於畫面感不強,AI無法直接從字面上獲取詩歌的主要物件。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
從AI繪畫工具生成的**可以看出,大部分工具都以“王者”為主體**,而通義萬祥是一座大宮殿,從側面也體現出王者。 然而,溫辛一言和溫欣一格呈現的是女性形象,這似乎與古詩的字面意義無關。
美圖奇蹟視覺無法從此提示生成**。
什麼時候會”。醉醺醺地拿起燈看劍,夢回吹號角連營。 八百里火,五十弦翻轉外界,戰場上是秋兵。 馬制陸快,弓如霹靂。 但世界之王,在他死前和死後都贏得了這個名字可憐的白色發生了! “整首詩以提示為用,AI繪畫工具生成**,更符合古詩本身的意境,具有戰場上將軍的形象。 但是,美圖奇蹟視覺仍然無法生成。
第一排左起:文鑫一言、文心一格、360智華、阿里雲通義萬向、智浦AI智浦清妍; 第二排左起:抖音鬥寶、科大訊飛星火、科大訊飛星火繪助手、騰訊混合助手、美圖奇蹟視界
其中,左下角有芝浦青岩的詩句,比較符合古詩帶圖畫的風格。 360志華和阿里雲通義永珍**中只有乙個大體形象,無法反映出更巨集大的景象。
每個設計師的設計稿都有n個版本,所以如果你想讓AI畫出乙個我滿意的**,就需要反覆要求。
不過,這個環節只剩下三個競爭對手:文心一言、志璞青妍、騰訊混元助手。 其餘的工具退出了比賽,因為它們不支援多輪對話。
第乙個問題是春節氣氛圖的提示詞的延續,其中許多AI工具都失敗了。
這一次我變得更加難度,對AI工具生成的**更加挑剔,在讓它們產生濃郁的春節氛圍後,包括燈籠、春聯、祝福人物,我不斷提出新的修改要求,包括“畫面更逼真”、“人多了”、“畫面裡還有人放鞭炮”, 等。 輸入到所有 AI 工具中的文字完全相同。
文心一言生成的四張圖片中,除了對“寫實”二字缺乏理解外,其餘的改進都非常符合我的需求,可以看出下一張圖片基本沒有偏離上一張的整體風格。
與文心一言相比,四張圖片中,志浦清妍可以明顯感覺到,同一張圖片的內容在逐漸增加,但也在“寫實”的部分,最後三張圖片依舊是**,動畫風格。
騰訊混合元素助手的四幅畫面可以用風格迥異來形容,每一張都是在之前所有需求的基礎上再現的,但對於“現實主義”的理解,混合助手也更勝一籌,最後三張明顯感覺更真實。然而,在最後一張照片中,混元的助手把“鞭炮”畫成了“烟花”,無法查出鞭炮在哪裡。
第二個問題也是許多AI繪畫工具將餃子變成包子的試題要求的附加版本。
在讓每個AI工具畫出乙個新鮮出爐的餃子**後,我陸續提出了“讓這盤餃子蒸”“多幾盤餃子”“旁邊多幾道菜”“旁邊一家人吃這些菜”等修改要求。
一共五輪對話,只有文心依妍堅持到最後,志璞清妍加了幾道菜都沒能加,跟我說還沒構思,可以換成其他需求,混元助理只堅持到餃子蒸了,才回答“這個問題我還沒學會怎麼回答呢。
不過,乍一看,下字的前四張圖片差別不大,雖然第四張圖片勉強能看到餃子周圍多了幾個碗,但這些更像是蘸碗。 上一張卡的氣氛還算不錯,但是沒有和之前的版本相比有所修改,相當於把這張牌都翻了一遍。
雖然志浦青妍只有三張圖,都按要求改了,但還是和之前的問題一樣,最後餃子都變成了包子。 志璞清妍生成的每張圖片,也都自帶了對**的理解和解釋,比如,在第三張圖片中,它提到“中間是一盤熱氣騰騰的新鮮出爐的餃子,周圍是幾盤其他各種中國菜。 這些菜餚包括蔬菜、肉類和公尺飯,代表了傳統的中國餐。 這使我能夠根據其對需求的理解再次提出更改建議。
騰訊混元助理的兩張照片,不僅把餃子變成了包子,還莫名其妙地在中間放了一盤辣椒。
第三個問題比較令人困惑,我試圖讓AI理解狗和狗忽略髮髻之間的關係。
我先讓每個AI工具畫一桌天津勾宋包子,然後要求把圖片改成“狗狗在吃勾宋包子”,讓它把狗的顏色改成黑色,把**改成漫畫風格。
文心依妍前兩輪表現很不錯,狗狗都無視包子和狗狗,但最後兩張圖讓我大吃一驚,黑包子真的難得一見,第四張圖包子“露”了,有一種產生烤麥子的感覺。
茹璞青妍的四張圖,我要求它修改的細節都覆蓋得很好,美中不足的是,為什麼包子乙個接乙個地變成了饅頭、漢堡包和一大塊麵包?
騰訊混元助理直接把狗狗放在了包子盤的中間,但狗狗的顏色確實變了,最後兩張圖中的包子也變成了漢堡包。
從我對國產10款AI繪畫工具的深入體驗來看,AI在生成一些氛圍感強且沒有特定包含元素的**方面表現更好,但是一旦指定生成狗、包子、餃子等特定物件,就會出現奇怪的**。 不過,說到春節的氣氛,或者是青花瓷的風格,需要AI獨立創作更多的畫面,往往會給我帶來驚喜,有的甚至可以馬上用上。
一開始,AI繪畫工具因為對松鼠“跪”魚、車馬等的奇怪理解而惹出了很多麻煩,但現在隨著它們的影象生成效果越來越逼真,細節也被描繪出來,我對這些工具的印象也發生了很大的變化。
然而,對於更有經驗的畫家來說,人工智慧在描繪物體時犯錯的問題是致命的。 當人們想用AI為書籍和宣傳海報生成圖片時,非資深人士很難發現AI生成的鳥爪和動物形象是否符合客觀情況,如果海報上的文字和吉祥物形象一下子看不懂,或者存在一些不合理的內容, 溝通效果會大大降低,所以這也是我希望下一步AI繪畫工具需要改進的地方。