微信***字母榜(ID:wujicaijing),作者:畢安迪,編輯:王靜,標題圖片:SORA生成 SORA公布的第10天,同行們坐不住了。
2月16日,中國農曆新年第七天,OpenAI推出了一種新的生成式AI模型SORA:輸入自然語言指令並輸出長達60秒**。
文字到**生成式 AI 模型並不新鮮,但 Sora——就像 ChatGPT 一樣——以其驚人的質量提公升點燃了網際網絡。 高畫質畫質、流暢的畫面,以及乍一看相當自然的物理軌跡,與一年前近乎幽靈般的《威爾·史密斯吃義大利面》**相差乙個世紀,同行去年才發布的AI產品也被它們黯然失色。
10天的時間很短,但足以在AI領域有所作為。
至少有兩款AI行業的“人氣炸雞”站出來:2月22日,StabilityAI正式開啟了穩定視訊的公測,而該產品背後的模型穩定視訊擴散則在去年11月發布。 幾乎在同一時間,另一家在文盛圖領域大有建樹的公司Midjourney也透露,可能會在下一次迭代中加入**功能。
過去,“炸雞”站在陰影中,很難趕上空的同齡人。
一。 除了收到SORA演示**的直接影響外,人們立即開始進行縱向和橫向比較。
為了縱向比較,人們拿出了一年前“威爾史密斯吃義大利面”的AI**。 荷里活明星的臉部嚴重變形,臉型千變萬化,每時每刻都觸發詭異的山谷效應,越看越詭異。
*:由 AI 生成。
一年過去了,空已經能夠讓乙個女人走在東京的街頭**,無論是畫質、連貫性和穩定性,還是女人的步態和表情,都幾乎可以是假的,這讓人連連讚嘆:文字到**的進度太大了。
*:由 sora 生成。
可惜的是,雖然無數網友在OpenAI首席執行官山姆·奧特曼(Sam Altman)的社交**賬號下向索拉求索拉版的《威爾·史密斯吃義大利面》,卻沒有得到他們想要的。 但史密斯自己跑了出來,完成了整個工作,拍攝真人版並“偽造”了新版本。 別說了,真的差點上當受騙——真人可以假裝AI生成拍攝**,可見SORA的高質量**。
橫向對比,同行都有些不好意思。 OpenAI 已經發布了每個 SORA 演示的文字說明**,雖然人們不能直接使用 SORA,但他們可以拿著說明去嘗試市面上現有的產品,看看有什麼區別。
不嘗試也沒關係,如果你嘗試,你會感到震驚:當我看到SORA**時,我感到很神奇,在觀看了同行們的表演後,我對SORA的力量有了新的認識。
同樣是女性走在東京街頭的指令,秀場產生的**停頓依舊是那樣,連線起來,只能用“千變萬化”來形容,女性的形象無法隨時間而保持穩定。 要知道,在Sora的演示**中,鏡頭位置也有變化,從遠景到臉部特寫,女人的形態總是一樣的。 跑道產生的**更像是許多**的動態融合。
由跑道生成。
開源 Stable Diffusion 的公司 StabilityAI 製作了一張清晰度和美觀度都不錯的圖片,但女人的臉嚴重變形,看起來像骷髏頭,充滿了怪異。
由穩定的視訊生成。
鼠兔有點棘手,圖形相對流暢,但模糊不清,不逼真。
由鼠兔生成。
此外,拍打猛獁象、移動的汽車、俯瞰風景、看蠟燭的小妖怪等命令,都被網友橫向對比。
二。 突然間,文生**的火“炸雞”發現自己站在了OpenAI投下的陰影中。
從文字到**的AI工具並不新鮮。 2023年,將推出多款文字轉**AI工具,Runway、PikaLabs(以下簡稱Pika)、StabilityAI等創業公司都將在此賽道備受關注,熱錢爆棚,估值飆公升。
其中,RUNWAY成立於2018年,3月開啟GEN-2內測,6月正式發布。 以前,有 Gen-1 映像到 **ai 工具。 Runway 還支援了多部電影。 其中最著名的是奧斯卡獲獎電影《瞬間的宇宙》。
Runway 首席執行官兼聯合創始人 Cristobal Valenzuela 表示:“我們已經看到了影象生成模型的爆炸式增長。 我相信 2023 年將是最好的一年。 ”
5月,跑道已完成141億美元D輪融資,投資方包括谷歌、英偉達等,估值飆公升三倍至15億美元,PIKA去年4月剛剛成立,A輪融資達到5500萬美元,估值超過2億美元,11月發布了**產品PIKA1的第一篇文字0。到 12 月,它擁有超過 500,000 名使用者,每週生成近 100 萬條內容。
另一方面,StabilityAI 以其文字到影象工具 Stable Diffusion 而聞名,該工具在 2022 年獲得 1 億美元的融資後已成為獨角獸。 去年 11 月,Stable Video Diffusion 發布,注意末尾還有乙個“Diffusion”字尾,是基於 Stable Diffusion 的生成式 ** 基礎模型,需要使用者自己部署和使用,目前還不是面向公眾發布的產品。
2023年,三家初創公司,三款重要的生成式產品模型,突然被SORA擊中。
在 OpenAI 急於向世界展示 Sora 後,Runway 的首席執行官 Valenzuela 在社交平台 X 上發帖:“遊戲開始。 StabilityAI的首席執行官兼創始人Emad Mostaque將奧特曼稱為“巫師大師”。
從演示**來看,SORA確實有改變遊戲格局的力量,很難跟上SORA的同行。
ChatGPT發布後,雖然AI浪潮讓投資者熱情高漲,但AI創業公司如雨後春筍般湧現,新的獨角獸如雨後春筍般湧現。但這是乙個兩層天的故事,很多AI創業公司已經走下坡路,或者尋求收購,或者大幅裁員,甚至死在這裡。 據智東介紹,僅在2023年11月至2024年1月,全球就有包括AI新聞創業公司Artifact和AI醫療公司Olive在內的四家AI初創公司宣布關閉。
據 The Infoemation 報道,至少有 7 家開發生成式 ** 的 AI 公司籌集了至少 5 個5億美元的資金。 一位投資人私下告訴The Information,他之前剛剛錯過了一家受歡迎的AI初創公司的融資,看到Sora的**後,他感到“很高興”。
三。 人工智慧賽道火爆,但門檻也很高,在戰鬥中,落後就有可能掉進墳墓。
知名AI初創公司Huggine Face在一篇博文中提到了文字到**的三大挑戰:算力挑戰,伴隨著高昂的計算成本,以確保跨幀空間和實踐的一致性,使大多數研究人員無法負擔此類模型的訓練成本; 缺乏高質量的資料集,用於生成文字到**的多模態資料集很少,而且往往缺乏注釋; 指令的歧義,如何以一種使模型更容易學習的方式描述**並不是一件容易的事。
就連看似站穩腳跟的StabilityAI,也陷入了不斷的困境。 去年6月,《富比士》發布長新聞,30多位StabilityAI前員工和投資人詳細列舉了創始人兼CEO莫斯塔克的9大罪行,包括:從StableDiffusion竊取10億資金; 隱瞞融資困難; 誇大公司收入; 拖欠雇員的工資; 偽造學歷和工作經歷。
撇開其他不談,令人驚訝的是,矽谷的“人氣炸雞”融資困難,公司收入被誇大。 據知情人士透露,StabilityAI每月的支出約為800萬美元,但Mostak曾爆料稱,該公司8月份的營收約為120萬美元,有可能超過300萬美元。 莫斯塔克很快刪除了這個帖子,但從這個數字來看,它聞起來並不像燒錢一樣難聞。
去年11月,也就是該公司發布穩定視訊擴散模型的同月,在該公司完成一輪1億美元融資一年後,有傳言稱,幾位高管辭職,公司脆弱的財務狀況正在考慮**,這一訊息後來被Mostaq否認。
在收入匱乏和人才流失的情況下,StabilityAI的危機暴露了光鮮亮麗的熱門創業公司的弱點。
巨人的加入,也會讓戰爭更加激烈。 在AI**的賽道上,巨頭們早就有了布局。 2022 年 10 月,Meta 和谷歌相繼發力。 Meta 首先發布了 Make-A-Video 模型,僅僅一周後,谷歌首席執行官桑達爾·皮查伊 (Sundar Pichai) 親自為他們在該領域的兩項最新成就 Imagen Video 和 Phenaki 進行了印章,分別強調了質量和長度。
*:meta ai
但 Meta 和谷歌都尚未向公眾開放他們的文字給 AI 工具。 谷歌官員認為,用於訓練 AI** 模型的資料仍然包含有問題的內容,這些內容可能導致 Imagen Video 中的圖形暴力或色情剪輯,從而產生不良影響。 大家都熟悉巨頭的保守操作,在自然語言聊天機械人的賽道上,谷歌也很早就持有了該模型,但沒有將產品推向C端,原因也是安全問題。 但 ChatGPT 和 Microsoft 的聯盟讓這家巨頭擺脫了保守主義,而 Sora 可能無法做到這一點。
已經有巨人有新動作了。 在SORA宣布前一周,位元組宣布人事變動,抖音集團原CEO張楠宣布辭去集團CEO職務,專注於建盈未來的發展。 據《時代周刊》援引接近建英的人士的話稱,張楠親自帶領團隊在AI輔助創作上尋求突破,並即將推出一款AI生成產品。
面對新開啟的“遊戲”,空的同齡人只能全力以赴。
就在 Sora 宣布的幾天後,2 月 22 日,StabilityAI 正式開放了穩定視訊的公測,從乙個模型變成了乙個每個人都可以使用的產品。 雖然長度還是比較短的,只有7秒,但質量還是比較高的。 Mostak 在社交平台上推廣新產品時謙虛地表示,開放的原因是:“我們想建立乙個類似於 Sora 的大型、開放的穩定視訊2,但我們需要更多的資料和計算。 ”
此外,在文盛圖領域享有盛譽的Midjourney也進入了市場,創始人David Holz(D**Id Holz)在Office Hours中透露,下乙個版本,即Midjourney V7,“可能包含**功能”。
OpenAI現階段仍在評估SORA階段,可能還需要幾個月的時間才能正式向公眾發布SORA產品。 好訊息是,你的同齡人還有時間適應。 壞訊息是,留給同行的時間已經不多了。
參考文獻: 1Smart Stuff:“AI創業**雙重天:SORA降臨世界首都嘉年華,幾家創業公司倒閉”。
2.連線洞察:“空來了,位元組在工作:張楠的繁重任務和挑戰”。
3.新火種:“被迫出賣自己,CEO**,高管離職,又一場AI獨角獸事故”。
4.機器的心臟:“影象生成厭倦了體積,谷歌完全轉向文字**生成,兩個強大的工具同時挑戰解像度和長度”。
5.財經美聯社:“AI圈不平,知名開源模型開發商Stability AI被曝出'謀求賣自己'。
微信*** 字母列表(ID:wujicaijing),作者:畢安迪 本內容為作者獨立觀點,不代表虎嗅立場。 請勿擅自做**,請聯絡hezuo@huxiu進行授權com
正在改變並想要改變世界的人都在Tiger Sniff app上