兩周前的今天,北京時間2月16日,OpenAI、Google、Meta、Stability都在這個時間節點前後發布了文盛**模型的結果,但只有OpenAI的SORA在這場大賽中突圍而出,成功抓住了全世界的目光。 可以說,SORA已經打響了文盛**大模型產業2024的第一槍。 一方面,誰也沒想到OpenAI的動作如此迅猛、刺激、刺激,招架已經來不及了,另一方面,都被其“60秒超長鏡頭”、“單**多角度鏡頭”和“世界模型”等爆炸性效果所震撼,並聲稱將迎來行業洗牌。 在關於SORA的各種爭議和預測如火如荼、接踵而至的時候,《AI技術評論》反思了Disco Diffusion再出現Stable Diffusion的過程,並與業內投資人、技術專家、學術專家、AIGC創業者等數十位行業專業人士對SORA進行了冷思考。 (關於SORA和AIGC,歡迎各界朋友來找作者:.)s1060788086從長遠來看,不可否認的是,SORA是文盛大模型的里程碑事件,標誌著生成能力達到了乙個新的水平。 不過,也有業內人士指出,“大家都應該清醒”,SORA的影響並沒有想象的那麼大,不會對影視、廣告、內容創作等領域產生立竿見影的顛覆性影響,也不一定會切斷AIGC創業者的後路。 SORA發布兩周後,需要的不是嗡嗡聲,而是降溫。 SORA的影響現在並不急於完成這個故事,而是需要在未來1-3年內看到。
SORA技術有很大的探索空間當PIKA走紅時,香港大學電腦科學系教授徐東稱其為文盛**行業的曙光——讓世界看到了文生**的驚人效果,但同時他也意識到,PIKA只是先跑出來的那個,距離大規模使用者支付還有一段距離。 SORA的出現,徐東教授評論說,這是乙個“巨大的突破”,它不是乙個簡單的來自ChatGPT-30 到 chatgpt-45、但對之前的視覺模型進行了降維打擊。 60秒的長度,讓其他文盛產品無與倫比。 但其實跳出對世代長度的考慮,生成速度也是考慮文盛大模型的關鍵指標。 乙個 60 秒、令人驚嘆的 AI** 是在 10 分鐘還是一小時內生成,對使用者來說都是一種截然不同的體驗。 如果生成時間少於 60 秒,那將是另一種驚人的效果。 面對未來低時延的要求,背後算力的支援是最根本的基礎。 預計高效利用算力滿足巨大需求的方式,是SORA等文盛模式可以探索的空間之一。 要解決一系列代時問題,除了算力之外,石榴科技創始人弗蘭克認為,其背後的技術解決方案也是影響因素的關鍵因素之一。 因為底層SORA是擴散模型,如果模型本身有一些侷限性,導致處理速度達不到,生成時間確實不快,算力強也無法使用。 除了一代的60秒持續時間外,世界模型也是SORA開闢的新視野。 就世界模型的技術淵源而言,SORA目前的做法與楊麗坤最初提出的方法不同。 Yann Lecun強調對空間中規則表示式的理解,即是否有可能直接在這個模型中找到明確定義的物件的表示式。
空顯然與這種方法不同,他們走上了“武力奇蹟”的道路。 使用基於 Transformer 的 Diffusion 進行解壓縮仍然是資料驅動生成的基本方法。 在這個過程中,是否真的能反轉總結中間學到的物理定律,動畫代捏ta產品創始人胡秀涵表示,這還是需要打個問號。 如果你認為 OpenAI 的理念是“縮放就是一切”,那麼隨著規模的增加,壓縮效率越來越強,模型被迫學習和總結所有的物理定律然而,基於該模型目前的規模和有效性,目前還不可能直接得出SORA是世界模型的結論。 弗蘭克對此表示同意,並補充說,不僅要從物理意義上思考,而且要從非物理意義上思考。 作為世界的典範,更需要考慮到社會中的“人類情感規律”。 就像當嬰兒被搶走時,空能否成功**出來,嬰兒會哭——所以除了物理定律的演化,世界模型還需要進一步滿足日常生活中的場景和判斷。 還有這個社會意義上的大多數資訊不是通過文字和文字來表達的在它的背後,仍然需要探索文盛模型是如何被理解和生成的。 為了實現這一點,弗蘭克認為有必要在表面文字和它背後的潛台詞之間建立相應的聯絡。 基於OpenAI冰山一角的海量資料和一定連線關係的建立,GPT-4已經表明,它對人類潛台詞、雙關語等許多複雜內容有著非常高的理解率,而且非常聰明。 空也值得期待,看看能不能多一些聯想,提示一句話,就能看懂它背後的10句話,然後用10句話完成更好的作品。 但是,當前的視覺化模型SORA與以前的大型語言模型不同。 在OpenAI的早期,大部分研究成果都是開源的,甚至資料庫也是開源的。 但現在不再是開源了,SORA的技術報告只講了乙個非常巨集觀的框架,其餘的需要同一家賽道公司自己去探索。 徐東教授認為,OpenAI的閉源性使得探索OpenAI成果的工作難以趕上。 但是,從社會的巨集觀角度來看,有必要趕上中國的SORA時代。 一方面,遊戲等行業或其他涉及商業秘密的行業不太適合OpenAI的底層技術。 另一方面文盛**技術的進攻和防守問題也是比較重要的方面。 由於SORA技術很容易產生大量的虛假資訊,因此可能會被別有用心的人用來傳播一些虛假資訊或不正確的價值觀來引導。 面對這樣的情況,如果不知道對手是如何進攻的,就很難防守。 在應用方面,國內對文盛**的需求非常旺盛,大家不可能都翻牆使用OpenAI的產品。 追趕SORA是一件長期的事情,需要更多的社會資源來支援人才,這是這場新的AI競賽的核心。 目前,香港大學的羅平教授正帶領同學們一點一點地探索文生**,研究與SORA最相似的技術路線,幾乎沒有卡片。 在SORA衝擊下的AI競爭格局中,產品應用是更安全的方式,國內企業也需要深入參與追趕技術。 因為無論你生產什麼產品,如果技術基礎不紮實,沒有人開源,那麼好的產品就很難出來。 此外,如果SORA很貴,那麼該產品就沒有多大意義。