誰是中國版的索拉?

Mondo 娛樂 更新 2024-02-20

長達一年的“百模大戰”仍未結束,兩大海外AI巨頭給國內科技廠商帶來了麻煩。

春節假期結束時,谷歌和OpenAI毫無徵兆地發布了他們新的AI“核武器”。

谷歌新一代多模態大模型雙子座1效能提公升到百萬級的5 Pro,秒殺徹底擊殺OpenAI的GPT-4 Turbo,暫時是表面上最強的。

後者首款文盛**機型SORA基於視覺美學的驚人表現,更是讓人印象深刻,並迅速成為全球科技圈的熱點。

在保真度、長度、穩定性、一致性、解像度、文字理解等生成方面,SORA已經超越了Gen-2、SVD-XT、PIKA等主流產品,取得了目前最好的成績。

去年,阿里巴巴、科大訊飛等國內網際網絡公司紛紛推出自主研發的大模型,在智慧型變革時代爭搶門票; 華為、小公尺、OPPO、vivo等手機廠商也紛紛布局大機型,希望新技術能為高峰市場帶來新的活力; 許多初創公司也進入了賽道,試圖在彎道中輕裝上陣並超車。

然而,物理意義上的差距,讓得國產大型模型產品在效能和生態上與ChatGPT仍有較大差距。 而現在,第乙個生成模型SORA的誕生,再次掀起後續浪潮也就不足為奇了。

然而,顛覆性影響往往來自顛覆性的想法。 從目前的節點來看,國內企業在AI大模型領域與全球前端的差距有多大? 有什麼區別? 哪些種子選手有可能脫穎而出?

關於Sora的出現,馬斯克的評論“GG Humans(人類認輸)”可以算是主流觀點了。

此前,雖然已經有大量的文盛**技術,但技術上的融合還沒有實現,主要的實現路徑是通過各種手段讓單幀的**“動起來”,類似於定格動畫。 從使用者實際需求來看,每一幀之間的連貫性和自然性是價值的關鍵,即每一幀語義資訊的無縫銜接才是核心。

換句話說,像SORA這樣的產品,提供符合需求的技術解決方案,遠比從技術可以實現什麼的角度來創造乙個產品要好得多。

根據OpenAI官網的介紹,SORA與之前的文生**想法不同,即讓模型**一次多幀,並確保**主體保持不變。 這就是獨創性的用武之地——在**框架上取得突破,提高**一代的使用上限。

360創始人周弘毅也對此給予了高度評價,認為SORA的誕生意味著AGI(通用人工智慧)的實現可能從十年縮短到一兩年。

作為SORA的前身,AI Wensheng**創業公司Runway的聯合創始人兼CEO克里斯托瓦爾·瓦倫蘇埃拉(Cristobal Valenzuela)感嘆,過去需要一年的時間才能取得的進步,變成了幾個月才能實現,然後是幾天和幾個小時。

在Sora發布之前,還有很多煙霧彈被釋放。 例如,OpenAI 已經組建了乙個新的團隊來研究兒童安全,或者正在準備推出 GPT-45-turbo,但真正的“殺手級更新”隱藏得很好。 這也讓PIKA和Runway等明星創業公司在面對SORA時措手不及。

事實上,國內外大型廠商對AI一代的態度一直模稜兩可。 根本問題是目前的勞動力質量更好,效果更好,成本可以接受; AI生成並不像大家之前想象的那麼具有顛覆性,所以整體策略更多的是防禦而不是進攻。

值得一提的是,國內的位元組跳動及其嗅覺更加敏銳。 早在去年,在文心一言的發布會上,AI文生的功能就已經發布,AI會根據文字內容自動找到合適的**素材,生成**並自動發布,這就是文心一言AIGC的TTV(Emotional Analysis of Text Content)功能。

位元組跳動在去年11月發布了pixeldance,可以通過上乙個clip的最後一幀為下乙個**clip頭幀提供指導,並且在**時長上取得了突破,但目前還沒有開放使用者測試,所以具體效果還不得而知。

如果我們看一下GPT的發展路徑,所有做AI生成甚至大模型的公司都會面臨新一輪的危機。 正如周弘毅所說,雖然國產大模型的開發水平表面上接近GPT-35,但實際上有 40 和 1 之間還有一年半的差距。 Openal 應該掌握著一些秘密**,無論是 GPT-5 還是通過機器學習自動生成內容。

但危險與機遇並存。 OpenAI已經證明,用大模型的思路做到最好是可行的,文盛可以成為全球新一輪AIGC大賽的焦點,也為直播電商和短平台上的內容創作帶來了更高的天花板。 其他網際網絡公司和內容平台需要做的,就是證明自己也可以用大模型做起來。

從技術角度來看,SORA是乙個多模態混合模型,它由乙個大型語言模型和乙個文字和影象生成器拼接在一起。 這也意味著多模態模型迭代的步伐正在加快,2024年第一波AI浪潮開始也就不足為奇了。

自2022年底以來,ChatGPT橫空出世,其強大的影響力如野火般蔓延到國內科技圈。 阿里巴巴、騰訊等各大網際網絡廠商,以及以公尺奧夫為代表的智慧型硬體公司,似乎都嗅到了新時代的氣息,紛紛宣布推出自己的大機型,打算在這股AI浪潮中占有一席之地。

同時,文盛圖、文盛**等多式聯運AIGC產品也在有序推進。 從現實的角度來看,人工智慧生物文字和傳記的應用早已興起,相關技術也在日新月異。 相比之下,艾文生**是乙個很久沒有被占領的位置,難度和價值同樣巨大。

公開資料顯示,包括位元組跳動、阿里巴巴、海康威視、萬興科技、Tors、當虹科技在內的科技公司都在積極部署文盛**,但與Sora相比差距較大。

簡單來說,之前的AI文盛**工具只停留在“模擬現實”的層面,SORA已經躍公升到了“構建現實”的新高度。 兩者的根本區別在於,前者只是對現實世界的膚淺模仿,難以深入捕捉現實世界的物理規律和動態變化; 另一方面,後者在虛擬世界中重建了與現實世界平行的存在。

Sora不僅學習了畫素和影象的呈現,還對現實世界的“物理定律”有了更深入的了解。 例如,在現實世界中,我們每咬一口食物,都會在食物上留下咬痕,這是一種遵循物理規則的自然現象。 在SORA生成的**中,這個細節也能精準再現,讓“咬下去有痕跡”,從而在虛擬世界中完美再現現實世界的真實感。 而這是其他文盛**產品做不到的。

例如,雖然可以基於輸入文字生成**,但在處理複雜的場景和細節描繪方面仍然存在不足。 而AI文生**也更像是從已有的素材庫中尋找乙個更接近文字含義的**進行拼接,單靠AI很難生成新的**內容。

今年年初,位元組跳動發布了一款超高清文盛**型號magicvideo-v2。 據悉,該模型在高畫質、潤滑、連貫、文字語義恢復等方面,輸出均高於目前主流的文盛**模型Gen-2、Stable Video Diffusion、Pika 10 等。

抖音的張楠於2月初辭去CEO職務,專注於放映業務。 這意味著抖音將加強AI原始圖片和**產品的布局,其中國學生**自然是重中之重。

然而,在張楠的規劃中,AI本應具備的更高保真生成效果、更清晰的生成畫面、更流暢、更自然的邏輯理解能力,也被Sora打敗了。

相較於網際網絡巨頭的低調表現,近期一些上市公司積極發聲,披露了自己在生成模型領域的業務。

據不完全統計,近三個月來,萬興科技、博匯科技、易電安俠、數碼視訊、漢王科技、當虹科技、東方國信、申思電子、銀賽集團、Tors、國邁文化、嘉都科技等10余家A股上市公司在互動平台披露了相關代機領域的業務。

但不可否認的是,真正達到前沿水平的企業寥寥無幾,很多企業只是隨波逐流,缺乏真正的技術儲備和研發能力。

東方國信直言不諱地表示,他們在AI生成領域沒有成熟的技術儲備; 申思電子回應稱,公司正在對文盛圖、圖生文、**盛文、文盛等多模態資料相互跳躍的收斂性進行深入研究,換句話說,他們在這一領域的技術仍處於探索階段。

AI文盛的顛覆性,在實際應用層面可見一斑。 **生成可以幫助改善企業的商業需求,例如幫助降低廣告主成本、方便製作**等。 以位元組跳動為例,其廣告主廣告總成本的一到二就成了第一生產成本,從去年開始,位元組就開始利用相關產品幫助廣告主減少這部分投資。

與上一波ChatGPT類似,雖然國內企業在推出類似AI文生**產品方面難免落後一步,但也是感受索拉渡河的機會。

從全球市場來看,AI依然引領著整個科技業務的方向,多模態成為主流。 從大型語言模型到多模態再到通用人工智慧的路徑逐漸清晰,分歧點在於節奏的判斷。

此前,OpenAI 花了大約半年的時間測試大型語言模型 GPT-4。 如果測試SORA花費的時間大致相同,那麼這個強大的生成工具可能會在今年8月推出。 而這半年,正是其他企業積蓄實力的視窗期。

畢竟ChatGPT已經存在一年多了,但仍有大量使用者沒有使用過聊天機械人相關產品,這也為其他商家提供了迎頭趕上的機會。

目前,國內企業面臨的最大問題是,科大訊飛等一線AI公司的股價因各種原因被打到地板價,而英偉達、Microsoft等國外頂級公司的股價再創新高,OpenAI的估值仍在攀公升。 這也意味著,國內外人工智慧企業在資金、人才、技術、市場吸引力等方面,存在著天然的優勢和劣勢。

周弘毅認為,科技的終極競爭是人才密度和深度積累。 事實上,SORA 使用 Transformer+Diffusion。 從模型架構的角度來看,如果以 Transformer 為基準,那麼文盛**還是比較優先的領先科技公司,但如果生成式**架構還是圍繞著擴散展開,初創企業的機會就更大了。

然而,沒有放之四海而皆準的技術,只有螺旋式的工業繁榮。

雖然SORA一次可以生成幾十秒到一分鐘的**,但是在應用階段,如果產品沒有提供足夠的微操作空間,保證使用者能夠將其整合到自己的工作流程中,那麼很有可能只能鼓掌。

幸運的是,技術的傳播才剛剛開始,沒有一家公司會因為新技術的出現而“突然死亡”。 OpenAI更像是乙個先鋒,它的優勢在於鋪平道路,應用的普及仍然需要生態系統的力量。

這就像文盛文模型上的模組化組合,會不會有手機、智慧型音箱等專有智慧型裝置? 讓更多的使用者在裝置端使用模型,構建開源+小引數模型+移動端的思路,對現有產品進行創新。 這是國內廠商擅長的,但也是未來內捲的位置。

從單點突破的角度來看,SORA是乙個里程碑; 然而,從商業需求和混合切割工作流程效率的提公升來看,SORA本身的價值和落地效果仍有待研究。

僅僅依靠AI生成的一分鐘**成為下乙個董玉輝和李佳琪是不現實的,更別說拍長篇**或者電影或者電視劇集了,哪怕是短篇**,是一遍又一遍地修改提示詞更有效率,還是在**剪輯軟體中根據創作者的想法調整素材更快? 顯然,期待SORA變強,還不如期待AI模組盡快加入到編輯軟體中,這樣才能有效提高工作效率。

即使SORA最終全面開放註冊,普通使用者也很難做出像現在這樣**的演示案例。 因此,最終,各大廠商的決定性點是如何普及多模態應用,如何在工具中加入AI功能,更直接地優化工作流程。

新興技術是通用的,而不是任何一家公司獨有的。 對於國內企業來說,多模態的探索不妨參考GPT的開發與落地,在特定垂直領域的應用層面找到自己的優勢,並以此為方向實現快速發展。

只不過在這個過程中,還是看重人才的密度,落地的程度,犯錯的次數。

相關問題答案

    中國大學排名校友會版 誰是最強的大學?

    不久前,中國大學排名 校友會版發布,引發了廣泛關注和熱議。這個由校友會發布的排名,更貼近實際情況,成為很多人選擇大學的重要參考。排名結果顯示,部分知名高校在綜合實力方面仍名列前茅,秉承了傳統的教學和研究優勢。同時,一些新興大學也逐漸湧現,呈現出強勁的發展勢頭。這反映了中國高等教育的多元化和發展動態。...

    中國股市最強的AI分支“Sora”的概念誕生了! 購買後立即翻倍

    SORA概念 SORA有三個突出的高光,乙個是秒長 SORA可以保持主體和背景之間的高度流暢性和穩定性。第二種是單 多角度鏡頭,SORA實現多角度鏡頭合二為一 故事板切換合乎邏輯,非常流暢。三是理解現實世界的能力,Sora在處理光影反射 運動模式 鏡頭運動等細節方面做得非常好,大大提公升了真實感。它...

    《問無界》版vs李玲、許青等人,誰是最出彩的“宋青玲”?

    許青在 建國大業 中飾演國母宋慶齡一角,她的表演引起了一些爭議 她一改嫵媚的形象,展現出溫柔大方的一面,給人留下了深刻的印象。雖然演技有點太軟,缺乏國母的威嚴,但眼神明亮,姿態自然,與其他明星合作也不遜色。許青能在當下脫穎而出。她很好地詮釋了國母的母性,即使戲份不多,觀眾看到戰爭和屍體散落在大街小巷...

    長安F70藍鯨版對決長城大炮,誰才是真正的商用皮卡“王”!

    隨著皮卡進城禁令的解除,以及露營 越野 釣魚等戶外運動的持續火爆,越來越多的皮卡逐漸成為市場的寵兒,但在商用皮卡領域,很多使用者開始做出艱難的抉擇為了找出答案,我們以長安F藍鯨版和長城大炮商用版為例,從使用者最關心的動力 舒適性 智慧型化等多個方面進行對比。真正的答案只能通過比較實力來最終確定。電源...

    誰是中國製造的“隱形冠軍”?

    年,隨著電子商務的興起,我用所有的積蓄在廣州開始了我的第一筆 生意。剛開始創業的時候,經常很緊張,緊張的時候很容易影響自己的判斷力 賺女人的錢沒有錯,但我忽略了我是直男,選擇做 的直男注定會死得很慘。半年後,生意倒閉,我體內只虧了塊錢,只好回到職場。年底,我打算在一間廢棄的廉租房裡度過春節。經過半年...