SORA席捲了太平洋。
在農曆新年尚未結束之際,OpenAI 展示了其 SORA Wensheng** 的功能。 美國和中國是人工智慧發展最快的兩個大國,OpenAI投下的重磅炸彈同時擊中了美國和中國的科技界。
它代表了一條新的技術路線和更好的效能,它展示了一種革命性的視覺轉型能力,這場風暴將席捲大量舊技術路線上的初創公司,並迫使大科技公司重新審視他們的研發方向。
Sora一下子解決了所有問題”。
《時尚少女漫步東京街頭》上映後,Adobe股價連續三天上漲。
這個 60 秒的 ** 是由 OpenAI 的文生 ** 工具 Sora 生成的。 這位時尚達人戴著墨鏡,塗著紅色口紅,走在潮濕和霓虹燈閃爍的街道上。 只需輸入文字提示,Sora 就可以輸出逼真和連續的視覺效果。
以前,建立類似 ** 的東西需要小組的合作。 其中,它涉及攝影師、燈光工程師、化妝師和編輯等眾多專業人士的分工,並且還使用了索尼相機和一流的後期處理軟體。 Adobe擁有一系列**處理軟體,其PS和AE工具深受全球動畫製作公司、電視台和多**工作室設計師的喜愛。
現在,Sora已經展示了威脅Adobe地位的能力。
如果Sora能夠以低成本生產逼真的軟體,那麼Adobe的付費軟體將毫無用處。 該公司的市值約為2500億美元,過去幾天股價在一天內下跌了7%4%。
Adobe此前曾嘗試將人工智慧引入其產品中,例如其之前發布的Firefly,它還可以從文字生成影象並更好地處理**。 但它的這一部分努力,就像創意公司Getty和Shutterstock一樣,可能會被Sora壓垮。
Shutterstock 連續三個交易日**,Getty 連續兩天下跌。 Shutterstock 於 2023 年年中與 OpenAI 簽署了一項協議,將他們的合作夥伴關係延長六年,允許 OpenAI 使用其平台的 ** 等來訓練 AI 模型。 現在看來,很難說 Shutter 不是在自掘墳墓。
人工智慧作為一種得心應手的工具,已經在遊戲領域扎根,原有的工作流程已經改變,取代了一些傳統的製作工具。 Sora來了,它將進一步改寫遊戲規則。
以遊戲中的AI繪畫為例。
巨人網路與阿里雲合作打造AI繪畫平台,想象一下。 該平台可以為美術團隊的工業化生產提供AI解決方案,在巨人內部的效率提公升效益非常可觀。 據巨人網路AI實驗室負責人丁超凡介紹,新平台整體在人物和場景的原畫上實現了50%-70%的節省,在UI(使用者介面)和Icon(遊戲圖示)設計上都有80%以上的效率優化,甚至有部分專案已經完全將內部UI和Icon交給AI製作圖片。
我們關注SORA在**生成領域取得的突破,短期內作為生產力工具,將大大提公升遊戲行業內容創作效率; 從長遠來看,SORA對3D模型的理解和強大的物理世界**能力將對遊戲的底層工具層面產生深遠的影響。 丁超凡告訴第一財經記者。
文盛**的技術方向在去年下半年就已經出現在美國。
在大型語言模型ChatGPT4之後,多模態的發展備受關注,多模態的乙個重要方向是視覺。 美國和中國都有公司,美國的兩大主要公司是Runway和Pika。
聯想創投董事總經理羅旭告訴第一財經記者,SORA與這兩家公司之間的乙個顯著區別在於其世代的長度。
Pika 目前支援 Tusheng** 或 Wensheng**,單串長度通常在 3 秒左右。 去年年底,Runway 將其生成時間從 4 秒增加到 18 秒。 僅就效率和長度而言,SORA更勝一籌。
SORA的技術能力還體現在其解像度、連貫性等方面。 **解像度很大程度上受計算能力的影響。 至此,Microsoft的雲服務為OpenAI提供了強有力的支援,在更深層次上,英偉達的高效能晶元可用。
*和**之間的主要區別之一是時間線。 很難確保時間線的一致性和運動的一致性。 我們在保持一致性方面付出了很多努力,並且有很多技術解決方案,例如光流的方式,移動視窗的方式等。 羅旭說,但是在SORA出現之後,這些技術方法在效果上就不一樣了。 “每個人都在努力解決它,但尚未解決的問題都被Sora一下子解決了。 ”
二級破碎。 這是OpenAI對其他科技公司的又一次攔截。
當 ChatGPT4 出現時,OpenAI 已經做過類似的情況。
OpenAI 發布 GPT3 後,吸引了一批創業者在其基礎上進行二次開發,其中最著名的就是 Jasper。 Jasper 的功能是撰寫營銷文案,它也有 1憑藉 25 億美元的融資,它躋身人工智慧領域的獨角獸之列。 但在 ChatGPT4 發布後一切都變了,Jasper 於 2023 年 7 月開始裁員。
chatgpt4.在0發布之後,其實這些公司在創業行業的一些創新功能已經被碾壓了。 羅旭告訴記者,chatgpt4在0之後,許多初創公司所做的事情的價值急劇縮水。
SORA的出現也重新評估了其他學者的價值。
Runway 的估值約為 15 億美元,Pika 的估值約為 2 億美元。 除非這兩家公司擁有更好的、未公開的技術,“我認為這不是估值下降的問題,而是誰可以繼續投資,誰可以接管。 羅旭說。
SORA還將數字人類初創公司置於其陰影之下。
虛擬人或數字人曾經是國內初創企業追捧的熱點。 數字人經常以**、動畫、直播等形式出現在手機、平板等裝置中。 例如,成立於2017年的矽基智慧型,估值超過60億元。
開源社群OpenCSG創始人陳然告訴第一財經記者,除了SORA對文盛圖、文盛等科技公司的影響外,“像數字人這樣的公司受影響最大”。 由於SORA演算法的創新,每個人都會朝著這個方向前進。 “你(以前)投資了這麼多,說得委婉一點,實際上都是浪費錢。 ”
SORA是長期積累、反覆試驗、使用者反饋的結果。 OpenAI 嘗試了遞迴網路、生成對抗網路、自回歸變壓器、擴散模型,最終誕生了 Diffusion Transformer。 陳然說,“SORA充分利用了大型語言模型代幣的優勢,讓畫素也能被使用。 SORA的誕生不亞於ChatGPT在2023年的出現。 ”
不同的生產工具,截然不同的生產效率。 秋收的時候,手鐮刀再快,也不如聯合收割機。 隨著大型機器的出現,繼續磨鐮刀幾乎沒有意義。
這個時候,即使初創企業改變路線,走上類似於SORA的技術路線,也不太可能趕上他們的技術能力。 不同的資源稟賦和對工程的理解可能無法跟上。 “就像你在中國做語言模型,能不能趕上,從現在的情況來看可能很難趕上。 因此,這些初創公司都面臨著同樣的問題。 羅旭說。
OpenAI的AI技術仍在迭代中,其能力的提公升還沒有達到天花板。 “它之所以會比創業公司更快,是因為它不僅擁有更豐富的資源,比如計算資源,而且還擁有GPT35、積累了此後未公布、不為外界所知的工程培訓方法。 羅旭說。 OpenAI的工程訓練方法導致了成本的不斷降低和效率的提高,“讓距離越來越遠”。 ”
SORA不斷發展,其對遊戲、電影和電視等行業的影響可能是革命性的。
短期內,SORA可能會在一定程度上影響CG成本。 從長遠來看,SORA的特別之處在於它實現了最佳物理定律,這可能會改寫未來整個3D內容製作的遊戲規則。 丁超凡說,“如果我們進一步假設,當人工智慧發展到能夠生成高度可控、準確、穩定的內容,具有高度可控和準確的物理運動規律時,它將被定義為乙個完全資料驅動的'物理引擎',而不是乙個CG創作工具,這將徹底改寫遊戲的製作方式。 ”
控制預期“ 過早下注的投資者可能走錯了路。
中國的風險投資家正在密切關注人工智慧的進展。 聯想創投在去年下半年就一直在與國內創業者進行溝通,但在真正投資時卻是謹慎的。
去年,我們可能比較謹慎,我們總是不太確定,“羅旭說,聯想創投去年接觸了幾家國內頭部創業公司,但沒有一家投資,”我們必須研究推動大模型發展的內部動機。 ”
乙個春節過去了,創業的技術路線和投資者的心態都發生了變化。
春節前,投資者只需要對比Runway和PIKA,就能在中國找到一支能夠達到或超越其技術水平的團隊。 如果 Runway 和 Pika 在一樓,那麼風險投資只需要在二樓找到一家企業就可以出人頭地。 但空一出生,他就站在了六樓,風險投資再也找不出只能站在二樓的團隊了。
羅旭告訴記者,“我們非常關注**代的方向,在SORA發布後,我們仍然對這個方向保持著興趣,我們需要考察創業團隊需要具備什麼樣的能力。
國內AI企業也需要考慮是否改變方向。
一些大型樣板企業不可避免地受到影響,陳然認為,這些企業改變了技術路線,對投資者和初創企業來說都是巨大的傷害。 “這相當於走錯了方向,如果像谷歌這樣大的公司誤入歧途,就會有大問題,更不用說創業公司了。
中美之間的技術競爭,美國豎起了小院牆,美元風險投資逐漸從中國的創業市場消失了。 它們應該成為中美之間資本流動、商業模式甚至人才交流的橋梁。 它們在中國市場的缺席也意味著初創企業可用的資金正在萎縮,在硬核技術領域試錯的空間越來越小。
很少有投資者願意讓你經歷反覆試驗。 陳然表示,很多企業都希望從資金最多的機構獲得融資,但對投資回報的預期明顯與風險投資不同,“所以這些大型樣板企業會在很多**投資中傳遞。
最近,一些初創企業獲得了融資。 比如月亮暗面最近報道了募集10億美元的訊息,阿里巴巴和紅杉資本是背後的融資方。
羅旭認為,AI專案可能在2024年有乙個分水嶺。 一些專案在去年就已經拿到了資金,今年AI創業公司的團隊和能力會逐漸分化,在方向的選擇上也會有差異。 “我們現在也在跟蹤幾個專案,比如專注於基本模型。 ”
投資的前提是適當降低預期。
在去年語言模型ChatGPT4發布後,國內看好的風險投資人一度認為,只要這些國產人才有足夠的能力,今年的國產模型應該會向ChatGPT4靠攏。 “大家都知道實際情況,現在我們基本上都在35 上下。 ”
去年,國內百模大戰得以在大型語言模型領域實現ChatGPT35 個左右的能力,很大程度上是因為開源模型的存在。 一位受訪者表示,中國超過90%的大型模型都是在Llama等大型模型的基礎上通過摸石頭過河的,這些模型是由美國Meta等公司開源的。
羅旭認為,國內文人的發展不如從GPT3到GPT3的語言模型5 這麼簡單。 “我只能說,我們看到了未來的發展方向,但中國有沒有這樣的創業公司,有沒有這樣的能力的樣板企業,我們還在尋找。 ”
風險投資很難與美國公司相比找到國內目標,“如果與這樣的國內公司相比,相對而言,你仍然可以投資,”羅旭說。