正文|陸九商業評論撇開技術路線不談,單從實現效果來看,國內大型樣板企業在發電量上是否也有同樣的“騰飛機會”?
龍年正月,就像去年的ChatGPT一樣,OpenAI以文盛領域的另一顆王彈——SORA開啟了新的一年。
面對這樣的AI生成能力,包括幾乎所有型別的從業者,他們都感受到了很大的震撼。 一位有IT背景的電影製片人告訴《陸九商業評論》,索拉的驚人表演讓身邊的從業者產生了危機感。 電影製作成本的急劇下降,以及新電影製作人的出現,將比以往任何時候都更容易。
然而,面對陸九《商業評論》提出的“SORA是否具備商業化條件”、“文盛**對算力有更高的要求以及如何解決”等問題,該製片人以“發展問題,發展解決方案”的表述回答。
這顯然過於樂觀了。 畢竟,更多的從業者認為,從概念到成熟的工商業階段,就算是SORA也有很多不成熟的地方。
因此,撇開技術路線不談,單就實施效果而言,文盛文等在通用車型上有相關布局的國內大型模型廠商,是否也有同樣的“騰飛機會”? 文盛**,與過去的文盛文相比,有哪些實質性的飛躍? 這是乙個有趣的話題。
Sora,革命還是泡沫? 必須承認,SORA的出現使通用人工智慧(AGI)的實現更近了一步。 這樣做的原因是它已經能夠模擬真實物理世界的運動,例如物體的運動和相互作用。
然而,僅憑這種程度的改進並不是“驚人的”。 根據OpenAI的官方報告,SORA的“革命性”主要體現在以下幾點。
首先是持續時間。 作為一般的文盛**大模型,它可以根據使用者提供的文字描述生成長達60秒的**,不僅質量高,而且可以更完整、更準確地還原使用者輸入的提示,即提示詞。
其次,在場景的複雜度和角色生成的層面上,都是一次突破。 到目前為止,Sora 已經能夠生成包含多個角色、特定動作型別和主題的場景,這些場景精確且具有複雜的背景細節。 而鏡頭語言也開始複雜化,這讓**本身開始具備了一定的敘事功能,而這正是當下短**領域所需要的。
第三,除了文字生成外,SORA還可以從靜態影象中對影象進行動畫處理,或者從現有影象中生成新影象,從而填補缺失的幀或擴充套件內容。
一位資深科技人士告訴陸九經營導報,SORA等AI產品的出現,是一次“平等思考”的機會,因為一些長期跟蹤行業的科技記者,往往有一些“開腦”的想法,但是沒有合適的工具讓想法落地。 但是有了GPT和SORA這樣的AI工具,一旦記者看到乙個機會和乙個想法,AI可能會幫助他實現產品,剩下的就是驗證產品的可行性。
不過,在與眾多行業人士交流後,《陸九商業評論》發現,就算是現在的風光無限,也有被高估的可能。
在他看來,SORA的出現很大程度上是文盛文的通用模式,延伸到了最前沿領域的舞台技術迭代。 SORA今天能有質的變化,很大程度上要歸功於算力和資金的無上限投入,以及海量訓練集的不斷重複,這是“大力創造奇蹟”的結果。
相較於技術實現的優越性,SORA在“資源稟賦”方面的優勢,顯然與國內眾多“算力不足”的廠商相距較大。 這是國內大型模型相關廠商長期以來無法逾越的差距。
從投資角度來看,SORA等垂直領域的“通用模型”並不是熱門目標。
一位一級市場從業者告訴陸九商業評論,純一級市場投資通常只投資大概念和高估值標的。 主要原因是一級市場存續期為7年,投資期為2年,退出是5年內的高概率事件。 不過,誰也說不准文盛的垂直模式能否在5年內實現產業化和商業化。
此外,目前SORA的所有已知資訊都只是2月15日發布的技術報告,但融資的訊息是在3天後傳出的。 在沒有開放使用且外界不知道其實際水平的情況下,在風險投資公司Thrive Capital領投的融資中,OpenAI的估值已接近800億美元。 這位一級市場從業者向陸九商業評論坦言,此次技術發布很可能是OpenAI“估值管理”的一部分。
崑崙萬維董事長周亞輝在朋友圈表示,“這裡(矽谷)的科學家和工程師根本不認可Open Al以外的創業公司的價值,覺得他們都是紙上財富。 我寧願openaiGoogle、FB Microsoft 100 萬包(半**)報價,而不要啟動 300 萬(80%**)報價。 ”
可以看出,在SORA之後,OpenAI進一步拉大了與其他AI廠商的差距。
雖然Meta、谷歌和Microsoft都做好了出手的準備,但相比於SORA上資本市場的狂熱,國內大型模型廠商要平靜得多。 國內各大廠商大多選擇根據自身應用開發大模型,而不是追求所謂的原始AI大模型公升級。
Byte 就是其中之一,其對生成式 AI 的保守態度早在文盛階段就已經體現出來了。 而且從輸入時間的角度來看,位元組並不遲到。 根據後來的乙份報告,在 OpenAI 於 2020 年 6 月發布 GPT-3 後,Byte 訓練了乙個具有數十億個引數的大型生成語言模型。
如果按部就班地發展起來,到2023年,位元組和OpenAI的GPT之間的距離不會很遠。 只不過,在ROI的業務體系下,Byte的投資顯然沒有被計算出來。 因此,它對生成式人工智慧的探索一直比競爭對手慢。
從上映時間來看,文心一言將於2023年3月上映,迭代至4版本 0,緊隨其後的是阿里的通益千問和騰訊混元助手,而位元組發布的雲雀模型的發布時間是 2023 年 8 月。
後者導致的結果之一就是使用者不足——文心藝言去年月活躍度突破1億,豆袋位元組數仍低於1000萬。 不過,在Byte選擇張楠負責建英之後,預計生成式AI的進展會快一些。
如果Byte沒有看到在文盛領域可以立即使用的產品**,那麼阿里就不是這種情況了。 早在去年的世界大會上,文心一言的文生**能力就已經展示出來了,主要整合在“一鏡影”外掛程式中。
當然,出現在世界大會上的這一代**只是無數扭蛋中的成功案例。 陸九的商業評論發現,一鏡到底的拍攝還是有一些侷限性的。
乙個是材料庫。 目前,One-Shot Streaming 使用無版權素材庫,無法將其用於特定品牌的工業商業用途。
二是目前無法用肖像生成**,但由於可能擁有肖像權,可以用來生成未註冊商標的商品**。
第三是目前生成的**在30秒左右,如果想達到與SORA類似的效果,還需要做兩種**材質的拼接。 如果你想保持內容和風格的一致性,這顯然會變得困難。
目前,通益千問是使用最多、最受歡迎的相關技術,以民族舞王為代表。 只需要一張全身照片,就可以讓他們表演各種流行的舞蹈動作。 在B站,與慈禧等歷史人物的第二次創作,加起來大約有1000萬。
雖然還沒有達到產業化的水平,也沒有拉平與國外SORA的差距,但國外SORA也沒有實現產業化,這意味著至少在商業化過程中,兩者之間還有不大的距離。 其餘的只需要繼續追趕。
星星AI董事長李明順也持類似觀點。 他告訴陸九商業評論,目前,OpenAI仍然佔據著行業頭部的位置,但很大程度上是基於之前的算力儲備和技術積累。 BAT和bytes等國內廠商將繼續迎頭趕上。 原因很簡單,從某種程度上說,通用模式已經成為網際網絡企業基本能力的象徵。
比賽似乎才剛剛開始。
文生**,真正的贏家在哪裡? 當然,無論是OpenAI的SORA還是國內多家大型模型廠商,其最終目標依然是產業化、精簡優質內容的製作。
但目前,即使它像SORA一樣強大,也存在許多不成熟的因素,使其無法應用於工業化領域。 AI動態**解決方案產品智行源(www.)。creatlyai.CN)產品架構師告訴陸九經營評論,雖然SORA目前看起來非常方便,但高質量的**可以通過文字直接生成,只需要幾個提示詞來控制,對使用者思想和操作的負擔似乎很小。
然而,由於目前SORA對真實物理世界的了解有限,在某些場景中仍然會出現問題。 燭光的誤導、精度的無序數字、空間物體進出的失真等細節,在後期剪輯中很難改變。
這並非沒有解決方案。 由於SORA目前具有擴充套件和拼接功能,因此使用者可以生成幾秒鐘的後期裁剪。 如果對於對提示詞工程了解不足的人來說,很難避免多代+人工後期製作。
此外,在工業產品宣傳片中,客戶通常會發布一些**產品,如**羽絨服、新車、新手機等。 但是,使用者的素材在**模型的訓練集中並不存在,導致只生成了類似的產品,然後進行再加工,也就是在影視後期。
同樣,專業使用者和非專業使用者的需求是有區別的。 例如,對於普通的輕度使用者來說,如果沒有商業需求,那麼模型就是演示產品,任何新生成的作品都會給他帶來驚喜。 但是,對於專業使用者(如導演)來說,如果一次性生成不盡如人意,那麼還涉及多代、多次後期製作,對算力和人力來說都是很大的負擔。
上述電影人告訴陸九商業評論,在影視製作過程中,後期最大的成本是負責剪輯和特效,也就是二次加工的人工成本。 如果工作流程不夠先進,很可能會在後期製作過程中推高成本,進而影響專案的投資回報率。
如果說現在的文盛還需要大量的人工調整,鏡頭和物理世界的還原不可能是1:1,那麼用AI生成**材質的價效比其實並不高。
基於此,一位影視後期製作從業者告訴陸九商業導報,在他看來,AI能直接替代的,其實是建設、拍攝等中期工作。 由於AI可以模擬和還原物理世界,因此可以對其進行不斷的訓練以接近真實水平。
以上只是SORA對影視行業變化的部分推論。 至於遊戲、廣告、短片創作等細分領域,變化必須遠遠超過問題。 人工智慧的應用及其革命性的變化無疑是巨集偉的。 不過,國內大型廠商顯然更願意在AI應用的商業化方面下功夫和嘗試。
同樣,根據周雅輝的朋友圈劇透,“開放人工智慧即將發布GPT4”。5、估計在Anthropic發布克勞德3的時候會特意放出來。 “除了SORA生成**,最新迭代的Open AI還有什麼驚人的創新,這應該是國內從事大模型戰略和業務部門的廠商最關心的事情。
最後,對於文盛**來說,是立足+AI做大規模模型應用,還是基於AI+訓練公升級自己原有的大規模模型。 顯然,美國大公司和中國大公司已經做出了自己的選擇。