封面新聞記者 孟梅 張月喜。
近日,第一代SORA一經推出,就首次引起了各界的關注,被稱為ChatGPT誕生後人工智慧領域的又乙個“WOW”時間點。 與此同時,知名AI公司Emotibot被傳出宣布停產半年,引發了大眾對技術商業化領域新舊換代速度的感嘆。
2月22日,封面新聞記者專訪了上海財經大學電子商務研究所執行主任崔麗麗。 她表示,當一項創新剛剛出現時,對當前SORA觀點的任何決定性趨勢判斷都可能為時過早。
雖然一些公布的SORA生成結果幾乎是現實的,甚至比大多數缺乏專業能力的內容製作者還要好,但要真正取代或主導內容創作,還需要時間,甚至是很短的時間。 根據崔麗麗的說法,SORA主導或取代了內容創作,至少取決於模型和使用者的因素。
崔麗麗,上海財經大學電子商務研究所執行主任。
在模型方面,有兩個方面起著決定性的作用:一是人類世界已有內容的積累和人工智慧模型的學習速度,二是人工智慧模型如何進一步理解和掌握純內容背後的一些隱含關係。 她表示,從SORA的現狀來看,這其中的第一點已經實現,那就是根據對已經精細標註的內容的學習,快速標註和學習簡單標註和非標註的內容。 但是,第二點在SORA中還沒有看到,即在展現出完美的視覺生成畫面的同時,是否涵蓋了畫面中所包含的機械關係、時空因果關係、區域性關係和整體關係,這將決定所生成的視覺畫面的合理性和真實性。 很難在單一維度上識別視覺影象和內容之間的邏輯關係。
這可能意味著,大語言模型在標註視覺畫面的內容時,不僅要用語言描述和描述畫面的狀況,還需要標註畫面中反映的隱含的物理關係,但問題在於語言描述不如數學公式準確。 崔麗麗解釋說,換句話說,在現實世界中構成合理性的數學和物理原理並不是現有大型語言模型的專業知識,可能需要由其他更擅長數學或物理原理的技術模型來補充。 顯然,突破還需要時間。
在她看來,即使這些問題都解決了,Sora仍然需要面對完美的實驗室產品與大規模工業化應用之間的差距。 崔麗麗從適合應用場景和使用者側兩個方面進行分析。 首先,使用乙個好的AI模型也需要技巧,而要成為一名魔術師,首先要學會使用法術。 該領域的閾值決定了新技術應用的速度和頻率。 比如ChatGPT問世後,就出現了這樣乙個專業職位的提示詞工程師。 有人說,每乙個人工智慧模型的出現,都是第乙個把班級養肥的。 各種培訓課程的出現,足以說明,一項新技術的全面更新換代,需要全行業準備一整段時間,而個人技能的準備往往是第一步。
從進一步的商業角度來看,雖然新技術可以在早期階段帶來競爭優勢,但也需要一些投資。 崔麗麗指出,這些投資不僅包括資金,還包括裁員、組織調整等隱性管理成本。 綜上所述,導致公眾開啟未來世界黑洞的奇點還遠未結束。 這個等待過程取決於現有行業資料的積累、模型的完善程度、應用場景的適應性、學習門檻、資金和管理成本。
場景需求是點燃技術生產力的魔杖。 崔麗麗提出的觀點是,從優化的角度來看,一方面,現有行業的資料積累、資料質量、標註深度需要不斷加強,這取決於場景行業的數位化程度,因此是持續推動各行各業資訊化程序加速、實現數位化轉型的必由之路。 另一方面,對於AI模型本身來說,重要的是整合更多可以隱含反映現實世界中全域性關係的模型表示。
我們已經看到太多的新技術在資訊科技領域加速發展。 例如,電子商務行業正在見證從基於搜尋的平台到社交通訊再到內容分發的正規化轉變,而內容分發正在以越來越快的速度收集流量。 事實證明,學習門檻越低,一項技術的普及和全面更新換代就越快。 因此,降低使用AI模型的門檻,與大家一起學習使用AI模型是乙個雙向的過程,可以促進奇點的更快到來。 這需要技術人員和教育行業的長期努力。 她想象,奇點之後,人工智慧的出現可能會創造乙個新的文明。 人工智慧與元宇宙技術的交匯與融合,或許真的能創造乙個“平行世界”。