OpenAI Sora 技術解讀投資機會

Mondo 財經 更新 2024-02-19

1. 專家解讀SORA的技術細節和行業影響

1、OpenAI發布的SORA是科技的巔峰之作,大力產生奇蹟成果,在**領域出現了“湧現”;

2、SORA已達到可以投入商業或工業生產的水平,是創作領域的里程碑式產品;

3、SORA成果帶來的對Infra和AI晶元的更大需求將快速增加,高階算力消耗需求將快速增長;

4.SORA受計算資源短缺的限制,不能使用過多的大量模型引數,但還是很好的工作,未來引數數量增加的瓶頸在計算資源上。 要實現AGI,需要有更強的AI晶元和更強的算力。

2、2023年10月至今國內外AI領域回顧:多模態推動AI大模型領域進入第二階段。

1、國內AI模式與國外AI模式存在代際差異的共識,但AI模式是下一代科技創新的核心,國產模式必須擁有自主智財權的共識仍是主流。 自10月底以來,該行業一直受到國內外行業進展和A**市場波動的影響。

1)10月底,經過一輪深度**,加上三季報落地,板塊接近觸底,崑崙萬維、中際旭創等具有技術和效能能力的企業率先登台。此時,國內AI產業伴隨著大模型備案的完成,尤其是11月3日,經過近半年的等待,第二批大模型備案通過,市場格局逐漸明朗。

11月到12月,海外大模型領域同時迎來了一系列更新,這也支撐了這一階段。

2)12月底,第乙個領域開始,包括劇集行業政策的影響,加速了媒體板塊的恐慌性調整,包括AI大模型和應用公司,一直持續到1月。

此時,國產AI大模型開始探索從GPT3到GPT4的飛躍,市場普遍認為國產大語言模型處於GPT3和GPT4之間的水平。

會議紀要**:溫八沽研究]小程式

3)1月26日,據路透社報道,美國商務部長吉娜·雷蒙多(Gina Raimondo)表示,拜登將提議要求美國雲計算公司確定外國實體是否正在訪問美國資料中心以訓練AI模型。基於此,美國商務部發布了關於“採取額外措施應對嚴重惡意網路活動的國家緊急狀態”的意見稿(系統顯示發布事件為2024年1月29日),徵求意見截止日期為2024年4月29日。 這一訊息進一步打擊了國內人工智慧行業的情緒,隨著市場調整,該行業繼續下滑。

2、從海外來看,AI依然引領著整個科技的發展方向,多模態成為主要發展方向,從大型語言模型到多模態,再到通用人工智慧,路徑逐漸變得清晰,分歧點主要在節奏的判斷上。 如果說2023年初ChatGPT的退出是AI領域突破的主要催化劑,那麼新一輪的突破則是從大型語言模型到多模態的進一步突破,帶動AI領域進入第二階段。

1)在大型模型領域,OpenAI雖然經歷了短暫的內部管理失控,但很快就走上了正軌,GPT應用和多模態加速發展。

11 月 6 日,OpenAI 舉行了首次開發週日,會上進行了多項重大更新,包括 OpenAI 官方宣布推出自己的 GPT,即將推出“GPT 商店”,與創作者分享收入。 OpenAI 內部管理層內部出現了分歧,但很快就得到了解決。 OpenAI 的 ChatGPT 仍然是 AI 終端應用中排名最高的獨立應用。

12月初,多式聯運技術開始迎來多重突破,pika10 測試結果令人驚嘆; 12月6日晚,谷歌發布了最新的雙子座大模型。 Gemini 從一開始就是乙個多模態模型,可以概括和流暢地理解、操作和組合不同型別的資訊,包括文字、音訊、影象等。 谷歌發布 Gemini,谷歌的 Gemini 大模型首次在 MMLU(大規模多工語言理解)評測中超越人類專家,在 32 個多模態基準測試中取得了 30 個 SOTA(當前最優結果),幾乎在所有方面都超越了 GPT-4,1 月 12 日,Open AI 正式向 ChatGPT Plus、團隊和企業使用者推出 GPT 商店,合作夥伴和社群開發的多種 GPTS 可用。 第一季度將推出GPTS Builder收入計畫,作為第一步,美國開發者將根據使用者與GPT的互動獲得報酬。

那麼本週,OpenAI發布了第一代模型SORA,可以生成長達一分鐘的高畫質**,可以生成多個角色和特定動作的複雜場景,展現出突破性的語義理解能力、複雜場景理解能力和一致性等,效能效果遠優於之前發布的**模型,真正開啟了**大模型的時代。

2)在計算晶元領域,對AI晶元的強勁需求引發了持續的人工智慧投資狂潮,12月,AMD正式推出AI GPU加速器Instinct MI300X和全球首款資料中心加速處理器APU Instinct MI300A,此後,從1月到2月,海外科技巨頭陸續披露財報和新品, 英偉達對AI大模型算力需求旺盛,在去年下半年在多模態進展和預期上公升的情況下,股價突破平台。

3)在市場層面,美國經濟仍在蓬勃發展和軟著陸的預期正在增強,而英國、歐洲部分地區和日本正處於衰退之中,這使得美國股市繼續表現強勁。

3、通過以上綜述,我們可以總結出:1)正如我們在年度戰略中強調的那樣,多模態是2024年AI大模型領域最重要的邊際變化,但並不是AI發展的終點。我們仍然不確定AGI何時到來,但從近期多式聯運超出預期的進展來看,AGI的時機可能比市場預期的要早。 多模態的意義就像 2022 年底 ChatGPT 的發布一樣,引領 AI 大模型板塊進入第二階段。

2)對於中國來說,大模型和應用的格局比半年前已經清晰了不少,但現在還遠未到來,因此,在投資方面,還是要看產業趨勢,買比較優勢。我們仍然認為,2024年,中國有望迎來大語言模型領域的突破,從SORA的角度來看,算力還是前提,擁有更多的算力是大型模型公司跑出來的硬門檻。

3. 您如何看待Openal Sora的出現?

2 月 14 日,OpenAI 宣布將為 ChatGPT 增加記憶體能力,16 日,谷歌推出了 Gemini 15系列,專業版支援100萬個代幣的上下文視窗,比之前業內大模型高出乙個數量級,100萬個代幣相當於70萬字或1小時**,大模型的應用場景將大大拓展。 Gemini 的多模態能力也得到了顯著公升級,從第一代能夠讀取影象的能力提公升到 15.可以看**,比如雙子座可以在某部電影中找到某個時刻,並描述相關細節,但現在距離第一代發布還不到3個月,大模型的多模態能力的發展可能比我們想象的要快。

而在谷歌發布 Gemini 的第二天,OpenAI 的首款 ** 模型 Sora 驚豔亮相。 在我們之前的多模態深度報告中,我們明確指出,2023年的**一代可以與2021年的2D影象生成相提並論,考慮到大型語言模型對AI各個領域的加速效應,今年的**一代可能會有更大的發展,而SORA的出現也驗證了我們之前的觀點, 隨著行業整體技術水平的提公升,可能會像文盛圖領域一樣,一些流行的**代應用會用完,行業會加速發展。我們專注於梳理SORA在實現技術突破後給產業鏈不同環節帶來的變化和機遇

我們認為的第乙個層次是新技術解決方案得到驗證的機會:

1)對算力的需求增加。SORA採用擴散模型+Transformer架構,擴散模型在生成多樣性和質量方面表現不錯,但很難實現更好的語義控制和一致性,而這正是Transformer擅長的,擴散和Transformer整合的技術路徑是去年才提出的,然後在12月,李飛飛和谷歌團隊推出了**生成模型Wa.l.T也使用了類似的技術方案,但仍然停留在學術研究的層面,這次SORA進一步驗證了兩種模型組合的潛力,未來其他玩家也會在這個方向上加大嘗試力度,一些開源模型也可能會出現,有望推動行業整體技術水平上去。 過去,Transformer 模型對算力的要求大於擴散模型,這裡對算力提供者來說會有更多的機會。

2)對資料的需求增加。SORA統一了影象和**的資料表示,通過大量的資料集擴大了模型大小,提公升了模型的效能,擁有大量高質量影象或**資源的玩家有望受益。

3)3D等多模態領域也可能加速。與之前的**生成模型相比,SORA開始展現出對物理世界的理解和互動能力,角色或物體在**中不會輕易變形,但可以保持良好的一致性,OpenAI還表示,SORA不是簡單地被視為乙個**模型,而是作為乙個“世界模擬器”,而**生成模型的擴充套件可能是構建物理世界通用模擬器的一種很有前途的方式。 事實證明,AI 3D模型在生成效率和精度方面並沒有找到很好的平衡點,而這一波領域的技術突破可能會給3D領域帶來一些靈感,AI 3D引擎的技術拐點可能比市場最初預期的要快。

我們認為的第二個層次來自發電技術突破後落地應用的機會:

1)發電技術在廣告、電商等垂直領域的商業可行性大幅提公升。與之前的模型相比,SORA的語義理解能力、一致性和靈活性都得到了顯著增強,這意味著生成技術的商業可行性得到了極大的提公升,例如營銷領域可以為中小型B提供更多的營銷工具,電子商務領域可以為賣家提供相關服務,對應企業的客戶支付率和ARPU值有更大的空間起色。

2)構思實施成本大大降低。SORA可以生成長達一分鐘的高畫質**,已經基本滿足了目前主流短**創作時間的要求,再加上之前文字創作、文盛圖片等技術的成熟,製作不同形式內容的門檻和成本都大大降低,一方面,手頭有豐富IP資源的玩家有望降低試錯成本, 拓展IP變現的方式,另一方面,可能會有更大的商業化空間的新UGC平台,每個人都可以創造IP。過去,對於小紅書、知乎、抖音、快手等UGC平台來說,使用者建立內容的門檻每提高一倍,使用者建立的內容數量就會增加十倍,相應平台上的使用者規模也會大幅增加。 **一代技術成熟後,抖音或將誕生乙個新的AI時代,更有趣的是,抖音集團前CEO在2月初宣布辭職,後期的精力將集中在編輯工具剪裁上,可見大廠商其實看到了機會,當然, 這個過程也會有原有玩家被顛覆的風險,比如Adobe的股價最近也出現了波動,我們認為國內市場聚焦於AI模式的企業,持續投資的企業可以有更大的拓展空間,擁有海外應用接入模型能力並充分發揮工具價值的企業,可以實現垂直場景的深度培育。

深度耕耘垂直場景:**需要結合劇本構建、畫面、風格、粒子、特效等多種元素,但要實現完整商業內容的製作仍然需要人員和工具,**創作者的數量會隨著創作門檻的下降而大幅擴大,工具產品提供更方便快捷的工具配合場景, 以及了解和服務垂直使用者的體驗,在技術之上更加關注使用者的需求和體驗,這也將受益。

3)影視、遊戲、MR領域的專業創作者可以利用先進的AI技術降本增效,比如動畫電影的產能可能進一步擴大,頂尖玩家有望受益。

4)隨著內容的增加,對資料傳輸、編解碼、內容審核等環節的需求也會增加,相關玩家相信有望受益。

最後,我們認為多模態一定是AGI,即實現通用人工智慧的必由之路,也是AI商業變現的真正起點,無論是谷歌的Gemini公升級還是OpenAI的SORA,都有望推動AI多模態應用的進一步加速,24年後行業層面的變化可能比23年更大, 我們也看好TMT全年的投資機會。

算力:基於春節以來AI產業鏈的傳聞,我們認為算力板塊仍有上調空間。

1)首先,Open AI這邊不斷有新訊息和新動作,據介紹,公司計畫募集5萬億至7萬億美元打通算力晶元第一鏈,投資金額遠超全球半導體市場約5000億美元的市場規模;

2)英偉達宣布有意開發定製計算晶元(如ASIC),還正式發布了1月份CES上展出的Chat with RTX,使用者可以在使用NVIDIA RTX顯示卡的電腦上本地使用LLAMA和MISTRAL模型,其推理框架比常見的PyTorch和LLAMA-CPP更強。

3)最後,從春節前到現在,海外AI產業鏈上的眾多龍頭廠商紛紛發布了最新的財報,並給出了相應的指導,從中可以看出,算力建設仍是未來產業發展的重中之重。一方面,無論領先雲廠商傳統業務表現如何,其AI計算設施的建設是未來資本支出增長的主要驅動力,另一方面,AMD、Coherent(Finisar母公司)、 Lumentum(Cloud Light 的母公司)、Arista 和 Fabrinet 取得了良好的增長。同時,AMD持續強調27年算力晶元市場規模為4000億元的預期(類似於我們根據台積電計算的3600億美元),相干公司也將800G及以上光模組市場規模的CAGR上調至28年65%。

基於以上資訊,我們認為:

首先,我們來看Open AI,它不僅是AI的破圈者,也是行業的推動者,是一條“鲶魚”(可能與CEO的對外宣傳風格有關)。 因此,這些新模型對行業的影響並不侷限於模型本身,一方面,SORA自身對訓練和推理算力的需求非常明顯,當讀取時間相同時,token數量比文字高出幾個數量級,所需的算力也是一樣的; 另一方面,公司帶來的鲶魚效應值得關注,無論是Open AI在計算晶元上給出的投入金額,還是與谷歌同時發布新品搶風頭,都表明了公司的目標是成為AI時代的新巨頭, 並且不排除Open AI也保留了一些未公開的產品。

其次,縱觀產業鏈廠商給出的中長期指引,雖然大家都是瞎子,甚至算力需求乙個數量級都是瞎子,沒有確切的認識,但從質上看,產業鏈的指引,隱含著算力空間會繼續上公升甚至倍增的邏輯。

最後再看看英偉達的新動作,無論是做定製晶元還是推出PC軟體產品,都是貫徹全員參與AI的理念,進一步提公升行業內的卓越程度,尤其是在PC的邊緣,格局與雲相比還不明朗,在英特爾的情況下, AMD和高通都已入局,英偉達肯定會從GPU給AI終端市場帶來大的邊際變化,不僅在產品成熟度方面,而且在供應保障和採購方面**上游對下游PC工廠有利。

基於以上分析判斷,光模組仍是可見光範圍內AI產業鏈最強、最確定的共振屬性,我們推薦該領域的龍頭企業中際旭創和天府通訊,同時推薦信益盛和元傑科技,它們有潛在的邊際變化。 同時,模型和邊緣架構的開發也加速了PC主機廠的銷量和利潤,全球領先的PC主機廠商聯想集團值得推薦。

會議紀要**:溫八沽研究]小程式

相關問題答案

    OpenAI 的 Sora 技術解釋

    一 引言。隨著人工智慧技術的快速發展,OpenAI作為全球領先的非營利性人工智慧研究機構,一直在推動人工智慧技術的創新和突破。SORA技術是OpenAI近年來推出的一項重要技術,旨在實現更高效 更穩定 更安全的AI模型訓練和部署。本文將對SORA技術進行詳細解讀,並分析其原理 應用場景和未來發展趨勢...

    背投是如何工作的?探索背投背後的技術

    投影儀設計為使用兩種型別的投影儀螢幕之一。在這種情況下,這些投影儀或光束源可以放置在螢幕的前面或後面。這種配置分別為我們提供了前投屏和背投屏。投影設定有兩個主要元件。投影儀或光束源 投影儀是一種將影象投射到螢幕上的裝置。該影象是使用投影儀內建的專用光學裝置構建的。根據要求,這些裝置的範圍可以從簡單到...

    鐵路路基沉降注漿技術解讀

    近日,不少朋友查閱了鐵路路基下沉灌漿技術解讀的相關內容,以下是相關知識點的總結,希望對大家有所幫助。概念 鐵路路基下沉注漿技術是指通過在鐵路路基下注入水泥漿,填補路基中的空隙,提高路基的穩定性和承載力的施工技術。該技術適用於鐵路路基的修復 加固和沉降防治。施工過程 挖溝 需要在需要修補或加固的路基旁...

    樑中預埋件施工技術解讀

    很多人對樑中預埋件的施工工藝解讀不太了解,這裡為大家準備了與此相關的介紹,感興趣的家人和朋友可以閱讀和收藏。預埋件是建築工程中使用的一種固定構件,通常預裝在混凝土樑中,在建成後的梁施工中起到特定的作用。嵌入式零件可以分為不同的型別,每種型別都有自己獨特的功能和設計特點。預埋件的定義是指混凝土樑中預裝...

    鋼板鎧裝接頭施工技術解讀

    最近,已經有不少人反饋,想多了解一下鋼板鎧裝接縫施工工藝的解讀,下面就為大家做乙個相關的介紹,供大家參考。鋼板鎧裝接縫施工技術是指在建築工程中使用鋼板鎧裝材料進行接縫施工的技術。主要用於加固和修復混凝土結構中的裂縫 裂縫和易損件,提高結構的抗震性和承載力。下面將詳細介紹鋼板鎧裝接縫施工技術的步驟和技...