位元組跳動加速AI布局

Mondo 科技 更新 2024-01-28

本報記者李坤坤、李正浩北京報道。

11月27日,在位元組跳動確認遊戲業務萎縮的當天,《第一財經報》記者注意到,位元組跳動成立了新的AI(人工智慧)部門Flow,由位元組跳動技術副總裁洪定坤、位元組跳動大模型團隊負責人朱文佳擔任技術負責人。 根據Flow相關招聘資訊,Flow是位元組跳動的AI創新業務團隊,已分別在海內外推出豆包和CICI兩款產品,並正在孵化多款AI相關創新產品。 業界普遍認為,這可能是位元組跳動在加大AI應用開發力度的同時,收縮遊戲業務的訊號。

《第一財經日報》記者開啟鬥寶APP,發現其已經上線了程式設計助手、文學伴侶、人氣文案、愛情大師等應用功能,值得一提的是,鬥堡還推出了建立AI代理的功能,所有使用者都可以在豆包上建立自己的AI代理。

記者問豆包有哪些應用場景,結果顯示:“我是位元組跳動基於雲雀模型開發的人工智慧,我叫豆包。 我可以將其應用於自然語言處理、對話系統、智慧型客服、內容生成、智慧型助手、教育培訓等場景。 這些只是我的一些用例,隨著技術的不斷發展,我的用例將繼續擴充套件。 ”

CICI專注於海外市場,已於2024年8月在多個海外市場上線,目前已在36個國家和地區上線,基本覆蓋除歐美成熟市場外的全球其他地區。

建立 AI 代理

事實上,早在2024年,位元組跳動就成立了AI實驗室,專注於自然語言處理、機器習、資料探勘等方面的研究。 抖音、今日頭條等位元組跳動產品也頻頻加入AIGC(生成式人工智慧)功能,持續吸引流量。

人工智慧在位元組跳動的核心業務中一直扮演著重要的角色。 根據抖音官方標籤演算法圖,人工智慧是整個過程的核心。 從機器檢測,到組合關鍵詞匹配,再到疊加推薦、系統“挖墳”、更高層次的流量池,AI都出現在相關場景中。

在豆包的介面中,特別引人注目的是,每個使用者都可以在豆包上建立自己的AI代理來獲得粉絲,粉絲可以與AI代理對話。 記者嘗試在豆袋上建立自己的代理,諮詢問題會自動得到回覆。

比如記者問豆包的資料**,豆包是這樣回答的:“我是基於位元組跳動雲雀模型開發的人工智慧,我的訓練資料來源於網際網絡、圖書、新聞、社交網路等多個領域的文字資料。 經過清理、預處理、標註等一系列處理步驟後,資料被用於我的訓練。 ”

談及豆袋與openai、文心一妍等大模型產品的區別,盤古智庫高階研究員江告訴本報記者:“從優勢來看,一是專注於某個領域,而豆袋可能專注於某個特定領域,比如娛樂,這使得它在這個領域的理解和應用可能會更深入。 第二個是本地化優勢,如果豆包是針對特定地區或國家開發的,它可能會更好地理解該地方的文化、習和語言,從而在某些任務中表現出色。 從缺點來看,一是規模較小,與OpenAI、文心易言等相比,豆包可能在模型大小、訓練資料量、計算資源等方面受到限制,可能會影響其在某些任務上的效能。 二是通用性差,因為豆包目前主要集中在某個領域或地區,在其他領域或地區的表現不如大型通用型號。 ”

記者了解到,豆寶的訓練資料來源於網際網絡上大量的文字,包括新聞、部落格、**等,而OpenAI的訓練資料來自多個領域的文字,包括科技、藝術等;豆寶的模型結構基於深化學習,使用多層神經網路,而OpenAI的模型結構基於強化學習,使用深強化學習演算法豆包的應用場景主要是自然語言處理,包括文字生成、問答、翻譯等,而OpenAI的應用場景更為廣泛,包括機械人、遊戲、金融等領域。

總的來說,目前豆包和OpenAI的區別可能在於它們的訓練資料、模型結構和應用場景不同。

大型模型盛開

大模型是今年網際網絡行業的關鍵詞。 事實上,自2024年以來,國內已經湧現出一些具有代表性和影響力的大模型。 受ChatGPT影響,2024年國產大模型進入快速發展階段,“百模大戰”的局面將一度呈現。 賽迪諮詢資料顯示,截至2024年7月底,中國共發布130款大型車型,其中2024年將發布64款大型車型。 國內大模型技術分布與國外基本一致,65%的大模型集中在自然語言領域,22%的大模型集中在多模態領域。

在全球範圍內,中國和美國在大型模型領域處於領先地位。 根據中國科學技術資訊研究所和科技部新一代人工智慧發展研究中心聯合發布的《中國人工智慧大模型地圖研究報告》,截至2024年5月,美國已發布100個引數規模超過10億的大型模型。 自2024年以來,中國也積極跟隨全球大模型發展趨勢,加速產出,如北京人工智慧研究院於2024年6月發布1.75萬億引數的啟蒙 11月,阿里M6大模型的引數達到10萬億。

同時,在應用方面,基於通用大模型的能力已經相對成熟和可用,其上的應用生態逐漸繁榮。 得益於先進演算法模型的融合和早期的產品化,OpenAI不僅在人機對話中展現了GPT(生成式預訓練Transformer模型)的意外表現,而且在基於GPT的應用生態中逐漸繁榮起來。Jasper 等 AI 營銷和創意公司已與 GPT 建立聯絡。

2024年,位元組跳動在AI領域的行動將大幅加速。 6月,Volcano Engine發布了大型模型服務平台Volcano Ark,在乙個平台中提供多個模型,讓企業使用者可以同步試用,選擇更適合自己業務需求的模型組合,實質上起到了“賣鐵鍬”的角色。 其自主研發的通用大模型“雲雀”從未正式公布,在今年8月通過《生成式人工智慧服務管理暫行辦法》的首批大型模型中也沒有亮相。 8月17日,位元組跳動公開測試了基於雲雀大模型開發的AI聊天機械人“豆寶”,並專注於面向C端市場的AI應用。 此外,市場上也有訊息稱,位元組跳動正計畫開發雲AI晶元和ARM伺服器晶元。

算力儲備方面,位元組跳動今年向英偉達訂購的GPU產品總價超過10億美元,接近英偉達去年在國內銷售的商用GPU總數,GPU是AI訓練不可或缺的計算基礎設施。

談及是否看好鬥寶未來發展,財經專欄作家馬對本報記者表示:“目前還是比較有潛力的,這可能取決於幾個方面,一是位元組跳動的雲雀模式在行業內還是比較先進的,此前有報道稱位元組跳動在AI晶元儲備上還是有優勢的, 所以其底層技術實力不用擔心。 二是位元組跳動有寫大模型的人。 第三,位元組跳動還擁有龐大的資料能力,肯定會把雲雀模型訓練得更智慧型。 基於以上三點,如果大模型本身更先進、更智慧型,那麼上面的應用應該不會太差。 ”

江認為,鬥寶的未來取決於多個因素,包括其技術路線、市場定位、合作夥伴和競爭格局。 如果豆包無法突破技術或資源的限制,或者面臨激烈的競爭和市場壓力,其未來的發展可能會受到挑戰。 但是,如果鬥寶能夠繼續深化其在特定領域或地區的技術和應用優勢,並與其他企業或機構建立合作關係,則有可能在該領域或地區取得領先地位。 此外,如果豆寶能夠繼續投入研發,跟上技術發展的步伐,並擴充套件其模型和資料,它也有可能成為更具競爭力的通用模型。

相關問題答案

    帕金森病有跳動的肚子嗎?

    帕金森病是一種常見的神經系統退行性疾病,主要影響運動能力。它的症狀包括震顫 肌肉僵硬 動作緩慢和平衡問題等。雖然帕金森病主要影響運動系統,但有時患者可能會感到胃部悸動的症狀。胃部悸動的感覺可能是由於帕金森病引起的肌肉震顫。震顫是帕金森病的主要症狀之一,通常表現為手 手臂 腿或下巴的震顫。然而,有時震...

    生命交響曲 舞蹈健康之舞,共鳴身體、心靈、靈魂的美妙旋律

    編輯健康小事。健康小事。閱讀此文大約需要分鐘,祝您閱讀愉快 健康是一種感動我們身體 思想和生活的舞蹈。在這場健康之舞中,我們將探索生命的輕盈,感受身心心靈共鳴的美妙旋律。健康之舞的開始是身體的節奏。運動 呼吸 血液迴圈,每個細胞都參與到這場生命之舞中。無論是靜謐的瑜伽之舞,還是激情澎湃的有氧運動,身...

    您知道嗎,平均每天心跳約 10 次?

    三分鐘談科普 心臟,這個拳頭大小的器官,日復一日地在我們的身體裡默默地工作,通過持續而有力的跳動將富含氧氣和營養的血液幫浦送到全身。據統計,乙個正常人的心臟每天跳動約次,每年約次億次,一生超過億次。本文將帶您了解心臟的日常工作以及如何保護我們的心臟健康。.心臟的結構和功能 心臟主要由心肌組成,分為左...

    “一旦位元組移動”,房子就租不出去了

    池塘裡的水越來越多,但魚卻越來越少。這兩天,位元組在南山蛇口總部遊戲板塊的業務和團隊調整,已經傳遍了深圳人的微信群。員工們上午接到訊息,中午與HR開會,下午掃碼進入網易騰訊招聘群,讓人一時間感嘆深圳人的效率。而優化訊息從網際網絡一線傳來,地產圈人心平不氣有人直接將位元組優化團隊等同於房地產市場,認為...

    位元組遊戲“斷裂”,王者榮耀再戰,網際網絡巨頭“回歸神靈”?

    作者 赤城瓶 編輯 mia 在輕 中 重內容被 品嚐 後,位元組選擇退出遊戲主力陣地。月日,有訊息稱,位元組跳動的遊戲業務將進行大規模業務收縮。具體來說,對於已經上線且表現良好的遊戲,他們會在保證運營的條件下尋求剝離 對尚未立項的專案,除少數創新專案及相關技術專案外,予以關停。位元組數正在萎縮的不僅...