聰明的東西
作者 |程倩
編輯 |沙漠之影
大模型的火已經燒到了個人終端,尤其是與我們生活和工作相關的個人電腦。
進入2024年,大模型行業的競爭焦點從量引數和量效能延伸到商用落地,各種AI應用和工具迸發出來,讓使用者對大模型有更強的感知。
一方面,一些企業在提公升通用大模型能力的道路上繼續快速奔跑,另一方面,一些企業開始探索在終端裝置上部署大模型的可能性。 各行各業的手機玩家紛紛部署大型模型技術,智慧型助手體驗被顛覆; 自主研發的輪輞大模型分批上車,重新定義智慧型座艙體驗; 還有智慧型家居廠商,機械人、晶元等賽道也在加速進軍......
PC作為醫療、教育、製造等各行各業的超級生產力工具,插上大機型的翅膀後,很可能會掀起生產力工具的革命。
就在昨天,PC行業龍頭聯想集團發布了2023財年第三季度財報 24. 財報顯示,聯想集團第三財季營收1136億元,同比增長3%,淨利潤近26億元,盈利能力連續兩個季度環比增長。 隨後公司同時發布了硬核科普**,揭示了聯想AI PC的原創性。
*通過炫酷的手法,聯動解說AI電腦,以立體動畫、立體故事板、平面故事板等逼真呈現聯想研發的AI OS生態和AI晶元TAC,大模型壓縮、知識蒸餾、向量化等前沿技術清晰普及。
2024年,生產力工具革命浪潮來臨,迎來AI為你的時代,聯想集團正在為AI PC行業探索新的可能性。
從最初出現聊天機械人,到現在建立在大型模型能力上的產品和工具,已經逐漸轉變為更實用的生產力工具。
在個人使用者將這些產品融入到日常生活和工作的同時,他們的需求也更加深入和細分,他們需要更符合自身使用習慣的個人模型。
這些需求側趨勢中有許多正在推動大型模型行業的轉型。 大型模型不再侷限於超大規模引數理論,採用壓縮技術在保持效能穩定的同時,減小模型的尺寸和計算複雜度,使其更易於部署。
當大模型可以部署到裝置上時,就會出現乙個問題,即如何使大模型的功能更適合使用者的個性化需求。
PC裝置脫穎而出,在互動模式、終端算力、本地儲存能力等方面具有優勢,使這款終端裝置成為AI技術惠及所有人的重要途徑。
首先,大模型驅動人機互動的變革,可以實現對語音、文字、影象、**的高質量識別和理解,從而使人機互動的方式更加自然、智慧型、高效。 同時,PC可以連線更多的外部終端,這是多種互動方式的核心,未來體驗會更加豐富。
其次,PC更適合於大模型對應創作能力的呈現,從原來的大語言模型到多模態大模型,其生成的內容已經從簡單的文字延伸到**、音訊甚至3D動畫。
最後,還有計算能力和資料。 PC是個人終端裝置中算力最強的產品,也更適合使用者儲存個人資料和檔案,因此可以支援大規模模型計算,保護使用者資料安全。
綜上所述,可以看出PC機型和大型機型的特性具有天然的適應性。
AI PC的出現進一步放大了PC的生產力工具屬性。
首先,我們必須回答最本質的問題:什麼是AI PC? 聯想集團董事長兼CEO楊元慶給出了AI PC的五大特點,與傳統PC相比,AI PC具有更強的算力、更大的儲存空間、體積小但效能不降低的大型號、完整的AI應用生態、安全和私隱保護。
前三個與基礎硬體和軟體基礎設施有關,即在PC上執行壓縮和效能優化的個人大型模型的能力,包括CPU、GPU和NPU在內的異構計算,以及包含使用者個人資料的本地知識庫。
後兩者測試了PC廠商的生態建設能力,讓AI PC可以有更豐富的自然語言互動形式,而不僅僅是文字、語音、手勢互動。 最後是讓AI PC更可靠,讓使用者的資料更安全。
基於此,未來PC不僅可以承載一般大模型的能力,還可以獨立執行使用者專屬的個人大模型,成為更實用的工具。 這背後,存在著許多挑戰。
AI PC不僅要壓縮超大規模引數模型,還要保證PC的可用性,保持穩定的效能。
在壓縮的大模型之上,AI PC需要為使用者構建自己的個人大模型,保持對使用者習慣、資料等內容的持續學習和訓練,並擁有強大的算力和儲存空間來支援這些資料的訓練和儲存。
更重要的是,個人資料私隱和安全問題與使用者的日常生活和工作息息相關,因此對使用者資料安全保護的要求也將突飛猛進。
現在,隨著這些技術困難的克服,人工智慧電腦將徹底改變生產力工具。
聯想集團展示的AI電腦,厚度只有不到2cm,裡面隱藏著多少黑科技?
*使用3D動畫,通過建模效果還原AI PC獨創性背後的技術點,將AI PC進行三維拆解,我們可以看到AI PC的基礎是強大的異構計算能力,高效能的CPU、GPU、NPU構成了大模型的初步硬體架構。
在硬體架構之上,如何實現PC可以控制的大模型? 其實,將引數比例大的模型安裝到PC上是很困難的,在用一組數字量化的時候,我們發現OpenAI之前發布的大模型GPT-35 引數大小為 1750 億,預計占用記憶體超過 330GB。
這個問題的答案是知識蒸餾,其中知識蒸餾的模型技術通過平面故事板技術以拓撲圖的形式視覺化。
可以看出,知識蒸餾就是利用大模型的監督資訊來訓練乙個輕量級的小模型,使模型在小引數尺度下獲得更好的效能和精度。 其中,成熟的模型是“老師”,PC中部署的本地模型是“學生”。
這樣一來,大模型的引數大小可以從1750億壓縮到70億,個人大模型只需要占用硬碟4到5GB的空間。
現在 PC 中的大模型已經準備好了,下一步是如何讓它更加使用者友好,並為每個人量身定製最強大的生產力工具。
*使用立體故事板演示如何通過向量化技術構建本地知識庫,當使用者授權插入時,個人文件、ppt、pdf、日程表等與個人習慣相關的資訊將儲存在當地知識庫中。
這些知識被向量化為一種形式,可以由人工智慧計算,然後儲存。 當使用者提出需求時,個人模型也會對相應的需求進行向量化,並查詢匹配本地知識庫中最相似的片段。 個人模型提取出相關文字塊後,會根據使用者的提示詞輸出答案,結合大模型的生成和理解能力。
除了智慧型算力的部署和個人大模型的本地知識庫外,聯想集團自主研發的AI作業系統是整機的生態入口,可以呼叫本地文件,調節上百個隱藏系統和硬體設定,完成使用者更加個性化的需求。
聯想集團打破了該領域AI知識只由模型主導的格局,讓AI在PC領域從“通用”回歸“個體”,真正實現“千人千面”。
例如,當使用者與 AI 作業系統互動時,“如果我覺得計算機不夠流暢,無法玩遊戲,我該怎麼辦? AI OS會識別出這個需求中涉及的關鍵詞,然後了解使用者想要適配遊戲場景的相關設定,並彈出“開啟野獸模式”的設定選項。
隨著使用者在PC上觸發的互動次數越來越多,AI OS對個體有了更深入的了解,可以解決使用者日常生活和工作中的諸多痛點,比如生成會議紀要、檢索過去的PPT,從而服務於個人,為使用者帶來定製化的高效體驗。
值得注意的是,大模型的每一次響應和學習都會占用大量的系統功耗,這需要AI PC智慧型排程和分配系統功耗,讓使用者體驗更好。
針對這些問題,聯想集團自主研發的AI晶元TAC(Trusted AI Controller)是關鍵,展現了TAC通過華麗流暢的三維動畫輔助排程算力分配、釋放高效能的實力。
TAC與PC上的所有硬體連線,並將該硬體的狀態傳輸到AI OS。 如**所示,這些狀態將被 AI OS 理解,並被識別為會議、遊戲、學習等特定使用場景。
基於不同的場景和任務識別,TAC將精準轉移能耗壓力,確保CPU、GPU、NPU等計算晶元的合理執行,保障AI PC的可持續高效執行。
該晶元不僅將支援效率和功耗的最大化,而且將成為保護使用者個人資料的有力衛士。
TAC會通過金鑰對使用者的個人檔案、使用習慣等資訊進行加密,並將金鑰封印在晶元的ROM中進行獨立供電,有效防止資料洩露和惡意攻擊。
最後,聯想AI PC巧妙地結合軟硬體和生態,提供首次在個人終端上實現的落地方案,層層黑科技讓我們看到,個人AI雙胞胎(Personal AI Twin)即將成為現實。
AI PC 正在蓬勃發展,即將登陸。 人工智慧將不再是使用者的話題,而是一種可以使用的工具。
正如聯想集團科普**中提到的,PC在39年前踏上歷史舞台後,幾乎承載了數字世界的每一次技術變革,而39年後的今天,AI PC或許也即將成為人類與數字世界互動的最佳解決方案之一。
這一次的AI PC既是突破,也是回歸。 面對生產力工具發生重大變革的時刻,聯想集團作為PC行業的領導者,將人工智慧的顛覆性力量帶到了每乙個使用者的終端,讓每個人都能用AI PC實現AI的包容。