曾經在電影中看到的機械人,如今正乘著大模特的東風,離我們越來越近。
特斯拉最近展示了最新版本的擎天柱機械人擎天柱II。 在最新發布的**中,第二代人形機械人似乎比上一代更具靈活性,包括更優雅的行走姿勢和更自由的雙手,甚至可以用來完成煮雞蛋等精細任務。
除了特斯拉之外,許多技術製造商都試圖將大影象語言模型的能力和知識遷移到機械人領域,例如Microsoft的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,以及Voxposer和Bobocat。
那麼,這是否意味著人形機械人真的會進入我們的生活呢?
人形機械人很漂亮,但離商業化還很遠
在擎天柱第二代機械人發布後,特斯拉表示,第二代擎天柱機械人在保留原有功能的同時,重量減輕了10公斤,機械人具有更好的平衡性,例如能夠自由下蹲和站立,行走時的速度提高了30%。
擎天柱最大的公升級是雙手,它有11個自由度,可以更細膩地移動物體,比如**顯示,機械人可以拿起雞蛋輕輕放下,這要歸功於感測技術的改進。 全新擎天柱的發布標誌著特斯拉更接近於創造乙個“通用的、雙足的、自主的人形機械人”。 特斯拉的目標是能夠為人形機械人執行危險、重複和乏味的任務。
馬斯克早在2024年就表示,“未來,每個人都會擁有人形機械人,這個市場將是數百億美元。 ”
但實現這一目標可能需要很多年。 特斯拉預計Optimus機械人的商業版本將在未來三到五年內上市,但早期版本可能會首先在生產線上進行測試。
我們需要了解的是,人形機械人具有複雜的軟硬體結構,是智慧型機械人領域技術難度極高的乙個分支。 其中,軟硬體系統的結合和通訊的實時可靠性是保證人形機械人魯棒運動的基礎。 此外,動態穩定的運動控制也是人形機械人面臨的一大挑戰。
除了技術難度,成本一直是人形機械人難以商業化的重要原因之一。 例如,雖然Potuton Power的Atlas機械人已經可以規劃自己的路徑,並實現後空翻和跑酷等高難度動作,但它是以大量強大的液壓驅動器為代價的,因此製造成本仍然很高,估計為200萬美元。
然而,儘管面臨巨大挑戰,我們仍然很高興看到機械人行業的發展,隨著ChatGPT的爆發,科技巨頭們不斷加強其生成式AI產品,這可能會將機械人行業帶到乙個新的水平。
被大型模型點燃的具身智慧型
長期以來,人類對人工智慧技術和應用的探索從未停止,今年,以ChatGPT為代表的生成式AI風靡全球,深刻影響了內容創作行業,帶來了效率的大幅提公升。
但人工智慧的應用遠不止於此,雖然生成式AI讓類人大腦變得越來越智慧型,但它始終是抽象的,如果具體化,比如增加乙個機械人身體,它能不能成為乙個具身的智慧型機械人。
具身人工智慧也被認為是人工智慧的終極形式。 他們用自己的身體來感知,通過與環境的互動,他們獲取資訊、理解問題、做出決定並採取行動。 一般來說,可以理解為AI模型被機械人的外殼覆蓋,機械人生長AI模型的大腦。
圖靈獎得主、上海智慧研究院院長姚志志認為,人工智慧領域的下乙個挑戰將是實現“具身通用人工智慧”,即如何打造能夠通過自我習掌握各種技能的高階機械人,並在現實生活中執行各種通用任務。 清華大學電腦科學系教授張波院士也在一次工業智慧型論壇上提出,隨著基礎模型的突破,通用智慧型機械人是未來的發展方向。
英偉達創始人黃仁勳在ITF World 2023半導體大會上表示,具身智慧型是一種能夠理解、推理、與物理世界互動的智慧型系統,是人工智慧的下一波浪潮。
在Microsoft研究院發布的《ChatGPT for Robotics》一文中,研究人員利用ChatGPT大語言模型(LLMs)將人類語言快速轉化為機械人的高階控制**,從而控制機械臂、無人機等機械人,ChatGPT帶來了機械人應用的新正規化。
目前,已經可以在ChatGPT的對話方塊中輸入命令,控制機械人在房間裡找到“健康飲料”、“含糖和危險訊號的東西”,以及無人機的鏡子**。
谷歌和德國柏林工業大學的一組人工智慧研究人員宣布了視覺語言模型PALM-E,該模型整合了5400億個引數的PALM模型和220億個引數的視覺VIT模型,總參數量為5620億,是目前已知最大的視覺語言模型。
該模型在多工處理中表現出強烈的感知能力,機械人可以在被問到時從抽屜裡拿出東西,然後走到人身邊遞給人,研究人員要求機械人推動“旁邊的綠色補丁”,即使機械人以前沒有見過裝飾品。
對於國內外科技公司不斷布局機械人產業,但更多的是行業巨頭,對於這樣的表現,一位分析師朋友告訴元宇宙新聲音:“科技巨頭有資金、有實力、有技術,雖然細分**鏈市場不一定由巨頭主導,但整體來看, 人形機械人市場可能成為科技巨頭的遊戲。 ”
雖然巨頭們已經開始布局具身智慧型,但元宇宙的新聲音認為,LLM方興未艾,僅從一般智慧型理論上可行,如何實現還有很長的路要走。 從這個角度來看,被大模型火起來的具身智慧型,目前還處於語言和視覺兩大經典AI任務的階段,未來還有很大的拓展空間。
促進國內機械人產業發展的政策
機械人一直被譽為“製造業皇冠頂端的明珠”,是衡量乙個國家科技創新和高階製造水平的重要標誌,隨著人工智慧的發展,我國也在政策、市場等方向推動機械人產業公升級。
11月初,工信部印發《關於人形機械人創新發展的指導意見》,提出到2024年,人形機械人創新體系初步建立,突破“腦、腦、四肢”等多項關鍵技術,確保核心零部件安全有效供應。 整機產品達到國際先進水平,並已實現量產,並在特種、製造、民生服務等場景得到示範應用。
從地方**來看,北京已經開始建立產業集群。 11月2日,北京率先成立國內首個省級人形機械人創新中心。 該中心由機械人整機、核心部件、大模型等企業共同組建,開展通用人形機械人本體原型、人形機械人通用大模型、執行控制系統、工具鏈、開源作業系統、開發者社群等五大重點任務。
除了北京,上海、深圳等地也發布了類似的行動計畫,都包括開發人形機械人。 例如,深圳提出開展通用具身智慧型機械人的研發和應用,加快建立人形機械人製造創新中心上海提出建設國際化演算法創新基地,加快人形機械人創新發展。
在政策的推動下,國內各大廠商也在不斷努力創新產品和技術。 早在 2022 年 8 月,小公尺甚至率先在特斯拉推出了其首款全尺寸人形仿生機械人 CyberOne。 目前,CyberOne除了出現在科技主題的展會上外,還在電影拍攝、特效製作、場景修復等方面發揮著重要作用。 據了解,小公尺集團已經與《流浪地球3》達成戰略合作,或許CyberOne將出現在這部電影的第一面鏡子中。
科大訊飛是繼小公尺之後又一家自主研發的人形機械人製造商,在10月24日的科大訊飛開發者節上,公司董事長劉慶峰正式向公眾推出了人形機械人產品。 據介紹,該機械人是與宇樹科技聯合研發的,科大訊飛將以人形機械人為牽引力,推動“視覺-語言-行動”多模態具身智慧型模型。
與科大訊飛同日,首亮一流機械人產品,以及造車新勢力小鵬汽車。 何小鵬在“1024科技日”上介紹,過去五年,小鵬主要探索四足“機器馬”,而這一次只用了5個月就完成了雙足人形機械人PX5的穩定行走。 PX5 目前只有 1 個5公尺高,小鵬希望未來能做出更高的機械人,並將XNGP、XEEA電子電氣架構、XGPT靈犀大模型、XNET20 智慧型駕駛系統等與智慧型汽車同源的技術,快速植入機械人系統。
對於我國而言,機械人產業作為蓬勃發展的新興生產力,核心技術創新、人工智慧、高階製造等加速發展,同時也推動“機械人+”場景不斷深化,面向未來,機械人產業的創新發展,將加快建設製造強國、數字中國,為推進中國式現代化提供更加有力的支撐。
寫在最後
我們看到,2023 年是世界上第乙個人形機械人誕生 50 周年,在此期間,不斷有探路者失敗或掙扎著在這個行業中找到自己的案例。 元宇宙新聲音認為,今年出現的新一輪人形機械人研發熱潮,有望在政策支援和市場推動下實現技術突破和規模效應,為未來人形機械人的商業化奠定基礎。
可想而知,人與機械人的融合將是乙個具有歷史意義的過程,對整個社會產生深遠的影響。 在這個過程中,我們不僅要考慮技術的發展,還要對機械人與人類之間的倫理道德問題進行深入研究,並在兩者之間找到平衡點,從而確保機械人融入人的過程符合社會發展的需要,創造乙個更加和諧、 穩定和美好的未來。