多模態大型模型落地機械人行業 國內多家企業實現技術突破

Mondo 科技 更新 2024-01-31

近期,國內多家企業在“大模型+機械人”方面實現了技術突破。

業內人士認為,隨著技術的不斷進步和應用場景的拓展,對多模態大模型和機械人的需求將不斷增加,為企業提供廣闊的市場空間。 此外,與其他行業的合作也將為多模態大模型和機械人的發展帶來新的機遇,如與醫療、製造等行業的合作,可以實現更廣泛的應用場景和商業價值。

多模態機械人實現技術突破。

截至12月13日**,布科股份、埃福特、綠諧波等多隻機械人概念股漲超4%。 新聞方面,特斯拉發布了擎天柱第二代(擎天柱)人形機械人**,搭載了特斯拉設計的執行器和感測器,行走速度提公升30%,改善平衡和全身控制。

“多模態”AI是指可以處理文字、音訊、影象等多種形式內容的大型模型。 隨著多模態大模型的快速迭代,國際廠商不斷關注其在機械人領域的應用,紛紛探索機械人規劃、控制、導航等主要任務。

智山投資總經理何立告訴記者:“多模態大模型融合了視覺、語音和感測器資料處理技術,極大地豐富了機械人的認知和決策水平。 該技術在機械人上的應用有望在複雜互動、自然語言理解和環境適應領域取得重大進展,並激發它們作為高度自主助手或勞動者的無限可能性。 ”

國內已經有企業在這一領域處於領先地位。 12月12日晚,歐比中光發布大型模型機械臂10 產品,可以使用語音提示作為輸入,利用多種大模型的理解能力和視覺感知能力生成空間語義資訊,使機械臂能夠理解並執行動作。 在其同步披露中,機械臂成功完成了一系列語音命令,包括“將綠色方塊放入黃色方框”和“請恢復原始狀態”。

歐比中光聯合創始人兼CTO肖振忠告訴記者:“公司希望通過工程研究,讓大模型機械臂落地到實際場景中,包括提高機械臂自動繞過複雜障礙物完成第一類指令的能力,解決大模型+機械臂的泛化問題, 並最終實現通用場景落地。 ”

據不完全統計,迅雷達、億嘉禾等上市公司近期披露了基於多模態大模型的機械人研發進展。

大規模商業採用仍需要時間。

我國機械人產業具有一定的產業基礎。 具有聰明頭腦和更靈活肢體的模態機械人正在成為多方競爭未來行業的新賽道。

何力認為,在國內市場,公司積極投入關鍵技術環節的研發和生產,特別是在感測器、精密機械部件、執行器、創新材料和輕量化結構件等領域,呈現出蓬勃的發展勢頭。

諧波減速器是工業機械人的核心部件。 綠諧披露已完成工業機械人諧波減速器技術研發並較早實現規模化生產,在該領域率先替代進口產品,大大降低了國內機械人企業的採購成本和採購週期。 其推出的新一代Y系列諧波減速機,通過數學模型創新、軸承設計和加工工藝優化,使其剛度指數較現有其他產品翻了一番。

不過,有業內人士認為,“多模態+機械人”仍處於發展階段,實現商業化仍面臨諸多挑戰。

首先,技術成熟度低,存在技術瓶頸。 例如,模型的可解釋性、穩定性和安全性需要進一步提高其次,大型模型和機械人的研發和生產成本較高,維護和運營成本相對較高,需要大量的人力和物力。 郭濤說。

肖振中對此表示贊同,他告訴記者:“大語言模型(LLM)結合視覺感知,將讓各類機械人和機械臂落地在更多場景中,如工業製造、柔性物流、商業服務等。 目前,大模型與實際資料的結合還存在一定的差距,大模型消耗的算力也很大,應用逐步落地需要三到五年的時間,業務成熟可能需要更長的時間。 ”

但公司堅信,這是正確的方向,前途一片光明。 肖振中表示,歐比中光正在打造機械人和AI視覺平台,通過研發多模態視覺模型和智慧型演算法,結合機械人視覺感測器,形成自主移動定位、導航、避障的完整產品解決方案,積極迎接智慧型機械人時代的到來。

相關問題答案

    多模態大型模型落地機械人行業 國內多家企業實現技術突破

    近期,國內多家企業在 大模型 機械人 方面實現了技術突破。截至月日 布科股份 埃夫特 綠諧波等多隻機械人概念股漲超 業內人士認為,隨著技術的不斷進步和應用場景的拓展,對多模態大模型和機械人的需求將不斷增加,為企業提供了廣闊的市場空間。此外,與醫療 製造等行業的合作也將為多模態大模型和機械人的發展帶來...

    人形機械人 當大型模型落地時,它從機械人拿起一杯咖啡開始

    近日,來自清華大學 復旦大學等國內頂尖高校的餘支隊伍在上海進行了一場機械人大賽,最終來自復旦大學 國防科技大學 中科院軟體研究所的支隊伍脫穎而出。比賽的主題和內容設計非常有趣,一般都是一般性的比賽,需要這些團隊在咖啡館場景中競爭,參賽者不僅要 教 服務機械人如何扮演咖啡館服務員的角色,還要應對顧客和...

    深化AIGC大模型多模態應用,AI Agent加速應用普及

    報告製作人 招商局 跟蹤當前AIGC行業的發展,大模型的多模態發展進一步深化,尤其是文盛 能力的快速提公升,將大大降低創作門檻,開拓C端創作的商業空間,以及遊戲 影視製作等B端應用空間。在應用端,隨著大模型能力的提公升和大模型開發工具門檻的降低,AI智慧型體的構建能力有望快速下沉,這將推動AI應用的...

    谷歌發布了 Gemini,一款效能優於 GPT 4 的多模態大模型!

    近日,谷歌CEO桑達爾?Pichai 和 DeepMind 首席執行官 Damith Hassabis 在谷歌官網上的一篇文章中宣布,谷歌最新的多模態大型模型 gemini版本 正式上線。該模型被稱為 Gemini,不僅優於 OpenAIGPT 模型,而且還是最強大 用途最廣泛的模型之一。Gemin...

    谷歌發布了 Gemini,乙個效能比 GPT 4 更好的多模態大模型?

    Gemini 是 AI 領域的革命性突破,Google 發布了 Gemini 版本 有望在效能上超越 OpenAI 的 GPT 模型,成為目前功能最強大 用途最廣泛的模型。Gemini 的獨特之處在於它是乙個多模態模型,能夠同時理解和操作不同型別的資訊,例如文字 影象 音訊和 Gemini 使用原生...