多模態(tài)大模型落地機(jī)器人行業(yè) 國內(nèi)多家企業(yè)實(shí)現(xiàn)技術(shù)突破

2023-12-14 17:49:28 作者:王鏡茹

多模態(tài)AI崛起,2022年人工智能5大發(fā)展趨勢_手機(jī)搜狐網(wǎng)

近期,國內(nèi)多家企業(yè)在“大模型+機(jī)器人”方面實(shí)現(xiàn)技術(shù)突破。截至12月13日收盤,步科股份、埃夫特、綠的諧波等多只機(jī)器人概念股漲幅超4%。

業(yè)內(nèi)認(rèn)為,隨著技術(shù)不斷進(jìn)步和應(yīng)用場景的擴(kuò)大,多模態(tài)大模型與機(jī)器人的需求將不斷增加,這為企業(yè)提供了廣闊的市場空間。此外,與醫(yī)療、制造等行業(yè)的合作也將為多模態(tài)大模型與機(jī)器人的發(fā)展帶來新機(jī)遇,實(shí)現(xiàn)更廣泛的應(yīng)用場景和商業(yè)價值。

“多模態(tài)”AI是指能處理文本、音頻、圖像、視頻和代碼等多種形式內(nèi)容的大模型。隨著多模態(tài)大模型快速迭代,相關(guān)公司不斷關(guān)注其在機(jī)器人領(lǐng)域的應(yīng)用,并在機(jī)器人規(guī)劃、控制、導(dǎo)航等主要任務(wù)上進(jìn)行了探索。

止于至善投資總經(jīng)理何理表示:“多模態(tài)大模型融合視覺、語音和傳感器數(shù)據(jù)處理技術(shù),極大豐富了機(jī)器人認(rèn)知和決策層面。該技術(shù)在機(jī)器人中的應(yīng)用,有望使機(jī)器人在復(fù)雜交互、自然語言理解和環(huán)境適應(yīng)等領(lǐng)域取得重大進(jìn)步,激發(fā)其作為高度自主助手或勞動力的無限可能性?!?/p>

國內(nèi)已有企業(yè)在此領(lǐng)域搶先布局。12月12日晚間,奧比中光發(fā)布大模型機(jī)械臂1.0產(chǎn)品,該產(chǎn)品可通過語音Prompts作為輸入,利用多種大模型的理解能力和視覺感知能力,生成空間語義信息,讓機(jī)械臂理解、執(zhí)行動作。在其同步披露的視頻中,機(jī)械臂成功完成了一系列語音口令,包括“把綠色方塊放到黃色框中”“請恢復(fù)最開始的狀態(tài)”等。

奧比中光聯(lián)合創(chuàng)始人、CTO肖振中表示:“公司希望通過工程化研究,使大模型機(jī)械臂在實(shí)際場景中落地,包括提升機(jī)械臂自動繞開復(fù)雜障礙物來完成人類指令的能力,解決大模型+機(jī)械臂的泛化性問題,最終實(shí)現(xiàn)通用場景落地?!?/p>

與此同時,中科創(chuàng)達(dá)、億嘉和等上市公司也于近期相繼披露了基于多模態(tài)大模型的機(jī)器人研發(fā)進(jìn)展情況。

何理認(rèn)為,在國內(nèi)市場,企業(yè)已積極投入關(guān)鍵技術(shù)環(huán)節(jié)的研發(fā)和生產(chǎn),尤其是在傳感器、精密機(jī)械部件、執(zhí)行器以及創(chuàng)新材料和輕量化結(jié)構(gòu)件領(lǐng)域,展示了蓬勃發(fā)展勢頭。

諧波減速器是工業(yè)機(jī)器人的核心零部件。據(jù)綠的諧波披露,公司已較早完成工業(yè)機(jī)器人諧波減速器技術(shù)研發(fā)并實(shí)現(xiàn)規(guī)?;a(chǎn),在該領(lǐng)域率先實(shí)現(xiàn)了對進(jìn)口產(chǎn)品的替代,極大降低了國產(chǎn)機(jī)器人企業(yè)的采購成本及采購周期。其推出的新一代Y系列諧波減速器,通過數(shù)理模型創(chuàng)新,軸承設(shè)計(jì)及加工工藝優(yōu)化,剛度指標(biāo)較現(xiàn)有其他產(chǎn)品提升了一倍。

不過,部分業(yè)內(nèi)人士認(rèn)為,“多模態(tài)+機(jī)器人”還處于發(fā)展階段,實(shí)現(xiàn)商業(yè)化落地仍面臨不少挑戰(zhàn)。

“首先,技術(shù)成熟度較低,存在技術(shù)瓶頸,例如模型的可解釋性、穩(wěn)定性、安全性等方面還需進(jìn)一步提升;其次,大模型和機(jī)器人的研發(fā)和生產(chǎn)成本較高,維護(hù)和運(yùn)營成本也相對較高,需投入大量人力、物力資源。”郭濤說。

肖振中對此表示認(rèn)同,他表示:“大語言模型(Large Language Model,LLM)結(jié)合視覺傳感,會讓各類機(jī)器人、機(jī)械臂落地到更多場景中,如工業(yè)制造、柔性物流、商用服務(wù)等。目但前大模型跟實(shí)際數(shù)據(jù)的結(jié)合還存在一定差距,大模型運(yùn)行消耗的算力也偏大,需要三年至五年的時間逐步落地,而業(yè)務(wù)成熟可能需要更久。”

“但公司堅(jiān)信這是正確的方向,前景廣闊?!毙ふ裰斜硎?,奧比中光正搭建機(jī)器人及AI視覺中臺,通過多模態(tài)視覺大模型及智能算法研發(fā),結(jié)合機(jī)器人視覺傳感器,形成自主移動定位導(dǎo)航和避障的完整產(chǎn)品方案,積極迎接智能機(jī)器人時代。

(來源:證券日報(bào))

責(zé)任編輯:查雪霏

掃一掃分享本頁