中美機器人混戰:王興興硬剛馬斯克?
馬斯克的機器人狂想曲:超級大餅與艱辛旅程。
采寫(xiě)/林嵐
編輯/萬(wàn)天南
馬斯克最近身價(jià)縮水嚴重。
特斯拉股價(jià)自2月下旬一路下探后,又于3月10日暴跌超15%,較去年12月的歷史高點(diǎn),已經(jīng)腰斬。
直到3月11日,“盟友”特朗普特意購入一輛全新的Model S汽車(chē),“總統效應”才讓特斯拉股價(jià)小有回升。
股價(jià)大跌的背后,有資本市場(chǎng)對特斯拉銷(xiāo)量拉胯的不滿(mǎn)、對馬斯克涉政太深的擔憂(yōu),還有對其人形機器人Optimus前景的質(zhì)疑——畢竟,號稱(chēng)將帶來(lái)10萬(wàn)億美元收入、成為特斯拉業(yè)務(wù)新支柱的Optimus,目前的優(yōu)化進(jìn)度遜于預期,而承諾的量產(chǎn)時(shí)間表也一再推遲。
人形機器人這個(gè)超級大餅,能充特斯拉的“饑荒”么?
一、鋼鐵俠的“造人”熱情
是誰(shuí)掀起了2023年以來(lái)的全球人形機器人熱潮?根據鈦媒體對該領(lǐng)域多位創(chuàng )業(yè)者的采訪(fǎng),業(yè)內異口同聲:馬斯克。
宇樹(shù)科技創(chuàng )始人王興興就曾表示:“馬斯克之前在汽車(chē)、火箭領(lǐng)域都搞的效果還不錯,把產(chǎn)業(yè)帶得很大。這次,馬斯克涉足人形機器人領(lǐng)域后,政府、各類(lèi)機構也希望早點(diǎn)開(kāi)始做,而不是等馬斯克搞出來(lái)以后,大家再去追?!?/p>
鋼鐵俠為何把“造人”的興趣從生活延伸到了事業(yè)?
背后有著(zhù)突破汽車(chē)制造“瓶頸”的戰略考量。雖然借力上海超級工廠(chǎng),特斯拉已跨越“產(chǎn)能地獄”,但汽車(chē)既有制造模式的效率天花板已近。
汽車(chē)工業(yè)早在20世紀60年代就已引入了機械臂,實(shí)現了焊接、噴漆等環(huán)節的自動(dòng)化,但目前總裝環(huán)節,至今仍嚴重依賴(lài)人工——工人需要小范圍頻繁走動(dòng),完成線(xiàn)束連接、零部件組裝、內飾安裝等需要靈活操作的任務(wù)。因此,要突破當前的效率瓶頸,就要研發(fā)出一種既具備人類(lèi)運動(dòng)靈活性,又能完成精細操作的智能工具。
按馬斯克的構想,這款工具必須是各方面與人近似的雙足智能機器人。它能像人一樣,通過(guò)視覺(jué)等感知進(jìn)行自主學(xué)習和決策,并用靈活的手部完成各種工作,而非像波士頓動(dòng)力或者傳統機械臂公司的產(chǎn)品那樣,需要被預先輸入工作指令以執行特定工作。想象一下,當特斯拉工廠(chǎng)的總裝線(xiàn)由人形機器人“接手”,汽車(chē)制造將不再受到人類(lèi)工人的諸多限制,如工作時(shí)長(cháng)、不良情緒等,從而能夠進(jìn)行全天候不間斷的高質(zhì)量生產(chǎn)。
馬斯克的理想可能不止于此。因具有通用智能,且外形適配于人類(lèi)建造的各種工具、設施及場(chǎng)景,這樣的機器人也能大范圍用于其他工業(yè)、服務(wù)業(yè)或家庭場(chǎng)景——所以確切來(lái)說(shuō),應該稱(chēng)之為通用智能人形機器人。這類(lèi)機器人因用途廣泛而有望被大量銷(xiāo)售,鑄造特斯拉的收入新支柱。
2021年8月,馬斯克在A(yíng)I Day上首次提出“Tesla Bot”概念。2022年4月,首次展示原型機實(shí)體。
2022年9月,特斯拉人形機器人——Optimus Gen1正式發(fā)布,能緩慢行走和揮手。2023年5月,可以穩定行走并抓取物件;9月,可以對彩色塊進(jìn)行分類(lèi)、保持瑜伽姿勢。
2023年12月,Optimus Gen2發(fā)布,相比Gen1,步行速度提升30%,頸部增加2個(gè)自由度,重量減輕,能夠在非平坦地面行走。2024年1月,展示了洗衣服、疊衣服的家務(wù)能力; 5月,能執行基本工廠(chǎng)任務(wù),如分揀電池等;10月,能端送包裹、給植物澆水、自行充電、上樓梯、負重11kg等。11月,靈巧手的單手自由度由第二代的11個(gè)提升至22個(gè),可以用手攔截飛來(lái)的網(wǎng)球。12月,在室外測試中能夠自主穿越各種地形。
2025年1月,馬斯克宣布Optimus將在年內量產(chǎn)數千臺,且“理想情況下每年增加一個(gè)數量級”。
目前來(lái)看,Optimus仍是全世界最先進(jìn)的人形機器人之一。那么在這個(gè)遠離汽車(chē)主業(yè)的領(lǐng)域,特斯拉為什么能再次引領(lǐng)行業(yè)呢?
實(shí)際上,人形機器人與自動(dòng)駕駛汽車(chē)的本質(zhì)相近,同屬具身智能硬件,因此Optimus可在多個(gè)方面復用特斯拉汽車(chē)的技術(shù)及工程能力。
在技術(shù)能力層面,Optimus能復用的部分包括FSD(FullSelf-Driving,即完全自動(dòng)駕駛)芯片、Autopilot系統的視覺(jué)算法、數據及自動(dòng)標注工具、仿真模擬環(huán)境、云端算力設施等,而目前特斯拉的FSD和視覺(jué)算法在業(yè)內尚屬一流。同時(shí),特斯拉憑借自動(dòng)駕駛汽車(chē)的廣泛銷(xiāo)售,成功收集了海量的道路與駕駛數據。這些機器人業(yè)內稀缺的物理世界交互數據,構建了強大的數據流轉、自動(dòng)標注和快速部署的數據中臺,并為Optimus構筑起深度可觀(guān)的護城河。
在工程能力層面,人形機器人和自動(dòng)駕駛汽車(chē)在底層工程及制造供應鏈等方面有諸多相通之處。比如機器人的電機、傳感器、動(dòng)力電池等關(guān)鍵零部件能夠快速復用自動(dòng)駕駛汽車(chē)的供應鏈,且后續還可借助特斯拉多年搭建的軟件基礎設施進(jìn)行持續優(yōu)化。同時(shí),特斯拉的自有汽車(chē)工廠(chǎng)也為Optimus提供了現成的實(shí)地訓練場(chǎng)地。
以上種種,使Optimus具備許多“先天優(yōu)勢”。
二、量產(chǎn)前夜的重重難關(guān)
不過(guò),人形機器人與自動(dòng)駕駛汽車(chē)依然存在著(zhù)巨大差異。
比如,汽車(chē)需嚴格限制物理接觸(碰撞即事故),而機器人需通過(guò)主動(dòng)接觸(如抓取、焊接等)完成任務(wù),本質(zhì)是"非接觸避障"與"精準接觸操控"的技術(shù)分野。又如,汽車(chē)通常在二維平面內通過(guò)轉向與加速實(shí)現運動(dòng)控制,而機器人的活動(dòng)多涉及三維空間,對空間建模復雜度的要求呈指數級上升。再如,汽車(chē)通常只需兩個(gè)自由度,而Optimus僅手部已做到二十二個(gè)自由度,控制難度與自動(dòng)駕駛不在一個(gè)量級。
此外,自動(dòng)駕駛汽車(chē)在高速動(dòng)態(tài)場(chǎng)景中的容錯率趨近于零,需實(shí)現赫茲級的實(shí)時(shí)控制;而人形機器人當前主要部署在受控環(huán)境(如工廠(chǎng)、家庭),允許秒級推理延遲,并可依賴(lài)停機保護機制降低風(fēng)險,這為存在A(yíng)I幻覺(jué)的多模態(tài)大模型提供了試錯空間。
以上差異,使得特斯拉在Optimus的推進(jìn)過(guò)程中依然面臨著(zhù)模型適配、數據采集、硬件控制等多重挑戰。
從模型看,對自動(dòng)駕駛汽車(chē)的主要模擬是在已知規劃的道路上運動(dòng),而對人類(lèi)日常行為的模擬則復雜得多。研究表明,人類(lèi)個(gè)體平均每天會(huì )與600個(gè)左右不同的物體產(chǎn)生接觸互動(dòng)。若考慮物體的材質(zhì)、形狀、大小、位置以及人類(lèi)接觸時(shí)的不同動(dòng)作、力度、順序等因素,模型需要處理高達3500萬(wàn)種場(chǎng)景。
遺憾的是,當前放眼全球,無(wú)論是實(shí)力雄厚的大型企業(yè),還是專(zhuān)注前沿的科研機構,均無(wú)法拿出可覆蓋如此海量場(chǎng)景的人工智能模型。因此,即便已是自動(dòng)駕駛的模型強者,特斯拉也需要重新出發(fā)。
數據方面的挑戰也不小。小鵬汽車(chē)董事長(cháng)何小鵬曾指出,人形機器人的數據需求是汽車(chē)產(chǎn)業(yè)的10倍以上。同時(shí),相比可借助海量互聯(lián)網(wǎng)數據訓練的大語(yǔ)言模型(LLM),機器人模型訓練需依賴(lài)物理世界里的交互數據,需投入大量人力、物力與時(shí)間。
比如,若考慮在不同氣候、地形與社會(huì )狀況的場(chǎng)景中都布置傳感器及監測設備,得逐一采買(mǎi)、安裝、維護與更新,費用驚人;而負樣本數據同樣稀缺,因為要求機器人反復嘗試并承受失敗,既耗時(shí)又會(huì )造成設備損耗。又如,不同傳感器在采樣頻率、響應時(shí)間和精度上存在差異,致使時(shí)空對齊困難。此外,還存在隱私和安全等合規難題。根據北京國家地方共建具身智能機器人創(chuàng )新中心(后稱(chēng)“國地中心“)的一位數據負責人估算,要實(shí)現Optimus在特斯拉工廠(chǎng)的順利上崗,大概需耗費5億美元的數據采集成本。
雖說(shuō)使用3D仿真平臺也能生成一定的訓練數據,但“模擬-現實(shí)鴻溝”顯著(zhù)存在,這些數據訓練出的模型在真實(shí)世界中表現欠佳。據悉Optimus的“疊衣服”訓練就主要依賴(lài)于模擬數據,因此效果不佳——馬斯克曾親自澄清稱(chēng),展示視頻中的疊衣服操作并非由Optimus獨立完成。
硬件則是另一道檻。以靈巧手為例,盡管Optimus的最新版靈巧手已是業(yè)內頂尖水平,但相比人手還有較大差距。人手約有1.7萬(wàn)個(gè)的觸覺(jué)傳感器,而Optimus手部的傳感器還遠遠達不到這個(gè)量級。再看腿,人類(lèi)的腿僅憑四根骨頭和兩個(gè)膝關(guān)節,就能完成走路、跳、下蹲等動(dòng)作,而Optimus目前還無(wú)法下蹲。若為提高性能而在機器人的各部位堆疊更多傳感器、電機等硬件,不僅將大大提高成本,還會(huì )帶來(lái)空間占用、平衡性和靈活度等問(wèn)題。
三、中美機器人的"諸神之戰"
在自身能力等待突圍的同時(shí),Optimus也面臨著(zhù)愈發(fā)激烈的同行競爭。
僅在美國就已硝煙四起。亞馬遜投資的Digit已可在倉庫連續工作7.5小時(shí),實(shí)現100%的任務(wù)執行自主性,并達成97%的任務(wù)成功率。谷歌和斯坦福大學(xué)聯(lián)手推出的Mobile ALOHA2精通備菜翻炒、洗衣澆花等家務(wù),而成本僅需2.7萬(wàn)美元左右,目前遠低于Optimus。OpenAI與1X聯(lián)手打造的EVE可以完成自主居家、辦公幫手等任務(wù)……
英偉達則另辟蹊徑,依托自身的算力優(yōu)勢,做起了“賣(mài)鏟人“。2024年3月,英偉達推出了通用機器人模型Project GR00T,并提供Isaac平臺,計劃通過(guò)打造平臺和產(chǎn)業(yè)聯(lián)盟的方式推進(jìn)相關(guān)工作。
更可怕的對手也許來(lái)自中國。2024年,中國的人形機器人新產(chǎn)品頻出,令業(yè)界矚目。5月,宇樹(shù)推出搭載AI技術(shù)的新款人形機器人G1,9.9萬(wàn)人民幣的售價(jià)震撼全球。9月,傅利葉推出新一代通用人形機器人GR-2,搭載全新FSA2.0執行器及全自研12自由度靈巧手。10月,優(yōu)必選發(fā)布新一代工業(yè)人形機器人Walker S1,并已進(jìn)入比亞迪、吉利、富士康等多個(gè)企業(yè)進(jìn)行實(shí)訓。11月,小鵬推出了最新款機器人Iron,搭載小鵬天璣AIOS系統及自研AI芯片,且已在自家車(chē)廠(chǎng)生產(chǎn)實(shí)訓。
除了垂類(lèi)企業(yè),中國的科技大廠(chǎng)們在2024年也躍躍欲試。
華為正式運營(yíng)全球具身智能產(chǎn)業(yè)創(chuàng )新中心,提供一站式產(chǎn)品技術(shù)交易服務(wù),并與樂(lè )聚、兆威機電、拓斯達、埃夫特等16家企業(yè)簽訂合作備忘錄,涵蓋了人形機器人產(chǎn)業(yè)上下游。
字節跳動(dòng)發(fā)布了GR-2具身大模型,而基于豆包大模型的AI問(wèn)診機器人也正式落地北大醫院。
阿里首投人形機器人企業(yè)逐際動(dòng)力,計劃在該領(lǐng)域以“自研+投資”的方式向前推進(jìn)。
騰訊發(fā)布首個(gè)人形機器人“小五”,聚焦康養賽道,同時(shí)繼續投資多家機器人企業(yè)。小米的自研機器人CyberOne也開(kāi)始在自家生產(chǎn)線(xiàn)上分階段落地。
根據《中國人形機器人創(chuàng )新發(fā)展報告2025》,2024年中國人形機器整機企業(yè)達79家,市場(chǎng)規模約27.6億元人民幣;預計到2025年,市場(chǎng)規模將達到166.3億元,到2030年將增長(cháng)至861.0億元。
圖片:宇樹(shù)機器人在春晚表演
人形機器人百花齊放的背后,是中國正在以舉國之力加持這一產(chǎn)業(yè)。
2025年3月發(fā)布的國務(wù)院政府工作報告,首次提及具身智能。十五個(gè)部委聯(lián)合發(fā)布的《“十四五”機器人產(chǎn)業(yè)發(fā)展規劃》中提到,2025年機器人產(chǎn)業(yè)營(yíng)業(yè)收入年均增速將超過(guò)20%,并實(shí)現制造業(yè)機器人密度實(shí)現翻番。工信部在《人形機器人創(chuàng )新發(fā)展指導意見(jiàn)》中提出,2027年中國要形成安全可靠的產(chǎn)業(yè)鏈供應鏈體系,綜合實(shí)力達到世界先進(jìn)水平。
各地方政府也紛紛出臺機器人相關(guān)支持政策,跟隨政策而來(lái)的是大手筆的資金投入。
比如,北京設立1000億產(chǎn)業(yè)基金,聚焦人工智能、機器人賽道;上海設立具身智能基金,且已在此前設立出資額合計890億元的三大先導產(chǎn)業(yè)母基金,主要投向集成電路、生物醫藥、人工智能三個(gè)領(lǐng)域;廣州設立規模達1500億的產(chǎn)業(yè)母基金,主要投向中明確提到了智能裝備與機器人領(lǐng)域。
盡管政策和投資的東風(fēng)拂面,但從靈活度、智能性等維度,目前中國人形機器人的“單兵作戰”能力與Optimus相比還有一定差距。不過(guò)從產(chǎn)業(yè)整體看,中國的實(shí)力已足以讓特斯拉們膽寒。
根據摩根士丹利2025年3月發(fā)布的研報《人形機器人100:繪制人形機器人價(jià)值鏈圖譜》,在全球人形機器人產(chǎn)業(yè)鏈上的100家核心上市公司中,美國和中國已在數量上旗鼓相當,共占總數的七成左右。從細分領(lǐng)域看,歐美主導機器人的“大腦”,中國主攻機器人的“身體”。
美國知名半導體咨詢(xún)機構SemiAnalysis近日指出,特斯拉Optimus原型機關(guān)節采用的諧波減速器大概率來(lái)自日本哈默納科,伺服電機可能采購自德國博世,電池組則極可能來(lái)自中國寧德時(shí)代,這些關(guān)鍵部件的進(jìn)口成本超過(guò)總物料清單的60%。值得注意的是,部分標注著(zhù)“美國制造”的組件,實(shí)際仍可能高度依賴(lài)中國的零部件和原材料,且暫無(wú)可行的替代方案。
中國強大的供應鏈帶來(lái)的價(jià)格優(yōu)勢,使得宇樹(shù)的G1售價(jià)低至9.9萬(wàn)元人民幣。而按馬斯克的規劃,Optimus的理想售價(jià)是2萬(wàn)美元左右,且還要等到“年產(chǎn)量超過(guò)100萬(wàn)臺”之后。
據悉,要在美國制造一款與宇樹(shù)相同的機械臂,成本約是中國的2.2倍。在定制電池包方面,深圳欣旺達的產(chǎn)品雖然在能量密度比日立低15%,但價(jià)格僅為后者的1/3。在諧波減速器領(lǐng)域,中國廠(chǎng)商綠的的性能雖略遜于日本哈默納科,但售價(jià)不到后者的30%。
這些價(jià)格差距在已量產(chǎn)的機器狗上體現得更為明顯。宇樹(shù)最新款機器狗Go2基礎版的售價(jià)為9997元人民幣,而波士頓動(dòng)力機器狗Spot定價(jià)7.45萬(wàn)美元。相伴而來(lái)的是銷(xiāo)量的巨大差異——高工機器人產(chǎn)業(yè)研究所(GGII)的數據顯示,2024年宇樹(shù)機器狗的全球銷(xiāo)量高達2.37萬(wàn)臺,約占全球市場(chǎng)69%的份額,而波士頓動(dòng)力機器狗銷(xiāo)量卻僅為兩千出頭。
供應鏈不僅決定了價(jià)格,也決定著(zhù)產(chǎn)品的迭代速度。中國工程院院士、阿里云創(chuàng )始人王堅認為,中國企業(yè)可以快速低成本地制造出各種原型,有利于在具身智能領(lǐng)域的各種探索。
以另一具身智能產(chǎn)品的無(wú)人機為例??偛吭谏钲诘拇蠼稍跀敌r(shí)內獲得所需的各種零部件,從而實(shí)現超快迭代。GoPro的無(wú)人機項目Karma卻因關(guān)鍵制造環(huán)節分散在中國、馬來(lái)西亞和日本等國,每次迭代都需數周。最終,大疆憑借硬質(zhì)量和低成本迅速占據了全球無(wú)人機市場(chǎng),而GoPro卻因激烈競爭造成的利潤問(wèn)題而放棄了Karma。
以上的劇情似曾相識——同樣依靠著(zhù)強大的“中國制造”,中國的電動(dòng)汽車(chē)上演了后來(lái)者逆襲的大戲,已連續十年全球銷(xiāo)量第一。
巧合的是,正如鈦媒體副總編輯胡潤峰所指出的,同屬具身智能的無(wú)人機、電動(dòng)汽車(chē)、人形機器人在產(chǎn)業(yè)鏈上有較大程度的重合,可復用現成的零部件、人才、經(jīng)驗及工藝。事實(shí)上,目前減速器、伺服電機、激光雷達、電池等領(lǐng)域的龍頭企業(yè)正在同時(shí)為這三個(gè)行業(yè)供貨。
那么,中國還能在機器人行業(yè)續寫(xiě)東方神話(huà)么?
馬斯克畫(huà)的機器人大餅,最終會(huì )不會(huì )充了中國企業(yè)的胃?
大幕拉開(kāi),拭目以待。