一切都是基于經濟上的考慮
編者按:本文來自微信公眾號 星船知造(ID:xingchuanzhizao),作者:清波,編輯:唐曉園,創業邦經授權轉載
(資料圖)
人形機器人產業存在一個反直覺現象:
目前人形機器人本體玩家中,竟然既不包括遠近聞名的工業機器人四大家族(發那科、ABB、安川、庫卡),也少見國內排名靠前的幾大機器人巨頭(埃斯頓、埃夫特、廣數、新松、匯川、新時達、錢江)的身影。
當下人形機器人本體處于領跑位置的玩家,是汽車行業大佬,如特斯拉、本田、豐田。或是科技企業,如小米、谷歌、亞馬遜。
庫卡等傳統工業機器人巨頭反而鮮有入局。
但另一方面,當人形機器人概念股迎來井噴時,率先引爆的卻還是工業機器人老三樣——控制器、伺服電機、精密減速機。比如生產線性關節的拓普集團;旋轉關節的三花智控;空心杯電機的鳴志電器;滑動絲杠、行星滾柱絲杠、空心杯電機的江蘇雷利;伺服電機的匯川科技;諧波減速機的綠的諧波等等,均在人形機器人概念的助力下,有不俗表現。
要解答這個反直覺現象,星船知造還得從人形機器人既傳統硬核(工業機器人老三樣)、又酷炫前沿(人工智能)的產業鏈角度進行分析——
1, 為什么說人形機器人是屬于明天的產業,如何理解其巨大潛力?
2, 人形機器人iPhone時刻還遠未到來,是卡在了哪些領域?
3, 人形機器人產業鏈各環節當下情況
4, GPT技術在人形機器人中的場景應用和人形機器人終極猜想
01 人形機器人和具身智能阿西莫夫的《鋼穴》里有這樣一段對話,大意是:
如果你要管理一座農場,你有兩個選擇。一是在拖拉機、收割機、翻土機、汽車、擠奶器這些機械上都裝上一部“電子腦”,讓它們成為智能機械。二是讓收割機、翻土機、汽車、擠奶器都維持原樣,但使用一個擁有“電子腦”的機器人去操作它們。聰明人會怎么選?
我們認為上述這段文字形象的表明了人形機器人的意義和優勢:
與其把所有工具全部重新設計,不如生產出能模仿人類外形和行為方式的機器人。TA完美接入人類現有生活、進入所有人類已經存在的場景、使用所有人類正在使用的工具。
一句話,我們一切的生活和生產都不需要為了這種機器人做任何多余、額外的改變。
source:giphy
作為一門集機、電、材料、計算機、傳感器、控制技術等多門學科于一體的產業,人形機器人是國家高科技實力和發展水平的重要標志。全球發達國家都不惜投入巨資進行開發研究。
日、美、韓、英等國都在研制仿人形機器人方面進行了大量投入?
今年5月的特斯拉股東大會上,馬斯克通過視頻向全世界的投資者展示了Tesla人形機器人的最新進展:
Optimus(擎天柱)已經可以完成分類物品的復雜任務,如撿起物品、環境發現和記憶等。較之去年9月底的亮相,其運動控制能力持續進化,AI能力提升。馬斯克認為特斯拉的未來長期價值可能都是Optimus給予的。
馬斯克總財富已超越法國奢侈品巨頭LVMH總裁,重新奪回世界首富頭銜
日本本田公司最新開發的新型機器人ASIMO(阿西莫),身高120厘米,體重43公斤,它的走路方式更加接近于人。
source:本田
韓國KAIST 代表產品 HUBO+身高 1.7m,體重 80kg,具有 32 個自由度。
source:KAIST
美國波士頓動力研發的代表產品 Atlas 身高 1.8m,體重 80kg,具有 28 個關節,可完成原地起跳轉身一周等高難度動作。
硬件結構上,Atlas 擁有輕量級結構件皮膚和足部力控傳感器,雷達與深度相機形成視覺感知,28 個液壓關節驅動完成一系列敏捷動作,本體搭載 3 臺 NUC/工控機負責整體控制系統的運算。
軟件方面,波士頓動力運用行為庫、實時感知和模型預測控制(MPC)技術將相機、雷達等傳感器接收的數據進行分析并對決策制定和動作規劃提供支持。
source:波士頓動力 不得不說,波士頓動力的就是酷
我國人形機器人在科研領域,有國科大研發的“先行者”機器人,可完成靜態和動態步行動作;哈工大推出的“HIT-III”機器人能完成上、下斜坡等動作;清華大學開發的“THBIP-II”具有 24 個自由度等。
在產業領域,深圳優必選推出的“Walker”機器人能完成上、下臺階等動作;小米于 2022 年 8 月公布的人形機器人 Cyber One(鐵大),升級后的運動控制算法支配這機器人全身 13 個關節和 21 個自由度,實現雙足運動姿態平衡;電機性能增強10 倍,髖關節主要電機的動力扭矩峰值可達 300Nm,峰值扭矩密度 96Nm/kg;之江實驗室展示的人形機器人能借助高精度視覺感知系統,定位琴鍵進行高精度手指運動。
深圳優必選“Walker”機器人
點擊圖片可放大
馬斯克對于機器人市場的判斷并非“空穴來風”。IFR數據,2022年全球機器人市場規模已經達到了513億元的高點,2017-2022 年CAGR 達 14%。
其中工業機器人市場規模195億美元,服務機器人市場規模達217億美元,特種機器人市場規模超100億美元。到2024年,全球機器人市場規模有望超650億美元。
另據Markets and markets預測,全球人形機器人市場規模(僅考慮單機)將從2022年15億美元提升至2027年的173億美元(約合人民幣1038億元),千億市場的容量指日可待。
從零售端的價格來看,此前美國波士頓動力推出的四足機器人Spot Mini定價約為74500美元,上線一年賣出了大約400臺,人形機器人Atlas并未上市。面對高昂的價格,馬斯克曾公開表示,他的人形機器人將以低于2萬美元的價格銷售,并實現大規模生產。
做一個最為簡單的推算:即使未來Optimus的銷量只有馬斯克所說100億臺的1/100,那么其市場規模就有2萬*1億=2萬億(美元),這是何其壯觀的數字。
source:特斯拉
目前人形機器人的iPhone時刻還遠未到來。
從廣義范疇來看,人形機器人在本質上并沒有脫離機器的束縛,即便擁有了人體的形狀,但仍然是機器人的一種。只不過,在裝備了感知系統、驅動系統、末端執行系統、能源供應系統,運算系統及軟件這五大系統之后,在人工智能度上,人形機器人較之我們更為熟悉的工業機器人有了長足的進步。
傳統工業機器人更像一臺機器而并非“人”。由于其所運行的軌跡都是被事先編程好,只可以在固定區域,特定場所,做規定而重復的動作,不具備獨立處置突發(非程序內)問題的能力,只能被歸類為非智能機器人。
需要與環境(包括人)發生交互,做出反應,就要求人形機器人擁有相當程度的人工智能。用更為規范的學術語言描述,這樣一種人工智能就叫做具身智能。
具身智能(Embodied Intelligence),指的是智能體通過與環境產生交互后,通過自身的學習,產生對于客觀世界的理解和改造能力。
能夠產生具身智能的假設前提是:智能行為可以被具有對應形態的智能體,通過適應環境的方式學習到。有鑒于此,地球上所有的生物,都可以說是具身智能。
黃仁勛在2023年ITF世界大會上說:“人工智能和加速計算正在共同改變技術行業。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動的智能系統,即具身智能。”
具身智能是能夠提升當前“弱人工智能”認知能力的重要方式。亦是產生超級人工智能的一條可能路徑。
具身智能可以理解為人工智能發展的高階形態,也有可能成為AI的終極形態。說得更加透徹一點,人形機器人的未來,就是賦能了具身智能的真正智能機器人。
如此智能的人形機器人會是如何接受指令,完成任務的呢?
首先,機器人的感知系統把機器人的各種“內部狀態信息”和“環境信息”從“信號”轉變為機器人自身或者機器人之間能夠理解和應用的“數據”和“信息”。也即是說,讓機器人理解周圍的環境。
科學家(廠家)在機器人身上安裝各類傳感器,包括光、聲音、溫度、距離、壓力、定位、接觸等等,讓機器人能通過“五官”來接近人類,收集感知外界的信息。
各類傳感器應用技術的突飛猛進,保證了人形機器人得以發展。
傳感器精度和可靠性的不斷提高是當前亟待解決的難題之一。舉例來說,在進水,進到粉塵或者顛簸之后,相機的校準就容易失效,長期使用之后像素點就容易壞死等硬件問題都會直接導致機器識別率在準確性上的丟失。
其次,機器人的驅動系統和末端執行系統需要協同工作,各司其職,就如同人類依靠身體各部位上的78個關節來行動。
用在機器人上的每一個關節的技術門檻和成本都很高,不僅要求體積小、精度高、重量輕,還同時要求抗摔耐撞。當機器人快速運動時,驅動力輸出功率很高,要保證不會因為發熱問題而燒壞,同時具備緩沖能力,保護“機器人關節”不怕撞擊。
末端執行系統中的“手”,是技術難度非常高的部分。在實際抓、舉、拿、捏等動作的操作過程中,機器人手指柔軟度與抓握力度的協同性非常重要:抓輕了東西容易掉,抓得重了則直接破碎。
舉例來說,特斯拉發布的Optimus展示出了與人手非常相似的機械手:
Optimus擁有11個精細的自由度,結合控制軟件,能完成像人手一樣復雜的操作,承擔約9公斤負重。最新的demo視頻中,我們也能看到特斯拉機器人在硬件上的一定優勢,包括能控制力度的抓握很多物品,并且不會打碎雞蛋。
source:特斯拉
再次,機器人的驅動系統和能源供應系統用于保障其動作的完成。按照波士頓動力官網的描述:Atlas機器人,雖然各種炫技動作很酷,但必須配置功率很大的液壓驅動。實際上,Atlas配置了28個液壓驅動器才能讓機器人完成各種爆發力超強的動作,而這樣的代價也是波士頓動力的老問題了——
制造成本居高不下,難以走出實驗室完成商業化。
馬斯克在Optimus身上選用了穩定性、性價比更高的電機驅動方案,就是出于成本考慮。也正是因為這樣,才有底氣把Optimus的目標售價定在2萬美元,以此來滿足巨大的潛在市場需求。
最后,用機器人的運算系統及軟件來進行分析思考和對應指令的下達。
第一,理解需求和環境。機器人會通過傳感器了解周圍環境,搞清楚要做什么。
這一層的難點在于:視覺等環境識別和理解,包括識別未知物體以及識別物體的未知姿態。
第二,拆解任務和進行路徑規劃。
這一層的難點在于:人工智能輸出時的不穩定性。因為在人工智能拆解任務的時候,每一次的解法可能都不相同,可能導致任務拆解的不一致,產生意想不到的結果。
第三,命令驅動硬件執行任務。需要把運動規劃轉變成機械指令發到機器人的驅動系統上,確定能量、動量、速度等合適后,開始執行任務。
這一層的難度在于:目前的人工智能還做不到100%的準確率,同時速度較慢,耗時耗力,但是硬件執行任務的驅動需要精準控制,要以100%的準確率作為基礎,因此業內還是會采用傳統的控制論方式來發號施令,執行任務。
由此可知,要讓人形機器人身上的這四大硬件,一大軟件系統有機地整合在一起,協同工作,相互配合,同時還要讓合適的部位有合適的力量、速度和準確性來完成所需的任務,絕非易事。
仍以特斯拉的Optimus來說。2021 年 8 月,馬斯克在特斯拉年度 AI 開放日上首次公開展示了Optimus的想法。僅過一年時間,“擎天柱”原型機就于 9 月30 日特斯拉 AI Day 發布,硬件方面,“擎天柱”身高 172CM,整體重量 73KG;行走功率500W,坐下功率 100W,整體參數與 2021 年概念機略有出入(概念機參數:身高172CM,體重 57KG,負載 20KG,行走速度最高可達每小時 8 公里)。
電機驅動上,Optimus擁有 2.3KWH、52V 電壓的電池組,內置電子電器元件的一體單位,支持人形機器人工作一整天;選用 28 個定制關節驅動器,復用汽車動力總成設計經驗,設計 6 種關節驅動器,包括 3 種不同規格的舵機(采用諧波減速器)和 3 種不同規格的直線執行器(采用永磁電機,可抬動 1.5 噸三角鋼琴的),找到成本與效率的最佳組合。
目前特斯拉已把汽車的一些技術運用到了Optimus上,例如電池組、冷卻系統等,還使用與汽車測試類似的技術來進行機器人的運動和對外部碰撞模擬。
特斯拉的全自動駕駛系統FSD也直接被應用在Optimus上,機器人采用了與汽車一樣的視覺感知,使用攝像頭輸入數據,以神經網絡進行計算。
未來對特斯拉人形機器人或許還有以下驚喜:
特斯拉在新材料、電子技術上的研發能力較強,可能會用到特斯拉在火箭上的技術積累;給特斯拉帶來持續爆款話題等。
02 人形機器人的產業鏈各環節分析先說結論。未來人形機器人產品之間的競爭,歸根到底是一場各個本體廠家在人工智能(AI)賽道上的競爭。
首先比的是人工智能水平的高低:能否像人一樣,理解外部環境和內部中樞發出的信息和指令,理解,判斷并做出正確反應。
其次比的是各個軟硬件之間的協同工作能力:哪怕每一個部件都是同類中最好的,但總成不好,搭配不當,同樣發揮不了最佳實用效果。
再次就是量產后的成本比拼了:人形機器人終究是一種商品,如果其最終成本達不到市場能接受的程度,那做的再好充其量也只是一種沒有商用價值的實驗室產品。
人形機器人,作為機器人領域里新崛起的一個重要分支,其產業鏈也是由上中下游三個部分組成。
上游為核心軟硬件,硬件包括伺服電機、減速器、控制器、傳感器等;軟件方面主要包括機器視覺、人機交互、機器學習、系統控制等。
中游則是人形機器人本體制造商,也就是能把上游的核心軟硬件組合在一起,生產出能走、蹲、跑、跳、能撿東西、能抓物體的人形機器人的廠家。國內主要有優必選、北京鋼鐵科技、小米等,國外的則包括波士頓動力、美國敏捷機器人、特斯拉、日本豐田、本田等;
下游目前還未有特別成熟的商業應用?
制圖:星船知造 點擊圖片可放大
從人形機器人當前的產業鏈狀況來看,雖說馬斯克推出的Optimus早已給期盼它正式上市的人們注入了一劑超級強心劑,然而在現實市場中,其上游產業鏈走的依然是常規工業機器人的路線。
主要硬件部分除了傳感器之外,其他三樣就是工業機器人的三大核心零部件(控制器、伺服電機和減速機)。由此,也就能發現即便當下人形機器人的熱度再大,風頭再勁,“人”味再濃,最終采用的卻還是工業機器人的那套基本架構。
機器人能夠靈活工作的核心之一在于運動的精確控制,其技術難度最高的三大核心零部件分別是控制器、伺服電機和精密減速器,這三者成本的占比分別約為15%、20%、35%。
以2022年9月特斯拉發布的首款人形機器人Optimus為例:
它擁有28個關節驅動器,使全身能夠產生200個以上不同角度的動作。
手部有五個手指,配備6個驅動器,擁有人類的靈巧性。
要實現這些功能,上述三大產業鏈核心零部件的性能必須要達到相當高的要求。
從成本上分析,人形機器人的成本大致可拆分為動力總成系統(占總成本比重的60%)、智能感應系統(占20%)、結構件及其他(占20%)三個部分。
其中,動力總成系統包括電池系統、電驅系統(這里的動力總成定義類似電動車上的“三電系統”),預計這兩者分別占到總成本的10%、50%。
綜合技術與成本兩個方面來看,核心零部件的重要性尤為突出。
一方面,人形機器人技術的本質是3D空間中高維度的感知與運動,高性能的核心零部件是實現感知與運動的基礎。
另一方面,控制器、交流伺服電機和精密減速機這三個最重要的核心零部件在成本中所占的比例還是相當之高。
控制器是工業機器人的大腦,對機器人的性能起著決定性的影響。工業機器人控制器主要控制機器人在工作空間中的運動位置、姿態和軌跡,操作順序及動作的時間等;
伺服電機在自動控制系統中,用作執行元件,把所收到的電信號轉換成電動機軸上的角位移或角速度輸出。機器人每個關節運動均需靠伺服電機驅動,以實現多自由度的運動;
精密減速器則是連接動力源和執行機構的中間機構,具有匹配轉速和傳遞轉矩的作用,也是機器人生產中壁壘最高的零部件,主要包括諧波減速器與RV減速器,但其工作原理和應用場景存在較大區別:
諧波減速器:由波發生器、柔輪和剛輪組成。當波發生器被放入柔輪內圓時,柔輪產生彈性變形彎曲成橢圓狀。由于柔輪外側的剛輪比其多2個齒,導致柔輪長軸部分正好可以與剛輪的齒輪嚙合,而短軸部分與剛輪的齒輪呈脫離狀態。
RV減速器:由兩個減速部構成,在第一減速部中,輸入軸的旋轉從輸入齒輪傳遞到直齒輪,按齒數比進行減速;在第二減速部中,有一個曲柄軸與直齒輪相連接,在曲柄軸的偏心部分,通過滾動軸承安裝RV齒輪,曲柄軸會帶動RV減速機做偏心運動。
六軸工業機器人 source:遨博機器人
除了以上的三大核心部件外,傳感器在人形機器人身上的作用也極其重要。
人形機器人要具備對外界環境的識別能力,實現導航、避障、交互等功能,就需要使用傳感器識別物體、測距等。
識別外部環境主要使用攝像頭、激光雷達等傳感器,其傳感器方案和需求場景與自動駕駛存在類似之處,因此價值量較高的自動駕駛類傳感器存在新的機遇。
自動駕駛傳感器廠商、機器視覺廠商都是人形機器人傳感器的參與者。
以三大核心零部件來分類的方式通常更適用于相對粗獷的工業機器人,要想更好地解析人形機器人,五大系統的分法其實更為科學。
感知系統,也即是傳感器,如攝像頭、麥克風、激光雷達、距離感應器等等,負責收集、傳遞信息,相當于人的眼、鼻、耳,即人的“五官”;
驅動系統,比如驅動輪子的馬達,機械臂上液壓動力系統或氣動系統,相當于人的“肌肉”;
末端執行系統,既可以是機械手,也可以是機械臂上的一把螺絲刀或者噴槍,用以與外界環境進行物理交互,相當于人的“雙手”或“四肢”;
能源供應系統,如電源或電池,是機器人的能量供應中心;
運算系統及軟件,將上面所有的系統整合起來,完成指定任務,是機器人的“大腦”。
之所以需要用相當大的篇幅來介紹上游產業鏈中的核心零部件、軟件及系統部分,就是因為它們是人形機器人能夠身輕如燕地跑跳蹲立,靈活自如地抓取捧舉,聰明伶俐地辨物識人,言聽計從地信手拈來的關鍵所在。
沒有這些部件的縝密配合,外觀再逼真的人形機器人也只能算作是繡花枕頭,中看不中用。
相對于種類繁多的上游產業鏈,人形機器人的中游產業鏈顯得簡單明了:就是那些能夠把這些核心零部件及軟件組合在一起,使機器人能夠發揮出最大仿人效能的本體制造商。
如本文開頭所說,目前人形機器人本體上處于領跑位置的玩家,要么是像特斯拉這樣的汽車行業大佬,要么是小米這樣的科技企業。工業機器人大佬反而鮮有入局。
以筆者的判斷來看,雖然人形機器人脫胎于工業機器人而來,但由于前者在AI領域方面的要求遠高于后者,所以反而是高科技企業(尤其是在AI領域有較高建樹的)有后發優勢。
當然,把特斯拉、豐田、本田歸類為汽車企業未免太過片面,這幾家都是具備了極強科研開發能力的高科技企業(尤其是特斯拉在全自動駕駛技術FSD上的超強實力,已經讓人形機器人和汽車擁有了一樣視覺感知:以攝像頭輸入數據,通過神經網絡進行計算)。
03 ChatGPT實體化和機器人終極猜想最近舉辦的一場人形機器人比賽中,由OpenAI支持的實體機器人公司1x出品的EVE,擊敗了特斯拉的Optimus機器人。
EVE機器人的部分軟件功能由ChatGPT提供支持,也就是說將ChatGPT實體化,應用在現實場景中。
GPT技術在人形機器人中的場景應用打開了新的想象空間,引發了國內資本市場對機器人產業的高度關注。
從業內人士的角度來看,GPT大模型技術應用到人形機器人上,可以為機器人提供“常識”,使其具備理解與推理能力。
在邊緣端布局面向機器人作業的中模型,能夠較為快速處理機器人的傳感信息,結合機器人端部署的運動規劃與控制小模型,這樣才能構建出“云邊端”一體化的智能機器人系統,完成人形機器人的智能閉環。
由此再次鞏固了我們的判斷——人形機器人產品之間的競爭,歸根到底就是一場各個本體廠家在人工智能(AI)賽道上的競爭。
先拼AI研發能力,再比各軟硬件之間的協同工作能力,最后大家一起拼成本。
以筆者之見,人形機器人在不久的將來會有三個發展趨勢:
一是成本越來越低,進到千家萬戶是大勢所趨。
有鑒于當前人形機器人高昂的零售價格(未量產狀態),即便其下游的產業鏈前景被資本市場長期看好,但至少在當下,能夠實現商業化的場景還是屈指可數。
波士頓動力的Atlas單臺價值為200萬美金,本田Asimo的單臺價值250萬美元,小米Cyber One單臺造價也高達60-70萬人民幣。基本杜絕了普通人的購買奢望。
不過,假如Optimus在3-5年后通過量產,售價做到2萬美元一臺,且替代人類完成瑣碎復雜的工作(非簡單重復型),這樣的下游產業鏈場景無疑會是相當廣泛且極具商業價值的。
如馬斯克所描繪的,在量產規模達到特斯拉汽車的水平(幾百萬臺),各種更加經濟實用的替代品被投放到原來昂貴易損的零部件位置之后,2萬美金一臺的價格將只是初級目標。畢竟,卡爾·弗里德里希·本茨(Karl Friedrich Benz)發明的世界上第一臺內燃機汽車并不足以讓它走入到千家萬戶,量產后的福特T型車才是。
二是智能越來越高,替代復雜繁瑣的工作是民心所向。
與工業機器人主要用于取代工廠里簡單、重復、危險的勞動定位不同,人形機器人更加適合用作替換與人類有直接接觸,相對更為智能、繁瑣、貼身的工作,如導購、接待、看護、喂養寵物等。(更多機器人進入下游應用領域,請點擊閱讀星船知造文章:《萬億級機器人賽道里:為什么它最卷?》)
隨著人工智能水平提升,越來越多AI技術被運用到人形機器人身上,機器人越來越“人性化”,與人類的緊密度和契合度也會越來越高。
三是人工智超越人類的智能會是未來的大概率事件。
無論爆火的ChatGPT還是曾擊敗李世石的AlphaGo都屬于弱人工智能。
強人工智能至今尚未出現。但綜合來看,人工智能在與人腦的對抗中有以下三條優勢:
首先是能耗,人工智能思考和解答問題比人腦消耗的能量低得多。大腦是人體能耗最大的一個器官,為什么人類總是討厭學習和思考,這是求生本能決定的,為了避免過度思考帶來的身體能量過度的消耗。
其次是存儲,人會遺忘。但人工智能只要信息輸入,就會存儲下來。強人工智能還能通過學習關聯更多知識和信息。
最后也是最致命的優勢就是人工智能的時間效率。這里的效率有兩個方面的理解,一是學習效率,相比人類需要娛樂、社交、睡覺等,AI24小時不眠不休的學習和進化,昨天還是嬰兒明天就是成人后天就是最強大腦。二是解決問題的效率,人工智能全天候處理問題和工作,未來人工智能會比人類更熟練的使用各類工具,可能你一輩子才精通的操作精密機床的手藝,AI一晚上就學會了。
最后,讓我們回到阿西莫夫的機器人三部曲。
《鋼穴》里,中年便衣刑警貝萊問機器人丹尼爾,為什么人類那么執著要造出有手有腳有腦袋的機器人?為什么他們多多少少總要做得像個人?
丹尼爾的回答很簡單。至今為止一切為人類發明的東西,人型機器人直接就能用。
所以,是的,一切都是基于經濟上的考慮。
本文基于訪談及公開資料寫作,不構成任何投資建議