先是馬斯克放話:未來80%的特斯拉市值將來自人形機器人業務,一下把大家的注意力從電動車又拉回到了那臺神秘的Optimus上。
緊接著,一段新視頻又在網絡上瘋傳。
視頻最早是由Salesforce CEO Marc Benioff 發布的,主角自然是 Optimus。但這次,它換了個“金閃閃”的新殼,手部結構也更精細。除了外觀吸睛,這臺機器人的售價也不便宜, Benioff 親口透露:20萬到50萬美元之間。
最讓人眼前一亮的,還是它的“走路方式”。視頻里,這臺金色 Optimus 的步態明顯更加自然,腳跟著地、步伐穩健,非常接近人類走路的方式。

但這個步態,看起來非常熟悉。
幾乎就是前不久,國產機器人公司開普勒發布的K2“大黃蜂”抗擾動步態視頻中的“同款步態”。視頻中,K2“大黃蜂”在磚石、塑膠、草地等復雜環境和外力干擾中依然保持直膝步態、穩定行走,展現了強大的平衡能力與環境適應性。

為什么看起來這么像?追根溯源后得知,原來特斯拉和開普勒在底層架構上都選用了類似的技術路徑:滾柱絲杠直線執行器混動架構。
在機器人學界,這被認為是極具挑戰的方案,需要復雜的運動學建模和極高精度的力矩控制。但其優勢同樣顯著:步態更加自然,能效利用率更高,更便于任務執行,環境適應性更強。

對此,我們特地咨詢了開普勒公司,希望從這家國產廠商的視角,了解背后真實的技術考量。
01
直膝步態,為什么是“難而正確”?
開普勒方面表示,之所以選擇直膝步態和滾柱絲杠直線執行器混動架構,是因為這是一條“難而正確”的路。
對于雙足機器人而言,直膝行走幾乎是最難的動作之一。相比之下,彎膝步態更容易實現:重心低,結構穩定,對控制算法和硬件精度的要求相對寬松。因此,多數機器人公司會選擇彎膝方案來保證“能走”。但問題也很明顯:動作笨拙,能效低下,離“像人”還有很大距離。
開普勒堅持認為,人形機器人既然要走路,就必須“像人一樣走”。這也是他們選擇直膝步態的根本邏輯。
近日,開普勒人形機器人K2大黃蜂迎來全新步態升級,并正式發布了國內首例“混合架構抗擾動”步態實錄視頻。
在這段視頻里,K2大黃蜂面對復雜的環境時始終保持穩定的行走節奏。這種表現,直觀地體現了直膝步態在復雜環境中的可行性和優勢。
開普勒方面表示,這款機器人以直線執行器為核心動力,相當于“腿部肌肉”,提供主要能量;再結合旋轉電機等驅動方式,實現動作微調和步態切換,從而適應不同地形。
這一方案已被包括特斯拉、小鵬等在內的國際前沿人形機器人團隊驗證,并逐漸成為行業共識。
其中的核心部件是行星滾柱絲杠,一種將旋轉運動轉化為直線運動的精密傳動裝置。它通過“行星傳動+螺紋嚙合”的復合原理實現高負載、高精度傳動,優勢主要體現在三個方面:
1.高能效比與高精度:行星滾柱絲杠通過滾動摩擦傳遞動力,能量損耗較低,可高效地將伺服電機的旋轉運動轉化為直線運動,其能量轉化效率可以達到81.3%左右;低摩擦設計(摩擦系數低于傳統絲杠)減少熱變形和能量損耗,確保長期運行下的定位精度。
2.超強承載能力:行星滾柱絲杠通過螺紋滾柱作為滾動元件,在螺母與絲杠間形成眾多接觸線,大幅提升受力面積。其結構設計使承載能力遠超滾珠絲杠。在同等負載力下,行星滾柱絲杠體積更小,且能適應惡劣工況(如高沖擊、多粉塵環境)。尤其適用于如重載機械、工業機器人關節等。
3.運動平穩性與耐久性:螺紋滾柱的連續接觸消除了滾珠絲杠中可能出現的沖擊振動,運行更平穩,降低噪音和機械磨損。接觸應力分散顯著降低元件疲勞風險,壽命可達滾珠絲杠的數倍,尤其適合高強度工業環境。
正是這種結構,讓K2“大黃蜂”在保持人類自然步態的同時,兼具穩定性與耐久性。從特斯拉Optimus到開普勒K2“大黃蜂”,這不僅是“看起來像人”的選擇,更是經過驗證的效率與穩定性兼顧的最優解。
02
困難重重,開普勒有何解法?
正如開普勒公司所示,直膝步態的“正確”,并不意味著它“容易”。尤其是在采用滾柱絲杠混動架構的前提下,控制難度和工程復雜度幾乎是指數級上升。
第一重難點在于絲杠力學。
市面上常見的準直驅機器人,多數采用相對簡單的串聯結構,控制邏輯更直觀。但在開普勒的混合架構里,行星滾柱絲杠直線執行器與旋轉電機協同驅動,每一個關節都需要在高負載和復雜動作下保持精確控制。
這就意味著,上層控制器規劃的角度、速度和力矩,要實時轉化為絲杠長度、速度與推力,再由電機執行。而直線電機反饋的數據,又要反向換算成關節的角度、速度與力矩。這種復雜的雙向映射關系,就是所謂的“絲杠力學”,也是實現自然步態的前提。

第二重難點在于仿真與現實的差距(Sim-to-Real Gap)。
如果說絲杠力學是精度上的挑戰,那么仿真與現實之間的差距,則是落地性上的鴻溝。幾乎所有人形機器人研發團隊都會面對所謂的 Sim-to-Real Gap:在虛擬仿真環境里跑得流暢自然,一旦切換到真實世界,就問題頻出。
原因在于,仿真世界往往過于理想化。它可以忽略關節摩擦、材料變形、地面微小的不平整;傳感器數據也被假設為“完美”,而現實中的 IMU 漂移、力矩傳感器噪聲、視覺延遲都會積累成姿態偏差;仿真環境通常是平坦的地面,但現實中機器人要面對的是坑洼、斜坡、突發外力甚至光照變化。
更麻煩的是,真實的執行器存在響應延遲和死區效應,指令發出去并不會“秒到”;通信網絡也有延時,這些微小的差異足以讓看似完美的步態在實機上完全走樣。
針對這兩大難題,開普勒的應對思路是“雙管齊下”。K2“大黃蜂”采用直線執行器的混動架構,在力控環節中引入絲杠力學的精密計算,并輔以強化學習與模仿學習的結合,從而同時攻克了步態的靈活性與自然性問題。在復雜環境下,它能夠完成穩定而靈活的步態切換;在日常行走中,則展現出類人直膝步態的自然效果。

在具體方法上,強化學習承擔了最基礎的“教學”角色。通過大規模并行的仿真實驗,數千臺虛擬機器人被置于各類復雜場景之中:不同地形、不同執行器特性,甚至絆倒、滑倒或外力干擾。GPU加速讓這種試錯可以在極短時間內完成,最終形成能夠應對突發情況的魯棒性控制策略。
與此同時,模仿學習則讓“大黃蜂”具備了更接近人類的動作特征。借助高保真的物理仿真器,僅需數小時便能生成相當于數年的人體步態數據。機器人不僅學會了腳跟先著地、腳尖離地的細節動作,還能做到手臂與腿部的自然擺動,使整體步態更符合人類直覺。
在整個學習過程中,獎勵函數發揮了關鍵作用,它像“老師”一樣為機器人指引方向:哪些行為更高效、更穩定,哪些策略更能抵御擾動。
經過持續的反饋與優化,K2“大黃蜂”逐步具備了在真實環境中高可靠行走的能力。相比單純的仿真訓練,這種方法讓它不僅能在實驗室中走得穩,更能在工業生產線、物流倉儲等高復雜度場景中經受住各種干擾,實現自然且穩定的仿人步態。
同時,開普勒K2大黃蜂目前已經可以通過分層模型 VLA+語義識別,聽懂自然語言指令,按照需求給大家分發物品,完成多種任務。





