휴머노이드 10년
모델 기반 제어에서 학습 기반 정책으로의 패러다임 전환
2015–2026년 휴머노이드 로보틱스의 대격변을 정리한 서베이. 정통파 LIPM/ZMP/MPC 스택의 한계, QDD 액추에이터·GPU 병렬 시뮬·teacher-student RL·sim-to-real 네 기폭제, System 0/1/2 3-레이어 아키텍처와 VLA 통합, Boston Dynamics·Figure·Agility·Unitree·AgiBot 선두 기업 분석, 그리고 한국 제조피지컬AI 관점에서의 미래 확산 시나리오까지.
First published: 2026-04-24 | Last updated: 2026-04-24
16개 챕터 5 Parts
옛 스택에서 VLA까지 한 권에.
기본기 + 모던 이론
LIPM·QP부터 PPO·Transformer·Diffusion policy·VLA까지 이론 다리를 깐다.
제조피지컬AI 관점
한국 제조 강점과 글로벌 휴머노이드 경쟁의 접점.
Part I: 정통파 스택과 그 유산
2003–2015 정통파 스택의 전성기와 한계
Kajita LIPM · ZMP preview control · whole-body inverse dynamics QP · capture-point footstep. ASIMO·HRP·DRC-Atlas 계보. 모델 불확실성·접촉·지연이 왜 이 패러다임을 폭발시키는지.
→ 02여전히 유효한 기본기
LIPM·ZMP·whole-body QP·MPC 중 현대 hybrid 컨트롤러와 System 0 PD 루프에 살아남은 이론 유산. 독자가 Part II·III를 읽기 전 붙들어야 할 기본 개념.
→ 03패러다임 전환 개관
바뀐 네 축의 상호의존성 지도 — QDD 없으면 RL 무의미, GPU 시뮬 없으면 DR 불가 등. 각 축을 이후 챕터에 어떻게 나누는지의 로드맵.
→Part II: 네 가지 기폭제
하드웨어 — QDD 액추에이터
MIT Cheetah 2017 계보. 외전형 BLDC + 저기어비 유성기어가 만든 backdrivability·high bandwidth·proprioceptive GRF. Mini Cheetah backflip 이후 Unitree/Figure/1X로 수렴.
→ 05GPU 대규모 병렬 시뮬레이션
Isaac Gym 2021 변곡점, Rudin et al. ANYmal 분 단위 학습. Isaac Lab · MuJoCo MJX · Genesis · Humanoid-Gym 2026 표준. 도메인 랜덤화를 실용화한 샘플 스케일.
→ 06학습 알고리즘 Canon
Hwangbo 2019 actuator network → Lee 2020 teacher-student → Kumar 2021 RMA → Siekmann 2021 Cassie → Radosavovic 2023 풀사이즈 transformer. History encoder 추세 TCN→LSTM→Transformer.
→ 07Sim-to-Real 3전략
Domain Randomization · System ID + Actuator Network · Residual/ASAP(delta action). Reactive footstep이 계획이 아니라 매 제어 주기 emergent 출력으로 바뀐 근거.
→Part III: 2026 표준 스택
모던 이론 기본기
Part II·III를 쉽게 소화하기 위한 이론 다리 — RL·policy gradient·PPO/TD3 개요, Transformer history encoder의 in-context adaptation, Diffusion policy, VLA 개념. Ch2의 옛 기본기와 짝을 이루는 '새 기본기'.
→ 09System 0/1/2 3-레이어 아키텍처
Figure 명명 이후 업계 공통어. 주파수(1kHz/100Hz/7–10Hz)와 파라미터 스케일(10M/1B/7B)이 다른 세 레이어의 비동기 통신. 옛 preprocessing 분리와의 본질적 차이.
→ 10VLA와 Loco-Manipulation 통합
OpenVLA · GR00T N1/N1.5 · Helix · GO-1/GO-2 · π0. Locomotion을 해결된 primitive로 묻고 위에 VLA. Diffusion policy와 latent action의 역할.
→Part IV: 선두 기업 기술 분석
전통의 강자 — Boston Dynamics
Electric Atlas(56 DOF)·RAI Institute 합작 RL pipeline·TRI Large Behavior Model. 수십 년 MPC/simulation 자산을 RL로 대체가 아닌 보완. 하이브리드 MPC+RL의 정수.
→ 12미국의 도전자 — Figure AI와 Agility Robotics (with Tesla Optimus 전망)
Figure Helix 02의 end-to-end '픽셀→전신'과 BotQ 수직통합 vs Agility Motor Cortex + GXO 상용 배포 1위. 챕터 말미에 Tesla Optimus의 현재 공개 정보와 여전히 미지수인 포지셔닝.
→ 13중국의 강자 — Unitree와 AgiBot
Unitree G1 $16K·unitree_rl_gym '연구용 Android' vs AgiBot GO-2·Genie Sim 3.0·AgiBot World 100만 trajectory. 하드웨어 오픈 레퍼런스 vs 데이터·시뮬·배포 수직통합의 두 전략.
→Part V: 한국의 기회와 미래 시나리오
한국의 현위치와 K-휴머노이드 연합
현대로보틱스·레인보우로보틱스·네이버랩스·KAIST·SNU를 비롯한 한국 생태계의 기술 포지션. 선진 그룹과의 격차 진단, K-휴머노이드 연합을 비롯한 정부 지원 이니셔티브의 의미와 한계.
→ 152026 차별화 네 축 — 제조피지컬AI 혁신 관점
Manipulation 데이터 · 온보드 VLA · Fleet learning · Cross-embodiment 네 축을 한국 제조(반도체·자동차·조선·배터리) 강점과 어떻게 교차시킬 것인가. '제조피지컬AI' 혁신의 전략적 필수 조건.
→ 16단계적 확산 시나리오 — 제조피지컬AI 기술 정복과 산업 확산
제조피지컬AI 관점의 기술 정복 순서(dexterous manipulation 병목 해제 → 고정 설비 자율화 → 유연 제조) → 국내 산업 확산(반도체·자동차·조선·배터리) → 해외 확산 및 서비스·가정으로의 마지막 전이. 에너지·규제·일자리 병목.
→