论文导航 | Robotics Notebooks

1. 怎么使用这页

先按问题走，不要按热度走

先明确你是想补运动控制、强化学习、模仿学习、sim2real，还是人形专项，再进入对应主线。

先抓代表作，不要一口吞百科

每条线先抓 2 到 4 篇真正奠基或改变你理解框架的代表工作，读透比堆数量更值钱。

读完必须回结构页

论文不是目的，结构化理解才是目的。每次读完一组论文，都应该回模块页或关系页重新整理知识框架。

2. Motion Control：运动控制论文主线

适合先打控制骨架的人。控制主线越稳，后面看 RL / IL 越不容易飘。

先进入运动控制模块页

先把控制语言建立起来，再看 WBC、MPC、TSID、centroidal dynamics 等论文会顺很多。

第一批：WBC / QP / TSID

重点读任务优先级、约束组织、接触力分配、全身协调这条线，这是人形控制论文的基本语法。

第二批：MPC / Optimal Control

重点看如何把目标、动力学和约束写成优化问题，以及为什么这条线在人形 locomotion 里长期有生命力。

第三批：Learning-augmented Control

重点看学习方法怎样增强控制器，而不是粗暴替代控制器。

3. RL：机器人强化学习论文主线

适合想真正理解 humanoid locomotion、鲁棒训练和策略部署的人。

先进入机器人强化学习模块页

先理清 state、action、reward、训练系统和 sim2real，再看具体论文，不然很容易只记住算法名字。

第一批：PPO / Locomotion 代表作

重点看 observation、action、reward、并行仿真和训练范式，而不是只看“几分钟学会走”。

第二批：Robust Locomotion / Disturbance Recovery

重点看抗扰、复杂地形、变速和恢复策略，不要只盯平地稳定步行。

第三批：Motion Prior / Reference Tracking

当你关心“既稳又自然”的行为时，这条线很关键，它会把 RL 和 IL 真正接起来。

4. IL：机器人模仿学习论文主线

适合想利用演示、动捕、遥操作、参考动作和先验行为来加速技能学习的人。

先进入机器人模仿学习模块页

先建立对 BC、distribution shift、retargeting 和参考动作跟踪的理解，再读论文会更清楚。

第一批：Behavior Cloning / DAgger

这是最基础也最重要的起点，重点不是背定义，而是看清 deployment distribution mismatch 到底怎么出现。

第二批：Motion Imitation / DeepMimic / AMP

这一批特别适合人形机器人语境，重点看动作先验、参考跟踪和自然行为生成。

第三批：Diffusion / Sequence Policy

适合在长时序、多峰动作分布、复杂技能表达这类问题上进一步扩展理解。

5. Sim2Real：从仿真到真机

这是最容易被一句“成功迁移到真机”轻描淡写带过，但最能体现工程含金量的部分。

第一批：Domain Randomization

重点看随机化究竟随机了什么，以及为什么这些随机项能提升真机鲁棒性。

第二批：Actuator / Delay Modeling

很多部署能不能站住，就卡在执行器模型和延迟建模上，这一组特别值得深挖。

第三批：System Identification

重点看辨识不是为了找到唯一最准参数，而是为了缩小仿真和真机之间最致命的失配。

第四批：Deployment Reports

多看工程总结、supplementary 和失败经验，很多真正有用的信息不在 headline，而在这些细节里。

6. Humanoid：人形机器人专项阅读主线

这里不是重复控制、RL、IL，而是看它们在人形系统里如何真正缠在一起工作。

Locomotion

先打透站立、行走、跑跳、抗扰和复杂地形这条主战场，别急着横向铺太开。

Motion Style / Skill Prior

重点看 reference motion、style prior、AMP、tracking reward 这些如何让动作更自然。

Whole-body Skills

开始看上肢参与、全身协调、多接触交互和更复杂的技能结构。

Hardware & Deployment

真正决定工程直觉上限的，很多时候不是模型名字，而是部署细节、系统限制和失败案例。

7. 推荐阅读顺序

如果你当前主攻 locomotion

先 Motion Control → RL → Sim2Real → Humanoid，再回过头补 IL 和动作先验路线。

如果你当前主攻技能学习

先 IL → RL → Humanoid，再重点看 motion prior、reference tracking 和 multi-skill 组合。

如果你当前骨架还不稳

先补控制主线，再往学习方法扩。否则论文越看越多，结构越看越散。

如果你怕读散

每次只打一条主线，先吃透代表作，再回项目里写结构化总结，不要全地图乱跳。

8. 一句话总结

论文导航真正要做的，不是告诉你“哪里有论文”，而是告诉你“为什么先读这组、读完应该获得什么理解、接下来该往哪条线推进”。

📚 论文导航