📚 论文导航

这页不是“论文仓库目录”,而是帮助你按问题、按主线、按进入顺序去读论文,尽量避免收藏一堆、真正消化很少的典型陷阱。

1. 怎么使用这页

先按问题走,不要按热度走

先明确你是想补运动控制、强化学习、模仿学习、sim2real,还是人形专项,再进入对应主线。

先抓代表作,不要一口吞百科

每条线先抓 2 到 4 篇真正奠基或改变你理解框架的代表工作,读透比堆数量更值钱。

读完必须回结构页

论文不是目的,结构化理解才是目的。每次读完一组论文,都应该回模块页或关系页重新整理知识框架。

2. Motion Control:运动控制论文主线

适合先打控制骨架的人。控制主线越稳,后面看 RL / IL 越不容易飘。

第一批:WBC / QP / TSID

重点读任务优先级、约束组织、接触力分配、全身协调这条线,这是人形控制论文的基本语法。

第二批:MPC / Optimal Control

重点看如何把目标、动力学和约束写成优化问题,以及为什么这条线在人形 locomotion 里长期有生命力。

第三批:Learning-augmented Control

重点看学习方法怎样增强控制器,而不是粗暴替代控制器。

3. RL:机器人强化学习论文主线

适合想真正理解 humanoid locomotion、鲁棒训练和策略部署的人。

第一批:PPO / Locomotion 代表作

重点看 observation、action、reward、并行仿真和训练范式,而不是只看“几分钟学会走”。

第二批:Robust Locomotion / Disturbance Recovery

重点看抗扰、复杂地形、变速和恢复策略,不要只盯平地稳定步行。

第三批:Motion Prior / Reference Tracking

当你关心“既稳又自然”的行为时,这条线很关键,它会把 RL 和 IL 真正接起来。

4. IL:机器人模仿学习论文主线

适合想利用演示、动捕、遥操作、参考动作和先验行为来加速技能学习的人。

第一批:Behavior Cloning / DAgger

这是最基础也最重要的起点,重点不是背定义,而是看清 deployment distribution mismatch 到底怎么出现。

第二批:Motion Imitation / DeepMimic / AMP

这一批特别适合人形机器人语境,重点看动作先验、参考跟踪和自然行为生成。

第三批:Diffusion / Sequence Policy

适合在长时序、多峰动作分布、复杂技能表达这类问题上进一步扩展理解。

5. Sim2Real:从仿真到真机

这是最容易被一句“成功迁移到真机”轻描淡写带过,但最能体现工程含金量的部分。

第一批:Domain Randomization

重点看随机化究竟随机了什么,以及为什么这些随机项能提升真机鲁棒性。

第二批:Actuator / Delay Modeling

很多部署能不能站住,就卡在执行器模型和延迟建模上,这一组特别值得深挖。

第三批:System Identification

重点看辨识不是为了找到唯一最准参数,而是为了缩小仿真和真机之间最致命的失配。

第四批:Deployment Reports

多看工程总结、supplementary 和失败经验,很多真正有用的信息不在 headline,而在这些细节里。

6. Humanoid:人形机器人专项阅读主线

这里不是重复控制、RL、IL,而是看它们在人形系统里如何真正缠在一起工作。

Locomotion

先打透站立、行走、跑跳、抗扰和复杂地形这条主战场,别急着横向铺太开。

Motion Style / Skill Prior

重点看 reference motion、style prior、AMP、tracking reward 这些如何让动作更自然。

Whole-body Skills

开始看上肢参与、全身协调、多接触交互和更复杂的技能结构。

Hardware & Deployment

真正决定工程直觉上限的,很多时候不是模型名字,而是部署细节、系统限制和失败案例。

7. 推荐阅读顺序

如果你当前主攻 locomotion

先 Motion Control → RL → Sim2Real → Humanoid,再回过头补 IL 和动作先验路线。

如果你当前主攻技能学习

先 IL → RL → Humanoid,再重点看 motion prior、reference tracking 和 multi-skill 组合。

如果你当前骨架还不稳

先补控制主线,再往学习方法扩。否则论文越看越多,结构越看越散。

如果你怕读散

每次只打一条主线,先吃透代表作,再回项目里写结构化总结,不要全地图乱跳。

8. 一句话总结

论文导航真正要做的,不是告诉你“哪里有论文”,而是告诉你“为什么先读这组、读完应该获得什么理解、接下来该往哪条线推进”。