先按问题走,不要按热度走
先明确你是想补运动控制、强化学习、模仿学习、sim2real,还是人形专项,再进入对应主线。
这页不是“论文仓库目录”,而是帮助你按问题、按主线、按进入顺序去读论文,尽量避免收藏一堆、真正消化很少的典型陷阱。
先明确你是想补运动控制、强化学习、模仿学习、sim2real,还是人形专项,再进入对应主线。
每条线先抓 2 到 4 篇真正奠基或改变你理解框架的代表工作,读透比堆数量更值钱。
论文不是目的,结构化理解才是目的。每次读完一组论文,都应该回模块页或关系页重新整理知识框架。
适合先打控制骨架的人。控制主线越稳,后面看 RL / IL 越不容易飘。
先把控制语言建立起来,再看 WBC、MPC、TSID、centroidal dynamics 等论文会顺很多。
重点读任务优先级、约束组织、接触力分配、全身协调这条线,这是人形控制论文的基本语法。
重点看如何把目标、动力学和约束写成优化问题,以及为什么这条线在人形 locomotion 里长期有生命力。
重点看学习方法怎样增强控制器,而不是粗暴替代控制器。
适合想真正理解 humanoid locomotion、鲁棒训练和策略部署的人。
先理清 state、action、reward、训练系统和 sim2real,再看具体论文,不然很容易只记住算法名字。
重点看 observation、action、reward、并行仿真和训练范式,而不是只看“几分钟学会走”。
重点看抗扰、复杂地形、变速和恢复策略,不要只盯平地稳定步行。
当你关心“既稳又自然”的行为时,这条线很关键,它会把 RL 和 IL 真正接起来。
适合想利用演示、动捕、遥操作、参考动作和先验行为来加速技能学习的人。
先建立对 BC、distribution shift、retargeting 和参考动作跟踪的理解,再读论文会更清楚。
这是最基础也最重要的起点,重点不是背定义,而是看清 deployment distribution mismatch 到底怎么出现。
这一批特别适合人形机器人语境,重点看动作先验、参考跟踪和自然行为生成。
适合在长时序、多峰动作分布、复杂技能表达这类问题上进一步扩展理解。
这是最容易被一句“成功迁移到真机”轻描淡写带过,但最能体现工程含金量的部分。
重点看随机化究竟随机了什么,以及为什么这些随机项能提升真机鲁棒性。
很多部署能不能站住,就卡在执行器模型和延迟建模上,这一组特别值得深挖。
重点看辨识不是为了找到唯一最准参数,而是为了缩小仿真和真机之间最致命的失配。
多看工程总结、supplementary 和失败经验,很多真正有用的信息不在 headline,而在这些细节里。
这里不是重复控制、RL、IL,而是看它们在人形系统里如何真正缠在一起工作。
先打透站立、行走、跑跳、抗扰和复杂地形这条主战场,别急着横向铺太开。
重点看 reference motion、style prior、AMP、tracking reward 这些如何让动作更自然。
开始看上肢参与、全身协调、多接触交互和更复杂的技能结构。
真正决定工程直觉上限的,很多时候不是模型名字,而是部署细节、系统限制和失败案例。
先 Motion Control → RL → Sim2Real → Humanoid,再回过头补 IL 和动作先验路线。
先 IL → RL → Humanoid,再重点看 motion prior、reference tracking 和 multi-skill 组合。
先补控制主线,再往学习方法扩。否则论文越看越多,结构越看越散。
每次只打一条主线,先吃透代表作,再回项目里写结构化总结,不要全地图乱跳。
论文导航真正要做的,不是告诉你“哪里有论文”,而是告诉你“为什么先读这组、读完应该获得什么理解、接下来该往哪条线推进”。