Physical/Embodied Intelligence
views
| comments
范围说明
Physical/Embodied Intelligence 关注智能体如何在真实世界中感知、规划并执行动作,核心问题是把数据、模型、控制器与物理约束连接成稳定闭环。
关键问题
- 数据、模型、控制器三者怎样形成稳定闭环?
- sim2real 的主要瓶颈是数据覆盖还是策略表达?
- 世界模型怎样才能真正为行动和规划服务?
主题路线
Human Video Robot Data Generation
> 这条主题关注如何把 human videos 编译成机器人能直接训练或执行的数据,而不是只把人类视频当作预训练语料。
2026-05-16
打开主题
最近材料
论文
π0.7: a Steerable Generalist Robotic Foundation Model with Emergent Capabilities
π0.7 的关键价值不只是把模型继续做大,而是把“可控的通才机器人策略”往前推了一步。它试图解决的核心问题是:当训练数据越来越杂时,机器人基础模型怎样既能吃下示范、失败轨迹、人类视频和网页数据,又不在推理时退化成平均化、含糊的动作。作者给出的答案是把“怎么做”也写进 prompt,包括子任务语言、子目标图像、质量/速度/错误等 episode metadata,让模型学会在多模态上下文里被 steer。