E-TTS:机器人操控的测试时缩放新范式
来源:arXiv (cs.RO/cs.AI) | **发布日期**: 2026-06-25 | **链接**: https://arxiv.org/abs/2606.27268 · 2026-06-28
来源: arXiv (cs.RO/cs.AI) | 发布日期: 2026-06-25 | 链接: https://arxiv.org/abs/2606.27268
文章摘要
本文提出 E-TTS(Embodied Test-Time Scaling),一种模块化的测试时缩放框架,通过历史感知迭代 refinement 和视觉-语言验证器提升机器人操控能力。核心机制:推理-动作联合采样(pairwise 方式)、历史缓冲存储上下文供验证器评估候选动作,形成闭环迭代优化。在4个基准、6种环境、3种机器人形态、4个基础 VLA 模型上验证,无需额外专家数据或重训练,即可在模拟环境中提升最高 33.14%,真实世界 26.62%。
为什么重要
测试时缩放(Test-Time Scaling)是当前 LLM 领域的热点,但具身任务(机器人操控)的测试时 scaling 研究很少。本文首次系统解决两个挑战:推理 scaling 机制(之前未被研究)和历史信息利用(现有方法只依赖当前观测)。E-TTS 证明了"边做边想"的闭环策略在机器人领域同样有效。
关键要点
- 核心创新:历史感知闭环迭代 refinement;推理-动作 joint sampling + pairwise scoring
- 模块化设计:每个组件独立可组合,可根据任务需求灵活配置
- 实验覆盖:4基准 × 6环境 × 3机器人 × 4 VLA 基座模型
- 效果:无需重训练,模拟 +33.14%,真实世界 +26.62%
- 意义:为"边推理边操控"的机器人 Agent 提供了可复用的测试时 scaling 框架