E-TTS:机器人操控的测试时缩放新范式

来源: arXiv (cs.RO/cs.AI) | 发布日期: 2026-06-25 | 链接: https://arxiv.org/abs/2606.27268

文章摘要

本文提出 E-TTS(Embodied Test-Time Scaling),一种模块化的测试时缩放框架,通过历史感知迭代 refinement 和视觉-语言验证器提升机器人操控能力。核心机制:推理-动作联合采样(pairwise 方式)、历史缓冲存储上下文供验证器评估候选动作,形成闭环迭代优化。在4个基准、6种环境、3种机器人形态、4个基础 VLA 模型上验证,无需额外专家数据或重训练,即可在模拟环境中提升最高 33.14%,真实世界 26.62%。

为什么重要

测试时缩放(Test-Time Scaling)是当前 LLM 领域的热点,但具身任务(机器人操控)的测试时 scaling 研究很少。本文首次系统解决两个挑战:推理 scaling 机制(之前未被研究)和历史信息利用(现有方法只依赖当前观测)。E-TTS 证明了"边做边想"的闭环策略在机器人领域同样有效。

关键要点