E-TTS：机器人操控的测试时缩放新范式

来源：arXiv (cs.RO/cs.AI) | **发布日期**: 2026-06-25 | **链接**: https://arxiv.org/abs/2606.27268 · 2026-06-28

来源: arXiv (cs.RO/cs.AI) | 发布日期: 2026-06-25 | 链接: https://arxiv.org/abs/2606.27268

文章摘要

本文提出 E-TTS（Embodied Test-Time Scaling），一种模块化的测试时缩放框架，通过历史感知迭代 refinement 和视觉-语言验证器提升机器人操控能力。核心机制：推理-动作联合采样（pairwise 方式）、历史缓冲存储上下文供验证器评估候选动作，形成闭环迭代优化。在4个基准、6种环境、3种机器人形态、4个基础 VLA 模型上验证，无需额外专家数据或重训练，即可在模拟环境中提升最高 33.14%，真实世界 26.62%。

为什么重要

测试时缩放（Test-Time Scaling）是当前 LLM 领域的热点，但具身任务（机器人操控）的测试时 scaling 研究很少。本文首次系统解决两个挑战：推理 scaling 机制（之前未被研究）和历史信息利用（现有方法只依赖当前观测）。E-TTS 证明了"边做边想"的闭环策略在机器人领域同样有效。

关键要点

核心创新：历史感知闭环迭代 refinement；推理-动作 joint sampling + pairwise scoring
模块化设计：每个组件独立可组合，可根据任务需求灵活配置
实验覆盖：4基准 × 6环境 × 3机器人 × 4 VLA 基座模型
效果：无需重训练，模拟 +33.14%，真实世界 +26.62%
意义：为"边推理边操控"的机器人 Agent 提供了可复用的测试时 scaling 框架