多语言推理级联需要保留原始问题——一个无需训练的简单方法

来源: arXiv (cs.CL) | 发布日期: 2026-06-25 | 链接: https://arxiv.org/abs/2606.27306

文章摘要

翻译级联(Translate-think-translate)是多语言推理的常用方法,但每一跳都会丢弃后续阶段可能需要的信息——包括文化背景、语域、歧义消解线索。本文提出 context-aware translation cascade,一种无需训练的干预方法:在最终翻译阶段额外提供原始问题、英文翻译问题和推理链。跨越9个多语言基准、3个模型、285种高低资源语言评估后,在开放式生成任务上显示显著提升。核心发现:原始语言问题携带了绝大部分有益上下文,保留到流水线末端是简单有效的默认策略。

为什么重要

当前多语言推理系统大量使用翻译级联——将查询翻成英文→推理→答案翻回。这种方法结构上存在信息损失,且之前没人系统研究过如何在不重训练的情况下缓解这一问题。本文提供了一个零成本的干预手段:把原始问题一直保留到最后翻译阶段即可,且对所有语言、所有模型、所有任务类型普遍有效。

关键要点