多语言推理级联需要保留原始问题——一个无需训练的简单方法

来源：arXiv (cs.CL) | **发布日期**: 2026-06-25 | **链接**: https://arxiv.org/abs/2606.27306 · 2026-06-28

来源: arXiv (cs.CL) | 发布日期: 2026-06-25 | 链接: https://arxiv.org/abs/2606.27306

文章摘要

翻译级联（Translate-think-translate）是多语言推理的常用方法，但每一跳都会丢弃后续阶段可能需要的信息——包括文化背景、语域、歧义消解线索。本文提出 context-aware translation cascade，一种无需训练的干预方法：在最终翻译阶段额外提供原始问题、英文翻译问题和推理链。跨越9个多语言基准、3个模型、285种高低资源语言评估后，在开放式生成任务上显示显著提升。核心发现：原始语言问题携带了绝大部分有益上下文，保留到流水线末端是简单有效的默认策略。

为什么重要

当前多语言推理系统大量使用翻译级联——将查询翻成英文→推理→答案翻回。这种方法结构上存在信息损失，且之前没人系统研究过如何在不重训练的情况下缓解这一问题。本文提供了一个零成本的干预手段：把原始问题一直保留到最后翻译阶段即可，且对所有语言、所有模型、所有任务类型普遍有效。

关键要点

问题根源：每级翻译丢弃信息（文化语境、歧义线索等），误差会逐级传播放大
解决方案：在最终翻译阶段同时提供原始问题、英文问题、推理链，让翻译器看到完整上下文
跨语言覆盖：285种语言（高/中/低资源）；3个主流模型；9个多语言基准
核心发现：原始语言问题携带绝大部分有益上下文——简单保留即有效
意义：为生产级多语言 AI 系统提供了一个无需训练、无需改变模型的即插即用方案