多语言推理级联需要保留原始问题——一个无需训练的简单方法
来源: arXiv (cs.CL) | 发布日期: 2026-06-25 | 链接: https://arxiv.org/abs/2606.27306
文章摘要
翻译级联(Translate-think-translate)是多语言推理的常用方法,但每一跳都会丢弃后续阶段可能需要的信息——包括文化背景、语域、歧义消解线索。本文提出 context-aware translation cascade,一种无需训练的干预方法:在最终翻译阶段额外提供原始问题、英文翻译问题和推理链。跨越9个多语言基准、3个模型、285种高低资源语言评估后,在开放式生成任务上显示显著提升。核心发现:原始语言问题携带了绝大部分有益上下文,保留到流水线末端是简单有效的默认策略。
为什么重要
当前多语言推理系统大量使用翻译级联——将查询翻成英文→推理→答案翻回。这种方法结构上存在信息损失,且之前没人系统研究过如何在不重训练的情况下缓解这一问题。本文提供了一个零成本的干预手段:把原始问题一直保留到最后翻译阶段即可,且对所有语言、所有模型、所有任务类型普遍有效。
关键要点
- 问题根源:每级翻译丢弃信息(文化语境、歧义线索等),误差会逐级传播放大
- 解决方案:在最终翻译阶段同时提供原始问题、英文问题、推理链,让翻译器看到完整上下文
- 跨语言覆盖:285种语言(高/中/低资源);3个主流模型;9个多语言基准
- 核心发现:原始语言问题携带绝大部分有益上下文——简单保留即有效
- 意义:为生产级多语言 AI 系统提供了一个无需训练、无需改变模型的即插即用方案