DeepL 发布语音直译功能「Voice-to-Voice」:从翻译工具迈向跨场景语言基础设施

DeepL 于 2026 年 4 月 16 日正式发布实时语音直译功能「Voice-to-Voice」。该功能可以将说出的语音直接翻译成另一种语言的语音,面向在线会议、线下面对面交流以及通过 API 集成的客户服务等多种场景,被视为将翻译从单点工具升级为企业级语言基础设施的关键举措。

从文本翻译到「语音原生」AI

「DeepL Voice-to-Voice」的核心特点,是实现了语音到语音的直接实时翻译。与传统流程中「语音 → 文字 → 翻译 → 语音」的多步处理不同,Voice-to-Voice 以语音为起点和终点,在系统内部直接完成跨语言的语音转换。

这种设计不再以文本为中心,而是围绕语音本身构建,可被视为一种「语音原生 AI」架构。DeepL 创始人兼 CEO 雅雷克·库特罗夫斯基(Jarek Kutylowski)表示,DeepL 已经进入「实时语音沟通」这一新的翻译前沿,让人们能够用自己的母语自然表达,同时与使用其他语言的人顺畅交流。

覆盖会议、面对面交流与 API 的一体化设计

DeepL Voice-to-Voice 并非单一产品,而是围绕不同使用场景提供了一整套功能模块。

Voice for Meetings 面向在线会议场景,可在 Microsoft Teams、Zoom 等会议工具中提供实时语音翻译。与会者可以各自使用母语发言,并以自己的语言听到对方的内容。该功能计划自 6 月起开放早期访问。

Voice for Conversations 支持移动端和 Web 端,适用于不便安装应用的环境,提供跨平台的对话体验。该功能已于发布当日正式上线。

Group Conversations 面向培训、研讨会等多人数场景。参与者可通过扫描二维码加入,在多台设备上同时接收实时语音翻译,适合课堂、工作坊等环境。该功能预计于 4 月 30 日开始提供。

此外,通过 Voice-to-Voice API,企业可以将语音翻译能力嵌入到联络中心系统或内部业务应用中,将现有工作流程与实时语音翻译直接打通。

上述功能基于同一技术底座构建,旨在在会议、面对面交流以及企业业务系统之间,形成统一的多语言沟通基础设施。

面向企业的专业化与可定制能力

DeepL Voice 在设计上重点考虑了企业级使用需求,内置多项优化功能。

其中,新加入的术语自定义功能,可以对专业术语、产品名称、公司名称、人名等进行统一管理。DeepL 既有的翻译术语表已与该功能打通,可在整场对话中保持术语和表述的一致性。

系统还针对语速较快的发言和复杂语境进行了优化,力求在理解说话者意图的基础上给出更准确的翻译结果。

通过这些能力,DeepL 不仅提升了翻译本身的准确度,也更贴近真实业务环境对稳定性和专业度的要求。

性能评估与市场竞争位置

据语言服务市场调研机构 Slator 的盲测结果显示,DeepL Voice 在专业语言工作者中的评价较高。

在该项评估中,96% 的参与者在对比 Google、Microsoft、Zoom 的标准翻译方案后,更倾向选择 DeepL,主要原因在于其流畅度和对上下文的把握能力。

具体评分方面,DeepL 在 Zoom 场景中的得分为 96.4 / 100,在 Microsoft Teams 场景中的得分为 96.3 / 100,均高于主要竞品。

企业导入案例:从「会翻译」到「敢发言」

在先锋株式会社(Pioneer)的导入案例中,DeepL Voice 被认为显著缓解了员工对英语能力的依赖所带来的沟通障碍。

过去,员工在需要用外语表达复杂想法时往往有所顾虑,而在可以使用母语发言的环境下,讨论变得更加充分,决策速度也随之提升。

在这一视角下,翻译不再只是辅助工具,而是支撑业务运转效率的基础设施。

从翻译工具到企业级语言平台

与语音翻译功能同步,DeepL 还推出了「下一代 DeepL 翻译平台」,面向企业提供端到端的翻译管理能力。

该平台旨在帮助企业统一管理翻译流程,核心能力包括:翻译流程自动化、质量可视化以及持续改进机制。

在这一平台中,企业现有系统中的内容可以被即时翻译,并自动应用既定的术语和语气风格,从而减少人工调整的工作量。

平台还提供翻译结果的可信度评估功能,能够标记出需要人工复核的部分。同时,用户的编辑反馈会被系统学习,用于持续适配各企业自身的语境和表达习惯。

在高价值业务场景中的应用

在 Mondelez International(亿滋国际)等企业中,DeepL 的语言 AI 已被嵌入到日常业务流程中,用于支持并购(M&A)、法务等对保密性要求极高的工作。

借助该系统,这类原本耗时且成本高昂的翻译流程得以简化,同时在速度与安全性之间取得平衡,并逐步在整个组织范围内推广。

库特罗夫斯基指出,企业真正面临的问题并非「能否翻译」,而是传统翻译运营模式缺乏可扩展性。通过将翻译能力集中到一个 AI 优先的多语言平台中,企业可以摆脱对零散工具和外部服务的依赖,更快速地获取高质量翻译,并在此基础上构建统一的语言基础设施。


分享:


发表评论

登录后才可评论。 去登录