最近,通义APP 翻译能力全面升级。官方信息显示,本次通义APP攻克了文字翻译、同传翻译、文档翻译、图片翻译四大核心场景,打造面向个人与专业用户的“最强翻译综合体”。
针对本次升级的诸多功能,「电厂」选取多个实际用例、分多角度进行实测。
结果显示,不论是小众语言文本翻译,还是在同声传译、跨语言文档翻译、图片翻译等生产力场景下,升级后的通义APP都能精准理解翻译指令,以及有效处理专业术语、上下文语义一致性等复杂语言问题,在专业性表达、语义一致性等方面表现突出。
支持119种语言/方言翻译,让出游不再“难行”
据官方信息,升级后的通义APP新版本支持多达119种语言与方言的文字互译,涵盖印欧、亚非、南亚等多语种体系,并且着力打磨复杂语义处理能力。
提升语言覆盖密度,在大模型应用领域并不是一个容易的选择。究其原因,作为世界第一大语言的英语既是当下互联网及科研领域的主流语言,又有丰富充足的训练语料,因此是各大AI翻译应用积累用户规模、形成数据飞轮的最好选择。
但在日常使用场景下,“小众”语言无疑同样存在用户市场。通义APP选择“看见”这部分人的需求,不仅事涉回报比,更意味着对技术的极大挑战。
以隶属印欧语系的葡萄牙语为例,其是拥有约2.6亿母语或官方使用者的世界第六大语言,也是在巴西、葡萄牙等旅游胜地广泛应用的“区域性热门语言”。即便如此,葡语翻译在大模型应用领域也绝非热门功能。
为了测评通义APP在小众语言翻译领域的语义准确度,本次「电厂」也以葡萄牙语为例,准备了葡语版本的机场问询台常用问答、机场广播素材,并将其输入通义APP进行翻译为中文。
结果显示,通义APP准确地捕捉和翻译出了地名、指引路线、登机口变更、登机时间等关键信息,足以满足旅客的基本对话需求。
接下来,电厂还测试了通义APP对隶属壮侗语系的老挝语的翻译能力。
公开信息显示,老挝语的语序、表达均与汉语差异极大。比如不同于中文常用的“形容词+名词”的语法结构、老挝语通常将形容词放在名词之后;由于文化背景不同,许多老挝语表达在中文中并没有直接可对照的词汇……
「电厂」预设了一个旅行中常见的车站问答情景,将对话输入通义APP。翻译结果显示,在对问答语气的理解、翻译的准确性、金钱单位等专有名词的理解方面,通义APP的表现同样优秀。
特别指出的是,不只是日常场景,在强专业性、高难度的翻译场景下,通义APP的表现也较为优异。
以马来语为例,这是一门属于南岛语系的语言,目前广泛应用于马来西亚、新加坡、印度尼西亚、文莱等热带国家。
我们将流行于马来语地区的谚语“air yang tenang jangan disangka tiada buaya”输入通义APP及其他多个模型进行翻译。
通义APP给出的答案为“静水莫当无鳄鱼”,兼顾了精炼、准确两大要素;其他模型给出的答案则大多局限于字面意思理解,如“别以为平静的水中没有鳄鱼”“风平浪静,别以为没有鳄鱼”。
打造专属随身的免费同传服务,不限时间及次数
除了文本翻译,升级后的通义APP更支持10大语种同传翻译。
具体来说,通义APP可以识别包含中文(普通话)、英语、日语、韩语、粤语、德语、法语、俄语、意大利语、西班牙语这10大语言,并能够翻译出中文、英语、日语、韩语这4大语言。
同声传译,又称为同步口译,是一种高级翻译形式,要求译员在讲话者发言的同时、几乎同步地将其所说内容翻译成另一种语言。当前世界上95%的国际高端会议都采用同声传译的方式翻译,由于难度极高,同传有“翻译之王”“翻译皇冠之上的明珠”之称,同传师也供不应求、日薪也高达万元之上。
这样的背景下,通义APP同传功能的推出,意味着每个用户都可以拥有一个专属、随身的同传师。
针对同传功能,「电厂」选取了最为常用的中、英文场景,分别测试了通义APP的英传中、中传英功能。
在英传中场景下,「电厂」选取了斯坦福大学首位红杉讲席教授、美国国家工程院院士、华裔人工智能科学家李飞飞的TED演讲《有了空间智能,AI将会理解现实世界》。
在整个同传过程中,通义APP精准地捕捉到了演讲者的语气、对演讲内容进行合理分段,并实时将英文转化为符合中文语序的译文,同传的中文内容阅读流畅、相较英文原文十分准确。
在中传英场景下,「电厂」让通义APP翻译了2025年6月21日晚间新闻联播天气预报的内容。
结果显示,在总时长约1分钟50秒的主持人口播过程中,通义APP几乎一字不差地识别了播报内容,在顿挫的语气中准确完成了长句识别等任务。
同传翻译过程中,通义APP 几乎不存在启动延迟,也能够合理翻译长句和准确预判译文结构。
特别要指出的是,相较同类型产品,通义APP同传功能不限时、不限次、完全免费,完全摆脱了时间限制与付费门槛。
告别DeepL,一个APP实现专业级文档/图片翻译
在生产力场景中,通义APP全新升级的翻译能力也能派上用场。针对跨语言文档处理需求,可以提供专业级的文档翻译体验。
以英文文本阅读为例,「电厂」将一份索尼NEX-7 微单相机英文版快速使用说明输入了通义APP。后者在不到一分钟的时间内完成了全部64页内容的翻译处理。
可以看到,翻译文档不仅实现了用词的精准,而且还保持了和原文档一致的排版。此外通义APP还完成了文中表格内容的翻译处理。
在全文翻译完毕后,通义APP还自动生成了全文总结与脑图,帮助用户高效掌握文档核心信息。
同时,本次通义APP全面升级了图像场景下的多语言理解与生成能力,其图片翻译体验同样达到了专业级别。在菜单、图文海报等应用场景下,中英互译、一键出图不再是难题。
以一张英文摄像机功能使用说明图为例,在图片翻译页面将其输入后,点击“对照原图查看译文”按钮,即可生成一张中文版本的实用功能说明图。
可以看到,区别于传统OCR(XXX)工具仅完成“翻译单词”的任务,通义APP还保留了图片原本的排版结构。
左-英文原图,右-中文翻译图片结果
2023年7月,通义APP上正式上架应用市场,并在经历了一年多时间的稳定更新后,于2024年末从阿里云分拆、并入阿里智能信息事业群。
为了更加贴近用户,通义APP也悄然完成了一系列“改头换面”,比如其在上半年完成了交互设计的全面改版、只为打造更加易用的用户界面,曾引起市场广泛关注。但这或许只是第一步。
翻译功能的上线,折射出通义APP不止要“好看易用”,还希望在用户深度使用的诸多生活和生产力场景中提供价值。随着底层模型技术能力升级和产品打磨深入,通义APP的“进化”远未停止,未来有望为AI智能应用服务市场带来更多新鲜感。
评论