百度翻译日活大涨40%:技术十年沉淀,爆发恰逢其时

来源:A5专栏 时间:2020-05-11

百度翻译日活迎来新一轮逆势增长:2020年Q1日活较上一季度环比增长10%,较去年Q1同比增长40%,这还是在在业内大盘增长整体放缓的前提下。

同时,百度翻译目前可支持语种扩充到200个,翻译方向近4万个,每天来自世界各地的翻译请求字符量超过千亿,相当于2000部大英百科全书,平均每秒钟就要翻译超过1百万字符。

百度翻译日活的增长,我们或可将归结为疫情的推动。

一方面是学生们在家学习、在线学习,有了更多时间通过手机和电脑使用百度翻译(在校学习期间K12学生不能使用手机);另一方面,疫情背景下,跨过的多语言沟通变得更加重要,跨语言的信息分享变得紧迫,百度翻译正好满足了突然集中爆发的市场需求。

当然,这并不是百度布局翻译方向十年以来能持续保持增长的全部,在翻译之外,百度翻译还藏着更多“秘密”。

好的翻译产品,从来不只是“翻得准确”

在过去很长一段时间内,“准确率”是评判一款翻译产品是否优秀的唯一标准,因而所有的翻译产品都在准确率上“做文章”,从各个维度的“成绩”来说明自己在这方面有多厉害,但事实上,随着越来越多AI技术融入到翻译产品,其体验好坏的评判维度变得多元起来。

首先,在翻译的广度和速度方面,要不断扩充与突破。

前者不应只局限在主流语言的互通上,而应寻求更大范围内的多语言互译,做到真正意义上的“与世界对话”;后者的最高境界是同声传译。

道理大家都懂,但做起来才知道为什么这两项能力不是每家都有,其原因就在于太难了。

翻译广度牵涉到小语种语言的训练资源,全球5000多种语言,有一半的语言使用者不到万人,很大一部分小语种语言的训练数据只有几万条甚至几千条,难以迈过翻译的门槛。

翻译速度牵涉到时间延迟和翻译质量难以平衡的难题,导致很多翻译产品的同声传译体验很难尽人所意。

百度翻译通过模型上的创新,比如在多语言翻译技术上,提出基于多任务学习的翻译模型、多智能体联合学习模型等,使多个语言可以共享模型表示,再经过回译技术进行数据增强,使得1个季度之内,翻译语种扩充了近7倍,目前支持200种语言互译,是全球支持语种数量最多的翻译系统。

在同声传译领域上,百度翻译又相继提出了可控时延的翻译模型、语义单元驱动的上下文感知翻译模型等,在技术获得了突破,不但开放了全球首个面向真实场景的中英文同传数据集,还举办了首届同传评测,促进本领域技术发展。

还有一个值得一说的案例,由前沿科技领域顶级科学家参与的iCANX Talks(全球前沿科技直播)主办方之前尝试了多款翻译产品,对翻译效果都不甚满意,直到近期才更换为百度翻译。

其次,翻译产品的使用场景不应只局限在原始的文本或语音输入场景中,还应更加丰富和多元。

在技术不断强化的今天,用户追求的产品体验变得更加全面和多样,如果只有“结果”而没有细节丰满的过程,哪怕有100%的准确率,也因为一个字一个字地输入而产生干涩的使用感受,市场不会买账,用户也不会买单。

百度翻译除了文本和语音这两种常规的输入翻译功能之外,其PC文档翻译功能支持word、pdf、ppt、excel等多种格式,支持中英、中日、中韩互译,一键上传,实现不限字数快速翻译,保留文档样式排版,原文译文对照查看,并支持免费导出,提升文档翻译效率。

视频翻译领域,百度翻译携手人人译视界联合推出了百度视频翻译平台,只需上传视频文件并填写必要信息,即可一站式获取AI和人工视频翻译结果。

除此之外,百度翻译在拍照翻译、实景AR翻译、对话翻译等场景中通过AI技术的融合持续在对体验细节进行改善。

可以预料的是,来源于百度的AI技术基底,百度翻译在帮助用户更好地完成翻译这件事上,未来或将增加更多创新性的技术体验。

最后,要从“语言转换”的狭隘产品认知中跳出。

“语言转换”是翻译产品的基本盘,但如果只盯着“语言转换”,就将翻译产品划定了一个局限的牢笼。

借助着AI的能量,翻译产品的路子可以变得更宽,也更能符合当前所有APP都开始提供关联多样化服务的趋势。

如何理解?

百度翻译在业界首先推出了第四代AI词典,可以为用户提供个性化、可互动、智能化、视频化的“生动”体验,主要增加了面向学生群体的单词考频及题型大数据,单词讲解及情景演绎小视频,相关知识内容个性化推荐,AI互动跟读评测,多模态智能取词等功能。

例如,产品启动时,用户只要完成个人身份及目标(或兴趣)的填写,就能够体验到资讯流带来的专属定制化推荐。

又例如,在学习场景下,能够根据用户的查词历史为用户智能推荐讲解视频;在英语学习十分重要的发音方面,百度翻译能够对用户的跟读进行智能评分纠错。

文章开头提到,疫情期间让学生们有了更多使用百度翻译的机会,如果说这是特殊情况下的被动拉新,那么通过第四代AI词典的能力,百度翻译或将进一步强化用户粘性,从而形成对新增用户的留存,继续在后续竞争保持领跑。

从更开阔的视野来看,百度翻译某种程度上可以成为一种生活方式,在产品中内置与翻译相关的原创内容,在常规信息流(例如百度APP)之外给出了一个垂直的专业的信息获取方式。而与翻译相关的内容很多,旅行、人文、美食、探索,这些内容更深度也更体现翻译的生活化信息。

也正是因为在“准确率”之外,百度翻译丰富了翻译产品的体验细节,来自用户的反馈也是一面倒的好评,百度翻译APP的下载评论区中大批网友写道:“文档翻译功能非常好用,把文档拖进翻译框里数秒就能翻译出保留原格式的译文,节省了我们数倍的工作时间”、“在学术文章上百度翻译表现非常出色!”“全篇拍照翻译厉害到飞起”……

产品体验是基础,社会责任是高度

体验是一款优秀翻译产品的基本盘,但若要够领跑行业,还在于其通过技术建立起行业优势之后所释放出的社会价值。

在目前正在进行的疫情当中,百度翻译就向公众积极提供自己的能力,将中国抗疫经验精准推向全球,以及服务防疫志愿者团队,开放翻译医疗定制服务,体现出一家有责任企业的社会担当。

在这里不得不提到百度翻译的多领域翻译技术,采用预训练+精细化训练、以及领域自适应方法,研发了领域定制翻译引擎。

在疫情发生初期,百度翻译第一时间免费对外开放了生物医药垂直领域翻译。深度定制生物医药领域中英互译模型,截止目前已累计服务上百万用户,累计翻译字符达7.6亿。

此外,百度翻译还紧急成立了专项小组,两天内开发搭建并免费开放了医疗领域定制化翻译产品,同时为千余名防疫志愿者,定向提供单独医疗领域页面,包括免费的术语定制、图片翻译、文档翻译等功能。

随着疫情在全球范围的蔓延,百度翻译新增了包括波斯语在内的172个语种,累计上线语种达200个,累计翻译方向约4万个,覆盖全球约180个国家的74亿人口,让疫情信息的共享更加平等和便捷。

为将防疫的“中国经验”及时分享出去,百度翻译不仅免费开放覆盖病毒、疫情、症状、防护等多维度重点词语的多语种疫情词典,为驰援海外抗疫的中国志愿者提供更准确的翻译结果,还携手中新视频、人人译视界,为国际疫情严峻地区提供防疫视频翻译,让“中国经验”在全球抗疫中发挥更大作用。

我们可以看出,百度翻译在疫情防控这件事上,不光提供自己的能力,还拉上了生态伙伴们一同参与,众人拾柴火焰高,推动的不光是防疫工作,更重要的是在更大的范围内提高了社会对防疫工作的重视以及对疫情危害的认知。

在提供翻译服务的对象上,也不仅限于中国的疫情防控工作,而是着眼全球,站在更高的公益高度,也正是因为如此,百度翻译收到了很多正面反馈:“文档翻译功能非常好用,把文档拖进翻译框里数秒就能翻译出保留原格式的译文,很惊喜,这个细节节省了我们数倍的工作时间”、 “在学术文章上百度翻译表现非常出色!”等。

疫情使得全球人民更加紧密团结起来共同面对困难,也让百度翻译获得了一次极好的历练机会。正是因为百度翻译近十年来兢兢业业打磨技术,不断创造满足用户需求的产品,提升体验,才得以在疫情期间获得口碑传播,引来日活增加。

通过助力防疫,展示出的是百度翻译的技术力量与产品情怀。

百度翻译的发展史,翻译产品的三级跳

上文主要分析的是百度翻译当前所构建起的护城河,然而当我们回头环视百度翻译的发展历程,可以发现正是在百度翻译的带动下,翻译产品这才完成从工具到产品,再到交互服务的三阶进化。

1、工具阶段:百度利用技术沉淀解决翻译工具从无到有

早在2010年初,百度就已经组建了机器翻译的核心研发团队,筹备在翻译领域有所作为。作为全球最大的中文搜索引擎,百度与“语言翻译”这件事天然亲近,仅一年半后的2011年6月,百度就正式推出了web端“百度翻译”产品。

这个阶段,可以认为是百度翻译利用了百度已有的技术积淀解决翻译工具从无到有的过程。

此时的百度翻译,使用的是百度自主研发的翻译核心技术,其原理是机器自动从大量语料中学习并自动生成翻译结果,不经过任何人工整理与编辑。

2、产品阶段:与AI融合带来更多翻译体验

随着移动互联网时代到来,把PC端的工具变成移动端的随身产品成为一时的浪潮,2013年2月百度翻译发布Android客户端(iOS在半个月后发布),首次在Android平台上支持离线翻译应用。

这一过程,是翻译产品与AI逐步结合,带来更多翻译体验的过程。

百度翻译背靠百度强大的AI技术,将AI能力与产品逐步融合,既可以认为是领先行业、获取竞争优势的举动,也可以看作在为整个翻译产品门类与AI融合“探路”。

3、交互服务阶段:围绕用户、内容、服务的多维度融合

随着AI渗透的不断深入,百度翻译在“翻译”这件事上的智能化程度大大提高。

比如百度翻译推出的第四代AI词典实现了专属定制化内容推送与服务的融合,甚至还能为用户的英语学习提供辅助服务。

从以上三个阶段跨越看出,行业与百度翻译一样,也在经历从翻译得更好,到翻译得更便利,再到翻译有更多应用的进化。

如今,百度翻译的产品形态已经跨越了传统翻译产品古板的工具形象,其使用场景和用户圈层也在不断扩大,随着能力的不断提升,百度翻译也正在抹平语言之间的障碍,翻译产品让中国与世界的沟通更加顺畅的同时,也带来了见识和眼界的提高。

“与世界更好地沟通”是百度翻译的愿景。

在过去十年,百度翻译致力于提升翻译的精准度广度和速度、改变翻译的输入方式、丰富翻译产品的应用场景等,在下一个十年,随着产品形态的进一步进化,百度翻译或将在于世界“对话”的同时,讲出更多在翻译之外的故事。

*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

文|曾响铃

来源|科技向令说(xiangling0815)

相关文章

标签:

A5创业网 版权所有