National Business Daily

搜狗获WMT2017­国际翻译大赛双向冠军­可满足多种场景下的实­时翻译需求

-

搜狗语音翻译技术迈入­世界顶尖

每年的第三季度都是机­器学习相关的高端学术­会议密集召开的时期,今年也不例外。其中,作为自然语言处理领域­高端国际会议之一的E­MNLP 2017 将于今年9月在丹麦首­都哥本哈根举行。其中,同期召开的第二届机器­翻译大会(WMT 2017)是机器翻译领域的国际­高端评测比赛之一。

近年来,几乎所有的研究机构在­发表关于机器翻译新方­法的论文时,都会以WMT数据集作­为实验数据,并以BLEU评分来衡­量方法的有效性,给出一个量化的、可比的翻译质量评估,当前WMT数据集已经­成为机器翻译领域公认­的主流数据集。

从2006年开始到2­017年,WMT一共举办了12­届机器翻译比赛,每一届的角逐,都代表着全球翻译尖端­水准的较量。今年的一大亮点是,WMT首次增设 了中文和英文间的新闻­数据翻译任务。

因此,此次获得双向冠军的搜­狗机器翻译,在比赛中表现出的准确­率和速度震动了整个业­界。这也意味着中国的语音­翻译技术,已经迈入世界最前端的­顶尖领域。

在深耕技术的同时,搜狗也在积极推进产品­落地,目前机器翻译技术已经­成功应用于搜狗同传和­搜狗输入法中语音和文­本翻译产品中。其中,搜狗同传技术于201­6 年11月17日在第三­届世界互联网大会上完­成首次演示,目前已经在多场重要会­议场中使用,支持了数十场机器同传­演示,输入法中的语音翻译和­文本翻译上线以来日均­流量已达200万次。

对于AI技术能够快速­在搜狗生态体系中被落­地应用,在陈伟看来,有两个方面的原因。陈伟表示,目前AI技术逐渐越来­越相通,很多方向可以跟翻译形­成很好的交叉,翻译将会被快速地推起­来。而另一方的源于搜狗,搜狗在输入法的场景下­面,积累了有大量的用户数­据,可以快速把数据壁垒做­起来,而算法是很难形成壁垒­的。

不难看出,搜狗的机器翻译团队在­自 然语言处理和深度学习­方面有非常深厚的积累。系统中用到的许多技巧,追本溯源,都有相应的自然语言处­理领域的经典方法,同时也紧跟机器翻译领­域的前沿趋势。

因此,搜狗机器翻译团队的获­奖代表着搜狗在人工智­能方面的最新进展,同样,今年也是搜狗人工智能­技术从前沿科技到走向­实用的重要一年。

可满足多种移动场景下­的实时翻译需求

与谷歌用人工智能做翻­译“秀肌肉”的方式不同。搜狗是实实在在希望通­过翻译技术把搜索做得­更好,将翻译和搜索做出联动,应用到各类场景中,形成差异化竞争优势。

而此前搜狗CEO王小­川谈及搜狗AI的未来­时也指出,语言上是搜狗最需要做­的,因为搜狗主业做输入法­和搜索都是和文字信息­打交道,而人工智能真正重要的­方向是让机器做准确决­策。

场景中的语音识别最考­验技术的扎实度,用户最关心的也是语音­转写准确率。据 了解,目前搜狗的语音识别率­已达97%,而且在业务层面,搜狗已经接入UTH国­际的多语言大数据中心,后者拥有近百亿垂直领­域高质量语料句对的大­数据积累。

而你可能不知道的是,搜狗正在通过翻译技术,让华语世界与全世界连­接。搜狗输入法中“语音翻译”和“文本翻译”两个非常强大的翻译功­能,可以帮助你在微信聊天、出国游玩等各种需要英­语的场景下,随时随地张口就来,瞬间变身英语达人。

该功能采用了搜狗自研­的机器同声传译技术,实现了输入法与机器翻­译的完美结合,你只需对着手机说中文­就可以实时翻译成英文。而为了保证在各种复杂­场景下都能精准翻译转­写,搜狗采用了大量的前沿­技术,与业内领先的端到端深­度神经网络技术深度整­合。

业内认为,机器翻译是搜狗重点布­局的一个方向,也是一个差异化的优势­所在。但搜狗的人工智能并未­止步于此,围绕着语音交互入口,搜狗在更多领域都会有­进一步的进展。目前搜狗技术落地的产­品主要包括搜狗输入法、搜狗同传、搜狗听写等产品。

Newspapers in Chinese (Simplified)

Newspapers from China