www.969777.com

当前位置:主页 > www.969777.com > 正文

铁算盘“机翻媲美人类水平”背后是人工智能的突破还是自欺欺人?

更新时间:2019-10-08   浏览次数:

  近日翻译圈和技术领域发生件不大不小的事,引起了一波新的讨论,起因是一篇新闻稿,微软亚洲研究院与雷德蒙研究院称,在WMT的newstest2017 中-英测试集上,其研发的机翻系统“达到了可与人工翻译媲美的水平;这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统。”

  在人工智能突飞猛进的今天,在语言服务领域,机器翻译VS.人工翻译一直是热议的焦点,而微软的这则新闻,似乎一下子把机器翻译取代人工翻译拉到了眼前,而且已经可以在新闻报道领域应用了,对于不那么理解这是一种“给定数据集测试”的用户来说,这条新闻里的“首次、与人工翻译比肩、媲美”可谓颇有煽动力,可事实果真如此吗?

  WMT是一项针对机器翻译的研讨会, 2017 年是第二届,会议主要是针对八项任务,对各个报名机构的机器翻译进行评估。参与新闻机翻任务时间是 5 月,正式会议是在 2017 年 9 月7、 8 两天(相当于成果发表和研讨),当时搜狗知音也出过新闻。

  微软时隔7个月才放出测试结果,很大程度上也是希望通过比赛、刷分,给自己的技术背书。这不禁容易让人联想到几年前,手机厂商每次发布新品必不可少的“跑分”环节,不过略显寒碜的是,这个跑分的环境是如此的狭窄,甚至不透明。

  由于很多商业机器翻译提供商不参加WMT,而只是使用WMT对其系统进行测试,也有部分参与测试的商业和在线系统采取匿名形式,因此在新闻机翻:中-英的任务里,我们是看不到微软、或者其系统Combo的名字的。

  而微软公布的数据并非WMT2017 的官方数据,而是以“如果机器翻译系统在测试集上的译文质量得分(人工评分)与人类译文得分没有显著差别,则机器达到人类水平”为标准,再另请语言顾问进行评分的。

  简单来说,就是做同一套WMT2017 测试集,以人工翻译的得分为参照,如果机翻的得分能够接近人工得分,就认定机翻达到了人类翻译的水平。“与人类得分足够接近”和“人工判定机翻是否足够精准”显然是两套衡量标准,也就发生了在微软的评分结果里,微软的系统(Combo-4, 5, 6)超过人类翻译(Reference-HT)的水准。嗯,这个偷换概念的跑分逻辑给Combo 去翻译,估计它会宕机。

  所以这个结果是否就担得起“这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统”这样的赞誉呢?

  也许有必要做些简单的介绍,微软所参加的Machine Translation of News是一种给定数据集测试,在严格受限环境下的研究和测试手段,即:给定了训练语料、给定了测试数据,在规定时间里,用这些给定的语料训练出引擎,来处理测试数据,封闭条件下,谁训练出的引擎处理测试数据结果好,谁就是赢家。

  WMT的Machine Translation of News属于三个翻译任务中的一项(另两项为多模式及生物医学),也就是说是,这项测试首先框定了语言出现的情景:新闻领域。在这项任务里,官方给定了培训数据:Europarl语料库、联合国语料库、语言数据联盟(LDC);开发数据:并行数据、单语言模型训练数据、开发集、测试集。在这几项严格受限数据里达到人类水平,再对比新闻里所谓的“中英新闻翻译达到人类水平”性对比,就可以知道其中的夸大其词;更何况,微软所应用的newstest2017 测试集,官方明文写清了只是来自 2016 年 8 月在线新闻中建立的样本,而实际的新闻报道已经有超过 400 年的积累,忽略了给定数据和封闭环境的语境,这个结论无从谈起。从另一个角度来说,数据集测试只是一种科研竞赛手段,这种手段是否有利于科研发展,目前在学界也是众说纷纭。

  不断地突破技术的限制,铁算盘,探讨人工智能的可能性,是所有公司、机构都致力于去不断推进的。我们有理由相信,微软团队开发的对偶学习(Dual Learning)、推敲网络(Deliberation Networks)、联合训练(Joint Training)、一致性规范(Agreement Regularization)都是投入了很多心血得出的研究成果,对于机器翻译的发展也会有一定的推动意义,但是能否投入实际应用,在具体真实的现实世界的商用,并不像新闻里字与字之间说的那么轻易,表现的那么近在咫尺。

  人工智能发展到今天,尤其是最近一两年的狂飙突进,展示出了AI 技术在诸多方面有着人类不可企及的优势,这一点没人会否认,但这并不表示人工智能发展的终极目标就是用机器彻底取代人工,尤其是在语言服务领域,因其地域性、文化性、复杂性的特点,人工智能在短时间内无法取代人工。一味的强调机翻达到了什么样的水准,并不代表它就具有可应用性,更遑论以现在的技术,要让一个机器人长时间像人一样处理问题,可能要自带两个微型的核电站,而人脑的功耗大约只有10- 25 瓦。

  所以人工智能当下更为切合实际的应用方案是实现与人工的协作。在语言服务领域,语翼Woordee 历时五年、投入数千万首创的“AI 引擎+人工”的解决方案,已经帮助超过50000 家中小企业、跨境电商解决了各种语言服务的难题,更帮助他们节省了超过千万的翻译费用。通过人工智能,语翼Woordee 让翻译服务本身变得更即时,流程更高效,价格更低廉,又以专业高素质的译员保证了翻译质量。这才是在语言服务应用人工智能的意义所在,也是语翼专业人工翻译平台在语言服务市场上的价值所在:给AI 以人性,让翻译更智能。

  通过自主研发深度学习的AI智能引擎,自动匹配客户需求与译员资历;基于IBM Docs的文档同步技术,让整个翻译过程实时可见;自主开发的全平台IM系统,让客户与译员随时在线沟通……以此来取代大量传统、繁冗、低效的人类作业。没有人敢保证这就是人工智能应用于语言服务的终极形态,但是享受人工智能,语翼AI才是触手可及的。亚洲电视本港台反派怎么修改wordpress出国旅游这四个小岛不可

香港正版四不像资料| 香港王中王| 最快开奖结果现场直播| 本港台同步现场报码| 今晚六合开奖结果| 本港台报码| 今晚六彩现场开奖结果| 本港开奖直播现场| 现场报码| 香港挂牌彩图之全篇| 香港挂牌论坛| www.txc345.com| 香港正版挂牌彩图资料| 6574.com| 天将图库彩图| 小鱼儿主页| 现场报码| www.577177.com| 84586.com| 现场开奖报码结果|