百度研发AI机器同传,或将取代人类?

2020-06-05 16:10
和记娱乐 来源:和记h88
原创

 

  家住上海松江区的老刘是一位从业5年的同传工作者,谈起自己的工作经历,老刘用了“”四个字。

  老刘说,’“同传”的压力很大程度上来自“无法预料”。因为,“同传”在国际会议上用得最多,国际会议会涉及不同的领域和行业,由于不同国家背后不同的文化背景,不同的发言人也有各自的表达方式和思维习惯,即使同一种语言,却也存在不同的口音。

  他分析道,同传不仅需要经验,更需临场的发挥,充分集中,调动所有的语言和知识储备。这也正是同声传译需要两人以上协作,需要换岗的原因。但即便如此,超过35岁再做这个行业也很难应付了,而且年纪越大越吃力。

  针对于市场对同传人员用人难的需求,人们研发出了机器同传,用机器来代替人类翻译的过程从而达到结果。运用语音识别技术自动识别者的讲话内容,把语音为文字,然后调用机器翻译引擎,将文字翻译为目言,显示在大屏幕或者通过语音合成再播放出来。

  有了机器同传的出现,一定程度上减少了翻译人员的超负荷工作量。但是在人工智能领域,两种语言的“即时互译”是一项难以攻克的技术问题,主要原因在于源语言和目言之间存在较大的词序和语序差异。

  我们从这张动图上可以看到,的中文是人类说的话,下面的英文是百度 AI 给出的实时翻译。可以看到,没等说到“莫斯科”的时候,AI 自动翻译的英语就已经出现了“meet”,也就是汉语句末的“会晤”。

  百度运用人类同传译员常用的一个技巧就是“合理预测”:在发言人话说到一半时,预测到后半句可能要讲的内容,超前翻译,这样能使同传又快又准。

  百度的工程师们巧妙地模仿这一点,研发出了“wait-k words”模型,让机器同传也拥有了“合理预测”的能力,一定程度上解决了所说的“准确度与速度不可兼得”的问题。

  普通的 AI 同传是一整句话说完之后才进行翻译,而百度同传没等说完前半句,它的“大脑”就会瞬间做出反应,堪称“读心术”!

  这是百度同传的“读心术”现场,当说到“百度在18年前”时,AI 就预测出了“started a business”

  像老刘描述的一样,人类同传译员在接到翻译任务后,通常会提前很多天学习相关知识,进行“备课”,为的就是更好地应对陌生词汇而临危不惧。

  百度工程师们模仿了这一准备过程,让机器同传也能通过快速融合领域知识策略,快速学习专业知识,提前“备课”。

  当 AI 同传接到某一个领域的翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

  区别于传统的上下文相关建模技术,百度推出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。具有泛化性能好、对噪声鲁棒、中英文混合识别等特点,很好的解决了老刘所描述的同传难题。

  对于语音识别模型常犯的错误,在训练数据的时候加入噪声数据,让模型在接收到错误的语音识别结果时,也能在中纠正过来。

  比如,语音识别系统将“大堂”错误地识别为“大唐”,这一对噪声词被收录到训练数据里,再把源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”,而保持目言翻译不变“Lets meet at the lobby of the hotel”,同时将这两个中文句子存储在它的“大脑”里面,以后再出现类似的情况会更轻松地解决!

  和“老刘们”相比,机器最大的优势是不会因为疲倦而导致译出率下降,能把所有“听到”的句子全部翻译出来,这让机器的“译出率”可以达到100%,远高于人类译员的60%-70%。

  我们询问了百度工程师研发AI同传的目的,他们说:AI同传的出现并不是取代人类译员,而是为了降低同传成本,让同传的应用范围更加广泛。

  AI同传的出现会一定程度的减轻“老刘们”工作上的一些麻烦,但是我们相信科技的进步只会给人们生活带来方便。在未来,希望AI技术能出现在不同的领域为我们提供便利,我们一起拭目以待!

  特别提醒:本网内容转载自其他,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容您的权益,请及时联系我们,本站将会在24小时内处理完毕。

  在过去的一个月里,全国人民都在用自己的方式与“看不见”的病毒作战,随着返程复工大军的...

  受到疫情影响,在线教育、在线健身/娱乐、在线办公等在线服务迎来爆发,这些原本不属于家庭场景的新...

  位于东湖区宏图8号的武汉客厅曾是武汉的文化地标建筑。从半个月前开始,这里成为了“方舱医...

  2020年2月18日,由华为与智能与计算学部合作开设的《人工智能应用基础》校级选修课采用华为...

  随着全国各地复工复产的有序推进,社会整体经济也在全面恢复。2月25日,合肥市2020年重大产业项目集...

  2月25日消息 今日午间vivo微博再度放出APEX 2020预告:全新APEX 2020将支持高倍率“连续光...

  英特尔今天正式发布全新第二代英特尔至强可扩展处理器。全新第二代英特尔至强金牌处理器相比第一代...

  微软Xbox One游戏主机终于可以通过按击游戏手柄上的按钮来弹出光盘了。根据部分参与Xbox Insider项...

  2月25日消息 据三星透露,三星电子今天宣布已经开始大规模生产业内第一个16GB 的 LPDDR5移动 DR...

  时至移动互联时代,我们获取信息依然需要经过某些必要的径。种类繁多的APP给我们提供了更加多元化...

  基于三星5nm工艺的高通骁龙X60基带已发布,台积电下半年也将基于5nm(N5)为苹果代工A14、华为代工麒...

  继武汉体育馆方舱医院后,硚口区第二座方舱医院——新华产业园方舱医院即将建成,预计近...

  今年1月初在拉斯维加斯举行的CES 2020展会上,英特尔曾表示与谷歌扩大合作,将Chromebook加入&ldquo...

  2月25日消息,据国外报道,消息人士透露,苹果的下一代智能手机预计将被命名为iPhone 12,iPhon...

  随着疫情形势的逐渐好转,各行各业也逐渐开始进入复工状态。全新的生活即将开始,也更要保持自身及身...

  2月24日晚8点,苏宁召开了一场特殊的线上发布会。苏宁易购侯恩龙戴着口罩,主播,宣布自27日起...

  近日,全国各地进入复工高峰期。苏宁帮客大数据显示,自消杀功能上线以来,、上海、南京、广州...

      和记娱乐,和记h88,h88平台官网