世界上有6000多种语言,科技巨头们正试图用新技术弥合人们之间的交流障碍。但是,机器翻译的体验真的很可怕。
上个月,微软的Skype推出了“实时翻译”功能。当英语和西班牙语用户交流时,Skype会自动翻译并通过语音广播。
如今,类似的功能已经成为谷歌将要攻击的城市:移动应用Google Translate将支持的语言数量增加90种,同时将支持“语音翻译”——对个别语言用语音输入A语言,应用将文本翻译成B语言。
当然,这种翻译效果并不如你所愿。即使是纯文本版本的谷歌翻译也经常伴随着语法和词序上的错误。Skype的实时翻译也是如此。从宣传片的使用演示来看,这个功能应该是和耳机配套的,整个过程似乎就是两个运营商在用对讲机。
包括谷歌翻译的机器翻译,局限性在于机器算法和语言文学性的差异。机器翻译不能提供准确的翻译。翻译单词往往忽略语境和语境,不遵循语法。机器翻译还处于“词典”阶段。
机器翻译算法以统计分析为基础,注重翻译效率而非准确性,但语言本身具有“人文性”,包括语法、语义和情感,这些都是算法无法翻译的。
然而,人们仍然迫切需要翻译的应用。谷歌翻译的下载量已经超过1亿,月活跃用户达到5亿。机器翻译背后是一个巨大的市场。包括脸书和微软在内的巨头都在致力于翻译机器项目。
可以预见,未来机器翻译的准确率会有很大的提升,这就需要依靠庞大的数据库,让机器不断学习,让机器更好地理解人。
形式上,未来的翻译会更加智能化,比如开发者_C百科即时翻译,类似于现在的人工同声传译。虽然Skype的实时翻译效率有待提高,但它提供了一个美好的前景。机器翻译的最终任务是消除语言差异。
用数据和算法进行翻译,可以使翻译系统随着数据的积累不断学习和提高,但这里又出现了一个新的问题。如果数据库积累了用户的语言内容和习惯,必然会涉及隐私。
语言研究机构Hypervoice Consortium表示,只有1%的用户愿意贡献自己的使用数据来帮助翻译机器学习。大多数用户希望翻译机像Siri一样,关闭数据,只为自己服务。
精彩评论