技术探秘:谷歌翻译背后的那些故事

2011/3/19 21:33:35    编辑:艾瑞网     字体:【

Win7之家www.win7china.com):技术探秘:谷歌翻译背后的那些故事

  "享受服务同时,使用者往往会惊讶于他们是如何做到的",基于此,Google技术之旅正式开启,第一站选择了谷歌翻译,旨在带领大家体验Google翻译背后的技术,分享研发背后的故事,一同感受Google翻译和谷歌工程师的技术魅力。

图为:Google翻译团队研发经理陈雍昇

  3月17日,在谷歌北京办公地点科健大厦,Google翻译团队研发经理陈雍昇,带领其团队成员共同揭开了Google翻译产品的技术和背后研发的故事,目前,Google 翻译可提供 57种语言之间的即时翻译,其中甚至包括了少数民族语言,如威尔士和海地克里奥尔语,Google 翻译可以帮助用户阅读搜索结果、网页、电子邮件、YouTube视频字幕以及其他信息,用户甚至还能在Gmail内进行实时的多语言对话。借助 Google 翻译,Google希望将所有信息变为用户普遍可理解的有用信息,而无需考虑其源语言。

  谷歌:发现用户需求并不难 满足用户需求才是关键

  2004年,Google创始人之一Sergey Brin使用市面上的网络翻译服务来翻译韩国粉丝的邮件,结果显示:"生鱼片带着它的愿望,用Google搜索绿洋葱!".这样的结果,让Sergey认为Google在这方面可以做的更好。

  现实中,很多产品经理抱怨用户需求很难发现,在谷歌看来,发现需求也许并不难,而难的是如何更好的满足需求,谷歌翻译产品就是个非常好的例子。谷歌翻译并没有采用传统的机器翻译方法,就是事先在机器中灌输大流量词汇与语法,然后按照句子直译过来,而是独辟蹊径的逆向思维,采用平行语库的方式,即先往计算机内输入大量的文字文本,涵盖目标语言的文本和对应翻译文本中现有的人工翻译数据,然后构建统计翻译模型。

  而这些模型帮助Google找到了无数的相互关系,从这些相互关系中,得出某个特定单词、短语或文件的最佳翻译结果。Google 翻译针对某种特定语言分析的翻译文档越多,译文的质量就越高。

图:谷歌翻译李白静夜思的截图

  当然,如果把唐诗宋词输入进去,进行中翻英的话,也许还是得到的结果并不是很满意。"目前,google翻译大量的平行语库来自于学术机构,和一些文学作品,所以一些特殊文学方式翻译并不是特别准确,但随着平行语料的增加,将更加精准,与此同时,时下的流行用语也是逐渐被google翻译逐渐收录的。" Google翻译团队研发经理陈雍昇如是说。

  消除语言障碍 世界是平的

  巴别塔一说已经众所周知,《圣经·旧约》说,古巴比伦人欲建造巴别塔欲与天公比高,大家语言相通,同心协力统一强大,此事惊动上帝,后者想阻止他们,于是悄悄地离开天国来到人间,改变并区别开了人类的语言,使他们因为语言不通而分散在各处,那座塔于是半途而废了。当然,这只是种传说而已。

  但事实上,语言的不统一,确实导致信息分享的不对称,据陈雍昇介绍说,从世界的资料来看,中文资料只占世界所有资料的3%,大部分资料是其他语言形式的。所以,在Google看来,语言本就不应该成为用户访问和使用互联网的障碍,而Google翻译所提供的服务正是为了让人们跨越语言的藩篱,自由地与各国朋友分享和交流信息:让全世界的网友看懂你的网站,让所有朋友分享你博客上的喜怒哀乐,享受更加精彩的互联网世界。

  《世界是平的》一书中,而随着科技和通信领域如闪电般迅速的进步,使全世界的人们可以空前地彼此接近,彼此间工作和交流的机会越来越多。陈雍昇向介绍了谷歌一对多的一个非常实用的应用,"谷歌翻译最典型的一对多的案例就是,10年南非世界杯,来自全国各地的游客和球迷涌向南非,而当地的旅馆的工作人员边通过谷歌翻译来进行一国语言与多国语言的沟通。"

  在众多应用中,最令记者感到惊讶的是,一位患者通过手机客户端上的谷歌翻译与医生进行沟通,似乎再进一步印证除了语言不应该有障碍,而在社会资源上也同样不应该有障碍,也许对于不久的将来,对于盲文的支持也将出现。

  谷歌产品:形散而神不散

  谷歌的企业文化鼓励工程师们将20%的工作时间用于自己喜欢的项目,此举是为了鼓励员工开发新产品,但纷繁的产品容易导致产品分布复杂化,得不到有效的整合,对于此,陈雍昇表示并不担心,在谷歌翻译里已经整合很多的功能,Google 翻译可以帮助用户阅读搜索结果、网页、电子邮件、YouTube视频字幕以及其他信息,用户甚至还能在Gmail内进行实时的多语言对话。

  对于未来谷歌翻译是否支持手机拍照后翻译,陈雍昇并没有否定,只是说未来充满想象。