语音识别:微软下一代自然用户界面技术

2010/8/4 16:48:04    编辑:软媒 - vivi     字体:【

Win7之家www.win7china.com):语音识别:微软下一代自然用户界面技术

       在8月3 日召开的 SpeechTEK 会议上,微软介绍了他们接下来在语音技术领域的产品 –虽说没有未公开的产品 –微软的语音产品也有涉及近年来格外热闹的云计算。

  微软语音技术部门总经理 Zig Serafin 向 SpeechTEK 出席者概述了微软在语音技术领域的进展,事实上微软自 1993 年就已将语音技术作为自然用户界面的一部分了。当年,微软研究院就成立了语音研究组。

  在 1999 年,微软完成了它的首个语音相关收购 –语音工具包厂商 Entropic。07 年,微软花 10 亿美元买下了语音识别公司 TellMe。但直到一年多前,微软才合并其旗下所有的语音产品和技术为微软语音部门,他们的使命是“让软件与服务因语音界面而更自然、更易于使用”。

  微软并没有把语音技术视为独立的产品,更多的,微软是将其作为微软自然用户界面战略的一部分,整合与其他产品或服务。在接下来一年里,微软将主要向市场推出以下4 类整合了微软各种语音技术的新产品:

  车内娱乐系统–就如在 CES 10 上宣布的 Kia UVO系统,首辆搭载 UVO 的车将在今夏发布。

  Windows Phone 7 设备–已深度整合 TellMe 语音识别技术,具体可。

  Kinect for Xbox–已整合语音识别功能,允许用户通过语音与 Xbox 360 交互,具体可。

  企业生产力产品–目前有超过 1 亿 Exchange 用户可以用上语音邮件、语音翻译和其他基于语音技术的产品(Exchange Online 也将支持这些)。同时,微软 TellMe 产品每年利用 TellMe 云计算后端平台处理 25 亿次通话。

  微软语言部门首席语音科学家 Larry Heck 称,长期来说,微软正试图解决的正是这个问题:“我们何时才能部署达到理解人类对话级别的系统?”他回答了三点解决该问题的驱动力:

  -- 数据及相关机器自学习机制

  -- 云计算平台,如 Azure和 TellMe 网络后端平台

  -- 搜索

  Heck 继续补充道:“自然用户界面能帮助用户实现任何地点访问数据的可能,但目前的入口(比如搜索引擎)对改进计算机或设备理解人类自然对话,并没有太大的帮助。在搜索引擎中,用户习惯于输入独立的关键词,而不是自然陈述的语句,但显然手机上的语音搜索更近似人类的对话。”