语音识别技术：有用还是痛苦？

内容

与人类对话，请按0
个人电话应用：Siri，Google Now
VR跌落的地方
未来是什么样子的

带走：

与对话式电子设备的交互变得越来越普遍-也是必要的。但是到目前为止，结果显然是好坏参半。

您是否曾经打电话给一家公司寻求帮助或支付账单，却只想听到想要与您交谈的悦耳动听的声音来打招呼-但您听不懂您说的一半？或者，也许您拥有一部iPhone，而Siri最初看起来像是一个好盟友，但您已经意识到有时（好吧，老实说，经常）她只是不了解它？语音识别技术（VRT）也被称为语音转语音，陷入了一个普遍的陷阱：它具有令人难以置信的酷炫潜力（男孩，我们正在为此扎根），但更常见的是，它是一种磨牙动作感到沮丧

语音识别曾经属于科幻小说领域，从1950年代的婴儿期开始发展，当时贝尔实验室Audrey系统被设计用来识别单一语音中所说的数字，如今发展成为我们现在与之互动的对话电子的现代网络。每天-结果不一。

与人类对话，请按0

现在，当今的许多企业都使用称为交互式语音响应（IVR）的系统来处理客户服务呼叫。最常见的用法是用于语音导航菜单，但是一些公司使用IVR系统，该系统可以访问客户帐户信息并回答一些小问题。菜单IVR软件通常具有有限的词汇，可能仅限于“是”，“否”和数字。更复杂的系统可以识别公司特定的单词和短语。

这些系统变得越来越流行-至少对于企业而言-原因很简单：它们具有成本效益。根据《华尔街日报》 2010年的一份报告，到达一个代理商的典型客户呼叫成本在3到9美元之间，而通过自动化系统处理的呼叫仅花费5至7美分。而且，当然，计算机程序不会感到疲倦，生病或对客户感到沮丧（尽管客户肯定会对他们感到沮丧！）。

幸运的是，这并不总是意味着IVR会将工作从人们手中夺走-或至少所有人都从呼叫中心消失了。这些语音激活的帮助程序可以通过拨打电话和回答简单的问题来提高人类客户服务代表的工作效率。

当然，对于与这些技术进行交互的人类用户而言，它并非总是顺风顺水。技术正在帮助改善IVR技术中的常见问题，例如口音问题，但是自动系统被解雇仍然是在线上的常见主题。查看有关配备语音识别功能的电梯的喜剧短片，该视频突出了IVR系统故障可能产生的挫败感。

个人电话应用：Siri，Google Now

大多数人都熟悉智能手机的语音识别。尽管大多数最新的手机型号都带有VR，但当苹果公司在2011年推出Siri时，它们的受欢迎程度和声名狼藉，而Siri则是讽刺性的，语音激活的iPhone 4S“个人助手”。Google很快创造了一个直接竞争对手：Google现在适用于Android Jelly Bean OS。两种系统均具有女性声音和复杂的识别功能，可让用户使用随便的语言与电话“交谈”。

但是，尽管这些系统比以前的系统更加复杂和功能强大，但它们也表明该技术还有很长的路要走。关于Siris失败的笑话已成为流行的网络模因。一名男子甚至起诉苹果公司有关Siris功能的虚假广告。

也许这就是为什么在苹果公司创建Siri时要使其功能先进且内容丰富的原因，而VR软件也显得有些愚蠢。例如，如果您讲1968年电影《 2001：太空漫游》中电影史上最臭名昭著的情报技术热线之一-“打开吊舱门”-Siri会回答电影中的任一回答热线，“对不起（您的名字），我怕我做不到。”或更讽刺的是，“我们情报人员显然永远不会辜负自己。”

以名称呼叫您只是试图使Siri更易于爱用，更加人性化的功能之一。 VR助手可以按照语音命令拨打电话，听写命令和命令，执行Internet搜索信息，查找附近的商店，提供行车路线等，而无需触摸任何东西。电话会同时说出答案并显示在屏幕上。

Google Now（Android Jelly Bean平台的VR部分）与Siri非常相似。该系统通过将随意的语音转换为命令，使用户可以进行呼叫，查询，运行搜索，执行计算和转换，获取单词定义，设置警报，播放歌曲以及获取地图和方向，从而提供了相同的广泛识别功能。

使用Siri和Google Now这样的个人语音助手，好处显而易见。从呼叫，搜索到搜索和娱乐，一切都变得更快，更轻松。只需说出您想要什么，（大多数情况下）VR应用程序就会为您抓取它。 VR的无人值守技术在驾驶时特别有用。尽管许多人谴责Siris的漏洞，并且作者辩称Google Nows从本质上控制用户生活的能力有点令人生厌，但大多数人仍然认为这些未来技术非常酷。

当然，像Siri和Google Now这样的个人电话应用程序还远远不够完美-尽管它们确实显示了该技术在未来的发展方向。这意味着，即使Siri给出了错误的答案，他们也可能会笑并原谅她，因为她知道下一个版本会更好。

VR跌落的地方

如果您在致电公司时曾经遇到IVR，则可能已经注意到了某些沟通障碍。一些程序使用机器人语音转换语音，使语音发音错误，并使事情难以理解。其他人则具有敏感性问题，如果您的声音太大，太柔和或没有仔细发声，则导致软件无法处理您所说的话。

此外，许多人仍然不愿意与机器交谈。如果您在IVR上进行一些搜索，则会遇到一些人将人们汇总在一起的各种方法，这些方法绕过了IVR系统并成为“真实的人”。该解决方案的范围从“对操作员保持按下0”到“向机器发誓，直到它吸引人为止”。结果，IVR系统最近的许多发展都围绕着使它们更适合人类使用。使声音更富有同情心，减少机械手，使系统更易于导航，并让呼叫者知道整个过程从头到尾要花费多长时间。这表明更好的技术只是这里的一半。另一半则是吸引用户与机器对话。

未来是什么样子的

尽管存在这些挑战，语音识别技术仍在不断进步。 Siri和Google Now之类的应用程序（包括缺陷和全部功能）在性能上仍然令人印象深刻，并且多家公司正在将VR功能扩展到其他应用程序。

例如，Dragon NaturallySpeaking语音到软件的创建者Nuance已经开发了用于电视和汽车的语音控件，并且该技术的版本已集成到某些三星电视和某些福特汽车中使用的SYNC娱乐系统中。

随着Google和Apple继续为他们的语音识别技术找到新的用途，很可能越来越多地与从电视到烤面包机的各种日常机器通信。而且，科幻小说似乎是正确的。好吧，只是希望那些聪明的作家错在一件事情上。如果这些机器要接管，那么下次您要求Siri“打开吊舱门”时，您可能会遇到很多麻烦。