解析ASR的认识误区,支持国产ASR发展

 

在智能化人机交互(HCI)技术实现突破与飞速发展的二十一世纪,其应用已逐渐深入人们的日常生活。在智能化人机交互技术中难度最大的自动化语音识别(ASR)研究从上世纪50年代开始到现在已经历半个多世纪的蓬勃发展,在这期间获得了巨大的进展。

近期,随着雅虎、微软两大巨头在海外相继高调推出语音搜索应用,ASR再次成为国内外业界关注的热点话题之一。这标志着自动化语音识别应用进入了产业化、市场化的新时期。

与海外市场不同,由于发展时间、知识普及程度、客户认知程度等方面的因素,在我国人们对自动化语音识别技术的了解以及其市场潜力多半还停留在一知半解的状态,尤其是对ASR在中国发展的情况更是不慎明了。

这里通过对一些目前普遍存在的误区进行分析解释,从而帮助大家深入了解语音识别技术的现状以及如何利用它来获得卓有成效的“中国模式”客户服务

u        误区1:按键式菜单已经够用了、语音识别无法提高客户服务。
u        误区2:语音识别无所不能。 
u        误区3:中国的语音识别技术落后。
u        误区4:语音识别技术非常昂贵。
u        误区5:洋玩意儿总是好的。 

误区1:按键式菜单已经够用、语音识别无法提高客户服务。

有这样一种观点认为古老的按键式系统已经够用了,语音识别无法提高客户服务。我们不禁要问:“消费者是否也这样认为呢?”。当然具体问题还要具体分析,要看客户的实际需求而定。如果仅仅是实现功能相对单一的自动化功能,而且客户的业务并没有太多与消费者交互内容的话,那么按键式系统或许已经足够。

然而,当今消费者往往不满意按键式系统。首先,传统的按键模式所能提供的菜单选择有限,使来电者不得不费劲地猜想自己的问题属于哪个类别,且菜单层次往往非常复杂,而来电者在厌烦听取繁琐的菜单选项或者得不到确切的结果后,更乐于直接选择咨询人工服务。其次,传统的按键模式非常不受手机使用者的欢迎,当消费者使用手机拨打号码时,必须频繁地将手机拿开以便按键,这无疑增加了使用者的操作时间与繁琐程度,于是使用者再次直接选择了人工服务。这就无形中增加了我们的人工坐席的工作量,而人工坐席不得不完成一些不必要的工作,IVR系统的效率被降低。

借助于语音识别技术的应用上述问题迎刃而解,使用者不必再听候冗长的菜单选项,不必再使用繁琐的按键操作,只需在提示问题的引导下,更加自由的用声音进行操作。例如“请输入您的身份证号码!”,使用者回答“110108********4964”,语音识别技术将对用户所说的内容进行自动识别与核对,“请问您说的是:110108********4964”,回答“是”;又比如“请说出您所要资讯的问题内容?”,使用者:“账单地址更改”。这样一来,不仅避免了使用者猜想自己问题的类别,而且大大节省了操作的时间,从而使其更加集中精力在他所关心的问题。

  语音识别技术同时还具备如复杂的拼写输入等传统按键模式所不具备的功能,简化互动和提高整体的客户体验。尤其是当使用者正处在如驾驶状态等不方便按键的环境中时,语音识别技术所带来的便捷,是可想而知的。

误区2:语音识别无所不能。

鼠标与键盘的输入方式,因其标准化的输入本质所达到的所输即所得的境界,对于评价自由度大大提升的语音输入来说是不切实际的。

长期以来,人们对语音识别技术的期望值过高,认为“语音识别技术应该听得懂一切”。这其实是一种理想的状态,也是科学家与技术人员所一直追寻的终极目标。然而,切合实际的想一想,对于这一目标我们只可能无穷尽地接近它,却无法达到它。举个简单的例子来说, 人与人之间的语言沟通,往往都还会因为语法、口音、噪声、俚语、语种等诸多因素的影响而使彼此听不懂对方在说些什么,对于计算机我们当然也不能奢望太多。随着技术的发展我们尽可能地设想语音交互所能有的可能,并为之提供相应的技术方案,然而我们却永远无法囊括所有的可能。

因此,没有那种语音识别技术能够完全100%准确无误地理解用户的任何语音。当然,我们可以通过语音提示、纠错与信息确认等方式来弥补语音识别的不足。例如,首先通过提示音告知用户所能输入的类型,例如“请输入年龄”“请问您的姓名”等;其次通过纠错、信息确认等方式来进行修正,例如“您输入的是18岁?”“您的姓名是**”。

误区3:中国的语音识别技术落后。

正如前文所述,语音识别技术因其自由度的大幅提升导致其技术开发难度增大,国外语音技术虽然起步较早,但其发展速度由于市场成熟度、相关技术发展速度等诸多因素的制约一直进展比较缓慢,且面临的最大技术难题就是的“自然语言”识别,即所谓的“语音识别听得懂一切”,也是迄今为止语音识别界无法逾越的鸿沟。

我国对于语音识别技术的研究与产品开发相对国外起步较晚,但追赶的步伐却很快。捷通华声经过多年的努力与潜心研发,目前语音识别技术水平已经与国外的技术水平相差无几,而在中文语音识别领域更是由于其强烈的地域特征和得天独厚的条件而领先于国际。

误区4:语音识别技术非常昂贵。

相对于国外大公司高昂的研发、运营、维护、广告成本而言,捷通华声在语音识别技术含量不降低的情况下,拥有着更为实际、更有竞争力的价格。捷通华声在为客户有效降低成本的前提下,带来比国外公司更高的投资回报率,还能让客户在一个更加合理的价位上提高客户服务质量,让消费者更多地感受语音识别技术带来的便捷。捷通华声坚信只有这样才能进一步拉近语音识别技术与产品化应用的距离,拉近语音识别技术与消费者之间的距离,进一步促进语音类增值服务的繁荣发展。

误区5:洋玩意儿总是好的。

不可否认,总体上来说,国外厂商的优势还是非常明显的,其发展较早、资金实力雄厚。然而一味地盲目崇拜国外也是不可取的,俗话说“适合的才是最好的”。

对于语音识别领域来说,正是在这“适合”二字上,国内企业有着国外公司所不具备的、得天独厚的优势。首先,中文语音识别技术是大部分国外厂商所不具备或者不完善的,而对中文语言特点的理解与中国人语言习惯的熟悉正是中国企业的优势之首。其次,高性价比也毋庸置疑地是国内企业最大的优势之一。再有,国内企业对国内客户的企业文化和业务流程有着良好把握,并提供灵活多样化的产品与合作模式、及时周密的服务、充分的培训、行业特色的解决方案。国外公司在中国的技术研发力量不足、甚至没有;培训人员、服务支持往往要远渡重洋不够及时;解决方案陈旧不符合中国国情,不了解行业特色;产品改造牵扯太多不够灵活主动。最后,国内企业在借鉴吸收国内外大量资源的基础上,结合中国国情、行业特色、集百家之长,逐渐形成了商业的“中国模式”厚积薄发。

         相信 “中国模式”一词对大家并不陌生,在这里我们不去做抽象的定义,简单的讲就商场而言“中国模式”就是具有中国特色的商业模式。随着中国经济的腾飞,以往单纯的“拿来主义”已经不能满足中国消费者的需求,由于文化背景、民族习惯、知识水平、行业特色、政府政策、法律法规、管理方式等诸多方面与国外的差异,形成了具有中国特色的客户需求。而各行业的商家看准这一市场需求,在原有的基础上加以变革或者干脆推翻原有不合理的东西,推出更加符合中国客户需求的产品、方案、制度、服务、商务合作等一系列的内容就形成了今天大家经常谈及的“中国模式”。

当今企业善用“中国模式”取得成功的案例不胜枚举,如联想、华为、阿里巴巴等知名企业还将“中国模式”成功地改良应用于海外市场,并获得了成功。

捷通华声凭借拥有自主知识产权的技术优势和多年的市场经验积累,建立了相对完善的、更加符合中国客户需求的产品、服务与支持体系,为ASR在CTI、嵌入式等领域的行业应用铺平了适合“中国模式”的发展道路。

 




 
  • 上 一条文章: 
  • 下 一条文章: 
  • 分享到: