数据堂定制化数据服务,有效解决智能客服语音辨识难题

来源:互联网 时间:2020-08-18

拨打海底捞餐厅的客服电话,一个语气热情的女声从电话那头传来,很多人可能都没有意识到,这并不是人工客服,而是智能电话机器人的声音。

同样,当你拨打10086/10010客服热线,电话那头不再是话务员,而是智能机器人客服在接听。所有这些变化都得益于智能客服的普及。

在客服语音识别技术的支持下,智能客服为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段,能够降低客服中心的人力成本、提升客服中心的运营效率。

不过,随着智能客服在各个行业的普及,越来越多人反映智能客服有时并不“智能”。

当你拨打银行客服电话时,经常会听到“请直接说出你要办理的业务”的提示,但“答非所问”的现象十分常见。一位市民曾表示,与智能客服的交流“还是和机器交流的感觉,而且你说话一定要短,不然也得重来一遍”。

造成智能客服“兜圈子”、“听不懂人话”的一个重要原因在于语音语言的复杂性。

首先,中国有七大方言区、数十种方言,不同的地域有不同的口音特点。所以,如何识别客户的方言以及带有口音的普通话,成为客服语音识别亟待解决的问题。

其次,人们习惯于以非常自然的方式同客服进行对话,语速快、吐字不清、抢话叠字等说话习惯同样会对客服语音识别的准确率产生影响。

最后,电话信道数字语音的采样频率定义为8kH,音质较差,且各行各业都拥有自己独特的领域术语,客观上也为客服语音识别构成了挑战。

数据堂在深刻理解智能客服场景的基础上,对海量原始语音数据进行提取、分类、标注等一系列处理,将混杂的数据转化为可供机器深度学习的智能客服专业数据,为上述客服语音识别面临的技术挑战提供了可靠的数据解决方案。

普通话语音识别

构建普通话基础语音数据,能够有效提升智能客服系统对普通话识别的精准度。

数据堂开发的普通话基础语音数据包括普通话朗读数据、重口音普通话数据和普通话自然对话数据。

朗读数据能够为客服语音识别提供模型,重口音普通话数据能够提高各地口音语音的适应性,而自然对话数据能够提高自然风格语音的适应性。

数据堂自有版权普通话语音数据

方言语音识别

与普通话语音识别的解决方案类似,基础语音数据也是提升方言语音识别精准度的重要保障。

数据堂开发的方言语音基础数据包括方言朗读数据和方言自然对话数据。

方言朗读数据是构建方言语音识别模型的基础,方言自然对话数据能够提高自然风格语音的适应性。

数据堂自有版权方言语音数据

数据定制服务

为了有效解决客服语音识别所面临的领域术语难题,数据堂特提供数据定制服务。

客服语音标注示例

数据堂积累了近十年标注经验,打造了一个业内领先的数据处理平台。

数据堂创建了可视化数据制作流程和管理制度,拥有语音、文本、图片和视频等近20种丰富的可配置工具,掌握多个领域20余个场景的预处理能力,保障了自动标注的高效性。

为保障数据的质量,数据堂采取了标注(多人拟合)、质检(机器质检、人工抽检)、人工验收等多级数据质量管控措施。

数据堂保密性极高的标注服务基地

数据堂提供的数据处理平台私有化部署+云标注的模式能够有效保护客服数据所涉及的企业机密或客户隐私。

数据堂的语音数据产品可以做到从智能客服实际应用场景出发,帮助客户快速提升语音识别的性能。

数据堂在人工智能数据服务领域将持续发挥导向性作用,不断优化自身业务与技术实力,为人工智能技术研发与应用提供数据能源支持。

项目推荐

A5创业网 版权所有