语音识别技术科普:客知音电话机器人为您解读人工神经网络

来源:互联网 时间:2018-09-28

语音识别引擎的迅速发展推动着人类进入了一个新的时代,在万物互联的基础上,人类开始可以摆脱手动键盘录入信息,直接用语音和“万物对话”,更接近自然交流场景。这样一种趋势正在席卷人类生活的方方面面:智能穿戴设备、儿童陪伴机器人、智能车载、电话机器人等。

其实这样的时刻已经酝酿多时了。从1952年贝尔研究所成功识别10个英文数字到如今人们可以和机器人实时交流互动,语音识别背后的技术经历了几个时期的重点突破。其中,人工神经网络(Artificial neutral Network,简称ANN)是推动语音识别技术到当前水平的一匹黑马。

可能我们会想当然地以为人工神经网络是一个新兴的概念,但它其实在1950年代就被提出来了!在20世纪80年代后期,神经网络成为一种流行的声学建模方法。从那时起,神经网络已被用于语音识别的许多方面,例如音素分类,孤立词识别,视听语音识别,视听说话者识别和说话者适应。

根据百度百科的介绍,人工神经网络是借鉴生物学上神经网络的信息处理方式,建立模型后按照不同的连接方式组成的不同的网络。那这样一种运算模型的基本原理是什么呢?

和往常的计算机运行模式不同,神经网络系统不是根据事先编写好的指令完成特定的任务,而是像人一样根据示范和例子进行学习。例如在图像识别领域,如何让机器识别猫咪?机器并不知道猫到底是什么,例如四条腿有毛发和胡须的动物,它毫无概念。但它能够通过分析大量标记着“猫”和“不是猫”的图片库,自主学习并辨别出哪些图片里有猫,哪些没有。

人工神经网络模拟生物神经网络,由连接着的节点或者神经元组成。例如,一个节点A可以传递信号给另一个与之相连的人工神经元B,而B可以处理收到的信号并能传递给与它相接触的其他节点C、D、E、F、G等,这样就形成了强大的信息处理和传递网络。

在ANN的普遍运用中,各个连接的节点传输的信号都是数字,而每次数字的传输都会经过特定的转化后输出。那人工神经网络是如何学习的呢?原来每个连接都会随着学习例子的过程计算它的权重,权重的大小可以强化或弱化连接的信息传递。通常,人工神经元会集聚成不同的“层”,只有当所有那一层的信息都通过了一个关卡时,信息才能被传输。不同的“层”会对传输进来的信息进行不同方式的变换,因此信息从开始层传到最后一层都会在各层之间转化过了很多次。

当然,以上只是对于人工神经网络最基础的介绍,各个模型的应用和测评在学术界时刻被交流和更新着。客知音的算法技术人员更是在理论和实践中把握着前沿动态,定期撰写论文并组织研讨,在自主研发的语音识别引擎的基础上,不断优化专门领域内的语音识别准确率,做到比科大讯飞、百度、阿里等通用语音识别更准确。

相关文章

标签:

A5创业网 版权所有