采用语音识别技术的智能娃娃

让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识别是一门交叉学科,关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。

计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:

  (1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列。

  (2)声学模型与模式匹配(识别算法):声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型通常由获取的语音特征通过训练产生,目的是为每个发音建立发音模板。在识别时将未知的语音特征同声学模型(模式)进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大影响。

  (3)语义理解:计算机对识别结果进行语法、语义分析。明白语言的意义以便作出相应的反应。

这里我们提供的娃娃就具备一定的语音识别能力,可以听懂并回答10句简单的提问,并作出回答

1.你好
娃娃答:你好

2.你叫什么名字?
娃娃答;我是聪明可爱的喜之宝娃娃,

3.你会唱什么歌?
娃娃答; 我会唱很多歌

4.你今天开心吗?
娃娃答;我见到你很开心

5.让我亲一下好吗?
娃娃答; 好吧,只能亲一下平

6.你很可爱!
娃娃答;你也很可爱哦

7.你会讲哪些故事?
娃娃答;我会讲很多故事

8.你住在哪里?
娃娃答;我住在地球上

9.你最喜欢谁?
娃娃答;我最喜欢你啦

10.喜欢玩什么?
喜欢和你一起玩

提问的顺序没有要求,在安静的环境下识别率很高。