带语音识别功能的消费电子产品的系统设计

[10-10 20:36:41]   来源:http://www.88dzw.com  电子制作   阅读:8585

文章摘要:过去,语音识别的应用一直局限于基于PC的系统、电话服务器、高端手机和PDA。但近年来,技术的进步已使得低成本的语音识别处理器在消费电子领域得到应用。 现在的语音识别处理器集成了更多功能,它们的精确度也更高,并有更好的开发工具支持,这使得在消费电子产品中添加语音I/O变得相对容易。在用语音控制家庭环境照明便是一个具有市场潜力的消费应用。 语音识别的类型 语音识别(有时也被称为声音识别或VR)技术可分成三大类:与说话人无关(SI)的识别技术、与说话人相关(SD)的识别技术和语音确认(SV)技术。每种技术都有各自的优点,适用于不同的应用。采用SI技术的产品要求无需对使用者进行培训便可使用的语音指令。

带语音识别功能的消费电子产品的系统设计,标签:电子小制作,http://www.88dzw.com
过去,语音识别的应用一直局限于基于PC的系统、电话服务器、高端手机和PDA。但近年来,技术的进步已使得低成本的语音识别处理器在消费电子领域得到应用。

现在的语音识别处理器集成了更多功能,它们的精确度也更高,并有更好的开发工具支持,这使得在消费电子产品中添加语音I/O变得相对容易。在用语音控制家庭环境照明便是一个具有市场潜力的消费应用。

语音识别的类型

语音识别(有时也被称为声音识别或VR)技术可分成三大类:与说话人无关(SI)的识别技术、与说话人相关(SD)的识别技术和语音确认(SV)技术。每种技术都有各自的优点,适用于不同的应用。采用SI技术的产品要求无需对使用者进行培训便可使用的语音指令。

例如,与说话人无关(SI)的识别技术通常最适合用于照明控制器。就像我们用名字来引起他人的注意一样,用一个被称为“触发(trigger)”的SI指令来激活照明控制器也是一个不错的方法。照明控制器被激活后,它可以接受多个指令。

集成了语音识别功能的产品通常需要一种方法,以让使用者知道它们已经听到指令并准备接受下一个指示。也就是说,它们必须让使用者知道该产品已在控制流程之中。由于控制流程十分简单,照明控制器将用一个短音作为应答,这可缩短使用者与控制器的交互时间,而且如果发生误启动也不会导致太大问题。

由于语音是人类的天生交流方式,所以语音识别功能可以增加产品的易用性,此外它还延伸了使用者的物理控制范围。例如,一个语音控制的照明开关即可提供此类价值。或许使用者正坐着看电视,而照明开关不在伸手可及的范围内,或者环境太暗,看不到照明开关,此时借助一个简单的语音指令就能方便地解决这些难题。

点击放大 图1:一个典型的具语音识别功能的电灯控制器将采用本流程图中显示的步骤进行操作。

设计考虑

因为语音识别建立在概率函数的基础上,所以设计者必须在接受指令(包含在识别指令集合中)和拒绝指令(不包含在识别指令集合中)的重要性之间做出折衷。例如,如果该产品必须反应非常灵敏,且偶尔发生误接受(误启动)也不会酿成大问题,则应用开发者可能倾向于接受指令更重要些。而其它一些应用则不允许误启动,如声控烤箱或照明控制器。

背景噪声是语音识别的克星。检测和识别均要求信噪比(SNR)在合理的范围之内(约为3:1或更高)。如果应用条件允许,最好使用定向麦克风或近讲麦克风来降低噪声。

成本也是一个考虑因素。当最终使用者购买产品时,产品价格已经是原始制造成本的4到5倍。幸运的是,目前市场上提供的高集成度语音处理器包含了所必需的麦克风前置放大器、模数转换器(ADC)、数字滤波器、内核处理器、数模转换器(DAC)和数学运算引擎。

这些处理器同样捆绑了从文本输入到与说话人无关(T2SI)的识别及合成技术。这些芯片也可充当各种消费产品功能的主控制器,而且其价位对消费电子产品来说颇具竞争力。这使得产品在增加语音功能的同时,只增加很少成本,或不增加成本。

照明控制器的设计原理

这些优异的性能使VR照明控制器非常具有吸引力,同时还有助于解决该应用中的语音识别挑战。在家庭环境中,远距离识别一个指令意味着要排除人说话、电视、音乐、碗碟碰撞和撞门等背景噪声的影响。此外,这类应用也必须能适应不同性别的成人和孩子。

语音识别输出的信号完整性只跟经过处理的信号一样,因此适当的麦克风电路设计是最基本的。麦克风电路的设计应使得麦克风、偏置电阻和前置放大级的组合电路可以充分利用ADC的输出位数,即尽可能利用ADC的输出位数来达到最佳分辨率,并且不饱和。另外,设计还应考虑到人们轻声或大声说话时的可能功率范围,以及照明控制器可能被使用的距离范围(通常最大约为10英尺)。

最好把照明控制器设置成避免误启动,(在嘈杂的环境中,使用者有时可能不得不重复发出指令),利用Quick T2SI工具的设置可实现这点。保持指令集的规模尽可能小,对尽量减少错误指令带来的误操作十分重要,特别是在嘈杂的环境(如在家中)。为使指令之间的差异最大,T2SI指令在声音和长度方面应尽可能地不同。

[1] [2] [3]  下一页


Tag:电子制作电子小制作维修教程知识 - 电子制作

《带语音识别功能的消费电子产品的系统设计》相关文章