基于16位单片机的语音电子门锁系统

发布时间:2007/4/23 0:00:00 访问次数:539

摘要：介绍采用声纹识别技术、在凌阳SPCE061A单片机上实现的一种语音电子门锁身份认证系统。实验结果表明，系统性能稳定，识别效果好，可以推广使用。

关键词：声纹识别基于周期线性预测模式匹配 DTW

生物识别技术是利用人体生物特征进行身份认证的一种技术，是目前公认的最为方便与安全的识别技术。由于每个人的生物特征具有与其他人不同的唯一和在一定时期内不变的稳定性，不易伪造和假冒，所以利用牲识别和技术进行身份认证，安全、准确、可靠。

在生物识别领域中，声纹识别，也称为说话人识别，以其独特的方便性、经济性和准确性等优势受到世人瞩目，并且益成为人们日常生活和工作中重要且普遍的安全认证方式。声纹识别是一种根据说话人语音波形中反映说话人生理和行为特征的语音参数，自动识别说明人身份的技术。

声纹识技术可分为两类，即说话人辨认和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的，是多选一的问题；而后者用以确认某段语音是若干人中的哪一个所说的，是多选一的问题；而后者用以确认某段语音是否是指定的某个人所说的，是一对一判别的问题。从另一方面，声纹识别又有与文本有关和与文本无关两种，根据特定的任务和应用，应用范围不同。与文本有关的声纹识别系统要求用户按照规定的内容发音，每个人的声纹模型逐个被精确地建立，而识别时也必须按规定的内容发音，因此可以达到较好的识别效果；而与文本无关的识别系统则不规定说话人的发音内容，模型建立相对困难，但用户使用方便，应用范围较宽。

本文介绍的语音电子门锁是一种在凌阳16位单片机SPCE061A上实现的与文本有关的说话人确认系统。该系统主要由说话人识别模块、门锁控制电机以及门锁等部分组成。在训练时，说话人的声音通过麦克风进入说话人语音信号采集前端电路，由语音信号处理电路对采集的语音信号进行特征化和语音处理，提取说话人的个性特征参数并进行存储，形成说话人特征参数数据库。在识别时，将待识别语音与说话人特征参数数据库进行匹配，通过输出电路控制门锁电机，最终实现对门锁的控制。

1 算法原理

说话人识别算法原理框图如图1所示。

1.1 预处理

（1）去噪

对麦克风输入的模拟语音信号进行量化和采样，获得数字化的语音信号；再将含噪的语音信号通过去噪处理，得到干净的语音信号后并通过预加重技术滤除低频干扰，尤其是50Hz或60Hz的工频干扰，提升语音信号的高频部分，而且它还可以起到消除直流漂移、抑制随机噪声和提升清音部分能量的作用。

（2）端点检测

本系统采用语音信号的短时能量和短时过零率进行端点检测。语音信号的采样频率为8kHz，每帧数据为20ms，共计160个采样点。每隔20ms计算一次短时能量和短时过零率。通过对语音信号的短时能量和短时过零率检测可以剔除掉静默帧、白噪声帧和清音帧，最后保留对求取基音、LPCC等特征参数非常有用的浊音信号。

1．2 特征提取

在语音信号预处理后，接着是特征参数的提取。特征提取的任务就是提取语音信号中表征人的基本特征。

1．2．1 特征参数的选取

选取的特征必须能够有效地区分不同的说话人，且对同一说话人的变化保持相对稳定，同时要求特征参数计算简便，最好有高效快速算法，以保证识别的实时性。

说话人特征大体可归为下述几类：

（1）基于发声器官如声门、声道和鼻腔的生理结构而提取的参数。如谱包络、基音、共振峰等。其中基音能够很好地刻画说话人的声带特征，在很大程度上反映了人的个性特征。

（2）基于声道特征模型，通过线性预测分析得到的参数。包括线性预测系数（LPC）以及由线性预测导出的各种参数，如线性预测倒谱系数（LPCC）、部分相关系数、反射系数、对数面积比、LSP线谱对、线性预测残差等。根据前人的工作成果和实际测试比较，LPCC参数不但能较好地反馈声道的共振峰特性，具有较好地识别效果，而且可以用比较简单的运算和较快的速度求得。

（3）基于人耳的听觉机理，反映听觉特性，模拟人耳对声音频率感知的特征参数。如美国