中文语音处理在数字助听器系统的开发

与非网 中字

  2. 方法 (Methodology)

  数字助听器的核心部分是增益计算,基于频域的处理过程,它建立了各频率段的输入瞬时能量与增益的函数关系,如图3所示,对每个频段的瞬时能量进行短时能量累计和长时间慢速平均可获得信号识别和分类所必要的数据。其中:

  ( 1 ) E j (n)= a E j (n-1) 式中: a 是时间常数 。

  ( 2 )使用倒谱算法提取基频, 512 个点 FFT , 40ms 汉明窗,窗移为 10ms 。

  ( 3 )用一个简单的滑动平均算法对每个音节测到的基频进行平滑处理,剔除那些平滑段内偏离均值过大的值。

  ( 4 )音高和音长分别进行归一化。

  ( 5 )采用一个二次曲线在最小均方误差的意义下逼近基音轨迹。并计算曲线的一次斜率、二次斜率、谷点和平坦度。

  上述算法采用基于 TOCCATA 指令系统的汇编语言实现。 14 位 A/D ,采样率设为 32KHz 。

中文语音处理在数字助听器系统的开发

图3 . 汉语言语增强系统处理结构图

  1). 语音的切分 (Classifications of Phonemes)

  声波由音质(即音色)、音高、音强和音长四部分组成,这四部分在语音中起着不同的作用,但在时间上又是同时并存的。

  音质成分 —— 按音节划分,如元音、辅音。

  超音质成分 —— 由音高、音强和音长三部分组成,附着于一个音节或音段上。

  从声波特性上看,可以由基频确定音高,根据振幅确定音强,根据时间确定音长。

  2). 处理原理 (Algorithm Principles)

  中文语音处理主要体现在:

  在验配过程的中,考虑中文语音长时间频谱覆盖的频率作加权处理,抬高目标曲线中言语频率的部分,可以达到加强语音理解的作用。

  在助听器的信号处理程序中,对压缩控制器做特别的设置,使对高频的信号压缩的启动时间和释放时间很短 , 做到使辅音清晰化的效果,增强使用者对言语的理解度。

  在降噪处理中,根据中文语音在噪音环境中的采样分析,得出了为中文语音优化的降噪策略。实验证实,该策略最高可以提高信噪比 18dB 。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存