摘要: 本文通过对小训练样本集的基于DTW结构的数字语音识别模型的比较性分析,指出其存在的三个一般性问题:(1)DTW逐帧匹配模式割裂了观测向量序列的内在联系;(2)压扩观测向量序列造成局部信息使用的不均匀;(3)计算复杂度高,识别率低.为了解决这些问题,我们提出了基于数字语音时频信息整体结构的单特征向量识别模型.这种模型完整地利用了观测向量序列的全部信息,结合置信度评估和自适应反馈学习之后可及时地吸收测试向量携带的新的环境特征信息,调整识别模型结构.该模型的错识率较之最好的基于DTW结构的混合域模型的错识率降低
No related articles found! |
|