全部
期刊
文献
标题
作者
单位
摘要
关键词
栏目
基金
文献检索
包含全部检索词
包含精确检索词
包含至少一个检索词
作者
出版物
发表时间
-

一种利用轻量化CNN的说话人识别方法

姚晨伟 高勇

四川大学

针对传统说话人辨认任务中相位特征容易被人忽视的情况,对说话人辨认任务提出了结合幅度和相位特性的短时傅里叶变换(Short-Time Fourier Transform,STFT)+基于相位的谱根倒谱系数(Phase-based Spectral Root Cepstral Coefficients,PSRCC)特征融合方案,并且将轻量级卷积神经网络模型MobilenetV3与CA注意力机制融合作为后端分类器。通过5种不同特征选择方案进行说话人辨认对比实验,得到相应准确率。结果表明,所提出的说话人识别模型在开源声纹识别数据集VOXCELEB-1的测试集上取得了83.23%的准确率,该模型在超越VGGVOX基线系统81.82%测试准确率的同时,模型大小和参数量分别减少了75.98%和76.32%。
【栏 目】 信息处理与传输
【分 类】 工程技术
【出 处】 《通信技术》2023年03期 第276-281页 (共6页)

相关文献

导出/参考文献
[1]姚晨伟,高勇. 一种利用轻量化CNN的说话人识别方法[J]. 通信技术 . 2023(01): 276-281.

PDF在线阅读

《一种利用轻量化CNN的说话人识别方法》

价格:0.00

Copyright © 2021-2024 全科互知 | 赣ICP备2021006197号-4 | 新出网证(赣)字20417号
赣公网安备 36012102000372号 | 赣B2-20210313 | 技术支持:道然科技

sasa 互知学术
sasa 全科互知