基于wRLS滤波器和神经网络回声残留抑制的AEC模型——模型框架介绍
(3)NLP回声残差抑制网络进行mask的学习:Deep Feedforward Sequential MemoryNetwork (Deep-FSMN);深度前馈顺序记忆网络;输入:回声信号的估计Y,残差信号E,近端麦克风信号D(三个输入均是Fbank特征,维度是80);输出:ISTFT(Mask*STFT(e))(2)Linear Filter 线性滤波器,进行回声信道估计:wRLS 加权递归
·
参考文献:WEIGHTED RECURSIVE LEAST SQUARE FILTER AND NEURAL NETWORKBASED RESIDUAL ECHO SUPPRESSION FOR THE AEC-CHALLENGE
相关模型:https://modelscope.cn/models/iic/speech_dfsmn_aec_psm_16k/summary
模型整体框架:

(1)TDE 延时估计:基于广义互相关与相位变换(GCC-PHAT)的时间延迟补偿。
(2)Linear Filter 线性滤波器,进行回声信道估计:wRLS 加权递归最小二乘滤波器(频域),即,先对输入信号进行短时傅里叶变换,针对不同帧的相同频点进行RLS线性回声消除。
(3)NLP回声残差抑制网络进行mask的学习:Deep Feedforward Sequential MemoryNetwork (Deep-FSMN); 深度前馈顺序记忆网络;输入:回声信号的估计Y,残差信号E,近端麦克风信号D(三个输入均是Fbank特征,维度是80);输出:ISTFT(Mask*STFT(e))











更多推荐
所有评论(0)