参考文献:WEIGHTED RECURSIVE LEAST SQUARE FILTER AND NEURAL NETWORKBASED RESIDUAL ECHO SUPPRESSION FOR THE AEC-CHALLENGE

参考视频:https://www.bilibili.com/video/BV1Ft421N7iB/?spm_id_from=333.999.0.0&vd_source=77c874a500ef21df351103560dada737

相关模型:https://modelscope.cn/models/iic/speech_dfsmn_aec_psm_16k/summary

模型整体框架:

(1)TDE 延时估计:基于广义互相关与相位变换(GCC-PHAT)的时间延迟补偿。

(2)Linear Filter 线性滤波器,进行回声信道估计:wRLS 加权递归最小二乘滤波器(频域),即,先对输入信号进行短时傅里叶变换,针对不同帧的相同频点进行RLS线性回声消除。

(3)NLP回声残差抑制网络进行mask的学习:Deep Feedforward Sequential MemoryNetwork (Deep-FSMN); 深度前馈顺序记忆网络;输入:回声信号的估计Y,残差信号E,近端麦克风信号D(三个输入均是Fbank特征,维度是80);输出:ISTFT(Mask*STFT(e)) 

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐