《PHASEN:A Phase and Harmonics Aware Speech Enhancement Network》Pytorch代码学习

上传:chengguan 浏览: 12 推荐: 0 文件:PDF 大小:288.2KB 上传时间:2021-02-01 14:48:51 版权申诉
PHASEN结构 源码地址:https://github.com/huyanxin/phasen PHASEN是一个双流网络,其中幅值流和相位流分别专门用于幅值和相位预测。幅值流主要由卷积操作,频域变换模块(FTB,后文介绍)以及双向 LSTM 组成,而相位流为纯卷积网络。强度流的预测结果为幅值掩膜 M,其取值为正的实数,相位流的预测结果是相位谱。 具体细节不一一介绍,直接从每个模块的代码入手。 输入Input PHASEN的输入是cmp_spec = self.stft(inputs),即计算inputs的幅值与相位,再concat到一起,窗长=400,帧移=100,计算512点FFT。所
上传资源
用户评论