2025年12月11日星期四

AU降噪黑科技:小白也能速成高质量干声,轻松提升AI声音克隆与翻唱效果

在进行AI声音克隆和AI翻唱时,许多人受限于缺乏专业录音设备,往往只能直接使用手机录制干声。然而,干声的质量直接影响AI模型对音色的还原精度与最终翻唱效果。因此,今天我来讲一下,如何使用AU快速去除录音噪音,得到高质量的干声录音。
下面这是一段有着非常大底噪的干声音频,底噪已经达到了-22左右。
图片
在通常去噪的方法中,我们可能会想到用AU的降噪/恢复-->降噪(处理),通过选取噪声样本的方式来去除噪声。
图片
我们先来看一下这样去除噪音的效果如何。
在弹出降噪对话框后,先用鼠标在轨道中选取一段均匀的噪声,然后选择捕捉噪声样本。
图片
接着点击面板中间部位的"选择完整文件",再将下方的降噪和降噪幅度都设为80左右,最后点击应用。
图片
等待几分钟,降噪处理完毕。
这时你会发现,处理完的音频还是有问题,特别在每句的结束后会有一个像房混一样的小尾巴,听起来就像每句话后面有一个呼呼一样的声音。
这就说明噪音没有去除干净。
图片
右击,切换成完全对数方式显示。
图片
切换成完全对数方式后,可以看到底面的颜色中黄色比较浓,黄色代表能量最重,黑色代表没有能量,这正说明噪音没有处理好。
图片
那么如何干净快速地去除噪音呢?
正确方法:先对音频进行低切。
低切方法:
效果-->滤波与均衡--FFT 滤波器
图片
人耳能听到的声音是20-20000Hz,而人类说话的声音是60HZ以上,所以60HZ以下的音频可以无脑低切掉。
但很多时候噪音会出现在60-100HZ,所以我们的低切数值要设高一些,可以提高到90-100。
我们以100为例,在滤芯波器中100的位置添加一个关键点,再向下垂直拉一个关键点到底部,同时将起始位置也拉到0的位置(如下图)。
图片
【小技巧】如何将设置好的低切保存起来并快速调用。
我们可以将做好的这个低切做一个收藏,起一个自己认识的名字。
图片
以后就我们就可以到收藏夹里直接调用我们收藏的低切,将它应用到波形编辑器里。
图片
但如果是多轨编辑器,则无法直接应用我们在波形编辑器里收藏的内容,所以我们要将刚刚做好的低切保存成预设。
图片
我们来到多轨的效果组里添加FFT 滤波器
图片
FFT 滤波器的预设里就有了我们刚刚保存的100低切预设了。
图片
回到刚刚的低切操作。
在对音频进行100低切后,现在的底噪在-31左右,比之前小了一些,但还是有些大。
图片
降噪的核心技能来了
在做完低切后,打开降噪/恢复-->降噪(处理),
在进行样本处理时有几个关键参数要调整
1、首先打开左下方的"高级"设置,"FFT大小"的默认值是4096,要把它的数值尽量调小,比如512。
图片
2、中间部位的"降噪"和"降噪幅度"数值在40-100范围内,如果噪声比较大,可以调到100,如果噪声不大,可以适当调小这个数值。
我的音频噪音比较大,我设置的是90。
图片
点击应用后,你会发现这个降噪效果非常好,甚至能超过 RX的 Voice De-noise,做好的音频完全没有音损,而且底噪也被处理的非常干净。
图片
对于局部有些没去除干净的噪音,可以先用鼠标选中它,然后右击,选择静音。
图片
这样一来,你就得到了一段无音损、无噪声的高质量干声。有了这样干净清晰的音频素材,在后续用于AI声音克隆或AI翻唱时,便能显著提升音色还原度与整体听感,呈现出更加自然、逼真的效果。
最后,完整的操作步骤可以总结为:
1、首先要对音频进行低切,根据原始音频噪音大小,低切数值设为80-100。
2、打开降噪/恢复-->降噪(处理)。在高级选项里将"FFT大小"设为512。
3、"降噪"和"降噪幅度"数值在40-100范围。


END




感谢您的阅读,麻烦点个赞+在看吧!

没有评论:

发表评论

AI画不出的左手,是因为我们给了它一个偏科的童年。

都是偏见 昨天刷到了一条非常有意思的推特。 是我关注的一个博主,Howie.Serious发的。 他发了一个很有趣的点,就是即使是世界上现在最牛逼的NanoBananaPro,在世界知识如此屌爆的情况下,AI,还是没有办法生成左手写字的图片。 这事特别有意思。 我立马用Gem...