http://lalal.ai,这个音频处理工具太牛了,它可以对复杂的合成音轨进行精准分离和无损提取。我试了一下,效果非常好。
它主要用于两个场景,一个是音轨剥离,一个是声音移除,例如它可以提取人声、鼓、贝斯、吉他和弦乐等声音,也可以去除背景音乐、麦克风隆隆声以及其他不需要的噪音。下面的视频演示了剥离伴奏和人声的效果,还是比较直观的。
也去搜罗了下实现原理,找到一篇介绍 MSS(Musical Source Separation)的论文:https://inria.hal.science/hal-01945345/document,它介绍了基于模型和基于信号处理的两种较为传统的处理方式,也提到,当前引入深度神经网络来解决这个问题的应用越来越多,不过最大的局限性还是可用于学习的数据太少,例如你让工具单独提取音频中鸟叫的声音,可能就比较吃力。