4代笛子:任意乐器分离已发布
团子AI · 2024-10-04
现已发布4代笛子模型,欢迎小伙伴们的使用和反馈。
笛子:提升9%
在4代的实验过程中,笛子是最为“丝滑”的一个,相对于上一代来说,本代的笛子在各方面均有稳步的提升。在上一代中,我们获得了6.00dB的SDR成绩,本代中,我们获得了6.56dB的成绩,相当于在量化的评估中,本代的笛子性能提升了约9.3%左右。
笛子独特的气流声会导致笛子在声学的角度来说,和人类的“嗓子”声音很像——没错,人声在某种程度上来说和笛子声音非常像,并且我们发现三代模型中已经存在这个问题,部分人声会错误的认为是笛子从而被移除,在4代中我们已经解决了这个问题。另外和萨克斯相似,笛子也增加了大量的对抗,现在可以在管弦乐中更好的提取出需要的笛子音色了。
我们可以听一个三代和四代的区别案例:
原曲:
Flute raw
0:00
/0:07
三代:
Flute 3
0:00
/0:07
四代:
Flute 4
0:00
/0:07
这是一首由“尺八”演奏的Naruto Main Theme(火影忍者主题曲),我们可以听到在原曲中有男声“哈”的声音,而在三代中,笛子模型错误的将其认为是“笛子”声音并提取,四代模型经过我们进一步的加强对抗,已经大幅度缓解了这个问题。