4代笛子:任意乐器分离已发布
团子AI · 2024-10-04
4代笛子:任意乐器分离已发布

现已发布4代笛子模型,欢迎小伙伴们的使用和反馈。

笛子:提升9%

在4代的实验过程中,笛子是最为“丝滑”的一个,相对于上一代来说,本代的笛子在各方面均有稳步的提升。在上一代中,我们获得了6.00dB的SDR成绩,本代中,我们获得了6.56dB的成绩,相当于在量化的评估中,本代的笛子性能提升了约9.3%左右。

笛子独特的气流声会导致笛子在声学的角度来说,和人类的“嗓子”声音很像——没错,人声在某种程度上来说和笛子声音非常像,并且我们发现三代模型中已经存在这个问题,部分人声会错误的认为是笛子从而被移除,在4代中我们已经解决了这个问题。另外和萨克斯相似,笛子也增加了大量的对抗,现在可以在管弦乐中更好的提取出需要的笛子音色了。

我们可以听一个三代和四代的区别案例:

原曲:

audio-thumbnail
Flute raw
0:00
/0:07

三代:

audio-thumbnail
Flute 3
0:00
/0:07

四代:

audio-thumbnail
Flute 4
0:00
/0:07

这是一首由“尺八”演奏的Naruto Main Theme(火影忍者主题曲),我们可以听到在原曲中有男声“哈”的声音,而在三代中,笛子模型错误的将其认为是“笛子”声音并提取,四代模型经过我们进一步的加强对抗,已经大幅度缓解了这个问题。