4代笛子：任意乐器分离已发布

团子AI · 2024-10-04

现已发布4代笛子模型，欢迎小伙伴们的使用和反馈。

笛子：提升9%

在4代的实验过程中，笛子是最为“丝滑”的一个，相对于上一代来说，本代的笛子在各方面均有稳步的提升。在上一代中，我们获得了6.00dB的SDR成绩，本代中，我们获得了6.56dB的成绩，相当于在量化的评估中，本代的笛子性能提升了约9.3%左右。

笛子独特的气流声会导致笛子在声学的角度来说，和人类的“嗓子”声音很像——没错，人声在某种程度上来说和笛子声音非常像，并且我们发现三代模型中已经存在这个问题，部分人声会错误的认为是笛子从而被移除，在4代中我们已经解决了这个问题。另外和萨克斯相似，笛子也增加了大量的对抗，现在可以在管弦乐中更好的提取出需要的笛子音色了。

我们可以听一个三代和四代的区别案例：

原曲：

Flute raw

0:00

/0:07

三代：

Flute 3

0:00

/0:07

四代：

Flute 4

0:00

/0:07

这是一首由“尺八”演奏的Naruto Main Theme（火影忍者主题曲），我们可以听到在原曲中有男声“哈”的声音，而在三代中，笛子模型错误的将其认为是“笛子”声音并提取，四代模型经过我们进一步的加强对抗，已经大幅度缓解了这个问题。

返回到团子博客