11.0【和声保留】算法已上线
团子AI · 2025-09-17 新功能
11.0【和声保留】算法已上线

作为团子11.0系列算法的最后一员——和声保留算法现已上线,新一代的和声保留继承了我们全新研发的DangoNet5神经网络架构的优点,性能相较上一代再次得到大幅度提升。

得益于全新的架构以及33%的额外训练素材的加入,新算法获得了16.44dB的SDR分数,而10.0的分数为16.03dB,这意味着生成的带和声伴奏更贴近于“真实原曲”。

全新架构我们引入了双倍的注意力机制,让AI每次分离时可获得的上下文更多——就像是AI聊天更不容易忘记“之前聊过”的内容一样,得益于更多的上下文记忆,新算法可以更准确的从歌曲中分析出主唱与和声的差异,并减少主唱忽然出现、消失的问题。

新算法基于DangoNet5架构,而本代的架构主要优化目标是“听感”,新的和声保留算法生成的伴奏相较于上一代,进一步的减少发闷、伪影残留(如滋滋声)的问题,伴奏更加饱满、残留更少,全新11.0的“智能”算法就已经超过10.0的“保守”算法。

我们也在上线时同步增加了“三轨分离”功能,11.0的和声保留和10.0相同,同样支持三轨分离,可以一次分离就得到伴奏、主唱、和声三轨的输出,具体使用教程可以点击查看此篇文章

需要和小伙伴们说明的是,本代的更新主要倾向于听觉优化、减少伴奏乐器丢失的问题,和声提取错误的问题我们并没有特意优化,尽管更长的注意力机制可以有效缓解此问题。如果您在使用和声保留时遇到提取错误、混乱等问题,您可以使用我们的和声保留高级修复算法(点我查看),来自助修复提取问题。

至此,11.0的全系列算法全部完成。上文我们说到,我们没有主动优化和声保留的某些“提取错误”问题(尽管被动的因为网络性能提升和注意力增加,该错误会得到缓解),这主要归因于目前的瓶颈问题,目前的网络很难继续靠“堆训练数据”来得到提升,因为商业歌曲的主唱/和声的范式团子早已经学习,并可以在绝大多数商业歌曲中正确的运行,但在部分歌曲中,存在识别异常的问题,导致主唱意外残留或和声丢失,而这些“反范式”的歌曲很难靠进一步的学习素材来提取,目前您可以使用我们的高级修复算法来完成自助修复,我们将在未来专注于研发一套“彻底解决”的神经网络架构,从根本上让神经网络可以在整首歌曲一致性的分离,敬请期待😘