11.0【和声保留】算法已上线

团子AI · 2025-09-17 新功能

作为团子11.0系列算法的最后一员——和声保留算法现已上线，新一代的和声保留继承了我们全新研发的DangoNet5神经网络架构的优点，性能相较上一代再次得到大幅度提升。

得益于全新的架构以及33%的额外训练素材的加入，新算法获得了16.44dB的SDR分数，而10.0的分数为16.03dB，这意味着生成的带和声伴奏更贴近于“真实原曲”。

全新架构我们引入了双倍的注意力机制，让AI每次分离时可获得的上下文更多——就像是AI聊天更不容易忘记“之前聊过”的内容一样，得益于更多的上下文记忆，新算法可以更准确的从歌曲中分析出主唱与和声的差异，并减少主唱忽然出现、消失的问题。

新算法基于DangoNet5架构，而本代的架构主要优化目标是“听感”，新的和声保留算法生成的伴奏相较于上一代，进一步的减少发闷、伪影残留（如滋滋声）的问题，伴奏更加饱满、残留更少，全新11.0的“智能”算法就已经超过10.0的“保守”算法。

我们也在上线时同步增加了“三轨分离”功能，11.0的和声保留和10.0相同，同样支持三轨分离，可以一次分离就得到伴奏、主唱、和声三轨的输出，具体使用教程可以点击查看此篇文章。

需要和小伙伴们说明的是，本代的更新主要倾向于听觉优化、减少伴奏乐器丢失的问题，和声提取错误的问题我们并没有特意优化，尽管更长的注意力机制可以有效缓解此问题。如果您在使用和声保留时遇到提取错误、混乱等问题，您可以使用我们的和声保留高级修复算法（点我查看），来自助修复提取问题。

至此，11.0的全系列算法全部完成。上文我们说到，我们没有主动优化和声保留的某些“提取错误”问题（尽管被动的因为网络性能提升和注意力增加，该错误会得到缓解），这主要归因于目前的瓶颈问题，目前的网络很难继续靠“堆训练数据”来得到提升，因为商业歌曲的主唱/和声的范式团子早已经学习，并可以在绝大多数商业歌曲中正确的运行，但在部分歌曲中，存在识别异常的问题，导致主唱意外残留或和声丢失，而这些“反范式”的歌曲很难靠进一步的学习素材来提取，目前您可以使用我们的高级修复算法来完成自助修复，我们将在未来专注于研发一套“彻底解决”的神经网络架构，从根本上让神经网络可以在整首歌曲一致性的分离，敬请期待😘

返回到团子博客