【25年12月】团子AI研发日志

团子AI · 2026-01-03 预告

小伙伴们新年快乐🎉🎉🎉

2025总结

在整个2025年，团子推出了混响回声移除功能、全新的11.0系列伴奏人声提取算法以及全新的音频工具组系列快速工具。

实际上团子的研发效率并没有我们想象中那么“理想”，我们在年初时尝试研发“有损音频修复”但屡遭失败、经历了2个月的折磨实验最终以失败告终，而新的11.0系列算法甚至在年中时才发布，我们在之前就提到过，以目前的算法高度来说，接下来提升1%都是“巨幅提升”，这导致我们需要更久的研发周期和更多的实验才能突破之前的高度。而混响回声移除以及新的音频工具组反而是基于我们现有技术的补充，所以从立项到上线的速度都会快的很多。

但不管是哪一项工具，团子都秉持着“工具、不是玩具”的想法，每一项工具都经过更多的堆料、更多的实验来确保团子的工具和其他网站/应用的与众不同，尽管由于提升越来越困难导致研发周期越来越长，但在2025年团子的研发团队每时每刻都没有松懈，我们的研发机器全年无休的跑着实验和训练，我们的工程师时刻的创造新想法、实验并研发，我们有时会半夜突然醒来惦记着睡觉之前启动的实验，紧张的观察指标动态，只为了将最“猛”的算法提供给小伙伴们使用。

展望2026年

上线“音频音质修复”功能

在12月，我们的音频音质修复已经进行了最后的“收尾”工作，该功能的主体AI算法已经完成，这也是给2025年的一个圆满交代，我们年初时决定研发该功能屡遭失败，而年底时我们重新挑战并成功毕业。

我们的音频音质修复功能以1-10分自我评价的话，我们可以毫不夸张的给出至少8分的成绩，该算法输出的音频可以达到难以辨别级别的程度，堪称“恐怖如斯”👻

而作为参考，我们以开源的Apollo、AudioSR等类似产品作为评价，我们只能给出1分的成绩，团子的音频音质修复可以达到无缺陷级别的输出——没有任何的伪影，输出有效的高频（包括谐波）而不是一团“嘶嘶响”的搞笑噪音，并且团子的输出经得起“听”、也经得起“看”，在频谱分析工具上我们找到一系列的音频工程师测试者，大多数歌曲均无法区别原始无损音频以及团子恢复出的音频的区别，该功能可以作为团子在音频领域耕耘数年的“大成者”，敬请期待。

预计我们将在1月底之前发布该功能，目前网络的模型已经训练完毕，我们还需要制作向您交互的网页界面、优化模型的推理速度等一系列后续任务，当全部完成后该功能立刻会向小伙伴们面世。

上线“现场声音移除”功能

用来移除“现场版（Live）”音频的欢呼声、尖叫声、鼓掌声以及过于厚重的混响和低频声音，来达到一键将现场版声音转为类似录音棚实录的效果。音频音质修复功能上线后，我们还会上线两个回声移除模型，在那之后我们会开始研发此功能，相对于“音频音质修复”这种创新型功能不同，现场声音移除将会是我们的研发“舒适区”，所以预计上线速度也会很快~

上线12.0系列“伴奏人声提取”算法

对于12.0，我们现在已经有了一些目标，12.0将着重在两个点上进行优化：

进一步减少提取错误问题。
更好的听感。

其中更好的听感对于现在的团子来说已经卖点之一了，团子的算法相对于其他网站/软件来说主要区别就是接近原曲的听感，没有伪影、毛刺、发闷发糊的恍惚感，但这还不够！🧐我们12.0将再一次提升输出听感，给小伙伴们带来前所未有听感体验。

而有关进一步减少提取错误问题，我们的12.0研发路径预计可能有所变动，之前我们每次更新都是“伴奏人声提取”->“更好人声提取”->“和声保留”的路径，而12.0我们可能会完全反过来，我们会将大多数的研发精力放在和声保留上，在11.0的研发报告中我们提到，和声保留如果需要进一步的性能提升，提高算法“脑容量”或者增加训练素材的路线已经走不通了，我们需要在网络本身上进行创新，来保证和声保留算法在整首歌拥有一致性的提取能力，而不是提取断断续续、时有时无或认错主唱和声，这也是我们12.0算法的主要目标打算，我们将对提取错误的问题进行深入的研究和创新，如果研发成功我们会首先应用到和声保留来测试提取性能，接下来我们会在“更好人声提取”上测试我们新的听感提升能力，预计会输出前所未有的清晰人声，最后我们会推出“伴奏人声提取”来集大成——听感和更好的提取我全都要👻

再次祝小伙伴们新年快乐，2026年团子将变得更加逆天，敬请期待👻

返回到团子博客