【25年09月】团子AI研发日志

团子AI · 2025-10-07 预告

(￣ω￣(￣ω￣〃 (￣ω￣〃)ゝ国庆节快乐

本月我们更新了11.0和声保留算法，至此团子11.0系列的更新全部完成。

在未来的几个月内，团子的重心将重新回归到研发状态，原本计划我们接下来将发布“混响回声移除”的去回声能力、以及全新的“现场声音移除”功能，但这两项功能的“排期”可能会略有延期。

我们在今年早期时一直致力于研发“音频音质修复”功能,但经过一个多月的研发，我们发现无法达到预期的性能，所以暂时搁置此功能的开发，上个月我们发布了“音质损伤分析”功能，其实该功能本身就是音频音质修复功能的“前置”能力，要想修复音频的音质，首先需要识别出音频哪里有损伤，也就是将修复的任务拆解为“识别”和“修复”——前者相对来说较好实现，而后者却不简单；我们始终无法获得较好的修复结果，故将识别模块单独拆分为小功能供小伙伴们使用，以便即便没有音频经验的“小白”也能知道手里的音频是否存在损伤问题。

但当我们从尘封的仓库找出这个模块时，团子的研发团队希望“再博一次”🧐我们决定重启“音频音质修复”的研发进程。

在上次的研发时，我们提到如果修复的质量理想状态是10分的话，我们只能自我评估给出2分，仍然是玩具水平，无法“拿得出手”的程度，但好消息是，我们其实已经开始了研发的进程，并且得到了相较上次非常大的提升（我们自评为4分🤓☝️），新的实验算法可以有效的生成高频内容，这是之前我们一直没有走到的地方，但目前高频内容仍有很大需要提升的地方。

和上次相同，我们可能需要1-2个月的研发时间来看看我们能走“多远”，在此阶段我们可能会将其他确定性更新内容延后，如果我们的实验能达到6分，我们会开始正式制作此功能并将性能提高到7-8分，如果性能不足，这也是我们的宝贵经验，上一次的研发其实对11.0的“反哺”作用很大，11.0的提升有一部分就是因为我们研发的“副产物”得到的，本次无论成功与否，都会让团子的研发团队和未来的算法得到一次新的飞跃，小伙伴们敬请期待👻

返回到团子博客