【25年09月】团子AI研发日志
团子AI · 2025-10-07 预告
【25年09月】团子AI研发日志

( ̄ω ̄( ̄ω ̄〃 ( ̄ω ̄〃)ゝ国庆节快乐

本月我们更新了11.0和声保留算法,至此团子11.0系列的更新全部完成。

在未来的几个月内,团子的重心将重新回归到研发状态,原本计划我们接下来将发布“混响回声移除”的去回声能力、以及全新的“现场声音移除”功能,但这两项功能的“排期”可能会略有延期。

我们在今年早期时一直致力于研发“音频音质修复”功能,但经过一个多月的研发,我们发现无法达到预期的性能,所以暂时搁置此功能的开发,上个月我们发布了“音质损伤分析”功能,其实该功能本身就是音频音质修复功能的“前置”能力,要想修复音频的音质,首先需要识别出音频哪里有损伤,也就是将修复的任务拆解为“识别”和“修复”——前者相对来说较好实现,而后者却不简单;我们始终无法获得较好的修复结果,故将识别模块单独拆分为小功能供小伙伴们使用,以便即便没有音频经验的“小白”也能知道手里的音频是否存在损伤问题。

但当我们从尘封的仓库找出这个模块时,团子的研发团队希望“再博一次”🧐我们决定重启“音频音质修复”的研发进程。

在上次的研发时,我们提到如果修复的质量理想状态是10分的话,我们只能自我评估给出2分,仍然是玩具水平,无法“拿得出手”的程度,但好消息是,我们其实已经开始了研发的进程,并且得到了相较上次非常大的提升(我们自评为4分🤓☝️),新的实验算法可以有效的生成高频内容,这是之前我们一直没有走到的地方,但目前高频内容仍有很大需要提升的地方。

和上次相同,我们可能需要1-2个月的研发时间来看看我们能走“多远”,在此阶段我们可能会将其他确定性更新内容延后,如果我们的实验能达到6分,我们会开始正式制作此功能并将性能提高到7-8分,如果性能不足,这也是我们的宝贵经验,上一次的研发其实对11.0的“反哺”作用很大,11.0的提升有一部分就是因为我们研发的“副产物”得到的,本次无论成功与否,都会让团子的研发团队和未来的算法得到一次新的飞跃,小伙伴们敬请期待👻