【26年03月】团子AI研发日志

团子AI · 2026-04-01 预告

本月我们在进行有损音频修复V1-Max的最终研发，并在月底前成功发布，全新的V1-Max不但拥有更大的模型参数，也包含了数个改进地方：支持低采样率失真的修复、支持抖动（Dither）损伤的修复、大幅度减少V1模型的爆音问题，并且生成的高频大幅度减少了因为相位预测错误导致的“预回响（Pre-Echo）”问题，这使得高频的声音会更“紧实”、声音更大、也更清脆。

我们还新增了一个小工具“音频盲测投票”，该功能可以在匿名无偏见的情况下，对多个声音进行评分，并随时可以揭露评分结果，该功能免费，小伙伴有需要可以自助使用😇

接下来？

有损音频修复功能的V1-Max是我们的“大乘之作”，已经将V1发布后遇到的数个问题均完美解决😇我们可以很荣幸的再次和您介绍，团子的有损音频修复功能是截止到目前为止，全网对有损音频修复唯一的成熟解决方案，并且修复的质量并不是“糊弄”，而是超高标准的重建音频损伤的谐波纹理、能量和相位，这点每一位使用过的小伙伴均可以感知。

尽管很不舍，该功能已经达到一定的边际效应（也就是提升1%可能需要300%的研发投入），目前我们将暂时“毕业”有损音频修复的研发，将按照我们的年计划开始研发其他功能，并且将有损音频修复的经验和架构也当做“前置科技树”去反哺其他功能的输出性能🧐

4月份我们将投入到“混响回声移除”的“去回声”模型研发，之前我们介绍过混响一般比较短（几百毫秒到几秒），但回声可能会更长，为此我们研发了一个改进的神经网络，“专治”远程音频提取问题，该实验花费了相当多时间，不过我们直接报喜——在我们多次实验中，该网络已经研发成功，目前只需要一定时间将该功能训练完毕即可😇

我们预计5月初~5月中旬期间发布去回声模型。尽管时间可能有些久，但去回声模型的技术也会当成我们的“前置科技树”来反哺未来的其他功能🧐

返回到团子博客