【26年03月】团子AI研发日志
团子AI · 2026-04-01 预告
【26年03月】团子AI研发日志

本月我们在进行有损音频修复V1-Max的最终研发,并在月底前成功发布,全新的V1-Max不但拥有更大的模型参数,也包含了数个改进地方:支持低采样率失真的修复、支持抖动(Dither)损伤的修复、大幅度减少V1模型的爆音问题,并且生成的高频大幅度减少了因为相位预测错误导致的“预回响(Pre-Echo)”问题,这使得高频的声音会更“紧实”、声音更大、也更清脆。

我们还新增了一个小工具“音频盲测投票”,该功能可以在匿名无偏见的情况下,对多个声音进行评分,并随时可以揭露评分结果,该功能免费,小伙伴有需要可以自助使用😇

接下来?

有损音频修复功能的V1-Max是我们的“大乘之作”,已经将V1发布后遇到的数个问题均完美解决😇我们可以很荣幸的再次和您介绍,团子的有损音频修复功能是截止到目前为止,全网对有损音频修复唯一的成熟解决方案,并且修复的质量并不是“糊弄”,而是超高标准的重建音频损伤的谐波纹理、能量和相位,这点每一位使用过的小伙伴均可以感知。

尽管很不舍,该功能已经达到一定的边际效应(也就是提升1%可能需要300%的研发投入),目前我们将暂时“毕业”有损音频修复的研发,将按照我们的年计划开始研发其他功能,并且将有损音频修复的经验和架构也当做“前置科技树”去反哺其他功能的输出性能🧐

4月份我们将投入到“混响回声移除”的“去回声”模型研发,之前我们介绍过混响一般比较短(几百毫秒到几秒),但回声可能会更长,为此我们研发了一个改进的神经网络,“专治”远程音频提取问题,该实验花费了相当多时间,不过我们直接报喜——在我们多次实验中,该网络已经研发成功,目前只需要一定时间将该功能训练完毕即可😇

我们预计5月初~5月中旬期间发布去回声模型。尽管时间可能有些久,但去回声模型的技术也会当成我们的“前置科技树”来反哺未来的其他功能🧐