【26年01月】团子AI研发日志
Dango AI · 2026-02-05 新功能预告
【26年01月】团子AI研发日志

2026你好!(虽然已经到2月份了)

本月我们上线了重磅菜系“有损音频修复”,这是全网首家为有损音频考虑的成熟商业方案,可以“认真的”重建有损音频带来的高频丢失、能量缺损、相位破坏的问题,而不是目前市面其他方案的“糊弄重建”👻

目前上线仅一周时间,我们本认为该功能受众比较“冷门”,但一周的使用量远超我们想象,同时我们也收到很多的反馈,部分小伙伴对“有损音频修复”到底能做什么还不太清楚:

有损音频修复 是否支持?
MP3、OGG等有损压缩音频重建
上采样缺失修复 下版本支持
非压缩导致的音频本身缺陷 ×
因为伴奏提取导致听感缺陷的修复 ×

有损音频修复设计初衷是修复因为MP3、OGG等有损压缩编码导致音频出现缺陷、发闷发糊问题,而部分小伙伴上传的音频是小于44100的低采样率音频并希望“上采样”到44100/48000的程度,但团子在最初设计中并没有包含该修复能力,所以目前暂不支持该能力的修复。

另外,音频本身的缺陷(如某些杂音)团子无法修复他们,团子拥有严格的“置信点”机制,严格的确保重建后的音频听感上符合原曲,好处是修复不会“乱修”,但相应的,也导致了原曲本身如果有杂音,团子也会忠实的保留这些内容(但其实除非是那种“录音磁带”风格的音频,99.99999%大多数音乐没有什么杂音,不用考虑此问题😘)

最后,部分小伙伴将团子的其他功能(如伴奏人声提取)的结果发送到有损音频修复,希望增强提取效果,但实际上就像刚才所说,团子的输出严格忠于原曲听感,只会重建高频和中低频能量缺陷,不会“修改”原曲本身的内容,所以无法带来任何的听觉改进,但如果小伙伴本身的音频是MP3等有损音频,可以“先有损修复、后伴奏提取”的流程,理论上可以一定程度的增强伴奏提取的性能,但如果小伙伴有能力直接找到无损音频版本,直接上传原始无损音频到伴奏提取功能当然相较来说是最好的🤔

本月我们还增加了一个新的音频工具“视频音频替换”,顾名思义可以将一个视频内的音频替换成另一个音频,如果小伙伴们身边没有专业工具可以使用该功能“临时顶一顶”👻

本月我们还更新了桌面端和APP端的版本,全部支持了新的“有损音频修复”功能,APP端额外的支持了英语和繁体中文的语言选项,小伙伴们可以按需使用👻

接下来?

由于有损音频修复的反馈较多,我们考虑在近期提升到2.0版本算法,2.0的目标支持上采样丢失修复和抖动伪影(dither)修复,这些提升是“增项”,只是增加了更多的修复能力,并不影响1.0目前的有损音频修复能力,小伙伴们如果需要“有损音频”的修复,当前的1.0算法和未来的2.0算法性能理论上是相近的,所以不用“等到2.0再说”👻

有损音频修复的训练耗时可能较长,目前暂时没有完成时间的公布计划,但我们会尽快完成2.0算法的发布,敬请期待~

同时,我们的“现场氛围移除(名称暂定)”也在开始数据筹备阶段,预计2月底完成数据最终的筹备和清洗,我们随即将开始实验和训练,但该功能相较来说比较简单,属于“移除类”功能,属于团子的“舒适圈”🤡,所以发布时间也不会太慢。

最后,我们的混响回声移除的“去回声”算法仍在训练中,会在其他功能中间穿插的发布。