【音频工具】音质损伤分析功能算法已升级
团子AI · 2025-12-15

在“音频音质修复”的研发中,需要识别音频是否有损以及损伤的程度,目前“音频音质修复”正在有序研发中,而它的“副产物”——音质损伤分析功能,已经升级到了V3版本,目前已经发布,现在上传的文件将使用V3的分析算法,分析更准确。
V2(代号:灵魂/psyche)的音频损伤识别算法,在发布之前一直在团子的内部使用,用来进行数据处理和过滤,随着时间发展和使用时,我们逐步发现该算法的准确性仍需提升,在本轮的音频音质修复中,我们也重新的更新了新的分析算法——更多的学习数据以及更强壮的架构。
全新的V3算法(代号:复视/diplopia)在我们内部测试中,性能和准确性获得了巨大的提升,您的文件将被细化到更多的特征去进行识别,就像是用放大镜仔细的观察您音频的内容和频谱一样。
直观上V3算法进行了两点的提升:
- 对“有损无损内容混合”更加敏感。现代的音乐多数为数字创作,而非以前的“实录”音乐,数字创作将音频变为一条条的轨道,轨道可能是乐器、可能是某些简短的采样或者FX,现代音乐逐渐模糊了有损和无损音频的界限——即便输出的是无损音频格式,但可能音频中用到了某些“采样”是有损的(常在大量电子音乐的FX中可见),这导致了有损和无损内容混合的情况,团子提高了此类歌曲的识别能力,这类歌曲出现时,团子会提示“有损无损混合”的情况。当然,团子正在研发的音频音质修复功能,同样支持有损无损混合的修复能力🧐
- 对“AI生成”更加敏感。我们注意到目前已经出现了某些“AI修复”的音频,和团子即将发布的音频音质修复类似,不过处理更加粗糙,这些算法可能是从某些裁剪点开始进行上采样(如AudioSR算法),但并不会修复中低频的内容,在V2算法中网络会注意音频的高频内容,这些上采样算法可能会填补高频内容,导致V2算法在某些情况下误判为无损音频,V3算法对此问题进行了大量改良,现在网络会关注全频而非仅仅高频,即便您使用上采样算法进行高频补充,网络仍然能识别为有损音频🧐
另外,团子的音频音质修复正在有序开发中,我们尝试过“矛与盾的问题”🧐使用团子修复的结果和V3算法的检测,结果V3算法均输出为“无损音频”,我们对此的结果感到激动,团子的全新音频音质修复功能将会是您从没有见过的修复质量,符合团子的“工具、不是玩具”的价值观,小伙伴们敬请期待👻









