
小伙伴们大家好👻
我们在昨天半夜时更新了全新的有损音频修复功能,正如我们发布日志所认为的,这是个“小众”且“冷门”的功能,但意外的在我们发布后半日内就收到了大量使用和反馈👻,本篇文章我们整理了一些常见问题以及解答。
团子有损音频修复功能,适合与团子其他工具协助使用吗?
首先无论何时,团子都推荐您在使用团子任何功能时均优先上传无损音频文件,以确保最佳的处理效果。
如您的音频过于冷门或无法获取无损音频文件,团子有损音频修复功能可以帮助您重建有损压缩所丢失的高频音色、谐波和包络能量,从而提升音频质量。我们建议首先您先将原始文件修复后,再上传至团子其他功能进行处理,以获得更好的最终效果。
但还请注意,尽管使用修复后的结果通常会优于直接使用有损音频文件,但由于有损压缩所丢失的信息无法完全还原,修复效果可能因音频文件的不同而有所差异,请根据实际试听效果决定是否使用修复后的音频进行后续处理。
另外,团子有损音频修复的主要目的是“修复有损编码音频”,而团子其他功能(如提取类工具)的输出有可能偶发出现提取质量不佳的问题(比如发闷发糊),这并不是有损音频修复可以修复的,二者的叠加无法带来任何收益,但该功能的研发也给了我们未来研发其他功能新版本的灵感,未来其他工具的算法(如伴奏人声提取12.0)将会吸收该功能的灵感,得到更加完美的输出👻。
为什么我的有损音频修复的不太好?
目前团子有损音频修复1.0算法仅支持“有损压缩编码格式音频”的重建,比如MP3、OGG或者各类常见有损压缩编码的无损修复,在这些文件中,团子可以很好的重建音频质量。
我们目前收到的反馈不佳的样本大致如下:
下采样损伤:将一个下采样音频(如8000hz音频)上采样到44100hz,团子在学习时并没有学习下采样损伤的解决方法,故此类音频无法得到修复或修复但效果不佳。
二次损伤文件:有些小伙伴们上传的音频反而是“WAV”或者“FLAC”这种无损音频(但音频内容是有损的),和团子其他功能推荐上传无损功能相反,该功能团子希望用户直接上传原始压缩文件,如MP3这类型的文件,这些压缩编码的文件的元信息反而能帮助团子更好的修复音频,而如果您的MP3转成了“无损音频”,有可能会导致位深度错乱从而出现“抖动伪影”,看起来高频有一些白噪声,由于团子没有在抖动伪影的情况下进行修复学习,反而可能将这些白噪声当成了原曲的一部分从而衰弱修复强度。简单来说您直接上传原始的有损压缩文件即可得到最佳性能。
刻意截断频率的文件:和下采样损伤类似,这些文件并没有有损编码的特征,而只是从某个截止点往上音频能量全部丢失,由于团子没有学习此类文件的恢复方法,故无法正确修复音频。
录音老音频:团子不支持老旧磁带风格的录音型(或者使用后期软件模拟的)音频的修复,团子有损音频修复从设计之初就考虑输出要严格遵守原曲,老旧录音包含多种破坏,不但有高频的丢失,还有中低频出现尖锐或浑浊的杂音,团子设计之初不会考虑修复音频内的杂音,这会破坏或改动原始音频的声音——与我们设计不符合,未来我们会考虑单独设计录音老音频的修复方案,但主要的重建算法不会支持这类文件。
团子有损音频修复还会更新吗?
非常会!正如上面我们整理的几种无法恢复的文件,以及我们还会接受进一步的反馈,在不远的未来我们仍然会更新算法来支持更多类似的“有损音频”,尽管我们设计之初该功能只是用来修复“有损压缩编码”的文件,但未来我们会考虑支持下采样损伤音频、抖动伪影二次损伤音频等其他风格的有损音频。
这些类型的文件支持起来并不困难,只需要让我们的AI能“见过”这类音频并知道如何修复即可~我们可能在近期加入2.0算法的更新计划,我们将在下月初的研发报告公开进一步的研发动向。












