团子的全部功能都推荐您上传时提交“无损”的音乐,越清晰的音频提交给团子,处理的效果相对来说就会越好,因为部分有损压缩的算法可能会删除一些人耳难以听到的声音来保证歌曲的文件大小,但这些声音对于团子的音频分离可能会有一些辅助作用,有损格式可能会让团子的分离效果达不到满意的程度。
首先我们要了解一个最基本的概念,就是音频的“格式”,常见的如“MP3”、“FLAC”、“WAV”之类的格式,一般按后缀名来区分,每种格式可以理解为不同的“容器”,有的容器是无损容器,有的是有损容器:
- MP3: 有损压缩容器。会删除歌曲的部分声音来减少歌曲的文件大小,拥有几种不同的压缩程度,但无论什么样的压缩率如何都会破坏歌曲原有的信息导致音质损伤。
- WAV:无损容器。它可以完整的包含声音的信息,不会损伤任何音质,缺点是文件非常大(一般是MP3的5~10倍大小,如MP3的歌曲可能5MB,WAV要50MB大小)。
- FLAC:无损压缩容器。和MP3的“有损压缩”不同,FLAC可以在不损失任何音质情况下压缩音频的体积,相当于占据了MP3和WAV的共同优点,团子返回给您的文件即为FLAC格式的。
以上是一些常见的音频容器格式,音频有数十种格式无法为您依次介绍,但细心的您可能会发现我们一直说的一个词叫做“容器”,没错,一个容器决定了音频的上限(即为是否能做到无损),但容器的内容,也就是音频本身的声音才是决定是否无损的关键。
想象一下,我们有一段真正无损的音频(如一个WAV格式的),这时候我们将这个音频转为MP3格式,这个MP3音频就会永久不可逆的丢失音质了,此时可能会有人认为“那我用这个MP3重新转回WAV不就好了”,但因为音质已经永久丢失了,即便我们将MP3转回WAV,尽管它的容器重新变回“无损容器”了,但容器里的内容已经经过了“折腾”导致永久丢失音质了,所以这就相当于“无损的容器装着有损的歌曲”。
进一步我们可以举一个抽象的例子,我们有1升的水,放在一个刚好1升的瓶子里,这个1升的瓶子就是“无损容器”。此时找来一个100毫升的、只有原始十分之一大的瓶子,把水倒入,会导致丢掉900毫升,这个100毫升的瓶子就是“有损容器”,最后我们小瓶子的水重新装入大瓶子中,就会变成一个1升的瓶子里装着100毫升的水,尽管从瓶子上来看是个“无损容器”,但从内容物来看,已经产生损失了。
所以擅自的转换格式或者修改后缀名的方法是没有任何作用的,损失的东西就已经永久丢失了,不会因为“小聪明”方法就能奇迹般复原回来的。
所以,如果一个音频一上来就是个MP3格式,那100%是有损的,而如果是一些无损格式,比如FLAC或者WAV,那我们要进一步去打开这个音频来查看是否是无损内容。
我们以电脑端的iZotope RX8来举例,这是一个常用的音频编辑软件,可以查看音频的“频谱图”(其他的如AU之类的软件也可以),我们不用了解什么是频谱图之类的复杂名词,总之在该软件内打开你要查看的音频,并在软件的左下角位置拖拽显示模式为频谱模式,如下图所示。
我们会看到一个乱七八糟的类似火焰一样的图形,这就是一首歌的频谱图,我们直奔重点——看频谱图的“头顶”位置,也就是最上方。以一个相同歌曲的“无损版本”和“有损版本”的频谱图为例:
看出区别了吗?有损(右侧)的音频会删除掉这个频谱图的“上方”内容,频谱的上方代表着“高频内容”,可以简单理解为“高音”,也就是有损格式会删除掉音乐里的高音内容来减少歌曲的体积,所以我们经常听到一些特别有损的声音都会“很闷”或者“很糊”就是来源于此,最简单的判断是否有损的方法就是查看频谱的高频程度,是否有很突兀的“剪切”现象,如果有,那一定是有损的。
进一步的,我们还可以放大频谱(用鼠标滚轮),显示如下图:
可以看到右侧的有损图片在圈住的位置,有一些“黑色”的破洞(看起来像是黑点),这些都是压缩算法导致的,这些破洞可能是一些人耳不敏感的声音,被有损算法删除掉来节省音频体积,但这些破洞的本身内容可能会辅助团子提取出更好的结果。
当然,还有一些方法能欺骗这种频谱图的查看,比如复制某些中频到高频、比如镜像频谱等等的“假无损”,但这些经过训练也能一眼看穿,不过对于99%的歌曲来说不用考虑这些内容,不在本次讨论范围之内。
所以最终结论就是,如果遇到有损容器格式的音频(如MP3),那肯定是有损的,只不过是损伤程度有多大罢了,但无论如何都不是一个“好音频”,而遇到了无损格式,我们要进一步的查看频谱图来决定是否为“真无损”,我们推荐您使用无损音频来上传给团子,来提升您的提取效果能力😇😇