【25年07月】团子AI研发日志
团子AI · 2025-08-02

7月份是属于团子的“勤劳月”,本月带来了数个全新的功能🧐
- 伴奏人声提取的音频高级修复功能,如果伴奏提取效果仍然不尽人意,现在您可以进一步的细化编辑有问题的区域,直到您满意为止。
- 和声保留现已支持输出三轨音频,现在和声保留在上传时只要勾选特定选项,就可以输出“主唱”、“和声”和“伴奏”三轨音频了,无论是“让和声音量变大”或者进一步细化后期音频,现在都可以一次性做到了。
- 全新工具系列——音频工具组已上线,无需繁琐的本地软件或专业知识,您可以在团子的网站内完成一系列的操作:转换任意音频格式、分割音频、分析差异、分析BPM节拍和延迟、调节音量——并且这些工具都是免费的。
接下来?
我们本预计在7月底发布“更好人声提取”的11.0算法,在我们内部测试中,效果仍然不太满意,不符合发布的标准,我们将延期该算法的发布时间,预计额外延期到8月中下旬。
即便如此,当前在我们内部测试中,11.0的更好人声提取带来了史无前例的清晰感,大幅度减少了之前算法提取时,人声像是“被捂住嘴巴”一样发闷恍惚感,这得益于我们的DangoNet5架构大幅提升了听感,并且我们对人声自带的效果器(混响、回声)等捕获的更好,现在提取出的人声更类似于母带中的最终人声。目前我们输出仍有一些不满意,需要一定时间的改进,来以最好的状态和小伙伴们会面🧐
8月份我们还会增加新的音频工具——“音质损伤分析”,团子将利用AI分析您的音频,并判断是否存在有损压缩或音质被破坏情况🧐即便没有任何专业知识,您也可以一键分析并确认自己的歌曲文件是否是“有损”或“假无损”文件。该功能为我们上半年希望制作的“音频音质恢复”功能的副产物,由于该功能“难产”,经过数个月的研发仍效果不满意,我们决定将我们当时制作的“分析模型”拆分并公开到网站内供大家使用😭在条件允许情况下,我们仍会考虑音频音质恢复功能的开发,敬请期待。