【24年05月】团子AI研发日志
Dango AI · 2024-06-03 预告
【24年05月】团子AI研发日志

和声保留10.0已上线

本月上半旬,我们成功发布了和声保留10.0算法,作为10.0系列算法的最后一员,和声保留的训练和实验的过程,相比之前耗时更久,因为我们希望借助我们自研的DangoNet4的高性能架构来一举解决和声内一些提取错误问题,不过这个结果即“成功”又“失败”。

成功在于10.0的提取性能、听觉以及稳定性要比9代更强;在我们测试的复杂和声歌曲中,它相比上一代处理的更好,可以正确的识别和声和主唱的位置,但一些极少部分的复杂的歌曲仍然“难以胜任”,团子希望在10.0的世代就彻底解决和声提取错乱的问题——

高级修复算法已上线

在我们研发和声保留10.0的同时,我们就已经在内部秘密开发了一种新型的架构,我们遇到的一切“和声保留错误”的问题,归根到底都是我们的AI在某些情况下,无法认知“谁是主唱谁是和声”,由此产生了各种浮于表面的听觉问题。

只要我们解决根本上的“无法识别”问题,和声保留提取错误的问题就可以成为历史,所以我们推出了全新的【可控和声保留】算法,您可以提供一个样本给该算法来辅助它提取和声,而样品就是“您希望删除的人声、它听起来是什么样的”。

经过我们的实验、测试和优化,它非常的“好用”!👻👻它可以在任意的多人声唱歌环境下,删除不需要的声音,保留其他声音:

audio-thumbnail
Raw
0:00
/0:06
audio-thumbnail
Girlonly
0:00
/0:07
audio-thumbnail
Manonly
0:00
/0:07

感兴趣?高级修复算法已上线,点此阅读完整的使用教程>>

接下来?

目前我们的10.0算法的研发已经完成,接下来我们会带着10.0算法的“DangoNet4”架构来“反哺”至任意乐器分离功能,我们预计需要3个月左右的时间能将我们的模型全部升级至4代,目前我们已经快速实验了电吉他和木吉他的4代训练,在收敛阶段性能均超过3代0.3db左右的SDR值,听觉和表现上也都变得更好,我们将在下个月开始向您报告任意乐器分离的研发日志,敬请期待😇😇