
5月初我们上线了新的任意乐器分离功能,全新的提取能力和音质获得了大量的好评,同时也获得了一些和第三方深度合作的机会,本月我们仍然紧密的进行着团子的功能更新,本月研发日志已经释放🤗
无损升降音调更新
无损升降音调更新至二代算法,能进一步增强音频中清脆感和准确度,同时减少了音频中“错调”的问题,目前我们的AI无损升降音调算法仍然领先于传统算法一大截,欢迎带上最好的耳机进行随意对比试听哦~
任意乐器分离提供更多的二代算法
如今,人声、鼓组和贝斯也升级为新的算法,提供更少的残留和更好的提取效果,这些算法暂时不提供“优化伴奏而不是乐器”的选项。后续我们将进一步更新电吉他和木吉他的二代提取能力。
编辑器更新
音频编辑器更新了内存占用和稳定度,并且新增了“叠加音轨时以播放音量为准”选项,可以做到将 A 轨叠加至 B 轨时,按照 A 轨当前播放音量叠加,而不是 100% 音量。
伴奏人声分离第九代算法开始研发
本月我们再次筹备到约12000个原始分轨数据,这些数据可能需要两个月左右时间来标注和清洗,按数据的质量可能筛选清洗得到约2000~3000对高质量训练数据,这足够为我们的AI学到更多的新内容。
这些新的数据也会同时作为我们未来研发的“多人声分离”的训练素材,相当于筹备一次数据可以让两种AI获利🥰
与此同时,本月初我们的9.0算法也已经开始实验,目前已经至进行第三次实验,前两次的实验我们已经找到了一些进一步优化的思路,给我们的第九代算法的研发提供了一些目标。

我们将伴奏人声分离的优化目标设定为两种:
- 拟合能力:拟合能力可以理解为“对各种各样的人声的理解能力”。如果拟合能力差会导致“伴奏里丢失乐器”或者“伴奏内有一些顽固短人声无法消除”。
- 精细提取能力:精细提取能力缺失会导致“毛刺感”、“发闷”或“滋滋声”等杂音残留问题,他会导致整个伴奏都产生出“不自然”的失真感。
团子从5代算法一直到目前的8代算法一直在优化精细提取能力,基于我们自研的WMIR架构能有效减少伴奏内的不自然杂音产生。但我们的拟合能力仍然不足,第9代算法我们将修改架构,着重优化拟合能力,9代算法可能第一时间的“听感”和第8代差不多,但会进一步减少丢失乐器或顽固人声无法消除问题。这将是个非常大的挑战,目前的源分离提升1%都非常艰难,但我们仍然会无惧险阻,为用户提供最佳的提取能力😇
接下来?
在中长期,接下来数月我们会筹备新的训练数据以供AI使用,新的第9代算法与“多人声分离”也将开始研发。在短期,下个月预计更新任意乐器分离的批量上传功能,还请敬请期待😇