【24年12月】团子AI研发日志
Dango AI · 2025-01-01
【24年12月】团子AI研发日志

首先祝小伙伴们元旦节快乐~

12月团子主要仍以“混响回声移除”功能为主,并在12月底成功的上线了该功能。混响回声移除的开发中,我们一方面目标为推出移除混响,而在隐藏的另一方面,我们也在尝试实验并应用我们新的架构技术🧐尽管这减慢了新功能的上线速度(大致延缓了我们一个月左右的上线时间),但也为了未来的新算法如伴奏人声提取进行了一些有效实验。

有关“混响回声移除”的特性以及团子的优势,可以点击这篇介绍文章。

目前我们混响回声移除仅上线了针对人声混响的“人声模型”,我们也在同步的实验并训练针对乐器的“乐器模型”,预计在1月底-2月中左右会发布该模型。

同时,我们也在为下一个功能进行初步实验,很抱歉目前仍不能透露有关下一个功能的信息(主要是如果实验并不能达到我们理想程度,我们会考虑放弃该功能的开发🧐),现在可以透露的是——我们目前正在制作一个模型,可以分析出音乐频谱的“美观”程度,美观程度听起来很抽象,但对经常和频谱打交道的音频工程师来说可能很有印象,如有损音频的破洞、颗粒,或某些频率的噪音、线条,又或者频谱看起来“不光滑”、“坑坑洼洼”,都会让频谱整体变得“很难看”

高频杂音、频谱破洞等不“美观”的频谱

这些不“美观”的频谱既会影响视觉,也会影响听觉,比如“不平滑”的频谱听起来会有“恍惚”感,而我们正在设计一个能自动识别并评价这些频谱素质的系统,这可能会提升我们未来团子的提取分离素质。