结果:找到“语音分离”相关内容8个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
使用部分异步麦克风阵列的语音分离 重采样
0 个回复 - 213 次查看 摘要翻译: 我们考虑了由多个空间分离的设备捕获的语音源的分离问题,每个设备都有多个麦克风,并以稍微不同的速率对其信号进行采样。大多数异步阵列处理方法依赖于采样率偏移估计和重采样,但如果信源或麦克风在移动 ...2022-4-11 12:50 - 能者818 - Forum
基于性能的端到端语音分离代价函数
0 个回复 - 408 次查看 摘要翻译: 最近的神经网络源分离策略试图通过直接处理音频信号的波形来建模音频信号。均方误差(MSE)度量去噪语音波形与地面真值语音波形之间的欧几里得距离,是这些方法的自然代价函数。然而,MSE不是一个知觉动机的 ...2022-3-25 22:55 - nandehutu2022 - Forum
在鸡尾酒会上倾听:一个说话人独立的人 语音分离视听模型
0 个回复 - 319 次查看 摘要翻译: 我们提出了一个联合视听模型,用于从其他说话人和背景噪声等混合声音中分离单个语音信号。仅使用音频作为输入来解决这个任务是极具挑战性的,并且不能提供分离的语音信号与视频中的扬声器的关联。在本文中 ...2022-3-23 20:15 - 可人4 - Forum
具有展开迭代相位的端到端语音分离 重建
0 个回复 - 217 次查看 摘要翻译: 提出了一种端到端的单通道非特定人多说话人语音分离方法,将时频(T-F)掩蔽、短时傅立叶变换(STFT)及其逆变换表示为深层网络中的层。以前的方法不是计算重构信号上的损失,而是使用基于目标STFT幅度的替 ...2022-3-8 20:59 - 何人来此 - Forum
非特定人深度模型的置换不变训练 多话者语音分离
0 个回复 - 308 次查看 摘要翻译: 我们提出了一种新的深度学习模型,该模型支持置换不变训练(PIT),以解决与说话人无关的多说话人语音分离问题,即通常所说的鸡尾酒派对问题。不同于大多数现有技术将语音分离视为多类回归问题,以及深度聚 ...2022-3-6 15:16 - nandehutu2022 - Forum
TASNET:用于实时、 单通道语音分离
0 个回复 - 647 次查看 摘要翻译: 多说话人环境下的稳健语音处理要求有效的语音分离。最近的深度学习系统已经在解决这个问题上取得了显著的进展,但它仍然具有挑战性,尤其是在实时、短延迟的应用中。大多数方法试图在混合信号的时频表示中 ...2022-3-6 14:58 - 何人来此 - Forum
基于卷积的多通道语音分离与增强 传递函数
0 个回复 - 277 次查看 摘要翻译: 本文在已知混合滤波器的前提下,研究了多通道卷积噪声混合语音的分离和增强问题。我们提出在短时傅立叶变换域中使用卷积传递函数(CTF)近似来执行语音分离和增强任务。与时域滤波器相比,CTF具有更少的抽头 ...2022-3-5 19:46 - 何人来此 - Forum
基于话语级置换的多说话人语音分离 深层递归神经网络的不变训练
0 个回复 - 534 次查看 摘要翻译: 本文提出了话语级置换不变训练(uPIT)技术。uPIT是一个实用的、端到端的、基于深度学习的独立于说话人的多说话人语音分离解决方案。具体来说,uPIT将最近提出的置换不变训练(PIT)技术扩展为话语级代价函数 ...2022-3-3 16:31 - kedemingshi - Forum