结果:找到“语音识别”相关内容106个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
银行数字化转型综合指数(2012-2021)
17 个回复 - 2036 次查看
数据类型:年度非平衡面板
银行数量:50家+
数据处理:通过统计银行年报中涉及“数字化转型”的词频来刻画其转型程度,具有可行性和科学性。具体而言,借助Python 爬虫功能对中国上市银行年度报表进行爬取,并采用 ...
2022-10-5 16:10 - wueny1205 - 现金交易版
语音识别和智能家居控制开发套件实验
1 个回复 - 516 次查看
语音识别和智能家居控制开发套件实验
语音识别和智能家居控制开发套件实验
语音识别和智能家居控制开发套件实验
语音识别和智能家居控制开发套件实验
语音识别和智能家居控制开发套件实验
语音识别和智 ...
2021-12-23 21:23 - Tiger-like - 现金交易版
基于Python自动语音识别代码
0 个回复 - 562 次查看
基于Python自动
语音识别代码
更详细的内容,请参考下面的截图说明为准!
基于Python自动
语音识别代码
基于Python自动
语音识别代码
基于Python自动
语音识别代码
基于Python自动
语音识别代码
基于Python ...
2022-2-8 13:53 - Mujahida - 现金交易版
设计基于语音识别和图像识别的手语翻译软件破茧
2 个回复 - 2197 次查看
价值主张:破茧是一款帮助听障人士和健听人士交流的软件。其使用图像识别、文字识别、
语音识别、语音合成和机器翻译API。[/backcolor]
[/backcolor]
听障人士现状手语类型多看不懂、听不到、说不出是大多数听障人士 ...
2021-5-1 19:36 - G-2000 - Forum
深度学习-语音识别实战(Python)
4 个回复 - 3627 次查看
深度学习-
语音识别实战(Python)
网盘地址:https://pan.baidu.com/s/1vWTSaG7a86DB0kGNWhN1oQ提取码: cfcm
备用地址(腾讯微云):https://share.weiyun.com/aNF2L1IS 密码:ivfk5p
课程概述
基于深度学习的语 ...
2021-2-5 10:17 - 大帅哥很帅的 - Forum
教你怎样用python进行语音识别
0 个回复 - 526 次查看
作者 | 小隐 来源 | 淘气面包 原文 | 教你怎样用python进行
语音识别
网上找到一些例子,有一些成熟的模型,可以将语音转成文字。例如Cloud Speech API,但是需要你使用google云平台的前提。
speech recognition
对于 ...
2022-6-9 11:43 - AIU人工智能学院 - 数据分析师(CDA)专版
人工智能实战之语音识别
0 个回复 - 791 次查看
一、课程背景CDA数据分析师人才教育品牌联合海内外知名讲师团队共同打造AI在线学习解决方案。旨在培养AI时代“十字型”技术精英。人工智能工程师课程中,可以让你在家就能学习机器学习全栈课程,零基础入门,学习知名 ...
2022-3-8 13:40 - AIU人工智能学院 - 数据分析师(CDA)专版
基于远场语音识别的ICD码自动记录
0 个回复 - 353 次查看
摘要翻译:
文档错误增加了医疗保健成本,并导致不必要的病人死亡。作为诊断和计费的标准语言,ICD代码是全世界医疗文件的基础。尽管电子病历的普及,医院仍然见证了ICD错误编码的高水平。在这篇论文中,我们提出了用 ...
2022-4-11 21:40 - mingdashike22 - Forum
基于生成对抗网络的语音研究
用于鲁棒语音识别的去混响方法
0 个回复 - 419 次查看
摘要翻译:
我们研究了生成对抗网络(GANs)在语音去混响中的应用,以实现鲁棒的
语音识别。近年来,GANs已被用于语音增强以消除加性噪声,但仍缺乏对其语音去混响能力的研究,使用GANs的优势尚未完全确立。本文对GaN ...
2022-4-11 14:55 - 何人来此 - Forum
训练具有截断反向传播的递归网络
语音识别中的时间
0 个回复 - 220 次查看
摘要翻译:
递归神经网络已经成为许多语音和语言处理任务的主要模型。然而,我们对递归网络所能实现的行为和功能类别了解甚少。此外,在训练中使用的启发式使分析复杂化。在本文中,我们研究了在
语音识别的背景下,递 ...
2022-4-7 16:25 - 何人来此 - Forum
用策略学习改进端到端语音识别
0 个回复 - 376 次查看
摘要翻译:
连接主义时态分类(CTC)被广泛应用于端到端
语音识别模型中的最大似然学习。然而,负最大似然与
语音识别中使用的性能指标(如误字率(WER))之间通常存在差异。这导致在训练过程中目标函数和度量之间的不匹配 ...
2022-4-1 22:30 - 能者818 - Forum
单转换器打开的多语言端到端语音识别
低资源语言
0 个回复 - 198 次查看
摘要翻译:
基于注意的序列到序列模型将声学、发音和语言模型集成到一个单一的神经网络中,这使得它们非常适合于多语言自动
语音识别(ASR)。在本文中,我们通过一个单一的转换器来研究低资源语言上的多语言
语音识别, ...
2022-3-31 14:20 - 能者818 - Forum
深度上下文:端到端上下文语音识别
0 个回复 - 325 次查看
摘要翻译:
在自动
语音识别(ASR)中,用户所说的话取决于她所处的特定环境。通常,这个上下文表示为一组单词n-图。在这项工作中,我们提出了一个新的,全神经,端到端(E2E)ASR系统利用这样的上下文。我们的方法,我们 ...
2022-3-30 17:20 - 可人4 - Forum
深度学习-语音识别实战(Python)
1 个回复 - 1505 次查看
深度学习-
语音识别实战(Python)
下载地址:https://pan.baidu.com/s/1Le59dsSh2nWkGyBncMNZIw 提取码: 3dd4
基于深度学习的
语音识别实战课程主要包括三部分内容:
1.经典论文算法讲解;
2.算法源码解读;
3.项 ...
2021-5-12 16:50 - 少年码农 - Forum
微软2016对话式语音识别系统
0 个回复 - 295 次查看
摘要翻译:
我们描述了微软的对话式
语音识别系统,在该系统中,我们结合了基于神经网络的声学和语言建模的最新发展,以推进总机识别任务的最新技术。受机器学习集成技术的启发,该系统使用了一系列卷积和递归神经网络 ...
2022-3-22 20:10 - 何人来此 - Forum
基于原始波形的端到端语音识别
0 个回复 - 235 次查看
摘要翻译:
最先进的
语音识别系统依赖于固定的、手工制作的特征,如mel-filterbanks在训练管道之前对波形进行预处理。在本文中,我们研究了直接从原始波形训练的端到端系统,基于使用卷积结构的Mel滤波器组的两种可训 ...
2022-3-11 17:39 - 能者818 - Forum
基于序列的多语种低资源语音识别
0 个回复 - 327 次查看
摘要翻译:
多语种和跨语种
语音识别技术可以在资源不足的情况下帮助引导系统,并能够分析新的语言和领域。端到端方法,特别是基于序列的技术,由于其简单和优雅而很有吸引力。虽然可以集成传统的多语言瓶颈特征提取器 ...
2022-3-11 13:40 - nandehutu2022 - Forum
基于无监督学习的区域不变特征提取方法
自动语音识别
0 个回复 - 418 次查看
摘要翻译:
自动
语音识别(ASR)系统的性能可能会受到以前未见的情况的严重影响,这通常是由于训练和测试分布之间的不匹配造成的。本文通过研究领域不变特征来解决系统的鲁棒性问题,使领域信息对ASR系统透明,解决了不 ...
2022-3-8 21:29 - 大多数88 - Forum
视觉语音识别的分辨率限制
0 个回复 - 195 次查看
摘要翻译:
纯视觉
语音识别依赖于许多难以控制的因素,例如:照明;身份;动议;情感和表达。但有些因素,如视频分辨率是可控的,因此目前还没有系统的研究分辨率对唇读的影响。在这里,我们使用一个新的数据集Roset ...
2022-3-8 08:39 - mingdashike22 - Forum
单序列对序列的多方言语音识别
模型
0 个回复 - 183 次查看
摘要翻译:
序列到序列模型为构建
语音识别系统提供了一个简单而优雅的解决方案,它将典型系统的独立组件,即声学(AM)、发音(PM)和语言(LM)模型折叠到单个神经网络中。在这项工作中,我们研究了一个这样的序列到序列模 ...
2022-3-7 20:35 - nandehutu2022 - Forum
用于上下文感知语音识别的视觉特征
0 个回复 - 368 次查看
摘要翻译:
用户生成的多媒体内容如“YouTube”视频的自动转录仍然表现出很高的字错误率。这些数据通常占据非常广泛的领域,在具有挑战性的条件下记录,使用廉价的硬件并侧重于可视化模式,并且可能经过后期处理或编 ...
2022-3-7 19:11 - mingdashike22 - Forum
视觉语音识别:更好地调整术语
理解
0 个回复 - 310 次查看
摘要翻译:
我们正处于机器唇齿的激动人心的时刻。传统的研究源于音频识别系统的自适应。但现在,计算机视觉社区也参与进来。这两个以前不同的领域在计算机唇读方面的不同观点的结合为合作创造了机会,但在这样做的过 ...
2022-3-7 17:44 - 可人4 - Forum
用于远程语音识别的深度学习
0 个回复 - 300 次查看
摘要翻译:
深度学习是一种新兴技术,被认为是达到更高水平的人工智能最有希望的方向之一。在其他成就中,制造能够理解语音的计算机代表着向智能机器的一个关键飞跃。然而,尽管在过去的几十年里做出了巨大的努力,但 ...
2022-3-7 11:03 - 大多数88 - Forum
单端到端模型的多语种语音识别
0 个回复 - 370 次查看
摘要翻译:
训练一个传统的自动
语音识别(ASR)系统以支持多种语言是具有挑战性的,因为子词单元、词典和单词目录通常是特定于语言的。相比之下,序列到序列模型非常适合于多语言ASR,因为它们将声学、发音和语言模型联 ...
2022-3-7 09:49 - 何人来此 - Forum
基于区域分离网络的无监督自适应鲁棒性
语音识别
0 个回复 - 277 次查看
摘要翻译:
语音信号的无监督域自适应是指将经过良好训练的源域声学模型与来自目标域的未标记数据相适应。这可以通过对深度神经网络(DNN)声学模型的对抗性训练来学习既有感知鉴别又有域不变的中间深度表示。具体地说 ...
2022-3-6 22:57 - 可人4 - Forum
用于远距离语音识别的高速公路长短时记忆RNS
0 个回复 - 234 次查看
摘要翻译:
本文通过在相邻层的存储单元之间引入门控直接连接,扩展了DLSTM递归神经网络。这些被称为高速公路连接的直接连接使信息能够在不同的层间畅通无阻地流动,从而缓解了在建立更深的LSTM时的梯度消失问题。我 ...
2022-3-6 20:04 - 何人来此 - Forum
医学对话中的语音识别
0 个回复 - 471 次查看
摘要翻译:
在本工作中,我们探索建立自动
语音识别模型,以转录医生和病人的谈话。我们收集了一个大规模的临床对话数据集($14,000$hr),设计了一个任务来表示真实的单词场景,并探索了几种对齐方法来迭代提高数据质 ...
2022-3-6 16:16 - 何人来此 - Forum
改进的端到端语音识别正则化技术
0 个回复 - 325 次查看
摘要翻译:
正则化对于端到端语音模型非常重要,因为模型具有高度的灵活性和易重合性。数据增强和数据丢失对于改进其他领域的端到端模型非常重要。然而,对于端到端的语音模型,它们的研究相对较少。因此,我们研究了 ...
2022-3-6 15:43 - 何人来此 - Forum
基于序列到序列模型的语音识别技术
0 个回复 - 273 次查看
摘要翻译:
基于注意力的编码器-解码器体系结构,如Listen、Attent和Spall(LAS),将传统自动
语音识别(ASR)系统的声学、发音和语言模型组件包含在单个神经网络中。在以前的工作中,我们已经证明这种体系结构在听写任务 ...
2022-3-6 14:59 - 可人4 - Forum
预测-自适应-校正递归神经网络
低资源语言语音识别
0 个回复 - 196 次查看
摘要翻译:
本文研究了预测-自适应-校正递归神经网络(PAC-RNNs)在低资源
语音识别中的应用。PAC-RNN由一对神经网络组成,其中{IT校正}网络利用{IT预测}网络给出的辅助信息来帮助估计状态概率。来自校正网络的信息也 ...
2022-3-4 17:55 - 何人来此 - Forum
基于音图多语种CTC的语音识别
0 个回复 - 209 次查看
摘要翻译:
训练自动
语音识别(ASR)系统需要大量的目标语言数据,以达到良好的性能。对于像英语这样的语言来说,大型的训练语料库是现成的,但是存在着一个语言的长尾语料库,这些语料库确实缺乏资源。处理数据稀疏性 ...
2022-3-4 12:21 - nandehutu2022 - Forum
基于置换不变训练的多说话人语音识别
0 个回复 - 414 次查看
摘要翻译:
在本文中,我们提出了一种新的直接识别多个语音流的技术,在给定的单通道混合语音的情况下,不需要先分离它们。我们的技术是基于置换不变训练(PIT)的自动
语音识别(ASR)。在PIT-ASR中,针对每个可能的输出 ...
2022-3-3 16:14 - 大多数88 - Forum
会话语音识别中人对等性的实现
0 个回复 - 328 次查看
摘要翻译:
自20世纪90年代Switchboard语料库发布以来,会话
语音识别一直是
语音识别的旗舰任务。在本文中,我们在广泛使用的NIST2000测试集上测量了人为错误率,发现我们最新的自动化系统已经达到了人为平等。专业转 ...
2022-3-3 16:09 - 大多数88 - Forum
深度神经网络中的特征学习&语音识别研究
任务
0 个回复 - 206 次查看
摘要翻译:
近年来的研究表明,在大词汇量的
语音识别任务中,深度神经网络(DNNs)明显优于浅层网络和高斯混合模型(GMMs)。在本文中,我们认为DNNs所取得的提高精度是由于它们能够提取对语音信号中的多种变异性来源 ...
2022-3-3 12:46 - 能者818 - Forum
基于CMU-Sphinx4的阿拉伯语语音识别系统
0 个回复 - 302 次查看
摘要翻译:
在本文中,我们提出了一个阿拉伯语版本的自动
语音识别系统(ASR)的创建。该系统基于卡内基梅隆大学的开源Sphinx-4。它是一种基于离散隐马尔可夫模型的
语音识别系统。我们研究了为了适应阿拉伯语
语音识别而 ...
2022-3-2 20:20 - 大多数88 - Forum
用CMUSphinx系统进行阿拉伯语语音识别的介绍
0 个回复 - 422 次查看
摘要翻译:
本文从
语音识别问题的角度对阿拉伯语进行了研究。提出了一种建立阿拉伯语自动
语音识别系统(ASR)的新方法。该系统基于卡内基梅隆大学的开源CMU Sphinx-4。CMU狮身人面像是一个大词汇量;基于离散隐马尔可夫 ...
2022-3-2 20:19 - 大多数88 - Forum
如何通过深度学习进行语音识别
0 个回复 - 651 次查看
如何通过深度学习进行
语音识别
语音识别正在入侵我们的生活。它内置在我们的手机,游戏机和智能手表中。它甚至使我们的房屋自动化。仅需$ 50,您就可以大声说出一个Amazon Echo Dot(一个魔术盒,让您可以订购披萨, ...
2020-11-24 19:59 - 时光永痕 - 数据分析与数据挖掘
教你怎样用python进行语音识别——AIU人工智能学院
0 个回复 - 1057 次查看
AIU人工智能学院:数据科学、人工智能从业者的在线学院。数据科学(Python/R/Julia)数据分析、机器学习、深度学习[/backcolor]
[/backcolor]作者 | 小隐[/backcolor]
来源 | 淘气面包[/backcolor]
原文 | 教你怎 ...
2020-5-29 06:40 - AIU人工智能学院 - python论坛
人工智能实战之语音识别
0 个回复 - 338 次查看
人工智能实战之
语音识别
http://edu.cda.cn/course/2253
课程介绍
一、课程背景
CDA数据分析师人才教育品牌联合海内外知名讲师团队共同打造AI在线学习解决方案。旨在培养AI时代“十字型”技术精英。人工智能 ...
2020-2-27 16:56 - 158149053 - 休闲灌水
教你怎样用python进行语音识别
0 个回复 - 1856 次查看
python进行
语音识别" style="border: none; margin-top: 20px; max-width: 715px;">[/backcolor]
作者 | 小隐来源 | 淘气面包原文 | 教你怎样用python进行
语音识别网上找到一些例子,有一些成熟的模型,可以将语音转 ...
2020-2-4 10:03 - AIU人工智能学院 - 数据分析与数据挖掘
语音识别的终极目的,真正做到人机交互
0 个回复 - 635 次查看
人工智能一直都是一个能挑起人兴趣的话题,无论是谁不管学历如何,面对人工智能都发表几句自己的看法,以及对未来人工智能发展的预测。2016年是真正意义上的人工智能元年,不管是人工智能技能人才的储备量,或者是 ...
2019-7-2 10:25 - yayoudou - Forum
语音识别的最终目的,真正做到人机交互
0 个回复 - 480 次查看
人工智能一直都是一个能挑起人兴趣的话题,无论是谁不管学历如何,面对人工智能都发表几句自己的看法,以及对未来人工智能发展的预测。2016年是真正意义上的人工智能元年,不管是人工智能技能人才的储备量,或者是 ...
2019-7-2 10:24 - yayoudou - Forum
什么是机器人语音识别原理
0 个回复 - 1016 次查看
电销机器人核心技术是语音是识别,了解一台机器人
语音识别原理,可以说就能知道电话机器人好不好用,能否帮助企业完成拓客需求。
作为人工智能的产物,电销机器人还蒙着一层神秘的色彩。电销机器人如何做到语音识 ...
2019-6-10 14:11 - 放光的房子君 - Forum
基于LM算法的神经网络语音识别
0 个回复 - 487 次查看
摘要:由于
语音识别中朵用标准BP算法存在的训练速度慢、容易陷入局部极小等问题,提出一种基于稳定、快速的Levenberg-Marquardt算法的神经网络
语音识别方法,主要包括语音信号预处理、特征提取、网络结构优化设计、网 ...
2018-1-19 09:00 - a智多星 - 人工智能论文版
基于混沌神经网络的语音识别方法
0 个回复 - 450 次查看
摘要:基于语音信号的时变特性,研究了神经网络
语音识别的方法,把混沌特性引入到神经元,构造了一种新的多层混沌神经网络结构,同时推导了相应的学习算法,把这种混沌神经网络用于
语音识别,并与常用的神经网络语音 ...
2018-1-16 14:20 - AIworld - 人工智能论文版
基于神经网络的语音识别技术研究
0 个回复 - 497 次查看
摘要:对BP神经网络在特定人
语音识别技术中的应用进行了探索性的研究,进而对非特定人
语音识别做了一定的实验和研究。通过对比分析了传统的
语音识别方法——模板匹配法和人工神经网络
语音识别方法的优缺点。神经网络 ...
2018-1-15 07:00 - a智多星 - 人工智能论文版
基于神经网络的语音识别技术应用研究
0 个回复 - 491 次查看
摘要:简单叙述了采用人工神经网络技术进行
语音识别的原理,给出了其中关键技术,求语音特征参数和典型神经网络的学习过程,然后通过二个具体应用实例,展示了如何使这一技术实用化。原文链接:http://www.cqvip.com/ ...
2018-1-11 23:20 - a智多星 - 人工智能论文版
一种时间规整算法在神经网络语音识别中的应用
0 个回复 - 501 次查看
摘要:提出一种新的网络结构,这种网络能够很好地解决神经网络
语音识别中的时间规整问题。该网络从输入语音信号的特征矢量序列中提取一组固定数目的特征矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他 ...
2018-1-9 00:40 - 论文库 - 人工智能论文版
支持向量机在语音识别中的应用
0 个回复 - 610 次查看
摘要:支持向量机采用数学方法和优化技术,将向量映射到一个更高维的空间里,建立一个有最大间隔的超平面,其在
语音识别技术中应用广泛。阐述
语音识别技术及支持向量机的原理,介绍支持向量机在
语音识别中的应用。原文链 ...
2018-1-1 07:00 - 论文库 - 人工智能论文版
语音识别中HMM与自组织神经网络结合的混合模型
0 个回复 - 479 次查看
摘要:基于隐马尔可夫模型和自组织神经网络模型提出了一种用于
语音识别的混合模型,给出了训练调整权向量的算法,实验结果表明其在
语音识别中具有很好的性能。原文链接:http://www.cqvip.com//QK/90188A/199902/3587 ...
2017-12-27 17:20 - a智多星 - 人工智能论文版