结果:找到“音频”相关内容1000个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
【商业管理】商业方案、创业案例、营销推广方案、财务管理模板、连锁经营、合同协议
0 个回复 - 1222 次查看 分类压缩在商业方案、创业案例、营销推广方案、财务管理模板、连锁经营、合同协议等几个压缩包里。合集资料包,内容非常丰富,一共6个多G各类文档,基本都是可编辑的doc、ppt和xlsx文件,是很好的教学培训、经营管 ...2022-8-31 13:22 - wz151400 - 现金交易版
新经济公司数据及2020年死亡倒闭公司数据分析与可视化独角兽千里马破产倒闭公司
0 个回复 - 1042 次查看 新经济公司数据及2020年死亡倒闭公司数据分析与可视化独角兽千里马破产倒闭公司 (提供原始数据及各类程序源代码及处理过程) 本次提供两类数据: 1、分享截止2020年底的新经济公司数据,含有很高研究 ...2022-8-13 08:53 - yusb - 现金交易版
【合集资料】营销管理与销售技术方法资料
0 个回复 - 646 次查看 内容非常丰富,包括下列内容 10份服务人员的五项修炼 10份卓越团队训练手册12个销售单据文件13份网络营销技巧+案例 16份营销音频解说 18个保险公司-营销锦囊 19个营业日报表 20份市场定位指南 23个空手套 ...2022-8-12 13:59 - wz151400 - 现金交易版
CIA: 国际注册内部审计师(CERTIFIED INTERNAL AUDITOR)学习视频、也有音频文件
6 个回复 - 13552 次查看 CIA: 国际注册内部审计师(CERTIFIED INTERNAL AUDITOR)学习视频、也有音频文件 CIA: 国际注册内部审计师(CERTIFIED INTERNAL AUDITOR)学习视频、也有音频文件 CIA: 国际注册内部审计师(CERTIFIED INTERNA ...2020-2-10 11:23 - Mujahida - 现金交易版
美语入门 课文会话朗读30个音频文件(美籍老师)
52 个回复 - 5852 次查看 美语入门 课文会话朗读合并(美籍老师),共30个音频文件,初级,语言纯正。2019-4-28 19:51 - oasises - 悬赏大厅
AEO海关认证培训资料整理汇总(文件+音频,专家解读)
2 个回复 - 1841 次查看 AEO海关认证培训资料整理汇总(文件+视频解读),文件大小:100MB 经认证的经营者(AuthorizedEconomic Operator):在世界海关组织(WCO)制定的《全球贸易安全与便利标准框架》中被定义为:“以任何一种方式参与 ...2019-12-27 20:04 - Mujahida - 现金交易版
量化配对交易:课件(附有代码)+音频讲解
0 个回复 - 675 次查看 量化配对交易:课件(附有代码)+音频讲解(mp3) 1量化投资简介 2传统投资与量化投资 3如何进行量化投资? 4量化投资的组成 5,配对交易概念 6,配对交易分类及内容 7.配对交易实例 8配对交易设定及优化 ...2021-8-13 15:03 - mujahida01 - 现金交易版
美国习惯用语,音频简略版
2 个回复 - 2294 次查看 VOA美国习惯用语, 大家应该都知道吧。。不知道的,度娘吧。 这套节目其实真是不错,从90‘s一直播讲到现在。。虽然年代早,但前面部分绝对比后面的强。其中的例句,有一气呵成的感觉。 可惜啰嗦得过分了。。 ...2014-11-24 14:00 - shellw - 外语学习
《走遍美国》全78集(MP4视频+中英字幕+MP3音频+LIC字幕)
12 个回复 - 9953 次查看 《走遍美国》全78集(MP4视频+中英字幕+MP3音频+LIC字幕)2019-6-26 13:13 - 光之晨曦0421 - 休闲灌水
【独家发布】(听音频复习考博真题)天津财经大学会计历年考博真题23道音频MP3版
7 个回复 - 1732 次查看 (听音频复习考博真题)天津财经大学会计历年考博真题23道音频MP3版自己根据真题录制,边听边复习,效果会更好。 平均每个音频录制时间在3-6分钟之间,通过睡前听课,相信效果会更好。 一共录制了23道题。2019-2-28 15:10 - cyhcc409 - 现金交易版
【免费】中国人民大学《政治经济学》讲义和课程音频
44 个回复 - 12447 次查看 中国人民大学《政治经济学》讲义和音频: 欢迎坛友们:[/backcolor] 来“现金交易版块儿[/backcolor]http://bbs.pinggu.org/forum-2177-1.html”,[/backcolor] 出售[/backcolor]原创、非商业 ...2014-12-18 20:08 - 曲歌99 - 微观经济学
刘斌20000英语单词单词兵法全套 核心词根词缀速记+音频+视频+文档+专业发言课
27 个回复 - 6835 次查看 全套课程,资料齐全,可自行下载,附件为资料获取方法,按说明便可简单获取。已更新链接,因之前链接没设置对,需使用带描述和论坛币的三个链接下载。 备注:如电脑下载,按文件名要求获取资料便可。如手机或平板 ...2020-9-25 14:34 - 曼鹭森兰 - Forum
The economist 2012年(音频版)-已更新至2012.12.15 持续更新中
98 个回复 - 8341 次查看 特别声明: 此版本仅用于学习交流,请勿用于任何商业用途。出版社保留追究之权力。任何用于商业用途的传播责任自负。如果您喜欢本杂志,请购买正版。 Issue_8809_20121103_The_Economist_Full_edition **** 本内容 ...2012-11-3 09:34 - 雨在哭 - 真实世界经济学(含财经时事)
优酷《晓说》音频版 附网盘链接
1 个回复 - 2982 次查看 链接:https://pan.baidu.com/s/1O5rEBzOqLY0hmi67AP6nKQ 提取码:ijh12019-12-27 08:46 - 可口可乐雪碧 - 新手入门区
2014年汇丰商学院宣讲会音频-地点清华大学
13 个回复 - 3012 次查看 http://bbs.pinggu.org/thread-2347545-1-1.html2013-4-16 22:22 - xieg63 - 北京大学汇丰商学院
有没有同学知道研究生英语课的听力音频去哪里找~
9 个回复 - 1634 次查看 咱们英语课的音频谁有呀~求助 老师好像说武大图书馆的多媒体资源里面有~但是我没有找到~求助呀,各位大神2014-5-21 09:21 - 西瓜妹妹 - 武汉大学经济与管理学院
剑雅4-14全套(音频+电子书+精讲)剑桥雅思
14 个回复 - 8764 次查看 网盘链接如上 剑雅4-14全套(音频+电子书+精讲) 分享给uu们~祝各位早日脱坑~2022-1-21 11:24 - 苍耳猫猫 - 外语学习
新概念英语(2,3,4册)美音.英音(音频-LRC)种子文件
7 个回复 - 5307 次查看 新概念英语2,3,4册英音,美音音频以及对应的lrt文件。因为英音,美音播放进度有一些差别,所以有英音,美音两版lrt歌词文件,您可以在听音频的同时同步看到课文显示,方便学习,对纠正发音和提高学习效率有很大好处 ...2015-2-6 01:40 - FRANKQZY - 外语学习
哈利波特中英文pdf带音频全集
1 个回复 - 903 次查看 1到7是全集吧<br> 百度云已解压2019-8-9 15:39 - a187643700 - 休闲灌水
全球与中国汽车音频DSP芯片组行业销售态势及竞争策略分析报告(2022-2027)
2 个回复 - 532 次查看 全球与中国汽车音频DSP芯片组行业销售态势及竞争策略分析报告(2022-2027) **************************************** 【报告编号】: BG423028 【出版时间】: 2022年4月 【出版机构】: 中智正业研究院 免费售 ...2022-4-18 15:33 - zzzyyjy518 - 能源经济学
【书+音频】瞿士钊:正音—美语发音基本功
44 个回复 - 4683 次查看 【电梯】http://bbs.pinggu.org/thread-2580694-1-1.html 赖世雄精准美国英语音标发音》国内最好的发音书籍没有之一 瞿士钊:正音—美语发音基本功 **** 本内容被作者隐藏 ****2013-8-19 09:02 - lyt639 - 经管书评
金观涛 中国思想史音频讲座全集及现代中国社会转型必读书目
143 个回复 - 17080 次查看 本贴只提供金观涛老师的中国思想史讲座下载,全集总共7讲,包含在压缩包里,欲了解现代中国社会转型,不可不听,不可不读《开放中的变迁》《观念史研究》《探索现代中国的起源》《兴盛与危机》! http://115.com ...2012-5-7 20:46 - 大嘴学经济 - 休闲灌水
American Accent Training美语发音秘诀 第二版 (含音频MP3)
0 个回复 - 1166 次查看 A guide to speaking and pronouncing colloquial American English 这本书是为生活学习在美国加拿大的学生和商务人士量身定做的。其通过提供了大量的美式语音语调、发音的训练,让学生学习标准的美式发音,并且显著 ...2022-8-23 14:57 - Maggiepearljg - 灌水吧
boom3dapp官方最新版专业音频增强应用程序
0 个回复 - 441 次查看 Boom 3D是适用于Windows和Mac系统的音效增强软件。它带有令人惊叹的3D环绕音效,可适用于各种类型的耳机。它还拥有31个频段的高级均衡器和多种预设音效,可带来全方位的音乐体验。 Boom 3D是一款音效增强软件和3D环 ...2022-7-22 23:03 - AV百科 - 休闲灌水
跪求好易迅转写专家注册码——音频转化为文字软件的注册码
3 个回复 - 1805 次查看 跪求好易迅转写专家注册码——音频转化为文字软件的注册码。2021-3-3 08:43 - 静则胜 - 求助成功区
CDA区块链学院区块链大讲堂系列课程(音频+图文)
24 个回复 - 4183 次查看 区块链大讲堂系列课程:我们正站在一个时代的风口,面前的是一个快速发展的世界。区块链,最有潜力触发第五轮工业革命浪潮的核心技术,已被国务院列入“十三五”规划。那么,到底什么才是区块链?区块链的作用是什么 ...2018-4-13 11:01 - cainiaofei - 比特币与区块链
中国经济史(侯家驹)文本音频百度云下载
0 个回复 - 2566 次查看 中国经济史 侯家驹先生花费11年时间撰写本书,全书讨论了中国经济史的功能与范围、演进的轨迹,并将中国自秦汉起区分为三个一元体制与两个多元体制时期,对于各个体制的政经制度、社会环境、公共政策等,作了深入的 ...2020-5-28 09:02 - ujbbv - 休闲灌水
基于生成对抗的音频场景图像合成 网络
0 个回复 - 297 次查看 摘要翻译: 人类可以从一个声音中想象出一个场景。我们希望机器通过使用条件生成对抗网络来做到这一点。通过应用光谱范数、投影鉴别器和辅助分类器等技术,与朴素条件GAN相比,该模型在主观和客观评价方面都能产生更 ...2022-4-13 19:10 - 大多数88 - Forum
弱监督音频分类的多级注意力模型
0 个回复 - 153 次查看 摘要翻译: 本文提出了一种多级注意力模型来解决弱标记音频分类问题。音频分类的目的是预测音频片段中存在或不存在音频事件。最近,Google发布了一个大规模的弱标记数据集Audio Set,其中每个音频片段只包含音频事件 ...2022-4-10 15:40 - mingdashike22 - Forum
【中信证券】投资价值分析报告:国内音频品牌龙头,乘风智能耳机爆发
1 个回复 - 561 次查看 【中信证券】投资价值分析报告:国内音频品牌龙头,乘风智能耳机爆发2022-4-8 16:23 - 达坂城的老头 - 行业分析报告
基于样本混合的国内音频标签数据增强
0 个回复 - 235 次查看 摘要翻译: 近十年来,音频标签技术引起了越来越多的关注,并在许多领域有着潜在的应用前景。音频标签的目标是预测音频片段的标签。近年来,深度学习方法被应用于音频标注,并取得了较高的性能,但对新数据的泛化能力 ...2022-4-8 18:50 - 能者818 - Forum
2022-2028全球与中国消费级音频产品市场现状及未来发展趋势
1 个回复 - 1276 次查看 根据QYR(恒州博智)的统计及预测,2021年全球消费级音频产品市场销售额达到了 亿美元,预计2028年将达到 亿美元,年复合增长率(CAGR)为 %(2022-2028)。地区层面来看,中国市场在过去几年变化较快,2021年市场规 ...2022-4-6 16:08 - QYResearch020 - 产业经济学
音频广告质量预测
0 个回复 - 228 次查看 摘要翻译: 在线音频广告是在线音乐流媒体服务中广泛使用的一种特殊广告形式。在这些平台中,往往承载着数万个独特的音频广告(广告),提供高质量的广告确保了更好的用户体验,并导致更长的用户参与。因此,这些广告 ...2022-4-6 10:05 - 可人4 - Forum
脑电定向和因果信息流在感知评估中的应用 音频质量
0 个回复 - 206 次查看 摘要翻译: 本文利用脑电图(EEG)测量来推断皮层功能连接性的变化,以响应音频刺激的变化。实验中,当人类受试者收听质量随时间变化的音频序列时,记录他们的脑电活动。然后提出了一个因果信息论框架来测量在皮层上被 ...2022-4-4 16:40 - 大多数88 - Forum
R-CRNN:基于区域的卷积递归音频神经网络 事件检测
0 个回复 - 625 次查看 摘要翻译: 提出了一种基于区域的卷积递归神经网络(R-CRNN)用于音频事件检测(AED)。该网络受Faster-RCNN的启发,它是一种基于区域的卷积网络框架,用于视觉目标检测。与原始的Faster-RCNN不同的是,在卷积网络的基 ...2022-4-4 15:30 - 能者818 - Forum
警用佩戴音频中的冲突自动检测
0 个回复 - 191 次查看 摘要翻译: 随着人体穿戴技术的出现,自动冲突检测越来越相关,但现有的指标,如话轮转换和重叠,是警察-公众互动中冲突的不良指标。此外,计算它们的标准技术在应用于这种多样化和嘈杂的背景时是不够的。我们开发了 ...2022-4-2 18:40 - 能者818 - Forum
合成多样,高质量的音频纹理
0 个回复 - 333 次查看 摘要翻译: 基于神经网络中特征激活的Gram矩阵匹配的纹理合成技术在图像领域取得了巨大的成功。本文将这些技术扩展到音频领域。我们证明合成不同的音频纹理是具有挑战性的,并认为这是因为音频数据是相对低维的。因此 ...2022-3-30 22:45 - 何人来此 - Forum
合成音频中的声音事件检测--基于DCASE 2016的分析 任务结果
0 个回复 - 597 次查看 摘要翻译: 作为2016年声学场景和事件检测和分类公众评估挑战赛(DCASE 2016)的一部分,第二项任务侧重于使用办公室声音的合成混合物评估声音事件检测系统。这项任务遵循DCASE 2013的“事件检测-办公室合成”任务,研 ...2022-3-29 22:50 - 能者818 - Forum
用于音频分类的掩蔽条件神经网络
0 个回复 - 470 次查看 摘要翻译: 提出了用于时态信号识别的条件神经网络(CLNN)和屏蔽条件神经网络(MCLNN)。CLNN考虑声音信号的时间性质,并且MCLNN通过二进制掩码在CLNN上延伸,以保持特征的空间局部性,并允许自动探索特征组合,类似于手 ...2022-3-29 21:10 - 能者818 - Forum
现实音乐生成的挑战:模拟原始音频 刻度
0 个回复 - 408 次查看 摘要翻译: 逼真的音乐生成是一项具有挑战性的任务。当建立从数据中学习的音乐生成模型时,通常使用高级表示,如分数或MIDI,抽象出特定表演的特质。但是这些细微差别对于我们对音乐性和真实感的感知是非常重要的,所 ...2022-3-22 22:50 - nandehutu2022 - Forum
一种融合深度音频特征和I向量的艺术家识别方法
0 个回复 - 164 次查看 摘要翻译: 艺术家识别是一项塑造艺术家音乐风格的任务。这个问题具有挑战性,因为没有明确的标准。提出了一种生成模型I-向量和判别模型深度卷积神经网络的混合方法。我们表明,这种方法通过相互补充实现了最先进的性 ...2022-3-22 19:45 - nandehutu2022 - Forum
黑盒音频系统的目标对抗示例
0 个回复 - 301 次查看 摘要翻译: 深度递归网络在音频转录中的应用已经在自动语音识别(ASR)系统中取得了令人瞩目的成就。许多人已经证明,小的对抗性扰动可以欺骗深度神经网络,以高置信度错误地预测指定的目标。目前对ASR系统欺骗的研究主 ...2022-3-22 15:10 - 能者818 - Forum
基于von Mises-Fisher混合算法的鲁棒说话人聚类 自然主义音频流的分布
0 个回复 - 466 次查看 摘要翻译: 演讲者日记(即确定谁在何时发言?)对于多说话人的自然主义交互,如同伴领导的团队学习(PLTL)会话是一项具有挑战性的任务。在这项研究中,我们提出了一种基于混合多元von Mises-Fisher分布的鲁棒说话人聚 ...2022-3-21 10:40 - kedemingshi - Forum
低资源音频事件的数据高效弱监督学习 基于深度学习的检测
0 个回复 - 322 次查看 摘要翻译: 我们提出了一种在训练数据有限的共同约束下进行音频事件检测的方法。在训练深度学习系统执行音频事件检测时,出现了两个实际问题。首先,大多数数据集都是“弱标记”的,在每个记录中只有一个事件列表,而 ...2022-3-17 13:35 - mingdashike22 - Forum
剑4-14雅思听力音频+新东方俞敏洪雅思词汇词根+联想记忆法(乱序版)pdf版+MP3
4 个回复 - 3395 次查看 剑4-14雅思听力音频+新东方俞敏洪雅思词汇词根+联想记忆法(乱序版)pdf版+MP32019-10-8 11:06 - 伊克闹美克 - 版权审核区(不对外开放)
从符号音乐中学习换位不变音程特征 和音频
0 个回复 - 241 次查看 摘要翻译: 许多音乐理论结构(如音阶类型、调式、节奏和和弦类型)都是根据音高间隔--音高之间的相对距离来定义的。因此,当计算机模型用于音乐任务时,在音程表示上而不是在原始音乐表面上操作是有用的。此外,区间 ...2022-3-12 09:54 - mingdashike22 - Forum
【国海证券】阜博集团(03738):全球版权保护SaaS龙头,构筑良好音频产业
1 个回复 - 780 次查看 【国海证券】阜博集团(03738):全球版权保护SaaS龙头,构筑良好音频产业2022-3-11 19:12 - 达坂城的老头 - 行业分析报告
卷积神经网络标签噪声敏感性研究 用于细粒度音频信号标签
0 个回复 - 156 次查看 摘要翻译: 在一个细粒度的音频信号标记任务中,我们测量了由轻微失调的地面真值标记引起的少量系统和随机标记噪声的影响。我们选择证明这些影响的任务也被称为帧多音转录或音符量化多f0估计,并将单声道音频信号转换 ...2022-3-11 17:31 - 大多数88 - Forum
宏源证券首席经济学家房四海南开大学讲座音频(部分)
8 个回复 - 2319 次查看 房四海,宏源证券首席经济学家,莅临母校南开大学经济学院,关于当前宏观经济形式的讲座,和基本的宏观经济分析的分析框架,感兴趣的可以听一听~2014-11-14 23:36 - fabregasmu - 教师之家与经管教育
无并行数据的多目标语音转换 学习分离的音频表示
0 个回复 - 371 次查看 摘要翻译: 近年来,循环一致对抗网络(Cycle-Cersional Anversarial network,Cycle-GAN)被成功地应用于不需要并行数据的不同说话人的语音转换,尽管在这些方法中,每个目标说话人都需要一个单独的模型。本文提出了 ...2022-3-10 08:36 - 大多数88 - Forum
基于二次型音频信号的车辆分类 判别分析与高能特征向量
0 个回复 - 254 次查看 摘要翻译: 本文的重点是利用车辆发出的声音对不同车辆进行分类。本文根据信号的短时能量、平均过零率和周期段的基音频率等特征,利用二次判别分析将过往车辆的音频信号分为公共汽车、小轿车、电动机和卡车等类别。仿 ...2022-3-9 10:36 - 大多数88 - Forum
音频源中神经结构的泛化挑战 分离
0 个回复 - 198 次查看 摘要翻译: 最近的工作表明,递归神经网络可以训练分离单个说话人在一个声音混合和高保真度。在这里,我们探索卷积神经网络模型作为一种替代方案,并表明它们以一个数量级较少的参数实现了最先进的结果。我们还描述和 ...2022-3-9 09:28 - 可人4 - Forum
用于(音乐)音频分类的随机加权CNNs
0 个回复 - 172 次查看 摘要翻译: 计算机视觉文献表明,随机加权神经网络作为特征提取器的性能是合理的。遵循这一思想,我们研究了非训练(随机加权)卷积神经网络作为(音乐)音频分类任务的特征提取器的性能。我们使用从深层体系结构嵌入 ...2022-3-8 20:38 - mingdashike22 - Forum
基于神经网络的说话人聚类和音频处理
0 个回复 - 231 次查看 摘要翻译: 说话人聚类是在录音中区分说话人的任务。在某种程度上,目的是在录音中回答“谁在什么时候说话”。工业上常用的一种方法是利用MFCC特征直接从记录中提取特征,并使用高斯混合模型(GMM)和隐马尔可夫模型(H ...2022-3-8 19:48 - 何人来此 - Forum
360TextDegree{}视频的场景感知音频
0 个回复 - 172 次查看 摘要翻译: 尽管360\TextDegree{}摄像机简化了全景镜头的捕获,但添加真实的360\TextDegree{}音频仍然具有挑战性,该音频融合到捕获的场景中,并与摄像机运动同步。本文提出了一种在典型的室内场景中为360度视频添加 ...2022-3-8 17:25 - nandehutu2022 - Forum
音频图像的神经风格传递
0 个回复 - 295 次查看 摘要翻译: Gatys在创造图像的艺术转换方面做了令人着迷的工作。这是革命性的,我们如何在某种意义上改变图像的“风格”,同时通常保留其“内容”。在我们的工作中,我们提出了一种使用类似方法创建新声音的方法,将 ...2022-3-8 17:03 - nandehutu2022 - Forum
音频事件的弱标签学习研究
0 个回复 - 563 次查看 摘要翻译: 从声音事件的角度进行音频内容分析是一个重要的研究问题,在各种应用中都有广泛的应用。近年来,弱标记音频或声音事件检测(AED)方法的发展和大规模弱标记数据集的出现为大规模AED的实现开辟了可能。然而, ...2022-3-8 14:14 - mingdashike22 - Forum
PyrooMacousics:一个用于音频室模拟和阵列的Python包 处理算法
0 个回复 - 1237 次查看 摘要翻译: 我们介绍了pyroomacoustics,一个旨在快速开发和测试音频阵列处理算法的软件包。包的内容可分为三个主要组件:直观的Python面向对象界面,用于在2D和3D房间中快速构建涉及多个声源和麦克风的不同仿真场景 ...2022-3-8 12:59 - 大多数88 - Forum
用生物启发的可训练学习音频和图像表示 特征提取器
0 个回复 - 182 次查看 摘要翻译: 模式识别和信号处理的最新进展涉及从标记训练样本中自动学习数据表示。典型的方法是基于深度学习和卷积神经网络,它们需要大量的标记训练样本。在这项工作中,我们提出了新的特征提取器,可以用来学习在自 ...2022-3-7 19:49 - 何人来此 - Forum
基于卷积神经网络的音频翻唱歌曲识别
0 个回复 - 417 次查看 摘要翻译: 本文提出了一种基于卷积神经网络的复盖歌曲识别方法。以往的研究大多从一对歌曲中提取表征翻唱歌曲关系的特征向量,并将其用于计算两首歌曲之间的(dis)相似度。基于翻唱歌曲之间存在一种有意义的模式,并 ...2022-3-7 12:14 - 可人4 - Forum
语义音频表示的无监督学习
0 个回复 - 188 次查看 摘要翻译: 即使在没有任何明确的语义注释的情况下,大量的音频记录为学习声音的范畴结构提供了有价值的信息。我们考虑了几个适用于无标记非语音音频的类不可知论语义约束:(i)噪声和时间上的翻译不改变潜在的声音类 ...2022-3-7 11:08 - 可人4 - Forum
基于门控的大规模弱监督音频分类 卷积神经网络
0 个回复 - 192 次查看 摘要翻译: 在本文中,我们提出了一种门控卷积神经网络和一种基于时间注意力的音频分类定位方法,该方法在2017年声学场景和事件检测与分类挑战赛的大规模弱监督声音事件检测任务中获得了第一名。此任务中的音频剪辑是 ...2022-3-7 09:38 - 能者818 - Forum
一种用于改善环境音频的轻量级多模态框架 标记
0 个回复 - 153 次查看 摘要翻译: 强标签的缺乏严重限制了最先进的全监督音频标签系统向更大的数据集扩展。同时,基于无标记视频的视听学习模型已经成功地应用于音频标注,但它们不可避免地存在资源匮乏和训练时间长的问题。在这项工作中, ...2022-3-7 09:05 - nandehutu2022 - Forum
视频和音频检索中的跨模态嵌入
0 个回复 - 362 次查看 摘要翻译: 在线视频数量的增加为训练自监督神经网络带来了几个机会。像YouTube-8M这样的大规模视频数据集的创建允许我们以可管理的方式处理这些大量数据。在这项工作中,我们发现了利用该数据集提供的多模态信息来开 ...2022-3-7 09:04 - 可人4 - Forum
音乐音频特征深度学习中的声音表示
0 个回复 - 267 次查看 摘要翻译: 就音乐风格而言,单个音乐家、团体或作曲家的作品可以有很大的不同。事实上,不同的风格元素,从表现媒介和节奏到和声和质感,在艺术家的一生中都有典型的开发和发展。然而,在感性层面上,作曲家的作品往 ...2022-3-6 21:11 - mingdashike22 - Forum
领域知识在端到端音频处理中的应用
0 个回复 - 297 次查看 摘要翻译: 基于端到端神经网络的音频建模方法通常优于基于高级数据表示的模型。本文的初步工作表明,训练深度卷积神经网络(CNN)模型的第一层来学习常用的对数标度梅尔谱图变换是可行的。其次,我们证明了用学习变换 ...2022-3-6 18:27 - kedemingshi - Forum
用户生成内容的自动组织与质量分析 带音频指纹
0 个回复 - 242 次查看 摘要翻译: 社交媒体中用户生成的内容数量的增加,提高了根据内容质量分析和组织内容的重要性。在这里,我们提出了一种使用音频指纹来组织和推断用户生成的音频内容质量的方法。该方法检测不同音频片段之间的重叠片段 ...2022-3-6 17:40 - 何人来此 - Forum
基于神经网络的早期音频事件检测
0 个回复 - 344 次查看 摘要翻译: 本文提出了一种从音频流中早期检测音频事件的方法。早期发现是在事件的初始阶段推断正在发生的事件的能力。该系统由一个新的推理步骤与双并行定制损失深度神经网络(DNNs)耦合组成。除了损失函数(加权损 ...2022-3-6 15:56 - 何人来此 - Forum
弱监督小足迹多实例深度学习 音频事件检测
0 个回复 - 508 次查看 摘要翻译: 最先进的音频事件检测(AED)系统依赖于使用强标记数据的监督学习。然而,这种依赖性严重限制了大规模数据集的可伸缩性,在这些数据集中,获得精细分辨率注释的成本太高。在本文中,我们提出了一个使用弱标 ...2022-3-6 10:57 - 可人4 - Forum
音频到身体动力学
0 个回复 - 312 次查看 摘要翻译: 我们提出了一种方法,该方法获取小提琴或钢琴演奏的音频作为输入,并输出骨骼预测的视频,该视频进一步用于动画化身。关键的想法是创建一个化身的动画,他们的手移动类似于钢琴家或小提琴家会做什么,只是 ...2022-3-6 10:04 - kedemingshi - Forum
一种(非)社会(co)稀疏音频的建模与算法框架 复原
0 个回复 - 151 次查看 摘要翻译: 我们提出了一个统一的音频恢复问题建模和算法框架。它包括分析稀疏先验和更经典的合成稀疏先验,规则稀疏以及由收缩算子(如社会收缩)所体现的各种形式的结构化稀疏。该框架的多功能性在两个恢复场景中得 ...2022-3-6 09:24 - mingdashike22 - Forum
中关键字识别的多实例级联分类 窄带音频
0 个回复 - 132 次查看 摘要翻译: 我们建议使用级联分类器在非IID环境下获取的窄带(NB)8kHz音频上进行关键字识别(KWS)任务--这是一项比大多数最先进的KWS系统面临的更具挑战性的任务。我们提出了一个融合了深度神经网络、级联、多特征表示 ...2022-3-6 09:12 - mingdashike22 - Forum
基于原始波形的样本级CNN音频分类 体系结构
0 个回复 - 236 次查看 摘要翻译: 音乐、语音和声学场景声音由于其不同的信号特性,在音频域中往往被分开处理。然而,随着图像分类模型的不断发展,在音频领域也有必要研究可扩展的分类模型。在本研究中,我们使用两种样本级深度卷积神经网 ...2022-3-6 08:48 - 可人4 - Forum
空间音频球谐矩阵的条件化 应用程序
0 个回复 - 169 次查看 摘要翻译: 球谐矩阵(SHM)广泛应用于离散有限阶正交声场表示,本文主要研究它的条件化问题。SHM已广泛应用于音频领域,如使用扬声器的空间声音再现、头部相关传递函数的正交表示等。SHM的调理性能取决于在三维空间中 ...2022-3-6 08:38 - mingdashike22 - Forum
卷积音频模型的神经网络替代方法 分离
0 个回复 - 380 次查看 摘要翻译: 卷积非负矩阵分解模型使用具有时间维的频率模板对给定的音频谱图进行分解。在本文中,我们提出了一个卷积自动编码器模型,作为一个神经网络替代卷积NMF。利用神经网络的建模灵活性,我们还探讨了在编码器 ...2022-3-6 08:04 - kedemingshi - Forum
基于音频的壁球运动员成绩评估
0 个回复 - 121 次查看 摘要翻译: 在竞技体育中,往往很难量化成绩。一个球员得分或超车可能只取决于毫秒或毫米。在网球、乒乓球、壁球等球拍运动项目中,许多项目都是在短时间内发生的,对其进行记录和分析有助于揭示比赛成绩的差异。在这 ...2022-3-5 19:35 - nandehutu2022 - Forum
事件性:用于时间定位的频谱图目标检测 音频事件
0 个回复 - 170 次查看 摘要翻译: 在本文中,我们在音频事件检测中引入了事件性的概念,它在一定程度上可以被看作是计算机视觉中的对象性的一种模拟。事件概念背后的关键观察是,音频事件在频谱图中表现为具有特定纹理和几何结构的二维时频 ...2022-3-5 18:04 - nandehutu2022 - Forum
基于注意力模型的音频集分类:一种概率模型 透视
0 个回复 - 115 次查看 摘要翻译: 本文研究了音频集数据集的分类问题。音频集是由声音片段组成的大规模弱标记数据集。以前的工作使用多实例学习(MIL)对弱标记数据进行分类。在MIL中,一个包由几个实例组成,如果音频剪辑中至少有一个实例是 ...2022-3-5 16:15 - 何人来此 - Forum
复四元数主成分追踪及其应用 到音频分离
0 个回复 - 323 次查看 摘要翻译: 近年来,从信源分离到视频监控等信号处理领域,主成分追踪技术越来越受到人们的重视。到目前为止,所有现有的公式都是实数的,缺乏相位的概念,这是复杂光谱图或彩色图像等输入所固有的。因此,在这封信中 ...2022-3-5 16:06 - 能者818 - Forum
用于高效音频处理的神经网络精度缩放
0 个回复 - 209 次查看 摘要翻译: 虽然深度神经网络在许多音频应用中表现出了强大的性能,但其巨大的计算量和内存需求对实时处理提出了挑战。在本文中,我们研究了提高神经网络精度对两个常见音频处理任务性能的影响,即语音活动检测和单通 ...2022-3-5 13:09 - 何人来此 - Forum
非平稳音频的频谱分析
0 个回复 - 123 次查看 摘要翻译: 提出了一种分析非平稳信号的新方法,重点研究了音频信号的应用。继前人的贡献之后,非平稳性通过作用于高斯平稳随机信号的平稳性破缺算子来建模。重点研究了时间规整和幅度调制,并在小波变换域内提出了一 ...2022-3-5 09:04 - 何人来此 - Forum