结果:找到“文本分类”相关内容149个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
程序员的数学基础课讲义笔记-统计篇
1 个回复 - 666 次查看 程序员的数学基础课讲义笔记-统计篇 19讲概慨率和统计:编程为什么需要概率和统计.Pdf 20讲概率基础(上):一篇文章帮你理解随机变量、概率分布和朗望值Pdf 21讲概率基础(下):联合概率、条件概率和贝叶 ...2022-3-6 07:18 - Kathy-202109 - 现金交易版
Kaggle 各项竞赛情况数据集:各类机器学习竞赛包括训练和测试数据集
0 个回复 - 625 次查看 Kaggle 各项竞赛情况数据集:各类机器学习竞赛包括训练和测试数据集 Kaggle 各项竞赛情况数据包括竞赛名称、内容、奖励、形式、行业、参赛队伍、参赛者等相关信息,对数据竞赛举办和进行过程中发生的变化具有很好 ...2022-1-19 00:25 - yusb - 现金交易版
【原创总结】用R进行数据挖掘练习题
1 个回复 - 3314 次查看 RT。本人自己制作的练习题,参考书是经管之家主编的《用商业案例学R语言数据挖掘/CDA数据分析师》 资料部分内容截图如下: 这本书的介绍: ***章 商业数据分析基础 1.1 商业数据分析的本质 ...2018-10-17 15:41 - 芋头和稀饭 - 现金交易版
[案例分析]基于Spark ML 的文本分类
7 个回复 - 2596 次查看 引言 文本分类是一个典型的机器学习问题,其主要目标是通过对已有语料库文本数据训练得到分类模型,进而对新文本进行类别标签的预测。这在很多领域都有现实的应用场景,如新闻网站的新闻自动分类,垃圾邮件检测,非 ...2016-4-6 08:29 - Nicolle - spark高速集群计算平台
基于反类别频率的有监督项权重算法 文本分类
0 个回复 - 464 次查看 摘要翻译: 项权重方案常常支配着许多分类器的性能,如kNN、基于质心的分类器和支持向量机。文本分类中广泛使用的术语加权方案TF.IDF起源于信息检索领域。idf文本分类背后的直觉似乎不如IR合理。本文将反类别频率(ic ...2022-3-26 21:30 - 能者818 - Forum
文本分类:一种顺序阅读方法
0 个回复 - 461 次查看 摘要翻译: 我们提出将文本分类过程建模为一个顺序决策过程。在这个过程中,一个agent学会在顺序阅读文档句子的同时将文档分类为主题,并学会在阅读到足够的信息后立即停止决策。该算法将文本分类建模为马尔可夫决策 ...2022-3-12 19:36 - nandehutu2022 - Forum
二分响应的柔性贝叶斯广义线性模型 数据及其在文本分类中的应用
0 个回复 - 191 次查看 摘要翻译: 我们提出了一类稀疏广义线性模型,其中包括probit和logistic回归作为特例,并提供了一些额外的灵活性。我们提供了一个EM算法,用于从数据中学习这些模型的参数。我们将我们的方法应用于文本分类和模拟数据 ...2022-3-8 10:45 - mingdashike22 - Forum
基于文本分类的非正常报酬率预测
0 个回复 - 137 次查看 摘要翻译: 我们展示了如何使用支持向量机来预测金融资产的日内价格波动。采用多核学习将股票收益率与文本作为预测特征相结合来提高分类性能,并提出了解析中心切割平面方法来有效地解决核学习问题。我们观察到,虽然 ...2022-3-3 17:08 - nandehutu2022 - Forum
自然语言处理动手学Bert文本分类视频教程
6 个回复 - 2171 次查看 自然语言处理动手学Bert文本分类视频教程 网盘地址:https://pan.baidu.com/s/1l2Zw-vhg7Y6_c7sODSgZGA 提取码: uj9r 备用地址(腾讯微云):https://share.weiyun.com/KaHn9NGP 密码:r593cv Bert作为目前自然 ...2020-10-19 11:00 - 大帅哥很帅的 - Forum
文本分类:应用程序和用例
0 个回复 - 867 次查看 文本分类:应用程序和用例 整体而言,文本分析是一个新兴的研究领域。市场营销,产品管理,学术界和治理等领域已经在利用从文本数据中分析和提取信息的过程。我们讨论了文本分类背后的技术,文本分类是文本分析的重 ...2020-12-3 19:33 - 时光永痕 - 数据分析与数据挖掘
Python自然语言处理入门:以熟悉的术语构架文本分类
0 个回复 - 980 次查看 Python自然语言处理入门:以熟悉的术语构架文本分类 自然语言处理(NLP) 是一个广泛的领域,涵盖许多不同的任务,例如文本搜索,翻译,命名实体识别和主题建模。每天,只要我们搜索互联网,请语音助手告诉我们天气 ...2020-11-19 18:55 - 时光永痕 - 数据分析与数据挖掘
使用神经网络的文本分类
0 个回复 - 1027 次查看 使用神经网络的文本分类 了解聊天机器人的工作方式非常重要。聊天机器人内部的基本机器是文本分类器。让我们看一下用于文本分类的人工神经网络(ANN)的内部工作原理。 我们将使用2层神经元(1个隐藏层)和“单词袋 ...2020-8-14 20:13 - 时光永痕 - 数据分析与数据挖掘
Mahout构建贝叶斯文本分类器案例详解
2 个回复 - 2175 次查看 http://www.dataguru.cn/forum.php?mod=viewthread&tid=2782022014-12-13 20:57 - Nicolle - mahout论坛
用fastrtext做中文文本分类问题
2 个回复 - 1287 次查看 这个是我在github https://github.com/pommedeterresautee/fastrtext/issues/34 上提问的,用fastrtext 来做文本分类预测的,以下是英文直接复制过来的,哪位大神帮忙看看,多谢多谢~I got an issue with Chinese te ...2019-4-18 10:42 - sound118 - R语言论坛
求助:涉及文本分类;深度学习
0 个回复 - 768 次查看 问题: 给定三个词组:[表示愤怒的词],[表示动物的词],[表示家具的词]。能不能利用深度学习网络对以上三个词组进行特征提取,进而得到一个分类模型。 模型功能:输入一个新词,所得模型可以区分该词 ...2019-2-27 10:24 - koidou - Forum
基于机器学习的Web文本分类技术及算法
0 个回复 - 438 次查看 摘要:提出了一种基于机器学习的Web文本自动分类的信息检索解决方案。采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能。该算 ...2018-2-20 11:00 - 人工智能-AI - 人工智能论文版
多类支持向量机在文本分类中的应用
0 个回复 - 742 次查看 摘要:传统的支持向量机(SVM)是两类分类问题,如何有效地将其推广到多类分类问题仍是一项有待研究的课题。本文在对现有主要的四种多类支持向量机分类算法讨论的基础上,结合文本分类的特点,详细介绍了决策树支持向量 ...2018-2-20 09:00 - 论文库 - 人工智能论文版
一种基于粗糙集的文本分类规则抽取方法
0 个回复 - 389 次查看 摘要:随着文本数据库的日益增大,寻找新的文本数据处理方法变得十分紧迫.本文将粗糙集理论应用于文本自动分类的规则提取,提出了基于粗糙集理论的文本分类方法.把文本特征项的权值进行离散化处理后,作为规则的条件属性 ...2018-2-20 07:20 - AIworld - 人工智能论文版
独立于语种的文本分类方法
0 个回复 - 467 次查看 摘要:文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。本文提出了一个基于机器学习的、独立于语种的文本分类模型,并对模型中的特征抽取、分类器和评价方法进行了详细的介绍。该模型已经在中 ...2018-2-20 03:59 - DL-er - 人工智能论文版
文本分类中的特征抽取
0 个回复 - 633 次查看 摘要:特征提取是用机器学习方法进行文本分类的重点和难点。文中比较了目前几种最常用的特征抽取方法,提出了一种改进型的互信息特征抽取方法,并在构建的实验系统中比较了这几种特征抽取方法,发现改进的特征抽取方 ...2018-2-20 03:59 - DL-er - 人工智能论文版
高效的信任机制线性文本分类方法
0 个回复 - 403 次查看 摘要:基于信任机制设计了一种无须特征选择的高效的线性文本分类方法。面向特征与文档类的信任关系,使用bata概率密度函数评估特征的可靠度,提出特征对文档类的忠诚度的计算模型,基于忠诚度实现简单的线性文本分类器。 ...2018-2-19 18:00 - AIworld - 人工智能论文版
一种文本分类数据挖掘的技术
0 个回复 - 510 次查看 摘要:挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特 ...2018-2-19 03:39 - 人工智能-AI - 人工智能论文版
Sum-Product Networks模型的研究及其在文本分类的应用
0 个回复 - 507 次查看 摘要:图模型在机器学习有着广泛的应用。相比图模型,Sum-Product Networks模型具有更强表达能力和更快的推理速度,所以其在对文本和图像数据建模有着广泛的应用。本文总结Sum-Product Networks这一新的深度概率模 ...2018-2-19 00:19 - 论文库 - 人工智能论文版
层次式文本分类的Na
0 个回复 - 391 次查看 摘要:Naive Bayes方法在文本分类中的决策强烈依赖于主观选择的样本关于类别的分布。本文利用层次式分类的特点并引入概率条件改进Naive Bayes方法,使其在每个内部类别所属的子类局部数据中进行决策,缓解了全局数据 ...2018-2-18 23:19 - DL-er - 人工智能论文版
基于主成分分析的SMO文本分类
0 个回复 - 516 次查看 摘要:利用SMO进行文本分类的核心问题是特征的选择问题,特征选择涉及到哪些特征和选择的特征维度问题。针对以上问题,介绍一种基于主成分分析和信息增益相结合的数据集样本降维的方法,并在此基础上对序贯最小优化算法 ...2018-2-18 03:39 - AIworld - 人工智能论文版
用于文本分类的局部化双向长短时记忆
0 个回复 - 446 次查看 摘要:近年来,深度学习越来越广泛地应用于自然语言处理领域,人们提出了诸如循环神经网络(RNN)等模型来构建文本表达并解决文本分类等任务。长短时记忆(long short term memory,LSTM)是一种具有特别神经元结构的RN ...2018-2-17 12:00 - 论文库 - 人工智能论文版
智能文本分类系统的研究与设计
0 个回复 - 354 次查看 摘要:本文介绍了基于实列学习建立自动文本分类器的方法。送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)2018-2-16 22:20 - AIworld - 人工智能论文版
基于VSM的文本分类挖掘算法综述
0 个回复 - 572 次查看 摘要:简要介绍了VSM和文本分类挖掘的流程,分析了基于统计方法和基于机器学习的6种常用构造文本分类挖掘分类器的算法,指出了利用各种算法构造的分类器的特点,同时给出了这些算法的优化方向,为使用者选择、学习、改进 ...2018-2-15 23:39 - 论文库 - 人工智能论文版
基于流形正则化的支持向量机文本分类
0 个回复 - 441 次查看 摘要:支持向量机(Support Vector Machine,SVM)是一种Vapnik等在统计学理论的基础上发展起来的可训练机器学习的方法。它主要针对小样本的机器学习,具有泛化性能好、高维操作方便、适应性强、全局优化、训练时间短 ...2018-2-15 20:20 - AIworld - 人工智能论文版
文本分类在搜索引擎性能中的应用
0 个回复 - 412 次查看 摘要:随着World Wide Web的快速发展,电子文本信息迅速膨胀,如何有效的组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息是当前信息科学和技术领域面临的一大挑战。文本分类作为处理和组织大量文本数 ...2018-2-15 08:00 - AIworld - 人工智能论文版
基于汉语多类文本分类的机关公文智能办理系统
0 个回复 - 402 次查看 摘要:为了提高党政机关公文办理的自动化、科学化程度。尝试将业已成熟的汉语多类文本分类技术应用于机关公文办理系统中,并加入专家评估和反馈模块,使该系统具备“渐进式学习”的能力,将公文办理的经验积累在数据 ...2018-2-14 20:20 - DL-er - 人工智能论文版
不同程度的监督机制在自动文本分类中的应用
0 个回复 - 459 次查看 摘要:自动文本分类技术涉及信息检索、模式识别及机器学习等领域.本文以监督的程度为线索,综述了分属全监督,非监督以及半监督学习策略的若干方法-NBC(Naive Bayes Classofoer),FCM(Fuzzy G-Means),SOM(Self-Organixi ...2018-2-13 22:00 - DL-er - 人工智能论文版
多类支持向量机文本分类方法
0 个回复 - 516 次查看 摘要:文本分类是数据挖掘的基础和核心,支持向量机(SVM)是解决文本分类问题的最好算法之一。传统的支持向量机是两类分类问题,如何有效地将其推广到多类分类问题仍是一项有待研究的课题。介绍了支持向量机的基本原理 ...2018-2-12 23:20 - AIworld - 人工智能论文版
数据抽取中文本分类分析与研究
0 个回复 - 435 次查看 摘要:在数据抽取中,主要是对文本的处理。文本分类是文本处理的基本过程。文本分类技术同时还在自然语言处理、信息检索、文本挖掘等领域都有着广泛的应用。经过分类后的文本可以减少用户甄别信息时间,满足不同用户 ...2018-2-10 22:20 - AIworld - 人工智能论文版
用于文本分类和文本聚类的特征抽取方法的研究
0 个回复 - 457 次查看 摘要:文本信息处理已成为一门日趋成熟、应用面日趋广泛的学科。文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。面对急速膨胀的各种文本信息,通过使用文本分类和聚类技术,人们 ...2018-2-10 19:00 - 人工智能-AI - 人工智能论文版
一种新型文本分类方法的研究
0 个回复 - 333 次查看 摘要:主要介绍了一种新型文本分类方法。在文本分类中应用遗传算法优化各种参数,显著提高了文本分类的查全率,差准率,并节省了大的搜索时间。送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享, ...2018-2-9 22:40 - AIworld - 人工智能论文版
利用实体与依存句法结构特征的病历短文本分类方法
0 个回复 - 613 次查看 摘要:近年来,电子病历文本的分类、挖掘成为医学大数据研究的基础。该文提出一种利用实体与依存句法结构分析构特征集的电子病历短文本分类方法。首先对病历文本进行自然语言处理,包括分句、分词、词性标注以及实体提 ...2018-2-9 09:20 - 人工智能-AI - 人工智能论文版
一种新的基于SVM-KNN的Web文本分类算法
0 个回复 - 449 次查看 摘要:在应用基本的支持向量机算法的基础上,提出了一种新的Web文本分类算法。将SVM算法和KNN算法进行结合,提出了基于SVM-KNN的Web文本分类算法,用KNN算法来弥补传统SVM算法的不足,以简单的思想和较小的实现代价对传统 ...2018-2-9 06:40 - 人工智能-AI - 人工智能论文版
朴素贝叶斯在文本分类中的应用
0 个回复 - 549 次查看 摘要:朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果 ...2018-2-9 01:20 - 人工智能-AI - 人工智能论文版
基于词频分类器集成的文本分类方法
0 个回复 - 507 次查看 摘要:提出了一种基于词频分类器集成的文本分类方法.词频分类器是在对文本中的单词和它在每个文本中出现的频率进行统计后得到的简单分类器.虽然词频分类器本身泛化能力不强,但它不仅计算代较小,而且在训练样本甚 ...2018-2-8 13:20 - 人工智能-AI - 人工智能论文版
一种可靠信任推荐文本分类特征权重算法
0 个回复 - 360 次查看 摘要:从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较 ...2018-2-8 07:00 - DL-er - 人工智能论文版
基于神经网络的中文文本分类中的特征选择技术
0 个回复 - 381 次查看 摘要:基于神经网络的中文文本分类需要解决的核心问题是特征的选择问题。特征选择涉及选择哪些特征和选择的特征维度两个问题。针对上述问题,提出了信息增益(IG)与主成分分析(PCA)相结合的特征选择方法。通过实验 ...2018-2-6 09:40 - DL-er - 人工智能论文版
基于支持向量机的文本分类
0 个回复 - 542 次查看 摘要:随着人工智能方法的发展,智能理解语义的自然语言处理方法日趋成熟,而用计算机对大规模文本进行分类挖掘的需求也与日俱增。本文中,我利用分词工具对人工智能领域的部分论文的摘要进行了分词,并根据其刊登的期刊 ...2018-2-3 06:40 - DL-er - 人工智能论文版
利用文本分类技术研究方剂分类
0 个回复 - 484 次查看 摘要:目的:借助现代化的工具和手段,批量处理中医方剂信息,发现方剂的类别及内在联系。方法:利用计算机自然语言处理领域的知识,基于文本分类算法,计算方剂相似度,为研究中医方剂提供有用信息。结果:KNN分类器可以 ...2018-2-2 01:20 - DL-er - 人工智能论文版
基于特征缺失补偿最大熵模型的文本分类
0 个回复 - 483 次查看 摘要:针对自然语言处理中普遍存在的特征缺失问题,提出了基于特征缺失补偿最大熵模型的文本分类方法。为避免数据稀疏时出现训练过适应,采用高斯先验平滑进行特征补偿,并提出基于条件最大熵计算增益和基于特征频数的混 ...2018-2-1 21:00 - AIworld - 人工智能论文版
语义词特征提取及其在维吾尔文文本分类中的应用
0 个回复 - 404 次查看 摘要:基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性.该文使用另外一种维吾尔文自动分词方法dme-TS.dme-TS中,不再以词间空格作为切分标记提取词特征,而是用一种组合统计量(dme)来度 ...2018-1-28 00:39 - AIworld - 人工智能论文版
国内文本分类研究论文的统计分析
0 个回复 - 475 次查看 摘要:介绍文本分类是一个跨信息检索、机器学习和计算语言学的综合研究领域,是信息处理的重要研究方向,指出它在自动标引、信息检索、文本过滤和文献组织等领域中有着广泛的应用;并通过应用文献计量学的方法对1998 ...2018-1-27 21:00 - 论文库 - 人工智能论文版
中文文本分类研究
1 个回复 - 467 次查看 摘要:使用k近邻、支持向量机和最大熵模型进行中文文本分类的研究,对目前应用较多的k近邻、支持向量机和最大熵模型,分别进行了基于特征词布尔值和基于特征词词频的中文文本分类实验。实验结果显示,在相同的条件下 ...2018-1-27 18:39 - 人工智能-AI - 人工智能论文版
基于句类向量空间模型的自动文本分类研究
0 个回复 - 397 次查看 摘要:向量空间模型是自动文本分类中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项通常只能提供较少的局部语义信息。为实现基于内容的文本分类,该文用HNC理论中的句类作为特征项,通过混合句类分解 ...2018-1-27 14:20 - AIworld - 人工智能论文版
文本分类中的特征选择方法
1 个回复 - 693 次查看 摘要:文本分类是数据挖掘的一个重要的研究方向,用机器学习方法进行特征选择对文本分类起关键作用.结合的工作,本文从文本的特征表示、特征选择等方面加以阐述,综合了已有和最新的各种基于评估函数的特征选择的方法,评 ...2018-1-27 07:40 - 论文库 - 人工智能论文版
文本分类中连续属性离散化方法的研究
0 个回复 - 466 次查看 摘要:针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征 ...2018-1-27 00:20 - 人工智能-AI - 人工智能论文版
基于正例的多类文本分类方法
0 个回复 - 444 次查看 摘要:文本分类属于有指导的机器学习,而构造一个按照兴趣分类的分类器,需要做大量的预处理工作,来收集正负的训练样例,但负例的收集是非常困难的。提出了一个只有正例的基于支持向量机的学习模型。实验表明,该学 ...2018-1-26 11:20 - a智多星 - 人工智能论文版
基于模糊粗糙集的Web文本分类
0 个回复 - 332 次查看 摘要:网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Web文本分类方法。采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量 ...2018-1-26 09:20 - DL-er - 人工智能论文版
基于LSI和SVM相结合的文本分类研究
0 个回复 - 668 次查看 摘要:传统的向量空间模型使用关键词来表示文本,但没有考虑关键词的一词多义和多词一义问题。为了解决该问题,提出了一种潜在语义索引和支持向量机相结合的文本分类方法,使用潜在语义索引方法获得原始特征向量的潜 ...2018-1-25 23:00 - 人工智能-AI - 人工智能论文版
基于支持向量机的文本分类方法研究
0 个回复 - 529 次查看 摘要:文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展,其中基于支持向量机的文本分类方法的研究是信息检索领域的一个重要分支。本文首先讨论了该领域的研究状况,接着 ...2018-1-25 10:40 - AIworld - 人工智能论文版
基于神经网络算法的文本分类器研究
0 个回复 - 390 次查看 摘要:文本自动分类是目前最常用的文本信息自动处理技术,也是人工智能、自然语言处理和信息检索领域的研究热点。对文本自动分类所涉及的相关问题进行了全面论述,并简单介绍了基于神经网络的文本分类器的设计与实现。 ...2018-1-25 04:40 - DL-er - 人工智能论文版
基于模糊支持向量机的文本分类
0 个回复 - 377 次查看 摘要:为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证 ...2018-1-25 00:40 - 人工智能-AI - 人工智能论文版
一种基于集成学习与类指示器的文本分类方法
0 个回复 - 464 次查看 摘要:提出了一种基于集成学习机制与类指示器的文本分类方法.该方法利用AdaBoost.MH算法框架,在每一轮次中,自适应地计算类指示度,通过加权组合所有成员类指示度,获得对理想类指示度的一种逼近.利用最终的类指示度所得 ...2018-1-24 21:59 - 论文库 - 人工智能论文版
一种新的用于文本分类的概率分类器设计
0 个回复 - 434 次查看 摘要:为了进一步提高文本分类的准确率,文中介绍了一种新的用于文本分类的概率分类器。该分类器首先通过自然语言处理技术对文本进行预处理,然后从训练集中读取文本信息从而产生正、负规则,并计算正负权重系数,最 ...2018-1-24 21:40 - 论文库 - 人工智能论文版
基于朴素贝叶斯的文本分类研究综述
0 个回复 - 850 次查看 摘要:文本自动分类是自然语言处理领域的重要分支之一,已经形成了大量的模型以及算法,其中基于朴素贝叶斯的相关研究是该领域持续的热点。本文对基于朴素贝叶斯的文本自动分类研究进行了系统的综述。探讨了多项式模型 ...2018-1-24 07:00 - a智多星 - 人工智能论文版
文本分类算法研究
0 个回复 - 553 次查看 摘要:文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本 ...2018-1-24 01:39 - a智多星 - 人工智能论文版
使用最大熵模型进行文本分类
0 个回复 - 414 次查看 摘要:最大熵模型是一种在广泛应用于自然语言处理中的概率估计方法。文中使用最大熵模型进行了文本分类的研究。通过实验,将其和Bayes、KNN、SVM三种典型的文本分类器进行了比较,并且考虑了不同特征数目和平滑技术对 ...2018-1-23 15:40 - 论文库 - 人工智能论文版
基于类空间密度的文本分类特征加权算法
0 个回复 - 439 次查看 摘要:特征加权是一种依据特征在分类中起到的作用为特征赋予相应权重的过程,是为了提高分类性能而为特征标记权重的策略。基于类空间密度提出了两个新的特征加权算法:tf*ICSDF和ICSDF-based。实验中,在RCV1-4和20 N ...2018-1-23 11:20 - a智多星 - 人工智能论文版
基于N元语言模型的文本分类方法
0 个回复 - 400 次查看 摘要:分类是近年来自然语言处理领域的一个研究热点.在分析了传统的分类模型后,文中提出了用N元语言模型作为中文文本分类模型.该模型不以传统的"词袋"(bag of words)方法表示文档,而将文档视为词的随机观察序列.根据 ...2018-1-23 11:20 - a智多星 - 人工智能论文版
基于文本分类方法识别《史记》的伪作
0 个回复 - 498 次查看 摘要:使用基于机器学习的文本分类方法对《史记》的伪作识别进行了研究。《史记》是我国第一部纪传体通史,其伪作的识别历来是其研究中的重点问题。但传统的研究方法较为主观,不能定量,且多种结论互相矛盾。文中提出一 ...2018-1-23 08:00 - 人工智能-AI - 人工智能论文版
Markov逻辑网及其在文本分类中的应用
0 个回复 - 456 次查看 摘要:介绍了Markov逻辑网的理论模型、学习算法和推理算法,并将其应用于中文文本分类中。实验结合了判别式训练的学习算法,MC-SAT、吉布斯抽样和模拟退火等推理算法,结果表明基于Markov逻辑网的分类方法能够取得比 ...2018-1-23 07:20 - AIworld - 人工智能论文版
一个结合信息相关性分析的快速文本分类模型
0 个回复 - 433 次查看 摘要:如何准确地实现文本的有序组织,是自然语言处理的一个重要研究方向.本文首先介绍了文本分类的研究现状,讨论了基于向量空间模型的分类法的基本思想.在此基础上,通过对文本识别本质的研究,在向量空间模型的基础上 ...2018-1-23 06:00 - DL-er - 人工智能论文版
一种基于紧密度的半监督文本分类方法
0 个回复 - 352 次查看 摘要:自动的文本分类已经成为一个重要的研究课题。在实际的应用情况下,很多训练语料都只有一个数目有限的正例集合,同时语料中的正例和未标注文档在数量上的分布通常也是不均衡的。因此这种文本分类任务有着不同于传 ...2018-1-23 00:39 - 人工智能-AI - 人工智能论文版
一种新的多类SVM方法及其在文本分类中的应用
0 个回复 - 456 次查看 摘要:提出一种将SVM扩展到多类文本分类问题的新方法,此方法有增量模式及批模式两种应用途径。其中,批模式提供了一种其他多类SVM替代方法;而增量模式在重复利用原有模型的基础上将新增类别的知识信息以增量方式更 ...2018-1-22 20:40 - DL-er - 人工智能论文版
使用概念描述的中文短文本分类算法
0 个回复 - 505 次查看 摘要:针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种使用了概念描述的短文本分类算法,该方法首先构建出全局的语义概念词表;然后,使用概念词表分别对预测短文本和训练短文本概 ...2018-1-22 02:59 - a智多星 - 人工智能论文版
基于事件卷积特征的新闻文本分类
0 个回复 - 486 次查看 摘要:以往的卷积神经网络模型在对文本建模和分类时,通常按顺序提取n-gram卷积特征,忽视了长距离依存关系中的句法结构和语义信息。提出了一种基于事件卷积特征的文本分类方法,利用事件的语义特性弥补之前模型的不足。 ...2018-1-21 23:20 - 论文库 - 人工智能论文版
基于粗糙集的文本分类方法研究
0 个回复 - 376 次查看 摘要:本文旨在利用粗糙集优越的约简理论对文本进行分类.主要完成了以下几个方面的任务:对文本进行了预处理;改进了Okapi权重计算公式,并对权值进行了离散化;实现了属性约简和规则抽取,首先利用区分矩阵对特征向量维数 ...2018-1-21 11:20 - AIworld - 人工智能论文版
几种省长信箱文本分类算法的实验与比较
0 个回复 - 576 次查看 摘要:省长信箱是ZF密切联系群众的纽带。本文对省长信箱文本分类算法进行了研究。我们应用五种机器学习算法,包括:SVM、Bayes、fisher、Adaboost、k NN,对抓取的605篇省长信箱文本进行了分类实验,对比了这些算法的分 ...2018-1-16 18:20 - 论文库 - 人工智能论文版
基于球向量机的中文文本分类
0 个回复 - 368 次查看 摘要:SVM在文本分类中的应用是近年来文本分类领域重要的进展之一。许多实验表明,SVM在文本分类中比其他的机器学习算法表现出更高的分类精度,但在大规模数据上的收敛速度较慢,成为SVM在实际应用中的一大缺点。球向 ...2018-1-16 13:40 - a智多星 - 人工智能论文版
一种增量式Bayes文本分类算法
0 个回复 - 426 次查看 摘要:文本自动分类是数据挖掘和机器学习中非常重要的研究领域.针对难以获得大量有类标签的训练集问题,提出了基于小规模标注语料的增量式Bayes文本分类算法.该算法分两种情况处理:第一种情况是新增样本有类标签,可直 ...2018-1-15 01:20 - 人工智能-AI - 人工智能论文版
一种基于apiori算法改进的knn文本分类方法
0 个回复 - 428 次查看 摘要:针对现在机器学习的文本分类算法普遍使用的knn,支持向量机,神经网络等算法进行分类中存在的两个问题,没有考虑到语义关联对其文本的影响和受文章长短对其词频向量大小的影响,通过结合apiori算法进行改进knn算法 ...2018-1-13 18:00 - DL-er - 人工智能论文版
基于MongoDB的文本分类研究
0 个回复 - 667 次查看 摘要:文章基于流行的非关系型数据库MongoDB,结合Spark机器学习库中的朴素贝叶斯分类器和支持向量机,对豆瓣影评及京东商评进行情感分类,并采用准确率、召回率、F-Measure等指标对分类效果进行评价,最后测试了Spark-M ...2018-1-13 01:39 - 人工智能-AI - 人工智能论文版
自动情感文本分类研究综述
0 个回复 - 375 次查看 摘要:情感分类及其应用是目前研究的一个热点,是自然语言处理,机器学习和心理学等多学科交叉的研究课题,在很多领域都有实际的应用,如产品的声誉分析,舆情跟踪,博客兴趣分析等。论文对情感分类目前国内外的研究概貌进 ...2018-1-12 19:20 - 论文库 - 人工智能论文版
基于粗糙集和最小二乘支持向量机的文本分类方法
0 个回复 - 380 次查看 摘要:文本分类是数据挖掘和知识发现的关键,机器学习巳经成功的应用于文本分类。但是,高维度的特征向量影响了分类速度,且特征的选择影响了分类精度。本文提出一种粗糙集和最小二乘支持向量机相结合的文本分类方法 ...2018-1-12 07:20 - 人工智能-AI - 人工智能论文版
半监督文本分类综述
0 个回复 - 555 次查看 摘要:文本分类是人们日常工作中经常遇到的问题,也是机器学习的重要研究内容。半监督学习算法同时考虑有标记和无标记数据,能显著提升学习效果。给出了文本分类的定义和特点,介绍了传统的监督学习分类算法和评价指 ...2018-1-12 00:00 - DL-er - 人工智能论文版
一种半监督局部线性嵌入算法的文本分类方法
0 个回复 - 428 次查看 摘要:针对局部线性嵌入算法(LLE)应用于非监督机器学习中的缺陷,将该算法与半监督思想相结合,提出了一种基于半监督局部线性嵌入算法的文本分类方法。通过使用文本数据的流形结构和少量的标签样本,将LLE中的距离 ...2018-1-10 20:20 - 论文库 - 人工智能论文版
支持向量机的中文文本分类研究
0 个回复 - 421 次查看 摘要:支持向量机是一种基于统计学习理论的新型机器学习方法,在文本分类领域取得了很好的效果.使用支持向量机进行了文本分类的研究,实现了一个中文文本自动分类系统,并给出了实验结果.原文链接:http://www.cqvip.com ...2018-1-7 23:20 - a智多星 - 人工智能论文版
运用文本领域的常识改善基于支撑向量机的文本分类器性能
0 个回复 - 462 次查看 摘要:本文提出了一种提高中文文本分类器推广性能的方法。一般而言,采用机器学习的方法对文本集合进行训练,可以获得文本分类器。本文引入了文本语义不变性常识,并将其融合到文本分类器中,提出了改进文本分类器的 ...2018-1-7 13:40 - a智多星 - 人工智能论文版