结果:找到“停用词”相关内容13个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
【重磅推荐】词频爬取\文本分析\语调分析\情感分析【年报 MDA 社会责任报告】
154 个回复 - 12544 次查看 文本分析 语调分析 词频统计 情感分析 年报分析 Python爬取的代码 代码有具体的解释说明,基本上每一步都写了注释,保证小白能够使用! 一、❗️❗️代码有下列几个版本: ① ...2022-10-1 10:07 - a1010967149 - 现金交易版
【推荐 2021更新】数字化转型MDA词频分析2001-2021 管理层经营讨论与分析词频占比
151 个回复 - 10024 次查看 数字化转型MDA词频分析2001-2021[hr]全流程构建以及最新版本袁淳数据:https://bbs.pinggu.org/thread-11243044-1-1.html 1、数据来源:基于上市公司年报种的管理层分析与讨论部分2、时间跨度:2001-2021年 ...2022-9-26 15:31 - a1010967149 - 现金交易版
【推荐 2021更新】企业数字化转型 (袁淳) 数字 2001-2021
146 个回复 - 9839 次查看 企业数字化转型词频 2001-2021 提供python程序+词频结果文件+最终可用文件 已购买过老版本的同学直接找我领取, 最新全流程袁淳版本请看最新贴: 全流程构建以及最新版本袁淳数据:https://bbs.pinggu.o ...2022-9-25 18:54 - a1010967149 - 现金交易版
常见停用词库与情感词库集
5 个回复 - 2795 次查看 清华大学李军情感词库hownet 台湾NTUSD 百度停用词表 哈工大停用词表 四川大学机器智能实验室停用词表 还有一些杂七杂八2019-6-2 11:24 - 月夜吟丽词 - Forum
求文本挖掘中文停用词txt
8 个回复 - 6618 次查看 各位大神,谁有中文分词停用词txt文件,可以分享一下吗2019-1-8 16:14 - pennyr617 - R语言论坛
哈工大停用词
0 个回复 - 810 次查看 2021-6-24 22:09 - 杜若lx - 数据分析与数据挖掘
【python】文本分析时的停用词表以及去除除中文外的所有内容的小技巧
4 个回复 - 6609 次查看 pat=re.compile(r'[\u4e00-\u9fa5]+') result=pat.findall(row) “\u4e00-\u9fa5”是中文编码范围,只会剩下中文内容,免去了在停用词表中添加一些无意义的标点符号,数字,英文字母等。 附件是“百度停用词 ...2019-8-16 11:10 - MiSs.RainBowsss - 数据分析师(CDA)专版
停用词(stopword)
8 个回复 - 4275 次查看 停用词(stopword) Python 爬虫, 词云等必备2018-7-31 07:33 - 汗青一木 - python论坛
停用词是什么意思?这些词是默认的还是自定义的?
0 个回复 - 630 次查看 在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,比如“的”、“是”、“而且”、“但是”、”非常“等。这些字或词即被称为Stop Words(停用词)。Ji ...2022-10-19 10:39 - 我是小趴菜 - 数据分析与数据挖掘
停用词是什么意思?这些词是默认的还是自定义的?
1 个回复 - 416 次查看 在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,比如“的”、“是”、“而且”、“但是”、”非常“等。这些字或词即被称为Stop Words(停用词)。Ji ...2022-10-17 11:42 - 我是小趴菜 - 数据分析与数据挖掘
求助r语言如何去除英文停用词字符
2 个回复 - 4337 次查看 用什么函数呢2019-6-10 00:26 - xc793997241 - R语言论坛
R中文停用词包导入问题
3 个回复 - 4535 次查看 用Rwordseg包做分词时导入停用词包显示乱码,导入代码和导入文本如下图所示,请问应怎样修改导入代码: stopwords2019-1-10 10:49 - pennyr617 - R语言论坛
知识抽取中的停用词处理技术
0 个回复 - 1002 次查看 摘要:在知识抽取的分词过程中,需要提前把停用词标引出来。停用词处理的关键在于停用词的认定、停用词表的获取与组织技术以及停用词匹配技术。停用词的识别常常需要停用词表,识别过程中需要判断假停用词以降低噪声 ...2017-10-25 19:00 - AIworld - 人工智能论文版
tm包,文本分析,分词,删除停用词。出现问题
1 个回复 - 2726 次查看 segmentCN(file.choose(),returnType="tm") mydoc2017-7-18 10:07 - chaunceyzhou - R语言论坛
Rwordseg中文停用词导入成功但没有删除
13 个回复 - 11097 次查看 请问用Rwordseg分词的时候,导入的中文停用词,是txt格式,导入成功没有错误,但是实际结果中停用词并没有被删除。请问这是什么原因?怎么解决呢?谢谢啦!2015-11-3 16:34 - 松子茶hc - R语言论坛
文本分析(tm)怎么导入中文停用词
10 个回复 - 18179 次查看 用tm做文本分析,想要剔除中文的停用词 在网上找了一个哈工大的停用词表 然后保存为一个名为stopwordsCN的文本向量 但是用tm_map(X, removeWords,stopwordsCN)却提示出错了,“错误于gsub(sprintf("(*UCP)\\b(%s) ...2014-5-24 15:39 - lightcatcher - R语言论坛