结果:找到“Jieba 分词”相关内容10个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
【重磅 2021最新】上市公司年报关键词爬取 2007-2021
4 个回复 - 1952 次查看 上市公司年报关键词爬取 2007-2021 【注】纯小白版本,已经写好了代码的整体使用说明,可能出现的错误也进行了总结,整体流程已经测试完毕,全流程可运行。 一、数据说明 ①包含2007-2021年所有的年报txt文件 ② ...2022-7-23 12:05 - a1010967149 - 现金交易版
银行数字化转型数据(2011-2020)-整理好的面板数据
10 个回复 - 2029 次查看 数据类型:年度、40家上市银行非平衡面板 数据处理:通过统计银行年报中涉及“数字化转型”的词频来刻画其转型程度,具有可行性和科学性。具体而言,借助Python 爬虫功能对中国上市银行年度报表进行爬取,并采用J ...2022-5-29 10:46 - wueny1205 - 现金交易版
31省份ZF工作报告环境词汇词频统计(1998-2020)
1 个回复 - 1366 次查看 在相关文献中,环境词汇与ZF工作报告全部词频比例可以用来衡量ZF命令型/强制性环境规制。附件中是1998-2020年各省ZF工作报告环境词汇词频数据,包括31个省区,时间跨度为1998-2020年,环境词汇种类丰富。【计算方式】 ...2022-5-6 17:58 - 我我我爱学习 - 现金交易版
安装Rtools及jiebaR中文分词包的教程
5 个回复 - 10257 次查看 因为在安装jiebaR这个包时,有人说可以直接在r cran上安装了,也就是用install.packages()这个函数来安装。 不过试了一下,还是不行。所以按照先安装Rtools然后再安装devtools及jiebaR的顺序来安装了。 这个包可 ...2014-11-29 16:15 - jiangbeilu - R语言论坛
如何把递归函数和jieba分词结合到一起使用
6 个回复 - 1280 次查看 当前正在写毕业论文,使用到结巴分词,由于文件夹下的文章太多,复制不过来,有大佬出主意说可以使用递归函数遍历文章,但是遍历文章之后无法把他和结巴分词结合到一起,,求大佬指点2022-2-25 10:45 - 15560169761 - python论坛
R语言jiebaR中文分词报错
2 个回复 - 1934 次查看 Read 19 items > engine=worker() > word_seg=segment(word,engine) 2019-11-06 23:23:14 ../inst/include/lib/PreFilter.hpp:21 ERROR decode failed. 批量处理一批txt文档,有的报错,有的就分词成功,请 ...2019-11-6 23:28 - tiangy2019 - R语言论坛
python中文分词jieba总结
1 个回复 - 2303 次查看 1. GitHub:https://github.com/fxsjy/jieba2.分词[hr] [*]jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型 [*]jieba.cut_for_search ...2018-7-3 13:42 - jpld - python论坛
python中文分词jieba总结(下)
1 个回复 - 1343 次查看 基本思想: [*]将待抽取关键词的文本进行分词 [*]以固定窗口大小(默认为5,通过span属性调整),词之间的共现关系,构建图 [*]计算图中节点的PageRank,注意是无向带权图 使用示例:见 test/demo.py [*]词性标注 ...2018-7-3 13:43 - jpld - python论坛
R语言中文分词包jiebar
1 个回复 - 1101 次查看 jiebaR有没有办法跟mmseg4j一样分词不切成字符串 就是切成“我 爱 中国 天安门”这样 用空格分词 分完之后依旧是一整个字符串2017-7-28 14:48 - xm123155 - R语言论坛
Rwordseg与jiebaR分词之间的区别
4 个回复 - 2406 次查看 http://blog.csdn.net/sinat_26917383/article/details/510560682017-2-20 23:00 - lg21c - 数据分析与数据挖掘
jiebaR分词包 出现error zero-length pattern.求助!
2 个回复 - 3318 次查看 对10万个微博主的简介进行分词,用了"jiebaR"的软件包。用了个for的循环abc=function(x){ mixseg=worker() k=length(x) y=NULL for (i in 1:k) {y2015-6-26 17:05 - zh1221zh - R语言论坛
jiebaR中文分词词典匹配统计问题
6 个回复 - 4676 次查看 我用jiebaR做了分词,并按照list方式排列 然后想匹配词典,统计个数,呈向量显示。 例如:女主好白皮肤好棒 我侧重的问一下唇膏色号 分词结果:"女主好" "白" "皮肤" "好棒" "我" "侧重" "的" ...2015-11-6 16:35 - 兜兜爱人大 - R语言论坛