结果:找到“Jieba”相关内容19个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
【重磅 2021最新】数字化转型数据集 可能是最全的数字化转型数据
29 个回复 - 5008 次查看 数字化转型数据合集整理了基本上最常见的数字化转型的度量方式,全部都是目前为止最为常用的顶刊数据用法,具体数据说明如下 一、词频 (一)吴非版本(2007-2021) 参考文献: [1]吴非,胡慧芷,林慧妍,任晓怡. ...2022-7-23 12:49 - a1010967149 - 现金交易版
【重磅 2021最新】上市公司年报关键词爬取 2007-2021
4 个回复 - 1937 次查看 上市公司年报关键词爬取 2007-2021 【注】纯小白版本,已经写好了代码的整体使用说明,可能出现的错误也进行了总结,整体流程已经测试完毕,全流程可运行。 一、数据说明 ①包含2007-2021年所有的年报txt文件 ② ...2022-7-23 12:05 - a1010967149 - 现金交易版
【推荐】数字化 企业数字化转型 (袁淳) 数字 2001-2020
35 个回复 - 4884 次查看 企业数字化转型词频 2007-2020 提供python程序+词频结果文件+最终可用文件 一、参考文献 [1]袁淳,肖土盛,耿春晓,盛誉.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021(09):137-155.DO ...2022-7-18 21:21 - a1010967149 - 现金交易版
【推荐】Python提取年报关键词 jieba 以及基本版本
5 个回复 - 1759 次查看 -年报 财务报告 文本分析法 关键词分析 【后续更新2021年年报时会进行更新】 完全小白代码,不需要python的基础知识,自己只需知道修改的地方即可。 用于数字化转型 企业战略等非常常见 关键词分析 ...2022-7-9 15:15 - a1010967149 - 现金交易版
安装Rtools及jiebaR中文分词包的教程
5 个回复 - 10249 次查看 因为在安装jiebaR这个包时,有人说可以直接在r cran上安装了,也就是用install.packages()这个函数来安装。 不过试了一下,还是不行。所以按照先安装Rtools然后再安装devtools及jiebaR的顺序来安装了。 这个包可 ...2014-11-29 16:15 - jiangbeilu - R语言论坛
如何把递归函数和jieba分词结合到一起使用
6 个回复 - 1271 次查看 当前正在写毕业论文,使用到结巴分词,由于文件夹下的文章太多,复制不过来,有大佬出主意说可以使用递归函数遍历文章,但是遍历文章之后无法把他和结巴分词结合到一起,,求大佬指点2022-2-25 10:45 - 15560169761 - python论坛
jiebaR会直接使用user.dict.utf8吗
1 个回复 - 720 次查看 我已经将用户词典替换成了搜狗词库, jiebaR包运行的时候会自动使用这个词库还是仍然只使用默认的dict库,因为输出的词云仍然以两个字的为主2021-7-7 15:22 - hanxiaotong - R语言论坛
jiebar批量处理文本分析提取关键词
1 个回复 - 1342 次查看 我现在有一个大约130行文字的txt文本文档, 我想对每一行都提取TF-IDF关键词, 而后将130条关键词纪录输出到Excel表格中, 求一段代码,主要是自动批量提取每行关键词的部分我不会,我只会手动一行一行弄,太慢 ...2020-4-28 16:28 - 怎么没来盗号! - R语言论坛
R语言 jieba 文本分析 怎么提取含某词的行
0 个回复 - 770 次查看 我用 jiebar 处理 几本书的txt文件,我想只提取含有某个字,比如“信”,的句子,其他文本不要。 求问怎么编写代码?????2020-4-28 09:57 - 怎么没来盗号! - 爱问频道
R语言jiebar 文本分析 如何删除默认词典中的某些词
0 个回复 - 869 次查看 需要把jieba默认词典中的某几个词删掉,但是再分词时还会出现这个词,怎么处理。。。??? 请高手指点代码。。。2020-4-28 09:48 - 怎么没来盗号! - 爱问频道
R语言jiebaR中文分词报错
2 个回复 - 1923 次查看 Read 19 items > engine=worker() > word_seg=segment(word,engine) 2019-11-06 23:23:14 ../inst/include/lib/PreFilter.hpp:21 ERROR decode failed. 批量处理一批txt文档,有的报错,有的就分词成功,请 ...2019-11-6 23:28 - tiangy2019 - R语言论坛
JiebaR资料
1 个回复 - 715 次查看 求jiebaR完整中文资料分享2018-11-25 09:49 - glasspie - R语言论坛
关于jiebaR包的词性怎么处理
1 个回复 - 1530 次查看 怎么用jiebaR包根据词性来进行筛选2017-11-29 12:23 - sczy14404227 - 数据可视化
python中文分词jieba总结
1 个回复 - 2298 次查看 1. GitHub:https://github.com/fxsjy/jieba2.分词[hr] [*]jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型 [*]jieba.cut_for_search ...2018-7-3 13:42 - jpld - python论坛
python中文分词jieba总结(下)
1 个回复 - 1341 次查看 基本思想: [*]将待抽取关键词的文本进行分词 [*]以固定窗口大小(默认为5,通过span属性调整),词之间的共现关系,构建图 [*]计算图中节点的PageRank,注意是无向带权图 使用示例:见 test/demo.py [*]词性标注 ...2018-7-3 13:43 - jpld - python论坛
R语言中文分词包jiebar
1 个回复 - 1098 次查看 jiebaR有没有办法跟mmseg4j一样分词不切成字符串 就是切成“我 爱 中国 天安门”这样 用空格分词 分完之后依旧是一整个字符串2017-7-28 14:48 - xm123155 - R语言论坛
Rwordseg与jiebaR分词之间的区别
4 个回复 - 2399 次查看 http://blog.csdn.net/sinat_26917383/article/details/510560682017-2-20 23:00 - lg21c - 数据分析与数据挖掘
R语言jiebaR包 for语句循环simhash函数却不执行输出
1 个回复 - 1037 次查看 这个是出问题的部分,运行之后是这样的,不知道咋回事TAT for语句循环未执行各位大佬求帮忙 我新学的jiebaR presentation$address就是一列27行的不同地址2017-7-29 00:20 - xm123155 - R语言论坛
关于jiebaR构建词矩阵的问题
1 个回复 - 2074 次查看 各位大神好,我想问一下如果在先用tm构建语料库然后构建词矩阵中,我想用jiebaR进行分词而不用Rwordseg进行分词,应该怎样组织jieba分词形式才能实现呢?我试过好几种形式都不能得出词矩阵。(我花了两天研究安装Rwo ...2016-5-25 21:39 - 鸡聚族以争食1 - R语言论坛
jiebaR分词包 出现error zero-length pattern.求助!
2 个回复 - 3313 次查看 对10万个微博主的简介进行分词,用了"jiebaR"的软件包。用了个for的循环abc=function(x){ mixseg=worker() k=length(x) y=NULL for (i in 1:k) {y2015-6-26 17:05 - zh1221zh - R语言论坛
jiebaR中文分词词典匹配统计问题
6 个回复 - 4667 次查看 我用jiebaR做了分词,并按照list方式排列 然后想匹配词典,统计个数,呈向量显示。 例如:女主好白皮肤好棒 我侧重的问一下唇膏色号 分词结果:"女主好" "白" "皮肤" "好棒" "我" "侧重" "的" ...2015-11-6 16:35 - 兜兜爱人大 - R语言论坛