Jieba-经管之家(原经济论坛)-经济、管理、金融、统计在线教育和咨询网站

结果：找到“Jieba”相关内容19个，排序为按回复时间降序，搜索更多相关帖子请点击“高级”

【重磅 2021最新】数字化转型数据集可能是最全的数字化转型数据
29 个回复 - 5008 次查看数字化转型数据合集整理了基本上最常见的数字化转型的度量方式，全部都是目前为止最为常用的顶刊数据用法，具体数据说明如下一、词频（一）吴非版本（2007-2021）参考文献： [1]吴非,胡慧芷,林慧妍,任晓怡. ...2022-7-23 12:49 - a1010967149 - 现金交易版

【重磅 2021最新】上市公司年报关键词爬取 2007-2021
4 个回复 - 1937 次查看上市公司年报关键词爬取 2007-2021 【注】纯小白版本，已经写好了代码的整体使用说明，可能出现的错误也进行了总结，整体流程已经测试完毕，全流程可运行。一、数据说明 ①包含2007-2021年所有的年报txt文件 ② ...2022-7-23 12:05 - a1010967149 - 现金交易版

【推荐】数字化企业数字化转型（袁淳）数字 2001-2020
35 个回复 - 4884 次查看企业数字化转型词频 2007-2020 提供python程序+词频结果文件+最终可用文件一、参考文献 [1]袁淳,肖土盛,耿春晓,盛誉.数字化转型与企业分工：专业化还是纵向一体化[J].中国工业经济,2021(09):137-155.DO ...2022-7-18 21:21 - a1010967149 - 现金交易版

【推荐】Python提取年报关键词 jieba 以及基本版本
5 个回复 - 1759 次查看 -年报财务报告文本分析法关键词分析【后续更新2021年年报时会进行更新】完全小白代码，不需要python的基础知识，自己只需知道修改的地方即可。用于数字化转型企业战略等非常常见关键词分析 ...2022-7-9 15:15 - a1010967149 - 现金交易版

安装Rtools及jiebaR中文分词包的教程
5 个回复 - 10249 次查看因为在安装jiebaR这个包时，有人说可以直接在r cran上安装了，也就是用install.packages()这个函数来安装。不过试了一下，还是不行。所以按照先安装Rtools然后再安装devtools及jiebaR的顺序来安装了。这个包可 ...2014-11-29 16:15 - jiangbeilu - R语言论坛

如何把递归函数和jieba分词结合到一起使用
6 个回复 - 1271 次查看当前正在写毕业论文，使用到结巴分词，由于文件夹下的文章太多，复制不过来，有大佬出主意说可以使用递归函数遍历文章，但是遍历文章之后无法把他和结巴分词结合到一起，，求大佬指点2022-2-25 10:45 - 15560169761 - python论坛

jiebaR会直接使用user.dict.utf8吗
1 个回复 - 720 次查看我已经将用户词典替换成了搜狗词库， jiebaR包运行的时候会自动使用这个词库还是仍然只使用默认的dict库，因为输出的词云仍然以两个字的为主2021-7-7 15:22 - hanxiaotong - R语言论坛

jiebar批量处理文本分析提取关键词
1 个回复 - 1342 次查看我现在有一个大约130行文字的txt文本文档，我想对每一行都提取TF-IDF关键词，而后将130条关键词纪录输出到Excel表格中，求一段代码，主要是自动批量提取每行关键词的部分我不会，我只会手动一行一行弄，太慢 ...2020-4-28 16:28 - 怎么没来盗号！ - R语言论坛

R语言 jieba 文本分析怎么提取含某词的行
0 个回复 - 770 次查看我用 jiebar 处理几本书的txt文件，我想只提取含有某个字，比如“信”，的句子，其他文本不要。求问怎么编写代码？？？？？2020-4-28 09:57 - 怎么没来盗号！ - 爱问频道

R语言jiebar 文本分析如何删除默认词典中的某些词
0 个回复 - 869 次查看需要把jieba默认词典中的某几个词删掉，但是再分词时还会出现这个词，怎么处理。。。？？？请高手指点代码。。。2020-4-28 09:48 - 怎么没来盗号！ - 爱问频道

R语言jiebaR中文分词报错
2 个回复 - 1923 次查看 Read 19 items > engine=worker() > word_seg=segment(word,engine) 2019-11-06 23:23:14 ../inst/include/lib/PreFilter.hpp:21 ERROR decode failed. 批量处理一批txt文档，有的报错，有的就分词成功，请 ...2019-11-6 23:28 - tiangy2019 - R语言论坛

JiebaR资料
1 个回复 - 715 次查看求jiebaR完整中文资料分享2018-11-25 09:49 - glasspie - R语言论坛

关于jiebaR包的词性怎么处理
1 个回复 - 1530 次查看怎么用jiebaR包根据词性来进行筛选2017-11-29 12:23 - sczy14404227 - 数据可视化

python中文分词jieba总结
1 个回复 - 2298 次查看 1. GitHub:https://github.com/fxsjy/jieba2.分词[hr] [*]jieba.cut 方法接受三个输入参数: 需要分词的字符串；cut_all 参数用来控制是否采用全模式；HMM 参数用来控制是否使用 HMM 模型 [*]jieba.cut_for_search ...2018-7-3 13:42 - jpld - python论坛

python中文分词jieba总结（下）
1 个回复 - 1341 次查看基本思想: [*]将待抽取关键词的文本进行分词 [*]以固定窗口大小(默认为5，通过span属性调整)，词之间的共现关系，构建图 [*]计算图中节点的PageRank，注意是无向带权图使用示例:见 test/demo.py [*]词性标注 ...2018-7-3 13:43 - jpld - python论坛

R语言中文分词包jiebar
1 个回复 - 1098 次查看 jiebaR有没有办法跟mmseg4j一样分词不切成字符串就是切成“我爱中国天安门”这样用空格分词分完之后依旧是一整个字符串2017-7-28 14:48 - xm123155 - R语言论坛

Rwordseg与jiebaR分词之间的区别
4 个回复 - 2399 次查看 http://blog.csdn.net/sinat_26917383/article/details/510560682017-2-20 23:00 - lg21c - 数据分析与数据挖掘

R语言jiebaR包 for语句循环simhash函数却不执行输出
1 个回复 - 1037 次查看这个是出问题的部分，运行之后是这样的，不知道咋回事TAT for语句循环未执行各位大佬求帮忙我新学的jiebaR presentation$address就是一列27行的不同地址2017-7-29 00:20 - xm123155 - R语言论坛

关于jiebaR构建词矩阵的问题
1 个回复 - 2074 次查看各位大神好，我想问一下如果在先用tm构建语料库然后构建词矩阵中，我想用jiebaR进行分词而不用Rwordseg进行分词，应该怎样组织jieba分词形式才能实现呢？我试过好几种形式都不能得出词矩阵。（我花了两天研究安装Rwo ...2016-5-25 21:39 - 鸡聚族以争食1 - R语言论坛

jiebaR分词包出现error zero-length pattern.求助！
2 个回复 - 3313 次查看对10万个微博主的简介进行分词,用了"jiebaR"的软件包。用了个for的循环abc=function(x){ mixseg=worker() k=length(x) y=NULL for (i in 1:k) {y2015-6-26 17:05 - zh1221zh - R语言论坛

jiebaR中文分词词典匹配统计问题
6 个回复 - 4667 次查看我用jiebaR做了分词，并按照list方式排列然后想匹配词典，统计个数，呈向量显示。例如：女主好白皮肤好棒我侧重的问一下唇膏色号分词结果："女主好" "白" "皮肤" "好棒" "我" "侧重" "的" ...2015-11-6 16:35 - 兜兜爱人大 - R语言论坛

课程推荐