结果:找到“jieba”相关内容22个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
【推荐】上市公司人工智能指标人工智能词频Python处理代码(2000-2023年)年报文本
9 个回复 - 1326 次查看 人工智能指标 包含: [*]Python代码提取词频,画词云图 [*]年报txt原始文本 [*]人工智能关键词 [*]最后处理好的结果 计算说明[hr] 人工智能词典的生成 人工智能词典的生成步骤为: (1)参考陈 ...2024-7-20 15:59 - momingqimiao7 - 现金交易版
年报爬虫python代码及年报链接
0 个回复 - 182 次查看 年报文本分析爬虫程序,适用于对python入门的小白,需要通过pip install命令安装部分爬虫必备插件,如jieba库等,同时修改保存文件夹位置就可使用,附有2003-2022年报链接。完全没接触python的同学请谨慎购买。2024-7-19 15:15 - 591596 - 现金交易版
【推荐】上市企业经济政策不确定性感知2001-2023年赠送Python代码和管理层分析与讨论
6 个回复 - 1557 次查看 上市企业经济政策不确定性感知 计算说明[hr] 现有关于经济政策不确定性的研究通常将不确定性当作一种宏观冲击,没有测度和区分不同企业的政策不确定性感受差异。本文使用文本挖掘方法,从 2001-2023 年 ...2024-7-16 14:42 - momingqimiao7 - 现金交易版
【推荐】Python提取年报关键词 jieba 以及基本版本
6 个回复 - 1804 次查看 -年报 财务报告 文本分析法 关键词分析 【后续更新2021年年报时会进行更新】 完全小白代码,不需要python的基础知识,自己只需知道修改的地方即可。 用于数字化转型 企业战略等非常常见 关键词分析 ...2022-7-9 15:15 - a1010967149 - 现金交易版
安装Rtools及jiebaR中文分词包的教程
5 个回复 - 10265 次查看 因为在安装jiebaR这个包时,有人说可以直接在r cran上安装了,也就是用install.packages()这个函数来安装。 不过试了一下,还是不行。所以按照先安装Rtools然后再安装devtools及jiebaR的顺序来安装了。 这个包可 ...2014-11-29 16:15 - jiangbeilu - R语言论坛
python 的jieba分词好用吗?年报中主营业务产品加到里面去,会不会词语太多?
2 个回复 - 617 次查看 年报中的年报主营业务产品中的名词会不会重复太少?比如我想判断一家公司跟另一家公司是不是类似行业,那他们主营业务产品会不会不够类似?2024-6-17 10:24 - magicsun - python论坛
jieba包括哪些词
0 个回复 - 459 次查看 将‘世界和平’加入jiaba的词库,是否永久保存在词库中,还是需要反复添加?2024-5-22 18:14 - wtst - python论坛
如何安装jieba?
0 个回复 - 301 次查看 在anaconda prompt中执行: pip install jieba进度条执行完成会出现:Successfully installed jieba --他的型号然后可以去jupyter notebook 调用, 跟别的包调用方法一样 使用: import jieba2022-11-1 13:11 - 我是小趴菜 - 数据分析与数据挖掘
如何把递归函数和jieba分词结合到一起使用
6 个回复 - 1299 次查看 当前正在写毕业论文,使用到结巴分词,由于文件夹下的文章太多,复制不过来,有大佬出主意说可以使用递归函数遍历文章,但是遍历文章之后无法把他和结巴分词结合到一起,,求大佬指点2022-2-25 10:45 - 15560169761 - python论坛
jiebaR会直接使用user.dict.utf8吗
1 个回复 - 731 次查看 我已经将用户词典替换成了搜狗词库, jiebaR包运行的时候会自动使用这个词库还是仍然只使用默认的dict库,因为输出的词云仍然以两个字的为主2021-7-7 15:22 - hanxiaotong - R语言论坛
jiebar批量处理文本分析提取关键词
1 个回复 - 1357 次查看 我现在有一个大约130行文字的txt文本文档, 我想对每一行都提取TF-IDF关键词, 而后将130条关键词纪录输出到Excel表格中, 求一段代码,主要是自动批量提取每行关键词的部分我不会,我只会手动一行一行弄,太慢 ...2020-4-28 16:28 - 怎么没来盗号! - R语言论坛
R语言 jieba 文本分析 怎么提取含某词的行
0 个回复 - 781 次查看 我用 jiebar 处理 几本书的txt文件,我想只提取含有某个字,比如“信”,的句子,其他文本不要。 求问怎么编写代码?????2020-4-28 09:57 - 怎么没来盗号! - 爱问频道
R语言jiebar 文本分析 如何删除默认词典中的某些词
0 个回复 - 879 次查看 需要把jieba默认词典中的某几个词删掉,但是再分词时还会出现这个词,怎么处理。。。??? 请高手指点代码。。。2020-4-28 09:48 - 怎么没来盗号! - 爱问频道
R语言jiebaR中文分词报错
2 个回复 - 1942 次查看 Read 19 items > engine=worker() > word_seg=segment(word,engine) 2019-11-06 23:23:14 ../inst/include/lib/PreFilter.hpp:21 ERROR decode failed. 批量处理一批txt文档,有的报错,有的就分词成功,请 ...2019-11-6 23:28 - tiangy2019 - R语言论坛
JiebaR资料
1 个回复 - 722 次查看jiebaR完整中文资料分享2018-11-25 09:49 - glasspie - R语言论坛
关于jiebaR包的词性怎么处理
1 个回复 - 1546 次查看 怎么用jiebaR包根据词性来进行筛选2017-11-29 12:23 - sczy14404227 - 数据可视化
python中文分词jieba总结
1 个回复 - 2314 次查看 1. GitHub:https://github.com/fxsjy/jieba2.分词[hr] [*]jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型 [*]jieba.cut_for_search ...2018-7-3 13:42 - jpld - python论坛
python中文分词jieba总结(下)
1 个回复 - 1353 次查看 基本思想: [*]将待抽取关键词的文本进行分词 [*]以固定窗口大小(默认为5,通过span属性调整),词之间的共现关系,构建图 [*]计算图中节点的PageRank,注意是无向带权图 使用示例:见 test/demo.py [*]词性标注 ...2018-7-3 13:43 - jpld - python论坛
R语言中文分词包jiebar
1 个回复 - 1104 次查看 jiebaR有没有办法跟mmseg4j一样分词不切成字符串 就是切成“我 爱 中国 天安门”这样 用空格分词 分完之后依旧是一整个字符串2017-7-28 14:48 - xm123155 - R语言论坛
Rwordseg与jiebaR分词之间的区别
4 个回复 - 2419 次查看 http://blog.csdn.net/sinat_26917383/article/details/510560682017-2-20 23:00 - lg21c - 数据分析与数据挖掘
R语言jiebaR包 for语句循环simhash函数却不执行输出
1 个回复 - 1046 次查看 这个是出问题的部分,运行之后是这样的,不知道咋回事TAT for语句循环未执行各位大佬求帮忙 我新学的jiebaR presentation$address就是一列27行的不同地址2017-7-29 00:20 - xm123155 - R语言论坛
关于jiebaR构建词矩阵的问题
1 个回复 - 2081 次查看 各位大神好,我想问一下如果在先用tm构建语料库然后构建词矩阵中,我想用jiebaR进行分词而不用Rwordseg进行分词,应该怎样组织jieba分词形式才能实现呢?我试过好几种形式都不能得出词矩阵。(我花了两天研究安装Rwo ...2016-5-25 21:39 - 鸡聚族以争食1 - R语言论坛
jiebaR分词包 出现error zero-length pattern.求助!
2 个回复 - 3324 次查看 对10万个微博主的简介进行分词,用了"jiebaR"的软件包。用了个for的循环abc=function(x){ mixseg=worker() k=length(x) y=NULL for (i in 1:k) {y2015-6-26 17:05 - zh1221zh - R语言论坛
jiebaR中文分词词典匹配统计问题
6 个回复 - 4693 次查看 我用jiebaR做了分词,并按照list方式排列 然后想匹配词典,统计个数,呈向量显示。 例如:女主好白皮肤好棒 我侧重的问一下唇膏色号 分词结果:"女主好" "白" "皮肤" "好棒" "我" "侧重" "的" ...2015-11-6 16:35 - 兜兜爱人大 - R语言论坛