结果:找到“文本相似”相关内容24个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
WinGo文构财经文本数据 上市公司文本相似性
2 个回复 - 1076 次查看
字段说明:
security_code[证券代码]:以上海证券交易所和深圳证券交易所公布的证券代码为准。
security_name[证券简称]:以上海证券交易所和深圳证券交易所公布的公司最新证券简称为准。
rep_period[报告期间 ...
2022-6-3 17:32 - Davion2018 - 现金交易版
python Simhash模块 计算文本相似度
1 个回复 - 856 次查看
使用Simhash模块 计算出了两个文本的海明距离,但是不知道该如何使用simhash自带的函数进一步计算相似度。
如果进一步自定义函数,应该怎么计算呢?求各位相助
from simhash import Simhash
hash1 = Simhash(u' ...
2024-7-23 22:05 - 小七六六 - python论坛
文本相似度计算问题
2 个回复 - 3153 次查看
现在有一个数据库,里面存有大量项目,项目主体部分是文本,需要实现筛查项目是否有重复,因为这些主体是文本可能只有部分相似,不能用proc sort这种语句简单计算,查了一下好像余弦相似度、SimHash可以,小弟之前没 ...
2017-8-3 14:21 - 风中飘翼 - SAS专版
中文文本相似度问题
0 个回复 - 1306 次查看
各位前辈,我这边有两个表,数据是中文文本,需要实现筛查数据是否有重复,之前没做过关于文本挖掘问题,请问有大神做过类似问题么,该怎么入手。
数据类型大概如下:
医院名称 省 ...
2018-9-19 14:56 - shushu0629 - SAS专版
基于事件的文本相似度计算
0 个回复 - 483 次查看
摘要:大量研究成果已经表明,事件在很多文本中是客观存在的。从语义的角度理解,诸多文本是由事件组成的,事件是文本表示的最小语义单位。给出了基于事件的文本表示模型,在此模型的基础上,从文本类型相似度计算和 ...
2018-2-10 14:20 - a智多星 - 人工智能论文版
基于语义的文本相似度算法研究
0 个回复 - 568 次查看
摘要:
文本相似度算法研究一直是文本挖掘领域非常重要的算法,指采用一定的策略比较两个文本之间的相似程度,目前
文本相似度算法已经在文本分类、文本聚类、自然语言处理等多个领域崭露头角。本文主要就语义角度出发 ...
2018-2-2 09:40 - 人工智能-AI - 人工智能论文版
文本相似度计算方法研究
0 个回复 - 610 次查看
摘要:
文本相似度计算是文本分类、文本聚类、自动文摘、信息抽取的基础.
文本相似度计算性能直接影响到文本分类、文本聚类、自动文摘的质量.另外
文本相似度还应用于诸多自然语言处理任务中,本文对
文本相似度计算问题进 ...
2018-2-2 01:59 - 论文库 - 人工智能论文版
面向协调搜索的文本相似度计算方法
0 个回复 - 606 次查看
摘要:近年来
文本相似度计算在文本聚类、智能检索、网页问答、结果去重等其他许多自然语言处理领域具有举足轻重的地位,尤其是在搜索引擎中。该文简单论述了
文本相似度计算的常用方法,以及本系统如何利用
文本相似度计 ...
2018-1-2 00:39 - 论文库 - 人工智能论文版
一种基于公共词块的英文短文本相似度算法
0 个回复 - 414 次查看
摘要:短
文本相似度计算是自然语言处理方面的研究热点,传统基于词项的
文本相似度算法只考虑了词项因素,忽略了词序对短
文本相似性的影响。为此提出了一种基于公共词块的短
文本相似度计算方法,综合考虑了词项和词序因素 ...
2017-12-31 00:39 - 人工智能-AI - 人工智能论文版
基于部件的文本相似度计算
0 个回复 - 538 次查看
摘要:相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了
文本相似度的计算方法,以汉字数学表达式理论为基础,提出了一种新的文本部件粒度表示方法,根据部件频次建立文本特征向量空间模型,并在此模 ...
2017-10-26 17:20 - DL-er - 人工智能论文版
基于LDA的中文文本相似度计算
0 个回复 - 693 次查看
摘要:传统基于TF—IDF的向量空间模型的
文本相似度计算存在高维、数据稀疏、缺乏语义和维度未归一等问题,基于其上的语义扩展的TF—IDF向量空间模型中部分解决了语义问题,但是其基于词典的词语相似度计算限制了其应 ...
2017-10-26 06:00 - 人工智能-AI - 人工智能论文版
R 中文文本相似度分析求解答
0 个回复 - 2547 次查看
求教。
大神提出解决方案后小弟愿用100论坛币略表心意。 不发悬赏贴是因为上次的悬赏贴至今没有好的回答,但悬赏的论坛币不知道怎么拿回来。 顺便问下,这种情况如何拿回论坛币?
做
文本相似度分析,相关的方法 ...
2017-6-23 18:41 - 释梦涯 - R语言论坛
文本相似度算法
1 个回复 - 2681 次查看
用SAS如何做
文本相似度计算?
群里有大虾做过这块研究吗,我在论坛搜索了没找到这块的代码或案例
现在手头急着要做
文本相似度计算
余弦定理,海明距离、编辑距离等算法
2015-7-8 10:24 - wzy_630 - SAS专版
文本相似度的计算原则
0 个回复 - 3273 次查看
文本相似度计算是指充分利用计算机自动计算的能力,通过相似系数、相似距离等尺度来衡量文本之间的相似度,这里主要是指
文本相似度计算的公式、算法或者是模型。
文本相似度研究它只适合特定的领域,不同的领域考虑 ...
2016-4-6 08:41 - mcyberlove - 学术道德监督