结果:找到“STATA 正则表达式”相关内容13个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
stata正则表达式 回溯引用 \n $n
0 个回复 - 366 次查看
引用先前捕获的文本,并在
正则表达式中重复使用它\n \1、\2表示匹配第1、2个子表达式匹配到的内容$n 替换函数中使用 删除重复值dis ustrregexra("This is is is is isis a a a a cat", "(\b\w+\b )\1+", "$1")dis us ...
2024-1-19 23:34 - Lee_iris - Stata专版
ustrregexs(n) stata正则表达式 n的设定
0 个回复 - 506 次查看
clear
set obs 3
gen v = "湖北省武汉市珞喻路1037号,430074"
replace v = "北京市海淀区,100080,学院路" if _n==2
replace v = "475001,河南省开封市顺河区" if _n==3
gen zip1 = ustrregexs(0) if ustrrege ...
2024-1-19 20:29 - Lee_iris - Stata专版
stata 正则表达式 提取汉字
1 个回复 - 1100 次查看
例1 :从爬取的源代码数据中提取信息:从网站爬取的数据含有一些源代码如"董事"中提取"董事",首先要对目标进行描述(在这个例子里以下方式均可,但其他例子中不一定,需要根据具体情况自己判断总结):
(1)目标字 ...
2024-1-19 14:15 - Lee_iris - Stata专版
stata正则表达式提取中文字符
3 个回复 - 3480 次查看
部分数据如上所述,想把变量“回复内容”中包含某个词的记录保存。例如将含有“风险”或者“信息披露”或者“不确定性”保留。目前只会使用命令为
tempvar match
gen `match' = ustrregexm(回复内容,"风险")
...
2021-10-18 13:59 - sunhanhan1996 - Stata专版
Stata正则表达式提取省市名称
4 个回复 - 9585 次查看
看了一个帖子,要从地址中提取省份及市,前期帖子已经有了解决方案,但对于4个直辖市的处理,有位坛友@qianlxu出疑问,说原帖提供的方案导致city里的直辖市为空,那么如何让这四个直辖市既是省份又是市,这里再给一种 ...
2021-8-17 18:25 - zdlspace - Stata专版