结果:找到“清洗 数据”相关内容365个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
CHARLES数据清洗问题
3 个回复 - 736 次查看
最近在
清洗CHARLES
数据,将2011、2013、2015、2018四期合成面板
数据后,发现不随着时间变化的一些变量,例如民族、出生年月、性别等,大部分样本只在2011年汇报,在往后的调查中是缺失值,请问在Stata中如何解决这一 ...
2022-10-10 09:42 - qdc440224 - Stata专版
还原论文,CHFS中国家庭金融调查数据库数据清洗与回归
9 个回复 - 3617 次查看
**有意请私聊
一、变量说明(1)解释变量:
1.家庭人口结构变量:hhsize、old、kid、labor
2.其他解释变量:
①家庭财富状况:
家庭总资产对数(ln_asset),家庭总负债对数(ln_debt),家庭年收入对数(l ...
2022-1-18 16:51 - 天璃雪 - Stata专版
数据分析师:数据清洗经验
0 个回复 - 780 次查看
平时习惯了在某些特定的
数据集合上做实验,简单的tokenization、预处理等步骤就足够了。但是在
数据越来越大的年代,
数据清洗越来越重要,也越来越复杂。看到Philip J.Guo 的这篇英文文章《Parsing Raw Data》觉得不错 ...
2022-7-26 13:53 - AIU人工智能学院 - 数据分析师(CDA)专版
数据清洗的stata命令怎么写
2 个回复 - 2337 次查看
要把三表中有一些明显不符合勾稽关系的样本要把它删掉:比如,资产不等于负债加权益的,资产小于0的等等这种stata的命令怎么写?这样写对吗?drop if asset!=liability+owners' equitydrop if asset
2022-4-28 15:22 - 十块钱555 - Stata专版
数据清理利器:SQL数据清洗!
0 个回复 - 811 次查看
俗话说的好,工欲善其事,必先利其器。很多从事
数据统计分析工作的朋友应该会深有感触,苦于自己80%的时间在做
数据清洗,而仅仅只有20%的时间在优化模型、分析统计结果等,今天我们就来介绍下SQL
数据清洗。
因此, ...
2022-5-31 09:58 - AIU人工智能学院 - 数据分析师(CDA)专版
Python数据清洗公开课
0 个回复 - 536 次查看
Python是公认的目前
数据科学和机学习领域最受欢迎的编程软件之一。而支持Python能够火热的主要原因就是它强大易用的标准库,它们可以帮助你完美地解决几乎所有
数据科学领域的问题。
提到使用Python进行
数据分析, ...
2022-3-30 11:20 - AIU人工智能学院 - 数据分析师(CDA)专版
R数据分析:数据清洗的思路和核心函数介绍续
1 个回复 - 4257 次查看
就是"Mitylira Hopital"和"Mitylira Hospital",和"Military Hopital"其实都可以看成是录入的时候录错了,其实他们都是"Military Hospital",这个时候我们要做的就是重新编码变量,可以用mutate和recode实现我们的需 ...
2022-2-19 16:23 - codewar - R语言论坛
R数据分析:数据清洗的思路和核心函数介绍
0 个回复 - 4362 次查看
好多同学把统计和
数据清洗搞混,直接把原始
数据发给我,做个统计吧,这个时候其实很大的工作量是在
数据清洗和处理上,如果
数据很杂乱,
清洗起来是很费工夫的,反而
清洗好的
数据做统计分析常常就是一行代码的事情。Da ...
2022-2-19 16:21 - codewar - R语言论坛
数据清洗时异常值怎样识别和处理?
0 个回复 - 1724 次查看
在
数据分析工作中,面对收集而来的
数据,
数据清洗是首要环节。而异常值处理是其中的一个重要部分。下面介绍一下如何处理
数据中的异常值。
一、异常值判断
何为异常值?
异常值,指的是样本中的一些数值明显偏离其余 ...
2021-9-3 15:04 - spssau - SPSS论坛
数据清洗我们到底要“洗”掉什么?
0 个回复 - 912 次查看
数据清洗对
数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供
数据一致性,是企业在做
数据分析时必不可少的步骤。那么,
数据清洗[/backcolor]我们需要“洗”的
数据有哪些呢? 1、错误
数据 ...
2021-6-2 14:14 - Smartbi - 数据分析与数据挖掘
事件研究法数据清洗
1 个回复 - 1212 次查看
小白 找了很多地方都没找到怎么
清洗数据
有很多
数据 每个公司事件期不止一个 请问有知道怎么找事件估计窗口内收益率的吗 有没有什么简便方法 还是真的一个一个去搜 谢谢!
2021-4-19 12:02 - hejiajiayin - Stata专版
浅谈量化中的数据清洗:处理缺失值
0 个回复 - 1579 次查看
上一篇文章中,我们讨论了关于异常值的
清洗和假设。本文中,我们再聊聊
数据缺失值的
清洗和假设。量化研究模型往往是建基于大量
数据,然而,在
数据挖掘过程中,经常会遇到挖掘出来的特征
数据存在各种异常情况,比如数 ...
2021-3-12 08:34 - jaspercapital - 量化投资
浅谈量化数据中的数据清洗:处理异常值
0 个回复 - 1554 次查看
在量化研究中,免不了对大量
数据进行研究,而在研究之前,必不可少一道工序——
数据清洗。市场上的大多研究报告中,都会介绍如何
清洗所用
数据,但少有报告直接分析
清洗步骤带来的信息改变,以及做出的研究假设。笔者 ...
2021-3-9 09:45 - jaspercapital - 量化投资
数据清洗之“拆分” — 快速实现一列拆分为多列
0 个回复 - 1887 次查看
上期我们介绍了如何通过JMP的“堆叠”功能快速将多列指标合并为一列指标。相反地,在其他一些时候,你可能需要将一列或多列指标根据某个指标拆分为多列指标。比如在人口普查结果中想看看男性和女性在不同年龄段的分布 ...
2020-12-8 15:18 - JMPer - JMP论坛
新手求助数据清洗问题
8 个回复 - 1405 次查看
以下是有关夫妻的
数据,id1是某一被调查者的id号,id2是其配偶的id号。现在是想把id号同时出现在id1和id2中的
数据保留下来,请问命令该怎么用。
clear
input id1 id2 male
110006101 110006102 1
110006102 1100 ...
2020-12-3 12:16 - 小鱼的七秒梦想 - Stata专版
数据清洗之“堆叠”—多列数据的合并处理
0 个回复 - 3193 次查看
在
数据分析过程中,有时候我们经常需要将多列指标合并为一列,比如将一个100人5个观察时间点生成的100行5列
数据表,转换成500行1列的
数据表,从而满足作图、分析的进一步需求。那么,在JMP中如何快速实现呢?今天这篇 ...
2020-11-16 14:57 - JMPer - JMP论坛
数据清洗数据清洗数据清洗,重要事情说三遍
0 个回复 - 1471 次查看
当你的回归结果与实际或常识严重背离时,请复核你的
数据集吧,往往是
数据错误导致的。严格上讲,在回归之前,从多个维度,进行
数据清洗,是非常必要的,正所谓“rubbish in ,rubbish out",
数据错误,结果如何正确呢? ...
2020-11-12 16:55 - yinpeiwei - Stata专版