当前位置:网站首页 > 深度学习 > 正文

STATA学习笔记:缺漏值的处理

STATA学习笔记:缺漏值的处理

1. 缺漏值的标记

stata中缺漏值默认标记为"."
".“是数值,且是一个大于任何自然数的数值
【注意】
sum、generate等命令,会自动忽略缺漏值
count、keep等命令,会将缺漏值”."视为无穷大的一个数值

2.将其他缺漏值的标记转化为"."

mvdecode命令

常见缺漏值的标记
N.A.
N/A
-99
-97
-9999

import delimited using "D3_miss01.txt" //使用import delimited命令导入txt格式数据 

在这里插入图片描述
变量x1 x2中含有数值型缺失值
变量x3中含有字符串型缺失值

(1) 数值型数值型缺失值转化为"."

mvdecode x1 x2, mv(-97 -999) 

(2)字符串型缺失值转化为"."

replace x3 = "." if x3 == "N/A" destring x3, replace 

3. 使用不包含缺失值的样本

sysuse nlsw88.dta, clear sum wage industry tenure grade 

在这里插入图片描述
sum 命令的结果显示wage industry tenure grade 变量的观测值个数不同,即每个变量包含了不同个数的缺失值

reg wage industry tenure grade 

在这里插入图片描述
reg 命令结果显示参与回归的观测值只有2215个,回归使用的样本中不包含缺失值
问题是如何筛选出不包含缺失值的样本?

命令 ==ereturn ==
ereturn: Post the estimation results
ereturn list : List e() stored results

ereturn list 

函数e(sample)
e(sample)
Description: 1 if the observation is in the estimation subsample and 0 otherwise

sum wage industry tenure grade if e(sample)==1 //e(sample)有两个值:0和1 //1表示对应行观测值参与回归 

在这里插入图片描述
添加if e(sample)==1条件之后,sum命令统计的观测值个数和参与回归的观测值个数一致,即剔除了wage等四个变量中的缺失值

gen yes = e(sample) sort yes browse yes wage industry tenure grade 

在这里插入图片描述

4.删除缺失值

keep if yes==1 
到此这篇STATA学习笔记:缺漏值的处理的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 深度学习的进展_深度学习的进展2024-11-24 15:54:10
  • 【深度学习时间序列预测案例】零基础入门经典深度学习时间序列预测项目实战(附代码+数据集+原理介绍)2024-11-24 15:54:10
  • 人工智能——深度学习2024-11-24 15:54:10
  • 基于Pytorch深度学习的脑肿瘤分类识别2024-11-24 15:54:10
  • 深度学习之BP算法2024-11-24 15:54:10
  • 海思3559AV100 MPP学习2--MPP平台初识2024-11-24 15:54:10
  • “黑客”入门学习之“单机游戏外挂原理与实现”_cheatengine什么原理2024-11-24 15:54:10
  • Linux学习笔记1---Windows上运行Linux2024-11-24 15:54:10
  • canvas学习笔记2024-11-24 15:54:10
  • webpack5学习与实战-(十二)-webpack模块与解析原理2024-11-24 15:54:10
  • 全屏图片