27个常用占据命令(2)

  

常用的27个占据命令

  

【1】直接导入csv格式数据

  

insheet使用的名字。csv,

  

【2】修改变量长度

  

格式var %

20.2克   

【3】删除重复值

  

排序var1 var2   

duplicatesdrop var1 var2,迫使

  

【4】数据合并

  

使用data1、清晰

  

合并m: m var1var2使用data2

  

下降如果_merge==2

  

下降如果_merge==1

  

_merge下降   

【5】生成一期滞后项

  

tsset stkcd accper   

创newvarname=L.varname

  

【6】将文字转化为数字变量

  

genBigN=0   

replaceBigN=1如果strmatch (dadtunit,“普华永道*“)

  

【7】删除有缺失值的记录

  

egen mis=rowmiss (_all)

  

下降如果管理信息系统   

下降管理信息系统   

【8】行业划分

  

clonevarsic2=印第安纳州   

订单stkcd accper sic2

  

取代sic2=substr (sic2, 1, 1)如果substr (sic2 1 1) !=" C "

  

取代sic2=substr (sic2, 1, 2)如果substr (sic2 1 1)==" C "

  

汇总sic2 accper   

【9】日期只保留年份

  

下降如果substr (reptdt 6 2) !=?2“

  

取代reptdt=substr (reptdt 1 4)

  

创accper=实际(reptdt)

  

【10】数据分列

  

分裂日期、解析(-)destring忽略不计(“产生绯闻)

  

【11】求两个日期之间的间隔天数

  

g td=日期(trading_date,“YMD")

  

g ed=日期(eventdate,“YMD")

  

形式td ed % td

  g d=ed-td

  

【12】生成行业,年份哑变量

  

标签,gen ()

  

标签行业,创(行业)

  

【13】对数据进行Winsorize处理

  

发现winsor2   

winsor2 varname,取代(1 99)

  

【14】描述性统计

  

tabstat var1var2, stat (n分钟意味着平均p25我max sd),如果groupvar==0或1

  

注销,保存(名字)词替换:tabstat var, stat (n分钟意味着p50 max sd)坳(stat) f (% 9.2 g)

  

【15】两变量列联表

  

汇总var1 var2,行chi2陶布γ

  

【16】两样本间的均值T检验

  

tt var, (groupvar)

  

【17】两样本中位数Z检验

  

ranksum var, (groupvar)

  

【18】培生/枪兵系数

  

spearmanx
n马塔
x=st_data (,“x
“)
c (x)=相关性
n=行(c)
b=strofreal (lowertriangle (c) + uppertriangle (st_matrix (“r(ρ)“)),“% 9.3 f")
p=st_matrix (“r (p)“)
(i=2;i<=n;我+ +){
(j=1;j<张=;j + +) {
p (i, j)=2 * ttail(行(x) 2、abs (c (i, j)/?(1 - c (i, j) ^ 2)/(第2行(x)))))
b (i, j)=b (i, j) + (p (i, j) & lt; 0.01 ?“ <强>“:(p (i, j) & lt; 0.05 ?““:(p (i, j) & lt; 0.1 ?““:““)))
b [j,我]=[j,我]+ (p [j,我]& lt; 0.01 ?“ <强>“:(p [j,我]& lt; 0.05 ?““:(p [j,我]& lt; 0.1 ?““:““)))
}
}
c=editvalue (b,“2.000”,“1“) c


结束   

直接导出结果

  

注销,保存(pw)字代替:pwcorr_avars, star1 star5 (0.01) (0.05) star10 (0.1)

  

【19】按年度按中位数分组

  

方法一   

bysort: egen g=xtile (var), n (2)

  

方法二   

由accper: cumul icindex g (g)情商

  

途径accper,当地(id)

  

显示“r(水平)的“

  

本地cut1=1/2

  

foreach当地id {x

  

重新编码g(分钟/<代码> cut1 '=0)( cut1 '/max=1)如果accper==' x '

  

}   

分三组   

由accper: cumul icindex g (g)情商

  

途径accper,当地(id)

  

显示“r(水平)的“

  

本地cut1=1/3

  

本地cut2=2/3

  

foreach当地id {x

  

重新编码g(分钟/<代码> cut1 '=1)( cut1 '/<代码> cut2 '=2)( cut2 '/max=3)如果accper==' x '

  

}   

【20】输出回归结果

  

安装   

ssc安装estout,替换

  

单个回归

  

注册   

esttab使用的名字。rtf、压缩nogap r2 ar2明星(0.1 <强> 0.05 0.01)

  

多个回归一起

  

注册   

是存储m1   

注册   

是存储m2

  

esttab m1 m2使用的名字。rtf、压缩nogap r2 ar2明星(0.1 <强> 0.05 0.01)

  

连续运行托比特书模型结果导出:

  

esttab m1平方米,b (% 9.4 f) t标量(N会Fchi2类型),使用的名字。rtf、压缩nogap

27个常用占据命令(2)