如何理解R语言做正态性检验的分析

  介绍

如何理解R语言做正态性检验的分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

<节> <节>

R语言里做做正态性检验通常用到的函数是<代码> shaporo.test() ,这个是叫Shapiro-Wilk(夏皮罗-威尔克)正态性性检验。

对应的原假设是<强>样本X来自的总体具有正态性分布

比如代码

 <代码>祝辞,x<-rnorm (100) 
祝辞,shapiro.test (X)

, Shapiro-Wilk  normality 测试

数据:,,X
W =, 0.99187, 0.8117, p-value =,
  ,

p值大于0.05接受原假设

今天一位同学提出<代码> shaporo.test() 这个函数输出数据的范围是3 ~ 5000,超出5000年该如何做呢?我自己之前还没有注意到过样本量超5000年出的情况。

<强>第一个想到的是在大于5000的样本里再随机选一个小于5000的样本就可以了

示例代码

 <代码> x<-rnorm (6000) 
x1<样本(x, 3000年,replace =, F)
shapiro.test (x1)
  ,

但这种情况好像不太稳定,我试了一下有时候算出来的p值是小于0.05的。那我们就可以多抽几次,看p值小于0.05出现次数的多少

<强>还找到一种方法是直接可视化数据来观察

可以选密度分布图和qq图

参考链接是http://www.sthda.com/english/wiki/normality-test-in-r

示例代码

 <代码> x<-rnorm (6000) 
图书馆(ggpubr)
p1<-ggdensity (x)
p2<-ggqqplot (x)图书馆(cowplot)

plot_grid (p1, p2, ncol=2)
  图数据工具,<=" mdnice编辑器”> 如何理解R语言做正态性检验的分析“> <figcaption> image.png </figcaption> </图> <p>密度分布图是山形,qq图所有的点基本都分布在直线的周围,那就可以判定数据符合正态分布了。</p> <p> <强>另外还找到一个函数</强>,<代码> ad.test() </代码>,</p> <p>这个函数对应的R包<代码>北</代码> </p> <p>找到这个函数的链接是https://github.com/jamovi/jmv/issues/160 </p> <p>这个函数对应的是Anderson-Darling测试正常这个对应的中文名是啥暂时还不知道。</p> <p>示例代码</p> <pre> <代码>图书馆(北)<br/> ad.test (rnorm(100年,mean =, 5日,sd =, 3)) <br/> <br/>, Anderson-Darling  normality 测试<br/> <br/>数据:,,rnorm(100年,mean =, 5日,sd =, 3) <br/> A =, 0.3425, 0.485, p-value =, <br/> </代码> </pre>
  ,<p>这个函数对应的零假设应该也是样本来自正态总体</p> <p>比如试一下</p> <pre> <代码> ad.test (1:10 0) <br/> <br/> <br/> Anderson-Darling  normality 测试<br/> <br/>数据:,,1:10 0 <br/> A =, 1.0837, 0.007308, p-value =, <br/> </代码> </pre>
  ,<p>很明显1:10 0不符合正态分布</p> <p>这里得到p值小于0.05,拒绝原假设,最终的结论就是数据总体不符合正态分布。</p> </节> </节> <p class=看完上述内容,你们掌握如何理解R语言做正态性检验的分析的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!

如何理解R语言做正态性检验的分析