什么是零假设?

如题所述

比如你有两组学生的考试成绩,现在考察这两个组的学生的成绩的平均值是否一样。当然观测到的样本几乎不可能会两个均值正好一样,所以我们用分布这个概念来做这个事情。 

首先,假设每个组内部的人的成绩满足同一个正态分布 

然后,所谓零假设,一般是指这两个组的正态分布的参数一样。 

继续,在以上两个假设下,这两个组的平均成绩的差值,也满足一个正态分布(当然参数不一样,这个正态分布的均值参数是0,但是方差参数跟样本数量有关,样本越大方差越小) 

于是从一次观测,也就是一次考试中,得到这个随机变量“平均成绩的差值”的一次观测值,比如每个组三个人,第一组考了100+100+100,第二组考了50+50+50,那这个“平均成绩的差值”的这次样本实现值就是100-50=50。

然后,无论你事先是否假设了每个人成绩分布的方差已知还是未知,都可以精确计算“平均成绩的差值”的分布,然后看50在这个分布里是否在很远的地方,如果在,那就说明所谓零假设不太可能成立,那就是说两个组的平均成绩有差异。如果不在很远的地方,那就不能说明两个组的平均成绩有差异。换句话说,就是这两个组的平均成绩的差异有统计意义。 

三组数据的组间均值有统计学意义就是说“零假设:三组均值相同”这个假设不成立,换句话说可能1=2!=3,或者干脆三个都不一样,但是不会仔细说哪两个不同。1组和3组数据的比较差异有统计学意义就是明白了告诉你至少1跟3不一样,或者“零假设:1跟3均值相同”这个假设不成立。统计方法上这两个假设的检验方法会有不同。

温馨提示:答案为网友推荐,仅供参考