样本含量的计算公式

注意,是三样本均值或三样本中位数的比较,如何计算样本含量

样本含量的计算公式各不相同,现分别介绍如下:

一、现况研究

现况研究包括普查和抽样调查两类,普查是根据研究目的,于一定时间内对一定范围的人群中每一个成员所作的调查,它是对总体的研究,不涉及样本大小的问题。而抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征,因此抽样调查的设计中要考虑样本含量问题,以下我们分别介绍对均数和对率作抽样调查时样本含量的计算。

一般来说,在确定样本含量时,先需要有这样几个参数:①所容许的误差(d),如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。在率的调查中,确定样本的率(p)和总体率(P)的最大容许误差为多少。容许误差越小,需要样本量越大。②确定控制容许误差的概率α,概据需要一般为0.05或0.01,α越小,所需样本量越大。③总体标准差(s),如果不了解,则需要根据以往的资料或小规模预调查的结果进行估计。

(一)、调查均数时所需样本量, 可按下列公式计算:

n'=(Uas/d) (式16-1)

n= n'/(1+n'/N) (式16-2)

其中Ua为a值确定后的U值,可查表(16-1)获得,当a=0.05时, Ua=1.96,a=0.01时,Ua=2.58。如果为无限总体抽样,可直接用式(16-1)求出样本量。而我们在流行病学调查中,多为有限总体,即已经知道总体的数量N,这时将n'代入式(16-2)便可求出样本量n。如果n'/N很小,如小于0.05,可以省略式(16-2),直接用公式(16-1)求出n。

例16.1:某厂有职工6500人,用简单随机抽样调查该厂职工白细胞水平,希望绝对误差不超过100个/mm 。根据该厂以往的资料,职工白细胞总数的标准差为950个/ mm ,若取a=0.05(双侧),问应调查多少人?

N=6500 d=100个/mm s=950个/mm
a=0.05 Ua=1.96

n'=(1.96×950/100) ≈347

n=347/(1+347/6500)≈330(人)

(二)、调查率时所需样本含量,用下式计算:

n'=Ua PQ/d (式16-3)

n=n'/(1+n'/N) (式16-4)

其中P为总体的率,Q=1—P,如果P有若干个估计值可供参考时,应取接近0.5者,如果对总体的率一无所知,也可设P=0.5。

如果采用相对容许误差r=d/P 的形式,即d=rP,例如,规定容许误差不大于0.1 P,即d=0.1P。则可计算

n'=(Ua PQ)/(r P )=(Ua Q)/(r P) (式16-5)

我们也可以用一个易记的公式粗略估计样本量,设α=0.05 ,Ua≈2,r=0.1时,则

n=(4Q)/(0.1 P)=400Q/P (式16-6)

当然应用这个公式估计样本量时要记住前提为a=0.05,r=0.1,如果要求的显著性水平提高或降低,容许误差提高和降低,结果将随之而变。

例16.2:某地区现调查HBsAg阳性率,过去调查的结果为10%,本次调查容许误差不超过0.1P,a=0.05(双侧),估计应调查人数。

P=0.1 r=0.1(或 d=0.01) a= 0.05 Ua=1.96

根据公式(16-3)n'=1.96 ×0.1×0.9/0.01 =3457(人)

根据公式(16-6)n'=400×0.9/0.1=3600(人)

以上所述为简单随机抽样的计算方法。至于其它抽样方法样本含量的估计可参阅有关书籍的专用公式。

参考资料:http://202.114.128.246/shenbao/lxb/wangluokecheng/linchuang/16.htm

温馨提示:答案为网友推荐,仅供参考