您现在的位置:首页 > >

2019(笔记整理)年统计基础知识与统计实务 第七章 抽样调查基础知识.doc


第七章 抽样调查基础知识

第一节 抽样调查的概念、特点及分类

一、抽样调查的概念与特点

抽样调查的概念 ? 抽样调查 ( 概率抽样 随机抽样)从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调

查结果来推断总体,以达到认识总体的一种统计调查方法。 如:平均工资、1%人口调查

? 随机原则:在抽取调查单位时,完全排除人为的主观因素影响,保证每一个调查单位都有相等的中选可能的原则。就概率意 义而言,又称为(等可能性原则)。

抽样调查的特点

? 按照随机原则抽取样本 这个原则要求总体中每个单位都有同等被抽中的机会,使样本结构近似于总体结构,具有代表性 ? 根据样本的资料推断总体的数值 这种推断存在一定的抽样误差,但误差范围是可以计算和控制的,有一定可信度 ? 费用低

? 时效性强

比如:电视节目收视率调查

? 抽样调查有时是唯一的选择 如:产品破坏实验、检验一批灯泡的平均寿命 、水质调查

二、抽样调查的种类

(一)非概率抽样用主观(非随机)方法从总体中抽选单元进行调查,它是一种快速、简便且省钱的抽选样本的方法。风险大,代表性差

? 随意抽样 假定总体是同质,总体单元都相似,那么可抽选任何单元入样。 例如:街道拦截访问法是最常见的随意抽样,弊端

就是调查员倾向有差别,所遇到的人差别较大

? 志愿者抽样

例如 :研究非典疫苗,需要人体试验,需要志愿者

?判断抽样

专家或者熟悉行业的人事,对抽样对象有所了解,采用判断抽样

? 配额抽样

例如:按男女比例抽样。

(二)概率抽样(抽样调查、随机抽样)在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总

体的推断更具有代表性 概率抽样的两条基本准则:第一,样本单位是随意抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。

1.概率抽样 按(抽样过程中总体单位数是否相同) ? 重复抽样是把已经抽出的样本单位再放回到总体中,继续参加下一次抽选,使总体单位数始终是相同的,每个总体单位有多次

重复抽中的可能。

?不重复抽样是把已经抽出来的样本单位不再放回总体,每抽一次,总体会相应减少,每个总体单位只能被抽中一次。

2、概率抽样 按(组织方式不同),分为: ?简单随机抽样-----一步抽样法,不分组,随机原则进行抽样 ?系统随机抽样又称(机械随机抽样)或(等距随即抽样)等距抽样,按照一定的距离抽取样本

例如:4000 户居民中抽 40 人,平均每 100 户抽取 1 户 ; 1-100 号中随机抽取 1 个号码在第一组中抽取了 5 号,则 5、105、205、 以+100 为单位抽取

? 分层抽样又称(类型随机抽样)或(分类随机抽样)先分组,后抽组内

比如每个组抽 5 人 ;某地区三种地形:平原、丘陵、山区的粮食产量,先分地区,然后按每个组内按简单随机抽样抽取调查地

块,构成样本 ? 整群抽样先分群,抽群

比如:全市居委会为不同群,抽不同的群,整群进行研究;了解某地区职工家庭生活状况,按居民委员会分群,一个居委会为一

群,对抽中的居民委员会所辖每户职工家庭一一调查。

?多阶抽样 分两个或更多个连续阶段抽,都是随机抽样 ?与大小成比例的抽样 例如:对农场进行某方面的调查,因为农场很多,规模大小差异,因此在调查中要使规模大的农场入样概

率要大一些,而规模较小的农场其入样概率要小一些。
第二节 抽样推断的几个基本概念

一、总体和样本 ? 总体是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。N 样本 从总体中按随机原则抽取出来的部分单位所组成的集合体就称为样本。n

二、总体指标和样本指标

? 总体指标又称总体参数是根据总体各单位标志值计算的综合指标。

常用的总体指标有:总体平均数 X 、总体成数 P、总体方差 和标准差

? 样本指标是根据样本各单位标志值计算的综合指标。

常用的样本指标有:样本平均数 x、样本成数 p、样本方差

、样本标准差

第三节 抽样误差

一、抽样误差的概念 (一)代表性误差:在抽样调查中,用部分样本推断总体时,由于样本各单位的结构不足以代表总体的状况而产生的误差。
? 系统误差:破坏了抽样的随机原则而产生的误差,带有主观性的抽样 ? 随机误差:是遵守了随机原则,但可能抽到不同的样本而产生的误差。是不可避免的 (二)抽样平均误差
? 抽样估计中所说的抽样误差一般就是指抽样平均误差,用 ? 表示
? 抽样平均误差利用数理统计方法是可能计算并控制在所允许的范围之内的 (三)影响抽样误差的因素
?样本单位数目-------在其他条件不变的情况下,抽样数目越多,抽样误差越少。当 n=N(样本=总体)时,就是全面 ? 总体标志变动程度 ?抽样方法 ? 抽样组织方式---分层抽样的抽样误差较小,而整群抽样的抽样误差较大。 二、抽样平均误差的计算
(一)样本平均数的抽样平均误差的计算(用 ? 表示)

(二)样本成数的抽样平均误差的计算 (三)总体方差未知时的解决办法

例:某企业生产一批产品共 10000 件,随机抽取 500 件作重量检验。检验结果,平均重量为 1200 克,样本标准差为 80 克,500 件中发现 10 件不合格。试求:在重复抽样情况下,该产品重量的抽样平均误差和不合格率的抽样平均误差。 解:由于不掌握总体标准差,需用样本资料代替。
三、抽样误差的允许范围 (一)抽样极限误差
(二)抽样误差范围估计的可靠程度 ?扩大极限误差的范围,可以提高抽样推断的可靠程度。这个可靠程度在统计中称为概率,它对应的数值就是概率度,用 t 表 示。概率度越大,可靠程度欲高;反之,概率度越小,可靠程度也越低。
? =t ?
(三)极限误差的计算

例如:某企业生产一批产品共 10000 件,随机抽取 500 件作重量检验。检验结果,平均重量为 1200 克,样本标准差为 80 克,500 件中发现 10 件不合格。如果概率度是 t=2
解:由于不掌握总体标准差,需用样本资料代替。

第四节 参数估计
一、点估计是直接用一个样本指标估计总体指标的推断方法。适用于对推断的准确程度与可靠程度要求不高的情况下采用。 二、区间估计是在一定的概率保证下,根据点估计值,联系一定的误差范围估计总体指标值的一种推断方法。

? ? x - ≦ X ≦ x +

x

x

? ? p - ≦ P ≦ p +

p

p

例如:某企业生产一批产品共 10000 件,随机抽取 500 件作重量检验。检验结果,平均重量为 1200 克,样本标准差为 80 克,500 件 中发现 10 件不合格。如果我们认为总体均值与样本均值一样的可能程度是 95%,那么我们的误差是多少。 P=95% 则 t=1.96

? ? =3.58 我们如果要推断极限误差 x

=t ? =t s =3.58*1.96 n

? ? 因此我们可以利用公式: x - ≦ X ≦ x +

x

x

1192.98≦ X ≦1207.02

第五节 样本单位数的确定(重复抽样的情况,不重复抽样的情况推导一样)

样本数多少合适?有一个合理的范围。
一、影响样本单位数的几个主要因素

? =t ? =t ? n

t2 ? 2
n=
?2
? 抽样推断的可靠程度 t -----要求抽样推断的可靠程度越高,概率度 t 则越大,抽样单位数也要多些;相反,则可少一些。
? 总体标志的变异程度,即:? 2 ----总体方差大,抽样平均误差 ? 自然大,需要多抽一些,方差小,可少抽一些。
? ? 极限误差的大小,即 数值的大小-----允许极限误差大,可以少抽些,小则应多抽些。 ? 抽样方法与组织方式的不同:在相同条件下,重复抽样需要多一些,不重复抽样可少抽一些。 ? 人力、物力、财力的可能条件

二、必要抽样单位数目的计算 (一)推断总体平均数时,必要抽样单位数目的计算

t2 ? 2
n=
?2

(二)推断总体成数时,必要抽样单位数目的计算

例: 某企业生产一批产品共 10000 件,随机抽取

件作重量检验。检验结果,平均重量误差范围不能超过 10 克,样本标准差

为 80 克,如果我们认为总体均值与样本均值一样的可能程度是 95%,那么我们的抽取多少产品合适?

? ? 2 =802 t=1.96

=10 克

t 2 ? 2 1.96 2 80 2

n=

=

=245.8=246

? 2 10 2

注意:抽样单位数必须是整数,不能四舍五入,只要除不尽,就进一位

单选题

1. 将居民小区共 4000 户居民按 1——4000 编号,在 1——100 号中随机抽取 1 个号码为 3,则 3、103、203……3903 构成抽样调查样本,

这种获取样本的方法为( B )。

A. 简单随机抽样

B. 系统随机抽样

C. 分层随机抽样

D. 整群抽样

2. 某商品的 100 件样品中,测得的优质品为 98 件,则样本优质成数为( B )

A 100%

B 98%

C 2%

D 无法计算

多选题 1. 影响抽样误差的因素有( ABDE A. 样本单位数 C. 投入的经费大小 E. 抽样组织方式

)。 B. 总体标志变异程度
D. 抽样方法

07 年考题

2. 下列属于抽样调查特点的有(ABCDE )。 A.按照随机原则抽取样本 C.费用低 E.存在抽样误差

B.根据样本的资料推断总体 D.时效性强

3. 统计分析的特点有(ADE) A 数据性 B 完整性 C 精确性 D 目的性 E 时效性 4. 统计分析报告写作的原则(ABCDE) A 主题要突出 B 结构要严谨 C 观点和材料要统一 D 语言要力求准确、简洁、通俗易懂 E 写作态度要严肃认真

判断题

1. 随机原则又称为等可能性原则。(正确

) 07 年考题

2. 统计分析是建立在丰富资料基础上的,它是要用数字来“说话”的( 正确)



友情链接: 团党工作范文 工作范文 表格模版 社科文档网 营销文档资料 工程文档大全