在线学习
重点科目
初中数学
高中数学
高等数学
线性代数
概率统计
高中物理
数学公式
主要科目
复变函数
离散数学
数学分析
实变函数
群论
数论
未整理科目
近世代数
数值分析
常微分方程
偏微分方程
大学物理
射影几何
微分几何
泛函分析
拓扑学
数学物理
趣味数学
科数网
题库
教材
高考区
考研区
VIP
科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
你好
游客,
登录
注册
在线学习
高中数学
第十二章:排列组合与概率统计
抽样
最后
更新:
2025-02-12 16:54
查看:
46
次
反馈
刷题
抽样
统计调查,获取有效数据极为关键.普查和抽样调查是获取数据的重要手段.在许多实际问题中,当总体容量很大或检测过程具有一定的破坏性时,很难直接研究总体,这时可以通过从总体中抽取一个样本进行研究,然后根据样本的情况去估计总体的相应情况。 在日常生活中,人们总是自觉或不自觉地应用抽样方法.例如,在市场上买花生或瓜子时总要先抓几颗看看是否饱满,干燥;在厨房煮汤时,为考察汤的味道,没必要把汤全喝完,而只要把汤搅拌均匀,从中品尝一勺就够了. 生活中的实例为我们进行抽样调查活动并收集数据提供了一些启发.例如: 第一,"把汤搅拌均匀"是说明抽样的随机性,没有抽样的随机性,样本就不能很好地反映总体的情况. 第二,"品尝一勺"指出了选取的样本量不能太少,也不必太大.太少了不足以品出味道,品尝一大碗也没有必要. 第三,"无论这锅汤有多少,只要一勺就够了"。这里体现出抽样调查的如下基本性质:总体个数增大时,样本量不必按比例增大. 科学的抽样方法必须使样本具有代表性,也就是抽取的样本能客观反映总体的情况,没有人为的主观偏向.如何科学地进行抽样呢? ## 简单随机抽样 如果在抽样过程中,能使总体中的每个个体都有相同的可能性被选人样本,那么这样的抽样叫作随机抽样.随机抽样可以避免人为的主观偏向,使样本具有代表性. 人们经常用"任取""随机抽取"或"等可能抽取"等来表示随机抽样。 随机抽样分为无放回的随机抽样和有放回的随机抽样。例如,口袋中有质地相同的 10 个小球,分 3 种颜色。从中无放回地随机抽取 1 个,共抽取 $n$ 个 $(n \leqslant 10)$ ,这种抽样方法称为无放回的随机抽样。从袋中每次随机抽取一球记录颜色后放回,共抽取 $n$ 次,这样的抽样方法称为有放回的随机抽样。 在无放回的随机抽样下,同一个小球不会被抽中两次。而在有放回的随机抽样下,同一个小球可能被抽中多次.当样本量 $n=10$ ,采用无放回的随机抽样就可以完全了解袋中小球的颜色分布情况,采用有放回的随机抽样并不能对袋中小球的颜色分布作出准确判断。 一般地,设一个总体含有 $N$ 个个体,从中无放回地抽取 $n(n \leqslant N)$ 个个体为样本,如果总体内的每个个体都有相同的可能性被抽到,则把这样的抽样方法称为简单随机抽样。 我们把简单随机抽样得到的样本称为简单随机样本.常用的简单随机抽样方法有抽签法和随机数法. ### 1.抽签法 下面通过一个实例来说明: 高一(1)班计划从 50 名同学中抽取 5 名同学参加某项课外活动。为保证每名同学被抽取的机会均等,我们可以把 50 名同学的学号写在小纸片上,然后将纸片揉成团放人一个不透明袋子中,充分摇匀后,从中无放回地抽出 5 个纸团并记下上面的学号.这 5 个学号对应的同学就构成了一个简单随机样本. 我们可将抽签法的步骤简单总结如下: (1)假设一个总体有 $N$ 个个体,将它们逐一编号; (2)制作 $N$ 个号签(号签可以用小球,纸片等制作),将编号写在号签上; (3)将号签放在一个容器中,并充分搅拌均匀; (4)从容器中任意抽取 $n$ 个号签,记录其编号,就得到一个容量为 $n$ 的样本. ### 2.随机数法 下面通过一个实例来说明随机数法。 某中学为了解高一年级 500 名同学的视力情况,准备抽取 $10 \%$ 的同学作为样本.实现简单随机抽样的方法是先将 500 名同学从 1 到 500 进行编号,然后将 500张编有 1 到 500 号的小纸片放入一个大纸箱中充分摇匀,最后从纸箱中无放回地抽取 50 张纸片.纸片上的号码就是被选中的同学的号码.纸片上的这 50 个数被称为随机数.显然,此例中随着总体个数的增大,制签的过程将变得烦琐.事实上,我们完全可以借助计算机产生随机数来解决这个问题。 下表是用计算机在 $1 \sim 500$ 中随机产生的 50 个随机数:  接下来,我们按照上面随机数表中的号码选出对应编号的 50 名同学,测量他们的视力后,得到一个容量为 50 的简单随机样本. 简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础.抽签法的突出特点是简单,直观,在总体个数不大时,使总体处于"搅拌均匀"的状态容易实现,这时,每个个体有均等的机会被抽中,从而能够保证样本的代表性.但当总体中个体很多时,对个体编号的工作量很大,并且由于搅拌不均匀可能导致抽样的不公平.采用随机数的方法可以克服这一问题. ## 分层抽样 生活经验告诉我们,要了解一盘菜炒得好不好吃,一般只要随机品尝几口就可以下结论了,没有必要等到把菜吃完再作出结论。但如果品尝的是西红柿炒鸡蛋,你进行随机品尝就不能只品尝西红柿或只品尝鸡蛋,这对你作出正确的判断是不利的。你应当随机品尝一下西红柿,再随机品尝一下鸡蛋,然后进行综合评价.这种品尝方法就是分层抽样方法。 当总体由差异明显的几个部分组成时,为了使抽取的样本更好地反映总体的情况,把总体中各个个体按照某种特征或某种规则划分为互不交叉的层,然后对各层按其在总体中所占比例独立进行简单随机抽样,这种抽样方法称为分层抽样。 例1 某网络音乐平台就网络用户对某一特色栏目的喜爱程度进行调查,参与网络投票的总人数为 50000 .网络用户对栏目的评价如下表所示:  该音乐平台为进一步了解用户的具体想法和意见,打算从上述 50000 人中抽取 100 人进行电子邮件形式的调查,应怎样进行抽样? 分析 因为总体人数较多,不宜采用简单随机抽样.又由于观众对栏目喜爱程度差异较大,故应采用分层抽样. 解 采用分层抽样,其总体容量为 50000 . "五星评价"占 $\frac{9986}{50000}$ ,应抽取 $100 \times \frac{9986}{50000} \approx 20$(人); "四星评价"占 $\frac{15607}{50000}$ ,应抽取 $100 \times \frac{15607}{50000} \approx 31$(人); "三星评价"占 $\frac{14885}{50000}$ ,应抽取 $100 \times \frac{14885}{50000} \approx 30$(人); "二星评价"占 $\frac{6034}{50000}$ ,应抽取 $100 \times \frac{6034}{50000} \approx 12$(人); "一星评价"占 $\frac{3488}{50000}$ ,应抽取 $100 \times \frac{3488}{50000} \approx 7$(人). 即按照"五星评价"至"一星评价"分别抽取 20 人, 31 人, 30 人, 12 人, 7 人. 从上面的抽样过程可以看出,分层抽样保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构保持一致性,这对提高样本的代表性是非常重要的.在后面学习用样本估计总体时,我们将会了解到分层抽样既可以对总体特征进行估计,也可以对各层的特征进行估计。这些优点使分层抽样在实践中得到了广泛的应用。 前面介绍了简单随机抽样和分层抽样.对一个实际问题而言,究竟用何种抽样为好应视具体情况而定.我们简单归纳如下:  `例` 下列问题中,采用哪种抽样方法较为合理? (1)某微波炉厂质量检查组为了解某批次 1000 台微波炉的使用寿命. (2)每年 6 月 6 日是"全国爱眼日"。某县卫生部门要调查该县中小学生视力保护情况,已知该县有小学生 12000 名,初中生 10000 名,高中生 6000 名. (3)某校要调查该校九年级 400 名学生的身高和体重情况,以供该校营养师参考进而指导食堂伙食营养搭配。 解(1)由于总体容量较大,可采用随机数法进行抽样. (2)由于总体容量大,并且具有明显的层次性,因而应当先采用分层抽样,然后再在每层采用随机数法进行抽样。 (3)由于总体容量较大,男女学生在身高和体重方面又有较大的差异,所以应当先采用分层抽样,然后对男生和女生分别用抽签法进行抽样。 科学的抽样方法可以提高用样本估计总体的精度,关于历史上采取不正确的抽样方法而导致调查结论严重失真的教训,可参阅本小节的"数学文化"。但影响精度的不仅有抽样方法,还有样本容量.一般地,样本容量较大时,可以获得较精确的估计。
其他版本
【概率论与数理统计】检验的基本原理
【概率论与数理统计】样本
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
统计学常见术语
下一篇:
统计图表
本文对您是否有用?
有用
(
0
)
无用
(
0
)
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。