首页
高中数学
高中物理
微积分
线性代数
概率论
人工智能
赞助本站
在线教程
高中数学
统计与概率
敏感问题的统计
日期:
2024-04-15 08:15
查看:
1
次
编辑
导出
敏感问题的统计
利用概率与统计,可以统计一些较为敏感或者隐私的问题,例如感染艾滋HIV,观看色情影片、吸毒的比率等,那如何设计问卷呢?本文进行简单探讨。 ## 敏感问题的问卷设计 学生阅读黄色书刊或观看色情影片会影响其身心健康发展. 但这些都是避着教师与家长进行的, 属个人隐私行为. 现在要设计一个调查方案, 从调查数据中估计出学生中看过黄色书刊或影像的比率 $p$. 像这类敏感性问题的调查是社会调查的一类, 如一群人中参加赌博的比率、吸毒人的比率、经营者中偷税漏税户的比率、学生中考试作弊的比率等等. 对敏感性问题的调查方案, 关键要使被调查者愿意作出真实回答又能保守个人秘密.一旦调查方案设计有误, 被调查者就会拒绝配合, 所得调查数据将失去真实性. 经过多年研究和实践, 一些心理学家和统计学家设计了一种调查方案, 在这个方案中被调查者只需回答以下两个问题中的一个问题, 而且只需回答 “是” 或 “否”. 问题 ${A}$ : 你的生日是否在 7 月 1 日之前? 问题 ${B}$: 你是否看过黄色书刊或影像? 这个调查方案看似简单, 但为了消除被调查者的顾虑, 使被调查者确信他 (她) 参加这次调查不会泄露个人秘密,在操作上有以下关键点: (1) 被调查者在没有旁人的情况下,独自一人在一个房间内操作和回答问题. (2) 被调查者从一个罐子中随机抽一只球, 看过颜色后即放回. 若抽到白球, 则回答问题 $A$; 若抽到红球, 则回答问题 $B$. 且罐中只有白球和红球. 被调查者无论回答问题 $\mathrm{A}$ 或问题 $\mathrm{B}$, 只需在答卷 (见图 ) 上认可的方框内打钩, 然后把答卷放人一只密封的投票箱内. ![图片](/uploads/2023-12/image_20231224317f579.png) 如此的调查方法, 主要在于旁人无法知道被调查者回答的是问题 A 还是问题 $\mathrm{B}$, 由此可以极大地消除被调查者的顾虑. 现在的问题是如何分析调查的结果.很显然,我们对问题 $A$ 是不感兴趣的. 首先我们设有 $n$ 张答卷 ( $n$ 较大,譬如 1000 以上), 其中有 $k$ 张回答 “是”. 而我们又无法知道此 $n$ 张答卷中有多少张是回答问题 $\mathrm{A}$ 的, 同样无法知道 $k$ 张回答 “是” 的答卷中有多少张是回答问题 $\mathrm{B}$ 的. 但有两个信息我们是预先知道的, 即 (1) 在参加人数较多的场合, 任选一人其生日在 7 月 1 日之前的概率为 0.5 . (2) 罐中红球的比率 $\pi$ 已知. 现在就要利用这 4 个数据 $(n, k, 0.5, \pi)$ 求出 $p$. 因为由全概率公式得 $$ P(\text { 是 })=P(\text { 白球 }) P(\text { 是 | 白球 })+P(\text { 红球 }) P \text { (是 | 红球 }) . $$ 所以, 将 $P($ 红球 $)=\pi, P($ 白球 $)=1-\pi, P($ 是 $\mid$ 白球 $)=0.5, P$ (是 $\mid$ 红球 $)=p$ 代人上式右边, 而上式左边用频率 $k / n$ 代替, 得 $$ \frac{k}{n}=0.5(1-\pi)+p \cdot \pi . $$ 由此得 $$ p=\frac{k / n-0.5(1-\pi)}{\pi} . $$ 因为我们用频率 $k / n$ 代替了概率 $P$ (是), 所以从上式得到的是 $p$ 的估计. 例如, 在一次实际调查中, 罐中放有红球 30 个、白球 20 个, 则 $\pi=0.6$, 调查结束后共收到 1583 张有效答卷, 其中有 389 张回答 “是”, 由此可计算得 $$ p=\frac{389 / 1583-0.5 \times 0.4}{0.6}=0.0762 . $$ 这表明: 约有 $7.62 \%$ 的学生看过黄色书刊或影像.
上一篇:
回归分析的误差
下一篇:
复习4:组合数学
本文对您是否有用?
有用
(
0
)
无用
(
0
)
赞助我们
0
篇笔记
写笔记
更多笔记
提交笔记