2018年湘潭大学数学与计算科学学院814统计学(二)考研强化五套模拟题
● 摘要
一、简答题
1. 简述搜集数据的基本方法及其弱点。
【答案】搜集数据的基本方法:
(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。
(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。
(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,电话调查由于不是面对面的交流,在被访者不愿意接受调查 时,要说服他们就更为困难。
此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。
2. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当然相当好,此时随机变量X 的分布是相对于其平均值
时,二项分布的正态近似仍
和
都
对称的。当p 趋于0或1时,二项分
布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使
大于或等于5时,近似的效果就相当好。
3. 抽样误差影响因素分析。
【答案】影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。一般讲,不重复抽样的抽样误差
要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的 抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
4. 中心极限定理。
【答案】设随机变量相互独立(S 卩,对任意给定的
相互独立)且服从同一分布,该分布存在有限的期望和方
差
令
则
也就是说,当n 趋于无穷大时,
5. 简述统计分组的原则。
【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。
的分布趋向于标准正态分布
二、计算题
6. 某保险公司为50个集体投保人提供医疗保险,假设他们医疗花费相互独立,且花费(单位为百元)服从相同的分布律
|当花费超过百元时,保险公司应支付超过百元的部分;
作为预期的总支
则由题意知
其中为相对附加保费。为使公司获利的
当花费不超过百元时,由患者自己负担费用。如果以总支付费X 的期望值付费,那么,保险公司应收取总保险费为概率超过
附加保费至少应为多少。(己知
为保险公司支付给每个投保人的费用,且
相互独立并且分布律为:
【答案】设
因此
那么,由中心极限定理可得:
可得
7. 离散型随机变量X 的概率分布率如下。
(1)确定概率分布率中a 的值。 (2)试给出随机变量X 的分布
(3)计算随机变量X 的均值和方差。
【答案】(1)根据离散型随机变量的概率分布列的正则性,即得
当当当当
(2)当
时,时,时,时,时,
即为使公司获利的概率超过
附加保费
至少应为
可知:
所以随机变量X 的分布为:
相关内容
相关标签