2017年哈尔滨工业大学应用统计复试仿真模拟三套题
● 摘要
一、简答题
1. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:
(1)值能告诉我们什么信息?
(2)当相应的值较小时为什么要拒绝原假设?
(3)显著性水平与值有何区别?
【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。
(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。
(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。
(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,
如果选择的值相同,
所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。
2. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤:
(1)确定时间序列所包含的成分,也就是确定时间序列的类型;
(2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案;
(4)利用最佳预测方案进行预测。
3. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当
然相当好,此时随机变量X 的分布是相对于其平均值
大于或等于5时,近似的效果就相当好。
4. 简述假设检验的过程。
【答案】假设检验的过程如下:
第 2 页,共 22 页 时,二项分布的正态近似仍和都对称的。当p 趋于0或1时,二项分 只要当n 大到使布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说,
(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若则拒绝
5. 利用增长率分析时间序列时应注意哪些问题? 接受若则不拒绝
【答案】在应用増长率分析实际问题时,应注意以下几点:
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;
(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。
6. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?
【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;
②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。
③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,
标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差
⑤当为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。越大,正态曲线 越扁平;越小,正态曲线越陡峭。 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。
⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。
(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求
方差为总体方差的
态分布。
),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正
二、计算题
7. 设样本取拒绝域来自总体
第 3 页,共 22 页 其中为未知参数。对于检验(1)求c 使检验的显著性水平
(2)若
求当时,犯第二类错误的概率。
【答案】(1)由已知条件得,检验统计量z 的值为:
拒绝域为由于已知的拒绝域为
(2)当时,犯第二类错误的概率为:
8. 对某地打土方的工人按重复抽样的方法抽取144个工人进行调查,得出平均每人完成工作量为立方米,标准差为
要求计算:
(1)以的概率保证,计算全部工人平均完成工作量将落在什么范围之内。
立方米时,应抽取多少工人。 (2)按上述(1)的条件,当抽样误差不超过
果有何关系。
【答案】(1)在
区间为:
即
(2)
(3)准确性増加一倍,即立方米。 即故应至少抽取900人。 缩小到原来的所以n 应该扩大到原来的四倍,即应抽取的概率保证下,则全部工人平均完成工作量的置信立方米。 则:
(3)按照上述(2)的条件,如果准确性增加一倍,又应抽取多少工人? 说明它与(2)的结3600人。
9. 有两条茶叶包装生产线,从每条生产线上各抽60桶,其中一条生产线上每桶茶叶的平均重量为克,方差为36; 另一条生产线的平均重量为克,方差为
(1)试构造两条生产线茶叶平均重量之差的置信度为95%的置信区间。 (2)能否判断两条生产线上茶叶的平均重量存在显著差异?【答案】(1)已知
由于样本容量比较大,故两条茶叶包装生产线上茶叶重量均值之差经标准化后服从标准正态
第 4 页,共 22 页