2017年西安邮电大学统计学(同等学历加试)考研复试核心题库
● 摘要
一、简答题
1. 什么是置信区间估计和预测区间估计?二者有何区别?
【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;
预测区间估计,它是对x 的一个给定值
求出y 的一个个别值的估计区间,
这一区间称为预测区间。
(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;对同一个区间要比置信区间宽一些。
2. 构造下列维数的列联表,并给出
这两个区间的宽度也是不一样的,预测
检验的自由度。
a.2行5列 b.4行6列 c.3行4列 【答案】i 行j 列联表,如表所示。
而a. 当b. 当c. 当
检验的自由度=(行数_1)(列数一 1),所以
时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其
检验的自由度=检验的自由度=检验的自由度=
3. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。
【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。
从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果数取值;如果
即一般以
为显著
,
结果更倾向于接受假定的参数取值。
为非常显著,其含义是样本间的差异由抽样误差所致的概率
时
小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。
第 2 页,共 43 页
说明是较强的判定结果,拒绝假定的参
说明
说明是较弱的判定结果,拒绝假定的参数取值;如果
样本间的差异比时更大,这种说法是错误的。
4. 简述平稳序列和非平稳序列的含义。
【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。
(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
5. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间
【答案】记赢钱数为则的函数定义为:
则有
于是X 的概率分布为:
以及随机变量X 的定义和概率分布。
其中
为投掷后出现的两种结果,令
6. 简述统计分组的原则。
【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。
二、计算题
第 3 页,共 43 页
7. 欲调查噪声强度对学生完成作业的准确度的影响,随机抽取了 15名学生,分配到低噪声组,中噪声组, 高噪声组中,得到准确度均数与方差如下表:
样本平均
附:分子自由度为
样本方差
分母自由度为
的
对应的界值表
(1)计算完成方差分析表,并说明噪声强度能解释作业准确度的变异的比例。 (2)用
的显著性水平,分析噪声强度对作业准确度是否有影响。
(3)要具体确定低噪声组与中噪声组间的准确度是否有差异,怎样分析(不需计算)。 【答案】(1)
①计算全部观测值的总均值:
②计算各误差平方和: 组间平方和:
组内平方和:
总平方和:
③
方差分析表如下所示:
第 4 页,共 43 页