2018年中国药科大学专业学位432统计学[专业硕士]考研强化五套模拟题
● 摘要
一、简答题
1. 简述统计分组的原则。
【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。
2. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的
即
去修正重复抽样时样本均值
在不重复抽样条件下,
样本均值的方差则需要用修正系数的方差,即
对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数对于有限总体,
当N 很大而n 很小时,其修正系数
来计算。
3. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在之间。若
表明变量关关系;若相关关系;若
表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当
趋向于1;
也趋向于1,
这时样本均值的方差也可以按公式
之间存在正线性相
表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,
二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性相关关系。
当
说明两个变量之间的线性关系越强时. 可视为中度相关;
说明两个变量之间的线性关系越弱。对于一
时,
可视为高度相关时,说明两个变量之间的
个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当
时。视为低度相关;
当
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
4. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且
的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
5. 二项分布与超几何分布的适用场合有什么不同?它们的均值和方差有什么区别?
【答案】(1)从理论上讲,二项分布只适合于重复抽样(即从总体中抽出一个个体观察完后放回总体,然后再抽下一个个体)。但在实际抽样中,很少采用重复抽样。不过,当总体的元素数目况很大而样本量, 相对于AT 来说很小时,二项分布仍然适用。
但如果是采用不重复抽样,各次试验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本量 «相对于W 来说较大时,二项分布就不再适用,这时,样本中“成功”的次数则服从超几何概率分布。
(2)若X 服从二项分布若Y 服从超几何分布
则则
6. 举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根
据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
按照假设检验的步骤
:
按照假设检验的步骤: 设定假设:
(行变量与列变量独立)
(行变量与列变量不独立)
(其中
是行变量,
是列变量)
选取统计量:
(其中,
第i 行第j 列类别的期望频数;并且
为列联表中第i 行第j 列类别的实际频数;
最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。
7. 说明计算统计量的步骤。
【答案】计算统计量的步骤:
(1)用观察值减去期望值(2)将(3)将平方结果
之差平方;
除以
为列联表中
(4)将步骤(3)的结果加总,即得: