当前位置:问答库>考研试题

2017年兰州财经大学统计学院812统计学考研冲刺密押题

  摘要

一、简答题

1. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述

式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。

2. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。

【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。

从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果

数取值;如果

即一般以

样本间的差异比为显著

,结果更倾向于接受假定的参数取值。

为非常显著,其含义是样本间的差异由抽样误差所致的概率时小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。时更大,这种说法是错误的。

第 2 页,共 54 页 说明是较强的判定结果,拒绝假定的参说明说明是较弱的判定结果,拒绝假定的参数取值;如果

3. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、

“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……

4. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。

【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即

(2)回归平方和(^狀)是各回归值

来解释的变差部分。

(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即

称为误差平方和。

(4)三者之间的关系

5. 什么是置信区间估计和预测区间估计?二者有何区别?

【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;预测区间估计,它是对x 的一个给定值求出y 的一个个别值的估计区间,这一区间称为预测区间。

(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;对同一个这两个区间的宽度也是不一样的,预测区间要比置信区间宽一些。

6. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?

【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。

不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽

第 3 页,共 54 页 与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又

取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。

(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。

7. 简述时间序列的组成要素。

【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;

(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

8. 中心极限定理。

【答案】设随机变量

也就是说,当n 趋于无穷大时, 的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方

二、计算题

9. 设人均收入X 为自变量,人均消费Y 为因变量。现根据某地12个住户的有关资料计算出以下数据:(单位:元)

要求:(1)拟合简单线性回归方程,并解释方程中回归系数的经济意义;

(2)计算可决系数和回归估计的标准误差;

第 4 页,共 54 页