2017年湖南科技大学商学院623统计学考研强化模拟题
● 摘要
一、简答题
1. 简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述式为:
式中,
列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的
列
联表,是因为对于计算公式为:
列联表中的数据,计算出的系数可以控制在
(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,果列联表中有一维为2,即
2. 给出在一元线性回归中:
(1)相关系数的定义和直观意义; (2)判定系数的定义和直观意义; (3)相关系数和判定系数的关系。
【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为称为样本相关系数,记为r 。样本
相关系数的计算公式为:
按上述计算公式计算的相关系数也称为线性相关系数,或称为
相关系数。r 仅仅是x
若是根据样本数据计算的,则
当两个变量完全相关时,
所以V 的取值在
之间。如
则V 值就等于值。
与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两
个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。
(2)回归平方和占总平方和的比例称为判定系数,记为
其计算公式为:
判定系数测度了回归直线对观测数据的拟合程度。
的取值范围是
越接近于1,
表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变 差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。
(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。
3. 多元线性回归模型中有哪些基本的假定?
【答案】多元回归模型的基本假定有: (1)自变量(3)对于自变
量
(4)误差项是一个服从正态分布的随机变量,且相互独立,即
4. 简述假设检验的过程。
【答案】假设检验的过程如下: (1)根据所研宄问题的要求提出原假设
(或称为零假设、无效假设)和备择假设
确
定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若则拒绝
5. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量
的数学期望等于未知参数
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性
设
与
都是的无偏估计量,若对于任意
; 是非随机的、固定的,且相互之间互不相关(无多重共线性)
的方
差
都相同,且不序列相关,
即
的所有
值
(2)误差项是一个期望值为0的随机变量,即
接受若则不拒绝
即:
有
且至少对于某一个
(3)—致性(相合性) 如果依概率收敛于
则称
即
上式中的不等号成立,则称有
较有效。
是的一致估计量。
6. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若相关关系;若相关关系。
当
说明两个变量之间的线性关系越强时. 可视为中度相关
;
说明两个变量之间的线性关系越弱。对于一
时,
可视为高度相关时,说明两个变量之间的
个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当
时。视为低度相关;当
之间。若
表明变量
之间存在正线性相
表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当
表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,
二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
7. 构造下列维数的列联表,并给出检验的自由度。
a.2行5列 b.4行6列 c.3行4列 【答案】i 行j 列联表,如表所示。
而a. 当b.
当c.
当
,所以 检验的自由度=(行数_1)(列数一 1)
时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其
检验的自由度=检验的自由度=检验的自由度=
8. 简述描述离散程度的统计量和适用类型。
【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。
(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:
极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。
相关内容
相关标签