2017年河北工程大学理学院432统计学[专业硕士]考研题库
● 摘要
一、简答题
1. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若相关关系;若相关关系。
当
说明两个变量之间的线性关系越强时. 可视为中度相关
;
说明两个变量之间的线性关系越弱。对于一
时,
可视为高度相关时,说明两个变量之间的
个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当
时。视为低度相关;当
之间。若
表明变量
之间存在正线性相
表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当
表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,
二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
2. 何谓统计量?分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?
【答案】设函数又称出
是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数
为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。
从以上统计量的定义可以看出,当. 赖于任何未知参数时,则.
未知参数,则它们就不是统计量。
分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。t 分布:一般当
时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本
理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。
F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。
3. 简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述式为:
式中,
列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的
列
分布、t 分布、F 分布是由样本构造的函数,而且不依
分布、t 分布、F 分布中含有
分布、t 分布、F 分布就是统计量;若
是一个统计量。通常,
时,代入T ,计算
联表,是因为对于计算公式为:
列联表中的数据,计算出的系数可以控制在
(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,
当两个变量完全相关时,
所以V 的取值在
之间。如
果列联表中有一维为2,即则V 值就等于值。
4. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?
【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于
的对称钟形曲线,且峰值在
处;
②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。
③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,
标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。
④正态分布的标准差⑤当
为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。
越大,正
态曲线 越扁平;越小,正态曲线越陡峭。
的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,
但理论上永远不会与之相父。
⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。
(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求方差为总体方差的
,不论原来的总)
体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值
这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正
态分布。
5. 什么叫变异、变量和变量值,试举例说明。
【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。
变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:
(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;
“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、
“次品”等;
(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……
6. 说明计算统计量的步骤。
【答案】计算(2)将(3)将平方结果
统计量的步骤:
之差平方;
除以
(1)用观察值减去期望值
(4)将步骤(3)的结果加总,即得:
7. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量
的数学期望等于未知参数
即:
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性
设
(3)—致性(相合性) 如果依概率收敛于
则称
即
有
是的一致估计量。
8. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤: (1)确定时间序列所包含的成分,也就是确定时间序列的类型; (2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案; (4)利用最佳预测方案进行预测。
9. 给出在一元线性回归中:
(1)相关系数的定义和直观意义; (2)判定系数的定义和直观意义;
与
且至少对于某一个
都是的无偏估计量,若对于任意
上式中的不等号成立,则称
较
有效。
有