当前位置:问答库>考研试题

2017年河北工程大学理学院432统计学[专业硕士]考研题库

  摘要

一、简答题

1. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?

【答案】相关系数r 的取值范围在关关系;若相关关系;若相关关系。

说明两个变量之间的线性关系越强时. 可视为中度相关

说明两个变量之间的线性关系越弱。对于一

时,

可视为高度相关时,说明两个变量之间的

个具体的r 取值,根据经验可将相关程度分为以下几种情况:

时。视为低度相关;当

之间。若

表明变量

之间存在正线性相

表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当

表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,

二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性

相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

2. 何谓统计量?分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?

【答案】设函数又称出

是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数

为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。

从以上统计量的定义可以看出,当. 赖于任何未知参数时,则.

未知参数,则它们就不是统计量。

分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。t 分布:一般当

时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本

理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。

F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。

3. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述式为:

式中,

列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的

分布、t 分布、F 分布是由样本构造的函数,而且不依

分布、t 分布、F 分布中含有

分布、t 分布、F 分布就是统计量;若

是一个统计量。通常,

时,代入T ,计算

联表,是因为对于计算公式为:

列联表中的数据,计算出的系数可以控制在

(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,

当两个变量完全相关时,

所以V 的取值在

之间。如

果列联表中有一维为2,即则V 值就等于值。

4. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?

【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于

的对称钟形曲线,且峰值在

处;

②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。

③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,

标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。

④正态分布的标准差⑤当

为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。

越大,正

态曲线 越扁平;越小,正态曲线越陡峭。

的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,

但理论上永远不会与之相父。

⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。

(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求方差为总体方差的

,不论原来的总)

体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值

这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正

态分布。

5. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、

“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……

6. 说明计算统计量的步骤。

【答案】计算(2)将(3)将平方结果

统计量的步骤:

之差平方;

除以

(1)用观察值减去期望值

(4)将步骤(3)的结果加总,即得:

7. 简述估计量的无偏性,有效性和一致性。

【答案】(1)无偏性 若估计量

的数学期望等于未知参数

即:

则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若

是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性

(3)—致性(相合性) 如果依概率收敛于

则称

是的一致估计量。

8. 简述时间序列的预测程序。

【答案】在对时间序列进行预测时,通常包括以下几个步骤: (1)确定时间序列所包含的成分,也就是确定时间序列的类型; (2)找出适合此类时间序列的预测方法;

(3)对可能的预测方法进行评估,以确定最佳预测方案; (4)利用最佳预测方案进行预测。

9. 给出在一元线性回归中:

(1)相关系数的定义和直观意义; (2)判定系数的定义和直观意义;

且至少对于某一个

都是的无偏估计量,若对于任意

上式中的不等号成立,则称

有效。