当前位置:问答库>考研试题

2017年河北经贸大学统计学(同等学力加试)复试实战预测五套卷

  摘要

一、简答题

1. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是则

越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。

2. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、

“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……

3. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?

【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;

②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。

③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,

标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。

第 2 页,共 39 页 越大,正态曲线 越扁平;越小,正态曲线越陡峭。

⑤当的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。

⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。

(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求

方差为总体方差的

态分布。

4. 说明计算),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正统计量的步骤。

统计量的步骤:

之差平方; 除以【答案】计算(2)将(1)用观察值减去期望值(3)将平方结果

(4)将步骤(3)的结果加总,即得:

5. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用

或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计

第 3 页,共 39 页

值。

6. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot ),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

二、计算题

7. 盒子中有10个球,6个红球和4个黑球,无放回随机选出4个球。计算选出球中包含黑球数的期望和方差。

【答案】设X 为所取的4个球中包含黑球的个数,则

所以选出球中包含黑球数的期望为,方差为。

8. 某企业欲了解广告费用支出(x 万元)对其产品销售量&件)的影响,收集了相关的统计资料(75年资料),拟建立线性回归方程,对两者之间的关系进行分析。通过计算得到下述结果:

根据上面计算结果请回答下面问题:

(1)写出销量与广告费的线性回归方程,并解释回归系数的含义。

(2)计算销量与广告费的相关系数,并说明两者之间的线性相关的密切程度。

(3)计算估计标准误差。

(4)处用所建立的回归方程估计当广告费用为S00万元时,该企业产品的销量。

【答案】(1)产品销售量y 与广告费x 之间的线性回归方程为

截距

斜率表示当没有广告费用支出时,其产品的平均销售量为表示每当广告费用支出增加7万元时,产品销售量平均増加

第 4 页,共 39 页 件。 件。