当前位置:问答库>考研试题

2017年河北工程大学统计学Ⅱ(同等学力加试)考研复试核心题库

  摘要

一、简答题

1. 什么叫变异、变量和变量值,试举例说明。

【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。

变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或 变化。变量的具体取值称为变量值。具体包括:

(1)分类变量,如“性别”就是分类变量,其变量值为“男”或“女”;

“二等品”、“三等品”、(2)顺序变量,如“产品等级”就是顺序变量,其变量值可以为“一等品”、

“次品”等;

(3)数值型变量,如“年龄”是连续数值型变量,变量值为非负数;“企业数”是离散数值型变量,变量 值为 1,2,……

2. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?

【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行

的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。

3. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为y 如何依赖于自变量式中(2)多元回归方程:

根据回归模型的假定有

方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数

数据去估计它们。当用样本统计

时,就得到了估计的

个自变量分别为是模型的参数描述因变量为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为

:之间的关系。 是未知的,需要利用样本去估计回归方程中的未知参

多元回归方程,其一般形式为:

式中

是参数称为偏回归系数。

4. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

5. 构造下列维数的列联表,并给出检验的自由度。

a.2行5列 b.4行6列 c.3行4列

【答案】i 行j 列联表,如表所示。

的估计值是因变量y 的估计值。其中

a. 当

b.

c.

当检验的自由度=(行数_1)(列数一 1),所以 时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其检验的自由度=检验的自由度=检验的自由度=

6. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】(1)众数、中位数和平均数的关系

从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:

①如果数据的分布是对称的,众数中位数和平均数必定相等,即

②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:

③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,

(2)众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。

二、计算题

7. 欲调查噪声强度对学生完成作业的准确度的影响,随机抽取了 15名学生,分配到低噪声组,中噪声组, 高噪声组中,得到准确度均数与方差如下表:

样本平均附:分子自由度为样本方差分母自由度为的对应的界值表

(1)计算完成方差分析表,并说明噪声强度能解释作业准确度的变异的比例。

(2)用的显著性水平,分析噪声强度对作业准确度是否有影响。

(3)要具体确定低噪声组与中噪声组间的准确度是否有差异,怎样分析(不需计算)。

【答案】(1)

①计算全部观测值的总均值:

②计算各误差平方和:

组间平方和: