当前位置：问答库＞考研试题

2018年西北大学经济管理学院806西方经济学与应用统计学之统计学考研核心题库

● 摘要

一、简答题

1．什么是置信区间估计和预测区间估计？二者有何区别？

【答案】（1）置信区间估计，它是对x 的一个给定值_求出y 的平均值的估计区间，这一区间称为置信区间；预测区间估计，它是对x 的一个给定值求出y 的一个个别值的估计区间，这一区间称为预测区间。

（2）置信区间估计和预测区间估计的区别：置信区间估计是求y 的平均值的估计区间，而预测区间估计是求y 的一个个别值的估计区间；对同一个

区间要比置信区间宽一些。

2．说明计算统计量的步骤。

【答案】计算统计量的步骤：

（1）用观察值减去期望值

（2）将

（3）将平方结果之差平方；除以

这两个区间的宽度也是不一样的，预测（4）将步骤（3）的结果加总，即得：

3．简述平稳序列和非平稳序列的含义。

【答案】（1）平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动，虽然在不同的时间段波动的程度不同，但并不存在某种规律。其波动可以看成是随机的。

（2）非平稳序列包含趋势、季节性或周期性的序列，它可能只含有其中的一种成分，也可能是几种成分的组合。因此，非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

4．重复抽样和不重复抽样相比，抽样均值抽样分布的标准差有什么不同？

【答案】样本均值的方差与抽样方法有关。在重复抽样条件下，样本均值的方差为总体方差

的即

去修正重复抽样时样本均值在不重复抽样条件下，

样本均值的方差则需要用修正系数

的方差，即

对于无限总体进行不重复抽样时，可以按重复抽样来处理，因为其修正系数

对于有限总体，

当N 很大而n 很小时，其修正系数

来计算。

5．简述时间序列的预测程序。

【答案】在对时间序列进行预测时，通常包括以下几个步骤：

（1）确定时间序列所包含的成分，也就是确定时间序列的类型；

（2）找出适合此类时间序列的预测方法；

（3）对可能的预测方法进行评估，以确定最佳预测方案；

（4）利用最佳预测方案进行预测。趋向于1; 也趋向于1，

这时样本均值的方差也可以按公式

6．简述标准化值的意义及计算公式。

【答案】变量值与其平均数的离差除以标准差后的值称为标准分数，也称标准化值或分数。其计算公式为：

标准差。

标准分数可以测量每个数据在该组数据中的相对位置，并可以用它来判断一组数据是否有离群数据。比如，如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时，常常需要对各变量进行标准化处理。实际上，z 分数只是将原始数据进行了线性变换，它并没有改变一个数据在该组数据中的位置，也没有改变该组数据分布的形状，而只是将该组数据变为平均数为0, 标准差为1。

7．欲调查广州市初中学生的身高情况，随机抽取100名广州市初中学生，测量了身高。

（1）用此例说明这几个统计概念，总体（population ）, 样本（sample ）, 参数（pammeter ）, 统计量（statistics ）。

（2）请说明如何对这100例身高数据进行描述性统计分析。

式中为变量的标准化值，是该组数据均值，s 为该组数据的

【答案】（1）总体（population ）是包含所研宄的全部个体（数据）的集合，它通常由所研宄的一些个体组成。本例中的总体是广州市所有初中学生。

样本（sample ）是从总体中抽取的一部分元素的集合，构成样本的元素的数目称为样本量（sample size）。本例中的样本是随机抽取的100名广州市初中学生，其中样本量为100。

参数（parameter ）是用来描述总体特征的概括性数字度量，它是研究者想要了解的总体的某种特征值。本例中广州市所有初中学生的平均身高即是一个参数。

统计量（statistic ）是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量，由于抽样是随机的，因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

（2）所谓描述性统计分析，就是对一组数据的各种特征进行分析，以便于描述测量样本的各种特征及其所代表的总体的特征。主要包括集中趋势的描述，可计算身高的均值，中位数和众数，也可采用箱线图直观的反映数据的集中趋势以及是否存在异常值；离散程度的描述，可计算身高的方差，变异系数，四分位差或极差，也可采用折线图或散点图等直观反映数据的离散程度；分布的偏态与峰度描述，可计算偏度和峰度值，或采用茎叶图或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

8．方差分析中的基本假定。

【答案】方差分析中有三个基本假定：（1）每个总体都应服从正态分布。也就是说，对于因素的每一个水平，其观测值是来自正态分布总体的简单随机样本；（2）各个总体的方差必须相同。也就是说，对于各组观察数据，是从具有相同方差的正态总体中抽取的；（3）观测值是独立的。

9．多元回归分析中为什么需要使用修正的判定系数（可决系数）来比较方程的拟合效果？是如何计算的？

【答案】在多元线性回归分析中，常用修正的判定系数，而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

来越高（即的值越是解释变量个数的增函数）。也就是说，在样本容量不变的情况，在模型中增加新

不是一个合适的指标，需加以的解释变量不会改变总离差平方和，但可能增加回归平方和，减少残差平方和，从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时，

调整。而修正判定系数

归模型方面要优于多重判定系数修正判定系数的计算公式为

其值不会随着解释变量个数k 的増加而增加，因此在用于估计多元回

当前位置：问答库＞考研试题

相关题目: