当前位置：问答库＞考研试题

2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库

● 摘要

2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库（一） .... 2

2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库（二） .. 12

2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库（三） .. 22

2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库（四） .. 33

2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库（五） .. 43

第 1 页，共 52 页

一、简答题

1．简述平稳序列和非平稳序列的含义。

【答案】（1）平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动，虽然在不同的时间段波动的程度不同，但并不存在某种规律。其波动可以看成是随机的。

（2）非平稳序列包含趋势、季节性或周期性的序列，它可能只含有其中的一种成分，也可能是几种成分的组合。因此，非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

2．考虑总体参数的估计量，简述无偏估计量与最小方差无偏估计量的定义。

【答案】①无偏性（unbiasedness ）是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数，不同的样本值就会得到不同的估计值。这样，要确定一个估计量的好坏，就不能仅仅依据某次抽样的结果来衡量，而必须由大量抽样的结果来衡量。对此，一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值，但在大量重复抽样时，所得到的估计值平均起来应与待估参数的真值相同，即希望估计量的均值应等于未知参数的真值，这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量，即在均方误差

是的一个无偏估计量，都有

则称是的一致最小方差无偏估计。

3．举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量，如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等，我们对其进行列联表的独立性检验。列联表的独立性检验是对一个分类变量的检验，因其分析过程可以通过列联表的方式呈现，故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如：为了研究年龄和喜欢的节目类型是否有关系，某单位对闲暇时间进行了全面调查，根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类：

第 2 页，共 52 页最小意义下的最优估计，它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量

按照假设检验的步骤

：

按照假设检验的步骤：

设定假设：

（行变量与列变量独立）

（行变量与列变量不独立）（其中是行变量，是列变量）

选取统计量：

（其中，

第i 行第j 列类别的期望频数；并且

为列联表中第i 行第j 列类别的实际频数；

最后带入数字，进行判断。看是否有行向量与列向量独立。若拒绝原假设，即行向量与列向量不独立，即年龄和喜欢的节目类型有关系。反之，年龄和喜欢的节目类型无关。

4．欲调查广州市初中学生的身高情况，随机抽取100名广州市初中学生，测量了身高。

（1）用此例说明这几个统计概念，总体（population ）, 样本（sample ）, 参数（pammeter ）, 统计量（statistics ）。

（2）请说明如何对这100例身高数据进行描述性统计分析。

【答案】（1）总体（population ）是包含所研宄的全部个体（数据）的集合，它通常由所研宄的一些个体组成。本例中的总体是广州市所有初中学生。

样本（sample ）是从总体中抽取的一部分元素的集合，构成样本的元素的数目称为样本量（sample size）。本例中的样本是随机抽取的100名广州市初中学生，其中样本量为100。

参数（parameter ）是用来描述总体特征的概括性数字度量，它是研究者想要了解的总体的某种特征值。本例中广州市所有初中学生的平均身高即是一个参数。

统计量（statistic ）是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量，由于抽样是随机的，因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

（2）所谓描述性统计分析，就是对一组数据的各种特征进行分析，以便于描述测量样本的各种特征及其所代表的总体的特征。主要包括集中趋势的描述，可计算身高的均值，中位数和众数，也可采用箱线图直观的反映数据的集中趋势以及是否存在异常值；离散程度的描述，可计算身高

第 3 页，共 52 页为列联表中

的方差，变异系数，四分位差或极差，也可采用折线图或散点图等直观反映数据的离散程度；分布的偏态与峰度描述，可计算偏度和峰度值，或采用茎叶图或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

5．在投掷一枚均匀硬币进行打赌时，出现正面时投掷者赢5元，出现反面时输3元，记投掷者赢钱数为X 。试写出此问题的样本空间

【答案】记赢钱数为

则的函数定义为：

则有

于是X 的概率分布为：

以及随机变量X 的定义和概率分布。其中为投掷后出现的两种结果，令

6．多元回归分析中为什么需要使用修正的判定系数（可决系数）来比较方程的拟合效果？是如何计算的？

【答案】在多元线性回归分析中，常用修正的判定系数，而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

来越高（即的值越

是解释变量个数的增函数）。也就是说，在样本容量不变的情况，在模型中增加新

不是一个合适的指标，需加以的解释变量不会改变总离差平方和，但可能增加回归平方和，减少残差平方和，从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时，

调整。而修正判定系数

归模型方面要优于多重判定系数修正判定系数的计算公式为

7．简述非抽样误差类型。

【答案】非抽样误差是相对抽样误差而言的，是指除抽样误差之外的，由于其他原因引起的样本观察结果与总体真值之间的差异。无论是概率抽样、非概率抽样，或是在全面调查中，都有可能产生非抽样误差。非抽样误差有以下几种类型：

（1）抽样框误差，是指抽样框中的单位与研宄总体的单位不存在一一对应的关系，使用这样的抽样框抽取样本就会出现一些错误。

（2）回答误差，是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原

第 4 页，共 52 页其值不会随着解释变量个数k 的増加而增加，因此在用于估计多元回

当前位置：问答库＞考研试题

相关题目: