当前位置:问答库>考研试题

2017年西北师范大学913统计学复试实战预测五套卷

  摘要

一、简答题

1. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot ),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

2. 要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?

【答案】方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的检验。随着增加个体显

著性检验的次数,偶然因素导致差别的可能性也会増加(并非均值真的存在差别)。而方差分

析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

3. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

4. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?

【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。

5. 解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X

为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。

6. 多元线性回归模型中有哪些基本的假定?

【答案】多元回归模型的基本假定有:

(1)自变量

(3)对于自变

(4)误差项是一个服从正态分布的随机变量,且相互独立,即

是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方

差都相同,且不序列相关,

即的所有

值(2)误差项是一个期望值为0的随机变量,即

二、计算题

7. 已知我国1978〜1992年针织品零售量数据如表1所示。

1

试配合二次曲线趋势方程,并预测1993年的零售量,作图与原数列比较。(可令

【答案】记年份1978年

年为得:

表2

) 年

为年

为年

为设二次曲线趋势方程为利用Excel 进行回归分析可

故二次曲线趋势方程为售量的预测值为:

当时,可以得到1993年零

由二次曲线趋势方程可得各预测值,如表3所示。

3

绘制零售量原始数据与抛物线拟合曲线的图形为: