2017年西北师范大学913统计学复试实战预测五套卷
● 摘要
一、简答题
1. 在盒子图(箱线图)的作图中,会使用哪些描述指标。
【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot ),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。
2. 要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?
【答案】方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。
检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的检验。随着增加个体显
著性检验的次数,偶然因素导致差别的可能性也会増加(并非均值真的存在差别)。而方差分
析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
3. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。
数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。
4. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?
【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。
5. 解释总体分布、样本分布和抽样分布的含义。
【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X
为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。
样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。
一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。
6. 多元线性回归模型中有哪些基本的假定?
【答案】多元回归模型的基本假定有:
(1)自变量
(3)对于自变
量
(4)误差项是一个服从正态分布的随机变量,且相互独立,即
是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方
差都相同,且不序列相关,
即的所有
值(2)误差项是一个期望值为0的随机变量,即
二、计算题
7. 已知我国1978〜1992年针织品零售量数据如表1所示。
表
1
试配合二次曲线趋势方程,并预测1993年的零售量,作图与原数列比较。(可令
【答案】记年份1978年
为
年为得:
表2
) 年
为年
为年
为设二次曲线趋势方程为利用Excel 进行回归分析可
故二次曲线趋势方程为售量的预测值为:
当时,可以得到1993年零
由二次曲线趋势方程可得各预测值,如表3所示。
表
3
绘制零售量原始数据与抛物线拟合曲线的图形为:
相关内容
相关标签