当前位置:问答库>考研试题

2017年北京林业大学应用统计硕士(专业学位)专业-统计学考研复试核心题库

  摘要

一、简答题

1. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。

(2)请说明如何对这100例身高数据进行描述性统计分析。

【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。

样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。

参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

2. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

3. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

来越高(即的值越是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新

不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,

调整。而修正判定系数

归模型方面要优于多重判定系数修正判定系数的计算公式为

4. 利用增长率分析时间序列时应注意哪些问题?

【答案】在应用増长率分析实际问题时,应注意以下几点:

(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;

(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。

5. 解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为 其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1,

其计算公式为

6. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

【答案】单因素方差分析的实质是研宄一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为:

(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。

(2)构造检验统计量,计算各样本均值(3)计算样本统计量

(4)统计决策。比较统计量拒绝原假设。

的值。若拒绝原假设;反之,不能样本总均值误差平方和

二、计算题

7. 某卷烟厂向化验室送去A 和B 两种烟草,化验尼古丁的含量是否相同,从A 和B 中各随机抽取重量相同 的五例进行化验,测得尼古丁的含量(mg )为

据经验知,尼古丁含量服从正态分布。

(1)若已知A , B两种烟草尼古丁含量的方差分别为5和8, 问两种烟草的尼古丁含量是否有差别

(2)若未知两种烟草尼古丁含量的方差,问两种烟草的尼古丁含量是否有差别

【答案】A 种烟草的均值:

A 种烟草的样本方差:

B 种烟草的均值:

B 种烟草的样本方差:

假设:

计算统计量:

时,当因为所以拒绝原假设

即认为有证据表明两种烟草的尼古丁含量有差别。

计算统计量: