当前位置:问答库>考研试题

2017年浙江工商大学国民经济学综合之统计学考研复试核心题库

  摘要

一、简答题

1. 若有线性回归模型问:

(1)该模型是否违背古典线性回归模型的假定,请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为

量有关。

(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权

数以调整各项在平方和中的作用。即寻找参数的估计值使得离差平方和

与自变

其中

达到最小。这样,就消除了异方差性的影响。

2. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。

(2)请说明如何对这100例身高数据进行描述性统计分析。

【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。

样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。

参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

3. 构建综合评价指数时需要考虑哪些方面的问题?

【答案】构建综合评价指数需要考虑如下几个方面的问题:

(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。

(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的筛选,以提高指标的客观性。

(3)评价方法研宄,主要包括综合评价指数的构造方法、指标的赋权方法以及各种评价方法的比较等。

4. 解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X 为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。

5. 简述系数、c 系数、系数的各自特点。

【答案】(1)

相关系数是描述

公式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即

6. 简述平稳序列和非平稳序列的含义。 则V 值就等于值。

【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。

(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

二、计算题

7. 欲调查噪声强度对学生完成作业的准确度的影响,随机抽取了 15名学生,分配到低噪声组,中噪声组, 高噪声组中,得到准确度均数与方差如下表:

样本平均附:分子自由度为样本方差分母自由度为的对应的界值表

(1)计算完成方差分析表,并说明噪声强度能解释作业准确度的变异的比例。

(2)用的显著性水平,分析噪声强度对作业准确度是否有影响。

(3)要具体确定低噪声组与中噪声组间的准确度是否有差异,怎样分析(不需计算)。

【答案】(1)

①计算全部观测值的总均值:

②计算各误差平方和:

组间平方和: