当前位置:问答库>考研试题

2017年北京林业大学应用统计硕士(专业学位)专业-统计学复试实战预测五套卷

  摘要

一、简答题

1. 统计数据质量的基本标准是什么?

【答案】(1)准确:用数字语言来反映客观实际;(2)快速:统计信息服务必须具有时效性和紧迫性;(3)完整:调查单位没有遗漏,调查项目没有缺陷,资料数据齐全;(4)精练:统计信息具有针对性、有效性、精确性。

2. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立) (其中是行变量,是列变量)

选取统计量:

(其中,

第i 行第j 列类别的期望频数;并且

为列联表中第i 行第j 列类别的实际频数;

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向

第 2 页,共 43 页 为列联表中

量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

3. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot ),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

4. 简述非抽样误差类型。

【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:

(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。

(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。

(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。

(4)调查员误差,是指由于调查员的原因而产生的调查误差。

(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。

5. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为y 如何依赖于自变量式中(2)多元回归方程:

根据回归模型的假定有

方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数

数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

式中

第 3 页,共 43 页 个自变量分别为是模型的参数描述因变量为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为

:之间的关系。 是未知的,需要利用样本去估计回归方程中的未知参

数是参数称为偏回归系数。 的估计值是因变量y 的估计值。其中

6. 简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。

(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:

极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。

(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理答。

(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号, 然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。

二、计算题

7. 设某种商品每周的需求量X 是服从区间上均匀分布的随机变量,而经销商店进货量为区间[10, 30]中的某一整数,商店每销售一单位商品可获利500元,若供大于求,则削价处理,每处理一单位商品亏损100 元;若供不应求,则可从外部调剂供应,此时1单位商品仅获利300元。为使商品所获利润期望值不少于9280 元,试确定最少进货量。

【答案】该种商品每周的需求量X 服从

货量为y ,则有:

则商品所获利润期望值为:

若使商品所获利润期望值不少于9280元,只须满足:

第 4 页,共 43 页 上的均匀分布,设商店所获利润为z ,商店进