当前位置:问答库>考研试题

2017年新疆农业大学统计学(加试)考研复试核心题库

  摘要

一、简答题

1. 多元线性回归模型中有哪些基本的假定?

【答案】多元回归模型的基本假定有: (1)自变量(3)对于自变

(4)误差项是一个服从正态分布的随机变量,且相互独立,即

2. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加来越高(即

的值越

是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新

不是一个合适的指标,需加以

是非随机的、固定的,且相互之间互不相关(无多重共线性);

的方

都相同,且不序列相关,

的所有

(2)误差项是一个期望值为0的随机变量,即

的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,调整。而修正判定系数归模型方面要优于多重判定系数

修正判定系数

的计算公式为

3. 在研宄方法上,参数估计与假设检验有什么相同点和不同点?

【答案】(1)参数估计和假设检验的相同点 ①是根据样本信息推断总体参数;

②都以抽样分布为理论依据,建立在概率论基础之上的推断,推断结果都有风险; ③对同一问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。

(2)参数估计和假设检验的不同点

①参数估计是以样本资料估计总体参数的可能范围,假设检验是以样本资料检验对总体参数的先验假设是否成立;

②区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;

第 2 页,共 41 页

其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回

③区间估计立足于大概率,通常以较大的把握程度(可信度)成立。

4. 简述估计量的无偏性,有效性和一致性。

【答案】(1)无偏性 若估计量

的数学期望等于未知参数

即:

去估计总体参数的置信区

间;假设检验立足于小概率,

通常是给定很小的显著性水平去检验对总体参数的先验假设是否

则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若

是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性

(3)—致性(相合性) 如果依概率收敛于则称

是的一致估计量。

5. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?

【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的

去修正重复抽样时样本均值

且至少对于某一个

都是的无偏估计量,若对于任意

上式中的不等号成立,则称

有效。

在不重复抽样条件下,

样本均值的方差则需要用修正系数的方差,即

对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数对于有限总体,

当N 很大而n 很小时,其修正系数

来计算。

6. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】(1)众数、中位数和平均数的关系

趋向于1;

也趋向于1,

这时样本均值的方差也可以按公式

从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上

第 3 页,共 41 页

的值,而平均数 则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系: ①如果数据的分布是对称的,众数

中位数

和平均数

必定相等,即

②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:

③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,

(2)众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。

二、计算题

7. 某厂生产某产品1000件,其价格为

其使用寿命X (单位:天)的分布密度为

现由某保险公司为其质量进行保险:

厂方向保险公司交保费(1)若保费(2)试确定保费

保险公司亏本的概率? 使保险公司亏本概率不超过

【答案】(1)设该厂出现产品寿命小于1095天的总产品件数是Y 。保险公司刚好亏本时,产品寿命小于1095天的总产品件数是y ;,则

时,

所以保险公司亏本的概率为:

每件产品寿命小于1095天的概率为:

第 4 页,共 41 页

元/件,每件产品若寿命小于

1095天(3年),则由保险公司按原价赔偿2000元/件,试由中心极限定理计算: