当前位置:问答库>考研试题

2018年厦门大学统计系432统计学[专业硕士]考研仿真模拟五套题

  摘要

一、简答题

1. 简述系数、c 系数、系数的各自特点。

【答案】(1)

相关系数是描述列联表数据相关程度最常用的一种相关系数。它的计算公式为:式中,《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。

2. 回归分析结果的评价。

【答案】对回归分析结果的评价可以从以下四个方面入手:

(1)所估计的回归系数的符号是否与理论或事先预期相一致;

(2)如果理论上认为

归方程也应该如此;

(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;

(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,

都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的

简单方法是画出残差的直方图或正态概率图。

3. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

第 2 页,共 47 页 之间的关系不仅是正的,而且是统计上显著的,那么所建立的回

回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是则

越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。

4. 试述统计总体及其特征。

【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。

总体具有的特征包括:(1)同质性,即总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是 构成总体的条件;(2)大量性,即构成总体的总体单位数目要足够多;(3)差异性,即总体单位必须具有一个或 若干个品质变异标志或数量变异标志。

5. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为个自变量分别为

y 如何依赖于自变量式中(2)多元回归方程:

根据回归模型的假定有

方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数

数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

式中

第 3 页,共 47 页 描述因变量为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为

:是模型的参数之间的关系。 是未知的,需要利用样本去估计回归方程中的未知参

数是参数称为偏回归系数。 的估计值是因变量y 的估计值。其中

6. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?

【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的即

去修正重复抽样时样本均值在不重复抽样条件下,

样本均值的方差则需要用修正系数

的方差,即

对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数

对于有限总体,

当N 很大而n 很小时,其修正系数

来计算。 趋向于1; 也趋向于1,

这时样本均值的方差也可以按公式

7. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?

【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。

不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。

(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。

8. 简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。

(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:

极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述

第 4 页,共 47 页