当前位置:问答库>考研试题

2017年中国人民大学统计学院805统计学之统计学考研导师圈点必考题汇编

  摘要

一、简答题

1. 解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为

(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1,

其计算公式为

2. 简述估计量的无偏性,有效性和一致性。

【答案】(1)无偏性 若估计量的数学期望等于未知参数

则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若

是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。

(2)有效性

设(3)—致性(相合性) 如果依概率收敛于

则称

即有

是的一致估计量。

3. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?

【答案】不是。

显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。

当两个事件相互独立时,

当两个事件不相互独立时,⑴ ⑵ 与且至少对于某一个都是的无偏估计量,若对于任意

上式中的不等号成立,则称较有效。 有即:

记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左

撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。

4. 简述时间序列的预测程序。

【答案】在对时间序列进行预测时,通常包括以下几个步骤:

(1)确定时间序列所包含的成分,也就是确定时间序列的类型;

(2)找出适合此类时间序列的预测方法;

(3)对可能的预测方法进行评估,以确定最佳预测方案;

(4)利用最佳预测方案进行预测。

5. 回归分析结果的评价。

【答案】对回归分析结果的评价可以从以下四个方面入手:

(1)所估计的回归系数的符号是否与理论或事先预期相一致;

(2)如果理论上认为

归方程也应该如此;

(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;

(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。

6. 什么是集中趋势和离散趋势?它们常用的指标有哪些?

【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。

数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。

7. 简述统计分组的原则。

【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。

8. 多元线性回归模型中有哪些基本的假定?

【答案】多元回归模型的基本假定有:

之间的关系不仅是正的,而且是统计上显著的,那么所建立的回

(1)自变量

(3)对于自变

量; 是非随机的、固定的,且相互之间互不相关(无多重共线性) 的方

差都相同,且不序列相关,

的所有

值 (2)误差项是一个期望值为0的随机变量,即(4)误差项是一个服从正态分布的随机变量,且相互独立,即

9. 简述古典概率法和经验概率法如何定义事件发生的概率。

【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A 发生的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件数n 的比值,记为:

经验概率又称主观概率,是指对一些无法重复的试验,只能根据以往的经验,人为确定这个事件的概率。

10.简述平稳序列和非平稳序列的含义。

【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。

(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

11.在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。

【答案】

抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。