2017年中国人民大学统计学院805统计学之统计学考研题库
● 摘要
一、简答题
1. 什么是指数?它有哪些性质?
【答案】指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。它有如下一些性质:
(1)相对性。指数是总体各变量在不同场合下对比形成的相对数,它可以度量一个变量在不同时间或不同空间的相对变化,如一种商品的价格指数或数量指数。它也可以反映一组变量的综合变动,比如综合物价指数是根据一组商品价格的相对变化并给每种商品的相对数定以不同权数计算出来的,这种指数称为综合指数。另外根据对比两变量所处的是不同时间还是不同空间,它们计算出来的指数分时间性指数和区域性指数。
(2)综合性。综合性说明指数是一种特殊的相对数,它是由一组变量或项目综合对比形成的。比如,由若干种商品和服务构成的一组消费项目,通过综合后计算价格指数,以反映消费价格的综合变动水平。
(3)平均性。平均性含义有二:一是指数进行比较的综合数量是作为个别量的一个代表,这本身就具有平均的性质;二是两个综合量对比形成的指数反映了个别量的平均变动水平,比如物价指数反映了多种商品和服务项目价格的平均变动水平。
2. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且
的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
3. 回归分析结果的评价。
【答案】对回归分析结果的评价可以从以下四个方面入手: (1)所估计的回归系数的符号是否与理论或事先预期相一致; (2)如果理论上认为归方程也应该如此;
(3)用判定系数
来回答回归模型在多大程度上解释了因变量取值的差异;
(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进
第 2 页,共 56 页
之间的关系不仅是正的,而且是统计上显著的,那么所建立的回
行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。
4. 什么是置信区间估计和预测区间估计?二者有何区别?
【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;
预测区间估计,它是对x 的一个给定值
求出y 的一个个别值的估计区间,
这一区间称为预测区间。
(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;
对同一个区间要比置信区间宽一些。
5. 说明计算统计量的步骤。
【答案】计算(2)将(3)将平方结果
统计量的步骤:
之差平方;
除以
(1)用观察值减去期望值
这两个区间的宽度也是不一样的,预测
(4)将步骤(3)的结果加总,即得:
6. 简述指数平滑法的基本含义。
【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。
期的
预测值等于
期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊
使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生
不同的影响。当值
大的权数;同样
时,预测值仅仅是重复上一期的预测结果;
当
时,预测值就是上一期实际
越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更
越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的
但实际应用时,还应考虑预测误差,这里仍用误差
反应就越慢。一般而言,当时间序列有较大的随机波动时,
宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的最后的值。
7. 何谓统计量?
【答案】设函数又称出
均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为
分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?
是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数
为样本统计量。当获得样本的一组具体观测值
是一个统计量。通常,
时,代入T ,计算
的数值,就获得一个具体的统计量值。
第 3 页,共 56 页
从以上统计量的定义可以看出,当. 赖于任何未知参数时,则.
未知参数,则它们就不是统计量。
分布、t 分布、F 分布是由样本构造的函数,而且不依
分布、t 分布、F 分布中含有
分布、t 分布、F 分布就是统计量;若
分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。t 分布:一般当
时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本
理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。
F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。
8. 简述平稳序列和非平稳序列的含义。
【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。
(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
9. 构造下列维数的列联表,并给出
检验的自由度。
a.2行5列 b.4行6列 c.3行4列 【答案】i 行j 列联表,如表所示。
而a. 当b.
当c.
当
,所以 检验的自由度=(行数_1)(列数一 1)
时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其
检验的自由度=检验的自由度=检验的自由度=
10.简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离
第 4 页,共 56 页
式中为变量的标准化值,是该组数据均值,s 为该组数据的