2017年南京邮电大学理学院432统计学[专业硕士]考研导师圈点必考题汇编
● 摘要
一、简答题
1. 中心极限定理。
【答案】设随机变量
令
则
也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方
差
2. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。
【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。
此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用
值。
第 2 页,共 56 页 检验,检验方程是否存在一阶自相关问题,或采用或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计
3. 简述指数平滑法的基本含义。
【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第
形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。
使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生
不同的影响。当
值
大的权数;同样时,预测值仅仅是重复上一期的预测结果;
当时,预测值就是上一期实际
越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的
但实际应用时,还应考虑预测误差,这里仍用误差期的预测值等于
期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊反应就越慢。一般而言,当时间序列有较大的随机波动时,
宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的
均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值。
4. 什么是置信区间估计和预测区间估计?二者有何区别?
【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;预测区间估计,它是对x 的一个给定值求出y 的一个个别值的估计区间,这一区间称为预测区间。
(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;对同一个
区间要比置信区间宽一些。
5. 简述复合型时间序列的预测步骤。
【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:
(1)确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;
(2)建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测;
(3)计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。
6. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?
【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为
由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性
第 3 页,共 56 页 这两个区间的宽度也是不一样的,预测 势必增大
犯取伪错误的可能性也就是说
,
的大小和显著性水平的大小成相反方向变化。解决的唯
又能取得较小的值。 一办法只有增大样本容量,这样既能保证满足取得较小的
7. 构建综合评价指数时需要考虑哪些方面的问题?
【答案】构建综合评价指数需要考虑如下几个方面的问题:
(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。
(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的筛选,以提高指标的客观性。
(3)评价方法研宄,主要包括综合评价指数的构造方法、指标的赋权方法以及各种评价方法的比较等。
8. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?
【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行
的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。
9. 说明条形图和直方图的区别和联系。
【答案】(1)条形图与直方图的区别
①形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少, 矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
②由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 ③条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
(2)联系
两者都是用矩形表示数据分布情况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。
10.举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。
第 4 页,共 56 页
相关内容
相关标签