2017年湘潭大学数学与计算科学学院814统计学(一)考研题库
● 摘要
一、判断题
1. 残差平方和是解释变量变动所引起的被解释变量的变差。( )
【答案】×
【解析】残差平方和是随机因素影响所引起的被解释变量的变差;回归平方和是指被解释变量的总体平方和与残差平方和之差。
2. —项研宄表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设为
【答案】
【解析】在实际应用中,一般要把等号放在原假设里面。因此,建立的原假设和备择假设应 该是
3. 某地区医生人数逐年増加,1993年、1994年、1995年各年的环比增长率分别为8%、18%、15%。该地区三年来医生人数共増长了
【答案】×
【解析】由环比发展速度和定基增长速度之间的关系可得,该地区三年来医生人数的定基增 长速度为
4. 参数和统计量是没有区别的。( )
【答案】
【解析】参数是研宄者想要了解的总体的某种特征值。而统计量是样本的函数,其中不含未知参数。参数估 计就是利用样本统计量去估计总体参数。
5. 总体X 的数学期望和方差均存在,是来自X 的样本,当的无偏估计,但
【答案】
所以
即不是的无偏估计。
6.
回归模型中假定误差项是一个服从正态分布的随机变量,且相互独立。( )
【答案】×
( )
( )
时,尽管是
并非的无偏估计。( )
【解析】由于
7. 公司的业绩与股票价格是因果关系,其中股票价格大跌是因,公司的业绩下降是果。 ( )
【答案】×
【解析】公司业绩与股票价格之间存在不确定的数量关系,即两者之间存在一定的相关关系,并非因果关系。
8. 样本均值的抽样分布形式仅与样本量n 的大小有关。( )
【答案】×
【解析】当所抽取的样本为小样本时,样本均值的抽样分布不仅与样本量n 有关,还与总体 当为大样本时, 的分布形式有关;由中心极限定理可知,样本均值的抽样分布近似服从正态分布。
9. 方差分析中,检验时既可以采用双侧检验,也可以采用单侧检验。( )
【答案】×
【解析】在方差分析中,原假设所描述的是在按照自变量的取值分成的类中,因变量的均值相等,通常构造F 统计量来检验因变量的均值是否相等,此时采用单侧检验;当对各因变量的均值做多重比较的时候,采用双侧检验。
10.检验显著性水平的选择,对接受和拒绝原假设
【答案】
没有影响。( )
二、简答题
11.简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为
就知道该数值低于平均数1.5倍的标准差。在对
多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
12.简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述式为:
式中,
列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的
列
式中为变量
的标准化值,是该组数据均值,s 为该组数据的
联表,是因为对于列联表中的数据,计算出的系数可以控制在
(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
计算公式为:
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,果列联表中有一维为2,即
13.简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为
其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是
则
越接近于7,表明回归平方和占总平方和的比例越大,回当两个变量完全相关时,
所以V 的取值在
之间。如
则V 值就等于值。
归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。
14.简述指数平滑法的基本含义。
【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。
使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生
不同的影响。当值
大的权数;同样
时,预测值仅仅是重复上一期的预测结果;
当
时,预测值就是上一期实际
越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更
越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的
但实际应用时,还应考虑预测误差,这里仍用误差
期的
预测值等于
期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊
反应就越慢。一般而言,当时间序列有较大的随机波动时,
宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的最后的值。
均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为