2017年中国地质大学(武汉)经济管理学院958统计学原理之统计学考研冲刺密押题
● 摘要
一、简答题
1. 简述时间序列的组成要素。
【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;
(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;
(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;
(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
2. 简述古典概率法和经验概率法如何定义事件发生的概率。
【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A 发生的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件数n 的比值,记为:
经验概率又称主观概率,是指对一些无法重复的试验,只能根据以往的经验,人为确定这个事件的概率。
3. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量
(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
4. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。
【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。
从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果
数取值;如果
即一般以为显著
,结果更倾向于接受假定的参数取值。
为非常显著,其含义是样本间的差异由抽样误差所致的概率
时小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。
样本间的差异比时更大,这种说法是错误的。
5. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。
【答案】单因素方差分析的实质是研宄一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为:
(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。
(2)构造检验统计量,计算各样本均值(3)计算样本统计量
(4)统计决策。比较统计量拒绝原假设。
的值。若拒绝原假设;反之,不能样本总均值误差平方和 说明是较强的判定结果,拒绝假定的参说明说明是较弱的判定结果,拒绝假定的参数取值;如果
6. 简述判定系数的含义和作用。
【答案】(1)判定系数的含义
回归平方和占总平方和的比例称为判定系数,记为其计算公式为:
(2)判定系数的作用
判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方
和
可见
x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时
的取值范围是则
越接近于7,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。
7. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?
【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为
由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性
犯取伪错误的可能性
一办法只有增大样本容量,这样既能保证满足取得较小的
8. 简述指数平滑法的基本含义。 又能取得较小的值。 势必增大
也就是说,
的大小和显著性水平的大小成相反方向变化。解决的唯
【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第
形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。 期的预测值等于
期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊
使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生
不同的影响。当
值
大的权数;同样时,预测值仅仅是重复上一期的预测结果;
当时,预测值就是上一期实际
越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的
但实际应用时,还应考虑预测误差,这里仍用误差反应就越慢。一般而言,当时间序列有较大的随机波动时,
宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的
均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值。
9. 全概率公式与逆概率公式分别用于什么场合?
【答案】(1)全概率公式为: