当前位置:问答库>考研试题

2018年对外经济贸易大学保险学院890精算学综合之统计学考研强化五套模拟题

  摘要

一、简答题

1. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:

(1)值能告诉我们什么信息?

(2)当相应的值较小时为什么要拒绝原假设?

(3)显著性水平与值有何区别?

【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。

(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。

(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。

(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,

如果选择的值相同,

所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。

2. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

3. 什么是置信区间估计和预测区间估计?二者有何区别?

【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间称为置信区间;预测区间估计,它是对x 的一个给定值求出y 的一个个别值的估计区间,这一区间称为预测区间。

(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;对同一个

区间要比置信区间宽一些。

4. 全概率公式与逆概率公式分别用于什么场合?

【答案】(1)全概率公式为:

其中

是互不相容的事件且这两个区间的宽度也是不一样的,预测

如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些事件下A 的条件概率较易于确定,就可以用全概率公式。

(2)逆概率公式也称贝叶斯公式,即

式中:表示完备事件组。

中每个事件的逆概率公式是要在事件A 已经发生的条件下来计算完备事件组

发生概率。

5. 简述时间序列的构成要素。

【答案】时间序列的构成要素分为4种,即趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。

(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;

(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;

(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;

(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。

二、计算题

6. 抽样调查某地区50户居民的月消费品支出额数据资料,如表1所示(单位:元)。

表1

要求:

(1)试根据上述资料编制频数分布表。(2)编制向上和向下累积频数、频率分布表。

【答案】(1)编制次数分布和频率分布表,如表2所示。

表2 居民户月消费品支出额频数分布和频率分布表

(2)编制向上累积和向下累积频数以及频率分布表,如表3、4所示。

表3 居民户月消费品支出额向上累积表

表4 居民户月消费品支出额向下累积表