当前位置:问答库>考研试题

2017年华东交通大学经济管理学院432统计学[专业硕士]之统计学原理考研题库

  摘要

一、简答题

1. 简述季节指数的计算步骤。

【答案】以移动平均趋势剔除法为例,计算季节指数的基本步骤为:

,(1)计算移动平均值(如果是季度数据采用4项移动平均,月份数据则采用12项移动平均)

并将其结果进行“中心化”处理,也就是将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”

(2)计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值。

(3)季节指数调整。由于各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。具体方法是:将第(2)步计算的每个季节比率的平均值除以它们的总平均值。

2. 简述搜集数据的基本方法及其弱点。

【答案】搜集数据的基本方法:

(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷, 对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法 进行仔细的研宄和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。

(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过 程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。

(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无 法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,电话调查由于不是面对面的交流,在被访者不愿意接受调查 时,要说服他们就更为困难。

此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。

3. 下列调查问卷中的提问都有问题,请修改。

(1)您和您爱人是否对现有住房满意?

(2)您最近一次是几点上班的?

(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?

【答案】(1)您对现有住房满意吗?您爱人呢?

(2)您最近一次的工作是几点上班?

(3)您认为明光牛奶的口味纯正吗?

4. 在盒子图(箱线图)的作图中,会使用哪些描述指标。

,是利用数据中的五个统计量:最【答案】箱线图(Boxplot )也称箱须图(Box-whiskerPlot )

小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。由上面

叙述可知,箱线图使用的描述指标有:最小值、第 一四分位数、中位数、第三四分位数与最大值。

5. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用

或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计

值。

6. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计

模型用于预测,影响预测精度的因素有哪些? 具有哪些统计特性?若

)。独立性【答案】(1

)误差项是一个服从正态分布的随机变量,且独立,

0的随机变量,即对于所有的值的方差都相同。 意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值为

(2

)模型参数的最小二乘估计的统计特性:①线性,即估计量为随机变量的

线性函数;②无偏性

具有最小方差的估计量。 分别是的无偏估计;③有效性是所有线性无偏估计量中

(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度越大,相应的预测区间就越宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心区间越窄,精度越高。

7. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?

【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为

由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性

犯取伪错误的可能性

一办法只有增大样本容量,这样既能保证满足取得较小的又能取得较小的值。

8. 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?

【答案】样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的即

去修正重复抽样时样本均值 势必增大也就是说

的大小和显著性水平的大小成相反方向变化。解决的唯在不重复抽样条件下,

样本均值的方差则需要用修正系数

的方差,即

对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数

对于有限总体,

当N 很大而n 很小时,其修正系数

来计算。

趋向于1; 也趋向于1,

这时样本均值的方差也可以按公式

二、计算题

9. 某厂商准备在北京投资一家快餐店,为进行可行性研宄,现随机调查了在快餐店就餐的49位顾客。其消费额如下: