2017年浙江工商大学统计学动态(理论与实务)之统计学复试实战预测五套卷
● 摘要
一、简答题
1. 简述系数、c 系数、系数的各自特点。
【答案】(1)
相关系数是描述
公式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的列联表,是因为对于
计算公式为:
列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。
2. 简述古典概率法和经验概率法如何定义事件发生的概率。
【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A 发生的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件数n 的比值,记为:
经验概率又称主观概率,是指对一些无法重复的试验,只能根据以往的经验,人为确定这个事件的概率。
3. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤:
(1)确定时间序列所包含的成分,也就是确定时间序列的类型;
(2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案;
(4)利用最佳预测方案进行预测。
4. 简述复合型时间序列的预测步骤。
【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:
(1)确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;
(2)建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测;
(3)计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。
5. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计
模型用于预测,影响预测精度的因素有哪些?
【答案】(1
)误差项是一个服从正态分布的随机变量,且独立,即
为0的随机变量,即线性函数;②无偏性
具有最小方差的估计量。
(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度越大,相应的预测区间就越宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心间越窄,精度越高。
6. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。
【答案】
抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优
具有哪些统计特性?若)。独立性意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值对于所有的值分别是的方差都相同。 为随机变量的是所有线性无偏估计量中(2
)模型参数的最小二乘估计的统计特性:①线性,即估计量的无偏估计;③有效性区
点。
二、计算题
7. 分别随机抽取9例健康人和9例克山病人,测定其血磷值数据如下:
经计算得,健康人和克山病人的样本均数分别为间; (计算保留小数点后2位)
(2)假设健康者和患者的血磷值具有方差均等的正态分布,问在显著性水平
病人的血磷是否高于健康者?(计算保留小数点后2位)
(3)在健康者和患者的血磷分布类型未知的情况下,如何推断克山病人的血磷是否高于健康者?(只需说明计算过程,不需具体计算结果)
注3:样本标准差定义
注4:记为自由度 的t 分布的与分位数,
【答案】(1)样本容量为小样本,总体方差未知,此时可用样本方差代替总体方差,
的分布,即
代入数据得
在两总体方差相等的条根据
下,克山样本标准差分别为 的置信区(1)假设健康者血磷值具有正态分布,求健康者血磷值总体均数的置信度为样本均值经过标准化以后 的随机变量则服从自由度为分布建立的总体均数
在的置信水平下的置信区间为
:的置信区间为即健康者血磷值总体均数的置信度为(2)设健康者的血磷值平均数为建立假设:克山病人的血磷值平均数为 件下,检验克山病人的血磷是否高于健康者。
由于总体方差未知,且相等。因此可用?检验。取统计量
代入数据得其观察值为: