2017年苏州科技大学统计学(同等学力加试)复试仿真模拟三套题
● 摘要
一、简答题
1. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
【答案】(1)总平方和(S^T)是实际观测值
与其均值的离差平方和,即
(2)回归平方和(^狀)是各回归值
来解释的变差部分。
(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即
称为误差平方和。
(4)三者之间的关系
2. 中心极限定理。
【答案】设随机变量
令
则
也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方
差 它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线
3. 简述标准化值的意义及计算公式。
【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:
标准差。
标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据
第 2 页,共 25 页 式中为变量的标准化值,是该组数据均值,s 为该组数据的
分布的形状,而只是将该组数据变为平均数为0, 标准差为1。
4. 简述描述离散程度的统计量和适用类型。
【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。
(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:
极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。
(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理答。
(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号, 然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。
5. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计
模型用于预测,影响预测精度的因素有哪些?
【答案】(1
)误差项是一个服从正态分布的随机变量,且独立,即
为0的随机变量,即线性函数;②无偏性
具有最小方差的估计量。
(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度越大,相应的预测区间就越宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心间越窄,精度越高。
第 3 页,共 25 页 具有哪些统计特性?若)。独立性意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值对于所有的值分别是的方差都相同。 为随机变量的是所有线性无偏估计量中(2
)模型参数的最小二乘估计的统计特性:①线性,即估计量的无偏估计;③有效性区
6. 简述系数、c 系数、系数的各自特点。
【答案】(1)
相关系数是描述
公式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的列联表,是因为对于
计算公式为:
列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。
(3)克莱默提出了 V 系数。V 系数的计算公式为:
当两个变量相互独立时,
果列联表中有一维为2,即
当两个变量完全相关时,所以V 的取值在之间。如则V 值就等于值。
二、计算题
7. —家紧急救护中心目前每天的值班护士人数相同。表1是2010年11月1日至2010年11月26日到紧急 救护中心的病人数(紧急救护中心周六,周日不营业),表2和表3分别是表1数据的描述统计和方差分析的结果。
根据表1、表2和表3中的数据和统计分析结果,请你替这家紧急救护中心的主任给他的上级主管部门撰写一份报告,阐明根据一周每天病人人数安排相应的值班护士人数的理由。
报告至少涵盖下面两项内容:
(1)一周中每天的病人人数是否存在差异?
(2)如果存在差异,哪些天似乎是最繁忙的?
第 4 页,共 25 页
相关内容
相关标签