2017年兰州财经大学统计学院432统计学[专业硕士]之统计学考研仿真模拟题
● 摘要
一、简答题
1. 说明计算
统计量的步骤。
统计量的步骤:
之差平方;
除以
【答案】计算(2)将(3)将平方结果
(1)用观察值减去期望值
(4)将步骤(3)的结果加总,即得:
2. 试述统计总体及其特征。
【答案】总体是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成,如由多个企业构成的 集合,多个居民户构成的集合,多个人构成的集合,等等。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。通常情况下,统计上 的总体是一组观测数据,而不是一群人或一些物品的集合。
总体具有的特征包括:(1)同质性,即总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是 构成总体的条件;(2)大量性,即构成总体的总体单位数目要足够多;(3)差异性,即总体单位必须具有一个或 若干个品质变异标志或数量变异标志。
3. 利用增长率分析时间序列时应注意哪些问题?
【答案】在应用増长率分析实际问题时,应注意以下几点:
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率。这是因为对这样的序列计算增长率,要么不符合数学公理,要么无法解释其实际意义;
(2)在有些情况下,不能单纯就增长率论増长率,要注意增长率与绝对水平的结合分析。
4. 何谓统计量?
【答案】设函数又称出
分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?
是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数
为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。
从以上统计量的定义可以看出,当. 赖于任何未知参数时,则.
未知参数,则它们就不是统计量。
第 2 页,共 53 页
是一个统计量。通常,
时,代入T ,计算
分布、t 分布、F 分布是由样本构造的函数,而且不依
分布、t 分布、F 分布中含有
分布、t 分布、F 分布就是统计量;若
分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。t 分布:一般当
时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本
理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。
F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。
5. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量
的数学期望等于未知参数
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性
设
(3)—致性(相合性) 如果依概率收敛于则称
即
有
是的一致估计量。
6. 简述假设检验的过程。
【答案】假设检验的过程如下: (1)根据所研宄问题的要求提出原假设
(或称为零假设、无效假设)和备择假设
确
定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若
7. 简述非抽样误差类型。
则拒绝
接受
若
则不拒绝
与
且至少对于某一个
都是的无偏估计量,若对于任意
上式中的不等号成立,则称
较
有效。
有
即:
【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:
(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。
(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原
第 3 页,共 53 页
因有多种,主要有理答误差、记忆误差和有意识误差。
(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。 (4)调查员误差,是指由于调查员的原因而产生的调查误差。
(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。
8. 说明回归模型的假设以及当这些假设不成立时的应对方法。
【答案】(1)多元回归模型的基本假定有: ①自变量③对于自变
量
④误差项是一个服从正态分布的随机变量,且相互独立,即(2)若模型中存在多重共线性时,解决的方法有:
第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。 第二,如果要在模型中保留所有的自变量,那就应该:避免根据统计量对单个参数进行检验;对因变量Y 值的推断(估计或预测)限定在自变量样本值的范围内。
若模型中存在序列相关时,解决的方法有:如果误差项不是相互独立的,则说明回归模型存在序列相关性
,这时首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的自变量,则应増加自变量;如果以上两种方法都不能消除序列相关性,则需采用迭代法、差分法等方法处理。
若模型中存在异方差性时,解决的方法有:当存在异方差性时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。
9. 简述系数、c 系数、系数的各自特点。
【答案】(1)相关系数是描述式为:
式中,
列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合
这个范围。
列联表的情况。C 系数的
列
; 是非随机的、固定的,且相互之间互不相关(无多重共线性)
的方
差
都相同,且不序列相关,
即
的所有
值
②误差项s 是一个期望值为0的随机变量,即
联表,是因为对于计算公式为:
列联表中的数据,计算出的系数可以控制在
(2)列联相关系数又称列联系数,简称c 系数,主要用于大于
当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能
第 4 页,共 53 页
相关内容
相关标签