2017年华侨大学统计学院856统计学之统计学考研冲刺密押题
● 摘要
一、简答题
1. 什么是指数?它有哪些性质?
【答案】指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。它有如下一些性质:
(1)相对性。指数是总体各变量在不同场合下对比形成的相对数,它可以度量一个变量在不同时间或不同空间的相对变化,如一种商品的价格指数或数量指数。它也可以反映一组变量的综合变动,比如综合物价指数是根据一组商品价格的相对变化并给每种商品的相对数定以不同权数计算出来的,这种指数称为综合指数。另外根据对比两变量所处的是不同时间还是不同空间,它们计算出来的指数分时间性指数和区域性指数。
(2)综合性。综合性说明指数是一种特殊的相对数,它是由一组变量或项目综合对比形成的。比如,由若干种商品和服务构成的一组消费项目,通过综合后计算价格指数,以反映消费价格的综合变动水平。
(3)平均性。平均性含义有二:一是指数进行比较的综合数量是作为个别量的一个代表,这本身就具有平均的性质;二是两个综合量对比形成的指数反映了个别量的平均变动水平,比如物价指数反映了多种商品和服务项目价格的平均变动水平。
2. 多元线性回归模型中有哪些基本的假定?
【答案】多元回归模型的基本假定有:
(1)自变量
(3)对于自变
量
(4)误差项是一个服从正态分布的随机变量,且相互独立,即
3. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。
【答案】
抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非
第 2 页,共 56 页 ; 是非随机的、固定的,且相互之间互不相关(无多重共线性) 的方
差都相同,且不序列相关,
即 的所有
值(2)误差项是一个期望值为0的随机变量,即
概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。
4. 何谓统计量?
【答案】设
函数
又称出分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处? 是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数为样本统计量。当获得样本的一组具体观测值是一个统计量。通常,时,代入T ,计算的数值,就获得一个具体的统计量值。
从以上统计量的定义可以看出,当. 分布、t 分布、F 分布是由样本构造的函数,而且不依
分布、t 分布、F 分布中含有分布、t 分布、F 分布就是统计量;若赖于任何未知参数时,则.
未知参数,则它们就不是统计量。
分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。
t 分布:一般当时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。
F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。
5. 简述非抽样误差类型。
【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:
(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。
(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。
(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。
(4)调查员误差,是指由于调查员的原因而产生的调查误差。
(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。
第 3 页,共 56 页
6. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?
【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;
②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。
③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差
⑤当为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。越大,正态曲线 越扁平;越小,正态曲线越陡峭。 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。
⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。
(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求
方差为总体方差的,不论原来的总)体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正态分布。
7. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若
相关关系;若
相关关系。
当
说明两个变量之间的线性关系越强
时. 可视为中度相关;说明两个变量之间的线性关系越弱。对于一时,
可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当时。视为低度相关;
当之间。若
表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
8. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即
(2)回归平方和(^狀)是各回归值
来解释的变差部分。
第 4 页,共 56 页 与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线
相关内容
相关标签