2017年河南科技大学数学与统计学院840统计学考研题库
● 摘要
一、简答题
1. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?
【答案】在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数。
在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性。
2. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。
【答案】(1)众数、中位数和平均数的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:
①如果数据的分布是对称的,众数中位数和平均数必定相等,即
②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:
③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,
则
(2)众数、中位数和平均数在实际中的应用
①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。
②中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。
③平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。
3. 在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。
【答案】
抽样调查()是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研宄,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研宄的总体中,根据随机原则来
抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有 如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;第二,能够根据部分 调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识;第三,在抽样调查中会存 在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。
4. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:
(1)值能告诉我们什么信息?
(2)当相应的值较小时为什么要拒绝原假设?
(3)显著性水平与值有何区别?
【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。
(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。
(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。
(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,
如果选择的值相同,
所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。
5. 中心极限定理。
【答案】设随机变量
令
则
也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方
差
6. 下列调查问卷中的提问都有问题,请修改。
(1)您和您爱人是否对现有住房满意?
(2)您最近一次是几点上班的?
(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?
【答案】(1)您对现有住房满意吗?您爱人呢?
(2)您最近一次的工作是几点上班?
(3)您认为明光牛奶的口味纯正吗?
7. 回归分析结果的评价。
【答案】对回归分析结果的评价可以从以下四个方面入手:
(1)所估计的回归系数的符号是否与理论或事先预期相一致;
(2)如果理论上认为
归方程也应该如此;
(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;
(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。
8. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为 之间的关系不仅是正的,而且是统计上显著的,那么所建立的回
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
二、计算题
9 假定随机向量.,服从二维正态分布且X 和Y 分别服从正态分布
现做变换:
和方差
和并已知它们的相关系数为(1)试求Z 的数学期望(2)试求X 与Z 的相关系数
(3)试判断X 与Z 的独立性(说明理由)。
【答案】⑴
相关内容
相关标签