当前位置:问答库>考研试题

2017年湖南科技大学商学院861统计学原理考研导师圈点必考题汇编

  摘要

一、简答题

1. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。

【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。

从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果

数取值;如果

即一般以为显著

,结果更倾向于接受假定的参数取值。

为非常显著,其含义是样本间的差异由抽样误差所致的概率

时小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。

样本间的差异比时更大,这种说法是错误的。

2. 简述系数、c 系数、系数的各自特点。

【答案】(1)相关系数是描述

式为:式中,列联表数据相关程度最常用的一种相关系数。它的计算公《为列联表中的总频数,也即样本量。说系数适合

这个范围。

列联表的情况。C 系数的列说明是较强的判定结果,拒绝假定的参说明说明是较弱的判定结果,拒绝假定的参数取值;如果联表,是因为对于

计算公式为:

列联表中的数据,计算出的系数可以控制在(2)列联相关系数又称列联系数,简称c 系数,主要用于大于

当列联表中的两个变量相互独立时,系数c=0, 但它不可能大于1。c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了 V 系数。V 系数的计算公式为:

当两个变量相互独立时,当两个变量完全相关时,所以V 的取值在之间。如果列联表中有一维为2,即则V 值就等于值。

3. 何谓统计量?分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处?

【答案】设

函数是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数

第 2 页,共 54 页 是一个统计量。通常,

又称出为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。

从以上统计量的定义可以看出,当. 时,代入T ,计算分布、t 分布、F 分布是由样本构造的函数,而且不依

分布、t 分布、F 分布中含有赖于任何未知参数时,则. 分布、t 分布、F 分布就是统计量;若

未知参数,则它们就不是统计量。

分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。

t 分布:一般当时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。

F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。

4. 下列调查问卷中的提问都有问题,请修改。

(1)您和您爱人是否对现有住房满意?

(2)您最近一次是几点上班的?

(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?

【答案】(1)您对现有住房满意吗?您爱人呢?

(2)您最近一次的工作是几点上班?

(3)您认为明光牛奶的口味纯正吗?

5. 统计分组标志选择的原则。

【答案】在进行统计分组标志选择时要遵循三个原则:

(1)应根据研宄目的与任务选择分组标志。同一研宄总体,研宄的目的不同,可选用的分组标志也不同。

(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志 时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本 质的标志进行分组。

(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经 济条件下,选择的分组标志也不一样,要根据情况的变化而变化。

6. 方差分析中的基本假定。

【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差

的。

7. 什么是置信区间估计和预测区间估计?二者有何区别?

【答案】(1)置信区间估计,它是对x 的一个给定值_求出y 的平均值的估计区间,这一区间

第 3 页,共 54 页 必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独立

称为置信区间;预测区间估计,它是对x 的一个给定值求出y 的一个个别值的估计区间,这一区间称为预测区间。

(2)置信区间估计和预测区间估计的区别:置信区间估计是求y 的平均值的估计区间,而预测区间估计是求y 的一个个别值的估计区间;

对同一个这两个区间的宽度也是不一样的,预测区间要比置信区间宽一些。

8. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?

【答案】在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数。

在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性。

9. 解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为

(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1,

其计算公式为

10.解释总体分布、样本分布和抽样分布的含义。

【答案】总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X 为总体随机变量,那么总体分布就是指X 的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x 为总体随机变量X 在样本 中的体现,那么样本分布就是指x 的分布,或者说是关于《个观测值的分布。同样,同一变量不同的样本或同一 样本不同的变量,其分布是不同的。

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组 成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样 本观测值计算而来的。具体地说,抽样分布就是从容量为W 的总体中抽取容量为n 的样本时,所有可能的样本 统计量所形成的分布。假设从容量为W 的有限总体中最多可以抽取m 个容量为n 的不同样本,那么把所有m 个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研宄样本分布与总体分布之间的桥梁。

二、计算题

第 4 页,共 54 页