当前位置:问答库>考研试题

2018年西北大学经济管理学院806西方经济学与应用统计学之统计学考研基础五套测试题

  摘要

一、简答题

1. 何谓统计量?

【答案】设

函数

又称出分布、t 分布、F 分布是不是统计量?它们在统计分析中各有何用处? 是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个不依赖于任何未知参数,则称函数为样本统计量。当获得样本的一组具体观测值的数值,就获得一个具体的统计量值。

从以上统计量的定义可以看出,当.

赖于任何未知参数时,则.

未知参数,则它们就不是统计量。

分布:分布可以用来构造f 分布与F 分布,并且在假设检验与列联分析中做检验统计量。

t 分布:一般当时,f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。

F 分布:在比较两个总体方差的假设检验时通常用F 分布,且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。

2. 抽样误差影响因素分析。

【答案】影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的 抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

3. 举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的

第 2 页,共 54 页 是一个统计量。通常,时,代入T ,计算分布、t 分布、F 分布是由样本构造的函数,而且不依分布、t 分布、F 分布中含有分布、t 分布、F 分布就是统计量;若

检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:

按照假设检验的步骤

按照假设检验的步骤:

设定假设:

(行变量与列变量独立)

(行变量与列变量不独立) (其中是行变量,是列变量)

选取统计量:

(其中,

第i 行第j 列类别的期望频数;并且

为列联表中第i 行第j 列类别的实际频数;

最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。

4. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。

(2)请说明如何对这100例身高数据进行描述性统计分析。

【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。

样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。

参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一

第 3 页,共 54 页 为列联表中

个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

5. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:

(1)值能告诉我们什么信息?

(2)当相应的值较小时为什么要拒绝原假设?

(3)显著性水平与值有何区别?

【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。

(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。

(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。

(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,

如果选择的值相同,

所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。

6. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间以及随机变量X 的定义和概率分布。

【答案】记赢钱数为为投掷后出现的两种结果,令其中

则的函数定义为:

则有

于是X 的概率分布为: 第 4 页,共 54 页