当前位置：问答库＞考研试题

2017年长安大学统计学原理(同等学力加试)复试仿真模拟三套题

● 摘要

一、简答题

1．举例说明什么是列联表的独立性检验。

【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量，如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等，我们对其进行列联表的独立性检验。列联表的独立性检验是对一个分类变量的检验，因其分析过程可以通过列联表的方式呈现，故又可称为列联分析。

独立性检验就是分析列联表中行变量和列变量是否相互独立。

例如：为了研究年龄和喜欢的节目类型是否有关系，某单位对闲暇时间进行了全面调查，根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类：

按照假设检验的步骤

：

按照假设检验的步骤：

设定假设：

（行变量与列变量独立）

（行变量与列变量不独立）（其中是行变量，是列变量）

选取统计量：

（其中，

第i 行第j 列类别的期望频数；并且

为列联表中第i 行第j 列类别的实际频数；

最后带入数字，进行判断。看是否有行向量与列向量独立。若拒绝原假设，即行向量与列向量不独立，即年龄和喜欢的节目类型有关系。反之，年龄和喜欢的节目类型无关。

2．简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】（1）众数、中位数和平均数的关系

从分布的角度看，众数始终是一组数据分布的最高峰值，中位数是处于一组数据中间位置上

为列联表中

的值，而平均数则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言，众数、中位数和平均数之间具有以下关系：

①如果数据的分布是对称的，众数中位数和平均数必定相等，即

②如果数据是左偏分布，说明数据存在极小值，必然拉动平均数向极小值一方靠，而众数和中位数由于是位置代表值，不受极值的影响，因此三者之间的关系表现为：

③如果数据是右偏分布，说明数据存在极大值，必然拉动平均数向极大值一方靠，

则

（2）众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值，不受极端值的影响。其缺点是具有不唯一性，一组数据可能有一个众数，也可能有两个或多个众数，也可能没有众数。众数只有在数据量较多时才有意义，当数据量较少时，不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值，不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的，而且利用了全部数据信息，它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时，3个代表值相等或接近相等，这时则应选择平均数作为集中趋势的代表值。但平均数的主要缺点是易受数据极端值的影响，对于偏态分布的数据，平均数的代表性较差。因此，当数据为偏态分布，特别是当偏斜程度较大时，可以考虑选择众数或中位数。

3．说明条形图和直方图的区别和联系。

【答案】（1）条形图与直方图的区别

①形图是用条形的长度表示各类别频数的多少，其宽度则是固定的；直方图是用面积表示各组频数的多少，矩形的高度表示每一组的频数或频率，宽度则表示各组的组距，因此其高度与宽度均有意义。

②由于分组数据具有连续性，直方图的各矩形通常是连续排列，而条形图则是分开排列。 ③条形图主要用于展示分类数据，而直方图则主要用于展示数值型数据。

（2）联系

两者都是用矩形表示数据分布情况；当矩形的宽度相等时，都是用矩形的高度来表示数据的分布情况。

4．何谓统计量？

【答案】设

函数

又称出分布、t 分布、F 分布是不是统计量？它们在统计分析中各有何用处？是从总体X 中抽取的容量为n 的一个样本，如果由此样本构造一个不依赖于任何未知参数，则称函数为样本统计量。当获得样本的一组具体观测值是一个统计量。通常，时，代入T ，计算的数值，就获得一个具体的统计量值。

从以上统计量的定义可以看出，当. 分布、t 分布、F 分布是由样本构造的函数，而且不依

赖于任何未知参数时，则. 分布、t 分布、F 分布就是统计量；若分布、t 分布、F 分布中含有未知参数，则它们就不是统计量。

分布：分布可以用来构造f 分布与F 分布，并且在假设检验与列联分析中做检验统计量。

t 分布：一般当时，f 分布与标准正态分布就非常接近。分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。f 分布在假设检验与线性回归显著性检验中做检验统计量。

F 分布：在比较两个总体方差的假设检验时通常用F 分布，且F 分布在线性回归显著性检验与方差分析中做很重要的检验统计量。

5．何谓统计分组？统计分组有哪些作用？

【答案】根据统计研宄的目的和客观现象的内在特点，按某个标志（或几个标志）把被研宄的总体划分为若干个不同性质的组，称为统计分组。

统计分组的作用有：（1）发现社会经济现象的特点与规律；（2）将复杂的社会经济现象划分为性质不同的各种类型；（3）反映总体内部结构；（4）揭示现象之间的依存关系。

6．简述搜集数据的基本方法及其弱点。

【答案】搜集数据的基本方法：

（1）自填式。自填式方法的弱点：首先，问卷的返回率比较低。其次，自填式方法不适合结构复杂的问卷，对调查的内容有所局限。此外，自填式方法的调查周期通常都比较长，调查人员也需要对问卷的递送和回收方法进行仔细的研宄和选择。最后，对于在数据搜集过程中出现的问题，一般难以及时采取调改措施。

（2）面访式。面访式的弱点主要有：首先，调查的成本比较高。其次，面访这种搜集数据的方式对调查过程的质量控制有一定难度。此外，对于敏感性问题的调查，需要对调查员的访谈技巧进行技术培训。

（3）电话式。电话调查也有一定的局限。因为电话调查的工具是电话，如果被调查者没有电话，调查将无法实施。所以在电话拥有率不高的地区，电话调查这种方式就受到限制。另外，使用电话进行访问的时间不能太长，人们不愿意通过电话进行冗长的交谈，特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时，电话调查所使用的问卷要简单。最后，与面访式相比，电话调查由于不是面对面的交流，在被访者不愿意接受调查时，要说服他们就更为困难。

此外，搜集数据的方法还有观察式，即调查人员通过直接观测的方法获取信息。

二、计算题

7．某住宅调查居民用水情况，该区共有N=1000户，采用无放回抽样随机抽取了n=100户，测

得吨

，其中有40户用水超过了规定标准。要求计算（列出计算公式）：

（1）该住宅区的总用水量及95%的置信区间。

（2）若要求估计的相对误差不超过10%，应抽多少户作样本？

（3）以95%的可靠性估计用水超过标准的户数。

当前位置：问答库＞考研试题

相关题目: