当前位置：问答库＞考研试题

2018年中国人民大学统计学院432统计学[专业学位]之统计学考研基础五套测试题

● 摘要

2018年中国人民大学统计学院432统计学[专业学位]之统计学考研基础五套测试题（一） .... 2

2018年中国人民大学统计学院432统计学[专业学位]之统计学考研基础五套测试题（二） .. 14

2018年中国人民大学统计学院432统计学[专业学位]之统计学考研基础五套测试题（三） .. 26

2018年中国人民大学统计学院432统计学[专业学位]之统计学考研基础五套测试题（四） .. 38

2018年中国人民大学统计学院432统计学[专业学位]之统计学考研基础五套测试题（五） .. 50

一、简答题

1．简述统计分组的原则。

【答案】采用组距分组时，需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组，不能在其他组中重复出现；不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组，不能遗漏。

为解决不重的问题，统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时，恰好等于某一组上限的变量值不算在本组内，而计算在下一组内。而对于连续变量，可以采取相邻两组组限重叠的方法，根据“上组限不在内”的规定解决不重的问题，也可以对一个组的上限值采用小数点的形式，小数点的位数根据所要求的精度具体确定。

2．简述古典概率法和经验概率法如何定义事件发生的概率。

【答案】概率的古典定义是，如果某一随机试验的结果有限，而且各个结果出现的可能性相等，则某一事件A 发生的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件数n 的比值，记为：

经验概率又称主观概率，是指对一些无法重复的试验，只能根据以往的经验，人为确定这个事件的概率。

3．构造下列维数的列联表，并给出检验的自由度。

a.2行5列 b.4行6列 c.3行4列

【答案】i 行j 列联表，如表所示。

而检验的自由度=（行数_1）（列数一 1），所以

a. 当

b. 当

c. 当时，表9-8即为2行5列的列联表，其时，表9-8即为4行6列的列联表，其时，表9-8即为3行4列的列联表，其检验的自由度=检验的自由度=检验的自由度=

4．在假设检验中，犯两类错误之间存在什么样的数理关系？是否有什么办法使得两类错误同时减少？

【答案】第一类错误是指原假设为真，拒绝原假设，又称弃真错误，犯这类错误的概率记为第二类错误是指原假设为假，接受原假设，又称取伪错误，犯这类错误的概率记为

由于两类错误是矛盾的，在其他条件不变的情况下，减少犯弃真错误的可能性

犯取伪错误的可能性势必增大也就是说

，

的大小和显著性水平的大小成相反方向变化。解决的唯一办法只有增大样本容量，这样既能保证满足取得较小的又能取得较小的值。

5．考虑总体参数的估计量，简述无偏估计量与最小方差无偏估计量的定义。

【答案】①无偏性（unbiasedness ）是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数，不同的样本值就会得到不同的估计值。这样，要确定一个估计量的好坏，就不能仅仅依据某次抽样的结果来衡量，而必须由大量抽样的结果来衡量。对此，一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值，但在大量重复抽样时，所得到的估计值平均起来应与待估参数的真值相同，即希望估计量的均值应等于未知参数的真值，这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量，即在均方误差

是的一个无偏估计量，都有

则称是的一致最小方差无偏估计。

6．在多元线性回归中，为什么我们对整个回归方程进行检验后，还要对每个回归系数来进行检验呢？

【答案】在多元线性回归中，线性关系检验主要是检验因变量同多个自变量的线性关系是否显著，在个自变量中，只要有一个自变量与因变量的线性关系显著，F 检验就能通过，但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验，它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验，就意味着这个自变量对因变量的影响不显著，也许就没有必要将这个自变量放进回归模型中了。

最小意义下的最优估计，它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量

7．何谓统计分组？统计分组有哪些作用？

【答案】根据统计研宄的目的和客观现象的内在特点，按某个标志（或几个标志）把被研宄的总体划分为若干个不同性质的组，称为统计分组。

统计分组的作用有：（1）发现社会经济现象的特点与规律；（2）将复杂的社会经济现象划分为性质不同的各种类型；（3）反映总体内部结构；（4）揭示现象之间的依存关系。

8．什么是置信区间估计和预测区间估计？二者有何区别？

【答案】（1）置信区间估计，它是对x 的一个给定值_求出y 的平均值的估计区间，这一区间称为置信区间；预测区间估计，它是对x 的一个给定值求出y 的一个个别值的估计区间，这一区间称为预测区间。

（2）置信区间估计和预测区间估计的区别：置信区间估计是求y 的平均值的估计区间，而预测区间估计是求y 的一个个别值的估计区间；对同一个这两个区间的宽度也是不一样的，预测区间要比置信区间宽一些。

9．欲调查广州市初中学生的身高情况，随机抽取100名广州市初中学生，测量了身高。

（1）用此例说明这几个统计概念，总体（population ）, 样本（sample ）, 参数（pammeter ）, 统计量（statistics ）。

（2）请说明如何对这100例身高数据进行描述性统计分析。

【答案】（1）总体（population ）是包含所研宄的全部个体（数据）的集合，它通常由所研宄的一些个体组成。本例中的总体是广州市所有初中学生。

样本（sample ）是从总体中抽取的一部分元素的集合，构成样本的元素的数目称为样本量（sample size）。本例中的样本是随机抽取的100名广州市初中学生，其中样本量为100。

参数（parameter ）是用来描述总体特征的概括性数字度量，它是研究者想要了解的总体的某种特征值。本例中广州市所有初中学生的平均身高即是一个参数。

统计量（statistic ）是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量，由于抽样是随机的，因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

（2）所谓描述性统计分析，就是对一组数据的各种特征进行分析，以便于描述测量样本的各种特征及其所代表的总体的特征。主要包括集中趋势的描述，可计算身高的均值，中位数和众数，也可采用箱线图直观的反映数据的集中趋势以及是否存在异常值；离散程度的描述，可计算身高的方差，变异系数，四分位差或极差，也可采用折线图或散点图等直观反映数据的离散程度；分布的偏态与峰度描述，可计算偏度和峰度值，或采用茎叶图或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。

当前位置：问答库＞考研试题

相关题目: