2018年西安财经学院统计学院801统计学综合之统计学考研核心题库
● 摘要
一、简答题
1. 方差分析中的基本假定。
【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差立的。
2. 说明条形图和直方图的区别和联系。
【答案】(1)条形图与直方图的区别
①形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少, 矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
②由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 ③条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
(2)联系
两者都是用矩形表示数据分布情况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。
3. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一
必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独
个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
4. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。
数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。
5. 简述时间序列的组成要素。
【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;
(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;
(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;
(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
二、计算题
6. 下面是A 、B 两个班学生的数学考试成绩数据:
A 班: B 班:
(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点。 (2)两个班考试成绩的描述统计量如表1所示。试进行比较分析。
表1
(3)要判断考试成绩是否有离群点,可使用哪些方法?
(4)要判断考试成绩是否服从正态分布,可使用哪些描述性方法?
【答案】(1)构建两个班考试成绩的茎叶图,如图1所示。
图1两个班考试成绩的茎叶图
从茎叶图可以看出,A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散, 且平均成绩较A 班低。
(2)从平均数、众数与中位数可以看出A 班成绩明显好于B 班;A 班成绩的方差小于B 班,说明A 班成 绩相对于B 班比较集中;两个班成绩的偏斜度较低,成绩分布比较对称;从极差可以看出B 班的成绩差异大于A 班。
(3)A 班学生的数学成绩全部在个标准差之内,即所以A 班
个标准差之内,
即学生的成 绩中没有离群点。B 班学生的数学成绩全部
在
所以B 班学生的成绩中没有离群点。
(4)由于A 班的偏度系数峰度系数说明A 班学生成绩的分布为右偏
峰度系数说明B 班学分布,且与正态分布相比略有一些扁平。B 班的偏度系数生成绩的分布也为右偏分布,且与正态分布相比略有一些扁平。