2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库
● 摘要
目录
2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库(一) .... 2
2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库(二) .. 12
2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库(三) .. 22
2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库(四) .. 33
2017年西安电子科技大学数学与统计学院432统计学[专业硕士]之统计学考研题库(五) .. 43
第 1 页,共 52 页
一、简答题
1. 简述平稳序列和非平稳序列的含义。
【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。
(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
2. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。
【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知参数的真值,这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量,即在均方误差
是的一个无偏估计量,都有
则称是的一致最小方差无偏估计。
3. 举例说明什么是列联表的独立性检验。
【答案】变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研宄。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联 表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
第 2 页,共 52 页 最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量
按照假设检验的步骤
:
按照假设检验的步骤:
设定假设:
(行变量与列变量独立)
(行变量与列变量不独立) (其中是行变量,是列变量)
选取统计量:
(其中,
第i 行第j 列类别的期望频数;并且
为列联表中第i 行第j 列类别的实际频数;
最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。
4. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高
第 3 页,共 52 页 为列联表中
的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
5. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间
【答案】记赢钱数为
则的函数定义为:
则有
于是X 的概率分布为:
以及随机变量X 的定义和概率分布。 其中 为投掷后出现的两种结果,令
6. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?
【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模
型对样本观测值的拟合优度。这是由于多重判定系数
随着样本解释变量个数的增加
来越高(即的值越
是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新
不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,
调整。而修正判定系数
归模型方面要优于多重判定系数修正判定系数的计算公式为
7. 简述非抽样误差类型。
【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:
(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。
(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原
第 4 页,共 52 页 其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回
相关内容
相关标签