2017年南京邮电大学经济学院432统计学[专业硕士]考研冲刺密押题
● 摘要
一、简答题
1. 简述非抽样误差类型。
【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:
(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。
(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。
(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。
(4)调查员误差,是指由于调查员的原因而产生的调查误差。
(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。
2. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间
【答案】记赢钱数为
则的函数定义为:
则有
于是X 的概率分布为:
以及随机变量X 的定义和概率分布。 其中 为投掷后出现的两种结果,令
3. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤:
(1)确定时间序列所包含的成分,也就是确定时间序列的类型;
(2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案;
(4)利用最佳预测方案进行预测。
4. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即
(2)回归平方和(^狀)是各回归值
来解释的变差部分。
(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即
称为误差平方和。
(4)三者之间的关系
5. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。
数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。
6. 简述假设检验的过程。
【答案】假设检验的过程如下:
(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与显著性水平比较,若则拒绝
7. 全概率公式与逆概率公式分别用于什么场合?
【答案】(1)全概率公式为: 接受
若则不拒绝 它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线
其中
,
是互不相容的事件且
如果对于某一复杂事件A 的概率,能够构造合适的完备事件组,使得这些事件的概率和给定这些事件下A 的条件概率较易于确定,就可以用全概率公式。
(2)逆概率公式也称贝叶斯公式,即
式中:表示完备事件组。
中每个事件的逆概率公式是要在事件A 已经发生的条件下来计算完备事件组
发生概率。
8. 简述时间序列的组成要素。
【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;
(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;
(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;
(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
9. 简述均值、众数和中位数三者之间的关系及其在实际中的应用。
【答案】(1)众数、中位数和平均数的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:
①如果数据的分布是对称的,众数中位数和平均数必定相等,即
②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:
③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,
则
(2)众数、中位数和平均数在实际中的应用
①众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。