2017年哈尔滨商业大学统计学(同等学力加试)复试实战预测五套卷
● 摘要
一、简答题
1. 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的 概率是不是0. 05X0. 05=0. 00257?为什么?
【答案】不是。
显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。
当两个事件相互独立时,
当两个事件不相互独立时,⑴ ⑵
记事件A 为小明是左撇子,事件B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左
撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。
2. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。
【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。
此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用
或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计
值。
3. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。
【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原
假设。P 值越小,我们拒绝原假设的 理由就越充分。
从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果
数取值;如果
即一般以为显著
,结果更倾向于接受假定的参数取值。
为非常显著,其含义是样本间的差异由抽样误差所致的概率
时小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。
样本间的差异比时更大,这种说法是错误的。
4. 构建综合评价指数时需要考虑哪些方面的问题?
【答案】构建综合评价指数需要考虑如下几个方面的问题:
(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。
(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的筛选,以提高指标的客观性。
(3)评价方法研宄,主要包括综合评价指数的构造方法、指标的赋权方法以及各种评价方法的比较等。
5. 说明计算说明是较强的判定结果,拒绝假定的参说明说明是较弱的判定结果,拒绝假定的参数取值;如果统计量的步骤。
统计量的步骤:
之差平方; 除以【答案】计算(2)将(1)用观察值减去期望值(3)将平方结果
(4)将步骤(3)的结果加总,即得:
6. 欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。
(1)用此例说明这几个统计概念,总体(population ), 样本(sample ), 参数(pammeter ), 统计量(statistics )。
(2)请说明如何对这100例身高数据进行描述性统计分析。
【答案】(1)总体(population )是包含所研宄的全部个体(数据)的集合,它通常由所研宄的一些个体组成。 本例中的总体是广州市所有初中学生。
样本(sample )是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。 本例中的样本是随机抽取的100名广州市初中学生,其中样本量为100。
参数(parameter )是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某
种特征值。本 例中广州市所有初中学生的平均身高即是一个参数。
统计量(statistic )是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于 抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。
(2)所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所 代表的总体的特征。主要包括集中趋势的描述,可计算身高的均值,中位数和众数,也可采用箱线图直观的反映 数据的集中趋势以及是否存在异常值;离散程度的描述,可计算身高的方差,变异系数,四分位差或极差,也可 采用折线图或散点图等直观反映数据的离散程度;分布的偏态与峰度描述,可计算偏度和峰度值,或采用茎叶图 或直方图直观的反映分布是否与正态分布或单峰偏态分布逼近。
二、计算题
7. 已知一组15名工人的资料,如表1所示。
表1 工人资料
要求:
(1)按照性别、文化程度和技术级别分别对数据进行分组。
(2)以组距为10岁、20岁以下、60岁以上各为一组,编制频数分布表。
【答案】(1)
表
2