2017年北京理工大学管理科学与工程统计学复试实战预测五套卷
● 摘要
一、简答题
1. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?
【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。
2. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。
数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。
3. 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。
【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。
从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果
数取值;如果
即一般以为显著
,结果更倾向于接受假定的参数取值。
为非常显著,其含义是样本间的差异由抽样误差所致的概率
时小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。
样本间的差异比时更大,这种说法是错误的。
4. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量的数学期望等于未知参数
第 2 页,共 42 页 说明是较强的判定结果,拒绝假定的参说明说明是较弱的判定结果,拒绝假定的参数取值;如果即:
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。
(2)有效性
设(3)—致性(相合性) 如果依概率收敛于
则称
即有
是的一致估计量。
5. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?
【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为
由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性
犯取伪错误的可能性
一办法只有增大样本容量,这样既能保证满足取得较小的
6. 简述方差分析的基本原理。 又能取得较小的值。 势必增大
与且至少对于某一个都是的无偏估计量,若对于任意
上式中的不等号成立,则称较有效。 有也就是说,
的大小和显著性水平的大小成相反方向变化。解决的唯
【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。
二、计算题
7. 已知某种病菌在全人口的带菌率为
和在检测时,
带菌者呈阳性和阴性反应的概率分别为和随机地抽出一个人进行检
分别代表而不带菌者呈阳性和阴性反应的概率分别为测,求结果为阳性的概率;已知某人检测的结果为阳性,求这个人是带菌者的条件概率。 【答案】设事件分别代表“一个人带菌”,“一个人不带菌”,事件
“检测结果为阳性”,“检测结果为阴性”。
(1)根据全概率公式得
第 3 页,共 42 页
即随机地抽出一个人进行检测,结果为阳性的概率为
(2)根据条件概率公式
即已知某人检测结果为阳性,这个人是带菌者的条件概率是
8. 华兴镇2001年〜2004年鲜蛋季度销售量资料如表1所示。
表1 单位:万吨
要求:
(1)用移动平均法修匀数列;
(2)拟合线性趋势模型,测定时间数列的长期趋势并预测该镇2005年第一季度鲜蛋的销售量;
(3)试用按月平均法测定该数列的季节变动并分析说明其结果。
【答案】(1)为消除季节变动,
选取移动平均时距项数
果如表2所示。
表
2 对序列作四次移动平均,结
(2)利用给定的数据,由Excel 可得回归结果如下:
第 4 页,共 42 页
相关内容
相关标签