2017年清华大学数学科学系432统计学[专业硕士]之统计学考研题库
● 摘要
一、计算题
1. 某艺术家拍卖会上油圆价格和油画年龄的关系。研宄收集25个样本,数据见表1。以油画价格为因变量,油画年龄为自变量建立一元线性回归模型,结果见表2。
表
1
表
2
就上述结果,试写一份报告,答释油画年龄如何影响油画价格。报告中至少涵盖以下内容: (1)油画年龄如何影响油画价格的线性模型是什么? (2)前述模型是否合理?
(3)按前述模型,哪些油画被低估了。:Excel 输出的回归结果,如表3、4和5所示。
表3回归结果
表4方差分析表
表5参数估=表
5
【答案】由表5可以得到,线性回归方程为:
回归系数
表示:油画年龄每增加1岁,油画价格平均增加17.3067132 (单位)
表明在油画价格的变差中被油画价格与油画年龄之间的线性关系所答释的
比例为 33.6144869%,回归方程的拟合程度比较差。
估计标准误差
表示,当用油画年龄来预测油画价格时,平均的预测误差为
298.1784807%,表明预测误差十分大,该一元线性回归模型不太合理。其中第16幅油画价格明显被估低,这是因为在表3中油 画年龄都是71的有两副油画,但是它们的价格明显不同。
由方差分析表可知,回归系数检验的
即回归方程的线性关系显著。
表明回归系数显著,即油画年龄是影响油画价格的显著性
因素。
2. 对一批产品(20000件)的质量进行抽样检验,随机抽出200件,发现6件不合格:
(1)以
的概率保证程度推断这批产品的合格率范围。
其它条件不变,则至少应抽
(2)若允许误差范围为2%,概率保证程度提高到取多少件产品进行检验?
【答案】(1)由于200/20000=1%, 故可作为重复抽样来进行计算。 由题意可知,合格产品的概率为的合格率范围是:
即
(2)允许误差为
若
则
则在
的概率保证程度下,这批产品
所以至少应抽取655件产品进行检验。
3. 某人乘公共汽车或地铁上班的概率分别为当他乘地铁时,有
【答案】设
在该天恰好乘地铁的概率是多少?
和当他乘公共汽车时,有的日子迟到:
的日子迟到。问此人上班迟到的概率是多少?若此人在某一天迟到,则他
依题意有:
此人上班迟到的概率为:
若此人在某一天迟到,则他在该天恰好乘地铁的概率为:
4. 一油漆制造商宣称,他们生产的一种新型乳胶漆的平均干燥时间为120分钟;为检验这一数值是否属实, 从该种乳胶漆中随机抽出20罐做试验,发现它们的干燥时间(分钟)为:123, 109, 115, 121,130, 127, 106, 120, 116, 136, 131, 128, 139, 110, 133, 122, 133, 119, 135, 109;
(1)假定干燥时间近似服从正态分布,在的显著性水平下,检验以上数据是否提供充分证据说明这种乳胶漆的平均干燥时间大于制造商宣称的120分钟,要求给出零假设、备择假设、检验统计量、检验结果。(经 计算可知,样本平均值为分布的
上侧分位数为
)
置信区间(要求给出枢轴量、置信区间的最后结果)
(2)给出平均干燥时间的
样本标准差为
自由度为19的t
(3)简述上述假设检验问题和置信区间问题的主要联系?
【答案】(1)由于干燥时间近似服从正态分布,总体方差未知,且样本量较小,所以采用t 统计量。
建立单侧假设检验:已知条件为:
因为显著性水平域,故不能拒绝
自由度为19的单侧临界值
而
样本统计量落在非拒绝
即还不能充分证明这种乳胶漆的平均干燥时间大于制造商宣称的120分钟。
(2)由于总体方差未知,且样本量较小,所以采用t 统计量。已知条件为
:
所以平均干燥时间的置信区间为:
即
即平均干燥时间的
的置信区间为
(3)假设检验问题和置信区间问题的主要联系如下:
第一,区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论