2018年华中科技大学教育科学研究院312心理学专业基础综合之现代心理与教育统计学考研强化五套模拟题
● 摘要
一、概念题
1. 假设检验
【答案】在统计学中,通过样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称假设检验。假设检验是推论统计中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。检验的推理逻辑是一定概率保证下的反证法。一般包括四个步骤:(1)根
据问题要求提出原假设 (2)寻找检验统计量,用于提取样本中的用于推断的信息,要求在Ho 成立的条件下,统计量的分布已知且不包含任何未知参数;(3)由统计量的分布,计算“概率值”或确定拒绝域与接受域;(4)由具体样本值计算统计量的观测值,对统计假设作出判断。若Ho 的内容涉及到总体参数,称为参数假设检验,否则为非参数检验。
2. 标准分数
【答案】标准分数指以标准差为单位的一种差异量数,又称Z 分数或基分数。它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:
数据的标准分数
,为原始数据的值,式中,Z 为某原始为该组数据的平均数,为该组数据的标准差。标准分数的平均数为0,标准差为1。标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。其作用除了能够表明原数据在其分布中的位置外,还能对未来不能直接比较的各种不同单位的数据进行比较。如比较各个学生的成绩在班级成绩中的位置或比较某个学生在两种或多种测验中所得分数的优劣。
3. 参数检验(parametric test)
【答案】参数检验是统计假设检验的一种。与“非参数检验”相对。适用于总体分布形式已知。且仅由少数几个参数便可确定的条件下。其检验方法常是基于正态性的假定,如t 检验、F 检验、正态线性回归、狭义多元分析等。其主要缺点在于,因其受到严格的关于正态性的条件限制,而大大制约了这类检验的应用或可信度的保证。
4. 统计量
【答案】统计量(statistic ),统计学术语,指不含未知参数的样本的函数。设有一总体X
,
是取自x 的一个随机样本,
数,则称是一个统计量。如,样本均值
第 2 页,共 36 页 是不包含任何未知参数的函是一个
统计量,也是一个统计量。在各种不同的统计分析或推断中,
,若数学期望y 未知,可并不直接使用随机样本,而是将随机样本“加工”为统计量。在解决不同问题时有不同的统计量,统计量是直接用来进行分析或推断的重要工具。如正态总体
用样本均值X 去估计;在两个总体的均值差异显著性检验时,要运用Z 统计量或t 统计量。
二、简答题
5. 线性回归的基本假设是什么?
【答案】(1)线性关系假设
X 与Y 在总体上具有线性关系,这是一条最基本的假设。回归分析必须建立在变量之间具有线性关系的假设成立上。如果X 与Y 的真正关系不是线性,而回归方程又是按线性关系建立的,这个回归方程就没有什么意义了。非线性的变量关系,需使用非线性模型。
(2)正态性假设
正态性的假设系指回归分析中的Y 服从正态分布。这样,与某一个
量Y 的一个子总体,所有这样的子总体都服从正态分布,其平均数记作各个子总体的方差都相等。因此经由回归方程式所分离的误差项e ,即由特定与实际值对应的Y 值构成变方差记作所预测得到的之间的差距,也应呈正态分布。误差项e 的平均数为0。所以,也有人指出线性回归中应满足变量X 没有测量误差这一严格假设,但在实际中很难满足,常常只是对X 的测量误差忽略不计。
(3)独立性假设
①指与某一个X 值对应的一组F 值和与另一个X 值对应的一组7值之间没有关系,彼此独立。
②指误差项独立,不同的X 所产生的误差之间应相互独立,无自相关
误差项也需与自变量X 相互独立。
(4)误差等分散性假设
特定X 水平的误差,除了应呈随机化的常态分配,其变异量也应相等,称为误差等分散性。不相等的误差变异量(即误差变异歧异性,),反应出不同水平的X 与Y 的关系不同,不应以单一的回归方程式去预测Y 。当研究资料具有极端值存在时,或非线性关系存
在时,误差变异歧异性的问题就容易出现。违反假设时,对于参数的估计检验力就会变得不足。
6. 如果你不知道两个变量概念之间的关系,只知道从两个变量的相关系数很高,请问你可能做出什么样的解释?
【答案】(1)两个变量之间的相关系数很高说明两变量存在共变关系,还不能判断两个变量之间的具体关系。
(2)根据相关系数的性质,系数值的大小只是表示变量变化趋势(0 第 3 页,共 36 页 而 向,比如:人的身高和体重就常常是一个变化方向,即身高增加,体重也增加;如果相关系数为负值,则说明两个变量变化方向相反,值的大小说明程度。比如:某研究中胆固醇水平与青少年青春期身高増长负相关,即胆固醇水平高的同时,青少年青春期身高增长反而在减慢。 (3)两个变量之间的相关性只是显示出变量的变化趋势,并不能显示出两个变量的因果关系。如果相关系数很高,还需要考察是正相关还是负相关,这样来说明两个变量究竟是向同一个方向还是相反方向变化。 7. 某厂要进行压力的性别差异的研究,但由于工厂不大就把男女员工的数据都收集来了,那么应该用什么方法看性别间有否差异呢? 【答案】可以用独立样本t 检验进行性别间差异检验。 首先可以从样本的抽样方面考虑这个工厂在数据采集上的科学性。 抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称登记误差或调查误差),一种是代表性误差(也称抽样误差)。另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。但是抽样调查得遵循一定的原则: (1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。 (2)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。而且抽样过程中样本要能代表总体,不能随便挑选。 因此,这个工厂在进行性别差异的研究中,没有考虑抽样的科学性原则。这样得出的结果只能代表这个工厂的情况,而缺乏推论价值。 8. 何谓次数、频率及概率? 【答案】(1)次数是指某一事件在某一类别中出现的数目,又称为频数(frequency ),用f 表示。 (2)频率,又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通常用比例(proportion )或百分数(percent )表示。 (3)概率又称机率、或然率(probability ),用符号P 表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率。概率通常用比例表示。 三、计算题 第 4 页,共 36 页
相关内容
相关标签