2018年长江大学课程与教学论629心理学基础综合之现代心理与教育统计学考研核心题库
● 摘要
一、概念题
1. 检验的显著性水平
【答案】检验的显著性水平指在假设检验中,虚无假设正确时而拒绝虚无假设所犯错误的概率。在假设检验中有可能会犯错误,如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率用a 表示,a 就是假设检验中的显著性水平。通常选择α=0.05作为检验的显著性水平。也就是说每当实验结果发生的概率小于或等于0.05的时候,就拒绝虚无假设。
2. 频率
【答案】频率(frequency )①亦称“相对频数”。某随机事件A , 在N 次试验中出现的次数n 与试验总次数N 的比值。亦称事件A 发生的频率。记为其值介于0〜1之间。事件的频率越大,说明它出现的可能性越大;反之则越小。一个事件的频率不是一个固定的数值,与总次数N 有关,且即使再重复N 次试验,次数n 也可能不同。但在大量重复试验中频率具有稳定性,即当试验次数N 无限增大时,频率F 会在某个固定值上下波动,而且偏差越来越小。②简谐振动基本物理量。物体每秒振动的次数。单位是赫兹(Hz )。在数学关系上频率是物体振动周期的倒数。
3. 样本
【答案】样本(sample )亦称“子样”,统计学术语,指按一定规则从统计总体中抽取的若干个体的集合或对总体X 的n 次观测结果
独立样本。
4. 随机变量
【答案】随机变量(random variable)是在样本空间的全部事件集上的一个实值函数。通常随机变量用大写字母x ,y , z 等表示,或者希腊字母,…等表示。分离散型随机变量和连续型随机变量两类。离散型随机变量是指所有可能的取值个数是有限的或至多可列的随机变量。如随机抽取任一学生观察其性别,其样本空间只有两个男性和女性样本点,
即
随机变量X 只取两个值:即当某学生
是男生时,x 取1; 当学生是女生时,x 取0。连续型随机变量是指可能在一个连续区间内或整个实数范围内取值的随机变量。如,在12岁的学生总体中,随机抽一个观测其身高y 。此随机试验的
第 2 页,共 31 页 根据样本容量(通常以30为界线)的大小,可区分为大样本和小样本。根据两样本来自的两总体是相关还是独立,可分为相关样本和
样本空间
机现象。
是大于0的实数集。随机变量y 可在一个连续区间内取值。随机变量的引进使概率论能使用精密的数学工具(如微积分、代数、实变函数、测度论等)来处理和分析随
二、简答题
5. 如何区分点二列相关与二列相关?
【答案】(1)点二列相关法(point-biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个为“二分”称名变量(二分型数据)之间相关程度的统计方法。
二列相关法(biserail correlation)就是考察两列观测值一个为连续变量(点数据),另一个也是连续变量不过被按照某种标准人为的划分的二分变量之间相关程度的统计方法。
(2)点二列相关与二列相关的区别
二列相关不太常用,但有些数据只适用于这种方法。在测验中,二列相关常用于对项目区分度指标的确定。有时,某一题目实际获得的测验分数是连续性测量数据,这些分数的分布为正态,当人为地根据一定标准将其得分划分为对与错、通过与不通过两个类别时,计算该题目的区分度就要使用二列相关。如果题目的类型属于错与对这样的是非类客观选择题,计算该题目的区分度就应该选用点二列相关。二者之间的主要区别是二分变量是否为正态分布。总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这时,不管观测数据代表的是一个真正的二分变量,还是一个基于正态分布的人为二分变量,这时就用点二列相关。当确认数据分布形态为正态分布时,都应选用二列相关。只要有任何疑问,选用点二列相关总是较好的选择。在实际的研究当中,二列相关很少使用。
6. 估计总体平均数落入该区间的正确可能性概率为1-«,犯错误的可能性概率为«。1. 在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响,为什么?
【答案】(1)在进行差异的显著性检验时,首先需要考虑样本是否服从正态分布,如果服从正态分布,还需要考虑总体方差是否已知,然后看样本是否是独立样本。若将相关样本误作独立样本处理,则忽视了样本数据之间的一致性,导致错误地运用计算公式,差异的显著性也会受到误估,使本来可能有显著差异变成无显著差异。
(2)因为相关样本与独立样本不同,会运用不同的计算方法计算显著性。相关样本与独立样本是根据两个样本是否来自同一个总体来划分的。
①如果是独立样本,其和(或差)的方差等于各自方差的和,即
在进行差异的显著性检验中采用以下公式:
②相关样本之间存在着一一的对应关系。如果是相关样本前后两次结果则相互影响,而不
第 3 页,共 31 页
独立。当两个变量之间相关系数为r 时,两变量差的方差为:
在进行差异的显著性检验中采用以下公式:
由计算公式可以看出,独立样本和相关样本在进行差异的显著行检验时,使用了不同计算公式,相关样本的标准误可能会比独立样本的标准误小,使得计算出的Z 值大,从而更容易达到显著性水平,所以如果将相关样本误作独立样本处理,会使本来可能有显著差异变成无显著差异。
7. 简述最小二乘法。
【答案】最小二乘法是建立精确的回归方程经常采用的方法,其基本过程如下: 设
若
图像“很象”
一条直线(不是直线),我们的问题是确定一条直线使得它能“最好”地反映出这组数据的变化。对个别观察值来说,它可能是正的,也可能是负的。为了不使它们相加彼此抵消,故“最好”应该是
确的回归方程:
8. 简述点估计和区间估计。
【答案】参数估计分为点估计和区间估计。
(1)点估计指用样本统计量来估计总体参数的值,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。例如,对总体平均数的估计,用样本平均数一个好的估计量应该具备无偏性、有效性、一致性和充分性。由于估计量是一个随机变量,所以点估计以随机变量中的某一个值来作估计,很显然会产生一定的误差。若误差较小,这个点估计值还是一个好的估计值,若误差较大,这个点估计便失去了意义,而区间估计在一定意义上弥补了点估计的不足之处。
(2)区间估计指根据估计量以一定可靠程度推断总体参数所在的区间范围,是在点估计的基础上,用数轴上的一段距离表示未知参数可能落入的范围,不仅给出一个估计的范围,使总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。区间估
第 4 页,共 31 页 是直角平面坐标系下给出的一组数据, 我们也可以把这组数据看作是一个离散的函数。根据观察,如果这组数据最小,即这时误差的平方和最小,这时可以求得比较精