2018年第四军医大学医学心理系312心理学专业基础综合之现代心理与教育统计学考研核心题库
● 摘要
一、概念题
1. 四分差
【答案】四分差又称四分位差,是差异量数的一种。计算公式:
位数,第三个四分第一个四分位数。在次数分配上第一个四分位数与第三个四分位数之间包含着全体项数的一半。次数分配越集中,离中趋势越小,则这二者的距离也越小。根据这两个四分位数的关系,观测次数分配的离散程度也可以得到相当高的准确性。因此,四分差可以说明某系列数据中间部分的离散程度,并可避免两极端值的影响。四分差通常与中数联系起来共同应用,不适合进一步代数运算,反应不够灵敏。
2. 标准分数
【答案】标准分数指以标准差为单位的一种差异量数,又称Z 分数或基分数。它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:
数据的标准分数
,为原始数据的值,式中,Z 为某原始为该组数据的平均数,为该组数据的标准差。标准分数的平均数为0,标准差为1。标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。其作用除了能够表明原数据在其分布中的位置外,还能对未来不能直接比较的各种不同单位的数据进行比较。如比较各个学生的成绩在班级成绩中的位置或比较某个学生在两种或多种测验中所得分数的优劣。
3. 非参数检验
【答案】非参数检验指对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验。常见的非参数检验有符号检验、秩和检验、中数检验等。其优点:(1)不需要对被检验的总体作出关于正态性或其他特定分布的假定;(2)容易理解、容易操作、应用范围广。缺点是功效较低,因为它常会丢失数据中的信息。经常属于大样本检验。
4. 个体
【答案】个体(individual )亦称“单位”、“样品”,统计学术语指总体中的每一个单位、样品或成员。是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。在心理学研宄中,个体根据研宄目的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。
二、简答题
5. 简述卡方配合度检验和卡方独立性检验的区别。
【答案】卡方配合度检验主要用于检验单个名义型变量多个分类上的实计数和某个理论次数分布(如均匀分布)之间的差异显著性,因此可以将之理解成多组之间次数比较的方法;卡方独立性检验主要用于检验两个名义型变量各项分类上的次数之间是否存在显著关联,是考察名义型变量间相关性的方法。
6. 应用算术平均数表示集中趋势要注意什么问题?
【答案】在应用算术平均数表示几种趋势时,要注意:①算术平均数易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。如果不处理好这两个问题,那么算术平均数将无法表示集中趋势。
7. 最小二乘法中各点到拟合直线的距离为什么要取铅直距离而不取垂直距离?
【答案】这是有最小二乘法的推导过程所决定的。 设
们也可以
把这组数据看作是一个离散的函数。根据观察,如果这组数据图像“很像”一条直线(不是直线),
我们的问题是确定一条直线
该是
程:
8. 线性回归的基本假设是什么?
【答案】(1)线性关系假设
X 与Y 在总体上具有线性关系,这是一条最基本的假设。回归分析必须建立在变量之间具有线性关系的假设成立上。如果X 与Y 的真正关系不是线性,而回归方程又是按线性关系建立的,这个回归方程就没有什么意义了。非线性的变量关系,需使用非线性模型。
(2)正态性假设
正态性的假设系指回归分析中的Y 服从正态分布。这样,与某一个
量Y 的一个子总体,所有这样的子总体都服从正态分布,其平均数记作各个子总体的方差都相等。因此经由回归方程式所分离的误差项e ,即由特定与实际值对应的Y 值构成变方差记作所预测得到的 由于是散点之间连线的最小距离,因此这个距离不是到拟合直线的垂直距离。 ,使得它能“最好”的反映出这组数据的变化。对个别观察值来说,它可能是正的,也可能是负的。为了不使它们相加彼此抵消,故“最好”应
最小,即这时误差的平方和最小,这时可以求得比较精确的回归方是直角平面坐标系下给出的一组数据,若我之间的差距,也应呈正态分布。误差项e 的平均数为0。所以,也有人指出线性回归中应满足变量X 没有测量误差这一严格假设,但在实际中很难满足,常常只是对X 的测量误差忽略不计。
(3)独立性假设
①指与某一个X 值对应的一组F 值和与另一个X 值对应的一组7值之间没有关系,彼此独立。
②指误差项独立,不同的X 所产生的误差之间应相互独立,无自相关
误差项也需与自变量X 相互独立。
(4)误差等分散性假设
特定X 水平的误差,除了应呈随机化的常态分配,其变异量也应相等,称为误差等分散性。不相等的误差变异量(即误差变异歧异性,),反应出不同水平的X 与Y 的关系不同,不应以单一的回归方程式去预测Y 。当研究资料具有极端值存在时,或非线性关系存
在时,误差变异歧异性的问题就容易出现。违反假设时,对于参数的估计检验力就会变得不足。
而
三、计算题
9. 一张考卷中有15道多重选择题,每题有4个可能的回答,其中至少有一个是正确答案。一考生随机回答,(1)求答对5至10题的概率,(2)答对的平均题数是多少?
【答案】有4个选项的多项选择题,回答正确的概率为:
(1)答对5至10题的概率
(2)由于这个二项分布不近似于正态分布因此无法求答对的平均题数。
所以,答对5至10题的概率是0.002, 无法确定答对题数的平均数。
10.总体平均数估计的具体方法有哪些?
【答案】总体平均数估计的具体方法有两种
(1)总体方差已知时,对总体平均数的估计
都是,这时样本的方差在计
一般情况下显著性水平a 确定为.05①当总体分布为正态时,不论样本n 的大小,其标准误算中没有用处。依据上面所讲的步骤,查正态表,确定
或0.01。
②当总体为非正态分布时,只有当样本容量n>30以上,才能根据样本分布对总体平均数进行估计,否则不能进行估计。
根据同一总体的两个不同的样本进行估计,样本大时估计的区间小,其样本平均值也更接近总体平均值。因此遇到有多个样本的情况时,一般取样本大的均值与标准误对总体进行估计。即在条件允许的情况下,应用大样本进行观测,对总体参数进行估计更具优越性。
(2)总体方差未知,对总体平均数的估计
n=15, p=0.067,np=l所以这个二项分布不近似正态分布,只能根据二项分布求解。