2017年华中师范大学心理学院347心理学专业综合[专业硕士]之现代心理与教育统计学考研导师圈点必考题汇编
● 摘要
一、概念题
1. 统计量
,统计学术语,指不含未知参数的样本的函数。设有一总体X
,【答案】统计量(statistic )
是取自x 的一个随机样本,
数,则称
统计量,是一个统计量。如,样本均值是不包含任何未知参数的函是一个也是一个统计量。在各种不同的统计分析或推断中,
,若数学期望y 未知,可并不直接使用随机样本,而是将随机样本“加工”为统计量。在解决不同问题时有不同的统计量,统计量是直接用来进行分析或推断的重要工具。如正态总体
用样本均值X 去估计;在两个总体的均值差异显著性检验时,要运用Z 统计量或t 统计量。
2. 随机变量
【答案】随机变量(random variable)是在样本空间的全部事件集上的一个实值函数。通常随机变量用大写字母x ,y , z 等表示,或者希腊字母,…等表示。分离散型随机变量和连续型随机变量两类。离散型随机变量是指所有可能的取值个数是有限的或至多可列的随机变量。如随机抽取任一学生观察其性别,其样本空间只有两个男性和女性样本点,
即
随机变量X 只取两个值:即当某学生
是男生时,x 取1; 当学生是女生时,x 取0。连续型随机变量是指可能在一个连续区间内或整个实数范围内取值的随机变量。如,在12岁的学生总体中,随机抽一个观测其身高y 。此随机试验的样本空间
机现象。
3. 概率
,概率论术语指,随机事件发生可能性大小度量指标。①概率描【答案】概率(probability )
述性定义。随机事件A 在所有试验中发生可能性大小的量值,称为事件A 的概率,记为P (A )。如将一枚均匀硬币上抛足够多次,会发现“正面朝上”的事件出现的频率在0.5上下波动。这种频率稳定性从实践上表明随机事件的概率是客观存在的。②概率的精确定义。设P 是定义在“事件域”上的一个集合函数,若满足下列条件,则称之为概率:
a.P
两互不相容对一
切,则是大于0的实数集。随机变量y 可在一个连续区间内取值。随机变量的引进使概率论能使用精密的数学工具(如微积分、代数、实变函数、测度论等)来处理和分析随
(性质(ⅲ)称为完全可加性)。若P 是概率,则不可能事件的概率为零,即对任意事件有应当注意,若P (A )=0, 并不能说A —
定是不可能事件,即不可能事件的概率一定是零,但概率为零的事件未必是不可能事件。这是由于P 是集合函数,可能在某些点集上(如有限个点)为零。同理,概率为1的事件,未必是必然事件。
4. 差异系数
【答案】差异系数(,又称变异系数、相对标准差等,它是一种相对差)
异量,用CV 来表示,为标准差与平均数的百分比。在对不同样本的观测结果的离散程度进行比较时,常常遇到下述情况:两个或多个样本所测的特质不同。如何比较其离散程度?即使使用的是同一种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?这时需要运用相对差异量进行比较。差异系数的计算公式是:(S 为某样本的标准差,M 为该样本的平均数)。差异系数在心理与教育研宄中常常应用于同一对象的不同领域或同一领域的不同对象。
5. 抽样误差
【答案】抽样误差指由抽样而造成的样本参数与总体参数之间差异或各样本参数之间差异。比如:样本平均数与总体平均数之间差异或各样本平均数之间差异。在抽样研究中,抽样误差是不可避免的,但可以估计其大小。
6. 次数
【答案】次数是指某一事件在某一类别中出现的数目,又称为频数(frequency ), 用f 表示。
二、简答题
7. 简述条图、直方图、圆形图(饼图)、线图以及散点图的用途。
【答案】这几种图是统计学中最常用的图形,条图和直方图都用于表示变量各取值结果的次数或相对次数,即次数分布图。不同的是前者用于离散或分类变量,后者用于连续变量(分组后)。圆形图用于表示离散变量的相对次数,即频率,整个圆面积为1,各扇形块表示各类别的频率。线图用于表示连续变量在某个分类变量各水平上的均值,如各年级的考试成绩均分,常用于组间比较中。散点图用于两连续变量的相关分析,可将两变量成对数据的值作为横、纵坐标标于图上,根据散点的形状可以大致判断两变量是否存在相关以及相关的程度。
8. 简述算术平均数的使用特点
【答案】算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。计算公式:式中N 为数据个数,为每一个数据,为相加求和。
(1)算术平均数的优点是:①反应灵敏;②严密确定。简明易懂,计算方便;③适合代数运算;④受抽样变动的影响较小。
(2)除此之外,算数平均数还有几个特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数。②用加权法可以求出几个平均数的总平均数。③用样本数据推断总体集中
量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
(3)算术平均数的缺点:①易受两极端数值(极大或极小)的影响。②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
9. 什么是二元线性标准回归方程?
【答案】二元线性回归方程是指y 对用公式表示
对与
位,所引起y 改变
个单位。
当两个自变量的单位不同,不能直接比较它们在估计y 时的贡献。若要进行这种比较,需要将原始数据分别转换成标准分数,以标准分数建立的回归方程就叫做标准回归方程。一般的形式为:标准分数的估计值,
10.直条图适合哪种资料? 自选数据绘制直条图。
【答案】直条图也称条形图,主要用于表示离散型数据资料,即计数资料。它是以条形的长短表示各事物间数量的大小与数量之间的差异情况。条形图中一个轴是分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据,在这个轴上数据单的大小取决于原始数据。
11.简述编制分组次数分布表的步骤。
【答案】(1)求全距。全距指最大数和最小数两个数据值之间的差距。从被分组的数据中找出最大数和最小数,二者相减所得差数就是全距。
(2)决定组距与组数。组距是指任意一组的起点和终点之间的距离,用符合i 表示。决定组距的大小需要以全距为参考。全距大,则组距可以大一些;全距小,则组距可以小一些。
组数的多少根据组距的多少来定。如果数据个数在100以上,习惯上一般分10〜20组,但经常取12〜16组。数据个数较少时,一般分为7〜9组。如果数据的总体分为正态,那么可以
,这样可使分组满足渐进最优关系。用下面的经验公式计算组数(K )
为数据个数,K 取近似整数)。
(3)列出分组区间。分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限有表述组限和精确组限两种。在列出分组区间时要注意:最高组区间应包含最大的数据,最小组应包含最小的数据;最大组或最小组最好是组距i 的倍数;各分组区间一般在纵坐标上按照顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面;等级次数时,要按照精确组限将数据归类划分到相应的组别中。
与的线性回归方程。 与的共同估计值,为常数项,与固定不变时,是y 每变化一个单式中; K 为个单位;表示当的偏回归系数。在二元线性标准回归中,表示当固定不变时,每变化一个单位时,所引起y 改变其中和表示因变量y 的标准分数的估计值。和分别表示以叫标准偏回归系数。 (N
相关内容
相关标签