按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
测量的标准误实际上是在一组测量分数中误差分布的标准差,可以象其它标准差一样地解释。因此,个人每次测量所得分数(X)有68%的可能性落在真分数(T)加减一个单位标准误(SE)的范围内,有95%的机会落在真分数加减1。96个标准误的范围内。图5—1表明实得分数在真实分数上的回归,以及距回归线一个标准误的平行线。
根据公式(5。6),知道了一组测量的标准差和信度系数就可以求出测量的标准误。进一步我们就可以从每个人的实得分数估计出真分数的可能范围,即确定出在不同或然率水准上真分数的置信区间。人们一般采用95%的或然率水准,其置信区间为:
(X…1。96SE)≤T≤(X+1。96SE) (5。7)
这就是说,大约有5%的可能性真正分数落在所得分数±1.96SE的范围内,或有5%的可能性落在这范围之外。这实际上也表明了再测时分数改变的可能范围。
例如:在一次测验中有些学生得80分,这是否反映了他们的真实水平?如果再测一次他们的分数将改变多少?已知该次测验的标准差为5,信度系数为0。84,将适当的数值代入公式5.6与5。7,并解之:
SE=5× =2
T=80±1。96*2=80±3。92=76。08~83。92
我们可说这些学生的真正分数有95%的可能性落在76与84分之间。即若再测一次,他们的分数低于76、高于84的可能性不超过5%。
(二)两种测验分数的比较
来自不同测验的原始分数是无法直接比较的,只有参照同一个团体的平均分数,将它们转换成相同尺度的标准分数,才能进行比较。
譬如某班期末考试,张生语文数学的成绩转换成T分数(平均数为50、标准差为10)分别为65和70,由此我们可以知道张生的数学比语文考得稍好些,但二者差异是否有意义,仍不清楚。为了说明个人在两种测验上表现的优劣,我们可用“差异的标准误”来检验其差异的显著性,常用的公式如下:
SEd= (5.8)
式中SEd为差异的标准误,SE1、SE2分别是两组测验分数的标准误,用SE1= 和SE2= 代入公式5。8可得:
SEd= (5。9)
这里S表示相同尺度的标准分数之标准差,Txx表示第一种测验的信度系数,ryy表示第二种测验的信度系数。
在上例中,假定此次语文,数学考试的信度系数分别为0.84和0.91,张生的两个分数转化成T 分数后,其差异的标准误为:SEd= 5
采取95%的置信区间(即.05显著水平),,则张生在这两门课上了分数的差异必须达到或超过1。96SEd=1。96×5=9。8,始能认为二者真有差异。因为数学的T分数只比语文高5分,所以差异并不显著。
用SE估计个人分数的误差要注意三点:1)一个测验有很多可能的信度估计,因而也有同样多的标准误估计,为此,我们要选择最适合某一特殊情况的信度估计来解决问题。例如倘若我们对半年内的分数稳定性感兴趣;我们就以六个月为时距施测两次的相关系数作为信度估计,依据此信度系数求出标准误,再用来估计在六个月内分数可能改变多少。2)这个估计假定SE在所有分数水平都一样,但有时高分段与低分段其标准误并不相同。上面所计算的SE实际是整个分数范围的平均测量误差指标。如果分数的分布近似正态,而且实得的分数不超过可能的全距,则测量的标准误差在所有分数水平上近似一致。3)测验上所得分数是一个人真正分数的最佳现成估计,但是,由于存在测量误差,所以它并不是个确切的指标。所得分数对真分数估计得如何精确,可以由SE的大小或间接地由测验的信度显示出来。因为在一般情况下,rxx0,所以我们必须将测验分数看成范围或带状,而不要看成确切的点。这条带子有多宽将取决于测量标准误的大小,最终取决于信度系数。rxx越小,SE越大,这个范围便越广。若经常将分数想成是一个范围,我们在比较不同被试的分数,或同一个被试在不同测验上的分数时,就可以克服对分数间的微小判别作出过分解释的习惯。4)测量标准误是对测量误差的描绘,用它能对个人真正分数的置信区间作出估计,但用它来估计个人真正能力则可能导致严重错误,因为它没有考虑到系统误差的影响,真分数与真正能力是两个不同的概念。