友情提示：如果本网页打开太慢或显示不完整，请尝试鼠标右键“刷新”本网页！阅读过程发现任何错误请告诉我们，谢谢！！报告错误

郑日昌心理测量学-第章

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

测量的标准误实际上是在一组测量分数中误差分布的标准差，可以象其它标准差一样地解释。因此，个人每次测量所得分数（X）有68％的可能性落在真分数（T）加减一个单位标准误（SE）的范围内，有95％的机会落在真分数加减1。96个标准误的范围内。图5—1表明实得分数在真实分数上的回归，以及距回归线一个标准误的平行线。

根据公式（5。6），知道了一组测量的标准差和信度系数就可以求出测量的标准误。进一步我们就可以从每个人的实得分数估计出真分数的可能范围，即确定出在不同或然率水准上真分数的置信区间。人们一般采用95％的或然率水准，其置信区间为：
（X…1。96SE）≤T≤（X＋1。96SE）　　　　　　　　　　　　　（5。7）
这就是说，大约有5％的可能性真正分数落在所得分数±1．96SE的范围内，或有5％的可能性落在这范围之外。这实际上也表明了再测时分数改变的可能范围。
例如：在一次测验中有些学生得80分，这是否反映了他们的真实水平？如果再测一次他们的分数将改变多少？已知该次测验的标准差为5，信度系数为0。84，将适当的数值代入公式5．6与5。7，并解之：
SE=5×　=2
T=80±1。96*2=80±3。92=76。08~83。92
我们可说这些学生的真正分数有95％的可能性落在76与84分之间。即若再测一次，他们的分数低于76、高于84的可能性不超过5％。
（二）两种测验分数的比较
来自不同测验的原始分数是无法直接比较的，只有参照同一个团体的平均分数，将它们转换成相同尺度的标准分数，才能进行比较。
譬如某班期末考试，张生语文数学的成绩转换成T分数（平均数为50、标准差为10）分别为65和70，由此我们可以知道张生的数学比语文考得稍好些，但二者差异是否有意义，仍不清楚。为了说明个人在两种测验上表现的优劣，我们可用“差异的标准误”来检验其差异的显著性，常用的公式如下：
SEd=　　　　　　　　　　　　　　　　　　　　　　　　（5．8）
式中SEd为差异的标准误，SE1、SE2分别是两组测验分数的标准误，用SE1=　和SE2=　代入公式5。8可得：
SEd=　　　　　　　　　　　　　　　　　　　　　　　　（5。9）
这里S表示相同尺度的标准分数之标准差，Txx表示第一种测验的信度系数，ryy表示第二种测验的信度系数。
在上例中，假定此次语文，数学考试的信度系数分别为0．84和0．91，张生的两个分数转化成T　分数后，其差异的标准误为：SEd=　5　
采取95％的置信区间（即．05显著水平），，则张生在这两门课上了分数的差异必须达到或超过1。96SEd=1。96×5=9。8，始能认为二者真有差异。因为数学的T分数只比语文高5分，所以差异并不显著。
用SE估计个人分数的误差要注意三点：1）一个测验有很多可能的信度估计，因而也有同样多的标准误估计，为此，我们要选择最适合某一特殊情况的信度估计来解决问题。例如倘若我们对半年内的分数稳定性感兴趣；我们就以六个月为时距施测两次的相关系数作为信度估计，依据此信度系数求出标准误，再用来估计在六个月内分数可能改变多少。2）这个估计假定SE在所有分数水平都一样，但有时高分段与低分段其标准误并不相同。上面所计算的SE实际是整个分数范围的平均测量误差指标。如果分数的分布近似正态，而且实得的分数不超过可能的全距，则测量的标准误差在所有分数水平上近似一致。3）测验上所得分数是一个人真正分数的最佳现成估计，但是，由于存在测量误差，所以它并不是个确切的指标。所得分数对真分数估计得如何精确，可以由SE的大小或间接地由测验的信度显示出来。因为在一般情况下，rxx0，所以我们必须将测验分数看成范围或带状，而不要看成确切的点。这条带子有多宽将取决于测量标准误的大小，最终取决于信度系数。rxx越小，SE越大，这个范围便越广。若经常将分数想成是一个范围，我们在比较不同被试的分数，或同一个被试在不同测验上的分数时，就可以克服对分数间的微小判别作出过分解释的习惯。4）测量标准误是对测量误差的描绘，用它能对个人真正分数的置信区间作出估计，但用它来估计个人真正能力则可能导致严重错误，因为它没有考虑到系统误差的影响，真分数与真正能力是两个不同的概念。　

未阅读完？加入书签已便下次继续阅读！

温馨提示：温看小说的同时发表评论，说出自己的看法和其它小伙伴们分享也不错哦！发表书评还可以获得积分和经验奖励，认真写原创书评被采纳为精评可以获得大量金币、积分和经验奖励哦！