測驗 - 信度

信度

古典測驗理論 CTT

一、定義

古典測驗理論=真分數理論,以真分數與實得分數觀聯性為基礎

二、實得分數、真分數、誤差分數

  1. 實得分數(obtained score)X:測驗測出來的分數
  2. 真分數(true score)T:測無限次的平均數,也就是某人的真實力(真理)
  3. 誤差分數(error)e:實得分數和真分數的差質

X=T+e

三、古典測驗理論的假定

  1. 個別受試者的實得分數平均等於真實分數 x̅=T
  2. 誤差分數是隨機發生的
    1. 誤差總和為零 Σe=0
    2. 真分數與誤差分數的相關為零
  3. 若同一群人前後施測兩次
    1. 先後兩次施測之誤差分數相關為零
    2. 所有學生第一次施測的真分數與第二次施測的誤差分數相關為零

貳、信度的意義、估計方法及種類

一、信度的意義

(一)意義

測量可信賴的程度,其強度由測量結果的一致性或穩定性反映。

從古典測驗理論來看,信度是一份測驗排除誤差的能力,當測驗分數受誤差支配程度越小,信度越高

(二)信度的原理

→實得分數的變異數中,由真分數的變異數所佔的比例:

image

實務計算方式

由於真分數無法求得,因此用複本對同一批人前後施測兩次,並求相關→
image

因此,信度在理論上是

  1. 一群人在測驗中實得分數和真分數的相關係數平方

image

  1. 實得分數的變異數中,由真分數的變異數所佔的比例

image

在實務上,信度是…

  1. 一分測驗先後兩次實得分數的相關係數

image

信度=信度係數

信度開根號=信度係數

(三)信度的特性

  1. 心理教育領域的信度比自然科學低
  2. 信度不是一種普遍特質
  3. 信度需蒐集實徵資料計算得知
  4. 信度不是全有全無

(四)測量的誤差

  1. 非系統性誤差:隨機誤差 Se^2/Sx^2
  2. 系統性誤差:不影響信度,但影響效度

二、常模參照測驗的信度估計方法

(一)再測信度(重測信度 test-retest reliability)

  1. 意義:用同分測驗對一群有代表性的受試者先後兩次施測
  2. 誤差來源:若兩次分數相關不是1,就有誤差存在→時間抽樣誤差
  3. 實務現象
    1. 練習效果:第二次高於第一次
    2. 間隔越久,再測信度越低
    3. 若特質在短時間內起伏較大,不適合用再測信度(如認知&情意)
    4. 性向測驗需預測受試者未來表現,宜具備好的再測信度

(二)複本信度 alternate form reliability

  1. 意義:根據同一份設計明細表設計的題目,請同一群受試者做兩份測驗,求相關
  2. 兩種複本信度
    1. 同時複本信度
      1. 連續施測兩個複本
      2. =等值係數,r反映出兩不同複本相同的程度
    2. 延宕複本信度
      1. 間隔一段時間先後施測兩個複本
      2. =穩定與等值係數,在兩個時間的穩定程度
  3. 誤差來源
    1. 同時複本信度:內容抽樣誤差
    2. 延宕複本信度:內容抽樣誤差+時間抽樣誤差
  4. 實務現象
    1. 無法排除練習效果
    2. 耗費成本
    3. 延宕複本信度通常低於同時複本信度
    4. 延宕複本信度可檢查內容抽樣誤差和時間抽樣誤差的影響

(三)內部一致性信度 internal consistency reliability

只需施測一次

  1. 折半方法 split-half method
    1. 將測驗分兩半
    2. 誤差來自內容抽樣
    3. 需校正公式以還原權份測驗信度:斯皮爾曼-布朗公式,但兩半變異數需相等

image

4. 其他

Flanagan福樂藍根公式

Rulon 盧龍公式 

  1. Cronbach’α係數
    1. 誤差來源:內容抽樣、內容異質性
    2. 適用於二元計分
    3. 0~1之間
    4. 福樂藍根&盧龍折半信度平均數=Cronbach’α係數

image

  1. 庫李信度Kuder-Richardson reliability
    1. 誤差來源:內容抽樣、內容異質性
    2. 適用二元計分
    3. 庫李20號公式:
      image
    4. 庫李21號公式:

image

1 Like