Mantel-Haenszel DIF 程序之第一類型錯誤率和DIF嚴重度分類結果研究

Research output: Contribution to journalArticle

Abstract

本研究調查Mantel-Haenszel (MH) DIF 程序在數種模擬情境中之實徵第一類型錯誤率和其在ETS DlF分類系統中各類DIF 的分類結果。本研究以Monte Carlo法進行,操弄的因子包括:參照組和焦點組受試者的樣本數(2個水準)、兩組受試者能力的分配(3個水準)、測驗長度(3個水準)、受評試圖的鑑別度(6個水準)和難度(5個水準),採交叉設計,共模擬了540種情況,每種情況各重覆100次,所有試題均模擬為無DIF試題。本研究主要發現卸下:在大多數的模擬情況下,MH DIF程序第一類型錯誤率的控制力令人滿意,惟在兩組受試者能力分配有明攝差異且測驗信度偏低的情況下,鑑別度較極端的試題產主之實徵第一類型錯誤率有偏高的傾向,又以高鑑別力試題特別嚴重,這種現象在受試樣本人數多的情形下尤其明顯。就ETS DIF嚴重度分類結果而言,MH 的表現大致上令人滿意,在本研究模擬的各情況中,B和C類DIF的出現率低於5%。最後,研究者根據研究結果提出建議供實務工作者在解釋和運用MH DIF 分析結果時的參考。
Original languageChinese
Pages (from-to)57-71
Number of pages15
Journal測驗學刊
Volume47
Issue number1
Publication statusPublished - 2000

Cite this

Mantel-Haenszel DIF 程序之第一類型錯誤率和DIF嚴重度分類結果研究. / 盧雪梅(Sheue-Mei Lu).

In: 測驗學刊, Vol. 47, No. 1, 2000, p. 57-71.

Research output: Contribution to journalArticle

@article{1f7d3daea0de41bda85fb333934bcbbd,
title = "Mantel-Haenszel DIF 程序之第一類型錯誤率和DIF嚴重度分類結果研究",
abstract = "本研究調查Mantel-Haenszel (MH) DIF 程序在數種模擬情境中之實徵第一類型錯誤率和其在ETS DlF分類系統中各類DIF 的分類結果。本研究以Monte Carlo法進行,操弄的因子包括:參照組和焦點組受試者的樣本數(2個水準)、兩組受試者能力的分配(3個水準)、測驗長度(3個水準)、受評試圖的鑑別度(6個水準)和難度(5個水準),採交叉設計,共模擬了540種情況,每種情況各重覆100次,所有試題均模擬為無DIF試題。本研究主要發現卸下:在大多數的模擬情況下,MH DIF程序第一類型錯誤率的控制力令人滿意,惟在兩組受試者能力分配有明攝差異且測驗信度偏低的情況下,鑑別度較極端的試題產主之實徵第一類型錯誤率有偏高的傾向,又以高鑑別力試題特別嚴重,這種現象在受試樣本人數多的情形下尤其明顯。就ETS DIF嚴重度分類結果而言,MH 的表現大致上令人滿意,在本研究模擬的各情況中,B和C類DIF的出現率低於5{\%}。最後,研究者根據研究結果提出建議供實務工作者在解釋和運用MH DIF 分析結果時的參考。",
keywords = "差別試題功能(DIF), Mantel-Haenszel法, 第一類型錯誤率, ETS DIF分類系統, differential item functioning (DIF), Mantel-Haenszel procedure, Type I error, ETS DIF classification",
author = "盧, {雪梅(Sheue-Mei Lu)}",
year = "2000",
language = "Chinese",
volume = "47",
pages = "57--71",
journal = "測驗學刊",
issn = "1609-4905",
publisher = "中國測驗學會",
number = "1",

}

TY - JOUR

T1 - Mantel-Haenszel DIF 程序之第一類型錯誤率和DIF嚴重度分類結果研究

AU - 盧, 雪梅(Sheue-Mei Lu)

PY - 2000

Y1 - 2000

N2 - 本研究調查Mantel-Haenszel (MH) DIF 程序在數種模擬情境中之實徵第一類型錯誤率和其在ETS DlF分類系統中各類DIF 的分類結果。本研究以Monte Carlo法進行,操弄的因子包括:參照組和焦點組受試者的樣本數(2個水準)、兩組受試者能力的分配(3個水準)、測驗長度(3個水準)、受評試圖的鑑別度(6個水準)和難度(5個水準),採交叉設計,共模擬了540種情況,每種情況各重覆100次,所有試題均模擬為無DIF試題。本研究主要發現卸下:在大多數的模擬情況下,MH DIF程序第一類型錯誤率的控制力令人滿意,惟在兩組受試者能力分配有明攝差異且測驗信度偏低的情況下,鑑別度較極端的試題產主之實徵第一類型錯誤率有偏高的傾向,又以高鑑別力試題特別嚴重,這種現象在受試樣本人數多的情形下尤其明顯。就ETS DIF嚴重度分類結果而言,MH 的表現大致上令人滿意,在本研究模擬的各情況中,B和C類DIF的出現率低於5%。最後,研究者根據研究結果提出建議供實務工作者在解釋和運用MH DIF 分析結果時的參考。

AB - 本研究調查Mantel-Haenszel (MH) DIF 程序在數種模擬情境中之實徵第一類型錯誤率和其在ETS DlF分類系統中各類DIF 的分類結果。本研究以Monte Carlo法進行,操弄的因子包括:參照組和焦點組受試者的樣本數(2個水準)、兩組受試者能力的分配(3個水準)、測驗長度(3個水準)、受評試圖的鑑別度(6個水準)和難度(5個水準),採交叉設計,共模擬了540種情況,每種情況各重覆100次,所有試題均模擬為無DIF試題。本研究主要發現卸下:在大多數的模擬情況下,MH DIF程序第一類型錯誤率的控制力令人滿意,惟在兩組受試者能力分配有明攝差異且測驗信度偏低的情況下,鑑別度較極端的試題產主之實徵第一類型錯誤率有偏高的傾向,又以高鑑別力試題特別嚴重,這種現象在受試樣本人數多的情形下尤其明顯。就ETS DIF嚴重度分類結果而言,MH 的表現大致上令人滿意,在本研究模擬的各情況中,B和C類DIF的出現率低於5%。最後,研究者根據研究結果提出建議供實務工作者在解釋和運用MH DIF 分析結果時的參考。

KW - 差別試題功能(DIF)

KW - Mantel-Haenszel法

KW - 第一類型錯誤率

KW - ETS DIF分類系統

KW - differential item functioning (DIF)

KW - Mantel-Haenszel procedure

KW - Type I error

KW - ETS DIF classification

M3 - 文章

VL - 47

SP - 57

EP - 71

JO - 測驗學刊

JF - 測驗學刊

SN - 1609-4905

IS - 1

ER -