華語文閱讀測驗信度效度分析與垂直等化研究

藍 珮君(Pei-Jiun Lan), 陳 柏熹(Po-Hsi Chen)

Research output: Contribution to journalArticle

Abstract

本文旨在探討華語文閱讀測驗四個測驗等級:基礎級、進階級、高階級與流利級的信度與效度表現,並將四個等級試題難度連結至同一量尺上。樣本來自2011年5月與11月正式考試,及2012年預試之考生作答反應資料,以古典測驗理論與試題反應理論進行分析。研究結果顯示:1.閱讀測驗信度良好,各等測驗KR20信度係數接近或達到0.90以上,IRT估計標準誤換算後的信度數值皆達到0.90以上,且各測驗通過門檻的考生能力值亦有較高的測驗訊息量與較低的估計標準誤;2.閱讀測驗具有建構效度,各等級因素分析結果抽出閱讀理解單一因素,解釋變異量在66.91%以上,且各等級試題與模式適配比例達87.5%以上;3.四等測驗試題難度分佈良好;4.進階與高階級測驗折半合併為一等測驗,通過門檻之測驗訊息量及估計標準誤,與原進階級測驗相當,略差於原高階級測驗,將此兩等級測驗合併為一等測驗在實務上應為可行,惟組卷時試題難度比例需再做調整。
Original languageChinese
Pages (from-to)99-125
Number of pages27
Journal華語文教學研究
Volume11
Issue number1
Publication statusPublished - 2014

Cite this

華語文閱讀測驗信度效度分析與垂直等化研究. / 藍珮君(Pei-Jiun Lan); 陳柏熹(Po-Hsi Chen).

In: 華語文教學研究, Vol. 11, No. 1, 2014, p. 99-125.

Research output: Contribution to journalArticle

@article{a5f626e032fa42f8a30e747a28f92769,
title = "華語文閱讀測驗信度效度分析與垂直等化研究",
abstract = "本文旨在探討華語文閱讀測驗四個測驗等級:基礎級、進階級、高階級與流利級的信度與效度表現,並將四個等級試題難度連結至同一量尺上。樣本來自2011年5月與11月正式考試,及2012年預試之考生作答反應資料,以古典測驗理論與試題反應理論進行分析。研究結果顯示:1.閱讀測驗信度良好,各等測驗KR20信度係數接近或達到0.90以上,IRT估計標準誤換算後的信度數值皆達到0.90以上,且各測驗通過門檻的考生能力值亦有較高的測驗訊息量與較低的估計標準誤;2.閱讀測驗具有建構效度,各等級因素分析結果抽出閱讀理解單一因素,解釋變異量在66.91{\%}以上,且各等級試題與模式適配比例達87.5{\%}以上;3.四等測驗試題難度分佈良好;4.進階與高階級測驗折半合併為一等測驗,通過門檻之測驗訊息量及估計標準誤,與原進階級測驗相當,略差於原高階級測驗,將此兩等級測驗合併為一等測驗在實務上應為可行,惟組卷時試題難度比例需再做調整。",
keywords = "華語文能力測驗, 信度, 效度, 試題反應理論, 垂直等化, mandarin test, reliability, validity, item response theory, vertical equating",
author = "藍, {珮君(Pei-Jiun Lan)} and 陳, {柏熹(Po-Hsi Chen)}",
year = "2014",
language = "Chinese",
volume = "11",
pages = "99--125",
journal = "華語文教學研究",
issn = "1811-8429",
publisher = "世界華語文教育學會",
number = "1",

}

TY - JOUR

T1 - 華語文閱讀測驗信度效度分析與垂直等化研究

AU - 藍, 珮君(Pei-Jiun Lan)

AU - 陳, 柏熹(Po-Hsi Chen)

PY - 2014

Y1 - 2014

N2 - 本文旨在探討華語文閱讀測驗四個測驗等級:基礎級、進階級、高階級與流利級的信度與效度表現,並將四個等級試題難度連結至同一量尺上。樣本來自2011年5月與11月正式考試,及2012年預試之考生作答反應資料,以古典測驗理論與試題反應理論進行分析。研究結果顯示:1.閱讀測驗信度良好,各等測驗KR20信度係數接近或達到0.90以上,IRT估計標準誤換算後的信度數值皆達到0.90以上,且各測驗通過門檻的考生能力值亦有較高的測驗訊息量與較低的估計標準誤;2.閱讀測驗具有建構效度,各等級因素分析結果抽出閱讀理解單一因素,解釋變異量在66.91%以上,且各等級試題與模式適配比例達87.5%以上;3.四等測驗試題難度分佈良好;4.進階與高階級測驗折半合併為一等測驗,通過門檻之測驗訊息量及估計標準誤,與原進階級測驗相當,略差於原高階級測驗,將此兩等級測驗合併為一等測驗在實務上應為可行,惟組卷時試題難度比例需再做調整。

AB - 本文旨在探討華語文閱讀測驗四個測驗等級:基礎級、進階級、高階級與流利級的信度與效度表現,並將四個等級試題難度連結至同一量尺上。樣本來自2011年5月與11月正式考試,及2012年預試之考生作答反應資料,以古典測驗理論與試題反應理論進行分析。研究結果顯示:1.閱讀測驗信度良好,各等測驗KR20信度係數接近或達到0.90以上,IRT估計標準誤換算後的信度數值皆達到0.90以上,且各測驗通過門檻的考生能力值亦有較高的測驗訊息量與較低的估計標準誤;2.閱讀測驗具有建構效度,各等級因素分析結果抽出閱讀理解單一因素,解釋變異量在66.91%以上,且各等級試題與模式適配比例達87.5%以上;3.四等測驗試題難度分佈良好;4.進階與高階級測驗折半合併為一等測驗,通過門檻之測驗訊息量及估計標準誤,與原進階級測驗相當,略差於原高階級測驗,將此兩等級測驗合併為一等測驗在實務上應為可行,惟組卷時試題難度比例需再做調整。

KW - 華語文能力測驗

KW - 信度

KW - 效度

KW - 試題反應理論

KW - 垂直等化

KW - mandarin test

KW - reliability

KW - validity

KW - item response theory

KW - vertical equating

M3 - 文章

VL - 11

SP - 99

EP - 125

JO - 華語文教學研究

JF - 華語文教學研究

SN - 1811-8429

IS - 1

ER -