校長ブログ

新コース立ち上げ特集㊸-項目反応(応答)理論

2023.02.04 グローバル教育
2月4日

 GTECTOEFLなど、各種検定によって項目反応(応答)理論による評価という言葉が出てきます。これは欧米諸国では広く使われていますが、日本でも近年、活用されるようになったもの。偏差値や正答率といった従来のテスト理論と比べると、評価項目の信頼性に有益と言われています。今回はそのあたりについてです。

IMG_2689.JPG

A:英語のいろいろな民間試験を受けると項目反応理論による評価という言葉をよく耳します。これは一体、どのようなものなのですか?いろいろ調べてみたのですがどうもわかりにくくて...。

校長:項目反応理論とは、項目と呼ばれる設問に対して、受験者の応答が正解であったのか、不正解であったのかをデータを通して見ることで、項目ごとの到達度や難易度の適切性を確率論的に求め、受験者の学力を正確に評価しようというものだね。これは英語教育の分野だけでなく、いろいろなテストでも使われているよ。

A:そうだったんですか!大体の仕組みはわかりましたが...。

校長:設問におけるそれぞれの項目のことをIRT (Item Response Theory)と言うけど、IRTでは、能力値や難易度のパラメータを推定し、データがモデルにどれくらい適合しているかを確かめ、評価項目の適切さを調べることができるんだ。あまり専門的になってもいけないからもう少し簡単な例で考えてみようね。

A:お願いします。

校長:偏差値で考えてみようか。100点満点のテストで全員が100点をとった場合、偏差値はどうなる?

A:偏差値は平均からみてどれくらい差があるかをみたものだから、全員が50です。

校長:では、全員が0点をとった場合は?

A:やはり全員が50です。

校長:ではもう一つ。設問が1問(100点満点)しかない問題、それもレポートなどの記述式とは違い、「関ケ原の戦いが起こった年は?」のような設問の場合、100点か0点かと言ったって、評価の妥当性・信頼性・客観性という点ではどう?

A:意味がないと思います。

校長:そうだね。極端な例ばかりを示したけど、テストは作り方によって評価がゆがんでしまうんだ。そのような従来のテスト理論の課題にチャレンジしたのが項目反応理論ということになるよ。

A:なるほど...。

校長:項目反応理論は、テスト項目の特徴、項目と受験者の到達度の関係、テストの質に関して一般化を行うために、データの統計モデルを用いるものとなっているんだ。メリットとしては、等化、つまり、異なるテストや異なる受験生の差を平準化できるということ、また、時間の経過にそって、学習者の進捗を測定するために難易度を明確にした異なるテストの使用を可能にするということ、さらに、CBTComputer Based Testing)になるということが挙げられるよ。実施にあたっては、テスト得点、能力値、基準集団、IRT 標準スコア、段階評価、項目特性値、項目困難度、項目識別力など、かなり専門的な項目バンクとそれを受験者に適切に提示するためのコンピュータ適応テストが前提となるね。どんな優れた理論でも完全無欠というものはないけど、知っておきたいことではあるね。

A:背景知識が増えました。ありがとうございました。