TCTとTRIテストの理論
テストは心理学で測定器として使われます. 概念に少し近づけるために、そして私達が長さを測定するためにメーターを使うように、私達は知能、記憶、注意を測定するためにテストを使うことができるでしょう。テストの適用が非常に簡単であることに加えて、テストの作成はそれほど簡単ではありません。.
さらに、1回の測定では物体の体積について話すことができないのと同様に、1回のテストでは介入を診断または提案することもできません。だから, テストは評価にとって重要ですが、決定要因ではありません。.
心理学者が最も重要な役割を果たすのはここです。何らかの方法で、彼はテストから、そして他のソースから得た情報を使用しなければなりません。 介入の計画への道を与える首尾一貫した評価に形を与える. 言い換えれば、それは専門家の質が最も顕著である異なるソースの結果を統合する時点です。私たちは、知識だけでなく長年の経験によっても達成される専門知識について話します。.
テスト理論の簡単な歴史
テストの起源は通常中国の皇帝によって行われたテストで引用されています キリストの前の3000年の間に。したがって、これらは彼らのサービスに入るつもりだった役員の職業的能力を評価するという目的を持っていました。 (1)
現在のテストは、Galtonが実施したテストに最も近い起源を持っています。 彼の研究室で(1822-1911)。しかし、この用語を最初に使用したのはJames Cattellです。 精神テスト, これらの最初のテストでは、人間の認知能力をあまりにも予測的にすることができなかったので、Binet and Simon(1905)のような研究者は、判断、理解、推論などの側面を評価するための認知タスクを新しいスケールで紹介します。.
Binetスケールは個々のスケールの伝統を開きます. 認知テストに加えて、パーソナリティテストで大きな進歩があります.
テストの理論はなぜ必要なのでしょうか。?
すべての進歩が生み出される前に、それらは順番に測定の理論(テストの理論)を発展させ始めます。私たちが彼らに測定させたいものを測定しそして可能な限り少ない誤差でそれを行う器具を作り出すことへの懸念と共に、心理測定法は現れる. すべての試験機器または測定機器を必要とし、そうであると主張し、それが有効で信頼できるものである心理測定,
を思い出して 信頼性 測定プロセスが繰り返されるとき、それは測定の安定性または一貫性として理解されます. つまり、同じレベルの測定値を持つ2つの被験者(または異なる機会にある同じ被験者)を測定したときの結果の再現性が高ければ高いほど、テストの信頼性は高くなります。その部分について, 妥当性とは、経験的証拠と理論がスコアの解釈を裏付ける程度のことです。 テストの。 (2)
したがって、このタイプの機器の分析と構築について説明するときには、テストまたはアプローチについて2つの大きな理論があります。 テストの古典的な理論(TCT)と項目への応答の理論(TRI).
テストの古典的理論(TCT)
それはテストの構築と分析における支配的な理論です. ボウル:このパラダイムの最小要件を満たすテストを作成することは比較的簡単です。言及されたパラメータに関するテスト自体の評価も比較的簡単です。信頼性と妥当性.
それは20世紀の初めにスピアマンの作品に起源があります. それから、1968年に、主とノヴィックの研究者はこの理論の再定式化を実行して、TRIの新しいアプローチへの道を開きます.
この理論は古典的な線形モデルに基づいています. このモデルはSpearmanによって提案されたもので、次のように仮定しています。 私たちが彼の経験的なスコアと呼び、通常は文字Xで表される、ある人がテストに参加するスコアは、2つの要素で構成されています。. (2)
一方では、テストの対象者の真のスコア(V)を見つけ、他方ではエラー(e)を見つけます。次のように表現されます。 X = V + e.
Spearmanは、この理論に3つの仮定を追加しています。
- まず、 真のスコア(V) として の数学的希望 経験的スコア: それは彼が無限の回数それをやったならば人がテストで受けるであろうスコアです.
- いいえ あります 関係 間 真の得点 そして エラーサイズ それらのスコアに影響する.
- 最後に、 テストの測定誤差 彼らは 関連した と、 別のテストでの測定誤差.
この理論を完成させるために、スピアマンは次のように定義しています。 並行テスト 同じことを測定するが異なる項目を使用するテストのように.
古典的アプローチの限界
最初の制限は、この理論の範囲内では、測定値が不変ではないということです。 使用される楽器に関して。これは、心理学者がそれぞれ異なるテストで3人の知能を評価した場合、結果は比較可能ではないことを意味します。しかし、なぜこれが起こるのでしょうか。?
さて、3つの測定器の結果は同じ規模ではありません。 各テストには独自のスケールがあります. たとえば、さまざまな知能テストで評価されたX人の知能を比較できるようにするには、それが必要です。 得られたスコアを変換する 他のスケールでのテストから直接.
これに関する問題は、スコアをベアマダに変換することによって、それらが作成された規範的グループが仮定されるということです。 さまざまなテストのスケールは 比較可能 - 同じ平均、同じ標準偏差-, 実際に保証するのが難しいもの(1)したがって、TRIの新しいアプローチはこの事実に関して大きな進歩を想定していた。したがって、TRIは、異なる商品を使用して得られた結果が同じスケールであることを達成します。.
このアプローチの2番目の制限は、テストプロパティの不変性の欠如です。 それを推定するために使用される人々に関して。したがって、TCTの枠組みでは、テストの重要な心理測定特性は、それらの計算に使用されるサンプルの種類によって異なります。これは、TRIアプローチで少なくとも部分的にも解決策が見つかるという事実です。.
項目反応理論(TRI)
項目反応理論(TRI)は、古典検定の理論を補完するものとして生まれました。. 言い換えれば、TCTとTRIは同じテストを評価し、各項目のスコアや関連性を確立することができます。その結果、個人ごとに結果が異なる可能性があります。他方、TRIが私たちにもっと良い校正済みの機器を提供するであろうことを指摘するために、問題はこのパラダイムがはるかに高いコストと専門の専門家の参加を持っているということです。.
TRIにはいくつかの仮定がありますが、おそらく最も重要なことは、どんな測定器もアイデアに従うべきであるということです。 アイテムを測定する変数の値とこれらに当たる確率の間の関数関係. この関数は呼ばれます アイテムの特性曲線 (CCI)私たちはそれからどう思いますか??
外部からのものは非常に論理的に見え、TCTでは評価されないもの. たとえば、最も難しい項目は、最も賢い人だけが答えるものです。一方、すべての人がよく答えるという項目は、それを差別する力がないため、それだけの価値はありません。言い換えれば、それはいかなる種類の情報も与えないでしょう。これはTRIによって提案された革命のほんの小さなスケッチです。.
ある測定モデルと別の測定モデルの違いをもう少しよく見るために、JoséMuñiz(2010)の表を参考にしてください。
表1. TCTとTRIの違い(Muñiz、2010年)
側面 | TCT | TRI |
モデル | 線形 | 非線形 |
仮定 | 弱い(データに会いやすい) | 強い(データに会うのが難しい) |
測定の不変性 | いいえ | はい |
テストプロパティの不変性 | いいえ | はい |
スコアのスケール | テストの0から最大の間 | 無限大 |
強調 | テストする | 項目 |
アイテムとテストの関係 | 指定されていません | アイテムの特性曲線 |
商品の説明 | 難易度と差別の指標 | パラメータa、b、c |
測定誤差 | サンプル全体に共通の典型的な測定誤差 | 情報機能(適性のレベルによって異なります) |
サンプルサイズ | それはおよそ200から500の主題の間のサンプルでうまくいくことができます | 500以上の科目が推奨されています |
これがテストの両方の理論がどのように関連しているかです。ほぼ同値ですが、次のことが明らかになります。 TRIは、TCTが発展させることができる限界や問題に対応して生まれました. しかし、それでも研究はこの分野の精神測定学に進むにはまだ長い道のりがあることは明らかです。.
心理テスト:特性と機能心理テストは、心理学で知ることに関心がある変数を測定するために使用される手段です。もっと読む」