信頼性と妥当性の4つの違い(科学における)

信頼性と妥当性の4つの違い(科学における) / 心理学

口語ではそれらは非常に似た意味を持つので、私たちが科学、特に心理測定学について話すとき、信頼性と妥当性の用語を混同するのは簡単です。.

このテキストを使って、私たちは 信頼性と妥当性の大きな違い. うまくいけば、あなたはこの一般的な疑問を明確にすることが有用であると思う.

  • 関連記事:「心理測定学:データを通した人間の心の研究」

信頼性とは?

心理測定において、「信頼性」という概念 機器の精度を指す;具体的には、信頼性係数は私達にこのツールでとられた対策の一貫性と安定性を知らせます.

機器の信頼性が高ければ高いほど、それを使用して特定の属性を測定するときに現れるランダムで予測不可能なエラーの量が少なくなります。信頼性は予測可能なエラー、つまり実験的な管理の対象となるエラーを除外します.

古典的なテスト理論によると、信頼性は真のスコアによって説明される分散の割合です。したがって、テストの直接スコアは、ランダムエラーと真のスコアの合計で構成されます。.

信頼性の2つの主な要素 それらは一時的な安定性と内部の一貫性です. 最初の概念は、スコアは異なる機会に測定されたときにほとんど変化しないことを示していますが、内部の一貫性はテストを構成する項目が同じ心理的構造を測定する程度を示しています.

したがって、信頼性係数が高いということは、テストのスコアが内部的にも時間の関数としてもほとんど変動しないことを示しています。 機器に測定誤差がない.

  • 多分興味があるかもしれません: "心理テストの種類:それらの機能と特徴"

有効性の定義

我々が妥当性について話すとき、我々はテストがそれが測定しようとしている構造を正しく測定するかどうかについて言及する。この概念は、 テストで得られたスコアと他の関連尺度との関係;両方の要素間の線形相関の程度が有効係数を決定します.

また、科学的研究では、高い妥当性は、与えられた機器または研究で得られた結果が一般化されることができる程度を示します.

有効性にはさまざまな種類があります。有効性の計算方法によって異なります。これは非常に異なる意味を持つ用語になります。基本的に私たちは区別することができます コンテンツの妥当性、基準(または経験的)妥当性、および構成概念妥当性.

内容の妥当性とは、心理測定テストの項目が、評価対象の構成要素を構成する要素の代表的なサンプルである程度を定義します。その楽器はその構成要素の全ての基本的側面を含まなければならない。たとえば、うつ病を測定するために適切なテストを行いたい場合は、心の状態と喜びの減少を評価する項目を必ず含める必要があります。.

基準妥当性は、特性または関心のある分野に関連する側面を予測するための商品の能力を測定します。最後に、構文の妥当性が意図されています テストがあなたが測定しようとしているものを測定しているかどうかを判断する, たとえば、同様のテストで得られたスコアとの収束から.

信頼性と妥当性の違い

これら2つの精神測定特性は密接に関連していますが、真実はそれらが明確に区別された側面に言及しているということです. これらの違いが何であるかを見てみましょう.

分析の対象

信頼性は、それを構成する品目の特性を測定するという意味で、その機器の特性です。一方、妥当性とは厳密には商品を指すものではありませんが、 結果から作られる一般化へ これを通して得た.

彼らが提供する情報

これはやや単純化したアプローチですが、妥当性とは、心理測定ツールが実際に測定しようとしている構造を測定することを示し、信頼性はエラーなしに正しく測定するかどうかを示します。.

それらが計算される方法

信頼性を測定するために3つの手順が基本的に使用されます。 二つの半分の方法、並列形式の一つとテスト - 再テスト. 最もよく使われるのは、2つの半分の手順で、テストに答えたら項目を2つのグループに分けます。それから2つの半分の間の相関関係を分析した。.

並列形式または代替形式の方法は、2つの同等のテストを作成して、それらがどの程度相関しているかを測定します。テスト - 再テストは、可能な限り類似した条件下で、単に2回テストに合格することに基づいています。両方の手順を組み合わせて、テストの最初の形式と2番目の形式の間に時間間隔を空けるという並列形式のテスト - 再テストを行うことができます。.

その一方で、妥当性 それはタイプによって異なる方法で計算されます, しかし、一般的に、すべての方法は、客観的テストの得点と同様の特性に関する同じ被験者の他のデータとの比較に基づいています。目的は、テストが形質の予測因子として機能できることです。.

妥当性を評価するために使用される方法の中で、我々は要因分析とマルチメソッド - マルチトレイトマトリックス技術を見つけます。また、コンテンツの妥当性は、多くの場合、合理的な非統計的分析によって決定されます。たとえば、テストの有効性に関する専門家の主観的な判断を指す見かけの有効性が含まれます。.

両方の概念間の関係

心理測定機器の信頼性はその妥当性に影響を与えます。 信頼性が高いほど、その妥当性は高くなります。. したがって、ツールの有効性係数は常に信頼性係数よりも低く、有効性は信頼性について間接的に通知します。.