「心理学研究法・心理学測定法・統計」における重要な用語である相関関係と因果関係(correlation coefficient and causality)について解説します。
■相関関係
一方の値が変化すると他方の値も変化するという2つの値の関連性を示したもの。
■因果関係
2つ以上のものの間に原因と結果の関係があると言い切れる関係を示したもの。
※つまり、相関関係は2つの値に関連があることをいい、因果関係は独立変数が従属変数よりも時間的に先行しており、明確な原因と結果の関係が存在する凶変関係のことを示す。
問題1:気温が高くなると飲み物が良く売れて、気温が低いとあまり売れない。
・気温の高さと飲み物の売り上げの間には因果関係がある。=原因:気温が高い→結果:飲み物が売れる。(飲み物が売れる→気温が高くなるわけではない。)
問題2:気温が高くなると、川遊びをする人が増えて、水の事故が増える。
・気温の高さと川遊びをするひとの数の間には因果関係がある。=原因:気温が高い→原因:川遊びの数が増える。(川遊びの数が増える→気温が高くなるわけではない。)
・気温の高さと水の事故の数には因果関係はなく相関関係がある。=気温の高さ⇄水の事故
(気温が高いから水の事故が増えているのではなく、川遊びをする人が増えたから事故が増えたに過ぎない。原因と結果の関係性は無い)
問題3:川での事故が増えると、飲み物の売り上げが上がる。
・川の事故数と売り上げの間には相関関係がある。
(事故が多いということは、遊んでいる人が多い。なぜなら暑いから。熱いと飲み物は良く売れる。)
つまり、はっきりとした原因と結果と言えない変数の関係は単なる関連に過ぎない。
問題2の因果関係の例で示した、遊泳数と事故の多さは普通に考えれば因果関係である。しかし、当該日に水量が多かったり流れが速かったりと別の要因がある場合、これらが原因で、遊泳数は事故の多さの原因ではない可能性もある。
心理学研究で因果関係まで示したい場合は、統制された実験条件で、当該変数の検討を行う必要がある。
2変数の相関の強さを表す値を相関係数(r)という。
相関係数の範囲は-1から1で表され、0に近いほど無相関で、-1に近いほど負の相関、1に近いほど正の相関を意味する。
※相関係数の解釈における注意点
✔ 疑似相関:第3の変数(z)によって「見かけ上」現れた相関のこと。
→検討したい2変数には実際には相関はない。(第3の変数の影響を取り除いた相関関係を偏相関関係という。)
✔ 外れ値:平均値や標準偏差が他と極端に大きさが異なる値のこと。
→外れ時によって本来存在しない相関が算出される可能性がある。(合併効果)
✔ 切断効果(選抜効果):集団の一部のみを使って相関係数を算出すると、本来の相関関係からぶれる可能性がある。
相関関係と因果関係の違いを説明をするのは、簡単なようでしっかりと理解するにはやや頭を使う問題ですね。
この違いは、簡単に言ってしまうと「A→B」とはっきり言えれば因果関係、「A⇄B」の場合は相関関係ということです。
しっかりとした理解のためには、疑似相関の可能性や文脈の理解が必要になるかと思います。