「心理学研究法・心理学測定法・統計」における重要な用語のひとつであるカイ二乗検定(Chi-square test)について解説いたします。
カイ二乗検定(Chi-square test)とは?
2変数の独立性と適合度の検定であり、統計的に人数の方よりがあるか否かを判定する手法である。
※度数を扱う代表的な分析方法であり、2つの質的変数間における仮説検定であるノンパラメトリック検定の1種である。
独立性と適合度
独立性の検定
クロス集計法を用いて、変数Aと変数Bの比率が互いに独立しているか同化を検定するものである。
例えば、ある質問項目の「はい」「いいえ」の割合が、年齢(40歳以下と40歳以上)で分けた場合に両者の間に有意に差があるか、差がないかについて確かめるなどが該当する。
適合度の検定
クロス集計表を用いて、期待値(理論値)と観測値の比率のズレについて検定することである。
例えば、日本人のけつえきがたの人口割合の理論値として、A型:40%、B型:30%、O型:20%、AB型:10%ということが理論的に想定された場合、観測値(研究で得られたデータ)が、同じような割合に近くなるか、有意なズレがあるかを確かめるなどが該当する。
方法
クロス集計法を用いて、母平均間における比率に有意な差があるかをもとめる検定である。
<クロス表の例>
・独立性の検定の場合
「はい」と答えた数 | 「いいえ」と答えた数 | 合計 | |
40歳以下 | 38 | 62 | 100 |
40歳以上 | 59 | 41 | 100 |
合計 | 97 | 103 | 200 |
「はい」「いいえ」の割合が、40歳以下と以上で分けた場合に有意な差が見られるか、見られないかについて確かめる。
【カイ二乗値を求める式】
(38-59)²/38+(62-41)²/62+(59-38)²/59+(41-62)²/41=37.00
この場合、「はい」と「いいえ」から、自由度df=1であるため、カイ二乗分布表のdf=1に当てはめる。
カイ二乗値が、分布表の値を上回れば有意。下回れば有意差なし。
・適合度の検定の場合
A型 | B型 | O型 | AB型 | 合計 | |
期待値 | 40 | 30 | 20 | 10 | 100 |
観測値 | 35 | 31 | 19 | 15 | 100 |
期待値と観測値の比率に有意なズレがあるかについて確かめる。
【カイ二乗値を求める式】
(35-40)²/40+(31-30)²/30+(19-20)²/20+(15-10)²/10=3.21
この場合、血液型は4つであるため、自由度df=3である。そのためカイ二乗分布表のdf=3に当てはめる。
カイ二乗値が、分布表の値を上回れば有意、下回れば有意差なし。
内容
カイ二乗検定では、実際に測定された観測度数とは別に、全体度数の比率に基づいて算出された期待度数を求める。
また、クロス表の行列の合計を該当度数に対する周辺度数という。
期待度数は、周辺度数をかけて、全体の度数で割ることで求められる。
検定の対象になるのは、カイ二乗値(期待値と観測値のズレ)である。
⇒カイ二乗値が(行数-1)×(列数-1)で算出される自由度の数値より多ければ、帰無仮説は棄却され有意差となる。
帰無仮説が棄却された場合に、当該2変数は相互に規定しあう関係があるといえる。
ポイント
ノンパラメトリック検定の代表例です。
独立性と適合度の検定ということを良く抑えておいてください。
また、計算方法を分かっておくとより望ましいと思います。
➤心理学用語:統計的仮説検定(帰無仮説と対立仮説)【関連用語】