2012年07月03日

カイ2乗検定

初心者統計シリーズ6回目。
今回は
カイ2乗検定
(この本はウソを見破る統計学を参考にしています)

まず本の事例から行きましょう。
ある女子大学生が入っているサークルにいる人の血液型を調べました。
A型が31人、O型が25人、B型が29人、AB型が11人の96人でした。
その女子大生はB型が異常に多いのではないだろうか、
つまり明らかに変わり者が多いのではないかと感じたのです。
そのB型が明らかに多いかどうかを探るためにどうすればいいか悩んでしまいます。
(その女子大生はA:O:B:ABの比率は4:3:2:1と思っていました)
そこで父親(大学で統計を教えている教授)に聞いてみます。
父親はカイ2乗検定だな、と言います。
カイ2乗検定をするときは、観測度数と期待度数のデーターがなくてはいけません。
A型が31人、O型が25人、B型が29人、AB型が11人というのが観測度数になります。
実際に観測された人数や事件などの回数をいうのです。
期待度数とは、期待される人数や個数・事件等の回数のことになります。
日本の血液型分布はウェブで調べると、
A型が38.6%、O型が27%、B型が25.4%、AB型が9%です。
もしサークル部員の血液型が全国の血液型分布と同じであるとするならば期待度数は、
A型の期待度数=96×0.386=37.056人
O型の期待度数=96×0.27=25.92人
B型の期待度数=96×0.254=24.384人
AB型の期待度数=96×0.09=8.64人
ここまでわかれば、あとはエクセルで計算してくれます。
そして計算するとP値というものがでてきます。
今回は0.468という値でした。
つまり「全国の血液型と同じ比率の人たちが気まぐれにうちに入ったとしても、偶然この比率になる確率が46.8%もある」ということなのです。
またまたつまり、「B型が明らかに多い!!ということではなくなった」ということです
普通は0,05より小さければ、5%で有意と判断します。
しかしこれは絶対ではなく0.01より小さくなければ有意と判断できない場合もあります。
ただ大概は5%がよく使用されます。

ではリハの事例で行きましょう。
A病院の回復期リハ病棟の入院時FIMと全国の入院時FIMを比較してみましょう。
実際に検定するときは仮説を立てて、その仮説がどのくらいの確率で正しいかを問題にします。
まずその2つのデーターが等しいと仮定して、その仮定が起こらない事を示すやり方をします(帰無仮説)
その帰無仮説が棄却されれば対立仮説が採用されます。
A病院の入院時FIMをみてみましょう.
FIM20点以下5名、
FIM21点以上40点以下6名、
FIM41点以上60点以下14名、
FIM61点以上80点以下25名、
FIM81点以上100点以下20名、
FIM101点以上11名としましょう。(全体で81名)
上記が数値が観測度数になります。
全国の入院時FIMは
FIM20点以下4.4%、
FIM21点以上40点以下14.9%、
FIM41点以上60点以下15.6%、
FIM61点以上80点以下18.3%、
FIM81点以上100点以下20.4%、
FIM101点以上26.4% です。
こうみるとA病院はFIM100点以上の人は少なく、FIM61点以上80点以下は多いように見えます。
これは明らかに多いと言えるのか。
カイ2乗検定をしてみましょう。
では期待度数を出してみます。
FIM20点以下 81×4.4%=3.564
FIM21点以上40点以下 81×14.9%=12.069
FIM41点以上60点以下 81×15.6%=12.636
FIM61点以上80点以下 81×18.3%=14.823
FIM81点以上100点以下 81×20.4%=16.524
FIM101点以上 81×26.4%=21.384
となります。
エクセルではCHITESTで観測度数の範囲・期待度数の範囲を決めれば出てきます。
ちなみに数値は0.005となり、
5%でも1%でも有意となり帰無仮説は棄却されます。
偶然でこのデーターになるのは0.5%ですから、同じようなデーターとは言えないでしょう。

本来は自由度という項目をしらないと本当はいけないのですが、
また次回説明しましょう。
posted by リハ技士 at 19:05| 山形 ☁| Comment(0) | TrackBack(0) | 初心者統計 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック