2012年07月11日

検定いろいろ

初心者統計シリーズ 最終回
今回は、
検定あれこれ、です。
(この本はウソを見破る統計学を参考にしています)

ある大学の国語の受験で、
男子の平均点52.78(標準偏差13.84)
女子の平均点63.59(標準偏差11.85)でした。
これは男女差があると言っていいのでしょうか。

まずこの男女それぞれのデーターが正規分布しているかどうか検定する必要があります。
なぜなら正規分布している場合と正規分布していない場合は、
その後の検定手法が違うからです。
では正規分布を確かめる検定はどうすればいいでしょうか。
これは前にも話したようにエクセル統計がないと厳密には検定できません。
コルモゴロフ・スミルノフ(KS)検定を本来使います。
統計を本格的にしたい人は統計ソフトを買った方がいいでしょう。

先ほどの例に戻りましょう。
統計ソフトを使用したとして
男子のKS値は0.0486、P値は0.9143。
女子のKS値は0.0635、P値は0.672
KS値は小さいほど正規分布に近いのでどちらもかなり低いのですが、
男子の方が正規分布に近いことになります。
コルモゴロフ・スミルノフ(KS)検定において、
帰無仮説は「変数は正規分布に従う」です。
P値は0.05よりもかなり大きいのでこの帰無仮説は棄却されません。
つまり正規分布していると言えます。

正規分布していないときは、
ウィルコクソンの順位和検定を使用します。
これもエクセルではないようです。

では正規分布したという結果でしたので次はどのような検定をすれば答えが出るのでしょうか。
実はもう一つ手間がかかるのです。
バラツキ方に差があるかどうか、それとも偶然なのかを検定をする必要があるのです。
それはF検定というものを使用します。
これはエクセルの関数にあります。
FTESTという関数です、
今回の事例ではF値が1.2683、P値が0.1986。
F検定において、
帰無仮説は「変数は等分散性を示す」です。
P値は0.05よりも大きいので、この帰無仮説は棄却されません。
つまりバラツキの違いについては気にしないで検定していいという事になります。

バラツキがあると検定された場合とバラツキがないと検定された場合では、
実はどちらもt検定を使用します。
だったらF検定しなくても良かったのではないかと言われそうですが、
同じt検定でもそのF検定の結果によって、t検定の式が変わってくるのです。
(t検定は2つの集団の平均に差があるのかを調べる検定です)

結果、この事例では、
t値が−6.6166。
P値が2.358×10の−8乗というものすごく小さな数になります。
P値が0.05よりも小さくなります、
t検定において、
帰無仮説は2つの集団の平均に差はない、というものです。
P値がこれだけ小さいので帰無仮説は棄却されます。
つまり男女差はあるという結果になるのです。

ここでは何を言いたいかというと、
流れさえ理解しておけば、
後は統計ソフトさえ使用すれば勝手に計算してくれるということです。

とりあえず、初心者統計シリーズは終了。
私も勉強になりました。
posted by リハ技士 at 19:35| 山形 ☁| Comment(0) | TrackBack(0) | 初心者統計 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック