2012年07月09日

回帰曲線

初心者統計シリーズ9回目。
今日は、
回帰曲線です。
(この本はウソを見破る統計学を参考にしています)

前回はデーターを直線で近似する回帰分析でした、
しかしデーターというのは中には直線だけで表せるものではありません。
では本に出ている世界各国の平均寿命と一人当たりのGDPをみてみましょう。
国が豊かであればあるほど衛生状態が良好であったり医療が発展していたりと、
平均寿命は延びています。
これはグラフを本来は見せたいところですが、言葉だけで想像してもらいたいと思います。
平均寿命の伸びは、一人あたりのGDPが大きくなるにつれ、ゆるやかになっていきます。
GDPが10倍になれば、平均寿命も10倍に伸びて500歳にはなりません。
また1人当たりのGDPがある程度まで少なくなると、
極端に平均寿命が少なくなっていく散布図になっています。
結果、曲線状に黒チョボが集まってきています。
ではそのような散布図の時の回帰曲線はどのように作ればいいでしょうか。
このような場合2つの変数のうち、そのうちの1つの変数の図り方を変えていくことが必要です。
今回は一人当たりのGDPの「対数」をとるという方法です。
10の3乗は1000、
10の4乗は1000です。
一人当たりGDP(ドル)で低い国だと2000ドルという国があります。
2000は10の何乗になるかというと、約3.3乗になります。
一人あたりのGDP(ドル)で高い国だと30000ドルという国もあります、
30000は10の約4.48乗になります。
そうするとグラフは縦軸に平均寿命、
横軸はただ一人あたりのGDPをあげるのではなく、
10の何乗なのかの目盛りで表すと
曲線を描かないといけないような散布図が変化し、線状に近い散布図になります。
しかしここでこの10の何乗を出すのはどうすればいいのかと質問があるでしょう
これはエクセルでは「LOG」というのを使用します。
関数でこの「LOG」を選び、「数値」「底」を入力する画面が出てきます。
先ほどの2000ドルの例だと、数値に2000と入力、底に10と入力します。
そうすると3.30103となります。
これが先ほどの10の3.30103乗なのです。

なるほど変数を変えればいいのか、とわかったかと思いますが、
しかしこのLOGを使用するのも少し面倒です。
エクセルのグラフを使用し、使い方をマスターさえすれば、
先ほどのくだりで考えなくても、
一発で散布図と回帰曲線と回帰曲線式とR2が出てきます。
(今までのくだりは何だったの、と言われそうですが…)
そのやり方を説明しましょう。
エクセルに入っているデーターから散布図を作ります。
その散布図の黒チョボにあわせて右クリックします、
そうすると近似曲線の追加というものが出ますので、それをクリック。
そうすると多項式近似というものがあるのでそれにチェック、次数の数値を入力します。
この次数はグラフ(散布図)の形で決めましょう。
凸や凹型のグラフであれば2次関数、
N型のグラフであれば、3次関数、
M型、W型のグラフであれば4次関数、
多項式近似以外でもセレクト出来ます。
例えば
急上昇タイプのグラフであれば指数関数とか…。
そして下の方にグラフ上に式を表示するにチェック、
そしてR2値を表示するにチェックを入れて「閉じる」をクリックすれば、
あっという間に出来上がりです。

また散布図が微妙なグラフもあるので、
いろいろ試してR2値がいいものを選んだほうがいいでしょう。
R2値が良くないなと思い別の関数で試したかったら、
出来あがったグラフの線にあわせて右クリック、そして削除を選んでください。
そして黒チョボ右クリックに戻ってまた作業を始めてください。

これも皆さんデーターか何かあったら試してください。
次回でこのシリーズは最後にします.
posted by リハ技士 at 18:26| 山形 ☀| Comment(0) | TrackBack(0) | 初心者統計 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック