平均年収637万円・・・をどう見るか? -統計学への入り口-

『統計学 (基礎コース)』田中勝人(新世社、1998年)

 世の中には様々なデータが溢れている。データそれ自体はただの数字だが、統計学を使うと、その数字の山を眺めているだけではなかなか分からない有用な情報を抽出できる。こう書くと抽象的で分かりにくいかもしれないが、私たちはそのような作業を日常的に行っている。例えば、平均を計算することも立派な統計学である。年収のデータは膨大な数字の山だが、そこから計算される637万円(2007年家計調査年報(総務省統計局))といったような平均年収を見ることで「みんなはこのくらいの年収がある」といった目安の情報を得ている人もいるだろう。

 では、平均とはそもそも何であって、どのような意味を持っているのか。平均年収637万円は「みんなは637万円くらいの年収がある」と解釈して良いのか(実はそう解釈できないことが多い)。このようなことは普段はあまり考えないのではないだろうか。平均なるものをただ何となく計算し、その解釈も厳密には行わないだろう。こうしたことは、私たちが統計学の断片をあまり深く考えずに使っていることを示唆する。このままでは必要な情報を上手く抽出できなかったり、抽出した情報を誤解してしまうおそれがある。企業や官庁でデータを扱う仕事をする人やデータを使ってレポートや論文を書く学生・研究者にとっては、問題はより深刻だろう。

 そこで薦めるのが本書のような統計学の入門書である。この本で扱うトピックはヒストグラムの作り方からいわゆる線形回帰分析までで、もちろん平均についての記述もある。その記述を拾い読みすれば先ほどの平均年収の解釈も適切に行えるだろう。ただ、そのような読み方では、個々の統計的なテクニックを断片的に身につけるだけになりかねない。それではマニュアル的な統計分析はできても応用力に乏しくなってしまうだろう。

 数多くある統計学入門書の中から特に本書を薦めるのは、本書がそうしたことを防ぐよう上手く書かれていると思ったからである。この本の大きな特徴は、各トピックをつなぐ流れが非常に良く、全体として統一的かつコンパクトに編集されている点である。これは、拾い読みではなく全体を通して読むことで、読者が統計学の全体像をつかめることを意味する。個々の統計手法の実際的な使い方だけではなく統計学の考え方や全体像も把握できれば、様々な問題に対応する応用力が付き、より適切な分析ができるだろう。また、本書は経済分析で使うための統計学を念頭に書かれているので、数学的な記述に偏ることはなく、読みやすいだろう。経済データを使った例も豊富だが、中には“例”としてさらっと読めないような難しい例もあるので、そこはやや注意が必要かもしれない。

 以上が本論で、以下は余談である。先日、知人の結婚式に出かける前にご祝儀の相場をネットで検索したところ、アンケート結果として“平均金額は32152円”のようなことを載せているサイトがあった。これを見て「32152円が相場だ」と誤解して152円のような小銭をもご祝儀袋に入れる人はまさかいないだろうが、平均金額を載せるのはあまり適切ではない。サイト運営者はあまり深く考えずに平均を載せたのかもしれないが、この手のサイトを見る人は「みんなはいくら包んでいるのか」を知りたがっているのだろうから、平均値より最頻値(モード)が適切だと考えられる。こうした些細なことも、上で述べた応用力の一つだと思う。

 さて、ご祝儀に152円をも誤って包むことは常識的にあり得ないが、様々な経済データと複雑な統計手法を使ったレポート・論文では思わぬ誤解が生じるかもしれない。“常識的”で片付けられない経済現象を分析することもあるのだから。また、統計分析の結果は、ご祝儀の金額を決めるといったように、意思決定に関わることもある。本書を読んで統計学をよく理解し、経済状態の誤認や意思決定の誤りなど無いようにして頂ければと思う。


千木良 弘朗 (経済学研究科 准教授)

専門分野:計量経済学
関心テーマ:パネルデータ分析、時系列分析