2014.07.10 仕事術
データプレゼン入門 政策をつくる人のためのデータで伝える技術 第1回 どんな統計グラフを選ぶのか
データのばらつきや相関が一目瞭然の散布図
国語テストの結果と算数テストの結果など2つの値をXY軸座標にプロットした点グラフを散布図、又は相関図と呼びます。全体としてのデータのばらつきや2つの値の相関、また、個別のデータの位置特性など、いろいろなことが同時に分かる便利で楽しいグラフです。
さっそく実例を挙げましょう。図4は、X軸に全国の町村部住民の平均年齢、Y軸に町村議会議員の平均年齢をとって都道府県別にこの2つの値をプロットしたグラフです。
町村部住民の平均年齢の最も高い県は高知であり、これに山口、秋田が続いています。逆に、最も低い県は沖縄であり、これに愛知が続いています。
町村議会議員の平均年齢の最も高い県は、65歳代の富山であり、これに64歳代の山梨、大分、長野が続いています。逆に、平均年齢の最も低い県は59歳代の沖縄であり、これに同じ59歳代の大阪、60歳代の長崎が続いています。
全体としての傾向を見ると、町村議会議員の平均年齢と議員を選出する住民の平均年齢には、特に相関はないことが分かります。高齢化の進んだ町や村だからといって議員の平均年齢がそれだけ高いわけではないのです。こうした図は、データの分布を示すという意味では散布図、それが2つの値の相関を確かめるために描かれた場合には相関図と呼びます。そして相関図の場合は、因果関係があるとしたら原因の方のデータをX軸、結果の方のデータをY軸にとるのが習慣となっています。議員と住民の平均年齢に相関があるとしたら、やはり住民の方が基になるため、X軸に住民の平均年齢をもってきているわけです。
2つの値の相関はなさそうだという結果になりましたが、散布図として読み取れることはほかにもあります。図の右上方向ほど、議員と住民の双方が高齢、左下方向ほど両者が若いことを示しています。
一方、図の左上方向ほど、議員と住民の平均年齢が離れており、右下方向ほど、両者が近いことを示しています。左上方向で目立っているのは愛知、滋賀、岐阜であり、逆に、右下方向で目立っているのは、山口、鹿児島、高知です。図の下の付表でも分かるとおり、前者の県と後者の県で議員の年齢にあまり違いはありませんが、住民の平均年齢に差があるため、こうした結果となっています。
議員と住民の年齢差が小さい方が良いとは必ずしもいえませんので、こうした結果からそれぞれの地域の優劣を論じることはできませんが、地域性の理解がそれだけ進む可能性はあると思われます。こういうグラフを試行的にいくつも描いて分析している中から、課題となっている問題について、重要なヒントを得られる相関や傾向、分布が明らかになってくることも多いといえます。
地理的分布の定番、地図グラフ
日本地図や世界地図の上で、データを濃淡や色で示したり、地域ごとに円グラフなどを示したりする地図グラフも、有力なグラフ表現のひとつです。これまでのグラフで地域別のデータを示しても、各地域の地理上の位置(東西南北、相互の隣接状況)や面積規模が分からないのでピンとこない場合がありますが、地図グラフではこうした情報が同時に得られるので、いろいろと示唆されるところが多いグラフとなる可能性が高まります。
少し古いデータなのですが、NHKの県民意識調査から、魚、肉、野菜が好きだといった人の割合の高い県を表示した地図グラフを図5に掲げました。日本海、太平洋を問わず、海との関わりの深い地域の県民が魚好き、中部地方の内陸部の県で野菜好き、西日本の県で肉好きという傾向がありそうだと理解できます。
地図グラフには、冒頭に述べた統計グラフの「分かりやすさ」、「覚えやすさ」、「伝えやすさ」という3つの役割に加えて、地域への関心や愛郷心を高めながらコミュニケーションできる「楽しさ」とでも呼ぶべき大切な役割があると考えられます。
まとめ
「データ」というのは単なる事実や数字の集まりにすぎず、そのままではそれが意味することを理解するのは困難です。雑然としたデータの羅列を整理して、理論構成や政策立案の基礎になる「情報」の形にまで高めなければなりません。指標化や表整理などと並んで、データを分析する代表的な手法がグラフ化です。グラフにしてみると、想定以上の傾向や思いがけない事実に気がつくことがあります。思い込みを統計グラフが打破することも少なくありません。グラフ化によって、データは何かを語り出すのです。グラフが持つ「気づきやすさ」の機能とも言い換えられます。
冒頭に述べた「分かりやすさ」、「覚えやすさ」、「伝えやすさ」というプレゼンテーション上の統計グラフの3つの役割は、こうした分析手段としてのグラフの機能の基礎に立っていることを忘れてはなりません。
1. 実数の迫力を表す棒グラフ
2. 変化の時期や程度が分かりやすい折れ線グラフ
3. そのものズバリの割合表現、帯グラフ
4. データのばらつきや相関が一目瞭然の散布図
5. 地理的分布の定番、地図グラフ
グラフ化によって、データは何かを語り出す!
最後になりましたが、棒グラフについては『統計データはためになる!』(本川裕著、技術評論社、2012年)、相関図については『統計データはおもしろい!』(同、2010年)で詳しく活用法を述べましたので、興味のある方は、ご覧ください。