2020 03/09
著者に聞く

『統計分布を知れば世界が分かる』/松下貢インタビュー

我が家で一杯

世の中は複雑怪奇です。そこに何らかの法則を見つけるのはむずかしいようにも思えます。では、どうすれば世界の法則が見えてくるのでしょうか。『統計分布を知れば世界が分かる―身長・体重から格差問題まで』を刊行した松下貢さんに、お話を伺いました。

――統計についての本はたくさんありますが、本書はそれらとどう違うのでしょうか。

松下:「統計」とは、ある共通の性格をもつものの集まりに注目し、その集まりに属する個々のメンバーが示す性質を調べてデータとして求め、その集まり全体としての特性や傾向などを数量的に表すことを言います。

たとえば、埼玉県など、ある地域の小学校に入学したばかりの児童全体の集まりについて、彼らの身長や体重を測定してデータとして集め、「男女別々の平均の値はどれくらいになるか」、「男女でどれほどの差があるか」、「ほかの地域と比べてどのような違いがあるか」、「これまでの入学児童と比べてどのように変化しているか」などと分析するのが統計です。その意味で「統計」は非常に広い概念だということができ、したがって、それに関する本も非常に多いのです。

上の説明からもわかるように、統計でまず問題になるのは、注目する集まり全体としての特性や傾向をいかに「見える」化するかということになります。統計データの数値だけ見ていると、一見バラバラに見えるものですが、それをグラフにしてみると、データに潜んでいたある傾向や規則性、特徴がデータの分布として見えてくるのです。それが統計分布です。

たとえば上の入学児童の例では、背の高い子もいれば低い子もいるわけですが、かと言って、極端に高い子や極端に低い子もおらず、ある平均値を中心に、ある幅を持ってばらついて釣り鐘状に分布していることがわかります。これが入学児童の身長に関する統計分布です。

このように、統計分布は統計において最も基礎的かつ重要であり、統計の議論をする際に出発点となるものです。本書はこの統計分布に焦点を当てているという意味で、類書が見当たらないという特徴があります。

――世の中の出来事は本書で説明されている3つの統計分布でだいたい表すことができると言うことですが、それに気づかれたのはどんなきっかけですか。

松下:本書で注目した3つの統計分布「正規分布」、「べき乗分布」、「対数正規分布」はいずれも長い歴史を持ち、数多くの先行研究があります。特に正規分布は、製品の製造工程における統計分析で常に使用されるなど、最もよく知られています。また、べき乗分布は地震の頻度分布や都市人口の分布、単語の使用頻度などに現れるという意味で、正規分布ほどではないにしても、よく知られている統計分布です。

いっぽうで、この2つに比べると、対数正規分布のほうは専門家を除くとその知名度が非常に低いと言わざるをえません。本書の目標の1つは、不当に知名度の低い、この対数正規分布を少しでも広く知ってもらうことです。

私がこの対数正規分布にはじめて出会ったのは、私の研究室の卒業研究生や大学院生と一緒に、細長いガラス棒を床に落として、その破片の長さの分布が対数正規分布になることを調べたときでした。しかし、これは砕石場で砕石された石ころのサイズが対数正規分布になるという、ずっと古い研究の一例にすぎません。

その後、東京都老人医療センター(当時)の松下哲さんから、センターの入院患者の介護期間のデータについて相談を受け、大学院生たちと一緒に分析してみたところ、データが対数正規分布に当てはまることを見出しました。これはまさしく新奇な対数正規分布の例であり、私が本当の意味で対数正規分布に出会ったときです。

いろんな人や物が集まって複雑に絡み合いながらも、一つにまとまっている集まりを「複雑系」といいます。私たちの身体はいろんな臓器が集まって一つの身体にできているという意味で、複雑系の典型例です。そのような人たちが集まっている学校や病院、役所、会社などという組織も複雑系です。市町村や都道府県、その集まりである国も、さらに国々が集まってできている世界も複雑系です。もちろん、私たちが住む環境にもいろんな生態系があり、複雑系の例です。このように、複雑系は私たちの身の回りにいくらでもある、ごく普通のものです。

誰もがいずれ罹る老人病の介護期間が対数正規分布になるという研究がきっかけで、もしかしたら対数正規分布はこのありふれた複雑系に広く深く関連しているのではないかと思いはじめ、これまで長い間、私の周辺にいた若い人たちといろんな例について調べてきました。その一端を本書の後半の部分に示しておきました。

――それでは、この統計分布が分かると、そこからどんなことが分かりますか。

松下:はじめに説明したように、注目する集まりが何であれ、そのメンバーが持つ性質が数値で表されれば、それが統計データとなって統計分布を求めることができます。それによってその集まりの特徴と傾向がわかるというわけです。これは小学校入学児童の身長についてお話ししたとおりです。

したがって、自然科学、社会科学であれ、工業、商業、農林水産業であれ、ともかくそれぞれの分野で過去および現在のデータを統計分布で「見える」化したうえで、その特徴と時間的な変化の傾向を分析することによって、将来を見据えることができます。そのような意味で、統計分布は分野を問わず統計データの最も基礎的なツールということができます。

統計分布のこの汎用性は、統計そのものを考察する分野である統計学が数学の一分野であり、数学が最も汎用性のある学問であることからきています。

また、統計分布を求めるためには数多くの統計データが必要だとよく言われますが、たとえば都道府県が関連する統計ではたったの47個のデータしか得られません。このようなデータの数が少ない場合であっても、ランキングプロットという手法があります。

データの数値を大きさの順に並べて順位表を作り、数値を横軸に、順位を縦軸にプロットするという簡単な作業で済むランキングプロットを行うと、ばらつきの少ない分布が得られるのです。この点についても、本書ではいくつもの具体例を示して強調しました。統計分布に興味のある読者には、それぞれの分野でぜひとも試みてほしいと思います。

――そもそも統計分布に松下先生が関心を持たれたのはなぜですか。

松下:私は大学の学部時代からほぼ一貫して、物理学の学習、研究、教育に携わってきており、特に、1970年代中ごろに大学に職を得てからは物理学の一分野である統計物理学に興味を持ってきました。

統計物理学というのは、物質の微視的な構成要素である原子・分子の振る舞いから出発して、原子・分子が多数集まってできている巨視的な、私たちの身の回りにある物質の性質を統計的な手法で明らかにしようという分野です。したがって、この分野には必然的に統計分布、特に正規分布が常に顔を出します。これが、私が統計分布に強い関心を持ちはじめた始まりです。

1980年代にはフラクタルの物理的な側面に注目して研究を始めました。フラクタルというのは、あるパターンがあって、その一部を拡大しても元のものと区別がつかないようなパターンのことで、このようにスケールを変えてみても同じように見える性質を自己相似性といいます。

たとえば、桜の木を想像してみてください。幹から枝分かれした大枝にはさらに枝分かれした中枝があり、それはさらに枝分かれした小枝からなり、……と続きます。その小枝を1つ取って拡大してみると、中枝とそっくりです。すなわち、桜の木の枝ぶりは自己相似的で、フラクタルの格好の例です。

本書でも少し触れましたが、べき乗分布とはスケールを変えても分布関数の形が変わらないという意味で自己相似的です。したがって、フラクタルの統計的な性質には常にべき乗分布が顔を出します。そういうわけで、私は一時期、べき乗分布にも深く関与してきました。

対数正規分布への関心を持ちはじめた動機については、上で述べた介護期間の調査がきっかけです。1990年代に入って従来の物理学どころか自然科学の範囲さえはるかに超え、社会科学の領域にまで範囲を広げる複雑系が話題になるにつれ、そこでの基本的な統計分布は何であろうかと考えるうちに、対数正規分布に関心を持つようになったのです。

――本書執筆にあたっての御苦労、あるいは興味深かったことがありましたら。

松下:これまでずっと理系の分野の教育・研究に携わってきたにもかかわらず、私はパソコンを使いこなすことができない古いタイプの人間です。もちろん、ワープロとして、あるいはメールのやり取りなどにはパソコンをいつでも使っていますが、スマホとなるともうだめです。

それでは、なぜパソコンを駆使して統計分析をしなければならない本書を書けたのかと思われるでしょうが、私の周囲には有能な若者たちがたくさんいて、彼らに助けてもらったからです。特に本書を書くにあたって古いデータを分析した結果はそれなりに持ち合わせていたのですが、それを新しいデータで置き換えて統計分析をし直すことが私にはできなくて、大変困りました。この点についても、かつての仲間にはすっかり助けてもらいました。

特に興味深かったのは、世界各国のGDPやGNPなどのデータを新しいものに変えても、それらが対数正規分布に従うという性質が、半世紀を経ても全く変わらないということでした。統計データの数値そのものは変わっても統計分布は変わらないということは興味深いことであり、統計分布の重要さを如実に示しています。

――最後に若い人々に伝えたいということがありましたらお願いいたします。

松下:誰もが子供のころ、身の回りのいろんなわからないこと、不思議に思うことについて、両親や周囲の人に「なぜ?」、「どうして?」と尋ねた覚えがあるでしょう。ところが、小学校の高学年ぐらいになると、「そんなこと言ってないで勉強しなさい」と言われるようになり、素朴だけど大人にはすぐに答えられないような質問は抑えられ、自分からもしなくなる。

しかし、これからの若い人たちにはぜひとも子供のころのあの好奇心を思い出して、身の回りのこと、自然や社会のことについてぜひとも疑問を持ったり、積極的に質問したり、仲間と議論したりしてほしいと思います。これは文系、理系には関係ありません。まさしく「聞くは一時の恥、聞かぬは末代の恥」です。

自分自身がそうだったからあまり強くは言えないのですが、私の少ない経験上でも、アメリカやヨーロッパに比べて、日本では授業の際でも極端に質問が少ないですね。友達と話し合ったり、議論したりするネタは、身の回りのことを考えればいくらでもあります。しかもほとんどの問題は、異常気象や原発問題を例にするまでもなく、若者たちの将来にそのまま強く影響することが非常に多く、今の政治家や力を持つ老人たちに任せておくわけにはいかないことばかりです。

このことに関して、私には座右の言葉があります。現代科学の基礎を築き、人類の平和の問題にも生涯にわたって貢献したアインシュタインが述べた「昨日に学び、今日を生き、明日に希望を持つ。重要なことは、疑問を持ち続けること!」です。

小学、中学、高校は言うに及ばず、大学での授業というのも、授業科目の最も基礎的な部分を教え、学ぶものです。その理由ははっきりしていて、学ぶ側は将来教員になる者もいるでしょうし、家業の酒屋さんを継ぐ者もいるかもしれません。彼らはそれぞれに多種多様な職業に就くのであって、決してある特定の、特殊な会社に就職するものばかりではありません。

このような場合に可能な授業は、どのような科目であれほとんど必然的に、誰にでも共通するような最も基礎的な部分を教え、学ぶことになるのです。残念ながら、このような授業は大抵の場合、それほど面白くない。しかし、面白くなくても基礎的なことを学んでおくと、月日が経つうちにそれが血となり肉となって必ず役に立つものです。基礎的なことというのは汎用性があり、幅広く応用が利くものだからです。

松下貢(まつした・みつぐ)

1943年,富山県出身.東京大学工学部物理工学科卒,同大学院理学系物理学博士課程修了.日本電子(株)開発部,東北大学電気通信研究所助手,中央大学理工学部助教授,教授を経て,現在.同大学名誉教授.理学博士.
著訳書『フラクタルの物理 (I),(II)』(裳華房),『物理学講義』シリーズ全5巻(「力学」「電磁気学」「熱力学」「量子力学入門」「統計力学入門」)(裳華房),『英語で楽しむ寺田寅彦』(共著,岩波科学ライブラリー),『キリンの斑論争と寺田寅彦』(編著,岩波科学ライブラリー)ほか.