2020 03/11
経済社会の学び方

第8回 因果推論との向き合い方②――原因から結果へという考え

ルビンの壺(https://commons.wikimedia.org/wiki/File:Rubin2.jpgより)

■ルビンの壺に見る認識の特質

 これまで述べてきたような、学問における認識の性格の相違にとどまらず、そもそも人間の物事の理解や納得のしかた自体に、因果的な説明を求める本源的な性向があることは否めない。人間には「なぜ?」と問う性癖があり、この「なぜ?」に対して、「なぜなら」「そのわけは」という形の言説でわれわれは満足するのだ。2歳児や3歳児と話をしたひとは、「どうして」という問いを連発されて困ったという記憶があるはずだ。

 この「どうして」、「なぜ」という問いは、ひとつの個別事象に対して発せられることもあれば、一群の事象の連なりに向けられることもある。「近年コンピューターの価格が大幅に下落しているのはなぜか」というような問いは前者の例であり、「太平洋戦争はなぜ起こったのか」という歴史上の時間的経過を含む問いは後者の例である。

 こうした問いに対する答えとして、ヒュームが論じたように、ある事象を観察し、それより先に起こったことがその事象を惹き起こし、その事象に続いて起こったことがその結果であるとわれわれは考えがちだ。Aが起こり、その後にBが起こった、したがって、Aが原因でBが起きたと理解しやすいのだ。その「系」として、Bを防ぐためにはAを防げばよい、という推論が無意識に生まれる(post hoc ergo propter hoc)。「あなたが来るまでこの村には何のトラブルも起きなかった。あなたが来てから次々と困った問題が発生した」という主張はその典型であろう。

 また、二つの運動が同時に起こり、そこに空間的な関係性が見て取れると、そうした関係から人間は因果性を感じ取る傾向がある。たとえば、夜半の「空」の月が白くて細い雲に覆われると「海」に烏賊の大群が発生するというような推論をする場合だ。

 この種の因果的推論は、必ずしも想定する因果の連鎖のメカニズムへの理解を伴うわけではない。むしろ自分が事前に持っていた知識(世界像)と、感じ取った現実(perceived reality)が混ぜ合わさって、意識されざる推測(直感?)によって結論に到達していることがある。心理学の教科書でよく見られる「錯視」や「騙し絵」も、感覚の段階でそうした操作を瞬時に行っていることを示す例であろう。

 目は無意識のうちに視覚情報を取り入れているが、脳がそうした無秩序な視覚情報に「文脈」を与えていると解釈できる。その「文脈」の与え方は、ヒュームの指摘するように経験によって形成された知識に規定される場合が多い。視覚による認識の分かりやすい例は「ルビンの壺(Rubin’s vase)」である。黒地に描かれた白地の図形が、向き合った二人の顔に見えるが、大きな白い壺の様にも見える。描かれた像と下地の双方が意味を持ちうる場合、見る者は自分にとって意味を持つ、あるいは自分の知っているイメージや事物をその絵から読み取る。「図と地の分化」と呼ばれる感覚や知覚、経験・記憶の情報処理過程に現れる人間の認識の特質とされている。

■ケインズの指摘

 われわれは、世界を詳しく、統一的に、そして実際以上に深く理解していると信じ込んでしまいがちだ。しかし実際は、溢れんばかりの情報をその上面だけに目をやりながら「消費」しているだけであって、物事の原理原則を必ずしも深く読み取っているわけではない。そして目にした情報をそれまで自分が持っていた情報に適合させているに過ぎないことが多い。これこそヒュームが論じた蓋然的知識の因果的推論である。主体とその行為の間の因果関連を事後的に理解するために、既知のアイディアや過去の思想や経験で物事を解釈してしまうのだ。

 こうした点について、J.M.ケインズは『一般理論』の最後の「一般理論の誘う社会哲学――結語的覚書」を、しばしば引用される次の文章で結んでいる。

「経済学者や政治哲学者の思想は、それらが正しい場合も誤っている場合も、通常考えられている以上に強力である。実際、世界を支配しているのはまずこれ以外のものではない。誰の知的影響も受けていないと信じている実務家でさえ、誰かしら過去の経済学者の奴隷であるのが通例である。虚空の声を聞く権力の座の狂人も、数年前のある学者先生から〔自分に見合った〕狂気を抽き出している。(中略)だから、役人や政治家、あるいは扇動家でさえも、彼らが眼前の出来事に適用する思想はおそらく最新のものではないだろう。だが〔最新の思想もやがて時を経る〕、早晩、良くも悪くも危険になるのは、既得権益ではなく、思想である。」(岩波文庫、間宮陽介訳)

 このケインズの言葉は、新しい考えが理解されて浸透するのに時間がかかるのは、新しい情報や考え方を、それまで自分が持っていた情報にうまく適合させることに傾注してしまうからだということを語っている。ここにはヒューム哲学に傾倒したケインズの世界観がはっきりと読み取れる。

■識別問題――統計的推論に関心がある人のために

 因果の推論を「一般論」として論じることはできない。いくつかある推論の方法を区別しておく必要がある。1)原因と思われる要素の変化が結果を変化させることから、因果関係を推定する場合。2)原因と結果の間に横たわるメカニズム(構造)がはっきりしている場合。3)原因となる要素とその結果と考えられる現象が、連続的な変量として観測できる場合は、両者の間に一対一対応の関数関係を当てはめることができる。そうした場合、その関数関係に従って人々は学習したり予測したりすることが可能になる。

 以下、しばらく統計的推論に関心がある人向けの話をしたい。難しいと感じる人は次の項に進んでいただいてかまわない。

 50年ほど前のことになるが、筆者が大学院で計量経済学を受講した時、主要なトピックは二つあった。ひとつは、ガウス=マルコフ流の回帰分析を用いた推定値はいかなる(望ましい)性質を持つのか、そして回帰分析の基本とされる「ガウス=マルコフの定理」で前提とされた条件が満たされていない場合、「その推定値はいかなるバイアス(偏り)を持つのか、どれほどチラバリの少ない頑健なものか」、そして「ガウス=マルコフの定理」で前提とされる条件が満たされていない場合、「推定方法をどのように改善すればよいか」という問題である。

 もうひとつの主要トピックは、経済的な変数の間に「すべてはすべてに依存している」、あるいは「相互に影響を与え合っている」という関係があるとすれば、そのような連立方程式体系は、いかに適切に推定できるのかというトピックである。この問題は、変数間の関係、すなわち何が何を決めているのかという問いに繋がる。言い換えれば、どこに因果関係を認め、どこに相互に影響し合っている関係を措定するのかという理論モデルの構造に関わっている。多くの変数が相互に依存しあっている連立方程式の体系を考えるとすれば、Ý1、Ý2、Ý3、……はそれぞれ相互依存の関係にある、その理論構造の中で決定される変数(内生変数 — endogenous variable)であり、その数は方程式と同じ数でなければならない。これに対して、X1、X2、X3,……はその理論構造(システム)の外から「一方向」にシステム内の内生変数に影響を与える変数であり、外生変数(exogenous variable)と呼ばれる。

 外生変数の変化が最終的に内生変数にいかなる量的変化をもたらすかという分析は、因果的推論のひとつの形である。しかし内生変数同士の間では、因果関係は一方向だけに働いているわけではないため、因果的推論を適用することはできない。その時、外生変数の係数にどのような制約を課したならば、われわれは求める構造式の係数を「求めていたもの」として同定(認知する― identify)できるのか、という理論的究明が必要になる。この問題は「識別問題(identification problem )」と呼ばれた。

 この識別問題が一時さかんに論じられたが、最近は言及されることが少なくなった。その経緯の正確かつ明快な解説は、新しい計量経済学のテキストに譲る他はない。簡単に要約をすれば、「推定結果から予測をする場合、構造方程式(連立方程式の体系)によってはじめて変数間の因果関係を論じることが可能になるのであって、推定式左辺の説明されるべき内生変数を右辺の説明変数の中にも含む単一の推定式で得られた結果は、因果関係の説明や政策論のために用いることはできない」ということになる。

■相関関係と因果関係の混同

 さて、以上の説明は相関関係と因果関係の混同という問題につながる。

 内生性を無視した、相関関係を因果関係として解釈することの誤りを、F. フィッシャー教授は次のような例を挙げて説明した(The Identification Problem in Econometrics)。

 ……かつてロシアでコレラが流行したことがあった。政府はその疫病を根絶するために、最も死者を多く出している地域に医者を派遣した。S県の農民たちは自分たちの遭遇している状況を議論し、各地の医者の数とこれら地域の罹病状況を調べ、これら二つの数の間に非常に高い相関(correlation)があることを見出した。この動かしがたい事実によって、農民たちは蜂起して医者たちを殺戮した……。
(このエピソードは、「E vsey. D. D―に負っている」とフィッシャー教授は断っているが、「D-」は、経済成長論で先駆的な研究をした同僚のドーマー教授(ロシア生まれ)に違いない。)

 派遣された医者の数は罹病者数によって政府が決めたものだ(感染者が多いから多くの医者を派遣した)。しかし多くの医者によって患者の数が減少するという方向の力も働く。コレラ患者の数はそれ自体、疫病の伝播の法則と各地方の衛生状況にも依存している。

 話のポイントをフィッシャー教授は次のように説明している。歴史的に(時の流れに沿って)変数間の相関関係を調べることは、観察された変数間の相関を乱すようなことが起こらない(「正常」状態が続く)限り、予測のための簡便な方法かもしれない。「正常」な状況においてはそのような予測は、因果構造の研究に基づく予測よりもよい予測が可能であろう。しかし、その変数の間の関係を変えてしまうような何らかの変化が起こった場合、構造に関する情報は不可欠になる。システムのひとつ、あるいはそれ以上の数の変数に影響を与える政策を採ることが望ましい場合もあるだろうし、また、歴史的に連動してきた変数が何らかの転換点に到達したときに(構造変化を来して)そうした関係性が断ち切られることもある。

■社会現象における因果関係把握の難しさ

 このように考えると、社会研究における因果関係の把握は、想像するほど容易ではないことが分かる。例えば、いま xが、yとzの共通の原因だとする。その場合、xが起こったとき、もしyとzが独立の事象であれば、yとzは独立に動くはずだ。 しかしxを共通の原因とするためにyとzが同じような動きを見せることから、yとzの間の因果関係を推測してしまうかもしれない。

 しばしば挙げられる例として次のようなものがある。「アイスクリームの売り上げが伸びると、水死者数が増える。したがってアイスクリームが水死の原因だ」。このような推論は、あまりにも馬鹿げているため、笑い話のように見える。しかしこれは先にフィッシャー教授の挙げたロシアにおけるコレラの蔓延と医者の数の増大との関係を因果関係と捉える推論と同じである。

 またxがzの原因、yもzの原因だとすると、二つの独立した原因xとyがzの結果を支配することになる。さらにxとzの間にyという要因が絡まっているような場合もある。これもよく知られた例であるが、「明かりをつけたまま寝る若者は近視になる確率が高くなる」という命題をめぐる医学関係の議論がある。この命題は統計的相関としてアメリカの医療機関で検証されたものだが、のちの研究で「両親が近視の子供は、近視になる確率が高い」(x)、「近視の両親は子供を明かりをつけた寝室でねかせることが多い」(y)という二つの命題が統計的に検出された。その結果、元の命題、すなわち「明かりをつけたまま寝る若者は近視になる確率が高くなる」(z)は、そのままの形では直接の因果的推論として成立しないことが示された。「明かりをつけたまま寝る」という事象には「両親の近視」という変数が因果の鎖の中に介在していたのだ。

■統計的差別の理論

 問題とする個別事例についての具体的な情報が不足しているとき、人はどのように推論し具体的判断に至るのであろうか。ひとつの個別ケースついて、何らかの判断を下さねばならない場合の因果的推論の典型例がある。それは「過去こうであったから、今度もこうなるはずだ」という推論だ。そうした保守的な選択をすることが合理的な場合がある。例えば、ある属性(attribute)について個別ケースの推量を行うとき、その属性を持つ集団についての経験的(統計的)な情報を用いて帰納的な推論を用いると、損害や費用が小さくて済む場合があるからだ。

 こうした推論を具体的に示す例のひとつが「統計的差別(statistical discrimination)」と呼ばれる理論である。労働市場への適応例が分かりやすいので紹介しておこう(以下の説明は労働経済学の教科書、G. Borjas, Labor Economicsによる。最初の理論論文はE.S. Phelps, “The Statistical Theory of Racism and Sexism,” AER 62, 1972)。

 ある企業の求人広告に対して二人の応募者があったとする。一人は女性、もう一人は男性であった。当該企業は人事に関して男性・女性に関する差別的な感情や意識は皆無だと仮定する。履歴書では二人は新規学卒であり、卒業した大学も同じ、学んだ専門分野も取得した単位も成績も同じ、要するに「能力」を示すデータが全く同じだとする。そして二人は面接も成功裡のうちにパスした。

 採用枠が一名の場合、人事の採用担当者はどのような推論によって採用を決めるだろうか。募集している人材に期待されている仕事内容が、新規学卒者が入職してすぐにひとりで遂行できないような難易度の仕事であり、その仕事の基礎的部分を習得するのには少なくとも2、3年かかり、高度な内容の技能を身に付けるためにはさらに4、5年を要するとする。面接では両者とも、「この企業でこの仕事をずっと続けて一人前になりたい」と前向きな姿勢を示しているが、人事担当者は「確かだろうか」という不安を持つ。最初の2、3年この企業が熱心に教育し、あらゆる訓練機会を与えても、2、3年でやめられると、訓練投資として多額の費用を投下したにもかかわらず、その果実(「収益」)を享受できないことになる。

 そこで人事担当者は、二人にどれだけの定着率を期待できるのかを考えざるを得なくなり、自社の過去のデータや同業他社のデータを集める。その結果、同じ職種の女性の離職率から、20代、30代の前半で結婚や育児で離職する女性が多いことを突き止める。今その採用を考慮中の個別の女性に関しては、彼女の将来の就業行動がどうなるのかは判断できない。しかし自分が集めた統計データでは、同業同職の女性の離職率が男性よりも有意に高いことが判明している。結局、この会社の人事担当者は、男性の応募者の採用に踏み切る。

「統計的差別」の例は次の点を明らかにしてくれる。履歴書や面接では応募者の真の能力を測定することはできない。こうした情報の「不完全性」を補うために、過去のケースや他社のデータによって、リスク情報に関する統計(男女間の離職率の平均値の違い)を利用して、個別具体的な二人の応募者の将来行動を予測するのである。

 こうした推論はなぜ統計的「差別」と呼ばれるのか。それは人事担当者の判断が、統計的に低い離職率を過去示してきた「男性グループ」に属する応募者に有利に働き、逆に高い離職率を示してきた「女性グループ」には不利に働くと見るからだ。

 しかし類似の現象はいたるところで発生している。この選好を「差別」と見るか「区別」と見るかは観察者の考え方次第ということになる。しばしばあげられる例として、生命保険における保険料は年齢や性、あるいは健康状態に応じて設定されている。これを「差別」と呼ぶ人はほとんどいないだろう。こうした保険の設計には、病気に罹る確率や死亡率が性と年齢によって異なるという動かしがたい統計データを根拠にしているからだ。

 ある一人の人間が保険に入ろうとした時、その被保険者がどれほど長く生きるのか、どれほど健康であるのかについて完全な情報は存在しない。だからこそ合理的な経営を行う保険会社は、過去の健康や生存率に関する統計(平均)の情報を利用する。一般に女性の方が長寿であるという統計的な事実に基づいて、女性の保険料を安くするという原則が合理的だとして受け入れられるのである。したって、「差別」であるか「区別」であるかの境界は、合理性が社会的通念にどの程度なじむのかという問題と捉えることができる。

 統計的な差別理論は、個別ケースに関する完全な情報が無いときに、統計的データ(ヒュームの言う「蓋然的知識」)を用いて、因果的な推論を行う典型的なケースと考えられる。

(以下、次回。参考文献は、新書刊行時にまとめて表示いたします)

猪木武徳(いのき・たけのり)

1945年、滋賀県生まれ。大阪大学名誉教授。京都大学経済学部卒業、マサチューセッツ工科大学大学院博士課程修了。大阪大学経済学部教授、国際日本文化研究センター所長、青山学院大学大学院特任教授などを歴任。主な著書に、『経済思想』(岩波書店)、『自由と秩序』(中公文庫)、『戦後世界経済史』(中公新書)、『経済学に何ができるか』(中公新書)など。