嗜好のごみ箱

地球船宇宙号

相関と因果

最近、「それは相関関係であって、因果関係ではないよ笑」という指摘をよく聞く。

この指摘自体は至極まっとうではあるのだけれど、では一体どうすれば相関から因果へと羽ばたいていけるのか。そもそも相関関係と因果関係はどう違うのか、なぜ相関関係よりも因果関係が喜ばれるのかを考えていく。

相関関係

まず、二つの変数の間に規則的な関係があるとき、これを「相関関係がある」といい、パターンとしては以下の2つが考えられる。

  • 正の相関・・・一方が増えた時に、もう一方も増える ex)身長と体重
  • 負の相関・・・一方が増えた時に、もう一方が減る ex)平均気温と年間積雪日数

ただし、変数間に一見、相関関係がみられても、それが第三の変数(潜在変数)による見せかけの相関関係であることがある。これを疑似相関という。これこそが、相関関係だけでは不十分だと言われるゆえんだ。

相関関係の分類

相関関係について、基本的な事柄をおさらいしたところで、次は分類をしてみよう。

高野・岡(2004)*1は、相関関係を因果関係という観点から、以下の5つに分類している。

変数Aと変数Bの間の相関関係の分類

  1. 変数Aが原因、変数Bが結果
  2. 相互的な因果関係
  3. 変数Aが結果、変数Bが原因
  4. 変数Cが原因、変数Aも変数Bもその結果
  5. たんなる偶然

図にすると、こんな感じだ。

f:id:gluckwell:20211116110606j:plain

まず、想定していた因果関係①ではなく、相互的な因果関係②の可能性がある。
たとえば、GDPと初等・中等教育の普及率の相関関係。GDPの高い経済的に豊かな国では、教育設備を整えられ、子供は働かずに学校に通うことだできる。識字率は上がり、労働生産性が伸び、結果的にGDPを押し上げる。一方がもう一方の原因になるのではなく、両者ともが原因であり、結果である。「鶏が先か、卵が先か」のパターンだ。

他には、変数Aが原因で変数Bが引き起こされる①と考えていたが、実はその逆③がもっともらしいということがある。
たとえば、警察官が多い地域では、犯罪の発生件数が多い。だからといって、警察官が多い(原因)から、犯罪件数が多い(結果)というのはナンセンスだ。もちろん、警察官が多いことで、検挙数が増えるというのは考えられる。しかし、犯罪者がわざわざ警察官の多い地域に越してきて犯罪を犯すとは考えづらい。そんなことするのは、犯人の半沢さんくらいだ。「これが犯罪都市、米花町か」

なので、犯罪が多い(原因)ため、警察官が多い(結果)と考えるのが自然だろう。この関係を、正確な統計学の用語かは定かではないが、「逆の因果関係」と呼ばれるらしい。

ちなみに用語を導入しておくと、原因だと想定する変数を独立変数、または説明変数、結果だと想定する変数を従属変数、または目的変数という。様々な呼び方があるのは、対象とする領域によって思想や意義が異なるためだが、違いはないと思っていい。慣習みたいなものだ。

また、一見すると相関関係があるように見えても、実は変数AもBもほかの変数の結果③であるパターンがある。
有名な例でいうと、「アイスクリームの売り上げが増えると溺死事故が増える」という関係だ。いわずもがな、アイスクリームに人をおぼらせる力はなく、気温が上昇したことで、アイスを食べる人が増えたり、海やプールに行く人が増える。すでに触れたとおり、これを疑似相関というのだが、この言葉は少しややこしい。なぜかというと、関係のありそうな二変数を統計解析すると、実際に相関関係は現れるからだ。ここで大事なのは、「本当はこの二変数間に相関関係が存在しないのに、存在するように見えてしまう」ことではなくて、「二変数間には相関関係があるが、この相関関係はほかの要因(剰余変数、潜在変数)によってもたらされたものだ」ということを峻別することにある。つまり、変数Aと変数Bをもたらしたものが他にあるにもかかわらず、変数Aが原因だと推論(第一種の過誤)してしまうことに気をつけなけばならないということだ。これは交絡と呼ばれる。相関関係より因果関係が好ましいとされる一因がここにある。ほかにも、因果関係は人の思考に深く根ざしているからという理由もあるが、ここでは触れないほうがいいだろう。またの機会に。

それから、単なる偶然⑤というパターンもある。
たとえば、アメリカにおける政治資金の額と、スポーツの新記録を年ごとにプロットすると、「巨額の政治資金が使われた年には、新記録の数が多い」という関係が現れるようだ。こんな風に言われたら、陰謀論好きでもなくても政治資金がスポーツ界に流れているのではと勘繰ってしまう。だが実際は、「アメリカの大統領選挙と、オリンピックが同じ年に行われる」というだけなのだ。なので、去年はコロナの影響でオリンピックが開催されず、バイデンの勝利にのみが起こったので、この相関は見られないだろう。

以上が相関関係の分類だ。もう一度おさらいすると、以下の通り。

変数Aと変数Bの間の相関関係の分類

  1. 変数Aが原因(=独立変数、説明変数)、変数Bが結果(=従属変数、目的変数)
  2. 相互的な因果関係 (鶏が先か、卵が先か)
  3. 変数Aが結果、変数Bが原因 (逆の相関関係)
  4. 変数Cが原因(=第三の変数、潜在変数、剰余変数)、変数Aも変数Bもその結果 (疑似相関、交絡)
  5. たんなる偶然

では、相関関係を見つけた後、因果関係を見抜くにはどうすればいいのかを見ていこう。

因果関係

因果関係を見極めることは、科学において最も重要といえるもので、16~17世紀に活躍したフランシス・ベーコン以来、多くの哲学者や科学者が喧々諤々の議論を交わしてきた。

その中でも、よく引き合いに出されるのが、19世紀イギリスの哲学者、ジョン・スチュアート・ミルの提唱した、三つの原則だ。

  1. 原因は結果よりも時間的に先行していること
  2. 原因と結果が関連していること
  3. ほかの因果的説明が排除されていること

第1原則は因果の基本的性質であり,第2原則は相関の存在の有無を確かめる。第3原則は剰余変数の統制を意味する。因果関係の特定を目的とする実証実験では,このミルの3原則を満たす必要がある。

たとえば、心理学者アルバート・バンデューラが行った有名な実験、ボボ人形実験を例にとってみよう。

まず、実験的研究における、実証のロジック*2を確認すると、以下の通り。(観察的研究はまた異なる)

f:id:gluckwell:20211116110706j:plain

天野成昭 心理実験のキーポイントを参考に作成

原因と仮定した変数を操作し、その結果となる変数を測定する。ほかの変数をコントロールした状態で、もし結果に変化があれば、その変化は独立変数の操作によって生じたと考えられる。つまり、操作した変数と測定した変数には因果関係があると判断できるというわけだ。簡単にいったが、そうは問屋が卸さないのが現実なのだが…。

ボボ人形実験の概要を上の図に当てはめると、下のようになる。

f:id:gluckwell:20211116110729j:plain

まず、実験参加者は3〜5歳の男子36名、女子36名の計72人。彼らは全員スタンフォード大学の保育園の生徒。

子どもたちをA、B、Cの3グループに24人ずつ割り振って実験が行われた。

Aグループ(実験群)の子どもたちには、ボボ人形に対して大人たちが攻撃的な行動(攻撃的なモデル)をとっている映像が見せられた。その映像の中では、大人がボボ人形を叩いたり、蹴ったり、罵声を浴びさせている様子が映っている。

Bグループ(対照群)の子どもたちには、ボボ人形に対して大人たちが攻撃的な様子を一切見せない(非攻撃的なモデル)映像が見せられた。大人たちはこの映像の中では他のおもちゃで遊んだり、静かに過ごしている。

Cグループ(対照群)の子どもたちには、何も映像を見せなかった。

その後、子どもたちをそれぞれボボ人形を含めたおもちゃがたくさんある部屋に入れ、観察した。

その結果、Aグループの子どもたちは、BグループやCグループに比べて、ボボ人形に対して攻撃的な言動が遥かに多いことが見受けられた。つまり、攻撃的な大人の言動を見たことが原因で、子供が攻撃的な言動をとるようになったという因果関係が導ける。

ちなみにボボ人形というのは、空気で膨らませたひょうたん型のビニール人形で、重心が下にあるので倒れない。何度でも起き上がるサンドバックだと思ってもらえればわかりやすいだろう。

ここで、ほかの因果関係を考えることができるかが問題になってくる。

たとえば、攻撃的な環境で育った子供はより攻撃的な言動を取ると仮定する。そして、対照群よりも実験群に攻撃的な環境で育った子供が偶然多くいた場合、映像を見たことが原因か判然としなくなる。ほかにも、異性の大人を見たことで性的興奮を覚え、攻撃性が増すなんてことも考えられる。

しかし、実際には、子供たちをグループに分けるときに、男女が半々になるように、それもランダム(無作為)に割り振り、映像に出てくる大人も、同性・異性が半分ずつになるように統制されている。そのため、実験群が攻撃的な環境で育った子供ばかりになることは可能性が低く、性別によるものでもなさそうだとわかるわけだ。

それでも、すべての可能性がつぶせるわけではない。たとえば、参加したのは3~5歳の子供だ。子供の攻撃性がこのころあいに増す傾向があるのかもしれない。よく、坊主にすると髪質が変わるというが、坊主にする人の多い時期が成長期と重なり、髪を剃ったことで髪質が変わったと感じられるだけだそうだ。これと同じようなことが起こっていたとしても不思議ではない。ほかにも、実験という非日常的な空間でストレスが溜まり、ボボを殴ってイライラを発散していたのかもしれない。

大切なのは、因果の推定は大変だということ。相関関係は比較的簡単に見つかる。しかし、そこから因果を推定するのは時間と労力が必要なのだ。

それでも、因果関係を探すことは大きな意味を持つ。それは、実証の過程でも出てきたように、操作によって結果を変えることができることだ。つまり、因果関係がわかってしまえば、望ましい結果を手に入れるために原因を操作すればいい。これは人類の根源的な欲求である十同時に、社会的な応用を考えれば大きな魅力を持つ。

だからこそ、因果の断定は慎重に慎重を期し、その応用範囲(外的妥当性)を明確にしなければならない。

こう考えていくと、「それは相関関係であって、因果関係ではないよね」と軽々しく言えないのではとも思ったりする。

 

*1:高野陽太郎,岡 隆(編),心理学研究法 補訂版—心を見つめる科学のまなざし(有斐閣,東京, 2017)

*2:天野成昭 心理実験のキーポイント 日本音響学会誌74巻12号(2018),pp. 641–648

ゴミ箱というのは不思議だ。
まず、これから捨てようとしているものに対して、頭を悩ませなければならない。
材料、目的、用途、代替、可能性、いろいろと悩みぬいた挙句に捨てるのだ。
しかも、捨てたとたんに忘れることができるが、捨てたということはなぜか覚えている。
それは、捨てなきゃよかったの未練も、きっぱり忘れようの諦観も同時に内包する。
捨てられたものは多くを語る。ごみだったものはたからになり、たからだったものはごみになる。
臭ければ蓋をすればいいし、見たくなければ黒い袋で覆えばいい。捨てる神も拾う神もいるのだから。
酸いも甘いも嚙み分けて、辛いも苦いも味わって、やっとうまみに気づくのが人生の醍醐味だと云わんばかり。
今はごみかもしれないけれど、いつかたからになるかもしれない。
だから僕は喜んで、君たちをここに捨てていこう。