さくらももこさん、ご冥福をお祈りします

相関関係と因果関係

さくらももこさん、お亡くなりになる

漫画家のさくらももこさんが、さる8月15日、乳がんのため亡くなられました。53才でした。

さくらさんは、10年近く乳がんと闘病されていました。40代半ばでのがん発覚後も治療を続けながら、近しい人以外にはがん闘病のことは明かさず、たんたんと仕事されていたそうです。

日本禁煙学会による、ある指摘

さくらさんは、健康おたくである一方で、ヘビースモーカーであったそうです。これに関連して、 日本禁煙学会の作田学理事長が「タバコと乳がんについての最新知見」として、さくらさんの死について、「タバコと乳がんとの関連をまったくご存じなかったとしか思えません」と述べられています。

同学会のパンフレットによれば、 若い女性の乳がん(閉経前乳がん:日本のデータ)について、次のように掲載されているようです。

  • タバコを吸うと3.9倍、受動喫煙で2.6倍
  • タバコを吸わなければ、乳がんの75%が予防できます。すぐに禁煙を!
  • 禁煙と受動喫煙防止をしっかり実行したなら、日本の若い女性の乳がんを半減できます!

喫煙と肺がんは因果関係なの?

 たばこと癌との関係はよく論じられます。とくに、肺がんと喫煙の因果関係が指摘されています。 
  禁煙協会などは、「喫煙と肺がんの因果関係はすでに複数の集団において明確に立証されている 。これを反証するデータは、存在しない 」 と指摘する傾向にあります。
 他方、「喫煙と肺がんとの直接の因果関係は、科学的に立証されていない」「喫煙者はストレスが多い。ストレスが死亡につながる」といった反対意見もあります。

生存バイアスとは何か

さらには、 「私の祖父は二人ともヘビースモーカーで、どちらも90歳まで生きた。だから、ヘビースモーカーが寿命を縮めるというのはウソだ」との自己流の判断を下す人さえいます。

これは、「 生存バイアス」という認知バイアスです。生存とは生き残っているという意味です。つまり、一部の表面化している情報(サンプル)のみを利用して物事を判断する、水面下に隠れている情報を無視するために、判断を誤るというバイアスです。 実際にヘビースモークにより肺癌になって早死にした人を探せば、たくさんいるはずです。 

因果関係を巡る論争

最近、統計データを基に「喫煙率が下がったのに肺がん死亡者が増えた」という指摘をもって、喫煙と肺がんの因果関係の切り崩しを行う論調があるようです。

これに対して禁煙派は、「喫煙から肺がんが生じるのには20~30年の時間間がかかり、喫煙率が低下したからといって即座に肺がんが減るわけではない。肺がんリスクが変わらなくても人口が増えたら、肺がん死亡者数は増える。高齢者の割合が増えるとそれだけで、肺がん死亡率(粗死亡率)は大きくなる」などと反論します。

因果関係と相関関係は異なる

ここで因果関係の厳密な意味を見てみましょう。 
「Aという原因があればBという結果が生じる」ことを「AとBは因果関係にある」といいいます。これには「Aが増加すればBも増加する」という正の因果関係と「Aが増加すればBは減少する」といった負の因果関係があります。

一方、因果関係とはいえないものの、「AとBにはなんらかの関係がある」ことを「AとBは相関関係にある」といいます。

相関関係と因果関係はしばしば混用されます。交通事故の数が増えれば交通事故死者の数は増える。したがって両者が因果関係にあることはほぼ間違いありません。しかし、実際には因果関係と思っていたことが、単なる相関関係にすぎないことがしばしばあります。

野菜を食べる人は長生き?

高原野菜で有名な長野県は日本一の長寿県です。長野県民は高原野菜をよく摂取します。

ただし「高原野菜をたくさん食べる人に長寿が多い」からといって、高原野菜の摂取と長寿に直接的な因果関係があるとまでは断定できません。

なぜならば長野県には「きれいな空気」や「理想的な生活習慣」などがあり、これらが長寿にプラスの影響を及ぼしている可能性があるからです。

因果関係の成立要件

因果関係には、 原因が先で結果が後であるという時系列的な関係が必要です。そして、その関係には別の原因が存在していないことが必要です。

肺がん患者には喫煙者の比率が多いことは、統計上はほぼ間違いがありません。つまり、両者は相関関係にあります。しかし、肺がんの増加は喫煙だけが原因ではありません。ここに、喫煙と肺がんの因果関係の立証が困難な点があります。だから、別の要因であるストレスなどが影響していることを指摘するなど、いろいろな議論が生まれているのでしょう。

因果関係の立証はインテリジェンスの要諦

因果関係が立証されれば、それは近未来を予測する手助けとなります。原因がわかれば結果が予測でき、対策も取ることができます。

しかし、相関関係では不十分です。喫煙率を減少させることが肺がん死亡率を低下させる決定打とまでいえない点もここにあります。

国際情勢における情報分析では、因果関係の立証がとても重要です。そのためには、
「まず相関関係にありそうな事象をアトランダムに列挙する。列挙した事象のなかから、原因が先で結果が後であるという時系列的な関係がある事象に着目する。その関係には別の原因が存在していないことを証明する。」ということが重要になります。すなわち、因果関係の立証はインテリジェンスの要諦なのです。

吸いすぎにご注意

社会科学においては、因果関係の立証は非常に難しいとされます。まことしやかな因果関係を疑って見ることが、情報分析では極めて重要です。

「喫煙と肺がんの因果関係はすでに複数の集団において明確に立証されている」など断定的に言われると、「え、本当?」と考える。このことは重要です。

ただし、やはり喫煙は多くの病気の原因であることは間違いありません。 筆者は喫煙はしませんが、嫌煙派といわけではありません。
喫煙者の方々、吸いすぎには注意しましょう。

想定外と不確実性の低減

北海道大地震の発生

9月6日未明、北海道胆振東部を震源とする震度7の地震が発生しました。亡くなられた方、行方不明者の関係者、負傷者、そして家屋損害やインフラ断絶などの被害にあわれた方、心よりご冥福並びにお見舞い申し上げます。

北海道において震度7の地震は初めてであり、予想外の感はあります。しかし、気象庁はすでに以前から、北海道に震度7クラスの地震が起きる可能性はある、との予測を発表していました。ですから、想定外とは言えません。ただし、何時起こるかは分かりませんし、これという予報もなかったので予想外ではありました。また、一つの発電所の被害によって北海道全域が停電になることは想定外であったのかもしれません。つくづく人間の想像力の欠如というものを思い知らされます。

想定外とは何か

想定外という言葉は、2011年の東日本大震災において流行しました。これは事前に想定した範囲を超えていることです。人間は物事を考えるうえで、一定の条件、すなわち枠を設けて考えます。これは情報分析の基本であり、想定のことを前提という言い方もします。

たとえば、中国の将来情勢を分析する上で、当面は共産党の一党独裁が継続するという前提(想定)で、その将来動向を見積もることになります。こうした前提がないと、分析の焦点が定まらず議論が発散し、政策や行動に活用できるインテリジェンスを作成することはできません。

わがくにの地震対策では、最大の地震は「東海」「東南海」「南海」の3地震が連動して起こるマグニチュード9クラスを想定しています。当然、これ以上の地震が起こる可能性は排除できませんが、キリがないので、最大規模をマグニチュード9としているのにすぎません。

想定外はなぜ起こるのか

物事を考える上で“考察の枠”を仮に設定しているだけなので、想定外は必ず起こります。しかし、ここで問題なのは、その事象が起こり得る蓋然性はかなりあるにもかかわらず、これを想定外として考察しない場合です。

こうした不注意な想定外は、思い込み、希望的観測、想像力の欠如、思考停止などで起こります。なかでも、自分にとって都合の悪いシナリオが浮かんで気分が滅入る、どうせ考えても自分では対策は取れないなど、起こり得るシナリオを考えようとしない思考停止がよく起こります。つまり、「なるようになるさ」「なってから考えればいいやる」という諦念感と開きなおり、「なるはずはない」「信じる者は救われる」的な希望的観測などが心理を支配します。

不確実性の低減

想定外とよく似た概念で不確実性という言葉があります。また、情報分析の目的は不確実性の低減にある、ともよくいわれます。

不確実性とは「確実性(絶対確実)」の反対語であり、事象が起きるか起きないか分からないという、意思決定者の不確かな精神状態のことをといいます。ただし、より厳密にはリスクと(真の)不確実性に区分することができます。 リスクは起こりうる事象が分かっていて、それが起きる確率もわかっているもの。つまり、測定可能な不確実性のことです。    一方、(真の)不確実性とは、起こりうる事象が分かっているが、それが起きる確率が事前には分からないもの。つまり、測定不可能な不確実性をいいます。

厳密な意味での不確実性とは起こり得る事象が分かっているものであるので、いずれも想定内です。つまり、不確実性の低減とは、第一に不確実性の領域を拡大する、すなわち想定内の領域を拡大し、想定外の領域を縮小することです。つまり、想像力を発揮して、想定外の事象を可能な限り想定内に組み込み、対応策を考えることです。ただし、なんでもかんでも組み込むと情報分析はできなくなるし、一方、組み込み不足は本来は想定内である危機やその兆候を見落すことになるので、その兼ね合いが重要です。

シナリオの蓋然性を提示

第二に、未来におけるいくつかの対応すべき起こり得る事象(シナリオ)と、そのシナリオがどの程度の確立で起こるかを提示することです。

シナリオが起りえる確立のことを、蓋然性あるいは確度(確証レベル、INTELLIGENCE CONFIDENCE LEVEL)、といいます。それは、通常は%をもって示されます。たとえば、天気予報において以下の予報があったとしましょう。

① 明日、雨が降る可能性0%、100%

② 明日、雨が降る可能性は50%

③ 明日、雨が降る可能性は80%、20%

①のように、国家政策や企業経営において、関連する事象の発生率が0%、100%ということは一般的にほとんどありません。では、②の50%ではどうかというと、これは「降るかどうかわからない」「降るかどうかいえない」ということであり、これでは判断や意思決定に役に立ちません。

よって、③のように50%を中心に上・下の幅の確度として提示する、これにより意思決定を支援することが情報分析の目的です。

たとえば雨が降る可能性が40%ならば、「少々のリスクはあるが、予定どおり屋外で行事を実施しよう」、あるいはその可能性が60%ならば「明日の行事は体育館に変更しよう」、そして80%ならば「中止にして別の行事に切り替えよう」などと判断することになります。

 なお、わが国では、確度を明確に示した国家的なプロダクトは稀ですが、米国のプロダクトには以下の確度に基づいたプロダクトが作成されています。

また、二〇〇三年のインク戦争では、「サダム・フセインは大量破壊兵器を隠している」という誤った判断を下したという反省から、CIAは確度を評価する必要性を再認識しているとされます。

不確実性を低減するためには確度の評価に臨まなければなりません。

群衆の叡智

私が年間購読している某雑誌

私は、ある雑誌を年間購読しています。この雑誌は、筆者がかつて組織に所属していた時には、持ち回りで読むことができました。なかなか鋭い分析記事が多々あり、「なるほどな」と感心していました。でも、組織を離れると、情報収集もすべて自己負担となったので、購読紙を厳選しなければなりません。当該雑誌はしばらく読むのを止めていました。

この雑誌は完全宅配制度を採用し、書店では購入できません。だから、年間購読予約しか、読む方法がありません(図書館でも読めますが)。なお、宅配制度の定期購読は値段も高いのですが、なかなか良い雑誌があります。

この雑誌の特徴は、執筆者は原則として無記名となっていることです。誰しも著名人が書いたものとなると、つい信じたくなります。でも、現実の事実をうまく文脈に落とし込んでいるからといっても、情報の信憑性が高いかどうかは別の問題です。

無記名だからこそ、作者は所属組織に箍に縛れずに良質の情報を伝えることができるという利点があります。また、読者はバイアスにとらわれず、白紙の状態で情報(記事)に接し、「その情報には妥当性があるか?」などの視点を持って読むことができます。

ネット情報について

ネット上では、ジャーナリストの池上彰氏と作家の佐藤優氏による『「ネット検索」驚きの6極意(東洋経済)』という記事が掲載されています。

そこでは、以下の6つの極意が述べられています。

  • グーグル検索は効率が悪い
  • 有料辞書サイトを活用する
  • ウィキペディアは、見ても「参考程度」にする
  • 語学ができる人は「外国語のウィキペディア」もチェックする
  • 電子辞書で済まされるものは、それで調べる
  • 情報の新たらしさは「冥王星」

これらの極意から読み取れるように、両氏ともにネットへの過度な依存を警戒し、ネットよりも新聞の方が効率的であるなどの見解を述べられています。その理由を両氏の共著『僕らが毎日やっている最強の読み方』(東洋経済、2016年12月)からいくつか拾ってみましょう。

  • ネット情報はノイズ(デマ、思いつき、偏見)が過多
  • 記事が時系列に並ぶためにその重要度がわかりにくい
  • ネットで入手できる情報の多くが二次情報、三次情報である
  • 知りたいことだけを知ることになり、その他のことに関心が薄れ視野が狭くなる
  • ネットの論調が社会全体の論調だと錯覚する

以上の中でもっとも重大な問題点として認識すべきは、ネットは各人の自由な書き込みができるためにデマ、偏見などの巣窟となりやすいという点でしょう。

ネット上では、一人の人が何度も書き込んだり、情報を操作したり、視聴率・支持率を上げ下げしたりすることもできます。だから、ネットの論調が社会の声(世論)を客観的に反映したものではないとの指摘もたしかに当たっています。

しかし、こうした反面、格安経費でさまざまな情報が入手できるという、他では代替できない利便性があります。また、ネット上にも情報源をしっかりと明記した確かな情報も多数掲載されています。

図書館などに行かなくても、検索を基に情報を絞り込めるという点もインターネットならではの利点です。そのほか、新聞記事にはみられないようなネットユーザーの斬新な視点によって、新たな分析起点を得ることもできます。ネット情報の功罪を認識した上で有効活用に心掛けたいものです。

『ウィキペディア』の正確性はどうか

ネット情報の代表ともいえる『ウィキペディア』の正確性どうでしょうか。『ウィキペディア』は、しばしばその記事の正確性に対する疑義が提起されます。前述の佐藤優氏も、『ウィキペディア』は参考程度にする、と注意を発しています。これは不特定のボランティアによって書かれているという点にあるようです。すなわち、情報源の信頼性が低いということです。

これに関して、正確性において定評のある『ネイチャー』誌は、2005年12月のオンライン版にて、次のような記事を掲載しました。「ボランティアによって書かれた400万近い項目を擁するオンライン百貨事典『ウィキペディア』は、「科学分野の話題を扱った項目の正確性において『ブリタニカ百科事典』に匹敵する」との趣旨の記事を掲載しました(AP通信、2005年12月19日)。

筆者の体験からしても、『ウィキペディア』にはときどきは不確実な情報がありますが、『現代用語の基礎知識』や『知恵蔵』などの出版物と比べて正確性が劣るという印象はありません。

『ウィキペディア』には「群衆の叡智」という恩恵がある

『ウィキペディア』には、さまざまな人がこの記事に目にして、誤りを指摘するなど、常に衆目を浴びているという利点があります。

ジェームズ・スロウィッキー著の『「みんなの意見」は案外正しい 』(角川書店)では、「Wisdom of Crowds(WOC)」という概念が述べられています。これは、「群衆の叡智」あるいは「集合知」と呼ばれています。つまり、少数の権威による意思決定や結論よりも、多数の意見の集合による結論や予測の方が正しいというものです。つまり、『ウィキペディア』には、「群衆の叡智」という恩恵もあることを理解する必要があります。

情報源の信頼性と情報の正確性は異なる

『ウィキペディア』の話は別としても、一概に、権威があるその道の専門家が書いたから正確である、名もないボランティアが書いたから不正確である、という判断は禁物です。

情報の処理の一環に情報を評価するという作業があります。これは、情報の「良し悪し」を評価することです。誤った情報、偽情報(ディスインフォメーション)、意図的な情報操作が横行しているなかで、インテリジェンスの正確性を高めるためには情報の評価が重要となります。

情報の評価は大きくは、情報源の信頼性(Reliability)の評価、情報自体の正確性(Viability)の評価に分けられます。

まず情報源の信頼性ですが、これは情報を発信した情報源が信頼できるかどうか、複数の情報源から裏づけが取れるかどいうかということです。一方の情報の正確性とは妥当性、一貫性、具体性、関連性という4つの尺度で評価します。

情報源の信頼性が高ければ、一般的には情報の正確性も高いのですが、この両者には直接的な関連性はありません。

なぜならば、いくら権威のある信頼性の高い情報源であっても、「群衆の叡智」に勝てないことや、または情報源が意図的に嘘をつくことがあるからです。また、信頼性の高い情報源の情報であったとしても伝達段階における媒体の介在により誤った情報に転化することも珍しくありません。

だから、情報源が信頼できるかどうかということと、情報が正確かどうかということは別個に判断する必要があります。要は、情報源の信頼性にかかわらず、正しい情報もあれば誤った情報もあります。権威者の情報を無秩序に信じることには要注意です。「信頼できるあの人の情報にも間違いはある」ということです。

体操界に走った激震

度重なるスポーツ界の不祥事

昨年から、大相撲、ラグビー、レスリング、ボクシング、そして今回の体操とスポーツ界が揺れています。いずれも、暴力やパワハラがらみです。大相撲を除いては、権力を握っている体制派の方がマスコミやインターネットで叩かれて敗北しています。

宮川選手の「勇気」ある行動

今回の宮川紗江(18歳)選手の事件は少し変わっています。彼女のコーチである速水佑斗氏が暴力を振ったということで、体操協会側の塚原夫妻が、同コーチを無期限登録抹消にしました。

今日、格闘技といえどもスポーツ指導における暴力行為は“絶対悪”です。ですから、暴力を振ったコーチは体操界から追放、ということで一見落着をみるのが普通だったのかもしれません。塚原千恵子・女子強化本部長も、暴力追放という時流を捉え、ここぞとばかりに速水コーチと宮川選手の関係を引き裂き、将来有望な彼女に対するコーチングの主導権を握ろうとしたのかもしれません。

しかし、宮川選手は、暴力振るわれたことは事実であるが、速水コーチに対する協会側処分は重い、私は速水コーチに対する処分を求めていないし、これまでどおり速水コーチの指導を受けたい、旨の発言をしました。

さらに、塚原夫妻に「あのコーチから指導を受けるのはだめ。・・・・・・これでは五輪にも出れなくなる」などの強圧的な発言を受けた旨を明らかにして、「これは権力を使ったパワハラだった」旨を訴えたのです。

これに対し、一部(?)の体操関係者や元選手が宮川選手に対する支持を表明し、マスコミや世論は「18歳の少女の勇気ある行動」と挙って賛辞を送りました。

一方の塚原夫妻は当初、宮川選手の発言をほぼ全面的に否定して、徹底抗戦の構えさえ見せていました。しかし、関係者や世論がアンチ塚原で結集し、体制不利になりつつあることに恐れをなしてか、自らの非を認めて、謝罪する方向に戦術を転じました。

これまで、たびたび見てきた食品偽装問題のように、次第に立場が悪くなると、小出しに謝罪するといった“歯切れの悪さ”を、塚原夫妻の対応には感じました。

一方の、宮川選手の態度はまことに堂々としており、発言の論旨も明快です。前回のラグビー事件においても、悪質タックルを行った日大選手の謝罪態度がりっぱであったため、問題を起こした行為者でありながらも、ぎゃくに世間の評価を受けました。今回はこれと似たものがありました。

インテリジェンスの視点から考える

誤解のないように先に言っておきますが、私は宮川選手に心情的に味方するものです。また、私自信は今回の事件の真相はおそくらく、塚原夫妻のパワハラなんだろうなと思っています。しかし、インテリジェンスの視点から言えば、情報分析の客観性を保持するためには、「18歳の女の子が嘘をつくとは思えない」といった、固定観念に支配された見方には気付けなければなりません。

18歳といえば、2016年の法改正により選挙権もあり、まもなく民法上の成人になる予定です。今回の事件はさて置き、物事を「大人」対「子供」、「悪代官」対「善良な市民」といった構図に単純化することは客観的ではありません。18歳でもしっかりと物事を判断できる人、ぎゃくに20歳を超えた成人でも無責任な言動しか取れない者は存在します。

一方の塚原夫妻、とくに千恵子・女子強化本部長の恰幅、どうどうたる態度はまさに女帝を思わせます。こうした外見が、世間をして、よりいっそう権力を使ったパワハラを連想させます。過去のさまざまな経緯からも、塚原夫妻に対するイメージはよくありません。ただし、真実を追求し、問題解決を図るためには、第三者委員会などによる客観的な検証は必要だということでしょう。

ハロー効果とは

内実が分からない者が第一印象をもって、物事の判断をすることを「ハロー効果」といいます。これは社会心理学の現象で「認知バイアス」と呼ばれるものの一つに該当します。物事の真実の解明を歪める要因であり、情報分析を行う上で回避すべきものとされています。とかく、日本人は「ハロー効果」のバイアスに陥りやすいとされます。

ハロー効果とは、ある対象を評価する際、対象者が持つ目立ちやすい特徴にひっぱられ、その他についての評価にバイアスがかかり歪んでしまうことです。なお、「ハロー」とは絵画で聖人やイエスキリストの頭上や後ろに描かれる後輪のことです。

ハロー効果には、ネガティブ効果とポジティブ効果があります。高学歴、高身長、ハンサムなどをポジティブに評価して、「仕事ができる」「パートナーとしてやっていける」など判断する。逆に、服装や態度がよくないと、「仕事ができない」とみられるケースが多いようです。第一印象が大事ということですが、これが単なる思い込みで、失敗したというケースは多々あります。

国際情勢の分析においても、ハロー効果における誤りが多々みられます。金正恩氏が叔父を粛清した、実兄を殺害したとのニュースが飛び交うと、「何をするかわからないやつだ、核実験を強行し、ミサイルを装備する。こんなやつとの外交交渉はあり得ない」との判断が横行します。

ぎゃくに、金正恩氏が李雪主(リソルジュ)夫人同伴で腕を組みながら、国際社会の場に登場すると、たちまち、「正恩氏は賢明で普通の常識を持った指導者だ。外交交渉による非核化の実現の可能性がある」などといったような評価に一変します。

今回の体操事件はさておき、人物評価においては外見を見て惑わされるのではなく、しっかりとした人物研究や過去の行動研究こそが重要であることを認識しましょう。