akon2.00βのよっぱらいの戯言

色しょく是食、食しょく是色 当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

因果推論の科学 「なぜ?」の問いにどう答えるか

 

 

因果ダイヤグラム
因果関係は因果ダイアグラムと記号言語によって表現できる。そして、記号言語は計算式なので、式を整理することでより簡素だったり、実現可能性の高いものへと変換できる。

https://saltcooky.hatenablog.com/entry/2020/05/04/001619

 

 

 

 

 

https://murachanlaw.com/wp/wp-content/uploads/2022/11/image-1-602x1024.png

https://murachanlaw.com/wp/wp-content/uploads/2022/11/image-1-602x1024.png

 

英語では推理も演繹法もdeduction。

ホームズの推理は、仮説を立てて結論を導く演繹ではなく、逆方向の証拠から仮説を導く帰納法も組み合わせている。

 

交絡(confounding)因子→隠れた第三の変数(潜伏変数)

「原因」と「結果」の両方に影響を与える因子。

交絡因子があると、「原因」と「結果」が無関係であったとしても、「原因」と「結果」の間に相関関係があるように見えてしまうことがあり、また逆に、「原因」と「結果」に因果関係があったとしても、「原因」と「結果」が無関係に見えてしまうことがある。これらの影響を統計処理で取り除き、「原因」と「結果」の正しい関係を評価することができるようになる。

 

交絡の解消

ランダム化比較試験がゴールドスタンダードとみなされてきた。

しかし因果革命によって、私たちはそれ以外の手段(do演算子)を手に入れることになった。

 

因果革命

ベイジアンネットワークや統計的因果推論の研究者であるJudea Pearl氏の著書、The book of whyで繰り返し出現する単語で、従来は"The Ladder of Causation(因果のはしご)"の最下部の"SEEING(観察)"研究でしか定式化できていなかったところを、その上の"DOING(行動)"や"IMAGINING(想像)" に属する研究でも定式化できるようになった。

 

do演算子

https://huyukiitoichi.hatenadiary.jp/entry/2022/09/16/080000

RCTによる介入が因果ダイアグラム上の操作であり、従来の確率の記法が因果ダイアグラムの違いを区別できないため、do-operator(do演算子)という記法を導入した。
do演算子の追加により、確率の世界でデータ生成過程も扱えるようになり、どのような分析手法が正しいかを判断しやすくなる

 

ベイジアンネットワークの三つの基本的なジャンクション

・パターン1:チェーン(連鎖)
A → B → C

Bは、媒介であり、AとCの仕切りになる。

・パターン2:フォーク(分岐)
A ← B → C

Bは、共通の原因。交絡因子と呼ぶ。

・パターン3:コライダー(合流)
A → B ← C

 

バックドア調整とフロントドア調整

https://hiramekun.hatenablog.com/entry/2021/12/26/122014

 

バイアス
交絡バイアス(confounding bias)
選択バイアス(selection bias)

 

コライダーバイアス(合流点バイアス)

→合流点に影響を与える因果変数同士は、相互に関連しているとは限らない

・モンティ・ホールのパラドックス

直感で正しいと思える解答と、論理的に正しい解答が異なる問題

・シンプソンのパラドックス

同じデータでも分析の仕方によって全く矛盾したように見える結果が得られる

・パークソンのパラドックス

相関が あるように見える事象が実は相関がないという直感に反する考え

事象Aの発生確率が事象Bの存在下で高くなるのは、どちらも発生しない場合が排除されるからである。

 

サヴェッジの当然原理

https://note.com/taiki_takahashi/n/na46a309fd9b0

 

フロントドア調整
適切な状況であれば、たとえ交絡因子についてのデータが一切なくても、数学によって交絡因子の影響を除去できる。

適用条件:媒介因子が交絡因子からの影響をほとんど受けない、と仮定できるときだ。

 

介入を観察に変える三つのルール
・観察の付加、あるいは排除を許可する
・介入を観察に、あるいは観察を介入に置き換えることを許可する
・介入の排除、あるいは付加を許可する

 

そもそもそれぞれの因果が複雑に関係しあっていると考えている。Holisticな見方が必要だと思う。

 

目次
はじめに
序 章  「因果推論」という新しい科学
導入 因果関係、すなわち原因と結果の関係について語ることは、科学の長年のタブーとされてきた。しかし近年、政治からAIにいたる幅広い分野で、因果関係の新しい科学である「因果推論」が大きな注目を集めている。

無視されてきた因果関係
なぜ誰もやらなかったのか?
統計学という抑圧
データは何も教えてくれない
因果ダイアグラムと記号言語
P(L | do(D))
P(L | D)
反事実的推論の重要性
強いAIと因果推論
現実の青写真
「推論エンジン」のⅠないし9の説明
「なぜ?」の問いに答えるロボット
本書の構成
一章から一〇章の簡単な説明
第一章   因果のはしご
因果関係を理解する能力を手に入れるには、三段の「因果のはしご」をのぼらなければならない。学習機械は一段目、初期人類は二段目にいる。三段目に到達できたのは、現在のところ私たち人間だけである。
第二章   シューアル・ライトが起こした革命──因果推論創世記
科学や統計学において因果関係はなぜ拒絶されるようになったのか? フランシス・ゴルトンによる相関の発見から、シューアル・ライトによる因果関係の再評価まで、因果推論誕生前夜の歴史をたどる。
第三章   結果から原因へ ──ベイジアンネットワークの真価と限界
一八世紀に発表されたトーマス・ベイズの理論をルーツとする「ベイジアンネットワーク」によって、コンピュータは不確実なことがらをはじめて扱えるようになった。その様々な応用例と限界について考える。
第四章   交絡を取り除く──ランダム化比較試験と新しいパラダイム
R・A・フィッシャーが提唱したランダム化比較試験は、交絡因子の解消に関して、長らくゴールドスタンダードとみなされてきた。しかし因果革命によって、私たちはそれ以外の手段を手に入れることになった。
第五章   タバコは肺がんの原因か? ──喫煙論争の煙を吹き飛ばす
一九五〇~六〇年代初頭にかけて、統計学者たちは「喫煙は肺がんの原因か」という問題をめぐる論争に明け暮れていた。この難問はいかに解決されたのか? 因果推論が投げかける新しい光とは何か?
第六章   パラドックスの詰め合わせ──因果のレンズで世界を見る
モンティ・ホールのパラドックス、シンプソンのパラドックス、バークソンのパラドックスなど、楽しくも手強い謎の数々を紹介する。おなじみの問題も、因果のレンズを通して見ると違う姿が浮かび上がってくる。
第七章   介入──険しい山を登るための強力な道具一式
介入は因果のはしごの二段目に位置する。「介入の山」の道は険しく、無事に登りきるためには、パスブロッキングバックドア調整、フロントドア調整、操作変数、do計算法といった強力な登山道具が必要になる。
第八章   反事実 ──「こうであったかもしれない」世界を考える
デヴィッド・ヒュームが一七四八年に因果性の定義を与えて以来、「反事実」は、因果関係の根底をなすものと捉えられてきた。因果のはしごの最上段に位置する反事実。その発展の歴史と現代の応用例を概説する。
第九章   媒介──因果関係の背後にはどんな仕組みがあるのか?
原因と結果をつなぐ「媒介」は、反事実の要素を含む難解な概念だが、因果推論の発展によって、今では簡単な数式で表せるようになった。媒介研究のパイオニア、バーバラ・バークスの知られざる業績とともに振り返る。
第一〇章   ビッグデータ、AI、ビッグクエスチョン
人間と同等の知性を持った「強いAI」を実現するには、自由意志の問題をはじめ、解決すべき課題が数多く残っている。だが、そうして生まれたAIは、人類の味方なのか、脅威なのか?私たちとAIの未来予想図。まず目次と本書に掲載されている