全ての知識と知恵はSDGs(Sustainable Development Goals)のために。

「その数学が戦略を決める」内容の要約と紹介:I・エアーズ

この記事は約17分で読めます。
  1. 「絶対計算」は「経験」に勝る
  2. 「絶対計算」が行われていない分野
  3. 「絶対計算」を行う上での基本的な概念
  4. 目次
  5. 序章 絶対計算者たちの台頭
    1. 抵抗勢力との戦い=既得権益との戦い
    2. 本書の主張
    3. 絶対計算者たちの台頭 「切れがある」「コクがある」。専門家が評決していたワインの質と値を、一本の方程式が決めるようになる
  6. 第1章 あなたに代わって考えてくれるのは?
    1. 回帰分析とは
    2. データに基づく意志決定
    3. テラバイトのデータ処理
    4. 信頼できる回帰分析
  7. 第2章 コイン投げで独自データを作ろう
    1. 無作為抽出テスト
    2. 無作為抽出テスト
    3. 回帰分析と無作為抽出テスト
  8. 第3章 確立に頼る政府
    1. 政府による無作為抽出テスト
    2. 事例
  9. 第4章 医師は「根拠に基づく医療」にどう対応すべきか
    1. 医療分野の旧泰然とした体質
    2. 根拠に基づく医療
    3. 医療過誤を減少させよ
    4. 過去の思い込みで医療は行われている
    5. 「イザベル」という名の診断プログラム
    6. 診断と絶対計算
    7. 医師の地位
  10. 第5章 専門家vs絶対計算
    1. どっちが正確なのだろう?
    2. 人は予測が苦手
    3. 両方やってみては?
    4. 人間の出番は?
  11. 第6章 なぜいま絶対計算の波が起こっているのか?
    1. データの商品化
    2. データベースのマイニングとマッシュアップ
    3. ニューラルネットワーク方程式
    4. 映画に見る予測結果
  12. 第7章 それってこわくない?
    1. もっとも有効な教育法
    2. 地位の衰退
    3. 絶対計算もやり方次第では間違った結果を出す
  13. 第8章 直観と専門性の未来
    1. 2SDルール
    2. 統計的思考の台頭
    3. ベイズ理論
    4. 結局のところは
  14. 補章 革命は続く
    1. 自分でもやりたい人のために

「絶対計算」は「経験」に勝る

複数要素を加味した計算式によって導き出される結果は、その道の「専門家の経験」に勝るというのが、あらゆる事例をもって紹介されている。

それは、きわめて多岐にわたって、結果は「絶対計算」の方が優れていることを示している。

「絶対計算」が行われていない分野

医療の診断というのがその最たるものであろう。

症例というデータベースが過去からずーっと蓄積されているのだから、これほど「絶対計算」に適している分野はない。

だが、未だに医師の個人的な経験など「医師個人の能力」をもとに診断がされている。そして、たまに診断を間違う。

この診断を「絶対計算」で導きだせば、診断を間違える可能性は、極めて小さくなる。その事例が本書にすでに書かれている。

ところで、診断に「絶対計算」をとりいれた仕組みを構築すれば、大金持ちになれることは間違いない。

なぜなら、病気をしない人間はいないから、最終的な顧客は人類全体だからである。

「絶対計算」を行う上での基本的な概念

「絶対計算」を行う上で、最低限必要な知識は次のとおりである。

  • 回帰分析
  • ランダム化実験
  • 標準偏差
  • ベイズ理論

これらは、あくまでも「最低限」のレベルのものであり、これらを組み合わせる(=マッシュアップ)ことや、これ以外の数学理論を取り入れる必要性があるだろう。

目次

序章 絶対計算者たちの台頭
 ワインの値段を方程式で予測する男
 野球界のオーリー・アッシェンフィルター
 真実は葡萄酒の中にあり
 なぜそれを私が説くのか
 本書の攻め方
 序章のまとめ
第1章 あなたに代わって考えてくれるのは?
 お気に召すまま
 新しい出会い系サイトeharmony
 懐の痛みを調べるカジノ
 私の何を知っているか言ってごらん
 顧客の反撃
 信頼できる回帰分析
 人生いたるところマイニングあり
 一連托生
 魔法の数字を探して
 第1章のまとめ
第2章 コイン投げで独自データを作ろう
 顧客が解約しようとしたら
 サイコロをふるキャピタル・ワン
 ご覧のウェブページは無作為化されているかも
 役に立つ創造性とは?
 無作為化―朝飯前ではありません
 ゲームに参加する
 第2章のまとめ
第3章 確率に頼る政府
 支出を抑えるための支出
 アイデアの真の州実験室
 偶然に注意を払う
 偶然の世界
 第3章のまとめ
第4章 医師は「根拠に基づく医療」にどう対応すべきか
 一〇万人の命
 昔からの思いこみはなかなか消えない
 「調べてみてはいかが?」
 未来は今だ
 第4章のまとめ
第5章 専門家vs.絶対計算
 裁判の結果をあてる
 ミールの「困った小さな本」
 なぜ人は予測が苦手か
 両方やってはいかが?
 人間の出番は残されているのか?
 第5章のまとめ
第6章 なぜいま絶対計算の波が起こっているのか?
 九〇から三〇〇万へ
 データ取引
 マッシュアップしよう
 あらゆるところにデータベースが
 コンピューターをあなたが考えるように仕込めるだろうか?
 大コケ映画を探せ
 なぜ今ではいけない?
 情報の保管所
 第6章のまとめ
第7章 それってこわくない?
 もっとも有効な教育法
 わたしは鉢植え植物じゃない!
 帝国の逆襲
 地位の衰退
 絶対計算者から中古車を買うべきか?
 エパゴギクスへの反抗者たち
 絶対計算屋からの贈り物にはご用心!
 形を変えた差別
 確率的に公開
 ジョン・ロットってだれ?
 でもそれまちがっていたら?
 第7章のまとめ
第8章 直感と専門性の未来
 95パーセントの信頼区間
 未来の男女
 数字一つにこめられた情報
 確率的な当確候補
 逆算してみる
 ポラックの妊娠問題
 そして結局のところは・・・
 第8章のまとめ
補章 革命は続く
 自分でもやりたい人のために
 データマイニングの民主化
 無料でコイン投げ
 インセンティブの働き具合を調べるエンジン
 進行中の作業
謝辞
訳者解説
文庫版への訳者付記
巻末付注

序章 絶対計算者たちの台頭

抵抗勢力との戦い=既得権益との戦い

筆者はイェール大学の法学教授であるが、博士課程ではMIT(マサチューセッツ工科大学)で計量経済学を学んでいる。

そのため、定量解析には大いなる情熱をもっており、データベースによる意志決定の台頭を論じるには都合のよい立場にいる人間である。

最初の五章では、絶対計算の台頭を論じる。

第1章〜第3章では、根本的な統計技法二つを紹介する

  • 回帰分析
  • 無作為抽出テスト

⇒定量予測技法が企業と政府を一変させている様子を示す。

第4章では「根拠に基づく」医療を巡る論争を検討する。

第5章ではデータベースに基づく意志決定が、経験と直観に基づく意思決定に比べてどうなのかを評価する試験を見る。

第二部ではこのトレンドの重要性について考える。

なぜ今それが起きているのか?それを喜ぶべきか?

第7章では誰がこのトレンドで損をしているのかを考える。

第8章では将来に目を向ける。

絶対計算が台頭したからといって、直観や経験が役に立たなくなるというわけではない。むしろ、意志決定者たちが統計とアイデアの両刀遣いになる新時代を迎えることになるだろう。

本書の主張

直観や経験を意志決定の規範として捨て去ろう!といっているわけではない。直観や経験が発展してデータベースによる意志決定と相互に作用することを示すのである。

新種の革新的な絶対計算者たちが生まれつつある。

例:スティーヴン・レヴィット

直観と定量分析とを行き来し、単なる直観主義者や単なる数字やよりも先を見通せる力をもっている。

絶対計算者たちの台頭 「切れがある」「コクがある」。専門家が評決していたワインの質と値を、一本の方程式が決めるようになる

  • 専門家:経験と直観に基づく
  • 絶対計算:大量のデータの解析に基づく分析。無関係に見える要素の相関関係を計算することによって、意外な事実を見つけることができる。

例えば、ワインの品質である。

アッシェンフェルターによるワイン品質方程式は生産地の気候条件などを加味した分析であり、極めて優秀である。

一方で、専門家の品質予測はほとんどあてにならない。

いまや、専門家の予想も生産地の気候条件を大幅に勘案したものになっている。

⇒「絶対計算による影響!」

第1章 あなたに代わって考えてくれるのは?

コンピュータがあなたのために、すべてにおいて相性ぴったりな結婚相手を見つけ出してくれるとしたら?

回帰分析とは

回帰分析=生の歴史データを使い、関心ある一つの変数に他の要因となる因子がどのくらい影響しているかを計算する統計手法である。

回帰分析手法の開発は100年以上も前。開発者はフランシス・ガルトンでチャールズ・ダーウィンのいとこである。

「回帰」という用語自体は、その技法とは関係のないところからきている。ガルトンがこの技法を「回帰」と呼んだのは、初めて推計したものがその傾向を示したからだけである。

回帰式は歴史的なデータを使って推計されるが、それを使えば未来に起きることも予測できる。

データに基づく意志決定

大衆の意識化された嗜好に限られない。

意志決定の結果を観察し、データ内部から成功につながる要因を絞り出すこともできる。

単純な回帰分析が予測を改善することで意志決定も変えることになる。

つまり、集計データをふるいにかければ、隠されている因果関係のレバーが明らかになる。

テラバイトのデータ処理

テラのデータを使ったデータマイニングを行うことによって、収益性の高い顧客に儲けの低い顧客を補填させることはしなくてすむ。企業は儲けをもたらす人にサービスを集中することができるようになる。

超カスタマイズされた顧客セグメンテーションの時代へ。

信頼できる回帰分析

統計的な回帰分析は、予測を出すだけじゃない。同時にその予測がどれくらい正確なのかを報告してくれる。

回帰分析は、回帰式全体の精度だけでなく、それぞれ個別の因子が与える影響についての予測精度についても、個別に判定してくれる。

第2章 コイン投げで独自データを作ろう

過去のデータがなければ創ればいい。本のタイトルから宣伝文句まで、無作為抽出テストをやってみる。

無作為抽出テスト

賢い企業では、回帰分析で予測精度があがることを知っている。

加えて、回帰予測と独自の無作為抽出テストによる予測を組み合わせ始めている。

無作為抽出テストが、データ主導意志決定で重要なツールになりつつある。

例えば、過去のデータを掘り出して、化学療法と放射線療法のどっちが有効かを調べるとすると、その他すべての条件についてコントロールしなければならない。患者の属性、環境要因…文字通りすべて。

だが、大規模無作為抽出テストなら、そのコントロールは不必要である。

重要なのはサンプル数である。サンプル数が大きければ、統計的な信頼性が高まる。 

無作為抽出テスト

そうはいっても、これをやる企業がいまだに少ない。なぜか?

伝統的な専門家が縄張りを守っているというのも一因だろう。

だが、無作為抽出テストは、試験を行う前に仮説を立てる必要がある。事後の分析を行うものが回帰分析だとすると、無作為抽出テストは事前のものであり、積極的な取り組みが大事となる。

回帰分析と無作為抽出テスト

無作為抽出テスト=過去の実績データを使わずにリアルタイムでランダムにデータを集める方法

回帰分析

使うデータに偏りがあったり、見たい属性についてのデータが不足することがある。

データ処理が非常に専門的で、結果も素人に分かりにくい。

そもそも分析すべき過去のデータがないことが多い。

無作為抽出テスト

大きな母集団を調べる手法として、インターネットの普及によってきわめて簡単、かつ、安くできるようになっている。

第3章 確立に頼る政府

子どもを学校に通わせたならば現金を支給。貧困脱出に関する政策は有効か?政府もサイコロをふるのだ。

政府による無作為抽出テスト

  • 政府も無作為抽出テストを使って自分の政策をきちんとテストできる。
  • こうしたテストを義務づけ、効果を実証しようとする動きあり。
  • 実績を実証的に示すことで政治的な横槍にも強くなる。

従来の政策決定。

政治家や官僚の勝手な思い込みやイデオロギーに基づくもの。

その成果判断も、政策が良かったおかげなのか他の要因なのかが分からず、責任の所在がハッキリとしないのが通例。

絶対計算の進展によって、政策そのものの有効性のテストができるようになった。本当に効果のある政策の判定ができるようになってきている。

国民から無作為にサンプルを選んで、その政策があった場合となかった場合とを比較してみればよい。

事例

失業対策に求職支援指導するのは有効か?

無作為抽出テストによって、追加の研修費用を上回る失業手当削減と税収増があることが実証された。つまり、「効果あり」

貧困世帯を高所得地域に移住させるのは有効か?

無作為試行してみると、どうもあまり効果なさそう。

投獄は犯罪を減らすか、かえって再犯率を高めるか?

どっちでもないらしい。

貧困削減で、貧困者が登校したりクリニックに来たりしたら金を払う制度は有効か?

極めて有効。成績や人々の栄養状態は大いに改善。

第4章 医師は「根拠に基づく医療」にどう対応すべきか

症状の入力によって医者の気がつかないような可能性まで提示してくる絶対計算のソフトが開発された

医療分野の旧泰然とした体質

医療の分野は科学に基づく治療が行われていると思われがち。

意外にも古い体質。

そこで、データに基づいた医療を導入しようという動きが顕著。

だが、それは、医師の地位を決定的に引き下げる動きでもある。

根拠に基づく医療

1992年。オンタリオのマクマスター大学のカナダ人医師二人。ゴードン・ガイヤットとデヴィッド・サケットは「根拠に基づく医療」(EBM=Evidence-Based Medicine)という宣言を発した。

治療法の選択は、最高の根拠に基づくべきであり、最高の根拠とはできれば統計から来るべきだということである。

統計的な根拠がもっと大きな扱いを受けるべきであるという主張。

医療過誤を減少させよ

アメリカでは毎年病院で最大9万8千人が予防できたような医療過誤の結果として死んでいるという。

小児科医にして医療改善研究所所長であるドン・バーウィックに命の救いかたを示したのは統計分析だった。

医師の裁量を減らす方が患者の安全は改善されると考える。

バーウィックの精力的な講演のおかげで、全国の3千以上の病院が「10万人の命を救えキャンペーン」に参加した。

アメリカの病床数の75%に相当する。

キャンペーン以前:入院患者の平均死亡率は2.3%

キャンペーン以後:12万2342人の病院死亡を減らした。

過去の思い込みで医療は行われている

多くの医師がいまだに信じていること

  • ビタミンB12障害では錠剤は効かないから注射で治療しなければならない
  • 眼帯を使うと角膜に炎症を起こした患者の快適さと治療は改善する
  • 急激な腹痛を起こしている患者にアヘン系の鎮痛剤を与えると、腹膜炎の徴候や症状が隠れてしまうので望ましくない

「どれもまちがっています」

「イザベル」という名の診断プログラム

「診療決定支援」ソフトウェアの「イザベル」は、医師が患者の症状を入力して、もっとも可能性の高い原因一覧を得られるようにするものである。

患者の症状が薬に来るものかもしれないという示唆もできる。

診断ミスは、医療過誤の1/3を占める。

検屍解剖調査によれば、医師たちは命にかかわる病気を最大で20%誤診している。誤診は処方ミスの2倍〜3倍多い。

なんと言おうと、何百万もの患者たちは、まちがった病気の治療を受けているのは間違いない。

困ったことに、2005年の「Journal of the American Medical Association」の論説は、誤診の比率は過去数十年で目に見えた改善を示していないと結論付けている。

診断と絶対計算

絶対計算者にしてみれば、診断というのは予測の一種でしかない。

医師の地位

医師の地位は間違いなく落ちていくだろう。

だが、逆に、それによって圧倒的な多数者である患者の利益が確保されるのであれば、何か問題が?

「診療決定支援」ソフトの開発は発展途上だが、いずれは、インターネット上などで一般の人間が手軽に利用できる日がくるに違いない。

それも、想像以上に近い日に。

第5章 専門家vs絶対計算

専門家にできて絶対計算にできないことは何なのか。お互いの共存はあるのか?それぞれの限界と長所を探る

どっちが正確なのだろう?

裁判の結果をあてる

  • 統計モデルを使う場合、過去の裁判をデータ化する時には人間が必要である。
  • 判決が「リベラル」か「保守的」かを判断するには専門性が必要。

⇒統計的な予測が主観的な判断と共存できることを示している。

結果は…。

専門家たちが負けた。

  • モデル:75%
  • 専門家:59.1%

極端にまでそぎ落としたモデルに専門家たちは負けた。

人は予測が苦手

人は間違った信念をもってしまうと、それにしがみついてしまう。

たとえ、新しい証拠が出てきても、信念に反するものは軽視してしまい、既存の信念を裏付けてくれる証拠に目を向けてしまう。

偏りと自信過剰は、予測が複雑になるにつれ、一層悪化する。

一般人よりも物知りだという自信を持っている野球のスカウトや医師などの専門家などがそれだ。

一方で統計的な回帰分析はエゴも感情も持たない。

新しいデータが集まれば、統計式が再計算され、新しい重みづけが個々の要素に対して行われるだけである。

両方やってみては?

伝統的な専門家のノウハウと、絶対計算を組み合わせてみては?

予測は改善される。

だが、絶対計算のみの予測の方が正確である。

=人間はマシンの予測を無視して、まちがった個人的な思い込みにしがみついてしまう。

人間の出番は?

仮説立案である。

人間が行うべきことは、頭や直観を使って、統計分析にどの変数を入れるべきか入れないべきかを推測することである。

第6章 なぜいま絶対計算の波が起こっているのか?

どの要素に重みをつけて考えるか。それをするのがニューラル予測だ。興行収入を極大化する脚本も計算!

データの商品化

デジタルデータは商品である。

アクシオムという企業は、「みんなが聞いたこともない最大の企業の一つ」といわれ、200億件の消費者記録をもっている。

多くは公開情報を集めたものである。

データベースのマイニングとマッシュアップ

データ集合のマッシュアップや統合は、かつてないほど容易になっている。

「なぜ今?」への回答。

絶対計算の近年の台頭は、技術面での進歩によるもので、統計技法の進歩によるものではない。

統計的な予測技法に新しい展開があったわけではないのだ。

コンピューターの処理能力の向上よりも、「記憶容量の増大」にもっと影響を受けている。

ニューラルネットワーク方程式

ニューラルネットワークとは神経系ネットワークである。

ニューラルネットワーク方程式を使った予測は、回帰方程式に対する新進気鋭の競争相手である。

ニューラルネットワークはコンピュータが人間の神経細胞のように情報を処理する試みである。

この技法の目新しさは、その柔軟性と細やかさにある。伝統的な回帰分析では、絶対計算者は式の具体的な形式を指定する必要がある。

だが、ニューラルネットワークだと、研究者は生のデータを喰わせるだけで良い。

映画に見る予測結果

ニューラル方程式によると…

  • ほとんどの映画は無名の俳優を使ったところで興業は変わらない
  • 映画の舞台はかなり効いてくる
  • スターや監督の名前はどうでもいい

【証拠】

史上興収上位200本を見ると、当時のスターがでている映画は実に少数

商業的に大失敗だった映画のリメイクが可能

=ニューラルネットワークの助言によって、ちょっとした変更を加えれば、台本は純利益を稼ぎ出すものになる。

おなじことは「本」でもできるということである。

第7章 それってこわくない?

この二五〇の変数を使えばあなたが○○に投票した確率は九七%!プライバシーは限りなくゼロに近づく

もっとも有効な教育法

「ダイレクト・インストラクション(Direct instruction=DI)」という手法
それは、教師を脚本に従わせる手法である。

根拠に基づく医療を巡る戦いと同じで、基本的には絶対計算の結果に依存すべきかどうかという戦いである。

DIの有効性についての証拠は一九六七年までにさかのぼる。

DIの有効性は圧倒的である。読み、書き、算数、全てにおいて他の教育手法に勝り1位となっている。どんなモデルもDIに及ばなかった。

また、高次の思考力を要求される問題にも対応し、行間を読む能力にもたけた。

つまり、いかなるモデルよりもDIに任せた方が、発想力豊かな子供になるということである。

DIのもっともすぐれているのは、誰にでもできるということである。

DIの授業は完全にマニュアル化されている。マニュアル通りに動けば済むうえに、生徒の成績もあがる。なんと素晴らしい教育手法か!

だが、現場の教育者からは猛反発を食らった。

教育を教師不要にしてしまうからだ。

地位の衰退

教師の権限と裁量だけが脅かされているのではない。

絶対計算の台頭は、伝統的な仕事の多くの地位と尊厳を脅かす。

例えば、かつては銀行の融資担当というのはそこそこ地位が高かったが、融資判断が本社の統計アルゴリズムに基づいて行われるようになってから、融資担当は見かけだけ立派な事務員になった。

裁量と地位が伝統的な専門家からデータベースに移行したのは医療分野でも見られる現象となっている。

「根拠に基づく医療」の台頭によって医師は情報の伝達パイプでしかなくなりつつある。医師は、昔ほどのヒーローではなくなってきている。

人は、医師の頭ごなしに、インターネットという膨大なデータにアクセスしている

絶対計算もやり方次第では間違った結果を出す

検証・監査できるシステムが必要である。

絶対計算においても「絶対」はない。

第8章 直観と専門性の未来

統計や数学の知識が世の中の必然となる。2SDルールとベイズ理論がわかれば、あなたの未来は明るいぞ

2SDルール

「2標準偏差」ルール(Two Stanadard Deviation=2SD)

このルールを理解することが変動制を理解するということの核心である。

標準偏差が便利なもので、平均と標準偏差を知ったらまずは2SDルールを適用しよう

統計的思考の台頭

それは直観や専門技能の終わりを意味するものではない

むしろ、直観が再発明されて統計的思考と共存するようになる道筋を示している。

今後の意志決定者はますます、直観とデータに基づく意志決定とを何度も切り替えつつ仕事をするようになる。

ベイズ理論

新しい情報を得るにつれて、自分の予測や直観をどう更新していくかを知る必要がある。

ベイズ方程式はこの更新プロセスに不可欠である。

ベイズ式を基礎から学ぶには確立を頻度に置き直すことである。

結局のところは

2SDルールとベイズ理論を知っていると、自分自身の意志決定の質を高めることができる

本書では、それぞれについて「詳細に、しかも、簡単に」書かれているわけではない。

したがって、別の本でそれぞれを学ぶ必要がある。

補章 革命は続く

自分で絶対計算をやりたい人はどうすればいい?本書の単行本版刊行以降、様々な無料ツールが登場した

自分でもやりたい人のために

「標準偏差、ベイズ理論」

その他に

「回帰分析、ランダム化」

タイトルとURLをコピーしました