昨日アクチュアリーの一次試験の「数学」を受験してきました。それなりに勉強したにも関わらず、合否は半々だろうといった手応えでした。よく言われることですが、家で問題が解けても、プレッシャーのかかる試験会場で問題が解けるとは限りません。
試験後私の頭の中は次のような言葉で満ちていました。
「悔しいっ・・・!悔しいっ・・・!悔しいっ・・・!し・・・しかし・・・・しかし・・・これでいいっ・・・・!来年受け直すためにまた勉強するっ!完膚なきまでに問題を解けるようになるまで統計を体に染み込ませてみせるっ!これでいいっ・・・!これでこそ数学・・・・数学だっ・・・・・!」
ん?このフレーズどっかで聞いたことあるぞ。。?
そうだっ!カイジだっ!!
- 作者: 福本伸行
- 出版社/メーカー: フクモトプロ/highstone, Inc.
- 発売日: 2013/07/25
- メディア: Kindle版
- この商品を含むブログを見る
【目次】
カイジとは
カイジというのは福本伸行さん原作の賭博漫画のシリーズです。タイトルと同名の主人公カイジは、普段は体たらくでだらしない生活を送っていますが、大金、人生、命を賭けた賭博で窮地に追い込まれると、天才的なひらめきを発揮し一発逆転、対戦相手を圧倒します。痛快ストーリーとあいまって賭博が題材ということで特に成人男性に人気がある漫画に思えます。かくいう私も学生時代に住んでいた寮の談話室にカイジがあったことがきっかけで大好きな漫画になりました。ただ統計好きな人はカイジと聞くと「カイ二乗(かいじじょう)検定」を思い浮かべるのではないでしょうか?(そんなことはないか。。)
ちょっと余談
私は数学が大好きですが、統計は全く好きではありませんでした。数学は美しさに溢れていますが、統計は数学ではなく計算であり、美しさではなく有用性を追い求める学問のように思えて敬遠していました。統計学に出てくる数式には必然性も美しさも感じません。しかし仕事柄統計を教える機会も多いので、スキルアップのためにアクチュアリーの数学試験を受験しました。数学試験といっても中身はバリバリの確率、統計です。アクチュアリーの勉強をしていく中で統計についての自分の考えを改めました。各種検定、推定の理論は非常に数学的であり、自然界や工学の世界につきまとうランダムな事象をいかに合理的に処理するかという問題に対する答えを与えてくれるものです。統計学で出てくる各種分布は人類の長い闘いの後に手に入れた人類の宝と言えると思えます。
「ゴセットさんT分布を見つけてくれてありがとう!貴方のおかげで母分散がわからない正規分布の母平均をサンプルから精度付きで予測できます!」
しかし、それでも統計より数学の方が10,000倍いや、もっと、、、比較できないくらい好きです。各種分布よりオイラーさんの見つけた人類の至宝()の方が大大大好きです。
カイジとカイ二乗検定
話を戻します。カイジとカイ二乗検定は名前が似ているだけではありません。なんとカイ二乗検定を駆使することで、カイジ第二シリーズ(賭博破戒録)でカイジを苦しめた大槻班長を打ち倒すことができるかもしれないのです。カイジは第二シリーズ開始早々、借金を返すために地下の強制労働施設に収容されてしまいます。カイジの借金額から計算された収容期間は15年間。当然嫌です。カイジは50万ペリカ(←地下通貨)を貯めて1日外出券を購入し、1日だけでも外に出ようと計画しますが、給料でもらった91,000ペリカをビール、おつまみで散財してしまいます。
そんなカイジを地下でもペリカの借金地獄に陥れようとする男が大槻班長です。
チンチロは簡単に言うと3個のサイコロをふって出た目で決まるポイントを競うゲームです。3つのサイコロの目がバラバラだとポイントにならないのですが、2つの目が揃うと残りの1つの目の数がポイントになります。3つ同じ目で揃うとよりポイントが高くなります。
また、先ほど3つの目がバラバラだとポイントにならないと書いたのですが、「1,2,3」と[4,5,6」は例外となっており、「4,5,6」はかなりポイントの高い出目になっています。
細かいポイントの設定は書きませんが、下の表で上に行くほど強い目となります。表にはその目が出る確率も記載します。これは高校レベルなので興味がある方は計算してみて下さい。
出目 | 例 | 確率 |
1のゾロ目 | ①①① | |
6のゾロ目 | ⑥⑥⑥ | |
5のゾロ目 | ⑤⑤⑤ | |
4のゾロ目 | ④④④ | |
3のゾロ目 | ③③③ | |
2のゾロ目 | ②②② | |
4,5,6(しごろ) | ④⑤⑥ | |
6の目 | ③③⑥ | |
5の目 | ②②⑤ | |
4の目 | ⑥⑥④ | |
3の目 | ⑤⑤③ | |
2の目 | ④④② | |
1の目 | ③③① | |
目なし(4,5,6、1,2,3除く) | ②④⑤ | |
1,2,3(ひふみ) | ①②③ |
大槻班長はイカサマを行いカイジからペリカを巻き上げ、カイジを地下でも借金地獄にすることに成功します。大槻班長のイカサマ、それは4と5と6の目しかないイカサマサイコロ(以下、イカサマ賽)を使う事でした。
このイカサマ賽を使うと先ほどのポイント表の確率は下のように変わります。振れば絶対目が出る、そしてポイントも上位の者ばかりになります。これでは通常のサイコロを使う限りはほとんど勝ちようがありませんね。
出目 | 例 | 確率 |
1のゾロ目 | ①①① | |
6のゾロ目 | ⑥⑥⑥ | |
5のゾロ目 | ⑤⑤⑤ | |
4のゾロ目 | ④④④ | |
3のゾロ目 | ③③③ | |
2のゾロ目 | ②②② | |
4,5,6(しごろ) | ④⑤⑥ | |
6の目 | ⑤⑤⑥ | |
5の目 | ⑥⑥⑤ | |
4の目 | ⑥⑥④ | |
3の目 | ②②③ | |
2の目 | ①①② | |
1の目 | ④④① | |
目なし(4,5,6、1,2,3除く) | ②③⑥ | |
1,2,3(ひふみ) | ①②③ |
カイジは直感により大槻班長の不正に気付きましたが、私にはカイジのような天才的なひらめきはないと思われるため、ここでは数学、特に統計の力を借りて大槻班長の不正を暴くことにしましょう。そう、ここで登場するのがカイ二乗検定です!
カイ二乗検定とは
ということで、カイジの世界を離れて簡単にカイ二乗検定の説明をしたいと思いますが、感じをつかんでいただきたいだけで、説明は不十分です。詳しく知りたい方は統計WEBの記事をご参照ください。個のものが、、、、という個のカテゴリに分類されているとし、各カテゴリの観測度数を、、、、とします。つまりが成り立っています。
また各カテゴリには理論確率、、、、(、)が与えられており、これが正しければ生じるであろう各カテゴリの理論度数は、、、、となります。
計 | |||||
観測度数 | |||||
理論確率 | |||||
理論度数 |
この時、
は自由度のカイ二乗分布に従うことが証明できます。なお、はカイ二乗(かいじじょう)と読みます。
カイ二乗分布は、正の整数を自由度と呼ばれるパラメータでもっている分布で、下記のようなグラフになります。
の式を見れば明らかな通り、観測度数が理論度数に一致する時となり、観測度数と理論度数のずれが大きくなるにつれての値も大きくなります。の値が大きくなればなるほど、その理論確率はあり得ないという事がわかり、どのくらいあり得ないかということがグラフと横軸の挟む面積で定量的に分かるのです。
いざ検定!
統計学の「検定」とは、「Aである!」という事実を主張したいとき、「Aではない」という仮説(専門的には帰無仮説という)を立て、その仮説の下で計算されるある統計量(ここでは)が予め設定したあり得なさを表す確率(有意水準という。座学の統計では5%の値をとることが多いが、実際には分野、求められる精度によって全く異なる値を設定する)以下でしか発生しない、つまり稀にしか起きないことを示して、「やはりAなのだ!」と結論付けたり、結論付けれなかったりする手法です。今回の大槻班長のイカサマに関しては、イカサマであるという事を主張したいので、まずは「イカサマではない」という仮説を立てます。
次にカイ二乗を計算する必要があるのですが、そのためには大槻班長の出目のデータが必要です。普通なら「これは困ったっ!大槻班長の不正が暴けないっ!」となるところなのですが、なんと、カイジと同じくペリカ借金地獄の三好が過去の班長の出目をメモっていてくれました。実はカイジも三好のメモを見て大槻班長の不正に気付いたのでした。
「三好さん三好メモを付けてくれてありがとう!貴方のおかげで憎き大槻班長の不正を暴くことができるかもしれません!」
漫画の中で班長の出目の描写と三好のメモから作成したデータが下記です。
話数 | 出目 | 備考 |
12話 | 5の目 | 大槻初戦②②⑤ |
13話 | 目なし | - |
17話 | 4の目 | イカサマ賽を使用⑤⑤④ |
18話 | 5ゾロ | 圧倒的イカサマ賽使用 |
20話 | 5の目 | 三好メモ |
20話 | 目なし | 三好メモ |
20話 | 目なし | 三好メモ |
20話 | 3の目 | 三好メモ |
20話 | 6の目 | 三好メモ |
20話 | 5の目 | 三好メモ |
20話 | 4,5,6 | 三好メモ |
20話 | 目なし | 三好メモ |
20話 | 目なし | 三好メモ |
20話 | 2の目 | 三好メモ |
20話 | 4の目 | 三好メモ |
20話 | 目なし | 三好メモ |
20話 | 2の目 | 三好メモ |
21話 | 6の目 | 三好メモ |
21話 | 4,5,6 | 三好メモ |
21話 | 3の目 | 三好メモ |
21話 | 5の目 | 三好メモ |
21話 | 目なし | 三好メモ |
21話 | 目なし | 三好メモ |
21話 | 6の目 | 三好メモ |
21話 | 目なし | 三好メモ |
21話 | 3の目 | 三好メモ |
21話 | 目なし | 三好メモ |
21話 | 目なし | 三好メモ |
21話 | 4の目 | 三好メモ |
21話 | 目なし | 三好メモ |
21話 | 4の目 | 三好メモ |
21話 | 3の目 | 三好メモ |
23話 | 4,5,6 | 45組が見守った大事な一投 |
29話 | 6の目 | ③③⑥ |
32話 | 1の目 | ④④① |
32話 | 1の目 | ④④① |
36話 | 目なし | 最後の対決1投目 ③④⑤ |
37話 | 目なし | 最後の対決2投目 ②④⑥ |
こうして見ると三好メモの偉大さがわかります。三好メモには何投目でその目を出したかも書かれているため、目なしについてもカウントできます。
これをわかりやすく表にまとめてみます。ここではイカサマ賽を使ったという事に興味があるため、4、5、6関連の出目とそれ以外に分けてみました。
4の目 | 5の目 | 6の目 | 4ゾロ | 5ゾロ | 6ゾロ | 4,5,6(しごろ) | それ以外 | |
観測度数 | ||||||||
理論確率 | ||||||||
理論度数 |
「データも揃ったし、いざ計算!」といきたいところですが、アクチュアリー受験生のバイブルであるヘイジ親分の「明解演習 数理統計」によると観測度数も、期待度数も5以上である必要があり、5未満のものがある場合は隣接する階級を合体などしなさいとのことです。「ヘイジ親分ありがとう!(カイジ親分ではない)」
- 作者: 小寺平治
- 出版社/メーカー: 共立出版
- 発売日: 1986/10/01
- メディア: 単行本
- 購入: 12人 クリック: 63回
- この商品を含むブログ (4件) を見る
そこでまとめ直したのが下記表です。4、5、6が絡む出目はすべてまとめましたが、それで問題ないはずです。
出目に4、5、6が絡むもの | それ以外 | |
観測度数 | ||
理論確率 | ||
理論度数 |
大槻はやったのか?やってないのか?
先ほど得られた表でを計算すると、となり、「大槻班長は不正をしていない」という(帰無)仮説のもと、これは自由度1のカイ二乗分布に従うことになります。
有意水準(あり得ないと結論付ける確率)を5%として、グラフ上での値を確認してみると、このの値は上側5%というあり得ないゾーンに入っていることがわかります。
「大槻班長は不正をしていない」と仮定すると、実際に目の前で起こった事象は5%以下の確率でしか起こらない、それは稀だ、つまり「大槻班長は不正をしている!」と結論付けることができるのです。
「大槻っ!お前が不正をしていないという帰無仮説のもと、過去37回のお前の出目を有意水準5%でカイ二乗検定したところ、ピアソンの適合度基準が自由度1のカイ二乗分布の棄却域に入ったから、お前は不正をしたと証明されたぞ!」
といって、大槻班長の不正を暴くことができるのです。
統計は自分の主張を正当化するツールです。上司をデータで説得したい社会人は是非とも身に付けていただきたい技術です。統計の素養を身に付けたカイジのようにパワーワードを並べて威嚇することで、統計の素養の無い上司は何も言えず、貴方の言いなりになるでしょう。
しかし気を付けてください、上司(ここでは大槻班長)が統計的素養がある場合、
「それはあくまで有意水準が5%の場合じゃろ。有意水準1%ならば自由度1のカイ二乗分布の上側1%点は6.6349だから帰無仮説を棄却できん、つまりわしの不正があったとは言えないじゃろ。カカカ」
と返り討ちに合うかも知れません。
「これだから統計は嫌いだ。(心の声)」