mattyuuの数学ネタ集

世界は数式で溢れている

「大槻っ!お前やったな!?」カイジでカイ二乗検定してみた

昨日アクチュアリーの一次試験の「数学」を受験してきました。それなりに勉強したにも関わらず、合否は半々だろうといった手応えでした。よく言われることですが、家で問題が解けても、プレッシャーのかかる試験会場で問題が解けるとは限りません。

試験後私の頭の中は次のような言葉で満ちていました。

「悔しいっ・・・!悔しいっ・・・!悔しいっ・・・!し・・・しかし・・・・しかし・・・これでいいっ・・・・!来年受け直すためにまた勉強するっ!完膚なきまでに問題を解けるようになるまで統計を体に染み込ませてみせるっ!これでいいっ・・・!これでこそ数学・・・・数学だっ・・・・・!」

ん?このフレーズどっかで聞いたことあるぞ。。?

そうだっ!カイジだっ!!

賭博破戒録 カイジ 2

賭博破戒録 カイジ 2

【目次】

カイジとは

カイジというのは福本伸行さん原作の賭博漫画のシリーズです。タイトルと同名の主人公カイジは、普段は体たらくでだらしない生活を送っていますが、大金、人生、命を賭けた賭博で窮地に追い込まれると、天才的なひらめきを発揮し一発逆転、対戦相手を圧倒します。痛快ストーリーとあいまって賭博が題材ということで特に成人男性に人気がある漫画に思えます。かくいう私も学生時代に住んでいた寮の談話室にカイジがあったことがきっかけで大好きな漫画になりました。

f:id:mattyuu:20181211044332p:plain

ただ統計好きな人はカイジと聞くと「カイ二乗(かいじじょう)検定」を思い浮かべるのではないでしょうか?(そんなことはないか。。)

f:id:mattyuu:20181211044400p:plain


ちょっと余談

私は数学が大好きですが、統計は全く好きではありませんでした。数学は美しさに溢れていますが、統計は数学ではなく計算であり、美しさではなく有用性を追い求める学問のように思えて敬遠していました。統計学に出てくる数式には必然性も美しさも感じません。しかし仕事柄統計を教える機会も多いので、スキルアップのためにアクチュアリーの数学試験を受験しました。数学試験といっても中身はバリバリの確率、統計です。

アクチュアリーの勉強をしていく中で統計についての自分の考えを改めました。各種検定、推定の理論は非常に数学的であり、自然界や工学の世界につきまとうランダムな事象をいかに合理的に処理するかという問題に対する答えを与えてくれるものです。統計学で出てくる各種分布は人類の長い闘いの後に手に入れた人類の宝と言えると思えます。

「ゴセットさんT分布を見つけてくれてありがとう!貴方のおかげで母分散がわからない正規分布の母平均をサンプルから精度付きで予測できます!」

しかし、それでも統計より数学の方が10,000倍いや、もっと、、、比較できないくらい好きです。各種分布よりオイラーさんの見つけた人類の至宝(e^{i\pi}+1=0)の方が大大大好きです。

f:id:mattyuu:20181211044421p:plain

カイジカイ二乗検定

話を戻します。カイジカイ二乗検定は名前が似ているだけではありません。なんとカイ二乗検定を駆使することで、カイジ第二シリーズ(賭博破戒録)でカイジを苦しめた大槻班長を打ち倒すことができるかもしれないのです。

注意
ここから先の内容はネタバレ(大槻班長の姑息なイカサマ)を含みます。漫画で楽しみたい方は漫画を読んでから読んでください。

カイジは第二シリーズ開始早々、借金を返すために地下の強制労働施設に収容されてしまいます。カイジの借金額から計算された収容期間は15年間。当然嫌です。カイジは50万ペリカ(←地下通貨)を貯めて1日外出券を購入し、1日だけでも外に出ようと計画しますが、給料でもらった91,000ペリカをビール、おつまみで散財してしまいます。

f:id:mattyuu:20181211044442p:plain

そんなカイジを地下でもペリカの借金地獄に陥れようとする男が大槻班長です。

f:id:mattyuu:20181211044515p:plain

大槻班長カイジにチンチロという賭博を持ち掛けます。

チンチロは簡単に言うと3個のサイコロをふって出た目で決まるポイントを競うゲームです。3つのサイコロの目がバラバラだとポイントにならないのですが、2つの目が揃うと残りの1つの目の数がポイントになります。3つ同じ目で揃うとよりポイントが高くなります。

f:id:mattyuu:20181211044531p:plain


また、先ほど3つの目がバラバラだとポイントにならないと書いたのですが、「1,2,3」と[4,5,6」は例外となっており、「4,5,6」はかなりポイントの高い出目になっています。
細かいポイントの設定は書きませんが、下の表で上に行くほど強い目となります。表にはその目が出る確率も記載します。これは高校レベルなので興味がある方は計算してみて下さい。

出目 確率
1のゾロ目 ①①① \frac{1}{216}
6のゾロ目 ⑥⑥⑥ \frac{1}{216}
5のゾロ目 ⑤⑤⑤ \frac{1}{216}
4のゾロ目 ④④④ \frac{1}{216}
3のゾロ目 ③③③ \frac{1}{216}
2のゾロ目 ②②② \frac{1}{216}
4,5,6(しごろ) ④⑤⑥ \frac{6}{216}
6の目 ③③⑥ \frac{15}{216}
5の目 ②②⑤ \frac{15}{216}
4の目 ⑥⑥④ \frac{15}{216}
3の目 ⑤⑤③ \frac{15}{216}
2の目 ④④② \frac{15}{216}
1の目 ③③① \frac{15}{216}
目なし(4,5,6、1,2,3除く) ②④⑤ \frac{108}{216}
1,2,3(ひふみ) ①②③ \frac{6}{216}

大槻班長イカサマを行いカイジからペリカを巻き上げ、カイジを地下でも借金地獄にすることに成功します。大槻班長イカサマ、それは4と5と6の目しかないイカサマサイコロ(以下、イカサマ賽)を使う事でした。

f:id:mattyuu:20181211044609p:plain

このイカサマ賽を使うと先ほどのポイント表の確率は下のように変わります。振れば絶対目が出る、そしてポイントも上位の者ばかりになります。これでは通常のサイコロを使う限りはほとんど勝ちようがありませんね。

出目 確率
1のゾロ目 ①①① 0
6のゾロ目 ⑥⑥⑥ \frac{24}{216}
5のゾロ目 ⑤⑤⑤ \frac{24}{216}
4のゾロ目 ④④④ \frac{24}{216}
3のゾロ目 ③③③ 0
2のゾロ目 ②②② 0
4,5,6(しごろ) ④⑤⑥ \frac{6}{216}
6の目 ⑤⑤⑥ \frac{48}{216}
5の目 ⑥⑥⑤ \frac{48}{216}
4の目 ⑥⑥④ \frac{48}{216}
3の目 ②②③ 0
2の目 ①①② 0
1の目 ④④① 0
目なし(4,5,6、1,2,3除く) ②③⑥ 0
1,2,3(ひふみ) ①②③ 0

カイジは直感により大槻班長の不正に気付きましたが、私にはカイジのような天才的なひらめきはないと思われるため、ここでは数学、特に統計の力を借りて大槻班長の不正を暴くことにしましょう。そう、ここで登場するのがカイ二乗検定です!

カイ二乗検定とは

ということで、カイジの世界を離れて簡単にカイ二乗検定の説明をしたいと思いますが、感じをつかんでいただきたいだけで、説明は不十分です。詳しく知りたい方は統計WEBの記事をご参照ください。

bellcurve.jp


n個のものがA_1A_2、、、A_kというk個のカテゴリに分類されているとし、各カテゴリの観測度数をf_1f_2、、、f_kとします。つまりf_1+f_2+\cdots+f_k=nが成り立っています。

また各カテゴリには理論確率p_1p_2、、、p_k(p_i>0p_1+\cdots+p_k=1)が与えられており、これが正しければ生じるであろう各カテゴリの理論度数はnp_1np_2、、、np_kとなります。

A_1 A_2 \cdots A_k
観測度数 A_1 A_2 \cdots A_k n
理論確率 p_1 p_2 \cdots p_k 1
理論度数 np_1 np_2 \cdots np_k n


この時、
\chi^2=\frac{(f_1-np_1)^2}{np_1}+\frac{(f_2-np_2)^2}{np_2}+\cdots + \frac{(f_k-np_k)^2}{np_k} = \sum_{i=1}^{k}\frac{(f_i-np_i)^2}{np_i}
は自由度k-1カイ二乗分布に従うことが証明できます。なお、\chi^2カイ二乗(かいじじょう)と読みます。

カイ二乗分布は、正の整数を自由度と呼ばれるパラメータでもっている分布で、下記のようなグラフになります。

f:id:mattyuu:20181211044636p:plain

\chi^2の式を見れば明らかな通り、観測度数が理論度数に一致する時\chi^2=0となり、観測度数と理論度数のずれが大きくなるにつれて\chi^2の値も大きくなります。\chi^2の値が大きくなればなるほど、その理論確率はあり得ないという事がわかり、どのくらいあり得ないかということがグラフと横軸の挟む面積で定量的に分かるのです。

f:id:mattyuu:20181211044701p:plain

いざ検定!

統計学の「検定」とは、「Aである!」という事実を主張したいとき、「Aではない」という仮説(専門的には帰無仮説という)を立て、その仮説の下で計算されるある統計量(ここでは\chi^2)が予め設定したあり得なさを表す確率(有意水準という。座学の統計では5%の値をとることが多いが、実際には分野、求められる精度によって全く異なる値を設定する)以下でしか発生しない、つまり稀にしか起きないことを示して、「やはりAなのだ!」と結論付けたり、結論付けれなかったりする手法です。

今回の大槻班長イカサマに関しては、イカサマであるという事を主張したいので、まずは「イカサマではない」という仮説を立てます。


次にカイ二乗を計算する必要があるのですが、そのためには大槻班長の出目のデータが必要です。普通なら「これは困ったっ!大槻班長の不正が暴けないっ!」となるところなのですが、なんと、カイジと同じくペリカ借金地獄の三好が過去の班長の出目をメモっていてくれました。実はカイジも三好のメモを見て大槻班長の不正に気付いたのでした。

f:id:mattyuu:20181211044719p:plain

「三好さん三好メモを付けてくれてありがとう!貴方のおかげで憎き大槻班長の不正を暴くことができるかもしれません!」

漫画の中で班長の出目の描写と三好のメモから作成したデータが下記です。

話数 出目 備考
12話 5の目 大槻初戦②②⑤
13話 目なし -
17話 4の目 イカサマ賽を使用⑤⑤④
18話 5ゾロ 圧倒的イカサマ賽使用
20話 5の目 三好メモ
20話 目なし 三好メモ
20話 目なし 三好メモ
20話 3の目 三好メモ
20話 6の目 三好メモ
20話 5の目 三好メモ
20話 4,5,6 三好メモ
20話 目なし 三好メモ
20話 目なし 三好メモ
20話 2の目 三好メモ
20話 4の目 三好メモ
20話 目なし 三好メモ
20話 2の目 三好メモ
21話 6の目 三好メモ
21話 4,5,6 三好メモ
21話 3の目 三好メモ
21話 5の目 三好メモ
21話 目なし 三好メモ
21話 目なし 三好メモ
21話 6の目 三好メモ
21話 目なし 三好メモ
21話 3の目 三好メモ
21話 目なし 三好メモ
21話 目なし 三好メモ
21話 4の目 三好メモ
21話 目なし 三好メモ
21話 4の目 三好メモ
21話 3の目 三好メモ
23話 4,5,6 45組が見守った大事な一投
29話 6の目 ③③⑥
32話 1の目 ④④①
32話 1の目 ④④①
36話 目なし 最後の対決1投目 ③④⑤
37話 目なし 最後の対決2投目 ②④⑥

こうして見ると三好メモの偉大さがわかります。三好メモには何投目でその目を出したかも書かれているため、目なしについてもカウントできます。

これをわかりやすく表にまとめてみます。ここではイカサマ賽を使ったという事に興味があるため、4、5、6関連の出目とそれ以外に分けてみました。

4の目 5の目 6の目 4ゾロ 5ゾロ 6ゾロ 4,5,6(しごろ) それ以外
観測度数 4 4 4 0 1 0 3 21
理論確率 \frac{15}{216} \frac{15}{216} \frac{15}{216} \frac{1}{216} \frac{1}{216} \frac{1}{216} \frac{6}{216} \frac{162}{216}
理論度数 2.57 2.57 2.57 0.17 0.17 0.17 1.03 27.75

「データも揃ったし、いざ計算!」といきたいところですが、アクチュアリー受験生のバイブルであるヘイジ親分の「明解演習 数理統計」によると観測度数も、期待度数も5以上である必要があり、5未満のものがある場合は隣接する階級を合体などしなさいとのことです。「ヘイジ親分ありがとう!(カイジ親分ではない)」

明解演習 数理統計 (明解演習シリーズ)

明解演習 数理統計 (明解演習シリーズ)


そこでまとめ直したのが下記表です。4、5、6が絡む出目はすべてまとめましたが、それで問題ないはずです。

出目に4、5、6が絡むもの それ以外
観測度数 16 21
理論確率 \frac{54}{216} \frac{162}{216}
理論度数 9.25 27.75


大槻はやったのか?やってないのか?

先ほど得られた表で\chi^2を計算すると、
\chi^2=\frac{(16-9.25)^2}{9.25}+\frac{(21-27.75)^2}{27.75} = 6.568
となり、「大槻班長は不正をしていない」という(帰無)仮説のもと、これは自由度1のカイ二乗分布に従うことになります。

有意水準(あり得ないと結論付ける確率)を5%として、グラフ上で\chi^2=6.568の値を確認してみると、この\chi^2の値は上側5%というあり得ないゾーンに入っていることがわかります。

f:id:mattyuu:20181211112621p:plain

「大槻班長は不正をしていない」と仮定すると、実際に目の前で起こった事象は5%以下の確率でしか起こらない、それは稀だ、つまり「大槻班長は不正をしている!」と結論付けることができるのです。

よってカイジ統計学の素養があれば、

「大槻っ!お前が不正をしていないという帰無仮説のもと、過去37回のお前の出目を有意水準5%でカイ二乗検定したところ、ピアソンの適合度基準が自由度1のカイ二乗分布の棄却域に入ったから、お前は不正をしたと証明されたぞ!」

といって、大槻班長の不正を暴くことができるのです。

f:id:mattyuu:20181211044822p:plain


統計は自分の主張を正当化するツールです。上司をデータで説得したい社会人は是非とも身に付けていただきたい技術です。統計の素養を身に付けたカイジのようにパワーワードを並べて威嚇することで、統計の素養の無い上司は何も言えず、貴方の言いなりになるでしょう。

しかし気を付けてください、上司(ここでは大槻班長)が統計的素養がある場合、

「それはあくまで有意水準が5%の場合じゃろ。有意水準1%ならば自由度1のカイ二乗分布の上側1%点は6.6349だから帰無仮説を棄却できん、つまりわしの不正があったとは言えないじゃろ。カカカ」

と返り討ちに合うかも知れません。

「これだから統計は嫌いだ。(心の声)」

f:id:mattyuu:20181211044858p:plain