BLOG
2018年06月25日 16時22分 JST | 更新 2018年06月25日 16時22分 JST

池に魚は何匹いるの?-全体の数を、どう見積もるべきか?:研究員の眼

2つの推計方法を考えてみよう。

確率や統計の分野は、難解な算式や専門用語がたくさん出てきて、とっつきにくい。こういう分野では具体的な問題を相手にすると興味がわきやすいように思われる。例えば「ある池に、魚が何匹いるかを推計してみる」といったことだ。2つの推計方法を考えてみよう。

まず、1つ目の方法。この池から、適当に20匹の魚を釣って、標識となる札をつけて池に戻す。しばらくしてから、30匹の魚を釣ったところ、15匹に標識がついていた。このとき、この池には何匹の魚がいると推計されるだろうか。

1回目の釣りで、池全体の魚のうち、20匹に標識をつけた。2回目の釣りでは、30匹のうち15匹に標識がついていた。1回目と、2回目の釣りで、標識の付いている魚の割合は同じだと仮定する。すると、「池全体の魚の数:20匹=30匹:15匹」という、比の等式ができる。これを解いて、池全体の魚の数=40匹となる。

ただし、この推計には、いくつか前提条件が必要となる。魚が池全体に均等に分布していること(亀やザリガニなどでは均等に分布しているか疑問が残るかもしれない)。1回目と2回目の釣りの間の時間が十分にあって、その間に魚が池の中で回遊していること。

とは言っても、時間が空きすぎると、その間に死亡したり誕生したりする魚が出てしまうので、2回の釣りの間隔は適度にとどめること。過去に同様の推計を実施したために、最初から標識がついているような魚がいないこと、などである。

この方法は、理論的には申し分ないが、実際にやろうとすると結構大変である。まず、20匹の魚を釣って標識の札を付けなくてはならない。そして、しばらく時間を置いた後に、30匹も魚を釣る。これを1人でやるためには、相当な釣りの腕前が必要となるだろう。

そこで、もっと簡単な2つ目の方法。この池から1匹ずつ魚を釣る。標識が付いていなければ標識の札をつけて、池に戻す。こうして、キャッチアンドリリースを続けたところ、10回目に、初めて標識の付いた魚を釣り上げた。このとき、この池には何匹の魚がいると推測されるだろうか。

この問題は、みかけの単純さによらず、かなり奥が深い。10回目に、初めて標識のついた魚を釣り上げた、ということは、9回目までは標識のついていない魚を釣ったことになる。池の中には少なくとも9匹の魚がいる。ちょうど9匹だとすると、9回目まで毎回違う魚が釣られて、全部の魚に標識がついた状態で10回目の釣りを迎えたことになる。こういうことが起きる確率は0.1%未満となる。

一方、仮に、池に1万匹も魚がいたとする。こう仮定すると、9回目の釣りを終えた段階で1万匹のうちの9匹にしか標識がついていないことになる。10回目の釣りで、標識のついた魚を釣り上げる可能性はかなり小さい。こういうことが起きる確率を計算してみると、またも0.1%未満となる。

つまり、9匹と1万匹の間に、もっと確率が高くて妥当な推計の数があるということになる。

池全体の魚の数をn匹とする。1回目の魚が標識なしの確率は1。2回目の魚が標識なしの確率は1-1/n。3回目は1-2/n。... 9回目は1-8/n。そして、10回目に、標識の付いた魚が9匹いる状態で、そのうちの1匹を釣り上げる確率は、9/nとなる。これらを掛け算して、次の確率の算式ができる。

1×(1-1/n)×(1-2/n)×...×(1-8/n)×9/n

ここで、この算式の値が最大になるのはnがいくらのときか、というのを考えるのである。ただし、これをまともに計算しようとすると、累乗や階乗の計算が必要となり手計算では困難を極める。

そこで、最大値を求める計算として、対数をとって、さらに微分した算式を考えて、nを9から、1ずつ増やして代入してみる。そうして、nを増やしていったところ、その算式の計算結果の符号がプラスからマイナスに転じるような箇所をみつける。そこで、元の算式が増加から減少に転じる。つまり、このようなnが最大値を与えるnということになる。

実際に計算してみると、nの値は42となる。つまり、池には、42匹の魚がいると推計される。そして、「池全体の魚の数を42匹としたときに10回目に初めて標識のついた魚を釣り上げる確率」は、約8.5%となる。

ただし、ここで1つ注意しなくてはならない点がある。この2つ目の方法は、限られたデータをもとに推計しているため、推計結果にある程度の幅が生じる点だ。今回、上記の確率が8%以上となるnの値の幅は31~59となる。42匹という推計結果は、あくまで目安と考えるべきだろう。

ちなみに、20回目に初めて標識付きの魚を釣り上げた場合、池全体の魚の数の目安は183匹。30回目なら425匹。50回目なら、1,208匹と推計される。

この2つ目の方法は、釣りの作業自体は効率がよい。しかし、対数や微分といった数学のテクニックと、パソコンなどでの表計算ソフトを使った計算が必要で、その手間はなかなかあなどれない。推計結果にある程度の幅が生じるという課題もある。

釣りに自信がある場合は、1つ目の方法。数学のテクニックと表計算ソフトでの計算に自信がある場合は、2つ目の方法がおすすめといえる。

池で釣りをしていて、釣り竿を垂れてぼーっとしているときには、その池にいる魚の数の推計についてあれこれ考えてみるのも退屈紛れになると思われるが、いかがだろうか。

関連レポート

日常生活における統計学の活用-一部の情報から全体量を推し量るにはどうしたらよいか?

「○○年に一度」のリスク-確率分布が、正規分布ではなかったら、どうなるか?

本当に独立なのか-確率は、いつでも掛け算できるのか?

(2018年6月4日「研究員の眼」より転載)
メール配信サービスはこちら
株式会社ニッセイ基礎研究所
保険研究部 主任研究員
篠原 拓也