さて、全体でどれだけあるのか?~一部の情報から全体量を推し量るにはどうしたらよいか?:研究員の眼

断片的に得られた情報から、全体像を推定する方法がある。

統計的推定の世界では、得られた情報・データをもとに、母集団の性質・傾向や、今後起こりうる展開などを、統計的手法を用いて推定する。これには、標本調査や時系列分析など、様々な手法があり、状況に応じて適切に活用されている。

そのような推定の1つとして、断片的に得られた情報から、全体像を推定する方法がある。まず、次の例をもとに、具体的に紹介したい。

そもそも、推定などせずに、直接、そのメーカーに聞いてみたらいいのではないか、という声があるかもしれない。それはそのとおりなのだが、こういう推定の問題というのは、得てして様々な制約条件が付くものと相場が決まっている。ここでは、このメーカーは製造能力を企業秘密にしていて、高級腕時計の製造数を教えてくれないものとしよう。

このメーカーは、この年に、少なくとも760個(10個のシリアルナンバーの中の最大値)の、高級腕時計を製造したはずである。問題は、これよりもどれくらい上積みして製造数を推定すべきか、ということにある。

このような場合、統計的には、この最大値を取り出した個数で割り、そこから1を差し引いた数だけ、上積みをするのが、良い推定方法となる。

今回の例では、75個 (= 760 ÷ 10 - 1 ) を上乗せすることになる。即ち、このメーカーはこの年に、835個 (= 760 + 75)の高級腕時計を製造したものと推定される。もちろん、推定はあくまで推定であって、実際の製造数がぴたりと835個に当たると保証するものではない。しかし、製造数の目安を知るという意味では、この推定は役に立つのではないだろうか。

実は、この方法は、「ドイツ戦車問題」として知られている推定方法の焼直しである。第2次世界大戦中、ドイツの戦車軍は強力な軍事力を誇っていた。連合国側は、ドイツ戦車軍の軍事力を知りたいと考えて、様々な諜報活動を行い、その状況を探った。その中で、ひと月に、何台の戦車が生産されているのか、についても知りたいと考えた。

そこで、連合国側では、ドイツの戦車に付いているシリアルナンバーを用いて、高級腕時計の例と同じような推定を行った。戦後、旧ドイツ軍の文書が明らかにされ、推定の値と、文書に書いてあった実際の生産数の値が比較された。その結果、この推定方法は、実際の数量を非常に良く捉えていたことが判明した。

高級腕時計や戦車に限らず、シリアルナンバーが付いている製品はいろいろある。製品以外にも、例えば、ある会員制組織では、メンバーに対して、1番から順に会員番号を付けている。人気の飲食店等で順番待ちをする顧客には、店側が1番から順に整理券を配ることもあるだろう。

このように、日常の中で、何かに、1、2、3、...と番号を付けていくことは、よく行われていることといえる。そう考えると、この推定法の活用の幅は、結構、広いのかもしれない。

多くの方々にとって、確率や統計というと、コインやサイコロなどを用いたさまざまな確率の問題に頭を悩まされた学生時代の苦い経験が思い起こされるのではないだろうか。そうした経験が、確率や統計など実生活の中では無用だと、割り切ってしまうことにつながってはいないだろうか。

しかし、何かの全体の数量について、おおよその目安をつけたいということは、実生活の中でもたまにあるのではないだろうか。そのときに、このような統計的な推定方法を活用することは、知っておいて損はないと思うが、いかがだろうか。

関連レポート

(2015年4月6日「研究員の眼」より転載)

株式会社ニッセイ基礎研究所

保険研究部 主任研究員

注目記事