作られた有意性-前提に、手を加えられてはいないか?:研究員の眼

統計学の仮説検定の仕組みには、研究者が恣意的に結果を操作できてしまう可能性がある。

人々の健康状態や、病気について、統計学を用いて解明する学問分野として、疫学がある。疫学では、仮説検定が行われることが多い。その流れは、次の(1)~(5)のような手順となる。

手順(1) 示したいことと反対のことを、帰無仮説として設定する

手順(2) 帰無仮説を否定する(「棄却する」という) 確率の水準(「有意水準」という)を設定する

手順(3) 臨床試験や健康調査などを行って、データを収集する

手順(4) 帰無仮説を前提とした場合に、収集したデータが得られる確率(「P 値」という)を計算する

手順(5) 計算されたP 値と、有意水準を比較して、帰無仮説を評価する

手順(5)の評価で、P値が有意水準未満の場合、帰無仮説が棄却される。即ち、統計的な論証が得られたことになる。この場合、示したいことが示されたとして、自説を展開することができる。

一方、P値が有意水準以上の場合、帰無仮説は棄却されない。これは、統計学的には、帰無仮説が否定されなかったことを意味する。しかし、かといって、帰無仮説が肯定された訳でもない。つまり、帰無仮説は、否定も肯定もされない、中途半端な状態になったことを意味する。

通常、仮説検定を行う研究者は、自分の論説を展開する上で、ある命題を統計学的に示したいという強い意図を持っている。例えば、研究開発対象の候補薬には効果があるとか、喫煙とがん発症の間には関連性がある、などといったことだ。

この状況を誇張して、やや口語的に言えば、研究者は、統計的検定を通じて、帰無仮説を棄却したくて、うずうずしている。検定の結果、もし、帰無仮説が棄却できないとなると、自説が論証できないため、困ってしまうことになるからだ。

帰無仮説が棄却できなかった場合に、そのデータを用いた論証をあきらめられればよいが、これはそう簡単な話ではない。通常、臨床試験の実施には、多額のコストや、多くの時間が費やされている。「臨床試験で、有意義な結果は得られませんでした」では、済まされないかもしれない。

そこで、何とかならないかと、研究者は考えてしまいがちだ。まず、すぐに思いつくのが、手順(2)で、有意水準を高めに設定し直すことだ。

例えば、有意水準を1%と設定して検定したところ、P値が3%となったため、有意水準を5%に設定し直す。これは、スポーツで言えば、プレーの後に、ルールを変えて、正反対のジャッジをするようなもので、本末転倒と言える。

このようなことを防止するために、臨床試験では、あらかじめ計画書を作成し、その中で有意水準を明記することとされている。

次に、手順(3)で、収集するデータの数を増やすことが考えられる。次の例を見てみよう。

候補薬を投与された人の70%、候補薬と形状や味がそっくりだが何も薬効のない対照薬(プラセボ)を投与された人の63%が回復している。回復割合には、7%の差がある。しかし、P値を計算してみると、32.4%もあり、有意水準1%で、帰無仮説は棄却されない。((*) P値は、ピアソンのカイ二乗検定という検定の値[以下、同じ])

AOL

そこで、試験データの数を、10倍に増やしてみることにした。症状の回復、未回復の人数も、それぞれ10倍となったとする。即ち、候補薬やプラセボを投与された人の回復割合は、70%、63%のままだったとしよう。

この例で、P値を計算してみると、0.2%となり、有意水準1%で、帰無仮説は棄却される。つまり、データを増やすことで、有意でなかったものが、有意に変わったのである。

AOL

ただし、いつもこの例のように、思惑通りに、事が進むとは限らない。例えば、次の例のように、候補薬の回復割合が低下し、一方、プラセボの回復割合が上昇する、といった事態が生じるかもしれない。この例で、P値を計算してみると、2.6%となり、有意水準1%で、帰無仮説は棄却されない。

AOL

このように、データを増やしても、P値が低下しないことがある。そこで、P値が1%未満となるまで、更に、データを増やすことになる。例えば、データ量を、例3の2倍にして、回復割合が変わらなければ、P値は0.2%となって、有意水準1%で、帰無仮説は棄却される。

しかし、こうした行為は、研究者の恣意によるもので、公正さを欠く。このようなことを防ぐために、臨床試験の計画書では、あらかじめデータ数も明記することとされている。

疫学に限らず、一般に、統計学の仮説検定の仕組みには、研究者が恣意的に結果を操作できてしまう可能性がある。仮説検定の結果を把握する際には、検定方法の説明書類(臨床試験の計画書等)を通じて、恣意的な設定がないかどうかを、よく確認することが必要と考えられるが、いかがだろうか。

関連レポート

(2017年9月4日「研究員の眼」より転載)

株式会社ニッセイ基礎研究所

保険研究部 主任研究員

注目記事