ネット世論調査でバイアスを排除する方法に関する提案

ネット上のアンケート結果で政権支持率が高く出た、的な話をいくつか見ましたので。

この手の調査で重要なのは、精密さと正確さの２つなんですが、特に重要なのは正確さです。
精密さはサンプル数を増やすことで高くすることができますが、正確さはサンプル数に依存しません。正確さを確保するには、サンプルが無作為に抽出されていることが重要で、ネット上のアンケートでは基本的にそれが担保できません。
なので、ネット上のアンケートで何十万、何百万の回答を集めたとしても、精密に偏った結果が出るだけです。

では、ネット上のアンケートは全く無意味で使えないのかというと、アンケートの作り方によっては上手くバイアスを排除することもできます。

政権支持率を調べる場合、回答者の集団に政治的な偏りが生じさせないことが重要です。
ですが、特定のサイトでアンケートを行う以上、そのサイトにアクセスするネット利用者の集団に政治的偏りが生じるのは避けられません。

ではどうするか。

最も単純な方法は、前回の総選挙の比例選挙区でどの政党に投票したか、という質問を追加することです。
（※以下の数字は例示のための値で、実際の調査に基づく数値ではありません。）
その回答が、自民党に投票：9000人、民進党に投票：200人、共産党に投票：800人だったとしましょう。
そして実際の総選挙の比例得票数の割合が、自民党：50%、民進党：30%、共産党：20% だったとしましょう。

で、アベノミクスを評価するかという質問の回答がこんな感じだったとしましょうか。

前回総選挙での投票先	評価する
自民に投票した人	7000人
民進に投票した人	60人
共産に投票した人	40人
合計	7100人

単純に集計すると、アンケート総数10000人に対して7100人がアベノミクスを評価していることになりますから71%という結果になります。しかし、回答者の中の自民支持者の割合が実際の有権者全体の割合と乖離しているため、この結果にはバイアスが生じていて、単純な結果はあてにできません。

上記の場合、アンケートの結果に以下の補正をかければバイアスを排除できます。

前回総選挙での投票先	評価する	補正係数	補正後の結果（人）
自民に投票した人	7000人	×50/9000	3889人
民進に投票した人	60人	×30/200	900人
共産に投票した人	40人	×20/800	100人
合計	8100人	---	4889人

補正後のアベノミクス評価割合は49%となります。

この方法は、前回総選挙での投票先という質問を追加することによって、実際の総選挙結果と比較することができるようになりネットアンケート特有のバイアスを排除できるようにすると言うものです。
実際に使う場合は、さらに性別や年齢などで人口構成のばらつきを調整する必要もあるでしょうし、既存の世論調査との乖離がどの程度かを調べる必要もあります。
基本的に、既存の調査と違う結果が出た場合は、自分たちの調査方法にバイアスが無いかを調べて乖離の原因を調べるべきであって、ろくに調べもせずに“マスコミの偏りが”とか言い出すのは論外なんですよね。

それはさておき、上記のようにネット調査であっても設問の仕方によってはバイアスを排除できますので、ネットアンケートから真摯に何らかの世論動向を得たいと考えているのならそういった検討をお勧めします。

ちなみに上記方法の問題点は、アンケートに答えた全員が自民に投票してたりすると計算上、補正できないと言う点です。
あと、サンプル数がいくら多くなったも集団が偏っているため、結果の精密さは劣化しているという認識が必要ですね。上記の場合だと、サンプル数は10000人でも、精密さとしては200人の調査と同程度です（民進に投票した人が60人を実際の選挙結果での30%に適用すると、60÷0.3＝200人規模の集団に相当することになります。まあ、自民投票7000人分の情報量をもう少し評価することも出来なくはないでしょうが）。