latest log

酩酊状態で書いたエンジニアポエムです。酩酊状態で読んでください。

世論調査(RDD)の信憑性って、正直どうなんですか?

メディアが内閣支持率を主張するとき、常に疑問を感じています。

その数字の根拠は曖昧で、恣意的なのではないかと。
政治の混乱を生み、失われた20年を面白おかしく継続させたいと願っているだけなのではないかと。


さて、
世論調査に多用されている方法の1つが、RDD(Random Digit Dialing)です。

RDDとは、一般固定電話に機械がランダムに電話し、そのレスポンスを得て集計する方法だそうです。

しかし…

RDDは働いている独身者を対象外とする調査システム

これらのことから、

  • 050, 070, 080, 090 番号は対象外
    • 単身者の多くは携帯電話しかもっておらず、固定電話を持っていない
    • 都会に住み、独身で、アクティブな人ほどサンプリング対象外になる
  • 昼間自宅におり、突然かかってきた機械音声の電話に対して、
    怪しまず対応する人を対象としている(有効回答は10%程度とか)
    • 調査期間が伸びるほど平日の割合が高くなる
    • 自宅で昼間TVを見ている割合の高い、お年寄りや主婦層が母集団に
  • 苦情が入った場合は次回から対象外にする処理がはいっているはず
    • 電話番号が他人に渡り、番号がリサイクルされていても、RDDの対象外になっているはず
    • 苦情があった事にすれば割と自由にコントロールが可能で、後から事実関係の追跡も不能になっているはず
    • 言うほどランダム性はない。指向性を簡単に持たせる事ができる

という事がわかります。

つまり

RDDに基づく世論調査や、内閣支持率の数字というのは、

  1. 独身
  2. 首都圏に住んでいる
  3. 昼間働いている

といった属性に複数該当する人達の声は、ほぼ確実に含まれていないだろうとわかります。

どうするか

色々案はあると思いますが、
RDD だめです

追記

朝日RDD方式 を見ると、朝日新聞側の配慮が感じられます。

  • 電話番号の偏りを無くすために、3〜4段階にわけて番号をふるいにかける
  • 機械ではなく、人が電話する
  • 得られた回答を元に、さらに、全体として地域別、性別、年代別の構成比のゆがみをなくす補正をする
    • 回答者の構成比が総務省発表の実態構成比と同じになるようにする
  • 選ばれた人が不在でも、一度決めた対象者は変えず、時間を変えて最大6回まで電話をかける

という事のようです。

なのですが… 残念ながら朝日RDD方式でも、050番号や携帯電話が考慮されていません。

回答を補正しようにも、ゼロに何を掛けてもやはりゼロです、携帯電話ユーザの意見はそこには含まれていません。
むしろ、ほぼゼロの極小値に大きなバイアスを掛けると、こんどはノイズ成分の除去のほうが難しくなるでしょう。

ノイズ除去作業の実態が「以前の結果をふまえつつ、人力でそれっぽい値に補正する」のでは本末転倒です。

朝日RDD方式は、INPUTとOUTPUTに対しても人が介在できるポイントがむしろ増えているため、
ランダム性の根拠はさらに希薄になっているのでは? と考えます。

やはり、私の中で、RDDで得られた情報から世論やトレンドを読む行為と、血液型相性占いは謎のままです。

では「公正なアンケートを取りたい。お前がシステムを組んでくれ」というオーダーが来た場合に対応できるか

議論のための議論を起こす気もありませんし、 やはり批判だけではダメで、システム屋としてはより優れた対案を提示する必要がありますが…

今、それは手元にありません。これは悔しいですね。