ドコモのモバイル空間統計は本当に安全なのか?
ドコモのモバイル空間統計ってのがある。
携帯電話の基地局への接続状況からそのエリアにいる人間の数を割り出して視覚化するというものだ。
ここのページを見ると、内容としては
モバイル空間統計では、運用データのうち電話番号の様な個人を識別できる情報を使用しません。また、生年月日を年齢層に変換するなど情報の要約を行います。この処理を「非識別化処理」と呼びます。
次に、属性別に携帯電話の台数を数え、さらに、ドコモの携帯電話の普及率を加味することで、ドコモのお客様以外の方々までも含む人口を推計します。この処理を「集計処理」と呼びます。
最後に、少人数エリアの数値を除去します。この処理を「秘匿処理」と呼びます。秘匿処理は、統計的に少数であることで個人を推測されやすくなる場合があり、これを防ぐために行います。
とある。同じページ内にある図を見ると、秘匿処理の時点でデータなしになっているエリアはそもそも人数が少ないということがわかってしまうので、こりゃ安全な人口統計とは言えないんじゃないか?どうなんだこれ?泥棒御用達統計になっちゃうんじゃないか?
的なことが気になったのでメモをしてみた次第。
どうなんだこれ。本当。