2005年02月06日

フリーメールアドレスにまつわる仮説と検証

yahoo, livedoor, goo, hotmailとさまざまなフリーメールアドレスはあるわけだが。

d-uを見ているとフリーメールアドレスの人は、ちょっと調べればわかる程度 のしょうもない質問をしてたり、なんかだらだらと続いてたり、あるいは次々 と質問してきたりする、という「イメージ」があった。

で実際にそのイメージはどうなのかということで、42400〜42826の426通につい て調べてみた。判断はかなりテキトー。ぱっと見て感覚で「まぁよいかな」「こりゃ ダメだな」というのを適当に振り分けてハッシュDBファイルにアドレスを 書いていく。

結果なのだが、実はそれほど仮説を強く支持するようなものにはならなかった。

  • 335 vs 91。フリーメール系では24 vs 48。判断基準がアレなのでもっとちゃんとした尺度が必要。
  • フリーメールだからすなわちダメということはない。まともな投稿もある。
  • ただし、フリーメールアドレスの絶対数で言うと、ダメなほうが多い。
  • でもフリーメール投稿者が爆発的に全体の中で多いわけでもない。とはいえ、48/91=53%弱がフリーメールというのは高いと見るべきか?
  • ごく数名のフリーメール投稿者がダメメール率を上げている。
  • とりあえず、自分はメール出しすぎ(笑)。59通。かねこさんが32通なので、DSAの分も多いとは言えるが…。ちなみにその次はやまねさんの11通。

次はspamassassinを応用できないか考えてみよう(超暇ができるか気分転換が 必要なとき)。基本的なところでは全文引用をうまく引っ掛ける方法とか全角 英数字とかか。

原稿に煮詰まってアホなことに逃避していた深夜。まぁPerlのDB_Fileの使い方がわかったのでよしとするか。