« トラックバックのスパムと,安全にチェックする手法その2 | トップページ | 迷子札が迷子に!(フェレットの散歩に適した迷子札) »

2006年12月 2日 (土)

POPFileで迷惑メールの隔離

   ホームページやブログを開設していると,迷惑メールが沢山来るものである。ふだんは,プロバイダの迷惑メール対策機能を使用し,かつ,パソコンではソースネクスト社の「ウイルスセキュリティ」(まぁこれが市販のウイルス対策ソフトでは一番安価な部類ではある)を使っていて,この迷惑メール監視機能を併用した形を取っている。とはいえ,どちらも誤認識が結構多いのには困ったものだ。身内からの携帯メールが迷惑メール(SPAM)扱いされて一向にメールソフト(Outlook Express)で受信できなかったことを経験したし(一定期間で自動削除される前に気づいてよかった),何度学習させても迷惑メール扱いされてしまうメールマガジンとかもあり,鬱陶しい。

 で,フリーで使える迷惑メール対策ソフトはないかとの質問を受けたこともあり,探したところ,下記のものが良さそうに思えたので,プロバイダやウイルスセキュリティの迷惑メール機能をあえて解除した上で試してみた。期間はちょうど1週間。

http://www.atmarkit.co.jp/fnetwork/rensai/netool08/popfile01.html
連載:ツールを使ってネットワーク管理(8)
「POPFile」でスパムと無駄な時間は除去じゃ!
~スパムメール対策「POPFileのインストール」~
山本洋介 bogus.jp 2006/4/25

|ダウンロードページ
| Windows版 
|   http://sourceforge.net/project/showfiles.php?group_id=63137&package_id=64395
| クロスプラットフォーム版 
|   http://sourceforge.net/project/showfiles.php?group_id=63137&package_id=59947
| MacOSX版 
|   http://sourceforge.jp/projects/popfile/files/

上記「アットマーク・アイティ」は,初心者用の解説記事となっていて,手順も詳しく大変判りやすい。Windows版は現時点(2006-12-02)で,「v0.22.4 (2006-02-22 04:36) 」となっている。これをインストールしてみた。使用するメールソフトは Outlook Express 6。なお,記事中,一部間違っている(あるいはバージョンアップで変わった?)点もある。記事中および当方追加のポイントは下記。

【POPFile設定のポイント】

・記事に解説されているように,迷惑メール「spam」とそれ以外に分ければよいので,初期値として表示される4つの「バケツ」のうち,「work」と「spam」の2つを残し,他は削除してよい。

・POPFileを経由するようにクライアントを設定する必要があるが,Outlook E20061202_oe1xpress 6 を使用の場合は,インストールで表示される「メールクライアントの設定」(図)で ,自動設定が可能。ただし,設定内容については記事の説明を読んでおいた方がよい。また,この自動設定を行う前に,念のため Outlook Express 6では,[ツール]-[アカウント]で,受信設定を「エクスポート」で保存(バックアップ)しておいた方がよい。

・記事に解説されているように,Outlook Express 6 では,あらかじめ,迷惑メールフォルダを作成しておき,[ツール]-[メッセージルール]-[メール]とし,題名に「spam」が付くものを,そのフォルダに隔離するように設定する。

・タスクトレイの蛸みたいな形のアイコンを右クリックして「POPFile UI」を選び,「POPFileコントロールセンター」を起動し,「バケツ」タブをクリックして,「件名の変更」は「spam」バケツだけとし,「work」「unclassified」のバケツは件名変更しないようにチェックをはずし「変更を適用」ボタンをクリックする。

・Outlook Express を起動して,メールを受信する。受信して初めて,20061202_popfile1 「POPFileコントロールセンター」の「履歴」タブに,メールの分類が表示される(図)。すなわち,プロバイダの迷惑メール対策機能が,メールソフトでの受信前に働くものであるとすると,POPFileはあくまで受信を仲介するだけで,迷惑メールかどうかの分類は受信後に行う。つまり,次回以降に受信するメールから,その学習結果が反映されることになるので,そこが注意点である。(ウイルスセキュリティの迷惑メール監視機能と変わらないとも言える。) 最初は学習が全くなされていないので全てのメールが「unclassified」扱いとなる。これを「work」か「spam」かを選択して「再分類」ボタンをクリックして覚えさせてやる訳だ。

 さて,この迷惑メール分類・統計機能が面白い。市販のウイルス対策ソフトやプロバイダの迷惑メール対策機能がブラックボックスになっていて中の仕組みが見えないのに対し,このPOPFileではその仕組みをユーザに判りやすい形で見せてくれる。

【POPFileの面白い点】20061202_popfile2

(1) 「POPFileコントロールセンター」の「履歴」タブで,各々のメールの「件名」をクリックして表示される情報

 メールのヘッダや本文が見える。面白いのは,バケツに対応した色で単語が表示される点。画面例の場合,「work」バケツに対応した単語が緑色で,「spam」に対応した単語が赤色で表示されている。そして最終行の「得点」に,その評価(確率)が表示されている。より確率が1に近い方に分類されるという訳だ。

(2) 「分類決定図」20061202_popfile3

 (1)の画面右下に「単語の得点を表示」があるが,これをクリックすると,評価の詳細が表示される。下方向にスクロールしていくと表示されるのが「分類決定図」。どんな単語がどんな重み付けを行って評価したのかが一目瞭然。

(3) 「POPFileコントロールセンター」の「バケツ」タブで表示される統計情報(分類精度/分類されたメール数/単語数)

 私の実験の場合,すでにメールサーバに3日間のメールがたまってい20061202_popfile4た状態(さらにはメールサーバ上で迷惑メールをあらかた削除してしまった状態)でPOPFileの実験を始めてしまったため,最初のメール受信で「unclassified」が74件。うち,「WORK]が68件,「SPAM」が6件といった具合に分 類した。画面で1件残っている「unclassified」はうっかりSPAMを一覧から見落として再分類するのを忘れて消してしまったもの。この最初の「unclassified」の分があるので,精度は84.09%となっているが,実際はもっと高い精度で隔離できている。図のOutlook Express で,分析しやすいように,隔離される「迷惑メールトレイ」の下に「確かにSPAM」,「誤検出(SPAMなのに正常メールと間違えた)」,「誤検出(正常メールをSPAMと間違えた)」の3つのフォルダを作り,これらへの移動は手動で行った。1週間の試行の結果は下記。
 ・「確かにSPAM」 401通
 ・「誤検出(SPAMなのに正常メールと間違えた)」 35通
 ・「誤検出(正常メールをSPAMと間違えた)」 0通
すなわち,本当の精度は92.0%といったところ。「誤検出(正常メールをSPAMと間違えた)」が1通も無いところは素晴らしい。この点,プロバイダやウイルスセキュリティの迷惑メール対策機能よりすぐれているかもしれない。 20061202_oe320061202_oe2

【POPFileの限界】
 私は,プロバイダで受信したメールを,プリペイド携帯電話へも転送するように設定している。ソフトバンクのプリペイド携帯電話は,一定文字数分はメール受信無料だから大助かりなのだが,迷惑メールをクライアント側で隔離する設定(POPFile)にしていると,迷惑メールまで多量に携帯電話に飛んでくることになる。無料だからよい,という話もあるが,鬱陶しいことには違いない。携帯電話のバッテリ消耗の原因にもなる。プロバイダのサーバ側のメールボックスで隔離しておれば,この迷惑メール自体が携帯電話に飛んでくることはないため,その鬱陶しさが減ずることになる。とはいえ,前述のとおり誤認識で届かなくなる正常メールが出てくるし,迷惑メールのチェック作業自体も複数箇所で行う必要が出てくるため,面倒さが増す。悩ましいところである。

【ウイルスセキュリティの迷惑メール対策機能】

 ウイルスセキュリティは,経験上誤認識が結構発生するとはいえ,「疑わしいwebリンクが含まれるメール」,ActiveXオブジェクトやJavaアプレット,スクリプトが含まれるメール,プログラムファイルやzipファイルが含まれているメールを無条件にSPA20061202_vs1M扱いする機能もあるので,その点では劣っているとは言えない。POPFileと2重に動かすことは可能だが,正常メールがSPAMと間違われた際のメールタイトルが大変なことになることは間違いない。まぁ一旦EML形式で保存しておいてからバイナリエディタやJISコードが扱えるテキストエディタで中身を書き換えた後,もう一度ドラッグ&ドロップでOutlook Expressに戻せば,改変(この場合は元に戻すのだが)も可能ではあるのだが。

【補足:Outlook Expressでメールを安全に見る方法】

 下記の設定を行った上で,一覧からクリックで選択し「転送」をクリックして見る。疑わしいメールの本文が引用符付きながら安全な形(テキスト)で読める。ただし,添付ファイルそのものを実行してしまえば意味がない。まぁOutlook Express 6ではかなり安全な設定が可能になっているのであるが,旧版(Outlook Expres 5)でも使える手法で操作することは意味があろう。会社で,他の方の端末を操作しなければならないことがあるからね。

(a) [表示]-[レイアウト]から「プレビューウィンドウを表示する」のチェックをはずす。
(b) [ツール]-[オプション]で「読み取り」タブをクリックする。「プレビューウィンドウで表示するメッセージを自動的にダウンロードする」のチェックをはずす。
(c) 「メッセージはすべてテキスト形式で読み取る」のチェックを入れる(Outlook Express 6の機能)。URLを偽っているやつとかあるからね。
(d) 「送信」タブより,メール送信の形式:テキスト形式 を選択しておく。
(e) 「受信したメッセージと同じ形式で返信する」のチェックをはずす。(c)と合わせて,そもそも受信したメールがHTML形式であってもテキスト形式に変換され引用される(「転送」ボタンクリック時)ので,疑わしいメールの本文を安全にチェックできる。
(f) 「セキュリティ」タブより,セキュリティゾーン:制限付きサイトゾーン を選択。(初期値)
(g) 「ほかのアプリケーションが私の名前でメールを送信しようとしたら警告する」のチェックを入れる。(Outlook Express 6の機能。初期値)。メール送信処理を自前で内蔵しているウイルスがあるため安心はできない。
(h) 「ウイルスの可能性がある添付ファイルを保存したり開いたりしない」のチェックをはずす。(Outlook Express 6の機能) はずしておかないと,マイクロソフト社以外のファイルを開けないことが多く不便。要らない機能だ。
(i) 「HTML電子メールにある画像および外部コンテンツをブロックする」のチェックを入れる。Windows XP Service Pack 2(SP2)で追加された機能。電子メールの中には,ウイルスを特定ホームページより自動的にダウンロードしたり,特定のホームページにアクセスしてその電子メールアドレスが有効なことを確認するスパイウェアとしての機能が組み込まれているものがあるので,この機能は有用である。もっとも(e)で「転送」でテキスト形式で開けばそんな心配はしなくて済む。
(j) メールの一覧画面では,項目名のところでマウス右クリックして「表示項目の設定」とし,下記項目を表示するようにするとよい。
・サイズ ~ サイズが大きい迷惑メールは怪しい。ウイルス付きの可能性高い。
・添付(初期値) ~ HTML形式のメールで画像込みの場合,マークが付かないときもあるので過信は禁物。
・受信日時(初期値)
・送信日時 ~ 相手送信時刻と受信時刻を比較することでメール遅延状況とかもわかる。ただし相手のパソコンの時刻が狂っていることもあるので,過信禁物。
・送信者(初期値) ~ ひどいのになると,自分のメールアドレスに詐称されているケースがある。
・宛先 ~ 宛先があからさまにおかしいメールはそれだけで迷惑メールの可能性が高い。
・件名(初期値)

2006-12-02 懶道人(monogusadoujin)

【関連項目】
http://midorigame-ferret.cocolog-nifty.com/blog/2006/11/google_a861.html
トラックバックのスパムと,安全にチェックする手法,そしてGoogleアラート

http://midorigame-ferret.cocolog-nifty.com/blog/2006/12/post_bb32.html
トラックバックのスパムと,安全にチェックする手法その2

http://midorigame-ferret.cocolog-nifty.com/blog/2006/12/popfile_5145.html
POPFileで迷惑メールの隔離

http://midorigame-ferret.cocolog-nifty.com/blog/2006/12/outlook_express_cc93.html
Outlook Express 6 のメールデータが壊れた! → 復旧(救出・復元)を試みる(DbxRescue ほか)

http://midorigame-ferret.cocolog-nifty.com/blog/2006/12/_popfile_v0224__6024.html
迷惑メール検出率の比較 ~ POPFile v0.22.4 と ウイルスセキュリティ 9.1.0084

|

« トラックバックのスパムと,安全にチェックする手法その2 | トップページ | 迷子札が迷子に!(フェレットの散歩に適した迷子札) »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: POPFileで迷惑メールの隔離:

« トラックバックのスパムと,安全にチェックする手法その2 | トップページ | 迷子札が迷子に!(フェレットの散歩に適した迷子札) »