リファラspam? 対策

httpd であるApache の標準の機能を使ってアクセスログを取っています。そのログはWebalizer が定期的に食べてくれて一覧にしてHTML ページにしてくれるので、普段はコレを見るだけで状況をチェックできます。リアルタイムで見てるわけではないですが、さほどアクセスのあるサイトでもないですし、この程度で充分。
さて、そんな風にしてチェックしてたら、なにやら見慣れぬリファラ(referrer) が。リファラってのはブラウザがサーバに送ってくる、一つ前に見ていたページのURL のことで、大抵はそのページにリンクしている元のページ(リンク元) のアドレスであることが多いです。で、これを見ることでどこからリンクされてるかが分かって、夜中に一人ほくそ笑んだりするわけですね。暗いですね。はい。
リファラは偽装することもできるので、Web アプリを作るときはリファラに頼ってはいけません。っと、話がそれた。で、なにやら同一のリファラからそこそこ(とはいえ、普段のウチからすれば相当数)のアクセスがあったので、すわ、どこぞで祭られたか!? と思って見に行くと…エロ同人誌をキャプチャした画像を貼り付けたページだったり。無修正エロ画像だったり…。………。えーと、とりあえずこれはこれでおいとくとして(おやくそく)、一体どこのどいつの仕業でぃ(ちょこっと江戸前風)、とばかりにApache のログ漁り。
2時間あまりの間に6つのIP アドレスを駆使し、合計118 アクセスありました。根拠は、ユーザエージェントが全て"HSlide/1.5" というものだったのと、サイト内の閲覧ルートが全て同じだったため。しかも1秒とおかずに次のページに飛んでいるため、どうみても読んでるようには見えないし、というか人の手による閲覧でないのは明かです。
この"HSlide/1.5" ってのはググってもあんまり情報が出てこないのですが、もう2度と来るな、ということでhttpd レベルで拒否しておきましょうそうしましょう。
ちなみに…アクセス元のIP アドレスのDNS レコードを引いてみたところ、案の定、lookup failed 。ついでに、whois も引いてみたところ、全て某国のアドレスでした…。なるほどね。
しかしエロサイトのトップページにアクセスを集めたいのなら分かるけど、このような形のspam 行為を行う意図が謎です。なんなんだろう?


(2004/07/15 21:23 追記)
httpd.conf の記述はこんな感じで。以降、状況に応じて追加予定。
参考: robotはぢきについて (http://c-moon.jp/robots.shtml)


<Directory "hogehoge">

<IfModule mod_setenvif.c> SetEnvIf User-Agent "^HSlide/" DenyRequest
Order allow,deny Allow from all Deny from env=DenyRequest
</IfModule> </Directory>