- Webalizerの漢字(日本語)コード統一
http://flatray.com/misc/webalizer.html
これまで、convertlog を使ってましたがちょっとおもしろそうなのを見つけたのでちょっと入れ替えてみました。
文字コードの変換だけでなく、全角アルファベットを半角に、アルファベット大文字は小文字に変換、おまけに検索文字の全角スペースを半角スペースに変換し、半角スペースをキーワードの区切りとして各キーワードを並び替えまでしてくれます。
BBClone だと完全に1キーワードまで分解してくれるのですが、どちらかというと「どういう組み合わせで辿り着いたのか」 が知りたいので、これはかなり重宝しそうな気がします。
ソートをするようになったからか、さすがにこれまでよりも少し時間がかかるようになりましたが、なかなか良い感じです。perl ベースなので、自分で改造できそうな(気がする) のもちょっと良いかも。
ついでに、webalizer まめちしき。検索エンジンからのリファラで埋まってしまうことが多く、普通のサイトからのリファラが埋もれてしまうことがあるので、ウチではこうやって対策してます。GroupReferrer とHideReferrer を併用すると、合計だけが表示され、個々のリファラは消してくれます。検索エンジンに限らず、いくらでも応用がきくと思います。
GroupReferrer .google. Google
GroupReferrer .104/search Google
HideReferrer .google.
HideReferrer .104/search
GroupReferrer search.yahoo.co.jp Yahoo!Japan
GroupReferrer srd.yahoo.co.jp Yahoo!Japan
HideReferrer search.yahoo.co.jp
GroupReferrer search.goo.ne.jp goo
HideReferrer search.goo.ne.jp
GroupReferrer search.biglobe.ne.jp biglobe
HideReferrer search.biglobe.ne.jp
GroupReferrer search.msn MSN
HideReferrer search.msn
GroupReferrer excite.co.jp/search.gw excite
HideReferrer excite.co.jp/search.gw
GroupReferrer infoseek.co.jp infoseek
HideReferrer infoseek.co.jp
GroupReferrer mixi.jp mixi
HideReferrer mixi.jp