ここ数日間で、Google Analyticsの流入計測で"Semalt.semalt.com"というリファラが多くなってきた。
調べてみると、どうもSEO関係のサービスらしいが、挙動がスパムっぽいのでブロックすることにした。
多くのWordpressのサイトがsemalt.comのクローリング対象になっているらしく、英語のフォーラムでは「ガチでうざい!」という議論が盛んなようです。ちゃんとした流入が計測できなくなるのは、サイトの健康診断の観点からすれば、良くないですものね。
さて、.htaccessには次のように書きました。
SetEnvIfNoCase Via evil-spam-proxy spammer=yes
SetEnvIfNoCase Referer evil-spam-domain.com spammer=yes
SetEnvIfNoCase Referer evil-spam-keyword spammer=yes
SetEnvIfNoCase Via pinappleproxy spammer=yes
SetEnvIfNoCase Referer semalt.com spammer=yes
SetEnvIfNoCase Referer poker spammer=yes
Order allow,deny
Allow from all
Deny from env=spammer
引用元:How to block semalt.com from visiting your WordPress website
始めにSetEnvIfNoCase でウザったりリファラやアクセス元をスパムとして認識して、スパム認識されたアクセスは全てブロックという設定だと思う。
コメント欄もスパムが毎日来ていたので、このついでにIPアドレスでブロックしました。
これで暫くはGoogle Analyticsの数字が落ち着くかな・・・。