*

GoogleAdSenseのレポートに知らないURLが出た場合の対応と2chleak.net(2chleak.com)の弾き方

投稿日:2013/10/03 最終更新日:2014/04/14

GoogleAdSenseは設置こそしているものの普段から放置状態にある。
アカウント自体はもう長い事あるものの、設定項目なども忘れている部分が多く、10月1日にあった規約改定の内容確認のついでにと色々設定を見ていた。

パフォーマンスレポートでサイト毎のページビューやクリック数が見れて、改めてみてみると実験的に作って放置したアカウントを覚えているかすら怪しいブログや、www.example.com と example.com (表示は同じ)の2つがカウントされていたりした。

人間と違ってクローラはwwwの有無で全く別のサイトと捉えるために、こいつをどちらかに統一してやるとこの問題は解決する。
最も簡単なのは.htaccessを利用して301リダイレクトする方法。

Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www\.example\.com$
RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]

 

謎の2chleak.comなるサイト

問題はwwwがあるだとかないだとか初歩的な事ではなくて、パフォーマンスレポートに全く記憶にない 2chleak.com なるサイトがあった事。
少し調べてみると、どうやら人様のコンテンツを丸ごとコピーして広告を貼ってる盗用サイトらしい。
2chleak.netも同一。

GoogleAdSenseのデフォルト設定では、広告を掲載したいサイトを新たに認証しなくても、同じ広告コードを好きに貼る事が出来る。
どうやら丸ごとコピーされてそちらで広告が表示されてしまったが為にレポートに紛れ込んでいるらしい。

別に広告が表示されてるなら良いんじゃ?と思うかもしれないけど、自分の管理外に行ってしまってる事は確かだし、なにより盗まれた側でGoogleAdSenseのルールに違反するような事になれば、自分のGoogleAdSenseアカウントが停止してしまう。

 

特定のURLのみ広告コードの使用を許可する設定

自分とは関係ないばかりか、勝手に食い物にされた上に問題を起こされてGoogleAdSenseが止まるのはマズい。
広告コードをコピーしてクリックしまくる様な輩も未だに居るみたいだし、自分の管理しているサイトでのみ広告コードの使用を許可する設定にしておくのが無難だ。

まずGoogleAdSenseにログインしてアカウント設定を選択する。

GoogleAdSenseアカウント設定画面

続いてアカウント設定ページ下部の「アクセスと認証」にある「自分のアカウントで特定のサイトの広告表示のみを許可する
」にチェックを入れる。
すると許可するサイトを指定できるボックスが出現するので、ここに1行区切りで書いていく。
(example.comと指定すると全てのサブドメインを含む)

許可するサイトのアドレスを指定

これで保存を押すと設定がなされ、ここで指定されていない所で広告が表示されると警告が出る。
指定サイト以外でも広告は表示されるものの報酬は発生しない。

警告が出て、それが例えばGoogleのキャッシュや、自分が管理しているウェブサイトだった場合は、同様の方法で追加すれば良い。

 

2chleak.net(2chleak.com)を弾いてコピーを防ぐ

それにしても気に入らないのは2chleak.net(2chleak.com)の存在だ。
昔からクローラを作って丸ごとコピーしていく輩は多いけど、やられる方としてはたまったもんじゃない。

多分クローラも同じサーバでcronでまわしていると思うので、2chleak.net(2chleak.com)のアクセスを弾いてコピーを防いで見たいと思う。

2chleak.net も 2chleak.com もIPアドレスを引くと 103.3.188.126 となっている為、IPアドレスが変動する環境であれば効果が無くなる可能性もあるが、とりあえずIPアドレスではじくことにする。

弾く方法はサーバを触れる状態にあるならiptablesを使い、そうでないなら.htaccessを使うのが良いと思う。

 

iptablesで弾く

例によってDebian Wheezyでの設定。
iptables-persistentパッケージが導入されている前提。

# vi /etc/iptables/rules.v4

-A INPUT -s 103.3.188.126 -j DROP

ウェブサーバを外部に公開している人は概ね以下のような設定がなされているハズ。

-A INPUT -p tcp --dport 80 -j ACCEPT

 

このtcp port80をACCEPTする設定より上にDROP設定を書かないといけない。
1回うっかり下に書いてすり抜けたので注意して欲しい・・・。

追加したら設定の反映と確認。

# service iptables-persistent start
# iptables -L

 

.htaccessで弾く

.htaccessに書いてドキュメントルートにでも放り込む。

order allow,deny
allow from all
deny from 103.3.188.126

以上。

 

2chleak.net(2chleak.com) が同じサーバ上でクローラを動かしているならこれで弾ける筈。
別のサーバやもっとややこしい方法で取得している場合は華麗にすり抜ける。

しばらく様子を観察したい。
自鯖に来てくれたら話早いのに・・・。

収益が伸びない人にお勧め

  • このエントリーをはてなブックマークに追加
  • Pocket
  • 1 follow us in feedly

関連記事

no image

複数人管理のサイトでそれぞれの広告コードを貼る(Googleアドセンス)

Web上の身内と数人でブログを更新していきたいと思うことがある。 普...

記事を読む

新着記事

no image

【WordPress】WP Super Cacheで設定時に500エラーが出るときの対処法

WordPressのページキャッシュ用にWP Super Cacheと...

記事を読む

【Debian】mysqlのスロークエリログを取得する手順

VPSにWordPressをインストールしていると、キャッシュプラグイ...

記事を読む

no image

MIFES10でUWSCの予約語・キーワードを明示する

最近エディタにはMIFES10を利用しているが、UWSCの利用頻度が上...

記事を読む

no image

WordPressでメニューが文字化けする

WordPressでメニューを編集した際、保存を押すと文字化けが起きた...

記事を読む

no image

WEBサイトキャプチャーツール「CrenaHtml2jpg」が便利

WEBサイトのキャプチャを作成したい事は多々ある。 これまでは He...

記事を読む

コメント/トラックバック

トラックバック用URL:

この投稿のコメント・トラックバックRSS




管理人にのみ公開されます

no image
【WordPress】WP Super Cacheで設定時に500エラーが出るときの対処法

WordPressのページキャッシュ用にWP Super Cacheと...

【Debian】mysqlのスロークエリログを取得する手順

VPSにWordPressをインストールしていると、キャッシュプラグイ...

no image
MIFES10でUWSCの予約語・キーワードを明示する

最近エディタにはMIFES10を利用しているが、UWSCの利用頻度が上...

no image
WordPressでメニューが文字化けする

WordPressでメニューを編集した際、保存を押すと文字化けが起きた...

no image
WEBサイトキャプチャーツール「CrenaHtml2jpg」が便利

WEBサイトのキャプチャを作成したい事は多々ある。 これまでは He...

→もっと見る

PAGE TOP ↑