サーチコンソールの参照元ページが怪しい...URL末尾/1000はリファラースパムが原因でした。

2024-01-18

サーチコンソール-リファラースパム_eyecatch

Googleサーチコンソールを確認していたところ、当サイトには存在しないURLに検索エンジンのクローラーが訪問していることに気が付きました。

早速確認すると、URLの後ろに「//1000」や「/1000」という謎のクエリが...

どうやら当サイトも「リファラースパム」を受けたようで、怪しいページを経由して検索エンジンのクローラーが訪問していたようです。

原因はスパムで、Google曰く404ページに関しては無視してOKだそうです。

サーチコンソールで存在しないURLがクロールされる

当サイトはこれまでサーチコンソールの“ページにリダイレクトがあります”を減らす目的で様々なことを行ってきました。WordPressを使っていると多発するのです。

そんなこんなで過去にWordPressの自動補完リダイレクトを停止したことで、順調にリダイレクトがあるページの件数は減っていたのですが、最近また急増していることに気が付きました。

サーチコンソール-リファラースパム_001

またサーチコンソールの「ページにリダイレクトがあります」が急増!

お次は何だ~!という事でさっそく確認します。

謎のクエリが付いたページにクローラーが訪問

Googleサーチコンソールで「ページにリダイレクトがあります」としてインデックスに登録されていないページ群を確認します。

サーチコンソール-リファラースパム_002

URLの後ろに「//1000」や「/1000」という謎のクエリが!?

すると直近でクロールされたページ全てに「//1000」や「/1000」というクエリが!

  • https://example.com//1000
  • https://example.com/hogehoge/1000

当然上のようなURLは当サイトにはなく、アクセスしても404 Not Foundになります。

なぜこんな存在しないページにクローラーが訪問しているのか?
そもそもサイトマップも送っていないURLになぜクローラーが??

参考

今回は「ページにリダイレクトがあります」に出現しましたが、場合によっては「見つかりませんでした(404)」にURL末尾/1000が出ることもあります。

スポンサーリンク

原因はリファラースパム(参照元スパム)

更に詳しく調べます。

サーチコンソール-リファラースパム_003

「URLを検査」を押してクロール情報を確認。

サーチコンソール-リファラースパム_004

参照元ページがかなり怪しい...(アクセスしない方が吉)

するとリファラー元(参照元)であるページのURLが出てきました。
見たところ参考元のページURLにも数字ばかりの怪しいクエリがあります。

どうやら検索エンジンのクローラーはこの参照元から飛んできたみたい。。。

で、これが何かというとリファラースパムを狙ったスパムサイトです。
気になってこのURLにアクセスするとスパムサイトに飛ぶので気を付けて下さい。
実際にアクセスしてみると以下のようなスパムサイトに飛びました。

上の画像はパソコンから、先ほどサーチコンソールで確認したクローラーの訪問元である「参照元ページ」にアクセスした様子です。スマホでもアクセスしてみました。

ウイルス警告やらソフトのインストール推奨やら...やはりスパムサイトです。
どちらもボタンを適当に押してしまうとスパムにやられます(↓)。

で、リファラースパムはこの今回の僕のようなアクセスが狙いです。

リファラースパムとは?

リファラー(参照元)は移動元のページを示します。つまりどこから来たか?です。

例えば、サイトAとサイトBがあり、

サイトA → サイトB

というアクセスがあったとすると、サイトBから見てサイトAがリファラー(参照元)となる感じです。サイト運営者なら当然、

  • 自サイトはどんなサイトからリンクされているのか?
  • どのような感じで自サイトにアクセスを受けているのか?

が気になるところですが、これを悪用したスパムをリファラースパムと呼びます。
つまりアクセス解析を行うサイト運営者を狙ったスパムがリファラースパムです。

自分のサイトのアクセスが急増したり、変なページ(URL)にアクセスがあったり、クローラーが訪問していると、サイト運営者は気になって参照元ページにアクセスしたくなりますが、それが悪人の狙い。汚ねぇ...

参考

スパムはウイルスとは区別され、直接の危険性はない迷惑なものとされます。
例えば、迷惑メールなどが代表例でスルーすれば大丈夫なものです

リファラースパム自体の対処は不可能

つらつらと書きましたが、リファラー自体は基本的にサイト側で事前に拒否できる物ではありません。悪意のある参照元からアクセスを投げられればそれまでです。

Googleアナリティクスなどのアクセス解析ツールなら、スパムサイト(参照元)のURLを除外するフィルタリングを設定することでアクセス解析からは除外できますが、サーチコンソールにはそのような機能は無いようです。

今回の僕のように、サーチコンソールの「ページにリダイレクトがあります」が変なサイトを参照元ページとしているなら対処は不可能という事です...。

これじゃ本当にリダイレクトがあって除外されているページが分かりにくいのですが...まぁ今回は仕方ありません。サーチコンソールに「このURLは無視する」というボタンでもあれば良いのですがね~。

URL/1000はGoogleも認識済みで対処不要!

調べると、サーチコンソールの各項目に「//1000」や「/1000」という謎のクエリが付いたページが出る問題に関しては、すでにGoogle側も認識しているみたいです。

詳しい内容は「Search Engine Roundtable」内の以下のページに載っています。

上記のサイトからポイントを抜粋すると以下の通りです。

I am seeing an unusual number of complaints around the reported 404 errors within Google Search Console reporting. This is specific to your URLs having /1000 appended to the end of the URL. Google is aware of the issue and is telling us to ignore them since the links go to 404 pages.

~中略~

Google's John Mueller replied to this issue saying "No need to disavow; it's probably just random spam." He also replied on LinkedIn saying, "You can ignore them. 404s are fine." Google has said 404s are fine in the past and that links pointing to 404 pages do not count anyway.

【日本語訳】
Google Search Consoleのレポート内で報告された404エラーに関して、異常な数の苦情が寄せられています。これは、URLの末尾に/1000が追加されているURLに特有です。Googleはこの問題を認識しており、リンクが404ページに移動しているため無視するように言っています。

~中略~

Googleのジョン・ミューラー氏はこの問題に対し、「否認する必要はない。おそらく単なるランダムなスパムだろう」と回答した。同氏はLinkedInでも「無視してもいい。404は大丈夫だ」と返信した。Googleはこれまで、404は問題なく、404 ページを指すリンクはカウントされないと述べてきました。

ジョン・ミューラー氏(Googleの中の人)曰く、リファラースパムによる404ページへのクローラーのアクセス、およびサーチコンソールのクロール結果については無視して良いとのこと。やはり無視以外に具体的な対処法はないみたい...。

ただ謎のクエリ「/1000」問題については、X(旧Twitter)や各フォーラムでも話題になっており、Googleも認知しているとのことなのでSEOに影響はなさそうです。



まとめ

以上、Googleサーチコンソールで「ページにリダイレクトがあります」が急増したので確認したら存在しないURL(クエリが//1000)だった!さらに参照元を確認したらリファラースパムだった...という話でした。
どうやらここ数週間で当サイトだけでなく、海外のサイトもやられてるみたいです。

残念ながらサーチコンソールに関してはこちら(サイト運営者)側からできる対処法はありません。もしアナリティクスで確認できてもフィルタリングをかける程度しか抗えないようです。

う~ん何だかイヤな感じですが、まぁうちのサイトもようやくスパムする価値があると考えられた!とでも思っておきます・w・

この記事が同じような状況に置かれた方の参考になれば幸いです。

-サイト構築
-,

site-logo
ありがとうございました!
良かったらシェアしてネ・w・
当サイトはピンバックを受け付けます。
  • この記事を書いた人
ザキ

ザキ

X:@sologaku

プログラミングに興味があり情報系の大学を卒業。

新卒で社会人になるも数年で退職し今はフリーランスとして生きています。

少しでも誰かの役に立てれば...と思い、当サイトでIT関係のハウツーを発信しています。


ソロ学運営者:ザキの自己紹介

© 2020 sologaku