Googleサーチコンソールに送信したサイトマップが「取得できませんでした」の状態になる時に確認したい内容をまとめました。
「取得できませんでした」とは、何らかの原因でGoogleがサイトマップファイル自体を読み込めないことを示すステータスです。
原因はサイトマップURLが間違っているという場合が大半ですが、サイトマップの再送信時にも同じエラーが出ることがあります。
確認すべきポイントは少なく、比較的簡単に解決することができるはずです。
この記事の目次
Googleサーチコンソールでサイトマップが「取得できませんでした」になる原因と対処法
Googleサーチコンソールに送信したサイトマップの場所(URL)が間違っていたり、アクセス制限などがあると、サイトマップのステータスが「取得できませんでした」となり、Googleにサイトマップを認識してもらえない状態になります。
また、すでにサーチコンソールに登録済みのサイトマップに対して「削除→送信」という操作を行った場合にも「取得できませんでした」が出ることがあります。
ポイント
サイトマップを送信した直後の場合は、すぐに反映されないことがあります。
経験上、最大20分程度待ってもステータスが「成功しました」にならない場合はサイトマップに何らかの問題があります。
このように原因は複数ありますが、今回はケースごとに原因と対処法を書きます。
「取得できませんでした」になる原因
サーチコンソールで、サイトマップのステータスが「取得できませんでした」になる主な原因は以下のようなものです。
- サイトマップのURL(場所)が間違っている
- サイトマップ自体がサーバー上に存在しない
- サイトマップにアクセス制限がかけられている
- サイトマップを更新(再送信)した直後である
- Googleから“手動による対策”が施されている
上記のように、原因のほとんどがGoogleのクローラーがサイトマップファイル自体(~.xml)にアクセスできないことによるものです。
また、なぜサイトマップを取得できなかったのか?については、サーチコンソールのサイトマップの画面からも確認できるので、先にそちらを確認してもよいでしょう。
サーチコンソールには「サイトマップの取得エラー」について、ヘルプセンター(↓)へのリンクもありますが、Googleの案内はテキストのみです...。
外部リンク
【Search Console ヘルプ】
サイトマップ レポートを使用してサイトマップを管理する
という事で、対処方法を具体的に解説していきます。
「取得できませんでした」の確認ポイント
サーチコンソールでサイトマップのステータスが「取得できませんでした」となっている場合、まずはサイトマップがきちんとサーバー上に存在しており、アクセス可能かどうか?を確認しましょう。
後述しますが、クローラーのアクセスを制御するファイル(robots.txt)が原因であることはごく稀です。(手動でサーバー上に設定ファイルをアップする必要がある。)
サーバー上にサイトマップはあるか?
当然ですがサイトマップはクローラーが定期的にアクセスしにくるファイルのため、ネット上に公開されている必要があります。つまり、サーバー上にないとダメです。
サイトマップは一般的に公開ディレクトリのルートに配置されます。
(必ずルートに配置しないとダメという訳ではない)
公開ディレクトリのルートとは、public_htmlやhtdocsのような場所です。
この場所にsitemap.xmlのようなサイトマップがあるか確認しましょう。
WordPressのサイトマッププラグインを使う場合
今現在、手動でサイトマップを作ってサチコに送信している人は少ないと思います。
特にWordPerssを使っている場合だと、サイトマップを自動的に作成・公開してくれるプラグインが数多くあり、これを使っている人が大半だと思います。
例えば「XML Sitemap Generator for Google」というサイトマップ専用のプラグインを使っている場合、サイトマップのURLはプラグインの設定画面に載っています。
ポイント
気を付けたいのが、プラグインを使っている場合は公開ディレクトリのルート(public_html)にサイトマップが作成されるとは限らないということです。
サイトマップのURL(場所)は正しいか?
サーバー上にサイトマップが存在するのに「取得できませんでした」のエラーが出る場合、サーチコンソールで指定したサイトマップのURLが正しいかを確認します。
先述した通り、サイトマップは一般的に公開ディレクトリ(public_html内)に配置されます。この場合サイトマップにアクセスするURLは以下の通りになります。
サイトURL/サイトマップ名
サイトマップ名は決まっていませんが、通常は「sitemap.xml」という名前です。
この場所にブラウザでアクセスしてみてサイトマップが表示されるか確認します。
見た目はどうであれサイトマップが表示されれば、設置とURLに問題はありません。
なのでこのURLをサーチコンソールのサイトマップURLとして送信すればOKです。
ここでもし「404 Not Found(見つかりませんでした)」が表示されてしまうなら、サイトマップの設置場所かサイトマップURLのどちらかに誤りがあります。
サイトマップにアクセス制限があるとダメ
サイトマップがサーバー上に存在しており、サイトマップのURLに間違いがなくても、クローラーが辿り着けないと「取得できませんでした」のエラーが出ます。
具体的には以下のような方法でサイトマップにアクセス制限をかけている場合です。
- robots.txtでアクセス制限をかけている場合
- IPアドレスなどでアクセス制限をかけている場合
- Basic認証やパスワード認証がかかっている場合
いずれにしても上記は自分で設定する必要があるものです。
つまり、作業の覚えがなければ該当しません。
例え自分がサイトマップにアクセスできたとしても、第三者のクローラーがアクセスできない状態になっていないかを確認しましょう。
参考
robots.txtは公開ディレクトリ(public_html)内に配置されますが、はじめから存在することは少ないはずです。
サイトマップの送信直後は待つこと!
これは僕が経験した内容ですが、正しくサイトマップを設置し、正しいURLをサチコに送信しているにも関わらず「取得できませんでした」のエラーが出てしまうことが何回かありました。
どうやらサーチコンソールにサイトマップを送信した直後はすぐにステータスが反映されず、一定時間「取得できませんでした」の状態になることがあるようです。
その時の様子が以下のような感じ。
サイトマップを送信した直後、すぐに「取得できませんでした」が出ました。
しかし、何もせずに10分ほど待っているとステータスが「取得できませんでした」から「成功しました」に変更されました。
「検出されたページの合計数」もサイトマップ送信直後には反映されていなかったのですが...
20分後には「検出されたページの合計数」に本来のページ数が反映されました。
サイトマップの送信直後に「取得できませんでした」が出ているなら、数十分様子見してステータスが変更されていないか確認しましょう。
手動による対策はサイトマップも無効にされる
調べたところ、Googleからスパムなどの悪質なサイトと認定されてしまった場合は、サイトマップの読み取りもされなくなり「取得できませんでした」が出るようです。
サーチコンソールで「手動による対策」を食らっていないかを確認しましょう...。
該当する人は少ないですね。
まとめ:取得できませんでしたの原因と対処法
思った以上に熱が入り長くなってしまったので、ここでまとめておきます。
サーチコンソールでサイトマップのステータスが「取得できませんでした」になってしまう原因と対処法は以下の通りです。
原因 | 対処法 |
サイトマップが存在しない | サイトマップを手動アップロード or プラグインの設定を確認 |
サイトマップURLにミスがある | ブラウザで該当するURLでサイトマップが開けるか確認 |
アクセス制限がかかっている | サイトマップにクローラーがアクセスできるように制限を外す |
サイトマップ送信直後の場合 | そのまま数十分様子見してステータスに変化がないか確認 |
上記で解決しない場合 | Googleから手動による対策を食らっていなか確認 |
僕が知りうる限り「取得できませんでした」はこれくらいかな?
他の原因だとまた別のエラー文言になると思います。
まとめ
Googleサーチコンソールでサイトマップのステータスが「取得できませんでした」になる原因と対処法についてでした。
初心者の方はおそらくサイトマップの設置場所か、URLのミス。
上級者の方はおそらくサイトマップの送信直後で反映されていないだけ...かな?
この記事が誰かの何かの役に立てば幸いです。ではではこのへんで!
内容に対してボリュームがあってないね・w・