Google Search Console のインデックスカバレッジで「除外」とされたらなんでやねん!と思いますよね。
除外にもいろんなパターンがあるようなので、個別に調べました。
代替ページ(適切な canonical タグあり)
パソコン用のページと、そのAMP用ページなど、別々のURLだけど内容は同じという場合、canonicalタグによって重複したコンテンツを1つのURLにまとめる(正規化する)ことができます。
これにより、Googleに重複したページがあると認識されないようにし、不正にページ数を増やしていると判断されないようにしています。
ですのでこれは適切な canonical タグを設置していると言う状態なので、何もする必要はありません。このままがベストです。
クロール済み – インデックス未登録
Googleの検索エンジンがクロールしたけど、とある判断でインデックスには登録しなかったという状態です。
AMPページやRSSフィードやAtomがその判断対象となります。
基本的には、不利益はないのでこのままでも問題ありません。
ページにリダイレクトがあります
サイトをhttpからhttpsに変更した時とか、あるページのURLを変更した(カテゴリーを変えたとか)の場合に表示されます。
httpsに変更した時はむしろリダイレクトして欲しいので、喜んで残しておきましょう。
URLを変更した場合もリダイレクトして欲しいのですが、リダイレクト先URLが既に存在しない場合は、もうリダイレクトする必要がないので、インデックスの削除から、削除するURLを登録しちゃいましょう。
noindex タグによって除外されました
問い合わせ確認ページや完了ページなど、Googleにインデックスされたくないページはnoindexタグを記述します。そのページをGoogleがクロールすると当然除外されますが、それは意図的なので問題ありません。
他には、過去にインデックスされたけど、現在は sitemap.xml にも存在しない。でもアクセスしてみると404にはならないというページの場合も、除外されます。検索結果画面等がこれに当たります。
これも意図的ではないにせよ、除外されても特に影響ないので、このままでも問題ありません。
気になるようならインデックスの削除から、URLを削除しちゃいましょう。
見つかりませんでした(404)
sitemap.xmlには存在するけど、アクセスしてもページが存在しない場合、この理由で除外されます。
ある記事を非公開にしているけど、sitemap.xmlに記載されているページがこれに当たります。
他には、過去に存在したページでインデックス済やけど、現在はsitemap.xmlに存在しない。アクセスすると404が返る。というページもこの理由で除外されます。
これも気になるようならインデックスの削除から、URLを削除しちゃいましょう。
重複しています。ユーザーにより、正規ページとして選択されていません
当該ページは過去にインデックスされたページで、このページと重複するページが別にあるとGoogleは判断しているけど、そのページも正規ページではないという場合に、この理由で除外されます。
放置してても害はないようですが、アクセスすると404になるURLは削除しちゃいましょう。
検出 – インデックス未登録
URLをサイトマップで送信しただけで、サイト内のどこからもリンクされていない場合や、新規投稿したページに出やすいので、URL検査して問題なければすぐに「インデックス登録をリクエスト」しちゃいましょう。