クローラーとはWebサイトを巡回するロボット!SEO対策との関係性
クローラーとは、検索結果の表示順を決定するための情報を集めるため、Webサイト上を巡回しているロボットプログラムを指します。SEO対策とも深い関連があり、正しい対策を取る必要があるでしょう。この記事ではクローラーの種類と、クローラー対策の方法を解説します。

クローラーとは
クローラーとは、検索順位を決める要素を収集する目的でさまざまなWebサイトを巡回しているロボットです。検索結果の表示順はSEO対策において重要なポイントであるため、しっかりとクローラーの知識を身に着けておくことが大切です。
ここからクローラーの意味や種類、クローラーの対象となるファイルを分かりやすく解説します。
Webサイトを巡回するロボットのこと
サイト表示順を決めるための情報を集めるために、Webサイト上を巡回しているロボットプログラムをクローラーと呼びます。クローラーの名前の由来は、這い回るという意味の英単語「crawling」です。
検索サイトを運営しているGoogleやBingといった企業では、独自のクローラーを開発・管理しているのが一般的です。クローラーによって検索結果へ表示される仕組みは後ほど詳しくご紹介します。
クローラーの種類
代表的なクローラーの種類は、主に次の5つです。
- Googlebot:Googleのクローラー
- Bingbot:Bing(マイクロソフト)のクローラー
- Yahoo Slurp:かつてYahooで使われていたクローラー
- Baiduspider:中国の検索エンジンBaiduのクローラー
- Yetibot:韓国の検索エンジンNAVERのクローラー
日本でSEO対策を行う場合には、GoogleのクローラーであるGooglebot向けの施策を行う必要があります。
クローラーの対象となるファイル
クローラーは、次のようなファイルの内容をチェックし、検索結果表示順を決める情報を収集しています。
- HTMLファイル
- テキストファイル
- CSSファイル
- 画像ファイル
- JavaScriptファイル
- PDFファイル
- FLASHファイル
これらのさまざまなファイルの情報を組み合わせて、サイトを評価し表示順を決めているのです。
>「Semrush」競合調査・キーワード調査・効果検証までSEO改善がこれ一つで!
Googleクローラーの仕組みとSEO対策との関連性
クローラーがサイトの内容を評価し、検索エンジンに表示されるまでにはいくつかの手順が踏まれています。クローラーはまずクローリングをするWebサイトに移動しページを巡回、内容を分析した後に、データベースへ情報を登録し表示順を決めます。
検索結果表示での上位を獲得するには、クローラーの存在がとても重要です。Googleクローラーの仕組みとSEO対策との関連性をご紹介します。
クローラーで認識されたサイトが上位表示される仕組み
クローラーは、多くのサイトを回って得た情報を元に表示順位を決め、検索結果に情報を表示させます。実際の手順は次のとおりです。
- 検索エンジンのデータベースに登録済みのWebサイトのリンクをたどる
- リンクからインターネット上を巡回する
- クローリングしようとするWebサイトに移動する
- Webサイトを解析・評価し、情報をデータベースに登録する
- データベースに登録された情報を元に各ページの表示順位を決定する
- 決められた各ページの順位に沿って検索エンジンが結果を表示する
クローラーの働きや、クローリングされたサイトが表示される仕組みを知っておくことは、SEO対策を効果的に進めるポイントでもあります。
SEO対策にはクローラー対策が欠かせない
先にご紹介したように、クローラーが検索結果の表示順を決定するという重要な役割を果たしているため、SEO対策を強化するにはクローラー対策が欠かせません。クローラーに良質なコンテンツだと認識されることで、検索結果での表示順を上げられるのです。
Webサイトは、頻繁に情報が更新されるのが一般的です。そのため、クローラーも1度の巡回ではサイトに関する全ての情報を把握できるわけではありません。
検索結果で自社サイトを上位表示させるためには、クローラーに何度も巡回をしてもらい、できるだけ多くの情報を収集してもらうことが重要です。
クローラーの自サイトへの巡回を確認する方法2つ
クローラーの巡回が完了したページは、indexがされている状態にあります。クローラーの巡回有無を確かめるために、indexを確認する2つの方法をご紹介します。
- Googleサーチコンソールを使う
- site:で確認する
それぞれの方法を詳しくご紹介します。
1.Googleサーチコンソールを使う
Googleサーチコンソールの「クロールの統計情報」から、クロールの巡回を確認できます。確認手順は以下のとおりです。
- Googleサーチコンソールにログインする
- 上部にある検索窓に確認したいURLを入力する
- 正常にインデックス登録されている場合「URLはGoogleに登録されています」のメッセージが表示される
ただし、Googleサーチコンソールを使った方法では、サイトのどのページをクローラーが巡回したかまでは把握できません。サイト全体でどれくらいクローラーが来ているかを確認する手段だと認識しておきましょう。
2. site:で確認する
2つ目のクローラー巡回の確認手段は「site:」を使った方法です。正常にインデックスされている場合は、Google検索で「site:(記事のURL)」のキーワードで検索すれば、検索結果に該当サイトが表示されます。
もし表示されない場合は、クローラーの巡回とインデックスが完了していないと分かります。投稿したばかりのコンテンツなどは、クローラーに認識されるまで時間がかかる場合もありますが、時間が経っても検索エンジンに認識されていない場合はクローラーの巡回を促す対策が必要でしょう。
>「Semrush」サイト診断・順位計測・キーワード調査などSEO対策にフル活用!
クローラーの巡回を促す6つの対策方法
SEOに強いサイトを作り上げるためには、クローラビリティを上げることが大切です。クローラーが回りやすいサイトであれば、それだけ多くの情報を収集でき、検索結果に上位表示してもらえる可能性が高まります。
クローラビリティを上げる6つの方法は次のとおりです。
- クロールをリクエストする
- XMLサイトマップを作って送信する
- URLを正規化する
- パンくずリストを設定する
- 内部リンクを最適化する
- 内部リンクが切れてしまっている記事がないようにする
1.クロールをリクエストする
Googleのクローラーは、巡回をリクエストすることが可能です。ページの更新や作成をした際には、リクエスト申請をしてクローラーの巡回を促しましょう。
クロールのリクエストには、Googleサーチコンソールを利用します。Googleサーチコンソールから「インデックス登録リクエスト」を使ってリクエストをすれば、対策2でご紹介するXMLマップと同じようにクローラーがページの位置を理解しやすくなるため、優先的に巡回をしてもらえます。
【クロールのリクエスト手順】
- Googleサーチコンソールのメニューにある「URL検査」をクリックする
- 表示される入力欄に、確認したいサイトのURLを入力する
- URLがインデックス登録されていない場合は「URLがGoogleに登録されていません」のメッセージが表示される
- 右下の「インデックス登録をリクエスト」をクリックして申請する
2.XMLサイトマップを作る
サイト全体を一覧で確認できる設計図であるXMLサイトマップは、クローラーにサイト内のコンテンツやページ構成を認識してもらいやすくするために欠かせません。クローラーは一般的に、サイトの内部リンクをたどってページを巡回します。
しかし、クローラーが膨大なページを全て理解するには長い時間がかかってしまいます。そこで、サイトの理解を助けるXMLサイトマップを作ってサーバーに設置し、Googleサーチコンソールを使ってXMLサイトマップを送信することが重要です。
特に次のような特徴をもつサイトの場合は、XMLサイトマップの作成とGoogleサーチコンソールからの送信をするメリットが大きいです。
- サイトの内部リンクが未設定
- サイトのページ数が多い(500ページ以上)
- 画像や動画などのコンテンツが多い
- 被リンクが少ない
XMLサイトマップがあれば、クローラーは優先的に巡回するページを知ることができます。XMLサイトマップの作成は手動でコードを記述することも可能ですが、知識不足が不安である場合は自動作成ツールを利用してみましょう。
3.URLを正規化する
Webサイトのページに「www」が含まれるURLと、含まれないURLの両方が混在している場合には注意が必要です。同じ内容のページでもその2種類のページが存在していると、Googleクローラーからすると違うページだとみなされます。
つまり、全く同じ内容のページが重複してしまっている状態になり、Googleからの評価が下がってしまう恐れがあるのです。クロールする必要のないページが存在している場合は、クローラビリティを上げるためにもURLを正規化することが重要です。
URLを正規化する方法は次のとおりです。
- Googleサーチコンソールにログインしてダッシュボードを開く
- 右上にある設定マークから「サイトの設定」を選択する
- 「使用するドメイン」の欄に表示される「www」が含まれるURLと含まれないURLのどちらかを選択し「保存」をクリックする
- 手順3で選択しなかった方のURLから、設定したURLへアクセスできるように301リダイレクトを設定する
4.パンくずリストを設定する
パンくずリストとは、Webサイトを訪問したユーザーが今どの位置にいるのかを階層構造で示したリストです。リストに表示される各階層のページへは、リンクが設定されているため、階層の違うページに瞬時に移動することも可能です。
クローラーはリンクをたどってWebサイトを巡回しているため、パンくずリストを設置することでスムーズな巡回を促せます。また、クローラーがどの階層にいるのかを理解しやすくなる効果もあり、Googleがよりサイトを理解しやすくなります。
Googleのクローラーとユーザーの両方が利用しやすく、理解しやすいサイトにするためには、パンくずリストを忘れずに設置するようにしましょう。
5.内部リンクを最適化する
クローラーの巡回を促すには、Webサイトの内部リンクを適切に設定することも重要です。内部リンクが適切に張り巡らされているとは、同じサイト内で関連のある記事やコンテンツがリンクでつなげられていることです。
内部リンクが最適化され関連ページへの移動がスムーズにできれば、クローラーの巡回を促すことができます。さらには、サイトの網羅性が高まりSEO対策にも良い効果を期待できるでしょう。
内部リンクを設定する際には、次の2つのポイントを意識する必要があります。
- 適切な文脈でリンクを貼る:関連性のあるコンテンツをつなげる
- ユーザーがクリックする場所に内部リンクを貼る:クローラーもユーザーが頻繁にクリックする場所を巡回する傾向がある
6.内部リンクの切れている記事がないようにする
内部リンクが切れてしまっていたり、設定されていない記事が存在すると、クローラーが他のページからたどり着けなくなってしまいます。内部リンクが上手く機能していないと、クローラーの巡回頻度も大幅に下がってしまう可能性があります。
サイト内に関連する見出しや記事を見つけて内部リンクを貼り、サイト上をクローラーが巡回しやすい状態にしておきましょう。どうしてもリンクを貼れる場所がないという場合は、リンクを貼るために関連性のある記事を作成するのも手です。
>「Semrush」競合調査・キーワード調査・効果検証までSEO改善がこれ一つで!
まとめ
クローラーとは、Webサイトを巡回して、検索エンジンでの表示順を決めるための情報を収集しているロボットです。SEO対策とも深い関係をもっており、Googleクローラーが巡回しやすいサイトを作り上げることも重要です。
クローラビリティを高めるための施策には、クロールのリクエストやXMLサイトマップの作成と送信、URLの正規化などがあります。クローラーが巡回しやすいサイトとは、つまりユーザーが使いやすいサイトであるともいえるでしょう。
適切な対策を施して、Googleから高評価をもらえるサイトを作り上げるにはさまざまな知識や分析ツールが必要となります。
SEOツールは無料で利用できるものから、かなり高額なものまで幅広く存在します。
どのツールから始めたらいいか迷われたら時には、まず低価格で手厚いサポートが受けられる「Semrush」からお試しください。
「Semrush」は、競合サイト分析、ターゲットキーワードの発見、検索表示順位計測、テクニカルSEOエラーの検出、被リンク調査などSEO対策を行うために必要な機能が一つになったSEOオールインワンツールで、カスタマーサクセスも無償です。
無料トライアルも可能なので、ぜひ、一度お試しくださいませ。
Web内部診断したい方におすすめ
記事内紹介のSEOツール「Semrush」をいますぐお試し!