検索ロボット(クローラー)にクロールされないようにすると検索エンジンの検索結果に該当のページが表示されなくなります。
クロールさせない方法として、HTMLのmetaタグに記載する方法とrobots.txtで設定する方法があります。
metaタグに記載する方法
以下の内容が、metaタグに指定できます。
指定は、大文字で指定します。
NOINDEX:検索エンジンにクロールささせずに、検索結果に表示させないようにします。 NOFOLLOW:ページ内に存在するリンク先をクロールさせないようにします。
では、実際にHTMLに記載する例です。
<!-- 巡回させない --> <meta name="ROBOTS" content="NOINDEX"> <!-- リンクをたどらない --> <meta name="ROBOTS" content="NOFOLLOW"> <!-- 両方 --> <meta name="ROBOTS" content="NOINDEX,NOFOLLOW">
robots.txtで設定する方法
robots.txt は、WEBサイトを公開しているディレクトリに設置します。
まずは、WEBサイト全体の巡回を許可する場合は、以下のように記述します。
User-agent: * Disallow:
WEBサイト全体の巡回を拒否する場合は、以下のように記述します。
Disallow には、パスを記載します。
User-agent: * Disallow: /
特定のディレクトリのみ拒否する場合は、以下のように記載します。
Disallow は、複数指定可能です。
User-agent: * Disallow: /data/ Disallow: /config/
検索ロボットを指定して、サイト全体を拒否設定する場合は以下のように記述します。
以下では、グーグルの検索ロボットを拒否しています。
User-agent: Googlebot Disallow: /
————————
最終更新日:2014年7月2日
作成日: 2014年7月2日
————————