7つの習慣のDVDが登場!期間限定キャンペーン中 ノウハウを学ぶ前にやるべきこと

robots.txtの書き方

robots.txtの書き方をまとめたメモ。今まで何となく適当に記述していたものの、正式な書式を調べてみた。

記述例

Sitemap: http://example.com/sitemap.xml

User-agent: *
Disallow: /cgi-bin/
Allow: /public*/
Disallow: /*?sessionid
Crawl-delay: 5

まず対象クローラ(検索エンジン)を指定する。

「User-agent: *」は「全てのクローラ」という意味。

主要な検索エンジンのエージェント名。

User-agent: Slurp
User-agent: Googlebot
User-agent: msnbot

Slurpはヤフーのクローラ。
Googlebotはグーグルのクローラ。
msnbotはMSNのクローラ。

次に、空白行なしで、対象クローラへの制御を続けて書く。

Allowはアクセス許可、Disallowは拒否を意味する。
AllowやDisallowのあとの記述は、大文字と小文字を区別するので注意。

AllowやDisallowの行の始めの「/」はルートディレクトリ(ドメイン直下)を意味する。

「/cgi-bin/」はドメイン直下の/cgi-bin/というディレクトリという意味。

*は任意の文字列を意味する。「/public*/」は「public」という文字列を含むディレクトリ全てという意味になる。

?は任意の文字。「/*?sessionid」はURLの途中に「sessionid」を含むという意味。

「Crawl-delay」はクローラが巡回する頻度を秒数で指定する。「Crawl-delay: 5」は、5秒以上の間隔を開けてアクセスせよ、という意味。

Sitemap: http://example.com/sitemap.xml
は、サイトマップの場所。robots.txtのどの場所に書いても良い。

The Web Robots Pages

«
»
 
人気ページランキングPV
WordPressのプラグイン10018
アダルトアフィリエイトマスタープログラム(AAMP)のレビュー7181
「ペイント」でモザイクをかける方法5016
アフィリエイト向けの仕訳4723
CCBillのTips4630
FTPソフト比較4189
アクセスの多い記事をリスト化するWPプラグイン2952
ネットビジネス大百科のレビューと評価2768
ダンケネディコピーライティングセールスマインドトレーニング2739
木坂氏基礎講座32719
木坂氏Alchemy第4回2675
WordPressのインストール2520
80code.comはWP2.9が使えない2502
XREAにAWStatsをインストール2483
Google日本語辞書ツールを直接起動する方法2438
まとめWikiを運営する2417
WPとヤフーブログ検索対策2397
Myletterが品川アドレスを有料化2272
MovableType⇒WordPressをほぼ完全移行2212
まろやかセールスレター術のレビューと評価1936

トラックバックURL

コメントを書き込む

SEO対策済みテンプレート
  • seo