2015年10月27日火曜日

robots.txtの書き方



こんにちは山田です。
肌寒くなってまいりましたね。10月も、もう終わりです。
秋の味覚の栗を探したい気持ちを抑えつつ、SEO対策の話です。

今回は、クロール最適化の方法の一つとして、robots.txtについてお話しします。
まず、検索エンジンのロボットが、サイトの中で最初にアクセスするファイルがrobots.txtになります。

もし、テストページなどをアップロードしてクローラーにインデックスされたくない場合は
robots.txtで拒否して、インデックスしてお欲しいページに誘導してあげましょう。

さて、以下に書き方についてまとめてみました。ご参考になればと思います。


robots.txtの書き方

■ファイル名
robots.txt

■ファイルの置き場所
ドメインのルートドメイン

■サイト内すべてのロボットを拒否したい場合
User-agent:* 
Disallow:/

■特定のロボット+特定のディレクトリやページ
User-agent: Googlebot ←グーグル
Disallow: /test/    ←拒否したい場合
Allow: /test/act    ←testディレクトリは拒否するが、actページは受け入れる場合
Allow: /test/act.html ←testディレクトリは拒否するが、actページは受け入れる場合

ser-agent: bingbot  ←Being(複数ロボットの場合は改行を入れて。拒否ページを記述する)
Disallow: /test/    

■ついでにsitemap.xml
ここに記述しておくとSitemapを読むようになってくれるので記載しておいたほうが良いです。
書き方は↓

Sitemap: http://www.test.com/sitmap.xml
  

Related Posts:

  • canonicalとは?こんにちわ山田です。 一段と肌寒くなってきましたね。 衣替えをして、冬に備えたいと思います。 さて、本日ですが、 canonicalタグについて調べてみました。 ■canonicalとは? 一言でまとめると。異なるURLを一つのものとして認識させるタグ。URLの正規化の設定です。 もし、この… Read More
  • 404エラーページのSEO効果404エラーページのSEO効果 こんにちは山田です。 404ってネットサーフィンしたことがある人ならだれでもしっている メジャーなエラーですよね。 このエラーの発生要因とすれば 人為的なURLの入力ミス ページの削除・移動 が考えられますね。 ということで、SEOの観点からすると404エ… Read More
  • GoogleのAMP(Accelerated Mobile Pages)ってすごいの?AMP(Accelerated Mobile Pages)とは・・・ Z-MENです。 どうも。 昨年夏頃?からモバイルやSEO界隈でAMPの話題がすごく盛り上がっていて、 モバイル担当としてもやはり気になるところなので一度情報を整理してみたいと思います。 自分の勉強がてらではありますが、ど… Read More
  • 301リダイレクトとは301リダイレクトとは こんにちは山田です。 写真は明るければきれいに見えるなと思う今日この頃です。 うまく話をつなげられないので悔しい限りですが本題に入ります。 ■そもそもリダイレクトとは 指定したWebページから、自動的にほかのWebページに転送される機能です。 おもにURLが変わった… Read More
  • ページネーションに、並び替えや絞り込みがあった場合を調べてみた②こんにちは山田です。 年末ですね。今年も一年の締めになりました。 年神様を迎えられるように、身辺を整理しましょう。 (山田家では、そもそも鏡餅は幾年も飾っていませんが気持ちだけ) さて毎度のことながら、グーグルのリファレンスを読んでおり 解読が増えた項目がありました。  ↓↓↓ コンテ… Read More

0 コメント:

コメントを投稿