facebook twitter hatena line email

「SEO/robots.txt」の版間の差分

提供: 初心者エンジニアの簡易メモ
移動: 案内検索
(不要bot排除)
(画像を登録しない)
行49: 行49:
 
<pre>
 
<pre>
 
location ~* \.pdf$ {
 
location ~* \.pdf$ {
 +
  add_header X-Robots-Tag "noindex, nofollow";
 +
}
 +
#絶対パス指定
 +
location ~ /assets/img/*min\.png$ {
 
   add_header X-Robots-Tag "noindex, nofollow";
 
   add_header X-Robots-Tag "noindex, nofollow";
 
}
 
}

2024年3月7日 (木) 15:29時点における版

robots.txtの書き方

画像検索ボットの排除

User-agent: Googlebot-Image
Disallow: /

User-agent: Yahoo-MMCrawler
Disallow: /

User-agent: *
Allow: /

サイトマップ登録

User-agent: *
Sitemap: http://example.com/sitemap.xml
Allow: /
Disallow: /js/
Disallow: /api/

ウェブ魚拓を拒否

User-agent: Megalodon
Disallow: /

不要bot排除

User-agent: MJ12bot
Disallow: /

User-agent: AhrefsBot
Disallow: /

User-agent: BLEXBot
Disallow: /

User-agent: Yandex
Disallow: /

User-agent: baiduspider
Disallow: /

User-agent: SemrushBot
Disallow: /

参考:https://oxynotes.com/?p=9056

画像を登録しない

nginx

location ~* \.pdf$ {
  add_header X-Robots-Tag "noindex, nofollow";
}
#絶対パス指定
location ~ /assets/img/*min\.png$ {
  add_header X-Robots-Tag "noindex, nofollow";
}

apache

<Files ~ "\.pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</Files>

参考:https://developers.google.com/search/docs/crawling-indexing/robots-meta-tag?hl=ja#apache