我是靠谱客的博主 娇气长颈鹿,最近开发中收集的这篇文章主要介绍怎么屏蔽搜索引擎蜘蛛抓取网页收录,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

正常情况下做网站的话,收录多,更新多点,对优化有些帮助。可是有些时候,屏蔽搜索引擎蜘蛛抓取网页收录,天外飞仙弄个测试网站,里面的数据都是假的,来搞个屏蔽搜索引擎

1、htaccess屏蔽搜索引擎蜘蛛的方式对来说更加隐蔽!

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (baiduspider|googlebot|soso|bing|sogou|yahoo|sohu-search|yodao|robozilla|msnbot) [NC]
RewriteRule ^(.*)$ http://www.jqueryba.com/ [R=301,L]

2、通过 robots.txt 文件屏蔽
可以说 robots.txt 文件是最重要的一种渠道(能和搜索引擎建立直接对话)

User-agent: Baiduspider
Disallow: /
User-agent: Googlebot
Disallow: /
User-agent: Googlebot-Mobile
Disallow: /
User-agent: Googlebot-Image
Disallow:/
User-agent: Mediapartners-Google
Disallow: /
User-agent: Adsbot-Google
Disallow: /
User-agent:Feedfetcher-Google
Disallow: /
User-agent: Yahoo! Slurp
Disallow: /
User-agent: Yahoo! Slurp China
Disallow: /
User-agent: Yahoo!-AdCrawler
Disallow: /
User-agent: YoudaoBot
Disallow: /
User-agent: Sosospider
Disallow: /
User-agent: Sogou spider
Disallow: /
User-agent: Sogou web spider
Disallow: /
User-agent: MSNBot
Disallow: /
User-agent: ia_archiver
Disallow: /
User-agent: Tomato Bot
Disallow: /
User-agent: *
Disallow: /

最后

以上就是娇气长颈鹿为你收集整理的怎么屏蔽搜索引擎蜘蛛抓取网页收录的全部内容,希望文章能够帮你解决怎么屏蔽搜索引擎蜘蛛抓取网页收录所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(35)

评论列表共有 0 条评论

立即
投稿
返回
顶部