概述
正常情况下做网站的话,收录多,更新多点,对优化有些帮助。可是有些时候,屏蔽搜索引擎蜘蛛抓取网页收录,天外飞仙弄个测试网站,里面的数据都是假的,来搞个屏蔽搜索引擎。
1、htaccess屏蔽搜索引擎蜘蛛的方式对来说更加隐蔽!
RewriteEngine On RewriteCond %{HTTP_USER_AGENT} (baiduspider|googlebot|soso|bing|sogou|yahoo|sohu-search|yodao|robozilla|msnbot) [NC] RewriteRule ^(.*)$ http://www.jqueryba.com/ [R=301,L]
2、通过 robots.txt 文件屏蔽
可以说 robots.txt 文件是最重要的一种渠道(能和搜索引擎建立直接对话)
User-agent: Baiduspider Disallow: / User-agent: Googlebot Disallow: / User-agent: Googlebot-Mobile Disallow: / User-agent: Googlebot-Image Disallow:/ User-agent: Mediapartners-Google Disallow: / User-agent: Adsbot-Google Disallow: / User-agent:Feedfetcher-Google Disallow: / User-agent: Yahoo! Slurp Disallow: / User-agent: Yahoo! Slurp China Disallow: / User-agent: Yahoo!-AdCrawler Disallow: / User-agent: YoudaoBot Disallow: / User-agent: Sosospider Disallow: / User-agent: Sogou spider Disallow: / User-agent: Sogou web spider Disallow: / User-agent: MSNBot Disallow: / User-agent: ia_archiver Disallow: / User-agent: Tomato Bot Disallow: / User-agent: * Disallow: /
最后
以上就是娇气长颈鹿为你收集整理的怎么屏蔽搜索引擎蜘蛛抓取网页收录的全部内容,希望文章能够帮你解决怎么屏蔽搜索引擎蜘蛛抓取网页收录所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复