robots.txt文件怎么写有什么作用
作者:bea
搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。
如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。
从SEO的角度,robots.txt文件是一定要设置的,原因:
网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。
网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。
一些没有关键词的页面, 一般情况下,站内的搜索结果页面屏蔽掉更好。
那么如何写robots.txt文件呢?
作为一名SEOer大家肯定是知道搜索蜘蛛的,但是关于robots.txt这个搜索蜘蛛遵循协议,却鲜少有人谈起,其实用好robots是很容易为你网站提权的,这里我不废话了,直接说。
第一,用robots屏蔽网站重复页
很多网站一个内容提供多种浏览版本,虽然很方便用户却对蜘蛛造成了困难,因为它分不清那个是主,那个是次,一旦让它认为你在恶意重复,兄弟你就惨了
User-agent: *
Disallow: /sitemap/ 《禁止蜘蛛抓取 文本网页》
第二,用robots保护网站安全
很多人纳闷了,robots怎么还和网站安全有关系了?其实关系还很大,不少低级黑客就是通过搜索默认后台登陆,以达到入侵网站的目标
User-agent: *
Disallow: /admin/ 《禁止蜘蛛抓取admin目录下所有文件》
第三,防止盗链
一般盗链也就几个人,可是一旦被搜索引擎“盗链”那家伙你100M宽带也吃不消,如果你做的不是图片网站,又不想被搜索引擎“盗链”你的网站图片
User-agent: *
Disallow: .jpg$
第四,提交网站地图
现在做优化的都知道做网站地图了,可是却没几个会提交的,绝大多数人是干脆在网页上加个链接,其实robots是支持这个功能的
Sitemap: http://www.xinge360.com/sitemaps/sitemaps_1.xml
第五,禁止某二级域名的抓取
一些网站会对VIP会员提供一些特殊服务,却又不想这个服务被搜索引擎检索到
User-agent: *
Disallow: /
以上五招robots足以让你对搜索引擎蜘蛛掌控能力提升不少,就像百度说的:我们和搜索引擎应该是朋友,增加一些沟通,才能消除一些隔膜。
猜你喜欢
您可能感兴趣的文章:
- 建设高质量网站外链的方法总结
- 博客园广告不显示另有他因
- 博客园Google Adsense疑似被封
- 六月谷歌PR更新几点注意事项
- 从这次百度大更看百度排名算法
- 用下面几种方法可恢复网站权重
- 新手如何快速提高网站关键词的排名
- 到新浪等博客发外链已不起作用
- 月光博客访问受限将带来的后果
- 网站被攻击对搜索引擎收录的影响
- 从今日关键词排名看百度搜索引擎
- 月光博客被黑站长们如何应对
- 浅谈SEO优化网页内部结构的一点看法
- 网站很有必要设置的常见http状态码
- 想做百度联盟就要选择好空间商
- 网站快照不更新收录不增加的权威解释
- 网站被百度K了或降权表现及解决方法
- 如何选择和确定网站目标关键词
- 404页面在SEO中的重要性及如何利用404页面