设为首页收藏本站

晨若资源分享论坛——学习资源丰富,视频课程很全的中文分享社区网!

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 7852|回复: 28

[网络教程] 教你robots.txt怎么写

[复制链接]

5万

主题

5万

帖子

774万

积分

管理员

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
7749620
资源币
7477846
威望
206974
贡献
9914
发表于 2020-5-22 10:21:11 | 显示全部楼层 |阅读模式
想做优化的朋友都会遇到robots.txt,也同时会产生robot.txt怎么写的疑问,那么首先,我来介绍一下什么是robots.txt
robots.txt是搜索引擎中访问网站的时候要查 看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是 否存在robots.txt
如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有 被口令保护的页面。最后,robots.txt必须放置在一个站点的根目录下。接下来告诉大家robots.txt怎么写:

大家了解完robots.txt后,那么我们可以用robots.txt来做什么?同时也就明知了robots.txt怎么写:
robots.txt怎么写第一节:用robots.txt屏蔽相似度高的页面或没内容的页面。
我们知道,搜索引擎收录网页后,会对网页进行“审核”,而当两个网页的相似度很高时,那么搜索引擎就会删除掉其中一个,并且会降低一点你网站的得分。
假设以下这两个链接,内容其实差不多,那么第一个链接就应该屏蔽掉。
/XXX?123/123.html
像第一个的链接这样的链接非常多,那么我们要怎么屏蔽呢?其实只要屏蔽/XXX?就可以屏蔽所有的链接了。

Disallow: /XXX?
同理,一些没有内容的页面我们也可以利用相同的办法将其屏蔽掉。
robots.txt怎么写第二节:用robots.txt屏蔽多余的链接,一般保留静态的链接(既HTML、htm、shtml等)。
由于网站中经常会出现多个链接指向同一个页面的情况,而这样会让搜索引擎对网站的友好度降低。为了避免这一个情况,我们就可以通过robots.txt把 非主要的链接去掉。

/OOO?123/123.html
那么我们就应该去掉第一个垃圾,代码如下:
Disallow: /OOO?123
robots.txt怎么写第三节:用robots.txt屏蔽死链
死链就是曾经存在的网页,因为改版或其他原因而失去效用后就变成死链,也就是说看似一个正常的网页链接,但点击后不能打开相对应的网页页面。
比如,原来在目录为/seo下的所有链接,因为目录地址的改变,现在都变成死链接了,那么我们可以用robots.txt把他屏蔽掉,代码如下:
Disallow: /seo/
robots.txt怎么写第四节:告诉搜索引擎你的sitemap.xml地址
利用robots.txt可以告诉搜索引擎你sitemap.xml文件的地址,而不需要在网站上添加sitemap.xml的链接。具体代码如下:
Sitemap: 你的sitemap地址
以上就是robots.txt的基本用法,一个好的网站必定会有一个好的robots.txt,因为robots.txt是搜索引擎了解你网站的一个途径。
另外在这里我推荐一下 robots.txt的写法 沈阳seo优化参考:
User-agent:*Sitemap:http://www.wordmars.com/wm-seo/sitemap.xml //这个指引搜索引擎蜘蛛找到你的SitemapDisallow:/ADMIN/ //管理员登陆入口,搜索引擎就不要进来吧?呵Disallow:/SCRIPT/ //我们调用的SCRIPT文件,搜索引擎抓到了,也不读。Disallow:/PLUGIN/ //插件目录,不需要抓取Disallow:/FUNCTION/ //不需抓取Disallow:/UPDATE/ //Zblog官方的升级信息目录,不需抓取。Disallow:/ARTICLE-IMAGE/ //网站模板中用到的一些小图标,这些在网上到处都是,就是让搜索引擎抓去了也没有排名,还浪费你的资源。Disallow:/DATA/ //数据库目录Disallow:/CACHE/ //Zblog生成静态页的缓存目录,这个和你的正常文章基本一致,高重复。建立拿掉Disallow:/STYLE/ //CSS生成目录,不需抓取Disallow:/TEMPLATE/ //模板目录,不需抓取Disallow:/CSS/ //CSS的一些调用文件目录,不需抓取Disallow:/LANGUAGE/ //语言目录,不必抓取Disallow:/login.asp //我们的登录后台文件,不需抓取。Disallow:/cmd.asp? //这个是供别人引用通知时产生的页面,不需抓取。Disallow:/search.asp //搜索页,这页在没有人使用时,就是一个空页Disallow:/atom.xml //支持ATOM的FEED页,高重复。Disallow:/rss.xml //支持RSS的FEED页,高重复。Disallow:/view.asp? //一般后台预览时生成的页面,高重复。
注意:你如果要用这段代码,把//和//前面的空格删掉再用,同时记得把sitemap地址改过来,要用绝对地址。

回复

使用道具 举报

0

主题

816

帖子

1187

积分

晨若助理

Rank: 2

积分
1187
资源币
371
威望
0
贡献
0
发表于 2020-5-22 10:21:52 | 显示全部楼层
是爷们的娘们的都帮顶!大力支持
回复 支持 反对

使用道具 举报

0

主题

699

帖子

920

积分

VIP会员(永久)-领币

Rank: 13Rank: 13Rank: 13Rank: 13

积分
920
资源币
221
威望
0
贡献
0
发表于 2020-5-22 14:40:55 | 显示全部楼层
支持楼主,用户楼主,楼主英明呀!!!
回复 支持 反对

使用道具 举报

0

主题

763

帖子

946

积分

晨若助理

Rank: 2

积分
946
资源币
183
威望
0
贡献
0
发表于 2020-5-22 18:49:50 | 显示全部楼层
额,看不懂在说神马~@_@
回复 支持 反对

使用道具 举报

0

主题

854

帖子

1120

积分

VIP会员(年)-领币

Rank: 12Rank: 12Rank: 12

积分
1120
资源币
266
威望
0
贡献
0
发表于 2020-5-22 22:30:00 | 显示全部楼层
我也来顶一下..
回复 支持 反对

使用道具 举报

0

主题

584

帖子

728

积分

VIP会员(1年)-免币

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

积分
728
资源币
144
威望
0
贡献
0
发表于 2020-5-23 12:38:16 | 显示全部楼层
传说中的沙发???哇卡卡
回复 支持 反对

使用道具 举报

0

主题

819

帖子

1093

积分

晨若助理

Rank: 2

积分
1093
资源币
274
威望
0
贡献
0
发表于 2020-5-23 17:02:43 | 显示全部楼层
小手一抖,钱钱到手!
回复 支持 反对

使用道具 举报

0

主题

619

帖子

733

积分

VIP会员(1年)-免币

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

积分
733
资源币
114
威望
0
贡献
0
发表于 2020-5-23 20:54:54 | 显示全部楼层
LZ帖子不给力,勉强给回复下吧
回复 支持 反对

使用道具 举报

0

主题

631

帖子

797

积分

VIP会员(1年)-免币

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

积分
797
资源币
166
威望
0
贡献
0
发表于 2020-5-24 13:03:14 | 显示全部楼层
小手一抖,钱钱到手!
回复 支持 反对

使用道具 举报

0

主题

815

帖子

1125

积分

晨若助理

Rank: 2

积分
1125
资源币
310
威望
0
贡献
0
发表于 2020-5-24 17:05:17 | 显示全部楼层
我是来刷分的,嘿嘿
回复 支持 反对

使用道具 举报

懒得打字嘛,点击右侧快捷回复,回复垃圾信息扣100资源币 【右侧内容,后台自定义】回复垃圾信息扣100资源币
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
购买VIP
购买VIP
广告招租
工作时间:
8:00-18:00
官方微信扫一扫

QQ|Archiver|手机版|小黑屋|晨若资源分享论坛 ( 粤ICP备14055667号-1 )|网站地图  

GMT+8, 2024-11-23 00:11 , Processed in 0.454706 second(s), 44 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表