搜索引擎的蜘蛛的爬行状况能够反映一个网站的质量和权重变化情况,站长一定要时刻注意蜘蛛程序的爬行状况,以便能让网站能在搜索引擎被搜到。权重高,更新快的网 站,搜索引擎蜘蛛会经常爬行,抓取网站最新数据,经过搜索引擎数据整理后,在搜索引擎上就能搜索到网站的网页。为了更好的SEO优化网站,了解搜索引擎蜘 蛛爬行规则也是相当重要的。蜘蛛程序爬行网页的情况会被记录在网站的日志文件中,从查看日志中,就可以了解搜索引擎蜘蛛爬行经过,如:
2008-08-19 00:09:12 W3SVC962713505 www.eduren.net GET /index.html – 80 – 61.135.168.39 Baiduspider+
(+http://www.baidu.com/search/spider.htm) 200 0 64
1、203.171.226.111就是搜索引擎蜘蛛防问的网站ip,
2、61.135.168.39 Baiduspider代表,百度搜索引擎蜘蛛的ip是61.135.168.39,
3、代码中的/index.html 就代表搜索引擎蜘蛛防问的网页
4、2008-08-19 00:09:12代表搜索引擎蜘蛛爬行的日期与时间
5、代码中的200就代表搜索引擎蜘蛛爬行后返回代码代表,代码中可以了解蜘蛛爬行后的反映,代码如下:
6、W3SVC962713505代表网站日志所在的文件夹
2xx 成功
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受用于处理,但处理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx 重定向
301 已移动 — 请求的数据具有新的位置且更改是永久的。
302 已找到 — 请求的数据临时具有不同 URI。
303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机首先必须使用代理认证自身。
410 请求的网页不存在(永久);
415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。
5xx 服务器中出现的错误
500 内部错误 — 因为意外情况,服务器不能完成请求。
501 未执行 — 服务器不支持请求的工具。
502 错误网关 — 服务器接收到来自上游服务器的无效响应。
503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
您可能还对这些文章感兴趣
还在为国内互联网政策发愁吗?想获得本站一样的超快主机吗?现在去GoDaddy吧,购买主机就能获得20%优惠!更有无限空间等着你!中国电信 中国移动 互联网 博客 域名 广告 建站 微软 心情 战略 技巧 操作系统 数据恢复 新闻 游戏娱乐 电脑维修 病毒 百度 硬件相关 硬盘 站长评论 笔记本 编程开发 网上调查 网站事务 网站技术 网络赚钱 蜘蛛 计算机安全 软件 软件技巧 通信 通信产业 闲话杂谈 e godaddy Google 广告 IT Photo Shop seo vc windows7 Windows XP wordpress z-blog
WP Cumulus Flash tag cloud by Roy Tanck and Luke Morton requires Flash Player 9 or better.
Recent Comments