网站SEO必备：网站日志分析

2016-04-06 14:06　来源: 站长资源平台　浏览（10988）人

分享按钮

　　作为一名seoer，对网站日志分析是必需要掌握的一项基本的技能，通过日志分析可以分析爬虫抓取页面有效性，通过日志分析蜘蛛返回的状态码能及时发现网站里面是否存在错误或者蜘蛛无法爬取的页面，排查网站页面中存在的404错误页面，500服务器错误等这些噪音内容上噪音页面上（重复页面，低质量页面，空内容页面，404页面，不排名页面等）

　　网站日志分析

　　一、网站日志可以为我们做什么？

　　1、可以分析爬虫抓取页面有效性（减少搜索引擎在一些噪音页面上：重复页面，低质量页面，空内容页面，404页面，不排名页面的抓取频率）；

　　2、排查网站页面中存在的404错误页面，500服务器错误等

　　3、页面重要内容是否被爬虫完整爬到并且快速遍历；

　　4、正确分辨蜘蛛爬虫

　　二、常见HTTP状态码解读

　　1、200代码，表示蜘蛛爬取正常

　　2、404代码，访问的这个链接是错误链接

　　3、301代码，永久重定向

　　4、302代码，表示临时重定向

　　5、304代码，客户端已经执行了GET，但文件未变化。

　　6、500代码，表示网站内部程序或服务器有错

　　接着，我列举一个网站日志的案例：

　　日志里的含义，可以大家看下网站日志中各个数据都代表什么意思，总之这个文件是记录的一天发生在网站上的一些行为。当我们拿到这么一个网站日志，我们就可以审视我们的日志，并且通过对日志文件分析解决网站存在的问题；

　　三、日志代码解读

　　从日志文件当中可以解读出两个部分内容：

　　1、搜索引擎抓取情况

　　从日志文件中，可以大家看到搜索引擎抓取了一些404页面及低质量重负页面（噪音行为）

　　备注：可以通过nslookup ip 识别蜘蛛的真假

　　/date-2016-01.html（低质量重负页面）

　　/author-1.html（低质量重负页面）

　　/downloads/（低质量页面）

　　/contact.html（死链接接），但这里有个问题，这个页面返回的状态码为200而不是404，但页面却跳转到404页面，从中可以发现服务器设置一定有问题；

　　所以，当我们有一些页面不希望他们抓取的时候，我们需要在robots中进行规范。规范robots一个重要的手段，就是robots.txt。爬虫纠偏，让爬虫花更多的精力放在我的详情页面上。

　　2、用户访问网站情况

　　关于用户网站访问情况，主要分析用户访问网站行为轨迹及用户属性，在这就不进行讲述

本文来源于互联网，如有疑问请及时联系站长资源平台官方客服，谢谢！

【版权与免责声明】如发现内容存在版权问题，烦请提供相关信息发邮件至 kefu@2898.com ，我们将及时沟通与处理。本站内容除了2898站长资源平台（ www.2898.com ）原创外，其它均为网友转载内容，涉及言论、版权与本站无关。

网站	权重	销量
3kyy	6	7
6080	4	20
权6解梦站优质外链	0	0
生活分类-权高秒收	5	2120
15天气网	4	0
词典网	5	31
电影网每天2万ip	0	44
日ip两万导出少	6	0
百度日收五千必应权5	6	46
优质导出少	5	22

网站SEO必备：网站日志分析

上一篇：百度友好度建议和WordPress优化

下一篇：网站改版如何操作才是最适合的？

解锁社群密码：从0到1搭建你的专属部落

TruBit与MoneyGram合作在拉丁美洲推出全球跨境支付服

支付宝提示“当前操作可能存在风险，为保护资金安全，我们中断了此次操作”怎么办？

如果公司要求只能认证一个，是认证服务号好还是小程序？

AIGC 平衡 SEO 与用户体验的深度解决方案

外贸网站建设过程中会遇到的一些问题

seo优化排名提升方法

2898站长资源平台：网站优化中，如何吸引蜘蛛爬取？

2898共享资讯：网站访问遇流量狂跌该怎么办

中小企业网站建设的长篇文排版如何做好？

消息盒

网站SEO必备：网站日志分析