QQ在线客服

当前位置:首页> 建站> 经验心得

什么是网站地图?站点地图详细介绍

2016-09-07 11:52 来源: 站长资源平台 编辑: 等等 浏览(992)人   

  什么是网站地图?站点地图详细介绍:网站地图,又叫站点地图,它就是一个列出了你网站上所有页面地址的清单文件,一般来说分为2种,一种是给搜索引擎看的,一种是给用户看的,前者帮助搜索引擎更好地收录你的网站,后者帮助用户更好的了解你的网站整体结构、更快的找到他们想要找的内容。本文讲的主要是前者。


什么是网站地图?站点地图详细介绍


  站点地图格式


  一般有3种格式,txt、xml、html,绝大部分情况下都是用xml格式,百度、谷歌都是支持xml格式。下面简单介绍3种格式。


  txt格式


  这种格式最简单,一般较少采用,示例如下:


  http://liuxianan.com/http://liuxianan.com/link.htmlhttp://liuxianan.com/msgboard.html


  注意事项:


  文本文件每行都必须有一个网址。网址中不能有换行。


  不应包含网址列表以外的任何信息。


  您必须书写完整的网址,包括 http。


  每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。


  文本文件需使用 UTF-8 编码或GBK编码。


  xml格式


  示例sitemap.xml如下:


  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">


  <url>


  <loc>http://liuxianan.com/</loc>


  <lastmod>2016-09-06T00:00:16+08:00</lastmod>


  <changefreq>daily</changefreq>


  <priority>1.0</priority>


  </url>


  <url>


  <loc>http://liuxianan.com/link.html</loc>


  <lastmod>2016-09-06T00:00:16+08:00</lastmod>


  <changefreq>daily</changefreq>


  <priority>0.8</priority>


  </url>


  </urlset>


  其中:


  loc表示完整网址,必填项,长度不得超过256字节


  lastmod表示本网页最后修改时间,必须是ISO-8601时间格式,具体这个格式是什么样的没整清楚,根据我的理解,反正就当成是:yyyy-MM-ddTHH:mm:ss+08:00,最后面的+08:00应该表示的是东八区;


  changefreq 表示更新频率,可选值:always、hourly、daily、weekly、monthly、yearly、never


  priority 用来指定此链接相对于其他链接的优先权比值,可选值 0.0-1.0,一般来说网站首页1.0,然后二级三级页面依次降低,具体这个属性有多重要不太清楚。


  以上4项中,除了loc是必填项之外,其它3个都不是必须的,但最好都写上。


  一个sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的sitemap超过了这些限值,请将其拆分为几个小的sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。一个站点支持提交的sitemap文件个数必须小于5万个


  下面从 百度站长平台 复制的几项QA:


  Q:我提交时填写的周期是什么含义?


  A:百度Spider会参考设置周期抓取Sitemap文件,因此 请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不 在此更新范围内。Sitemap工具不能解决页面更新问题。


  Q:Sitemap提交后,多久能被百度处理?


  A:Sitemap数据提交后,一般在1小时内百度会开始处理。在以后的调度抓取中,如果您的sitemap支持etag,我们会更频繁抓取sitemap文件,从而及时发现内容更新;否则抓取的周期会比较长。


  Q:提交的Sitemap都会被百度抓取并收录吗?


  A:百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。


  Q:我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?


  A:可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。


  Q:XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?


  A:不会。sitemap中的priority提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。


  Q:网址在 Sitemap 中的位置是否会影响它的使用?


  A:不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。


  Q:Sitemap中提交的url能否包含中文?


  A:因为转码问题建议最好不要包含中文。


  html格式


  本小结暂待补充。


  sitemap索引格式


  如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。


  因为这个我几乎不会用到,所以懒得研究,有兴趣的参考这里。


    2898站长资源平台文化艺术排行榜:http://www.2898.com/webmain/xxyl_whys.htm 


【版权与免责声明】如发现内容存在版权问题,烦请提供相关信息发邮件至 kefu@2898.com ,我们将及时沟通与处理。 本站内容除了2898站长资源平台( www.2898.com )原创外,其它均为网友转载内容,涉及言论、版权与本站无关。