WordPress免插件生成完整站点地图(sitemap.xml)的php代码

前言:站点地图(sitemap.xml)的作用,相信站长们都有所了解,我就不献宝了。而免插件生成sitemap.xml,网络上也早就有了纯代码生成的方法。

一直以来,张戈博客都是用DX-SEO这个很好用的中文SEO插件生成的sitemap。今天整理电脑文件时,看到了以前收藏的生成sitemap.xml的php脚本,就随手打开看了看,发现这个代码只能生成主页和文章页的sitemap。果断百度了一下,发现网上分享的都大同小异,只有首页和文章页。感觉有点缺憾,反正今天也是闲着,就动手改造了一番,让这个代码更加完善,可以同时生成首页、文章、单页面、分类和标签的sitemap!

一、PHP代码

将以上代码保存为sitemap.php,传到网站根目录。手动访问查看效果,如:http://zhangge.net/sitemap.php

二、伪静态

①、Nginx

编辑已存在的Nginx伪静态规则,新增如下规则后(平滑)重启nginx即可:

②、Apache

编辑网站根目录的 .htaccess ,加入如下规则:

做好伪静态规则后,就可以直接访问sitemap.xml看看效果了,比如 http://zhangge.net/sitemap.xml

三、纯静态

此部分内容补充于:2016年10月24日程序员节

看到很多朋友已经在问这个sitemap如何静态化,加快打开速度。毕竟每次重新生成绝对是一个耗能大户,而且还有可能被有心之人拿来作为攻击入口!

其实,张戈博客早就已经实现sitemap.xml静态化了,而且在后面的文章中也有提到=>【相关文章

实现方法有多种,比如在Nginx的fastcgi缓存中取消xml文件的缓存屏蔽,或者使用张戈博客最早使用的php生成静态文件等。

在这里,我就分享一个自己一直在用的最简单的实现方法:Linux定时任务+wget定时生成sitemap.xml

具体实现:将sitemap.php放到某个不为人知的目录,然后定时使用wget去请求这个文件,并将数据保存为sitemap.xml存放到网站根目录就可以了!比如:

2017-09-22补充:如果是启用了https的站点,需要加入 --no-check-certificate  的选项,即:

Ps:使用这个方法,注意sitemap.php里面的 require('./wp-blog-header.php'); 要改成 require('../wp-blog-header.php'); 也就是注意相对位置!

如果实在搞不清楚什么是相对路径,那么就用简单粗暴的方法:将网站根目录的sitemap.php重命名为一个只有自己知道的php文件,比如xml.php,然后如下添加任务:

这样一来,就解决了sitemap.xml是动态数据问题了!

四、文章最后

①、确认无误之后,已开通sitemap权限的就可以前往百度站长平台提交了,没开通权限的可以发送申请邮件到百度站长平台管理员邮箱申请,并且将sitemap.xml使用a标签链接在网站底部即可。

②、代码使用很简单,可以根据需要增减内容,比如觉得标签不应该出现在sitemap里面的,可以将标签部分的php代码删除即可,但一定要注意不要误删除结尾的</urlset>标签。

③、今天,把分类、单页面及标签的sitemap都整出来了,那开放适配专用sitemap的php代码也就可以继续完善下了,回头有时间我会整理总结一篇关于sitemap及开放适配的终结篇,敬请期待!

发表评论

gravatar

:?::razz::sad::evil::!::smile::oops::grin::eek::shock::???::cool::lol::mad::twisted::roll::wink::idea::arrow::neutral::cry::mrgreen:

刷新评论

目前评论:155   其中:访客  109   博主  46

  1. Sophia 0 来自天朝的朋友 谷歌浏览器 Windows 7 四川省成都市 四川大学

    张哥求救!我的站点.php格式的能打开,到了.xml就变成“有点尴尬,该页无法显示”。在网上查了很多其他教程试了各种.htaccess写法都不成功,能指点一下吗TAT
    RewriteEngine on
    RewriteRule ^(sitemap)\.xml$ $1.php

    • 张戈 [博主] 来自天朝的朋友 Safari浏览器  Android 5.1.1 Redmi Note 3 Build/LMY47V 广东省深圳市 移动

      RewriteRule ^/sitemap\.xml$ /sitemap.php [L]
      加到第一行试试

      • 免费电影吧 1 来自天朝的朋友 谷歌浏览器 Windows 10 四川省成都市 电信

        拜读此文后 有这样一个问题:是这样的 我用了这个代码后 每次点开 sitemap.xml 都要重新查询后生成内容,例如:http://www.dianyingbar.com/sitemap.xml,并不是张戈大神博客这样的sitemap.xml 点开即可看到生成好的页面。由于不能看到第1页的评论(怎么只能看到第2页的评论呢) 不知道是否已经有人提出过 望赐教。

        • 张戈 [博主] 来自天朝的朋友 谷歌浏览器 Mac OS X 10_11_3 广东省 电信

          1、评论历史分页无法查看问题已解决。
          2、sitemap.xml 静态化问题有多重解决办法,最简单的就是利用linux 的crontab定时任务,定时生成一个siemap.xml 到网站根目录,而且伪静态也不需要了。
          比如把sitemap.php改成xml.php,然后在crontab中加入:

          每天1点生成一个静态xml文件,够清楚吧?

  2. bitch 0 来自天朝的朋友 QQ浏览器 Windows 7 湖南省衡阳市 电信

    张哥,丫的也太骚包了,被你吓死了,叉掉之后网页开始跳舞

  3. skysmile 0 来自天朝的朋友 QQ浏览器 Windows 7 安徽省合肥市 移动

    百度的https sitemap.xml提交为什么是抓取失败

  4. 似水流年 1 来自天朝的朋友 谷歌浏览器 Windows 10 陕西省铜川市 电信

    求指导,我是这样写对吗。实际测试还是打不开

    • 游者记 2 来自天朝的朋友 谷歌浏览器 Windows 10 河北省石家庄市 电信

      到底是加在了什么位置呢?

  5. 美剧天堂 2 来自天朝的朋友 谷歌浏览器 Windows 7 江苏省苏州市 电信

    我的博客准备试试

  6. 佐恒科技 0 来自天朝的朋友 谷歌浏览器 Windows 10 广东省 联通

    This page contains the following errors:
    error on line 1 at column 161: Encoding error
    Below is a rendering of the page up to the first error.

    出现这个错误~咋办

    • ckeke 0 来自天朝的朋友 谷歌浏览器 Windows 8.1 山东省青岛市 移动

      问题解决了吗,我和你一样的错误提示

  7. 大漠 4 来自天朝的朋友 搜狗浏览器 Windows 10 山东省 联通

    网站数据量大的时候,生成的xml页面打开速度非常慢,有没有翻页或者限制xml数量,比如xml只展示最新更新的1000篇文章啥的。

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Mac OS X 10_11_3 广东省深圳市 电信

      可以尝试下 https://zhangge.net/5095.html 这篇文章中的预缓存前身。

  8. 番茄薯片 2 来自天朝的朋友 谷歌浏览器 Windows XP 河北省邢台市 联通

    然后在crontab中加入,是指在哪里加入啊?

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Mac OS X 10_11_3 广东省深圳市 电信

      执行 crontab -e 进入编辑界面
      后面的操作请参考vim,不会可以百度下。

  9. 番茄薯片 2 来自天朝的朋友 谷歌浏览器 Windows XP 河北省邢台市 联通

    张神,在crontab中加入,是指在哪里加入啊?

  10. 野人摊影视分享 3 来自天朝的朋友 谷歌浏览器 Windows 7 福建省福州市 联通

    张戈你好,我的问题是这样的,因为使用了博客中的前端html代码压缩优化中的代码,导致结构化数据xml这个页面也被压缩了,我想让这个页面不需要压缩,要这样实现?麻烦博主知道下!谢谢!已经尝试过在开头和结尾都添加了避免压缩的注释,效果还是和原来一样,不知道到博主,是怎么解决这个问题!评论 谢谢!

    • 野人摊影视分享 3 来自天朝的朋友 谷歌浏览器 Windows 7 福建省福州市 联通

      张戈有空吗?可以帮忙看下吗?谢谢

      • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Mac OS X 10_11_3 广东省深圳市 电信

        如下插入试试:

        • 野人摊影视分享 3 来自天朝的朋友 谷歌浏览器 Windows 7 福建省福州市 联通

          博主,还在吗?刚试了下你说的那个方法评论 问题还是 存在,麻烦博主再想想办法,谢谢

          • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Mac OS X 10_11_3 广东省深圳市 电信

            sitemap.xml压缩好像不影响功能把。解决办法当然多想想也是有的:
            找到压缩函数调用代码:

            替换成:

            表示,后台不压缩,POST请求不压缩,页面地址命中到sitemap或xml关键词不压缩,页面地址命中到feed不压缩,也是我博客当前的用法,关键词什么的,自己看着改改吧!

  11. 吾爱 2 来自天朝的朋友 谷歌浏览器 Windows 7 重庆市渝中区 电信

    shell脚本怎么执行

  12. 吾爱 2 来自天朝的朋友 谷歌浏览器 Windows 7 重庆市 电信

    我添加了ssl 怎么站点地图不行了

  13. boke112导航 2 来自天朝的朋友 谷歌浏览器 Windows XP 广西南宁市 电信

    我用的是ECS服务器,但是浏览器浏览sitemap_mob.php总会出现这个错误:error on line 1 at column 152: attributes construct error。同样的文件在虚拟主机却一切正常,不知道怎么解决?

  14. 牧羊人 5 来自天朝的朋友 谷歌浏览器 Windows 10 重庆市 联通

    这个好,收藏备用了~~

  15. 1 来自天朝的朋友 谷歌浏览器 Windows 7 广东省东莞市 电信

    wget -O /home/wwwroot/zhangge.net/sitemap.xml http://zhangge.net/xml.php >/dev/null 2>&1

    执行以上后,有返回提示吗?

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Mac OS X 10_11_3 广东省深圳市 电信

      后面的 >/dev/null 2>&1 就是屏蔽提示。

  16. 火车头 1 来自天朝的朋友 谷歌浏览器 Windows 7 河南省郑州市 电信

    谢谢大神,但这个超过8500条的时候,就会出现
    This page contains the following errors:
    error on line 28 at column 1: Extra content at the end of the document
    Below is a rendering of the page up to the first error.
    这样的问题,我猜应该是服务器数据库限制导致的,如何修改下代码使他5000个为一个文件呢?求大神帮忙,可以有偿,嘿嘿

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Windows 7 广东省广州市 电信

      看错误不是超出数量引起的

      • 火车头 1 来自天朝的朋友 谷歌浏览器 Windows 7 河南省郑州市 电信

        已经解决了,最后还是用的插件,嘿嘿,谢谢哈

  17. 小幻酱 5 来自天朝的朋友 谷歌浏览器 Windows 10 山东省潍坊市 联通

    我是用的ob_start缓存页面,然后判断缓存时间输出,感觉也差不多 就是创建个cron任务感觉好麻烦
    不过Google已经不支持xml格式了 现在仅接受json格式的结构化数据提交了

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Windows 7 广东省广州市 电信

      嗯,直接使用cron生成本地文件非常简单的。

  18. 花卉说 1 来自天朝的朋友 谷歌浏览器 Windows XP 陕西省西安市 电信

    不知道从什么时候起,已经懒得折腾这些东西了。

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Windows 7 广东省广州市 电信

      这已经是14年的文章了。。。

  19. 韦博 1 来自天朝的朋友 谷歌浏览器 Windows 7 广东省东莞市 电信

    已解决

  20. 开着宝马要饭 0 来自天朝的朋友 谷歌浏览器 Windows XP 云南省昆明市 电信

    张戈大大,我用的是虚拟主机IIS, 生成xml地图要怎么添加规则,如果有时间,求回答一下,谢谢!

  21. 田岗 0 来自天朝的朋友 谷歌浏览器 Windows 7 山东省枣庄市滕州市 联通

    我的哥,云虚拟主机咋设置crontab?还有Nginx也找不到啊,我是云虚拟主机,你们都是用的主机吗?不是虚拟主机?

  22. 索斌 0 来自天朝的朋友 搜狗浏览器 Windows 7 湖北省武汉市 电信

    大神,我按照你的方法弄了之后访问sitemap.php正常,访问sitemap.xml只显示头部内容:This XML file does not appear to have any style information associated with it. The document tree is shown below.,是怎么回事啊?

    • llanc.cn 1 来自天朝的朋友 谷歌浏览器 Windows 10 山东省烟台市 联通

      我的也一样,你的解决了吗?

    • llanc.cn 1 来自天朝的朋友 谷歌浏览器 Windows 10 山东省烟台市 联通

      注意ssl链接,要用–no-check-certificate,我的已经解决了。谢谢博主,之前的留言可以不用通过了

      • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Windows 7 广东省广州市 电信

        因为你们启用了https

  23. llanc.cn 1 来自天朝的朋友 谷歌浏览器 Windows 10 山东省烟台市 联通

    博主你给的展示链接https://zhangge.net/sitemap.xml也是只显示头部一句This XML file does not appear to have any style information associated with it. The document tree is shown below.我的也这样,只有一句,请问这是什么原因呢,能给解释下吗,万分感谢!

  24. 米扑 3 来自天朝的朋友 谷歌浏览器 Mac OS X 10_12_6 北京市 中国电信北京研究院

    Good Share 赞一个

  25. 值得买 2 来自天朝的朋友 谷歌浏览器 Windows 7 吉林省吉林市 电信

    张老师,添加https后,不能生成sitemap.xml,看日志提示:省略sitemap.xml –no-check-certificate\302\240https省略
    –no-check-certificate\302\240https这是是什么原因,求解,谢谢!

    • 张戈 [博主] 来自天朝的朋友 QQ浏览器 Mac OS X 10_11_3 广东省深圳市 电信

      https要带上–no-check-certificate选项,你仔细看下文章【2017-09-22补充】内容。还是没仔细看文章,文章都说的很全面了。

      • 值得买 2 来自天朝的朋友 谷歌浏览器 Windows 7 吉林省吉林市 电信

        参数写了,http设置301跳转https后现在生成了,不知道是否和这个有关,非常感谢张老师的教导。

加载中,请稍候...