WordPress 免插件生成最安全的纯静态站点地图(sitemap.xml)

2017年9月13日07:32:50 16 239
摘要

好了,经过上述的部署后,基本上你网站纯代码生成的最安全的纯静态站点地图(sitemap.xml)就部署完成了,后期几乎不需要任何的人工干预,一起都是自动定时的生成的,当然你也可以根据你网站的更新频率以及时间间隔来调整“定时任务”的执行时间更加匹配(可以参考【任务计划 crontab 配置概要与常见问题】一文了解具体办法)。

长期以来明月都是借助插件来生成站点地图(sitemap.xml)的,但是这类插件往往刚开始的时候都是“中规中矩”的,在有了一定的安装量后就会有各种捆绑的“推广”、“营销”类的动作让人是烦不胜烦呀,最近在部署SSL后,感觉需要向各个搜索引擎提交一下站点地图(sitemap.xml),想来想去还是免插件生成最好了,安全还高效!

WordPress 免插件生成最安全的纯静态站点地图(sitemap.xml)

其实站点地图(sitemap.xml)就是方便快捷的给搜索引擎蜘蛛指明道路的一个方式

当然,代码还是需要从网上找了,还好明月的偶像【张戈博客】里面很早就分享过这样的代码了,于是明月也就顺手牵羊的拿来使用了,具体如下:

  1. <?php
  2. require('./wp-blog-header.php');
  3. header("Content-type: text/xml");
  4. header('HTTP/1.1 200 OK');
  5. $posts_to_show = 1000;
  6. echo '<?xml version="1.0" encoding="UTF-8"?>';
  7. echo '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">'
  8. ?>
  9. <!-- generated-on=<?php echo get_lastpostdate('blog'); ?> Diy By 张戈博客(http://zhangge.net)-->
  10.   <url>
  11.       <loc><?php echo get_home_url(); ?></loc>
  12.       <lastmod><?php $ltime = get_lastpostmodified(GMT);$ltime = gmdate('Y-m-d\TH:i:s+00:00', strtotime($ltime)); echo $ltime; ?></lastmod>
  13.       <changefreq>daily</changefreq>
  14.       <priority>1.0</priority>
  15.   </url>
  16. <?php
  17. /* 文章页面 */
  18. $myposts = get_posts( "numberposts=" . $posts_to_show );
  19. foreach$myposts as $post ) { ?>
  20.   <url>
  21.       <loc><?php the_permalink(); ?></loc>
  22.       <lastmod><?php the_time('c') ?></lastmod>
  23.       <changefreq>monthly</changefreq>
  24.       <priority>0.6</priority>
  25.   </url>
  26. <?php } /* 文章循环结束 */ ?>
  27. <?php
  28. /* 单页面 */
  29. $mypages = get_pages();
  30. if(count($mypages) > 0) {
  31.     foreach($mypages as $page) { ?>
  32.     <url>
  33.       <loc><?php echo get_page_link($page->ID); ?></loc>
  34.       <lastmod><?php echo str_replace(" ","T",get_page($page->ID)->post_modified); ?>+00:00</lastmod>
  35.       <changefreq>weekly</changefreq>
  36.       <priority>0.6</priority>
  37.   </url>
  38. <?php }} /* 单页面循环结束 */ ?>
  39. <?php
  40. /* 博客分类 */
  41. $terms = get_terms('category', 'orderby=name&hide_empty=0' );
  42. $count = count($terms);
  43. if($count > 0){
  44. foreach ($terms as $term) { ?>
  45.     <url>
  46.       <loc><?php echo get_term_link($term$term->slug); ?></loc>
  47.       <changefreq>weekly</changefreq>
  48.       <priority>0.8</priority>
  49.   </url>
  50. <?php }} /* 分类循环结束 */?>
  51. <?php
  52.  /* 标签(可选) */
  53. $tags = get_terms("post_tag");
  54. foreach ( $tags as $key => $tag ) {
  55.     $link = get_term_link( intval($tag->term_id), "post_tag" );
  56.          if ( is_wp_error( $link ) )
  57.           return false;
  58.           $tags$key ]->link = $link;
  59. ?>
  60.  <url>
  61.       <loc><?php echo $link ?></loc>
  62.       <changefreq>monthly</changefreq>
  63.       <priority>0.4</priority>
  64.   </url>
  65. <?php  } /* 标签循环结束 */ ?>
  66. </urlset>

代码不需要做任何的修改的,至于“版权信息”,明月真心建议各位保留,这毕竟是对作者的一个尊重嘛!

上述代码保存为sitemap.php文件(UTF-8编码),上传到网站根目录,然后访问这个文件的链接即可实时的生成站点地图(sitemap.xml)了,很简单吧!

但是,这样生成的站点地图(sitemap.xml)其实就是“动态”的,这点儿对于服务器的性能还是会有小小的影响的,要是被“别有用心”的人利用,甚至会造成服务器直接宕机都有可能,在【张戈博客】上作者专门提供了“伪静态”和“纯静态”的方法,明月还是感觉“纯静态”的最是安全可靠了,就是需要站长拥有服务器的root权限,所以“虚拟主机”的可能就不适合了。

具体方法如下:

首先将代码保存为sitemap.php(这里为了安全着想可以取任意名字的.php文件,最好是让人猜不到的),然后将这个.php文件放到网站根目录下一个只有你自己知道的目录里面,为了防止这个目录被遍历查询搜索出来,我们还可以通过赋予root群组用户权限来限制访问和获取,具体命令如:chown -R root:root 目录名称;只要替换“目录名称”为你设定的目录名称即可。

然后,给你的系统定时任务里添加一个定时执行的命令来定时的生成纯静态的sitemap.xml到网站个目录即可:

  1. #每天在网站根目录生成一个sitemap.xml diypath为sitemap.php的实际位置和实际文件名哦!
  2. 0 1 * * * wget -O /home/wwwroot/zhangge.net/sitemap.xml http://zhangge.net/diypath/sitemap.php  >/dev/null 2>&1

 Ps:使用这个方法,注意sitemap.php里面的 require('./wp-blog-header.php'); 要改成 require('../wp-blog-header.php'); 也就是注意相对位置,切记!切记!切记!

好了,经过上述的部署后,基本上你网站纯代码生成的最安全的纯静态站点地图(sitemap.xml)就部署完成了,后期几乎不需要任何的人工干预,一起都是自动定时的生成的,当然你也可以根据你网站的更新频率以及时间间隔来调整“定时任务”的执行时间更加匹配(可以参考【任务计划 crontab 配置概要与常见问题】一文了解具体办法)。

本文主要的代码和思路均来自【张戈博客】-【WordPress免插件生成完整站点地图(sitemap.xml)的php代码】一文,特此声明。

历史文章推荐:

  • 我的微信
  • 扫一扫加好友
  • weinxin
  • 站长QQ群
  • 群号:284775512
  • weinxin
明月登楼

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:16   其中:访客  7   博主  9

    • 黑白配博客 来自天朝的朋友 QQ浏览器 Windows 8.1 湖北省宜昌市 电信 1

      This page contains the following errors:

      error on line 1 at column 6: XML declaration allowed only at the start of the document
      Below is a rendering of the page up to the first error.
      加了之后这样是为啥,本来不准备搞这些的,逛了几个博客你们都在说站点地图,,,现在不是不重要了么,话说一个文章归档放在首页让蜘蛛爬就可以了吧,,,

        • 明月登楼 明月登楼 博主 来自天朝的朋友 火狐浏览器 Windows 10 河南省南阳市 电信

          @黑白配博客 出现这个错误一般都是因为php文档里首行是空行造成的,只能你自己排查了!记得要用专用的文本处理软件,比如editplus这类的!

            • 我爱动感单车网 来自天朝的朋友 谷歌浏览器 Windows XP 广西桂林市 电信 5

              @明月登楼 我最近也遇到了这个问题,你所说的php文档指的的是主题目录下的所有php文件,还是网站根目录下的php文件?望指点一二,谢谢!

                • 明月登楼 明月登楼 博主 来自天朝的朋友 火狐浏览器 Windows 7 河南省南阳市 联通

                  @我爱动感单车网 一般是三个文件,分别是function.php(这个一般都是主题根目录里的),wp-config.php( WordPress 根目录),最后就是本文所用到的sitemap.php这个文件。一般都是排除这三个文件首行是否有空行或者换行符啥的(一般只有专业的文本编辑软件才可以看到换行符一类, Windows 的记事本是不行的!) :grin:

              • 明月登楼 明月登楼 博主 来自天朝的朋友 火狐浏览器 Windows 10 河南省南阳市 电信

                @黑白配博客 如果你网站的文章数量少于500个的话,搜索引擎不需要站点地图都可以正常索引收录的!站点地图的作用主要是适合3年以上的老站点的!

              • 实验室排烟系统 来自天朝的朋友 谷歌浏览器 Windows 10 上海市虹口区 电信 5

                这个有些太深了,没有看懂。

                • 懿古今 来自天朝的朋友 谷歌浏览器 Windows 7 广西南宁市 电信 6

                  我现在还是安装谷歌地图插件,懒得折腾了

                    • 明月登楼 明月登楼 博主 来自天朝的朋友 搜狗浏览器 Windows XP 河南省南阳市 联通

                      @懿古今 这些插件说实话安全隐患太大了!毕竟它是需要写入操作的!如果 WordPress 的漏洞利用起来,还是很不安全的!

                    • 里维斯社 来自天朝的朋友 谷歌浏览器 Windows 7 广东省广州市萝岗区 电信 4

                      纯代码的不错,有时候偷懒,就直接用插件了