一、背景
crontab 是 Linux 系统里面最简单易用的定时任务管理工具,相信绝大多数开发和运维都用到过。在咱们公司,很多业务系统的定时任务都是通过 crontab 来定义的,时间长了后会发现存在很多问题:
- 大量的 crontab 任务散布在各台服务器,带来了很高的维护成本
- 任务没有按时执行,甚至失败了很久才发现,需要重试或排查
- crontab 分散在很多集群上,需要一台一台去看日志分析,头都大了
- crontab 存在单点问题,对于不能重复执行的定时任务很伤脑筋
- 我 X,crontab 被误删了,没备份?尼玛!
- 我 Q,服务器要迁移,crontab 上的历史任务都是什么鬼?问了一圈居然都不知道
- ...
因此,我们非常需要一个集中管理定时任务系统,相信这也是的饱受 crontab 煎熬的运维或开发的心声。
二、选择
我们部门的开发人力一直都非常紧张,所以靠自己开发一套完善的定时任务管理系统不太现实。因此,希望找一个开源的系统来快速满足需求。
期间,我在网上看了不少相关文章,比如 http://ju.outofmemory.cn/entry/221885
发现这些系统对于我们的实际场景来说都过于臃肿,不太合适。偶然在 github 找了一个基于 Go 语言开源的定时任务集中管理系统—gocron,发现非常轻量,于是试用了一段时间。
不过最终我还是放弃了,因为 gocron 存在单点问题,项目地址:https://github.com/ouqiang/gocron
期间和作者有过一段时间的交流,提了不少改善建议,在和 gocron 作者交流期间,他针对我提到的单点问题,推荐了另一个开源项目:cronsun,也就是本文介绍的主角,通过试用,发现非常契合我们当前的使用场景,介绍如下:
cronsun 是一个分布式任务系统,单个节点和 Linux 机器上的 crontab 近似。是为了解决多台 Linux 机器上 crontab 任务管理不方便的问题,同时提供任务高可用的支持(当某个节点死机的时候可以自动调度到正常的节点执行)。支持界面管理机器上的任务,支持任务失败邮件提醒,安装简单,使用方便,是替换 crontab 一个不错的选择。
Github 地址:https://github.com/shunfei/cronsun
三、部署
本文主要介绍功能,这里就简单写下关键步骤:
1、安装 MongoDB,强烈建议使用集群模式
2、安装 Etcd3,强烈建议使用集群模式
3、部署 cronsun
①、下载 cronsun:https://github.com/shunfei/cronsun/releases (选择最新版本即可)
②、解压后修改 conf 目录下的配置文件:db.json 和 etcd.json,分别修改 MongoDB 和 etcd 的实际地址。
③、启动 web:./cronweb -conf conf/base.json (若要后台运行则使用 nohup)
④、启动 node:./cronnode -conf conf/base.json (若要后台运行则使用 nohup)
⑤、访问前台:http://x.x.x.x:7079/ui/
4、部署鉴权组件 aProxy,cronsun 在鉴权方面做的非常粗糙,所以这里用到了 cronsun 团队开发的 aProxy 鉴权组件,实现的原理为基于 Go 语言,反向代理了后端 WEB,从而实现域名和页面地址的访问控制,介绍地址:https://www.cnblogs.com/QLeelulu/p/aproxy.html
我们这边是要用到生产环境,所以在部署上会着重考虑到可用性和可靠性,这里贴一下我们这边的部署架构图,供参考:
Ps:目前新版本已支持历史日志定期清理。
这里,Etcd 和 MongoDB 复用了 5 台服务器(后续会继续复用其他公共组件),其中 MongoDB 采用分片+副本集的模式。
四、功能
部署完成后,访问前台就能看到 UI 比较简陋 cronsun 管理 WEB 了:
Ps:右上方选择熟悉的语言之后,基本就可以按照页面标签进行任务添加操作了。
1、添加节点
cronsun 基于 etcd 实现了自动发现和注册的功能,所以添加节点非常简单,直接将 cronnode 和 conf 拷贝到客户端服务器启动之后,就能在前台->节点页面看到该服务器了,当然节点和 Etcd 以及 MongoDB 之间的网络必须畅通。
2、节点分组
添加了所需的节点服务器之后,我们可以将节点进行分组,从而方便定时任务的添加:
3、添加任务
节点和分组都搞定之后,我们就可以开始添加定时任务了。定时任务填写的信息略微复杂,不过按照提示还是可以轻松搞定的:
上图我简单的标注了一些需要特别说明的地方,其他的选项大家看中文描述都能自行搞定。当然,还有一点要说明的是,任务脚本必须要有执行权限,否则任务会执行失败。
4、任务列表
添加完成任务之后,在任务标签页就能看到所有添加的定时任务以及执行情况了,这里可以使用分组过滤或节点过滤来筛选关心的任务。
每一个任务的右侧有 3 个小按钮:
①、成功/失败:显示最近一个任务的执行是成功还是失败,点击后可以查看到任务详情,包括任务输出数据:
②、latest 按钮:点击后查看改任务的近期执行情况
五、小结
通过一段时间的灰度试用,可以确定 cronsun 在中小型规模场景下,是 crontab 的一个比较好的替代品,它能够帮助运维人员脱离 crontab 难管理、难运维的苦海。
当然,作为一款开源产品,cronsun 很多功能细节还有很大的提升空间,目前我也和 cronsun 团队长期保持联系,将生产环境使用过程中遇到的一些问题和建议一一反馈,相信这款产品能够继续打磨优化,更加完善、完美。
六、问题及更新【持续】
问题记录:
1、告警配置
首先要清楚 cronsun 的告警是由 cronweb 发出的,而不是 cronnode(但是 cronnode 的 mail.json 也必须 Enable:true,否则还是无法发出告警)。
其次,编辑 cronweb 和 cronnode 的配置文件:mail.json,如下内容
{ "Enable": true, "To": ["这里填写缺省默认的告警邮件接收地址"], "#HttpAPI": "如有此字段,则按 http api 方式发送", "#Keepalive": "如果此时间段内没有邮件发送,则关闭 SMTP 连接,单位/秒", "Keepalive": 30, "#doc": "https://godoc.org/github.com/go-gomail/gomail#Dialer", "Host": "填写 SMTP 服务器地址,比如:stmp.qq.com", "Port": 25, "Username": "这里填写发送人邮箱地址(用于登陆 SMTP+from 地址)", "Password": "登陆密码", "SSL": false, "LocalName": "" }
Ps:LocalName 建议留空,HttpAPI 模式未使用到,这里省略之,请自行测试。
最后启动 cronweb 即可实现邮件告警。
当然, 还需要在 web 上的单向任务界面开启告警才行,如下图所示:
Ps:cronweb 的 mail.json 配置中必须将 Enable 填为 true 才可以看到上图的告警开关按钮,否则不显示。
2、更新记录
详见 github 版本发布页面:https://github.com/shunfei/cronsun/releases
重要功能更新:
①、已支持脚本参数;
②、已支持历史日志定期清理;
③、3.1 版本开始使用 UUID 作为节点唯一标识。
刚接触linux,感觉crontab还是挺好用的 :mrgreen:
单机没问题,来个几百台几千台,你就苦逼了。
:shock: 那也太恐怖了吧.... PS:网站备案真蛋疼...
哈哈 企业备案更蛋疼
今年初我的域名(mimvp.com)企业备案23天,
不仅严重影响了生意收入,还严重影响了PR值、网站权重、企业信誉等一系列问题
当然,很多初创企业,去年底和今年初都面临过你今天的同样问题
:???: 希望下周能OK,已经等了一周了~~
可以做点手脚,不关站备案啊。。
https://zhang.ge/5017.html
另外,我之前从阿里云转腾讯云的时候,只把www的域名给弄了一个临时页面,就备案过了,zhang.ge照样放开访问,没问题的。。。管局和审核只看www域名。。。当然如果你是www的作为主站,那么就得看看这篇文章了。。。
看到的晚了... :sad: 不过下次就用这个试试了~ :mrgreen:
这种方法不行了吧,文章是2015年的
mimvp.com 开始是我在阿里云的个人备案
后转企业备案时,阿里云把域名给屏蔽了,无法访问
没办法,临时切换到了另一个人域名 mimvp.cn 让客户继续访问
近一个月企业备案完毕后,再又切回了 mimvp.com 阿里云才让访问,PR早没了
站长平台点下闭站保护
这个代理也可以备案通过??真牛啊
发现作者居然还是个高中毕业,感叹果然大神无处不在! 高手在民间
服务器集群,会考虑试试 cronsun 维护米扑的几十台云服务器 :oops:
完全可以的
又学到了,感谢大大!
可惜我们的服务器特别的分散,隶属不通客户,使用到的机会不是很大。
博主的每一篇文章都有干货,值得学习
Jager大神的文章值得一看
太实用了,已收藏签到成功! :razz:
怎么添加节点呢
改天抽空折腾折腾这个软件
我是真的看不懂,不过这并不耽误我评论。
溜达溜达,博主不错
老板,你不更新文章我们过来没东西可学啊。之前的文章看了好多。
怎么看最新的文章啊...
博主更新不错,但是干货不少
喜欢用systemd的一套工具,包含了timer,感觉比crontab优雅
嗯,有空学习下
大佬,你的文章怎么写的啊,红色的标题线,绿色的文本框等是怎么弄的呢?小白想要学习一下,谢谢!
定时任务真的是个好东西,这两天折腾了一下WordPress的计划任务,可以说是非常的爽啊
分享的很好 学习了过来
怎么一抖一抖的啊,挺吓人的。
全篇干货啊
钟水洲博客→博客大全→贵站(我只是路上,打酱油)
这个不错,学习了
才发现竟然恢复了!不错!特来留个脚印!
linux 还是比较实用,学习了
博主,您好!
我下载源代码后没有./cronweb ./cronnode 这两个命令呢?求指点,谢谢
学习了!