Spring -- 定时任务调度的发展

屈定

2019-09-22

Spring

Java领域的调度最早一般认为是Timer，接着由Quratz创造调度器（Scheduler）、任务(Job)和触发器(Trigger)三个核心概念后开始发展，接着在JDK1.5时ScheduledThreadPoolExecutor出现，逐渐成为主流的单机定时调度方式，Spring的定时任务底层适配了Quratz以及ScheduledThreadPoolExecutor，提供更加方便的使用形式，并没有提供新的调度器实现，再接着发展则是抽离出来任务触发部分，独立集群部署，以应对数以万计的定时任务，即以Elastic-job，xxl-job等为代表的分布式调度平台。本文主要描述单机调度与分布式调度的常见实现原理，由于平台众多，如有错误还请指出。

Timer调度

Timer虽然古老，但是调度该有的东西基本都有，因此仍然值得一说。其使用如下所示，TimerTask为Job，提交一个job，即提交到执行队列(最小堆)中一个任务，Timer本身是Scheduler，也是Trigger，其内部持有一个线程，该线程会循环扫描任务优先级队列，发现可执行任务则执行，未发现或任务未到时间则等待下去。

清单1: Timer调度示例

// 相当于创建一个调度器
Timer timer = new Timer();
// 提交一个job任务
    timer.schedule(new TimerTask() {
            @Override
            public void run() {
                System.out.println(111);
            }
        }, 2000L);

至于内部优先级队列实现，以及任务循环实现与ScheduledThreadPoolExecutor类似，因此在下面ScheduledThreadPoolExecutor中详细说明。

ScheduledThreadPoolExecutor调度

Timer的缺陷是单线程执行，一个任务阻塞就会导致后续任务延迟，ScheduledThreadPoolExecutor简单来说为多线程版的Timer，除此之外还提供了任务隔离，异常处理等功能。
ScheduledThreadPoolExecutor为ThreadPoolExecutor的子类，本质上执行流程仍是线程池的那一套逻辑，核心在于BlockingQueue的实现类DelayedWorkQueue。DelayedWorkQueue在数据结构上和Timer保持一致，为小根堆，根节点为当前要执行的任务，每次线程去获取根节点即可拿到最近需要执行的任务。

清单2：小根堆示意

针对固定频率任务比如每5分钟一次，如何实现循环呢？答案是当一个任务执行结束前，计算出下次执行时间，然后重新添加到队列，队列则自动根据优先级调整顺序。多线程是针对多任务并发执行，针对单个任务仍然可以看作是单线程执行，同样如果任务执行时间超过执行周期，那么也会导致任务延迟。

ps：这里ScheduledThreadPoolExecutor针对多线程下任务抢占线程切换消耗做了leader/follow模式优化，有兴趣可以看下源码。

Spring调度

在Spring中可以很容易用@Scheduled注解开启一个定时任务，其内部适配了Quratz以及ScheduledThreadPoolExecutor两种实现，默认为ScheduledThreadPoolExecutor，其中针对ScheduledThreadPoolExecutor额外提供了cron定时形式，实现原理与固定类似，如下图所示，在ReschedulingRunnable类中执行完毕后，会再次开启下一个定时任务。

PS：关于Spring如何切入到Bean注册流程，扫描出对应@Scheduled注解对应的方法，注册对应定时器，这一流程也值得学习，有兴趣的同学可以从ScheduledAnnotationBeanPostProcessor类开始看。

时间轮调度

上述的调度实际上都是依赖于优先级队列，除此之外还有time wheel算法，如下图所示，原理是把时间按照bucket进行分配，比如下面一轮8个格子，假设一个格子1秒，指针从0开始走，当走到1时，发现其对应两个任务需要分别走2轮和4轮后才能执行，因此继续下去，当再次走到0时，对应所有任务轮数减1，因此针对该bucket上的任务需要 round() * 8 + N 秒才能被执行。

单时间轮会因为调度周期导致任务的round()变得很大，需要走很多轮才能被执行，同时一个bucket可能挂在很多个任务，导致效率降低，因此出现了变种算法层级时间轮，即多个时间轮嵌套，上级时间轮对应的round()变为0后，则下方到下级，直到最底层时间轮才被执行。

分布式调度

在分布式环境下，单机调度有着复杂的问题，比如多台机器一起触发，需要业务上做幂等，或者使用分布式锁+重试策略，以防万一还需要提供手动触发能力。对于量比较大的计算，无法充分发挥集群优势，只能落到单台机器执行等等问题。
无论单机还是分布式，调度框架模型始终调度器（Scheduler）、任务(Job)和触发器(Trigger)三大组件，而分布式的策略是把触发器(Trigger)集群化，任务触发消息通过其他服务转交给对应业务系统，业务系统承担调度器（Scheduler）、任务(Job)，执行完毕后反馈给触发器。

xxl-job架构图

参考

定时器的几种实现方式

版权声明: 感谢您的阅读，本文由屈定's Blog版权所有。如若转载，请注明出处。

文章标题: Spring -- 定时任务调度的发展

文章链接: https://mrdear.cn/posts/framework-spring-schedule

程序员的核心能力(转)

Spring -- Cache原理