快速开始 on OhMyScheduler

快速开始 on OhMyScheduler https://kfcfans.gitee.io/docs/startup/ Recent content in 快速开始 on OhMyScheduler Hugo -- gohugo.io en-us 调度中心（Server）部署 https://kfcfans.gitee.io/docs/startup/1-server-startup/ Mon, 01 Jan 0001 00:00:00 +0000 https://kfcfans.gitee.io/docs/startup/1-server-startup/ 环境要求 Open JDK 8+ Apache Maven 3+ 任意 Spring Data Jpa 支持的关系型数据库（MySQL/Oracle/MS SQLServer…） MongoDB（可选），任意支持GridFS的mongoDB版本（4.2.6测试通过，其余未经测试，仅从理论角度分析可用），缺失该组件的情况下将无法使用在线日志、容器部署等扩展功能初始化关系数据库调度服务器（oh-my-scheduler-server）的持久化层基于Spring Boot Jpa实现，对于能够直连数据库的应用，开发者仅需完成数据库的创建，即运行SQL：CREATE database if NOT EXISTS oms-product default character set utf8mb4 collate utf8mb4_unicode_ci;` OhMyScheduler支持环境隔离，提供日常（daily）、预发（pre）和线上（product）三套环境，请根据使用的环境分别部署对应的数据库：oms-daily、oms-pre和oms-product。调度服务器属于时间敏感应用，强烈建议检查当前数据库所使用的时区信息（show variables like "%time_zone%";），务必确保time_zone代表的时区与JDBC URL中serverTimezone字段代表的时区一致！手动建表表SQL文件：下载地址部署调度服务器—源码编译调度服务器（oh-my-scheduler-server）支持任意的水平扩展，即多实例集群部署仅需要在同一个局域网内启动新的服务器实例，性能强劲无上限！调度服务器（oh-my-scheduler-server）为了支持环境隔离，分别采用了日常（application-daily.properties）、预发（application-pre.properties）和线上（application-product.properties）三套配置文件，请根据实际需求进行修改，以下为配置文件详解。配置项含义可选 server.port SpringBoot配置，HTTP端口号，默认7700 否 oms. 执行器（Worker）初始化 https://kfcfans.gitee.io/docs/startup/2-worker-startup/ Mon, 01 Jan 0001 00:00:00 +0000 https://kfcfans.gitee.io/docs/startup/2-worker-startup/ 基于宿主应用的执行器初始化宿主应用即原有的业务应用，假如需要调度执行的任务与当前业务有较为紧密的联系，建议采取该方式。首先，添加相关的jar包依赖，最新依赖版本请参考maven中央仓库：推荐地址&备用地址 <dependency> <groupId>com.github.kfcfans</groupId> <artifactId>oh-my-scheduler-worker</artifactId> <version>1.2.0</version> </dependency> 其次，填写执行器客户端配置文件OhMyConfig，各参数说明如下表所示：属性名称含义默认值 appName 宿主应用名称，需要提前在控制台完成注册无，必填项，否则启动报错 port Worker工作端口 27777 serverAddress 调度中心（oh-my-scheduler-server）地址列表无，必填项，否则启动报错 storeStrategy 本地存储策略，枚举值磁盘/内存，大型MapReduce等会产生大量Task的任务推荐使用磁盘降低内存压力，否则建议使用内存加速计算 StoreStrategy.DISK（磁盘） maxResultLength 每个Task返回结果的默认长度，超长将被截断。过长可能导致网络拥塞 8096 enableTestMode 是否启用测试模式，启用后无需Server也能顺利启动OhMyScheduler-Worker，用于处理器本地的单元测试 false 最后，初始化客户端，完成执行器的启动，代码示例如下： @Configuration public class OhMySchedulerConfig { @Bean public OhMyWorker initOMS() throws Exception { // 服务器HTTP地址（端口号为 server.port，而不是 ActorSystem port） List<String> serverAddress = Lists. 处理器开发 https://kfcfans.gitee.io/docs/startup/3-processor-develop/ Mon, 01 Jan 0001 00:00:00 +0000 https://kfcfans.gitee.io/docs/startup/3-processor-develop/ 处理器概述 OhMyScheduler当前支持Shell、Python等脚本处理器和Java处理器。脚本处理器只需要开发者完成脚本的编写（xxx.sh / xxx.py），在控制台填入脚本内容即可，本章不再赘述。本章将重点阐述Java处理器开发方法与使用技巧。 Java处理器可根据代码所处位置划分为内置Java处理器和容器Java处理器，前者直接集成在宿主应用（也就是接入本系统的业务应用）中，一般用来处理业务需求；后者可以在一个独立的轻量级的Java工程中开发，通过容器技术（详见容器章节）被worker集群热加载，提供Java的“脚本能力”，一般用于处理灵活多变的需求。 Java处理器可根据对象创建者划分为SpringBean处理器和普通Java对象处理器，前者由Spring IOC容器完成处理器的创建和初始化，后者则有OhMyScheduler维护其状态。如果宿主应用支持Spring，强烈建议使用SpringBean处理器，开发者仅需要将Processor注册进Spring IOC容器（一个@Component注解或一句bean配置）。 Java处理器可根据功能划分为单机处理器、广播处理器、Map处理器和MapReduce处理器。单机处理器（BasicProcessor）对应了单机任务，即某个任务的某次运行只会有某一台机器的某一个线程参与运算。广播处理器（BroadcastProcessor）对应了广播任务，即某个任务的某次运行会调动集群内所有机器参与运算。 Map处理器（MapProcessor）对应了Map任务，即某个任务在运行过程中，允许产生子任务并分发到其他机器进行运算。 MapReduce处理器（MapReduceProcessor）对应了MapReduce任务，在Map任务的基础上，增加了所有任务结束后的汇总统计。核心方法：process 任意Java处理器都需要实现处理的核心方法，其接口签名如下： ProcessResult process(TaskContext context) throws Exception; 方法入参TaskContext，包含了本次处理的上下文信息，具体属性如下：属性名称意义/用法 jobId 任务ID，开发者一般无需关心此参数 instanceId 任务实例ID，全局唯一，开发者一般无需关心此参数 subInstanceId 子任务实例ID，秒级任务使用，开发者一般无需关心此参数 taskId 采用链式命名法的ID，在某个任务实例内唯一，开发者一般无需关心此参数 taskName task名称，Map/MapReduce任务的子任务的值为开发者指定，否则为系统默认值，开发者一般无需关心此参数 jobParams 任务参数，其值等同于控制台录入的任务参数，常用！ instanceParams 任务实例参数，其值等同于使用OpenAPI运行任务实例时传递的参数，常用！ maxRetryTimes Task的最大重试次数 currentRetryTimes Task的当前重试次数，和maxRetryTimes联合起来可以判断当前是否为该Task的最后一次运行机会 subTask 子Task，Map/MapReduce处理器专属，开发者调用map方法时传递的子任务列表中的某一个 omsLogger 在线日志，用法同Slf4J，记录的日志可以直接通过控制台查看，非常便捷和强大！不过使用过程中需要注意频率，可能对Server造成巨大的压力方法的返回值为ProcessResult，代表了本次Task执行的结果，包含success和msg两个属性，分别用于传递Task是否执行成功和Task需要返回的信息。任务管理与在线运维 https://kfcfans.gitee.io/docs/startup/4-console-guide/ Mon, 01 Jan 0001 00:00:00 +0000 https://kfcfans.gitee.io/docs/startup/4-console-guide/ 前端控制台允许开发者可视化地进行任务增、删、改、查等管理操作，同时也能直观地看到任务的运行数据，包括运行状态、详情和在线日志等。以下为对控制台的详细介绍：主页展示了系统整体的概览和集群Worker列表。任务创建创建需要被调度执行的任务，入口为主页 -> 任务管理 -> 新建任务。任务名称：名称，便于记忆与搜索，无特殊用途，请尽量简短（占用数据库字段空间）任务描述：描述，无特殊作用，请尽量简短（占用数据库字段空间）任务参数：任务处理时能够获取到的参数（即各个Processor的process方法入参TaskContext对象的jobParams字段）（进行一次处理器开发就能理解了）定时信息：由下拉框和输入框组成 API -> 不需要填写任何参数（填了也不起作用） CRON -> 填写 CRON 表达式（可以找个在线生成网站生成）固定频率 -> 填写整数，单位毫秒固定延迟 -> 填写整数，单位毫秒执行配置：由执行类型（单机、广播和MapReduce）、处理器类型和处理器参数组成，后两项相互关联。内置Java处理器 -> 填写该处理器的全限定类名（eg, com.github.kfcfans.oms.processors.demo.MapReduceProcessorDemo） Java容器 -> 填写容器ID#处理器全限定类名（eg，1#com.github.kfcfans.oms.container.DemoProcessor） SHELL -> 填写需要处理的脚本（直接复制文件内容）或脚本下载连接（http://xxx） PYTHON -> 填写完整的python脚本或下载连接（http://xxx）运行配置最大实例数：该任务同时执行的数量（任务和实例就像是类和对象的关系，任务被调度执行后被称为实例）单机线程并发数：该实例执行过程中每个Worker使用的线程数量（MapReduce任务生效，其余无论填什么，都只会使用1个线程或3个线程…）运行时间限制：限定任务的最大运行时间，超时则视为失败，单位毫秒，0代表不限制超时时间。重试配置：任务重试次数：实例级别，失败了整个任务实例重试，会更换TaskTracker（本次任务实例的Master节点），代价较大，大型Map/MapReduce慎用。子任务重试次数：Task级别，每个子Task失败后单独重试，会更换ProcessorTracker（本次任务实际执行的Worker节点），代价较小，推荐使用。注：对于单机任务来说，假如任务重试次数和子任务重试次数都配置了1且都执行失败，实际执行次数会变成4次！推荐任务实例重试配置为0，子任务重试次数根据实际情况配置。机器配置：用来标明允许执行任务的机器状态，避开那些摇摇欲坠的机器，0代表无任何限制。