此处将为大家介绍关于如何构建ApacheDolphinScheduler的Docker镜像的详细内容,并且为您解答有关构建docker镜像的方法的相关问题,此外,我们还将为您介绍关于ApacheDol
此处将为大家介绍关于如何构建 Apache DolphinScheduler 的 Docker 镜像的详细内容,并且为您解答有关构建docker镜像的方法的相关问题,此外,我们还将为您介绍关于Apache DolphinScheduler & Doris 联合Meetup、Apache DolphinScheduler & Doris 联合线上 Meetup、Apache DolphinScheduler 1.2.1 发布说明、Apache DolphinScheduler 1.3.2 发布,性能提升 2~3 倍的有用信息。
本文目录一览:- 如何构建 Apache DolphinScheduler 的 Docker 镜像(构建docker镜像的方法)
- Apache DolphinScheduler & Doris 联合Meetup
- Apache DolphinScheduler & Doris 联合线上 Meetup
- Apache DolphinScheduler 1.2.1 发布说明
- Apache DolphinScheduler 1.3.2 发布,性能提升 2~3 倍
如何构建 Apache DolphinScheduler 的 Docker 镜像(构建docker镜像的方法)
继昨日发布第一个 [官方 Docker 镜像] 后,有几位小伙伴私信想自己进行编译,这里也将 Docker 的主要贡献者文禾同学整理的文档进行分享。以下是全文内容:
您能够在类 Unix 系统和 Windows 系统中构建一个 docker 镜像。
类 Unix 系统,如下:
$ cd path/incubator-dolphinscheduler
$ sh ./docker/build/hooks/build
Windows 系统,如下:
c:\incubator-dolphinscheduler>.\docker\build\hooks\build.bat
如果你不理解这些脚本 ./docker/build/hooks/build
./docker/build/hooks/build.bat
,请阅读里面的内容。
环境变量
DolphinScheduler 映像使用了几个容易遗漏的环境变量。虽然这些变量不是必须的,但是可以帮助你更容易配置镜像并根据你的需求定义相应的服务配置。
DATABASE_TYPE
配置 database
的 TYPE
, 默认值 postgresql
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_DRIVER
配置 database
的 DRIVER
, 默认值 org.postgresql.Driver
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_HOST
配置 database
的 HOST
, 默认值 127.0.0.1
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_PORT
配置 database
的 PORT
, 默认值 5432
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_USERNAME
配置 database
的 USERNAME
, 默认值 root
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_PASSWORD
配置 database
的 PASSWORD
, 默认值 root
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_DATABASE
配置 database
的 DATABASE
, 默认值 dolphinscheduler
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DATABASE_PARAMS
配置 database
的 PARAMS
, 默认值 characterEncoding=utf8
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
、api-server
、alert-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
DOLPHINSCHEDULER_ENV_PATH
任务执行时的环境变量配置文件, 默认值 /opt/dolphinscheduler/conf/env/dolphinscheduler_env.sh
。
DOLPHINSCHEDULER_DATA_BASEDIR_PATH
用户数据目录,用户自己配置,请确保这个目录存在并且用户读写权限, 默认值 /tmp/dolphinscheduler
。
ZOOKEEPER_QUORUM
配置 master-server
和 worker-serverr
的 Zookeeper
地址,默认值 127.0.0.1:2181
。
注意: 当运行 dolphinscheduler
中 master-server
、worker-server
这些服务时,必须指定这个环境变量,以便于你更好的搭建分布式服务。
MASTER_EXEC_THREADS
配置 master-server
中的执行线程数量,默认值 100
。
MASTER_EXEC_TASK_NUM
配置 master-server
中的执行任务数量,默认值 20
。
MASTER_HEARTBEAT_INTERVAL
配置 master-server
中的心跳交互时间,默认值 10
。
MASTER_TASK_COMMIT_RETRYTIMES
配置 master-server
中的任务提交重试次数,默认值 5
。
MASTER_TASK_COMMIT_INTERVAL
配置 master-server
中的任务提交交互时间,默认值 1000
。
MASTER_MAX_CPULOAD_AVG
配置 master-server
中的 CPU 中的 load average
值,默认值 100
。
MASTER_RESERVED_MEMORY
配置 master-server
的保留内存,默认值 0.1
。
MASTER_LISTEN_PORT
配置 master-server
的端口,默认值 5678
。
WORKER_EXEC_THREADS
配置 worker-server
中的执行线程数量,默认值 100
。
WORKER_HEARTBEAT_INTERVAL
配置 worker-server
中的心跳交互时间,默认值 10
。
WORKER_FETCH_TASK_NUM
配置 worker-server
中的获取任务的数量,默认值 3
。
WORKER_MAX_CPULOAD_AVG
配置 worker-server
中的 CPU 中的最大 load average
值,默认值 100
。
WORKER_RESERVED_MEMORY
配置 worker-server
的保留内存,默认值 0.1
。
WORKER_WEIGHT
配置 worker-server
的权重,默认之 100
。
WORKER_LISTEN_PORT
配置 worker-server
的端口,默认值 1234
。
WORKER_GROUP
配置 worker-server
的分组,默认值 default
。
XLS_FILE_PATH
配置 alert-server
的 XLS
文件的存储路径,默认值 /tmp/xls
。
MAIL_SERVER_HOST
配置 alert-server
的邮件服务地址,默认值 空
。
MAIL_SERVER_PORT
配置 alert-server
的邮件服务端口,默认值 空
。
MAIL_SENDER
配置 alert-server
的邮件发送人,默认值 空
。
MAIL_USER=
配置 alert-server
的邮件服务用户名,默认值 空
。
MAIL_PASSWD
配置 alert-server
的邮件服务用户密码,默认值 空
。
MAIL_SMTP_STARTTLS_ENABLE
配置 alert-server
的邮件服务是否启用 TLS,默认值 true
。
MAIL_SMTP_SSL_ENABLE
配置 alert-server
的邮件服务是否启用 SSL,默认值 false
。
MAIL_SMTP_SSL_TRUST
配置 alert-server
的邮件服务 SSL 的信任地址,默认值 空
。
ENTERPRISE_WECHAT_ENABLE
配置 alert-server
的邮件服务是否启用企业微信,默认值 false
。
ENTERPRISE_WECHAT_CORP_ID
配置 alert-server
的邮件服务企业微信 ID
,默认值 空
。
ENTERPRISE_WECHAT_SECRET
配置 alert-server
的邮件服务企业微信 SECRET
,默认值 空
。
ENTERPRISE_WECHAT_AGENT_ID
配置 alert-server
的邮件服务企业微信 AGENT_ID
,默认值 空
。
ENTERPRISE_WECHAT_USERS
配置 alert-server
的邮件服务企业微信 USERS
,默认值 空
。
FRONTEND_API_SERVER_HOST
配置 frontend
的连接 api-server
的地址,默认值 127.0.0.1
。
Note: 当单独运行 api-server
时,你应该指定 api-server
这个值。
FRONTEND_API_SERVER_PORT
配置 frontend
的连接 api-server
的端口,默认值 12345
。
Note: 当单独运行 api-server
时,你应该指定 api-server
这个值。
初始化脚本
如果你想在编译的时候或者运行的时候附加一些其它的操作及新增一些环境变量,你可以在 /root/start-init-conf.sh
文件中进行修改,同时如果涉及到配置文件的修改,请在 /opt/dolphinscheduler/conf/*.tpl
中修改相应的配置文件
例如,在 /root/start-init-conf.sh
添加一个环境变量 API_SERVER_PORT
:
export API_SERVER_PORT=5555
当添加以上环境变量后,你应该在相应的模板文件 /opt/dolphinscheduler/conf/application-api.properties.tpl
中添加这个环境变量配置:
server.port=${API_SERVER_PORT}
/root/start-init-conf.sh
将根据模板文件动态的生成配置文件:
echo "generate app config"
ls ${DOLPHINSCHEDULER_HOME}/conf/ | grep ".tpl" | while read line; do
eval "cat << EOF
$(cat ${DOLPHINSCHEDULER_HOME}/conf/${line})
EOF
" > ${DOLPHINSCHEDULER_HOME}/conf/${line%.*}
done
echo "generate nginx config"
sed -i "s/FRONTEND_API_SERVER_HOST/${FRONTEND_API_SERVER_HOST}/g" /etc/nginx/conf.d/dolphinscheduler.conf
sed -i "s/FRONTEND_API_SERVER_PORT/${FRONTEND_API_SERVER_PORT}/g" /etc/nginx/conf.d/dolphinscheduler.conf
相关阅读:
花一分钟体验 Apache DolphinScheduler 第一个官方 Docker 镜像
本文分享自微信公众号 - 海豚调度(dolphin-scheduler)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与 “OSC 源创计划”,欢迎正在阅读的你也加入,一起分享。
Apache DolphinScheduler & Doris 联合Meetup
主题 Apache DolphinScheduler & Doris 联合Meetup
活动介绍
2020年,大数据成为国家基建的一个重要组成,大数据在越来越多的领域展现威力,越来越多的公司选择拥抱大数据。在这种背景下,必然绕不开的一个话题就是apache基金会,apache旗下拥有广泛被使用的开源软件,中国本土开源也展露头角,本次联合2个Apache大数据项目的用户以及爱好者一起分享开源技术,一起为中国本土开源献力
Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非常简洁,易于运维,并且可以支持10PB以上的超大数据集。
Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。
活动时间
沙龙时间:2020-07-25 14:00
面向人群:对开源技术感兴趣的小伙伴均可参与
议程安排
14:00 - 14:40 Introduction of Doris core features - pre-aggregation engine and materialized view
《Doris核心功能介绍--预聚合引擎和物化视图》 缪翎,百度研发工程师,Doris PPMC
14:40 - 15:10 Distributed task management platform, making job submit easier
《分布式作业管理平台,让作业提交变得更简单》 李杰,奇安信大数据研发工程师,主要参与DolphinScheduler和Flink的开发与维护
15:10 - 15:50 Doris global dictionary design and implementation based on hive table
《Doris基于hive表的全局字典设计与实现 》 王博,美团点评数据开发工程师,主要参与Doris和Kylin的开发与维护
15:50 - 16:30 DolphinScheduler architecture evolution journey
《DolphinScheduler架构演进之旅》 乔占卫,易观大数据平台技术专家,DolphinScheduler PPMC
Apache DolphinScheduler & Doris 联合线上 Meetup
01
—
活动介绍
2020年,大数据成为国家基建的一个重要组成,大数据在越来越多的领域展现威力。随着大数据的应用场景越来越多,大家对数据的响应速度和数据加工工作流的方便程度也提出了更高的要求。在这种背景下,相信做过大数据的技术小伙伴应该对 Apache 一词不会陌生,Apache 基金会旗下拥有被广泛使用的众多开源软件,本次特地邀请到 2 个本土的 Apache 大数据应用项目的开发者来一起分享解决数据响应速度和数据工作流任务调度方面的开源技术,一起为中国开源献力。
Apache Doris(Incubating)是一个现代化的 MPP 分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris 的分布式架构非常简洁,易于运维,并且可以支持 10PB 以上的超大数据集。
Apache DolphinScheduler(Incubating) 是一个分布式去中心化,易扩展的可视化工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在大数据处理流程中开箱即用。
02
—
活动时间
时间:2020-07-25 14:00
面向人群:对开源技术感兴趣的小伙伴均可参与
03
—
议程安排
14:00 - 14:40 Introduction of Doris core features - pre-aggregation engine and materialized view
《Doris核心功能介绍--预聚合引擎和物化视图》 缪翎,百度研发工程师,Doris PPMC
14:40 - 15:10 Distributed task management platform, making job submit easier
《分布式作业管理平台,让作业提交变得更简单》 李杰,奇安信大数据研发工程师,主要参与DolphinScheduler和Flink的开发与维护
15:10 - 15:50 Doris global dictionary design and implementation based on hive table
《Doris基于hive表的全局字典设计与实现 》 王博,美团点评数据开发工程师,主要参与Doris和Kylin的开发与维护
15:50 - 16:30 DolphinScheduler architecture evolution journey
《DolphinScheduler架构演进之旅》 乔占卫,易观大数据平台技术专家,DolphinScheduler PPMC
Free disscussion
非常欢迎对本次活动感兴趣的伙伴扫描图中二维码进行报名,非常期待大家的参与!
04
—
关于 ALC Beijing
作为全球最大开源消费国, Apache 软件基金会(ASF)在国内有广泛的群众基础,如何将这些开源项目用户发展转换成为社区的贡献者、开发者, 甚至成为开源项目的发起者、维护者是一个值得深思的问题。
基于对这个问题的思考,我们创建了ALC-Beijing(Apache Local Community-Beijing),并且致力于通过(但不限于)下述行动帮助开源爱好者更好的在 Apache 社区生根发芽:
举办线上和线下沙龙,将本地的开发与用户聚焦在一起。
通过分享开源开发经验,鼓励更多的人参与到 ASF 的项目开发中来。
为 ASF 的项目寻找相互合作的机会,让这些项目能够更加茁壮的成长。
介绍 ASF 管理和运作开源项目的成功之道,帮助大家更好地运作开源项目。

开源社简介
开源社是由国内外支持开源的企业,社区及个人,依“贡献,共识,共治”原则,所组织的厂商中立、纯志愿者、非营利的开源联盟,旨在共创健康可持续发展的开源生态体系,并推动中国开源社区成为全球开源软件的积极参与及贡献者。我们专注于开源治理、国际接轨、社区发展和开源项目。
相关阅读 | Related Reading
项目开源一年多就从 ASF 毕业,开发者可以从中学到什么
开源社媒体组招募 | 找暑期实习的小伙伴看过来
暑期2020“大咖说开源”之吴雪 | 开源的商业创新
关于在开源社区中的“工作倦怠”,你所需要知道的事
