如果您想了解花一分钟体验ApacheDolphinScheduler第一个官方Docker镜像的相关知识,那么本文是一篇不可错过的文章,我们将对docker镜像官网进行全面详尽的解释,并且为您提供关于
如果您想了解花一分钟体验 Apache DolphinScheduler 第一个官方 Docker 镜像的相关知识,那么本文是一篇不可错过的文章,我们将对docker镜像官网进行全面详尽的解释,并且为您提供关于Apache DolphinScheduler & Doris 联合Meetup、Apache DolphinScheduler & Doris 联合线上 Meetup、Apache DolphinScheduler 1.2.1 发布说明、Apache DolphinScheduler 1.3.2 发布,性能提升 2~3 倍的有价值的信息。
本文目录一览:- 花一分钟体验 Apache DolphinScheduler 第一个官方 Docker 镜像(docker镜像官网)
- Apache DolphinScheduler & Doris 联合Meetup
- Apache DolphinScheduler & Doris 联合线上 Meetup
- Apache DolphinScheduler 1.2.1 发布说明
- Apache DolphinScheduler 1.3.2 发布,性能提升 2~3 倍
花一分钟体验 Apache DolphinScheduler 第一个官方 Docker 镜像(docker镜像官网)
先前 Apache DolphinScheduler 社区一直是发布 Dockerfile 和 K8s Chart.yaml 文件,由用户自行 build 镜像。随着越来越多的用户伙伴们的呼声高涨,社区于近日终于发布了第一个官方 Docker 镜像。
快速试用 DolphinScheduler
有 2 种方式可以快速试用 DolphinScheduler,分别进行介绍
一、以 docker-compose 的方式启动 (推荐)
这种方式需要先安装 docker-compose , docker-compose 的安装网上已经有非常多的资料,请自行安装即可
1、下载源码 zip 包
请下载最新版本的源码包并进行解压
# 创建源码存放目录
mkdir -p /opt/soft/dolphinscheduler;
cd /opt/soft/dolphinscheduler;
# 下载源码包
wget https://mirrors.tuna.tsinghua.edu.cn/apache/incubator/dolphinscheduler/1.3.4/apache-dolphinscheduler-incubating-1.3.4-src.zip
# 解压缩
tar -zxvf apache-dolphinscheduler-incubating-1.3.4-src.zip
mv apache-dolphinscheduler-incubating-1.3.4-src-release dolphinscheduler-src
2、安装并启动服务
cd dolphinscheduler-src
docker-compose -f ./docker/docker-swarm/docker-compose.yml up -d
3、登录系统
访问前端界面:http://192.168.xx.xx:8888
然后参考用户手册章节的快速上手
即可进行使用
至此就可以体验 DolphinScheduler 的所有功能啦,怎么样?是不是超级简单。
当然如果您想了解更多的安装方式,下面介绍第 2 种方式
二、以 docker 方式启动
这种方式需要先安装 docker , docker 的安装网上已经有非常多的资料,请自行安装即可
1、基础软件安装 (请自行安装)
PostgreSQL (8.2.15+)
ZooKeeper (3.4.6+)
Docker
2、请登录 PostgreSQL 数据库,创建名为 dolphinscheduler
数据库
3、初始化数据库,导入 sql/dolphinscheduler-postgre.sql
进行创建表及基础数据导入
4、下载 DolphinScheduler 镜像
我们已将面向用户的 DolphinScheduler 镜像上传至 docker 仓库,用户无需在本地构建镜像,直接执行以下命令从 docker 仓库 pull 镜像:
docker pull apache/dolphinscheduler:latest
5、运行一个 DolphinScheduler 实例
如下:(注: {user} 和 {password} 需要替换为具体的数据库用户名和密码)
$ docker run -dit --name dolphinscheduler \
-e ZOOKEEPER_QUORUM="l92.168.x.x:2181"
-e DATABASE_HOST="192.168.x.x" -e DATABASE_PORT="5432" -e DATABASE_DATABASE="dolphinscheduler" \
-e DATABASE_USERNAME="{user}" -e DATABASE_PASSWORD="{password}" \
-p 8888:8888 \
dolphinscheduler all
然后登录系统
访问前端页面地址,接口 ip (自行修改) http://192.168.xx.xx:8888
然后参考用户手册章节的
快速上手
即可进行使用
附录
在容器启动时,会自动启动以下服务:
MasterServer ----- master服务
WorkerServer ----- worker服务
LoggerServer ----- logger服务
ApiApplicationServer ----- api服务
AlertServer ----- alert服务
如果你只是想运行 dolphinscheduler 中的部分服务
你能够运行 dolphinscheduler 中的部分服务。
启动一个 master server, 如下:
$ docker run -dit --name dolphinscheduler \
-e ZOOKEEPER_QUORUM="l92.168.x.x:2181"
-e DATABASE_HOST="192.168.x.x" -e DATABASE_PORT="5432" -e DATABASE_DATABASE="dolphinscheduler" \
-e DATABASE_USERNAME="test" -e DATABASE_PASSWORD="test" \
dolphinscheduler master-server
启动一个 worker server, 如下:
$ docker run -dit --name dolphinscheduler \
-e ZOOKEEPER_QUORUM="l92.168.x.x:2181"
-e DATABASE_HOST="192.168.x.x" -e DATABASE_PORT="5432" -e DATABASE_DATABASE="dolphinscheduler" \
-e DATABASE_USERNAME="test" -e DATABASE_PASSWORD="test" \
dolphinscheduler worker-server
启动一个 api server, 如下:
$ docker run -dit --name dolphinscheduler \
-e DATABASE_HOST="192.168.x.x" -e DATABASE_PORT="5432" -e DATABASE_DATABASE="dolphinscheduler" \
-e DATABASE_USERNAME="test" -e DATABASE_PASSWORD="test" \
-p 12345:12345 \
dolphinscheduler api-server
启动一个 alert server, 如下:
$ docker run -dit --name dolphinscheduler \
-e DATABASE_HOST="192.168.x.x" -e DATABASE_PORT="5432" -e DATABASE_DATABASE="dolphinscheduler" \
-e DATABASE_USERNAME="test" -e DATABASE_PASSWORD="test" \
dolphinscheduler alert-server
启动一个 frontend, 如下:
$ docker run -dit --name dolphinscheduler \
-e FRONTEND_API_SERVER_HOST="192.168.x.x" -e FRONTEND_API_SERVER_PORT="12345" \
-p 8888:8888 \
dolphinscheduler frontend
注意: 当你运行 dolphinscheduler 中的部分服务时,你必须指定这些环境变量 DATABASE_HOST
DATABASE_PORT
DATABASE_DATABASE
DATABASE_USERNAME
DATABASE_PASSWORD
ZOOKEEPER_QUORUM
。
1
新一代大数据任务调度 - Apache DolphinScheduler 继 11 月 19 日由 InfoQ 举办、在 300+ 参评项目中脱颖而出获得 “2020 年度十大开源新锐项目” 和 “2020 年度最具人气新锐项目” 以来,近期社区又荣获 OSCHINA 年度 “最佳技术团队” 称号,非常欢迎更多小伙伴加入到贡献队伍中来,为中国的开源崛起贡献自己的一份力量。
Apache DolphinScheduler(incubator) 于 17 年在易观数科立项, 19 年 3 月开源,8 月进入 Apache 孵化器, 据不完全统计,已有 400+ 公司在生产上使用。DolphinScheduler 致力于 “简化大数据任务之间错综复杂的依赖关系,并监控整个数据处理流程”。DolphinScheduler 以 DAG(有向无环图) 的方式将 Task 组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill 任务等操作。DolphinScheduler 专注于以下 6 个主要能力
Apache 组织崇尚 “社区大于代码”,DolphinScheduler 目前微信用户群近 4000 人,社区目前有 200 + 贡献者,来自 80+ 家公司、机构和高校 (部分统计)
2
据不完全统计,目前已经有 400 + 家公司及机构采用 DolphinScheduler 在生产环境使用,以下是部分案例 (排名不分先后)
此外,还有 1700+ 用户注册了 demo 试用,欢迎大家先体验,十分欢迎对比哈。
3
随着国内开源的崛起,DolphinScheduler 迎来了蓬勃发展,为了做更好用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量
参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:
贡献第一个 PR(文档、代码) 我们也希望是简单的,第一个 PR 用于熟悉提交的流程和社区协作以及感受社区的友好度
社区汇总了以下适合新手的问题列表:https://github.com/apache/incubator-dolphinscheduler/issues/4124
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/docs/development/contribute.html
文档 github 地址:https://github.com/apache/incubator-dolphinscheduler-website
来吧,DolphinScheduler 开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的
如果您想参与贡献,却发现上述方法都搞不明白,也没关系,我们有个开发者种子孵化群,可以添加微信 (easyworkflow) 手把手教会您,添加时请说明想参与贡献哈
本文分享自微信公众号 - 海豚调度(dolphin-scheduler)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与 “OSC 源创计划”,欢迎正在阅读的你也加入,一起分享。
Apache DolphinScheduler & Doris 联合Meetup
主题 Apache DolphinScheduler & Doris 联合Meetup
活动介绍
2020年,大数据成为国家基建的一个重要组成,大数据在越来越多的领域展现威力,越来越多的公司选择拥抱大数据。在这种背景下,必然绕不开的一个话题就是apache基金会,apache旗下拥有广泛被使用的开源软件,中国本土开源也展露头角,本次联合2个Apache大数据项目的用户以及爱好者一起分享开源技术,一起为中国本土开源献力
Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非常简洁,易于运维,并且可以支持10PB以上的超大数据集。
Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。
活动时间
沙龙时间:2020-07-25 14:00
面向人群:对开源技术感兴趣的小伙伴均可参与
议程安排
14:00 - 14:40 Introduction of Doris core features - pre-aggregation engine and materialized view
《Doris核心功能介绍--预聚合引擎和物化视图》 缪翎,百度研发工程师,Doris PPMC
14:40 - 15:10 Distributed task management platform, making job submit easier
《分布式作业管理平台,让作业提交变得更简单》 李杰,奇安信大数据研发工程师,主要参与DolphinScheduler和Flink的开发与维护
15:10 - 15:50 Doris global dictionary design and implementation based on hive table
《Doris基于hive表的全局字典设计与实现 》 王博,美团点评数据开发工程师,主要参与Doris和Kylin的开发与维护
15:50 - 16:30 DolphinScheduler architecture evolution journey
《DolphinScheduler架构演进之旅》 乔占卫,易观大数据平台技术专家,DolphinScheduler PPMC
Apache DolphinScheduler & Doris 联合线上 Meetup
01
—
活动介绍
2020年,大数据成为国家基建的一个重要组成,大数据在越来越多的领域展现威力。随着大数据的应用场景越来越多,大家对数据的响应速度和数据加工工作流的方便程度也提出了更高的要求。在这种背景下,相信做过大数据的技术小伙伴应该对 Apache 一词不会陌生,Apache 基金会旗下拥有被广泛使用的众多开源软件,本次特地邀请到 2 个本土的 Apache 大数据应用项目的开发者来一起分享解决数据响应速度和数据工作流任务调度方面的开源技术,一起为中国开源献力。
Apache Doris(Incubating)是一个现代化的 MPP 分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris 的分布式架构非常简洁,易于运维,并且可以支持 10PB 以上的超大数据集。
Apache DolphinScheduler(Incubating) 是一个分布式去中心化,易扩展的可视化工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在大数据处理流程中开箱即用。
02
—
活动时间
时间:2020-07-25 14:00
面向人群:对开源技术感兴趣的小伙伴均可参与
03
—
议程安排
14:00 - 14:40 Introduction of Doris core features - pre-aggregation engine and materialized view
《Doris核心功能介绍--预聚合引擎和物化视图》 缪翎,百度研发工程师,Doris PPMC
14:40 - 15:10 Distributed task management platform, making job submit easier
《分布式作业管理平台,让作业提交变得更简单》 李杰,奇安信大数据研发工程师,主要参与DolphinScheduler和Flink的开发与维护
15:10 - 15:50 Doris global dictionary design and implementation based on hive table
《Doris基于hive表的全局字典设计与实现 》 王博,美团点评数据开发工程师,主要参与Doris和Kylin的开发与维护
15:50 - 16:30 DolphinScheduler architecture evolution journey
《DolphinScheduler架构演进之旅》 乔占卫,易观大数据平台技术专家,DolphinScheduler PPMC
Free disscussion
非常欢迎对本次活动感兴趣的伙伴扫描图中二维码进行报名,非常期待大家的参与!
04
—
关于 ALC Beijing
作为全球最大开源消费国, Apache 软件基金会(ASF)在国内有广泛的群众基础,如何将这些开源项目用户发展转换成为社区的贡献者、开发者, 甚至成为开源项目的发起者、维护者是一个值得深思的问题。
基于对这个问题的思考,我们创建了ALC-Beijing(Apache Local Community-Beijing),并且致力于通过(但不限于)下述行动帮助开源爱好者更好的在 Apache 社区生根发芽:
举办线上和线下沙龙,将本地的开发与用户聚焦在一起。
通过分享开源开发经验,鼓励更多的人参与到 ASF 的项目开发中来。
为 ASF 的项目寻找相互合作的机会,让这些项目能够更加茁壮的成长。
介绍 ASF 管理和运作开源项目的成功之道,帮助大家更好地运作开源项目。

开源社简介
开源社是由国内外支持开源的企业,社区及个人,依“贡献,共识,共治”原则,所组织的厂商中立、纯志愿者、非营利的开源联盟,旨在共创健康可持续发展的开源生态体系,并推动中国开源社区成为全球开源软件的积极参与及贡献者。我们专注于开源治理、国际接轨、社区发展和开源项目。
相关阅读 | Related Reading
项目开源一年多就从 ASF 毕业,开发者可以从中学到什么
开源社媒体组招募 | 找暑期实习的小伙伴看过来
暑期2020“大咖说开源”之吴雪 | 开源的商业创新
关于在开源社区中的“工作倦怠”,你所需要知道的事
