巧用 Docker Compose 管理 GPU 资源（docker 使用gpu）

25-02-26 12

对于巧用DockerCompose管理GPU资源感兴趣的读者，本文将会是一篇不错的选择，我们将详细介绍docker使用gpu，并为您提供关于25.dockercompose简介和docker-comp

对于巧用 Docker Compose 管理 GPU 资源感兴趣的读者，本文将会是一篇不错的选择，我们将详细介绍docker 使用gpu，并为您提供关于25.docker compose 简介和 docker-compose.yml 参数介绍、centos7+docker 安装和部署 crawlab 分布式爬虫平台，并使用 docker-compose 管理 docker、Centos上安装Docker管理器Docker Compose、Docker Compose 和 Docker Swarm 和 Docker Service的有用信息。

本文目录一览：

巧用 Docker Compose 管理 GPU 资源（docker 使用gpu）
25.docker compose 简介和 docker-compose.yml 参数介绍
centos7+docker 安装和部署 crawlab 分布式爬虫平台，并使用 docker-compose 管理 docker
Centos上安装Docker管理器Docker Compose
Docker Compose 和 Docker Swarm 和 Docker Service

巧用 Docker Compose 管理 GPU 资源（docker 使用gpu）

在容器中使用 GPU 一直是使用 Compose 的一个痛点！

在面向 AI 开发的大趋势下，容器化可以将环境无缝迁移，将配置环境的成本无限降低。但是，在容器中配置 CUDA 并运行 TensorFlow 一段时间内确实是个比较麻烦的时候，所以我们这里就介绍和使用它。

Enabling GPU access with Compose
Runtime options with Memory, CPUs, and GPUs
The Compose Specification
The Compose Specification - Deployment support
The Compose Specification - Build support

在 Compose 中使用 GPU 资源

如果我们部署 Docker 服务的的主机上正确安装并设置了其对应配置，且该主机上恰恰也有对应的 GPU 显卡，那么就可以在 Compose 中来定义和设置这些 GPU 显卡了。

# 需要安装的配置
$ apt-get install nvidia-container-runtime

旧版本 <= 19.03

# runtime
$ docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi

新版本 >= 19.03

# with --gpus
$ docker run -it --rm --gpus all ubuntu nvidia-smi

# use device
$ docker run -it --rm --gpus \
    device=GPU-3a23c669-1f69-c64e-cf85-44e9b07e7a2a \
    ubuntu nvidia-smi

# specific gpu
$ docker run -it --rm --gpus ''"device=0,2"'' ubuntu nvidia-smi

# set nvidia capabilities
$ docker run --gpus ''all,capabilities=utility'' --rm ubuntu nvidia-smi

对应 Compose 工具的老版本 (v2.3) 配置文件来说的话，想要在部署的服务当中使用 GPU 显卡资源的话，就必须使用 runtime 参数来进行配置才可以。虽然可以作为运行时为容器提供 GPU 的访问和使用，但是在该模式下并不允许对 GPU 设备的特定属性进行控制。

services:
  test:
    image: nvidia/cuda:10.2-base
    command: nvidia-smi
    runtime: nvidia
    environment:
      - NVIDIA_VISIBLE_DEVICES=all

在 Compose v1.28.0+ 的版本中，使用 Compose Specification 的配置文件写法，并提供了一些可以更细粒度的控制 GPU 资源的配置属性可被使用，因此可以在启动的时候来精确表达我们的需求。咳咳咳，那这里我们就一起看看吧！

capabilities - 必须字段
- 指定需要支持的功能；可以配置多个不同功能；必须配置的字段
- man 7 capabilities

deploy:
  resources:
    reservations:
      devices:
        - capabilities: ["gpu"]

count
- 指定需要使用的 GPU 数量；值为 int 类型；与 device_ids 字段二选一

deploy:
  resources:
    reservations:
      devices:
        - capabilities: ["tpu"]
          count: 2

device_ids
- 指定使用 GPU 设备 ID 值；与 count 字段二选一

deploy:
  resources:
    reservations:
      devices:
        - capabilities: ["gpu"]
          device_ids: ["0", "3"]

deploy:
  resources:
    reservations:
      devices:
        - capabilities: ["gpu"]
          device_ids: ["GPU-f123d1c9-26bb-df9b-1c23-4a731f61d8c7"]

driver
- 指定 GPU 设备驱动类型

deploy:
  resources:
    reservations:
      devices:
        - capabilities: ["nvidia-compute"]
          driver: nvidia

options
- 指定驱动程序的特定选项

deploy:
  resources:
    reservations:
      devices:
        - capabilities: ["gpu"]
          driver: gpuvendor
          options:
            virtualization: false

咳咳咳，看也看了，说也说了，那我们就简单的编写一个示例文件，让启动的 cuda 容器服务来使用一个 GPU 设备资源，并运行得到如下输出。

services:
  test:
    image: nvidia/cuda:10.2-base
    command: nvidia-smi
    deploy:
      restart_policy:
        condition: on-failure
        delay: 5s
        max_attempts: 3
        window: 120s
      resources:
        limits:
          cpus: "0.50"
          memory: 50M
        reservations:
          cpus: "0.25"
          memory: 20M
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu, utility]
      update_config:
        parallelism: 2
        delay: 10s
        order: stop-first

注意这里，如果设置 count: 2 的话，就会下面的输出中看到两块显卡设置的信息。如果，我们这里均未设置 count 或 device_ids 字段的话，则默认情况下将主机上所有 GPU 一同使用。

# 前台直接运行
$ docker-compose up
Creating network "gpu_default" with the default driver
Creating gpu_test_1 ... done
Attaching to gpu_test_1
test_1  | +-----------------------------------------------------------------------------+
test_1  | | NVIDIA-SMI 450.80.02    Driver Version: 450.80.02    CUDA Version: 11.1     |
test_1  | |-------------------------------+----------------------+----------------------+
test_1  | | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
test_1  | | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
test_1  | |                               |                      |               MIG M. |
test_1  | |===============================+======================+======================|
test_1  | |     Tesla T4            On   | 00000000:00:1E.0 Off |                     |
test_1  | | N/A   23C    P8     9W /  70W |      MiB / 15109MiB |      %      Default |
test_1  | |                               |                      |                  N/A |
test_1  | +-------------------------------+----------------------+----------------------+
test_1  |
test_1  | +-----------------------------------------------------------------------------+
test_1  | | Processes:                                                                  |
test_1  | |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
test_1  | |        ID   ID                                                   Usage      |
test_1  | |=============================================================================|
test_1  | |  No running processes found                                                 |
test_1  | +-----------------------------------------------------------------------------+
gpu_test_1 exited with code

当然，如果设置了 count 或 device_ids 字段的话，就可以在容器里面的程序中使用多块显卡资源了。可以通过以下部署配置文件来进行验证和使用。

services:
  test:
    image: tensorflow/tensorflow:latest-gpu
    command: python -c "import tensorflow as tf;tf.test.gpu_device_name()"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              device_ids: ["0", "3"]
              capabilities: [gpu]

运行结果，如下所示，我们可以看到两块显卡均可以被使用到。

# 前台直接运行
$ docker-compose up
...
Created TensorFlow device (/device:GPU:0 with 13970 MB memory -> physical GPU (device: 0, name: Tesla T4, pci bus id: 0000:00:1b.0, compute capability: 7.5)
...
Created TensorFlow device (/device:GPU:1 with 13970 MB memory) -> physical GPU (device: 1, name: Tesla T4, pci bus id: 0000:00:1e.0, compute capability: 7.5)
...
gpu_test_1 exited with code

本文转载自：「开源世界」，原文：http://ym.baisou.ltd/?id=499 ，版权归原作者所有。

巧用 Docker Compose 管理 GPU 资源新闻第1张

巧用 Docker Compose 管理 GPU 资源新闻第2张

25.docker compose 简介和 docker-compose.yml 参数介绍

1. docker compose概念　　文档 https://docs.docker.com/compose/compose-file/compose-versioning

　　一个基于 docker 的工具

　　可以通过一个 yml 文件定义多容器的 docker 应用

　　通过一条命令就可以根据 yml 文件的定义去创建或者管理这多个容器

2 docker compose 版本 2 与版本 3 的区别

　　最大的区别

　　　　version 2 只能用于单机

　　　　version 3 可用于多机

3. docker-compose.yml

　　　　Services

　　　　　　一个 service 代表一个 container , 这个 container 可以从 dockerhub 的 image 来创建，或者从本地的 Dockerfile build出来的image 来创建

　　　　　　service 的启动类似与 docker run ，我们可以给其指定 network 和 volume . 所以可以给 service 指定 network 和 volume 的引用

　　　　　　eg :

　　　　　　docker run -d --name db -v db-data:/var/liv/postgresql/data --network back-tier postgres:9.4

　　　　　　services:

　　　　　　　　db:　　　　　　　　　　　　　　　　#service 的名称为 db

　　　　　　　　　　image: postgres:9.4　　　　　　#service image 为 postgres:9.4 这是从远程拉取的

　　　　　　　　　　volumes:

　　　　　　　　　　　　- "db-data:/var/liv/postgresql/data"　　#将外部db-data挂载到container 的 /var/liv/postgresql/data 内

　　　　　　　　　　networks:

　　　　　　　　　　　　- back-tier　　　　　　　　#网络为 back-tier

　　　　　　eg2:

　　　　　　docker run -d --link db --link redis --network back-tier worker

　　　　　　services:

　　　　　　　　worker:

　　　　　　　　　　build: ./worker

　　　　　　　　　　links:

　　　　　　　　　　　　- db

　　　　　　　　　　　　- redis

　　　　　　　　　　networks:

　　　　　　　　　　　　- back-tier　　　　　　　　#在同一个网络上不需要links

　　　　Volumes:

　　　　　　上面的

　　　　　　volumes:

　　　　　　　- "db-data:/var/liv/postgresql/data"　　#将外部db-data挂载到container 的 /var/liv/postgresql/data 内

　　　　　　会有单独的一个 volumes (与 services 同级别) 对db-data 进行阐述

　　　　　　类似于 docker volume create db-data

　　　　　　eg:

　　　　　　volumes:

　　　　　　　　db-data:

　　　　Nerworks:

　　　　　　上面的

　　　　　　networks:

　　　　　　　　- back-tier　　　　　　　　#在同一个网络上不需要links

　　　　　　会有单独的一个 networks (与 services 同级别) 对back-tier 进行阐述

　　　　　　类似于 docker nerwork create -d bridge back-tier

　　　　　　networks:

　　　　　　　　front-tier:

　　　　　　　　　　driver: bridge

　　　　　　　　back-tier:

　　　　　　　　　　driver: bridge

4编写 docker-compose.yml

# docker compose api 版本

version: ''3''

services:

# 定义了两个 service 分别是名字分别是 wordpress 和 mysql

wordpress:

#image 为 word press

image: wordpress

#本地 8888 端口映射容器 80 端口

ports:

- 8888:80

#wordpress 连接数据库的 host 为 mysql , passwword 为 root 类似于 -e

environment:

WORDPRESS_DB_HOST: mysql

WORDPRESS_DB_PASSWORD: root

#指定连接的网络为 my-bridge

networks:

- my-bridge

mysql:

image: mysql:5.7.27

# 数据库 root 的连接密码和所使用的数据库名称

environment:

MYSQL_ROOT_PASSWORD: root

MYSQL_DATABASE: wordpress

# 外部 mysql-data 挂载到容器内的 /var/lib/mysql

volumes:

- mysql-data:/var/lib/mysql

#指定连接的网络为 my-bridge

networks:

- my-bridge

# 定义 volumes

volumes:

mysql-data:

# 定义 networks

networks:

my-bridge:

driver: bridge

centos7+docker 安装和部署 crawlab 分布式爬虫平台，并使用 docker-compose 管理 docker

1. 先决条件 centos7+docker 最新版本

 sudo yum updat

2. 配置一下镜像源，创建 /etc/docker/daemon.conf 文件，在其中输入如下内容

{
 "registry-mirrors": ["https://registry.docker-cn.com"]
}

3. 启动 docker 命令:

systemctl start docker

重启 docker 服务：

service docker restart

4. 查看和下载 Crawlab 的镜像命令：

docker search crawlab                   #（查找Crawlab镜像）

docker pull tikazyq/crawlab:latest       #（下载Crawlab镜像）

5. 创建 docker 组：

sudo groupadd docker    （删除docker这个用户：userdel -r docker）

6.centos7 查看所有用户：

cut -d : -f 1 /etc/group

7. 将您的用户添加到该 docker 用户组，命令：

sudo usermod -aG docker 用户名

8. 查看 “docker” 组下的所有用户，命令：

  grep ''docker'' /etc/group

9.Docker Compose 安装

sudo curl -L "https://github.com/docker/compose/releases/download/1.24.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

稍等片刻，有点慢！！！！

赋权:

sudo chmod +x /usr/local/bin/docker-compose

查看版本:

docker-compose --version

10. 查找 docker-compose.yml 文件位置:

find / -name "docker-compose.yml*"

(会出现 find: ‘/run/user/1000/gvfs’: 权限不够，执行：umount /run/user/1000/gvfs 和 rm -rf /run/user/1000/gvfs, 再执行就不会出错了！！！

11. 图中：

/var/lib/docker/overlay2/50df4de9bf340501cade27650953ad983948b10e13bbe931710ef090ab1a4602/diff/app/docker-compose.yml-----------是我的路径

cd 到 app 目录就可以了

vim docker-compose.yml   #编辑

注意：新版镜像的 CRAWLAB_API_ADDRESS 是这样的： CRAWLAB_API_ADDRESS: "http://192.168.157.128:8000"

12. 启动 Crawlab

cd 进入到 docker-compose.yml 所在文件目录下

才能运行：docker-compose up 集群启动容器，否则找不到文件

查看 woker 容器日志命令：docker-compose logs worker

正常会启动四个容器：master、woker、redis、mongo

第一次次启动会下载安装并配置节点和数据库（redis 和 mongodb）

13.Crawlab

浏览器访问：http://ip:8080 用户名密码是 admin/admin

第一次访问没问题，但是第二次启动会报各种错，博主正在研究中 ----- 持续更新中！！！

Centos上安装Docker管理器Docker Compose

参照官方文档，进行了简单理解并照其所说进行了centos上的部署。 #1 前提# ##1.1 系统要求## 64位的CentOS 7 ##1.2 移除非官方的docker包##

sudo yum -y remove docker docker-common container-selinux

避免与官方的docker-engine冲突，所以同样的移除docker-selinux

sudo yum -y remove docker-selinux

#2 安装Docker# ##2.1 用repo安装## ###2.2.1 安装yum-utils### yum-utils提供了yum-config-manager组件。

sudo yum install -y yum-utils

###2.2.2 获取稳定版repo###

sudo yum-config-manager \
    --add-repo \
    https://download.docker.com/linux/centos/docker-ce.repo

###2.2.3 配置testing仓库(可选)###

sudo yum-config-manager --enable docker-testing

也可以用--disable来关闭

sudo yum-config-manager --disable docker-testing

##2.2 安装Docker## ###2.2.1 更新yum资源索引###

sudo yum makecache fast

###2.2.2 安装Docker### 安装最新版Docker

sudo yum -y install docker-ce

或者用下列命令安装之前版本的docker

yum list docker-engine.x86_64  --showduplicates |sort -r

根据常看的版本信息，用下面命令来指定版本

sudo yum -y install docker-engine-<VERSION_STRING>

###2.2.3 启动Docker###

sudo systemctl start docker

###2.2.4 确认完成###

sudo docker run hello-world

这里用hello-world项目来验证完成，如果出现下面信息则成功：

Hello from Docker!
This message shows that your installation appears to be working correctly.

To generate this message,Docker took the following steps:
 1. The Docker client contacted the Docker daemon.
 2. The Docker daemon pulled the "hello-world" image from the Docker Hub.
 3. The Docker daemon created a new container from that image which runs the
    executable that produces the output you are currently reading.
 4. The Docker daemon streamed that output to the Docker client,which sent it
    to your terminal.

To try something more ambitIoUs,you can run an Ubuntu container with:
 $ docker run -it ubuntu bash

Share images,automate workflows,and more with a free Docker ID:
 https://cloud.docker.com/

For more examples and ideas,visit:
 https://docs.docker.com/engine/userguide/

#3 安装Docker Compose# Docker工具箱同时提供了Engine和Compose，不过本人所用CentOS 7，所以就继续下面流程: ##3.1 下载Docker Compose## 使用curl下载compose，并赋予可执行权限：

curl -L https://github.com/docker/compose/releases/download/1.11.1/docker-compose-`uname -s`-`uname -m` > /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose

也可以用python pip来安装：

pip install -U docker-compose

##3.2 测试##

docker-compose --version

#3 Docker Compose使用# ##3.1 编写项目代码## 1.先创建一个目录，作为项目目录。

mkdir composetest
cd composetest

2.创建app.py：

from flask import Flask
from redis import Redis

app = Flask(__name__)
redis = Redis(host='redis',port=6379)

@app.route('/')
def hello():
    count = redis.incr('hits')
    return 'Hello World! I have been seen {} times.\n'.format(count)

if __name__ == "__main__":
    app.run(host="0.0.0.0",debug=True)

3.再创建一个叫做requirements.txt的文件，内容如下：

flask
redis

##3.2 编写Dockerfile##

FROM python:3.4-alpine
ADD . /code
workdir /code
RUN pip install -r requirements.txt
CMD ["python","app.py"]

##3.3 编写Compose配置文件## 在当前目录下创建docker-compose.yml，内容如下：

version: '2'
services:
  web:
    build: .
    ports:
     - "5000:5000"
    volumes:
     - .:/code
  redis:
    image: "redis:alpine"

##3.4 启动Docker Compose## 在项目目录下，用下面命令启动Docker Compose：

docker-compose up

然后就可以用浏览器访问 http://localhost:5000 来查看了，出现下面信息即为成功。

Hello World! I have been seen 1 times.

##3.5 更新应用## 修改app.py，将返回修改为：

return 'Hello from Docker! I have been seen {} times.\n'.format(count)

刷新浏览器，即可看到

Hello from Docker! I have been seen 2 times.

##3.6 Docker Compose其他命令## 1.后台运行

docker-compose up -d

2.列举后台已启动容器

docker-compose ps

3.启动已关闭的服务

docker-compose run web env

4.关闭启动的服务

docker-compose stop

5.彻底关闭服务并移除容器，--volumes 清理Redis容器产生的数据量

docker-compose down --volumes

Docker Compose 和 Docker Swarm 和 Docker Service

Docker Compose

介绍

通过yml文件配置，高效管理多个docker，启停

中文文档

https://www.jb51.cc/manual/view/36129.html

安装

# 慢
$ sudo curl -L "https://github.com/docker/compose/releases/download/1.27.4/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
# 国内镜像
$ sudo curl -L https://get.daocloud.io/docker/compose/releases/download/1.24.0/docker-compose-`uname -s`-`uname -m` > /usr/local/bin/docker-compose

授权文件

$ sudo chmod +x /usr/local/bin/docker-compose

测试

$ docker-compose --version
docker-compose version 1.27.4, build 1110ad01

卸载

sudo rm /usr/local/bin/docker-compose

测试使用（官方给的）

1创建文件夹

$ mkdir composetest
$ cd composetest

2写测试程序Python。app.py

import time

import redis
from flask import Flask

app = Flask(__name__)
cache = redis.Redis(host='redis', port=6379)

def get_hit_count():
    retries = 5
    while True:
        try:
            return cache.incr('hits')
        except redis.exceptions.ConnectionError as exc:
            if retries == 0:
                raise exc
            retries -= 1
            time.sleep(0.5)

@app.route('/')
def hello():
    count = get_hit_count()
    return 'Hello World! I have been seen {} times.\n'.format(count)

3创建py文件依赖文件requirements.txt

flask
redis

4创建Dockerfile文件

FROM python:3.7-alpine
workdir /code
ENV FLASK_APP=app.py
ENV FLASK_RUN_HOST=0.0.0.0
RUN apk add --no-cache gcc musl-dev linux-headers
copY requirements.txt requirements.txt
RUN pip install -r requirements.txt
EXPOSE 5000
copY . .
CMD ["flask", "run"]

5创建docker-compose.yml

# version: "3.9" 需要版本对应
version: "3"
services:
  web:
    build: .
    ports:
      - "5000:5000"
  redis:
    image: "redis:alpine"

6使用Compose构建并运行应用程序

docker-compose up
# 后台运行
# docker-compose up -d

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-87feppxX-1608950922543)(C:\Users\admin\AppData\Local\Temp\1608866566146.png)]

docker images 自动下载依赖镜像
默认服务名: 文件名 _ 服务名 _ num(集群副本数量)
创建docker compose自己默认网络，并将所有启动的容器添加到网络中
在同一网络下可以直接使用域名访问

停止

# 前端运行使用 ctrl + c 停止
# 后台运行使用
docker-compose stop

yml文件规则

version: "3" # docker-compose核心版本
services: # 服务
	fw: # 服务名称
		image: redis # 服务配置
		ports: # 服务配置2
      		- "5000:5000"
      	depends_on: # 依赖（启动顺序）
      		- fw2
      		- redis
      	..... # 容器启动的所有配置
	fw2: 
		image: # 服务配置

官方文档 https://docs.docker.com/compose/compose-file/compose-file-v2/

测试开源程序（官方给的）

创建工作文件夹 my_wordpress/

创建docker-compose.yml

version: '3.3'

services:
   db:
     image: MysqL:5.7
     volumes:
       - db_data:/var/lib/MysqL
     restart: always
     environment:
       MysqL_ROOT_PASSWORD: somewordpress
       MysqL_DATABASE: wordpress
       MysqL_USER: wordpress
       MysqL_PASSWORD: wordpress

   wordpress:
     depends_on:
       - db
     image: wordpress:latest
     ports:
       - "8000:80"
     restart: always
     environment:
       wordpress_DB_HOST: db:3306
       wordpress_DB_USER: wordpress
       wordpress_DB_PASSWORD: wordpress
       wordpress_DB_NAME: wordpress
volumes:
    db_data: {}

后台运行

docker-compose up -d

Docker Swarm

集群
必须有两个或两个以上主节点才能运行

Swarm mode cluster

[root@centos3 ~]# docker swarm --help

Usage:  docker swarm COMMAND

Manage Swarm

Commands:
  ca          管理根CA
  init        初始化集群
  join        加入集群
  join-token  创建加入令牌
  leave       离开集群
  unlock      解锁群
  unlock-key  管理解锁密钥
  update      更新集群

Run 'docker swarm COMMAND --help' for more information on a command.

1初始化一个集群

docker swarm init [OPTIONS]

名字，简写	默认	描述
–advertise-addr		通告地址（格式：<ip \| interface>：端口）
–autolock	假	启用管理器自动锁定（需要解锁密钥才能启动停止的管理器）
–availability	active	节点的可用性（“活动”\|“暂停”\|“漏”）
–cert-expiry	2160h0m0s	节点证书的有效期（ns \| us \| ms \| s \| m \| h）
–data-path-addr		用于数据路径流量的地址或接口（格式：<ip \| interface>）
–dispatcher-heartbeat	5S	调度员心跳周期（ns \| us \| ms \| s \| m \| h）
–external-ca		一个或多个证书签名端点的规格
–force-new-cluster	假	强制从当前状态创建一个新的群集
–listen-addr	0.0.0.0:2377	监听地址（格式：<ip \| interface>：端口）
–max-snapshots	0	要保留的附加木筏快照的数量
–snapshot-interval	10000	Raft快照之间的日志条目数
–task-history-limit	5	任务历史保留限制

# 初始化集群
docker swarm init --advertise-addr 192.168.0.191

2加入一个节点

docker swarm join [OPTIONS] HOST:PORT

名字，简写	默认	描述
–advertise-addr		通告地址（格式：<ip \| interface>：端口）
–availability	active	节点的可用性（“活动”\|“暂停”\|“漏”）
–data-path-addr		用于数据路径流量的地址或接口（格式：<ip \| interface>）
–listen-addr	0.0.0.0:2377	监听地址（格式：<ip \| interface>：端口）
–token		进入群的令牌

# 例如加入一个节点
# 令牌SWMTKN-1-3pu6hszjas19xyp7ghgosyx9k8atbfcr8p2is99znpy26u2lkl-7p73s1dx5in4tatdymyhg9hu2
docker swarm join --token SWMTKN-1-3pu6hszjas19xyp7ghgosyx9k8atbfcr8p2is99znpy26u2lkl-7p73s1dx5in4tatdymyhg9hu2 192.168.0.191:2377

3获取令牌

docker swarm join-token [OPTIONS] (worker|manager)
# 工作令牌
docker swarm join-token worker
# 管理令牌
docker swarm join-token manager

查看节点

# 查看节点
docker node

Docker Service

docker service COMMAND

命令	描述
docker service create	创建一项新服务
docker service inspect	显示一项或多项服务的详细信息
docker service logs	获取服务或任务的日志
docker service ls	列出服务
docker service ps	列出一项或多项服务的任务
docker service rm	删除一项或多项服务
docker service scale	扩展一个或多个复制服务
docker service update	更新服务

1创建服务

docker service create [OPTIONS] IMAGE [COMMAND] [ARG...]

名字，简写	默认	描述
–config		指定配置以暴露给服务
–constraint		展示位置限制
–container-label		容器标签
–credential-spec		托管服务帐户的凭证规范（仅限Windows）
–detach，-d	真正	立即退出，而不是等待服务收敛
–dns		设置自定义DNS服务器
–dns-option		设置DNS选项
–dns-search		设置自定义DNS搜索域
–endpoint-mode	要人	端点模式（vip或dnsrr）
–entrypoint		覆盖图像的默认入口点
–env，-e		设置环境变量
–env-file		读入环境变量文件
–group		为容器设置一个或多个补充用户组
–health-cmd		运行以检查运行状况的命令
–health-interval		运行检查之间的时间（ms \| s \| m \| h）
–health-retries	0	需要报告不健康的连续失败
–health-start-period		在重新计数到不稳定（ms \| s \| m \| h）之前，容器初始化的开始时间段
–health-timeout		允许一次检查运行的最长时间（ms \| s \| m \| h）
–host		设置一个或多个自定义主机到IP映射（主机：IP）
–hostname		容器主机名
–label, -l		服务标签
–limit-cpu		限制cpu
–limit-memory	0	限制记忆
–log-driver		记录驱动程序的服务
–log-OPT		记录驱动程序选项
–mode	复制	服务模式（复制或全局）
–mount		将文件系统挂载附加到服务
–name		服务名称
–network		网络附件
–no-healthcheck	假	禁用任何容器指定的HEALTHCHECK
–no-resolve-image	假	不要查询注册表来解析图像摘要和支持的平台
–placement-PREF		添加展示位置首选项
–publish，-p		将端口发布为节点端口
–quiet，-q	假	抑制进度输出
–read-only	假	将容器的根文件系统挂载为只读
–replicas		任务数量
–reserve-cpu		预留cpu
–reserve-memory	0	保留内存
–restart-condition		满足条件时重新启动（“none”\|“on-failure”\|“any”）（默认为“any”）
–restart-delay		重启尝试之间的延迟（ns \| us \| ms \| s \| m \| h）（默认5秒）
–restart-max-attempts		放弃前的最大重启次数
–restart-window		用于评估重新启动策略的窗口（ns \| us \| ms \| s \| m \| h）
–rollback-delay	0	任务回滚之间的延迟（ns \| us \| ms \| s \| m \| h）（默认值为0）
–rollback-failure-action		回滚失败的操作（“暂停”\|“继续”）（默认“暂停”）
–rollback-max-failure-ratio	0	在回滚期间容忍的失败率（默认0）
–rollback-monitor	0	（ns \| us \| ms \| s \| m \| h）（默认5秒）每个任务回滚之后的持续时间
–rollback-order		回滚顺序（“start-first”\|“stop-first”）（默认“stop-first”）
–rollback-parallelism	1	同时回滚的任务的最大数量（0一次全部回滚）
–secret		指定泄露给服务的秘密
–stop-grace-period		强制杀死一个容器之前等待的时间（ns \| us \| ms \| s \| m \| h）（默认10秒）
–stop-signal		停止容器的信号
–tty, -t	假	分配一个伪TTY
–update-delay	0	更新之间的延迟（ns \| us \| ms \| s \| m \| h）（默认为0）
–update-failure-action		更新失败的操作（“暂停”\|“继续”\|“回滚”）（默认“暂停”）
–update-max-failure-ratio	0	更新期间容许的失败率（默认0）
–update-monitor	0	（ns \| us \| ms \| s \| m \| h）（默认5秒）每个任务更新后的持续时间
–update-order		更新顺序（“start-first”\|“stop-first”）（默认为“stop-first”）
–update-parallelism	1	同时更新的最大任务数（0个一次全部更新）
–user，-u		用户名或UID（格式：<名称\| uid>：<组\| gid>）
–with-registry-auth	假	向注册代理发送注册表认证详细信息
–workdir，-w		容器内的工作目录

# 例如,启动一个Nginx服务，暴露8080端口
docker service create -p 8080:80 --name Nginx01 Nginx
# docker run 容器启动，单机版本
# docker service 服务启动，支持扩缩容器
# 查看服务
docker service ps Nginx01
# 查看副本
docker service ls
# 查看详情
docker service inspect Nginx01

2更新服务

docker service update [OPTIONS] SERVICE

名字，简写	默认	描述
–args		服务命令参数
–config-add		添加或更新服务上的配置文件
–config-RM		删除配置文件
–constraint-add		添加或更新展示位置约束
–constraint-RM		删除约束
–container-label-add		添加或更新容器标签
–container-label-rm		用钥匙取出容器标签
–credential-spec		托管服务帐户的凭证规范（仅限Windows）
–detach，-d	真	立即退出，而不是等待服务收敛
–dns-add		添加或更新自定义DNS服务器
–dns-option-add		添加或更新DNS选项
–dns-option-rm		删除一个DNS选项
–dns-rm		删除自定义的DNS服务器
–dns-search-add		添加或更新自定义DNS搜索域
–dns-search-rm		删除一个DNS搜索域
–endpoint-mode		端点模式（vip或dnsrr）
–entrypoint		覆盖图像的默认入口点
–env-add		添加或更新环境变量
–env-RM		删除一个环境变量
–force	假	即使没有更改需要，也强制更新
–group-add		向容器添加一个附加的补充用户组
–group-RM		从容器中删除先前添加的补充用户组
–health-cmd		运行以检查运行状况的命令
–health-interval		运行检查之间的时间（ms \| s \| m \| h）
–health-retries	0	需要报告不健康的连续失败
–health-retries		在重新计数到不稳定（ms \| s \| m \| h）之前，容器初始化的开始时间段
–health-timeout		允许一次检查运行的最长时间（ms \| s \| m \| h）
–host加		添加或更新自定义主机到IP映射（主机：IP）
–host-RM		删除自定义的主机到IP映射（主机：IP）
–hostname		容器主机名
–image		服务图片标签
–label-add		添加或更新服务标签
–label-RM		用钥匙去除标签
–limit-cpu		限制cpu
–limit-memory	0	限制记忆
–log-driver		记录驱动程序的服务
–log-OPT		记录驱动程序选项
–mount-add		添加或更新服务上的装载
–mount-RM		通过目标路径移除一个安装
–network加		添加一个网络
–network-RM		删除网络
–no-healthcheck	假	禁用任何容器指定的HEALTHCHECK
–no-resolve-image	假	不要查询注册表来解析图像摘要和支持的平台
–placement-PREF-ADD		添加展示位置首选项
–placement-PREF-RM		删除展示位置偏好设置
–publish相加		添加或更新已发布的端口
–publish-RM		通过目标端口删除发布的端口
–quiet，-q	假	抑制进度输出
–read-only	假	将容器的根文件系统挂载为只读
–replicas		任务数量
–reserve-cpu		预留cpu
–reserve-memory	0	保留内存
–restart-condition		条件满足时重新启动（“none”\|“on-failure”\|“any”）
–restart-delay		重启尝试之间的延迟（ns \| us \| ms \| s \| m \| h）
–restart-max-attempts		放弃前的最大重启次数
–restart-window		用于评估重新启动策略的窗口（ns \| us \| ms \| s \| m \| h）
–rollback	假	回退到先前的规范
–rollback-delay	0	任务回滚之间的延迟（ns \| us \| ms \| s \| m \| h）
–rollback-failure-action		回滚失败的操作（“暂停”\|“继续”）
–rollback-max-failure-ratio	0	在回滚期间容忍的失败率
–rollback-monitor	0	每个任务回滚后监视失败的持续时间（ns \| us \| ms \| s \| m \| h）
–rollback-order		回滚顺序（“start-first”\|“stop-first”）
–rollback-parallelism	0	同时回滚的任务的最大数量（0一次全部回滚）
–secret-add		添加或更新服务的秘密
–secret-RM		去掉一个秘密
–stop-grace-period		强制杀死一个容器之前的等待时间（ns \| us \| ms \| s \| m \| h）
–stop-signal		停止容器的信号
–tty, -t	假	分配一个伪TTY
–update-delay	0	更新之间的延迟（ns \| us \| ms \| s \| m \| h）
–update-failure-action		更新失败的操作（“暂停”\|“继续”\|“回滚”）
–update-max-failure-ratio	0	更新期间容错的失败率
–update-monitor	0	（ns \| us \| ms \| s \| m \| h）每个任务更新后的持续时间
–update-order		更新顺序（“start-first”\|“stop-first”）
–update-parallelism	0	同时更新的最大任务数（0个一次全部更新）
–user，-u		用户名或UID（格式：<名称\| uid>：<组\| gid>）
–with-registry-auth	假	向注册代理发送注册表认证详细信息
–workdir，-w		容器内的工作目录

# 为 Nginx01 创建 10 个副本
docker service update --replicas 10 Nginx01 
# 或 使用 scale 命令
docker service scale Nginx01=10

移除服务

docker service rm Nginx01

关于巧用 Docker Compose 管理 GPU 资源和docker 使用gpu的介绍已经告一段落，感谢您的耐心阅读，如果想了解更多关于25.docker compose 简介和 docker-compose.yml 参数介绍、centos7+docker 安装和部署 crawlab 分布式爬虫平台，并使用 docker-compose 管理 docker、Centos上安装Docker管理器Docker Compose、Docker Compose 和 Docker Swarm 和 Docker Service的相关信息，请在本站寻找。

本文标签：