对于NVIDIANVML驱动程序/库版本不匹配感兴趣的读者,本文将提供您所需要的所有信息,我们将详细讲解nvidia驱动程序与windows版本不兼容怎么办,并且为您提供关于docker-compos
对于NVIDIA NVML 驱动程序/库版本不匹配感兴趣的读者,本文将提供您所需要的所有信息,我们将详细讲解nvidia驱动程序与windows版本不兼容怎么办,并且为您提供关于docker-compose 找不到 nvidia 驱动程序、NVIDIA 515.65.01 Linux 驱动程序发布并修复、NVIDIA Docker-初始化错误:NVML错误:驱动程序未加载、NVIDIA 确认将放弃 Kepler GPU 驱动程序支持的宝贵知识。
本文目录一览:- NVIDIA NVML 驱动程序/库版本不匹配(nvidia驱动程序与windows版本不兼容怎么办)
- docker-compose 找不到 nvidia 驱动程序
- NVIDIA 515.65.01 Linux 驱动程序发布并修复
- NVIDIA Docker-初始化错误:NVML错误:驱动程序未加载
- NVIDIA 确认将放弃 Kepler GPU 驱动程序支持
NVIDIA NVML 驱动程序/库版本不匹配(nvidia驱动程序与windows版本不兼容怎么办)
改进这个问题
当我运行时,nvidia-smi
我收到以下消息:
Failed to initialize NVML: Driver/library version mismatch
一个小时前,我收到了同样的消息并卸载了我的 cuda 库,我能够运行nvidia-smi
,得到以下结果:
在此之后,我cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
从官方 NVIDIA
页面下载,然后简单地:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.debsudo apt-get updatesudo apt-get install cudaexport PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
现在我已经安装了 cuda,但我得到了提到的不匹配错误。
一些可能有用的信息:
运行cat /proc/driver/nvidia/version
我得到:
NVRM version: NVIDIA UNIX x86_64 Kernel Module 378.13 Tue Feb 7 20:10:06 PST 2017GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.4)
我正在运行 Ubuntu 16.04.2 LTS。
内核版本是:4.4.0-66-generic。
谢谢!
答案1
小编典典惊喜,重启解决了这个问题(我以为我已经尝试过了)。
评论中提到的解决方案 Robert Crovella 也可能对其他人有用,因为它与我第一次解决该问题时所做的非常相似。
docker-compose 找不到 nvidia 驱动程序
如何解决docker-compose 找不到 nvidia 驱动程序?
我正在尝试运行 clara train example,但是当我执行 startClaraTrainNoteBooks.sh 时,容器找不到 nvidia 驱动程序。
我已经知道脚本执行 docker-compose.yml。所以我测试了 docker-compose
是否可以找到 nvidia 驱动程序:
services:
test:
image: nvidia/cuda:10.2-base
command: nvidia-smi
deploy:
resources:
reservations:
devices:
- driver: nvidia
capabilities: [gpu]
device_ids: [''0'']
输出:
USER@test:~$ docker-compose up
WARNING: Found orphan containers (hp_nvsmi_1) for this project. If you removed or renamed this service in your compose file,you can run this command with the --remove-orphans flag to clean it up.
Starting hp_test_1 ... done
Attaching to hp_test_1
test_1 | Mon Jun 7 09:01:44 2021
test_1 | +-----------------------------------------------------------------------------+
test_1 | | NVIDIA-SMI 460.27.04 Driver Version: 460.27.04 CUDA Version: 11.2 |
test_1 | |-------------------------------+----------------------+----------------------+
test_1 | | GPU Name Persistence-M| Bus-Id disp.A | Volatile Uncorr. ECC |
test_1 | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
test_1 | | | | MIG M. |
test_1 | |===============================+======================+======================|
test_1 | | 0 GeForce RTX 206... Off | 00000000:01:00.0 Off | N/A |
test_1 | | 0% 34C P8 17W / 215W | 100MiB / 7979MiB | 0% Default |
test_1 | | | | N/A |
test_1 | +-------------------------------+----------------------+----------------------+
test_1 |
test_1 | +-----------------------------------------------------------------------------+
test_1 | | Processes: |
test_1 | | GPU GI CI PID Type Process name GPU Memory |
test_1 | | ID ID Usage |
test_1 | |=============================================================================|
test_1 | +-----------------------------------------------------------------------------+
hp_test_1 exited with code 0
但是 startClaraTrainNoteBooks.sh
无法找到它。
root@claratrain:/claraDevDay# nvidia-smi
root@claratrain:/claraDevDay#
实际上,startDocker.sh 可以找到驱动程序。
root@c7c2d5597eb8:/claraDevDay# nvidia-smi
Mon Jun 7 09:11:43 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.27.04 Driver Version: 460.27.04 CUDA Version: 11.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 206... Off | 00000000:01:00.0 Off | N/A |
| 0% 35C P8 17W / 215W | 100MiB / 7979MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
+-----------------------------------------------------------------------------+
root@c7c2d5597eb8:/claraDevDay#
我该怎么办?
解决方法
docker-compose.yml
脚本需要像这样重写并工作:
# SPDX-License-Identifier: Apache-2.0
version: "3.8"
services:
claratrain:
container_name: claradevday-pt
hostname: claratrain
##### use vanilla clara train docker
#image: nvcr.io/nvidia/clara-train-sdk:v4.0
##### to build image with GPU dashboard inside jupyter lab
build:
context: ./dockerWGPUDashboardPlugin/ # Project root
dockerfile: ./Dockerfile # Relative to context
image: clara-train-nvdashboard:v4.0
depends_on:
- tritonserver
ports:
- "3030:8888" # Jupyter lab port
- "3031:5000" # AIAA port
ipc: host
volumes:
- ${TRAIN_DEV_DAY_ROOT}:/claraDevDay/
- /raid/users/aharouni/data:/data/
command: "jupyter lab /claraDevDay --ip 0.0.0.0 --allow-root --no-browser --config /claraDevDay/scripts/jupyter_notebook_config.py"
# command: tail -f /dev/null
# tty: true
deploy:
resources:
reservations:
devices:
- driver: nvidia
capabilities: [ gpu ]
# To specify certain GPU uncomment line below
#device_ids: [''0,3'']
#############################################################
tritonserver:
image: nvcr.io/nvidia/tritonserver:21.02-py3
container_name: aiaa-triton
hostname: tritonserver
restart: unless-stopped
command: >
sh -c "chmod 777 /triton_models &&
/opt/tritonserver/bin/tritonserver \
--model-store /triton_models \
--model-control-mode="poll" \
--repository-poll-secs=5 \
--log-verbose ${TRITON_VERBOSE}"
volumes:
- ${TRAIN_DEV_DAY_ROOT}/AIAA/workspace/triton_models:/triton_models
# shm_size: 1gb
# ulimits:
# memlock: -1
# stack: 67108864
# logging:
# driver: json-file
NVIDIA 515.65.01 Linux 驱动程序发布并修复
nvidia 今天发布了他们的 515.65.01 linux 驱动程序,作为稳定的 r515 系列中的最新版本。 随着 nvidia r515 linux 驱动系列在添加了新的开源内核驱动选项
、Wayland 改进和其他增强功能后,现阶段已经相当成熟,今天的 515.65.01 驱动相对来说相当乏味。 NVIDIA 515.65.01 Linux 驱动程序版本最重要的是提高了遇到大量 ECC 内存错误的 GPU 的性能。此新驱动程序中的其他修复包括解决在启用立体模式的 VT 切换时导致 X.Org 服务器处理的错误,以及 OpenGL 应用程序在 SLI Mosaic 模式下无响应的问题。
可从NVIDIA.com下载更新的 NVIDIA 515 系列 Linux 驱动程序。
以上就是NVIDIA 515.65.01 Linux 驱动程序发布并修复的详细内容,更多请关注php中文网其它相关文章!
NVIDIA Docker-初始化错误:NVML错误:驱动程序未加载
- 是的,可以。
nvidia-docker
仅需要安装NVIDIA GPU驱动程序和Docker引擎:https://github.com/NVIDIA/nvidia-docker#getting-started。对于许多人(包括我)来说,安装nvidia-docker
的唯一目的是能够避免与CUDA接触:)。 - 那是因为您“本地没有GPU”或不是NVIDIA,或者是因为安装了驱动程序而弄乱了某个地方。如果您具有支持CUDA的GPU,建议您使用NVIDIA指南来安装驱动程序。这些指南在详尽程度方面是完整的。
- 问题是,即使您设法摆脱了Docker映像中的CUDA,也有软件需要它(您不认为他们添加CUDA是为了娱乐吗?)。因此,您还必须修改代码。在这种情况下,修复Dockerfile在我看来似乎是不必要的-您可以忽略Docker并开始修复代码(如果可能的话)。
NVIDIA 确认将放弃 Kepler GPU 驱动程序支持
NVIDIA 发文表示 R470 驱动系列将是最后一个支持 “Kepler” GPU 的产品,覆盖范围从 GeForce GTX 630 到 GeForce GTX 780 Ti 和 GTX TITAN / TITAN Black / TITAN Z 显卡。
此前,NVIDIA 的 CUDA 文档就已经透露出 NVIDIA 470 驱动系列将是最后一个支持 GeForce GTX 600/700 Kepler GPU 的驱动,而今得到证实。其表示,基于 Kepler 的桌面 GPU 最初于 2012 年 3 月推出,但目前游戏技术已经发生了巨大的变化,如 DirectX 12 Ultimate 和 NVIDIA DLSS(深度学习超级采样)。因此,英伟达的软件 QA 团队将专注于支持较新技术的硬件。
不过,R470 系列驱动程序将是一个长期存在的驱动程序分支,NVIDIA 会在 2024 年 9 月之前为其提供关键安全更新支持。就其 Linux 驱动程序而言,他们会定期更新其长期的驱动程序分支,以获得新的 Linux 内核和 X.Org 服务器的兼容性,因此它可以在 Linux 发行版的较新版本中运行。
据悉,R470 系列驱动程序将于今年 8 月底推出,其中包括 Wayland 的改进和许多其他新功能。对于 Linux 用户来说,这将是一次重大的驱动程序更新,而对于使用 GeForce GTX 600/700 系列的用户来说,这是最后一次大更新。而第一个不支持基于 Kepler 的桌面 GPU 的 Game Ready 驱动程序 R495 计划将于 10 月初上市。
今天关于NVIDIA NVML 驱动程序/库版本不匹配和nvidia驱动程序与windows版本不兼容怎么办的讲解已经结束,谢谢您的阅读,如果想了解更多关于docker-compose 找不到 nvidia 驱动程序、NVIDIA 515.65.01 Linux 驱动程序发布并修复、NVIDIA Docker-初始化错误:NVML错误:驱动程序未加载、NVIDIA 确认将放弃 Kepler GPU 驱动程序支持的相关知识,请在本站搜索。
本文标签: