Je suis nouveau à Rapids et j'ai rarement eu une bonne expérience avec Conda. Donc, j'essaie de travailler avec une version conteneurisée. Je suis nouveau à Docker et la combinaison d'inconnues me laisse ne pas trier les choses.
J'ai un serveur Ubuntu 18.04,
# uname -v
#30~18.04.1-Ubuntu SMP Fri Jan 17 06:14:09 UTC 2020
sur lequel j'ai installé une nouvelle version de Docker
# apt-get install docker docker-ce docker-ce-cli containerd.io
# docker --version
Docker version 19.03.8, build afacb8b7f0
Cette machine a Cuda V10.2 installé
# nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Wed_Oct_23_19:24:38_PDT_2019
Cuda compilation tools, release 10.2, V10.2.89
et Python v3.6.9
# python3 --version
Python 3.6.9
Comme indiqué dans la section Nvidia Contener Toolkit QuickStart , j'installe la liste NVIDIA-Docker vers /etc/apt/sources.list.d/
# curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | Sudo apt-key add -
# curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu18.04/nvidia-docker.list | Sudo tee /etc/apt/sources.list.d/nvidia-docker.list
substituant explicitement ubuntu18.04
Pour la distribution $, puisque c'est le buntu équivalent pour Linux Mint 19. .
Suite aux instructions de démarrage du conteneur et du serveur de cahiers dans Rapids - Science de données GPU ouverte , j'ai tiré le 0,13-CUDA10.2-Runtime-Ubuntu18.04-PY3.6 Runtime.
# docker pull rapidsai/rapidsai:0.13-cuda10.2-runtime-ubuntu18.04-py3.6
Une longue période et plusieurs Go plus tard, tous semblaient être ok. (Pas d'avertissements ou de messages d'erreur.) En outre, on dirait que l'image était enregistrée avec Docker.
# docker images -a
REPOSITORY TAG IMAGE ID CREATED SIZE
rapidsai/rapidsai 0.13-cuda10.2-runtime-ubuntu18.04-py3.6 c7440af853b5 4 days ago 9.26GB
rapidsai/rapidsai cuda10.2-runtime-ubuntu18.04-py3.6 c7440af853b5 4 days ago 9.26GB
Cependant, j'ai ensuite essayé de démarrer le serveur portable:
# docker run --gpus all --rm -it -p 8888:8888 -p 8787:8787 -p 8786:8786 \
rapidsai/rapidsai:cuda10.0-runtime-ubuntu18.04-py3.6
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
Cela semble surprenant, car il y a deux GPU GTX 1080 TI détectés
# nvidia-smi
Fri May 8 16:41:57 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01 Driver Version: 440.33.01 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... On | 00000000:08:00.0 Off | N/A |
| 21% 38C P8 10W / 250W | 1MiB / 11178MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... On | 00000000:42:00.0 Off | N/A |
| 23% 42C P8 10W / 250W | 1MiB / 11177MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
Après avoir nettoyé les choses
# docker system Prune -a
# apt-get purge docker docker-engine docker.io containerd runc
J'ai réinstallé Docker et tiré à nouveau l'image Rapidsai. Le résultat a été inchangé.
Y a-t-il un conflit avec la version pilote NVIDIA: 440.33.01?
Aucune suggestion?
Du Documentation NVIDIA CUDA/WSL 2 :
Utilisez le script d'installation Docker pour installer Docker pour votre choix de la distribution WSL 2 Linux. Notez que Toolkit de conteneur NVIDIA ne prend pas encore en charge Docker Desktop WSL 2 Backend.
Je viens de suivre les étapes dans ce PDF ; et ça marche bien:
Pour désinstaller un précédent package NVIDIA-Docker, émettez ces commandes:
[user@gpu1 ~]# docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm –f
[user@gpu1 ~]# Sudo apt-get remove nvidia-docker
Pour installer la boîte à outils de conteneur NVIDIA-GPU Docker, vous devez d'abord ajouter des référentiels de packages:
user@ubuntu-gpu1:~# distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
user@ubuntu-gpu1:~# curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | Sudo apt-key add -
user@ubuntu-gpu1:~# curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | Sudo tee /etc/apt/sources.list.d/nvidia-docker.list
user@ubuntu-gpu1:~# Sudo apt-get update && Sudo apt-get install -y nvidia-container-toolkit
user@ubuntu-gpu1:~# Sudo systemctl restart docker
Ensuite, vérifiez l'installation NVIDIA-SMI avec la dernière image officielle CUDA:
user@ubuntu-gpu1:~# Sudo docker run -it --rm --gpus all nvidia/cuda:9.0-base nvidia-smi