J'ai essayé d'installer le nvidia-docker après avoir installé docker-ce. J'ai suivi ceci: https://github.com/NVIDIA/nvidia-docker pour installer nvidia-docker. Il semble s'être installé correctement.
J'ai essayé de courir:
$ Sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker: Error response from daemon: Unknown runtime specified nvidia.
See 'docker run --help'.
Bien que cela fonctionne (sans --runtime = nvidia):
$ docker container run -ti ubuntu bash
Quelques informations supplémentaires sur mon système: Il s'agit d'un serveur Ubuntu 16.04 avec 8 GPU (Titan Xp) et le pilote nvidia version 387.26. Je peux exécuter nvidia-smi -l 1 sur le système hôte et cela fonctionne comme prévu.
$ dpkg -l | grep -E '(nvidia|docker)'
ii docker-ce 18.06.1~ce~3-0~ubuntu AMD64 Docker: the open-source application container engine
ii libnvidia-container-tools 1.0.0-1 AMD64 NVIDIA container runtime library (command-line tools)
ii libnvidia-container1:AMD64 1.0.0-1 AMD64 NVIDIA container runtime library
ii nvidia-container-runtime 2.0.0+docker18.06.1-1 AMD64 NVIDIA container runtime
ii nvidia-container-runtime-hook 1.4.0-1 AMD64 NVIDIA container runtime hook
ii nvidia-docker2 2.0.3+docker18.06.1-1 all nvidia-docker CLI wrapper
$ cat /etc/docker/daemon.json
{
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}
Je suis tombé sur: https://github.com/NVIDIA/nvidia-docker/issues/501 , mais je ne sais pas comment je dois m'y prendre.
En fait, vous pouvez essayer de redémarrer le démon docker en suivant la commande.
Sudo systemctl daemon-reload
Sudo systemctl restart docker
Ou vous pouvez essayer de redémarrer votre système. faire fonctionner nvidia-docker
Suivez les instructions de FAQ et mon problème a été résolu.
Il semble que vous ayez besoin de purger Docker et de le réinstaller comme dans la publication: problèmes github
Sudo apt remove docker-ce
Sudo apt autoremove
Sudo apt-get install docker-ce=5:18.09.0~3-0~ubuntu-bionic
Sudo apt install nvidia-docker2