J'essaie d'installer CUDA 8.0 dans Ubuntu 16.04 pour Nvidia GeForce GTX 1080. CUDA 7.5 était installé sur moi, mais il ne semblait pas compatible avec la GTX 1080. J'ai téléchargé le programme d'installation .run à partir de la page de développement de Nvidia, mais l'installation échoue et envoie les informations suivantes à un fichier nvidia-installer.log
An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in
your kernel. This may be because it is in use (for example, by an X
server, a CUDA program, or the NVIDIA Persistence Daemon), but this
may also happen if your kernel was configured without support for
module unloading. Please be sure to exit any programs that may be
using the GPU(s) before attempting to upgrade your driver. If no
GPU-based programs are running, you know that your kernel supports
module unloading, and you still receive this message, then an error
may have occured that has corrupted an NVIDIA kernel module's usage
count, for which the simplest remedy is to reboot your computer.
J'ai redémarré l'ordinateur, mais cela n'a pas résolu le problème. Comment décharger le module 'nvidia-drm' pour pouvoir installer la version 8.0 de CUDA?
En lisant votre journal, il semble que vous tentiez d’installer votre pilote Cuda pendant que votre logiciel de démarrage X est en cours d’exécution et que vous utilisez donc votre GPU.
Vous devez d'abord l'empêcher d'utiliser votre GPU:
Supprimez les pilotes actuels: Sudo apt-get purge nvidia-cuda*
(facultatif) - Si vous souhaitez également installer les pilotes, exécutez: Sudo apt-get purge nvidia-*
Déconnectez-vous de votre interface graphique (votre non-déconnexion est la raison pour laquelle vous recevez le message d'erreur). Pour vous déconnecter, appuyez sur ctrl + alt + F2.
Arrêtez lightdm: Sudo service lightdm stop
Vous pouvez maintenant installer les pilotes. Dans votre cas, vous devrez exécuter quelque chose du genre: Sudo sh cuda_8.0.18_linux.run
(remplacez cuda_8.0.18_linux.run
par le nom de votre fichier .run).
NB: Vous devez vous assurer que vous sélectionnez/acceptez l’option permettant de créer un lien symbolique.
lorsque l'installation est terminée, redémarrez votre ordinateur: Sudo reboot
J'ai eu un problème similaire. Il s'avère qu'un processus Xorg s'exécutait sur le GPU que j'ai découvert à l'aide de nvidia-smi
. Après avoir tué ce processus, les choses se sont bien installées.
Pour voir qui utilise nvidia: Sudo lsof | grep nvidia
puis arrêtez les services ou processus utilisant nvidia