web-dev-qa-db-fra.com

Impossible d'installer Cuda 10.2 sur Ubuntu 18.04

Je veux inviter cuda pour mon projet d'apprentissage en profondeur sur ubuntu. J'ai installé gcc. Quand j'essaye d'exécuter Sudo sh cuda_10.2.89_440.33.01_linux.run J'obtiens l'erreur: l'installation a échoué. Voir le journal à /var/log/cuda-installer.log pour plus de détails. J'ai lu le guide d'installation ( https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html ) mais cela n'a pas aidé. J'utilise Ubuntu 18.04 LTS et j'ai un GPU GTX 1080Ti. Puisque l'installation de cuda installe le pilote pour moi, je n'ai pas installé le pilote requis. Voici le journal:

[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /usr/bin/gcc

[INFO]: gcc version: gcc version 7.4.0 (Ubuntu 7.4.0-1ubuntu1~18.04.1) 

[INFO]: Initializing menu
[INFO]: Setup complete
[INFO]: Components to install: 
[INFO]: Driver
[INFO]: 440.33.01
[INFO]: Executing NVIDIA-Linux-x86_64-440.33.01.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd  2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed.
[ERROR]: Install of 440.33.01 failed, quitting
1
Fuzzyy

Vérifier la /var/log/nvidia-installer.log fichier. Mon fichier journal a dit quelque chose sur la désactivation de Noveou et m'a simplement demandé de redémarrer le système. Après le redémarrage, j'ai exécuté Sudo sh cuda_10.2.89_440.33.01_linux.run à nouveau et l'installation s'est exécutée avec succès.

1

J'ai rencontré le même problème, et j'ai trouvé qu'en plus du fichier "/var/log/cuda-installer.log" qu'il vous dit de regarder, il y a aussi "/var/log/nvidia-installer.log". Dans ce fichier, j'ai le message:

ERREUR: vous semblez exécuter un serveur X; veuillez quitter X avant d'installer.

(J'ai eu la même erreur en essayant avec cuda 10.1)

J'ai dépassé cette étape en utilisant ctrl-alt-F1 pour ouvrir un terminal, devenant root, puis systemctl stop lightdm. Je pourrais alors exécuter l'installation.

A part: après le redémarrage, c'était horrible. Par exemple. Je n'avais aucun contrôle sur la luminosité de l'écran, le centre de contrôle nvidia n'était plus ouvert, nvidia-smi ne fonctionnait pas. Donc dans les 5 minutes, je courrais nvidia-uninstall puis retourné au dernier package de pilotes (-435) à la place.

MISE À JOUR: Succès! J'ai relancé l'installation (de cuda 10.1) mais en décochant l'option du pilote. Il s'est plaint, mais a réussi. Il n'avait pas besoin de jouer avec un terminal, ni même de redémarrer. Cela n'a rien cassé. Et l'utilisation du GPU dans PyTorch 1.4 a fonctionné.

Je pense que cela a fonctionné parce qu'il a dit que 10.1 a besoin d'au moins la version 418, et que j'utilise 435. Cela ne fonctionnera probablement pas avec 10.2, car il veut la version 440 ou ultérieure. (Je vois que 440 est le dernier en Debian sid , à partir du 1er mars, alors peut-être qu'il apparaîtra dans Ubuntu/Mint très bientôt?)

Donc, pour résumer ma réponse: installez le dernier pilote nvidia avec les packages du système d'exploitation, assurez-vous qu'il est au moins aussi élevé que ce qui est requis par votre version de cuda, puis installez cuda et dites-lui de ne pas toucher le pilote.

0
Darren Cook