web-dev-qa-db-fra.com

Sur un serveur à double processeur, est-il normal qu'un processeur fonctionne plus chaud que l'autre?

J'ai un double serveur Opteron exécutant Linux avec libvirt pour héberger plusieurs machines virtuelles. Les machines virtuelles fonctionnent correctement et le serveur fonctionne correctement, mais je remarque qu'un processeur tourne toujours à environ 69 ° C (accélérateur à 70 ° C) et que l'autre tourne à environ 15 ° C.

Cela ne me semble pas normal? Ne devraient-ils pas tous les deux être un peu plus proches en température?

Je ne sais pas encore comment dianoser. Peut-être qu'il n'y a pas assez de pâte thermique sur l'un des CPU?

Edit: La carte mère est ASUS KGPE-D16 et refroidie par double ventilateurs Noctua NH-U9DO .

Notez que je pense que les températures peuvent être dégressives au-dessus de la température ambiante plutôt que des valeurs absolues? Lorsque le serveur tourne au ralenti, les températures du processeur chutent à 2 ° C et 13 ° C. J'utilise la configuration lmsensors de ici

51
samoz

Le problème a fini par être un dissipateur thermique mal ajusté. Peut-être que mal ajusté n'est pas la bonne description. Il s'avère que vous devez mettre de la pâte thermique sur le dissipateur thermique, pas le couvercle en plastique qui passe sur le dissipateur thermique.

enter image description here

Après avoir retiré le couvercle en plastique, le CPU est agréable et cool, merci à tous!

106
samoz

D'après mon expérience, il est normal que les composants appariés dans un boîtier fonctionnent à des températures différentes, car le flux d'air n'est pas le même partout. Voici un graphique de la température du disque dur de ma boîte de colo. Les disques sont mis en miroir, de sorte que les charges de travail sur eux sont presque identiques.

munin graph of HDD temps over past year

Comme vous pouvez le voir, ils se suivent, mais ce n'est pas la même chose; ils ne sont aussi, en moyenne, qu'à 6C d'écart. Que vos capteurs signalent une température absolue ou une surchauffe, une différence de 55 ° C sous charge semble très mal. Si vous avez confiance que les données sont correctes, alors étant donné que la différence de repos tombe à 10 ° C, qui est le genre de différence que je vois en raison du flux d'air, je soupçonne un dissipateur thermique mal ajusté.

25
MadHatter

Ce n'est pas. Sauf si vous avez de sérieux problèmes avec le flux d'air. Ou l'un des refroidisseurs est mauvais. La température variera - mais pas tant que ça (70 contre 15 degrés Celsius).

Étant donné le niveau bas de 15 degrés, je suppose (a) que votre capteur est éteint (vous stockez vraiment le serveur dans une pièce aussi froide?).

Je suppose également que l'un des processeurs ne fonctionne tout simplement pas, pour quelque raison que ce soit.

De petites différences sont normales. Quelques petits plus gros peuvent être (le flux d'air me vient à l'esprit). mais ici nous parlons d'un étant FROID.

8
TomTom

Cela peut être un refroidissement ou une charge inégale (étant donné la différence de température, votre situation est probablement une charge inégale). Vous devez utiliser quelque chose comme prime95 pour charger tous les cœurs de manière uniforme et voir si les températures varient toujours. Si ce n'est pas le cas, vous devez équilibrer les machines virtuelles, vérifiez que vos applications sont multithread et occupées. La façon de procéder dépend de votre logiciel et de votre charge de travail individuelle, c'est donc vraiment hors de portée de la question. Gardez à l'esprit qu'il n'y a pas vraiment d'avantage à le faire si vous n'avez pas assez de charge pour compléter un seul processeur/noyau, en fait votre VM peut délibérément éviter d'utiliser un deuxième processeur afin que il peut passer en modes d'économie d'énergie sur les systèmes multi-processeurs.

Si vous l'avez réduit au refroidissement. Une petite différence de jusqu'à 10 ° C pourrait être trop peu (ou trop!) De pâte thermique. Une différence plus importante indique un problème important ou une différence entre les refroidisseurs de CPU. Il se peut que l'on ait bloqué le flux d'air, qu'un dissipateur thermique ait été assommé, etc.

2
JamesRyan

Je devrais être d'accord avec, temp défectueux. capteur, car 15C est seulement 59F !!! À moins que l'ordinateur ne soit dans un centre de données extrêmement glacial, j'imagine que la température de l'air ambiant serait supérieure à 59F! Vous essayez d'affecter les VM au cœur à basse température et voyez s'il y a un changement; sinon, je soupçonnerais fortement le capteur d'être défectueux.

Vous pouvez également regarder la sortie de dmesg (messages de démarrage) et voir s'il y a quelque chose qui sort de l'ordinaire.

0
J. Simons