J'ai un serveur VMware ESXI qui a été opérationnel depuis près de 200 jours. Les derniers jours, lorsque j'essaie de vous connecter à l'aide du client VMware vSphere, je ne parviens pas à vous connecter. Après avoir entré mon nom d'utilisateur et mon mot de passe, je vois que la petite roue de filature et la ligne d'état indiquent "Connexion ..." puis "Chargement d'inventaire ...", puis je reçois un message d'erreur:
Le serveur 'my.host.name' n'a pas pu interpréter la demande du client. (Le serveur distant a renvoyé une erreur: (503) serveur indisponible
Appelez "ServiceInstance.retrieContent" pour objet "ServiceInstance" sur le serveur "mon.host.name" a échoué.
Je suis capable de SSH dans le serveur VMware ESXI. toutes les machines virtuelles semblent être opérationnelles et courir bien, alors je veux savoir à l'avance si je dois les traduire pour la maintenance !!! Si les méthodes proposées dans votre réponse interfèveraient avec exécution de VMS s'il vous plaît Cela, donc je sais préparer pour temps d'arrêt. Merci!
Comment puis-je résoudre cette condition d'erreur sur VMware ESXI?
(Je posterais le numéro de version mais je ne sais pas comment l'obtenir sans la console vSphere!)
éditer : environ un mois après que j'ai posé cette question, le serveur s'est inexplicablement redémarré. Je ne sais pas s'il a paniqué ou ce qui s'est passé ... Mais après avoir redémarré, ce problème était parti. Je ne peux donc pas tester/confirmer la réponse à moins que le problème ne réapparaisse (ce que j'espère que ce n'est pas!)
Vous devez redémarrer les services de gestion VMware. Heureusement, c'est facile (puisque vous avez un accès SSH) et non imputable aux machines virtuelles.
En un mot, ssh à la châssis ESX comme root
puis exécutez l'une des deux commandes suivantes (selon le cas é) ESX/I):
Pour ESX:
service mgmt-vmware restart
Pour ESXI:
/sbin/services.sh restart
J'ai résolu le problème en désinstallant widecap ServiceInstance.retrievievievecontent erreur
Nous avons connu un problème similaire que cela et cela a fini par avoir échoué SAN LUN qui ont été directement attachés via des HBAS de canal de fibre. Apparemment, l'un des deux déclarants a eu un événement de basculement, mais n'a pas échoué à proprier, l'hôte ESXI ne pouvait pas déclarer ces chemins morts et afflux d'afflux de problèmes de bloc de niveau LUN avec HBA occupés, bus occupés, des commandes d'avortement jonchées dans le Vmkernel. Journal.
La prise en charge de VMware a pu nous promener à travers les problèmes après que les clusters de la tête de fichier SAN ont été restaurés à un état actif/actif (NetApp). "Cat /var/log/vmkernel.log | Sense Grep | Moins" Erreurs Hex Hex a montré de nombreux problèmes de niveau LUN (D: 0x2), bus occupé (H: 0x2), HBA occupé (D: 0x8), commandes d'avortement (H : 0x5) des délais d'attente qui pointe vers un déposant SAN n'étaient pas correctement échoué et ne se rendent toujours pas à la disposition de la disponibilité.
Après le détricteur SAN Restoral pour les chemins/Luns, nous avons émis la commande "/sbin/services.sh redémarrage" qui a été complétée et que nous avons pu vler à nouveau dans l'hôte, le Web et le rejoindre à la Cluster existant pour effacer les VMS "Orphane" "Sans nom" Des restes résiduels.
Sur mon appareil vCenter 6.5, le noyau de service vpxd
dépose et procède à cette erreur.
Seulement solution de contournement/solution jusqu'à présent: bloquer l'accès à l'hôte ESX jusqu'à ce que tous les services vCenter soient démarrés.
Maintenant, une unité de script Shell/SystemD sur vCenter crée des règles de filtre de pare-feu/de paquets iptables au démarrage. Une fois que les services vCenter sont démarrés et chargez des gouttes moyennes inférieures à 0,5, le script supprime les règles IPTABLES. Ce n'est que maintenant vCenter est capable de "voir" les hôtes ESX et est heureux pendant un moment. Si le problème réapparaît, je redémarre vCenter.
Le script shell:
#!/bin/bash
# /usr/local/bin/block-esx-access-on-boot.sh
export ESX_HOSTS="ESX1-IP,ESX2-DNS,ESX3-IP"
export LOAD_THRESHOLD="0.5"
sleep 5
LOAD="$(cut -d' ' -f1 /proc/loadavg)"
echo "Waiting for 1min loadavg ${LOAD} > ${LOAD_THRESHOLD} ..."
while [ "$(echo "${LOAD} > ${LOAD_THRESHOLD}" | bc)" == "0" ] ; do
echo "Waiting for 1min loadavg ${LOAD} > ${LOAD_THRESHOLD} ..."
sleep 3
LOAD="$(cut -d' ' -f1 /proc/loadavg)"
done
echo "Blocking outgoing transfers to ${ESX_HOSTS}"
iptables -A OUTPUT -d ${ESX_HOSTS} -j DROP
iptables -L OUTPUT
while [ "$(echo "${LOAD} < ${LOAD_THRESHOLD}" | bc)" == "0" ] ; do
echo "Waiting for 1min loadavg ${LOAD} < ${LOAD_THRESHOLD} ..."
sleep 60
LOAD="$(cut -d' ' -f1 /proc/loadavg)"
done
echo "Allowing outgoing transfers to ${ESX_HOSTS}"
iptables -D OUTPUT -d ${ESX_HOSTS} -j DROP
iptables -L OUTPUT
L'unité SystemD:
# /etc/systemd/system/block-esx-access-on-boot.service
[Unit]
Description=Block ESX Access on Boot
After=network.target
[Service]
Type=oneshot
ExecStart=/usr/local/bin/block-esx-access-on-boot.sh
[Install]
WantedBy=multi-user.target
https://gist.github.com/quatauta/a1ac390633006996fbc547DA9BD01Ef9
cet article de VMware KB semble correspondre à votre symptôme décrit. Vérifiez que votre DNS est opérationnel du point de vue de l'ESXI Server.
Option 2: Pouvez-vous vérifier que votre vCenter Server est en hausse et que le service est démarré?
Nous avons rencontré le même problème. VMware Support stipule que vCenter est désynchronisé avec une seule connexion (SSO). Refoots simples du serveur SSO tandis que vCenter Server est impressionné de manière à résoudre le problème:
Voici la séquence:
éteignez le serveur vCenter.
puis redémarrez la boîte SSO et attendez que tous les services VMware reviennent sur cette case
power up the vCenter Server
services de serveur vCenter redémarrés dans une séquence appropriée (Répertoire, KDC, Service de certificat, IDM, STS, INV SERVICE ET SERVICE DE VC
le redémarrage de notre serveur vCenter a aidé à résoudre ce problème pour nous.
nous ne pouvions pas vmotion ou construire des modèles sans obtenir l'erreur 503. J'ai également vu cela dans le passé où le redémarrage du vCenter n'aide pas et nous devions redémarrer un hôte. Ce qui signifie que les ordinateurs virtuels sur cet hôte sont descendus aussi.
J'ai reçu cette erreur juste après ma mise à niveau réussie de VCenter 5.0 à 5.1. J'ai remarqué plusieurs alertes (sous des événements (tâches et événements)) au sein du vCenter des comptes de service que j'ai présumés dans le passé pour divers articles (comptes de Kaspersky Vsheild et Orion Syslog SVC) qui manifestaient l'accès refusé. J'ai ajouté ces comptes au groupe des administrateurs locaux sur vCenter et mes problèmes sont partis.
Avant de découvrir cela, cependant de me fournir une solution de contournement, je redémarrerais simplement le service VMware Server, puis je ne pouvais alors vous connecter à aucun problème et accéder à des consoles VM. Après 5 minutes environ, les consoles vont de noir et je ne pouvais plus y accéder. Si je me suis déconnecté et essayé de retourner dans vCenter, je recevrais cette erreur:
Appelez "ServiceInstance.retrieContent" pour objet "ServiceInstance" sur le serveur "mon.host.name" a échoué.
La règle est donc si vous pouvez entrer dans vCenter Go Vérifiez les journaux d'événements et voyez s'il y a des alertes refusées. S'il y a ajouté ces comptes au groupe d'administration local sur vCenter.
J'ai eu ceci après avoir changé l'adresse IP du vCenter
J'ai utilisé # 6 https://rlevchenko.com/2016/03/24/vcenter-503-service-unavailable/ Pour activer la coquille.
ssh dans le serveur vCenter
Commande> Shell
vI/etc/hosts a changé l'adresse IP
service-Control --Stop --Toutes --Toutes
service-Control --Start --Toutes