ElasticSearch est un magasin de documents et plus un moteur de recherche, je pense qu'ElasticSearch n'est pas un bon choix pour surveiller des données de grande dimension car il consomme beaucoup de ressources. D'autre part, prometheus est un TSDB qui est conçu pour capturer des données de grande dimension.
Quiconque est expérimenté dans ce domaine, veuillez me faire savoir quel est le meilleur outil à utiliser pour la surveillance des conteneurs et des serveurs.
ELK est une pile sans sql à usage général qui peut être utilisée pour la surveillance. Nous en avons déployé un avec succès en production et l'avons utilisé pour certains aspects de notre système de surveillance. Vous pouvez y envoyer des métriques (si vous le souhaitez) et les utiliser pour les surveiller, mais ce n'est pas spécialement conçu pour cela. Il ne vient pas non plus avec un système d'alerte - vous devrez configurer un autre composant pour cela (comme Sensu).
Prométhée, d'autre part, est conçu pour être utilisé pour la surveillance. Et avec ses clients de collecte de métriques (ou d'autres clients tiers comme Telegraf et ses options de découverte de services (comme consul) et son gestionnaire d'alertes est juste l'outil idéal pour ce travail.
En fin de compte, les deux solutions peuvent fonctionner, mais à mon avis, Elasticsearch nécessitera plus de travail et plus d'entretien (nous avons constaté que les clusters ES sont difficiles à maintenir, mais cela dépend de la quantité de données que vous aurez).
J'utilise openshift et nous utilisons les deux outils et les deux ont un travail différent. agréger tous les journaux et les expéditions à une recherche élastique pour faciliter la navigation sur tous les journaux et autres choses similaires.
notre utilisation de prometheus est principalement pour les métriques soit pour les nœuds soit pour les pods et grafana est certainement une excellente interface pour afficher toutes les métriques de prometheus avec certitude.