J'ai donc mis en place nos serveurs SQL pour nous informer des alertes à la gravité 17 ou supérieure (comme indiqué par divers articles SQL Server). J'ai fait cela à chaque noeud d'un serveur SQL toujours sur le cluster de disponibilité, avec trois nœuds multi-sous-réseau.
Au cours du week-end, nous avons reçu une centaine de notifications sur un seul message "informationnel unique" de l'un des nœuds secondaire. Les autres nœuds ne font pas cela et l'alerte ne semble pas causer de problèmes réels. L'alerte est:
DESCRIPTION: Skipping the default startup of database '<database>' because the database belongs to an availability group (Group ID: <...>).
The database will be started by the availability group.
This is an informational message only. No user action is required.
Culprit possible: Notre réseau a quelques problèmes, le nœud pourrait se déconnecter et reconnecter ou chronométrer.
Je suppose que mes questions sont, y a-t-il une action que je devrais prendre pour résoudre cette alerte? Pourquoi ne concerne-t-il que l'un de mes nœuds? Si cela est vraiment informatif et qu'aucune action n'a besoin d'être prise, puis-je configurer mes alertes pour ignorer ces alertes?
Sur un commentaire, j'ai examiné les journaux et il semble que le serveur ait fonctionné tout ce temps, mais qu'il s'est déconnecté du serveur toujours sur ce temps:
AlwaysOn Availability Groups: Local Windows Server Failover Cluster node is no longer online.
The Availability replica is going offline because the local ...
The Waiting for local Windows Server Failover Clustering service to start ...
(Then it goes through the informational messages regarding starting up each database)
Local Windows Server Failover Clustering service started.
Le même type de message est apparu dans notre environnement également.
Ce que je comprends, c'est que la DB était dans AAG, et lorsque le nœud (groupe AAG secondaire) passe sous le redémarrage, la start-up de la DB sera prise en charge par Tomaon au lieu du processus de 3 phases SQL Server régulier!
Si le message apparaît sans aucun recouvrement de nœud secondaire, nous devrons devoir envisager un dépannage, mais dans notre état, nous pouvons l'ignorer que le message indique que cela n'est que informatif.
Je vous suggérerais cela script .
Le @message_id = 35202 and 35206
, c'était extrêmement utile pour moi lorsque j'avais configuré un alevin avec 4 nœuds entre 2 centres de données différents.
[.____] Combien de répliques avez-vous? Soyez juste au courant des votes du quorum .
[.____] Ce script vous aide à le savoir.
SELECT member_name
, member_state_desc
, number_of_quorum_votes
FROM sys.dm_hadr_cluster_members;