Je cherche des conseils sur l'architecture Notre SQL Server 2016 SP1 toujours sur les groupes de disponibilité Solution HADR SUR Windows Server 2012 R2. Nous avons un site principal A avec une réplique principale et une réplique secondaire et une reprise des catastrophes (DR) Site B avec une réplique secondaire et un témoin de partage de fichiers. Notre objectif est que si le serveur de réplique principal 1 sur le site A est en panne, le groupe Toujours sur la disponibilité (AG) échoue sur le serveur de réplique secondaire 2 sur le site A, et si les deux serveurs du site A sont en panne, le AG échoue sur au site B.
Nous essayons de faire un Node et de la configuration majoritaire de partage de fichiers par https://technet.microsoft.com/en-us/library/cc731739 (v = ws.11) .aspx et ce diagramme:
Ce diagramme montre que lorsqu'un noeud et le témoin "Disque"/Share de fichiers sont en communication, les courses de la cluster, mais dans nos tests de cette situation, le grappe échoue en raison d'une perte de quorum du WSFC. Le basculement automatique AG fonctionne si nous testons une défaillance d'un serveur à la fois en désactivant NIC dans VMware, car SQL Server 2016 prend en charge deux répliques cibles de basculement automatique. Cependant, cela ne fonctionne pas si nous échouons les deux serveurs sur le site A en même temps de simuler une panne de réseau point à point ou une panne de courant du site.
L'approche suivante avec intervention manuelle pour forcer le quorum fonctionnera, mais ce n'est pas automatique, ce que nous voulons dans la situation idéale:
$node = "SQLServerC"
Stop-ClusterNode –Name $node
Start-ClusterNode –Name $node –FixQuorum
ALTER AVAILABILITY GROUP SQLServerAO FORCE_FAILOVER_ALLOW_DATA_LOSS;
$node = "SQLServerC"
Stop-ClusterNode –Name $node
Start-ClusterNode –Name $node
J'apprécie les suggestions que vous pouvez vous offrir et vous remercier d'avance!
Vous devriez considérer Windows Server 2016. blogs.msdn - introduire-cloud-témoin
Notre objectif est que si le serveur de réplique principal 1 sur le site A est en panne, le groupe Toujours sur la disponibilité (AG) échoue sur le serveur de réplique secondaire 2 sur le site A, et si les deux serveurs du site A sont en panne, le AG échoue sur au site B.
À l'exception d'un scénario très spécifique, cela ne fonctionnera pas. Dans tous les autres scénarios, vous perdrez du quorum avant que vous ne puissiez jamais échouer automatiquement (ce qui nécessite ... Quorum).
La meilleure réponse serait d'avoir le côté du DR Soyez un basculement manuel (il pourrait toujours être synchrone) avec la documentation appropriée sur la manière de forcer le quorum et d'apporter le AG en ligne.
Vous pouvez également investir davantage dans VMware et utiliser leurs technologies, mais cela suppose l'infrastructure, la licence et la possibilité de mettre en œuvre ces produits pour un service spécifique tel que celui-ci.