Google indexe les URL temporaires de Plesk. J'ai essayé le conseil suivant, mais il ne bloque pas ces URL.
Pourquoi Google a indexé l'URL de prévisualisation du domaine?
J'ai ajouté ceci à .htacess sans succès:
RewriteEngine On
RewriteCond %{HTTP_Host} !^(www\.)?example\.com$
RewriteRule .* - [E=block:1]
Header set X-Robots-Tag "noindex,nofollow" env=block
Comment puis-je empêcher les URL temporaires de Plesk d'être indexées?
Vous devez tester pour vous assurer que chaque URL figurant dans Google contient le tag que vous attendez. J'utilise cURL avec l'option --head
pour ce type de test.
curl --head 'http://temporaryurl.example.com/'
Vous voulez vous assurer que l'en-tête inclut la ligne attendue:
X-Robots-Tag: noindex,nofollow
Inversement, vous devez tester pour vous assurer qu'il n'apparaît pas pour votre propre nom de domaine.
Si cette balise est bien présente, Google ne doit pas indexer vos URL temporaires (bien qu'il les analysera pour rechercher les informations d'en-tête du robot). Vos règles de réécriture ne sont manifestement pas erronées, mais j’imagine qu’elles ne fonctionnent pas et que vous devez les tester.
Le moyen le plus simple et le plus stable consiste à rediriger les pages de plesk vers une autre URL. Donc, si vous avez une page plesk sur votre URL HTTPS, 301 la redirigez vers l'URL HTTP.
Une fois que Google l'a vu et traité, vous supprimez les pages de l'index.