web-dev-qa-db-fra.com

https: // résultats de recherche apparaissant sur Google pour purement http: // site

J'ai commencé aujourd'hui à parcourir les résultats de recherche de mon site sur Google, à l'aide d'une recherche site:, afin de déterminer s'il existe des liens causant des 404 et nécessitant par conséquent une redirection. À mon grand étonnement, j'ai remarqué de nombreux https:// résultats concernant différentes pages. Mon site ne possède pas de certificat SSL, ne sert pas de telles pages, ne crée pas de lien interne vers https:// pages, n'inclut pas de tels fichiers dans son sitemap.xml et , pour tout cela, ne l’a jamais fait.

J'ai décidé de faire une recherche Google pour https://<my site> et j'ai trouvé un site qui renvoie incorrectement à la racine de mon site avec un préfixe https:// - je vais essayer de les contacter pour les faire corriger.

Je ne sais pas cependant comment Googlebot a réussi à indexer les fichiers non root sous le nom https://. Je ne trouve aucun lien externe vers eux et, bien entendu, sans certification, Googlebot aurait dû rester bloqué à la première demande.

Je viens d'ajouter les lignes suivantes au message . Htaccess (bien que l'internaute doive toujours naviguer dans le message "Ce site est un risque pour la sécurité. Abandonnez tout espoir à ceux qui entrent ici!" ( s) premier à y arriver):

RewriteEngine On
RewriteCond %{HTTPS} on
RewriteRule ^(.*)$ http://www.<my site>.org/$1 [R=301,L]
  • remplacer <my site> par mon nom de domaine.

Ma grande question est la suivante: j'aimerais utiliser la fonctionnalité Supprimer les URL de Google pour les webmasters pour supprimer les pages https:// de l'index. Puis-je être assuré que cela ne supprimera que les versions https:// de chaque page pertinente et non les versions http:// valides?

Merci à tous ceux qui peuvent m'aider avec cette question particulière et la question en général.

3
user22880

Une question similaire se pose dans le forums Google . John Mueller de Google indique que vous ne devez pas utiliser les outils pour les webmasters pour essayer de supprimer une version HTTPS de la page de l'index:

... veuillez ne PAS utiliser l'outil de suppression d'URL dans Webmaster Tools pour cela. Il peut supprimer l'ensemble de votre site car il n'est pas conçu pour résoudre les problèmes de canonisation!

1

HTTPS et HTTP sont classés en tant que protocoles. Ils ne constituent donc pas des pages dupliquées sur le plan technique, mais plutôt des protocoles différents qui peuvent être utilisés pour accéder à la page. Ainsi, en termes de référencement, son effet est minime mais le fait que vous n'ayez pas de protocole SSL peut suffire. mais j'en doute. La plupart des sites sont accessibles sans certificats SSL valides, ce qui correspond à la façon dont ils ont été configurés. Il s’agit d’un protocole et non d’une page disponible malgré le changement d’URL.

J'ai moi-même eu des pages qui apparaissent dans les résultats de Google sous forme de HTTP et, si elles trouvent un lien avant d'explorer votre site, ce n'est pas grave, mais si vous le supprimez via les Outils pour les webmasters, la page sera supprimée car l'outil de suppression fonctionne avec les URL. et non des protocoles - il vaut donc mieux attendre que la page mise à jour avec HTACCESS soit mise à jour. Il faudra un mois à Google pour le modifier au sein du SERPS, mais Google le remarquera bien avant la mise à jour de l'index car il souhaite voir si c'est une erreur - sinon les gens se plaindraient de perdre leur adresse. classement après avoir changé de HTACCESS et en quelques jours ou une semaine, le problème passe inaperçu et perd le classement. Alors ça prend du temps.

Oubliez les outils du webmaster, HTACCESS fera l'affaire en temps voulu.

1
Simon Hayter