web-dev-qa-db-fra.com

Modification d'un sitemap volumineux (plus d'un million de liens) après le changement de chemin d'URL

J'ai un grand site qui a un sitemap de plus d'un million de liens, dont la plupart avaient déjà été indexés par Google.

Nous avons changé le chemin de l'URL pour la plupart des URL de sorte qu'il passe de

site.com/old_path/page

à

site.com/new_path/page

Toutes les URL old_path utilisent correctement une redirection 301 vers new_path. Dans le code HTML, j'ai suivi les instructions suggérées par cet article MOZ qui suggère de conserver les liens old_path dans les pages HTML pendant une semaine pour permettre à Google de suivre toutes les redirections 301 et -indexer les anciennes pages, de sorte que nous n'obtenions pas beaucoup d'erreurs "Dupliquer le contenu" des chemins anciens et nouveaux étant indexées.

Ma question est la suivante: comment gérer le plan du site dans GWT? J'ai actuellement mon ancien sitemap avec toutes les URL old_path, qui étaient principalement indexées, et mon nouveau sitemap avec les URL new_path en même temps. Je pensais qu'il serait peut-être préférable de supprimer le sitemap old_path, car ils entraînent tous une redirection 301, mais je crains que mon classement ne soit rapidement supprimé si la suppression de l'ancien sitemap supprime ces URL de l'index.

Dois-je supprimer mon ancien sitemap?

1
anon-seo-wannabe

Réponse simple. Votre sitemap doit refléter la structure que vous souhaitez et non celle que vous ne voulez pas. Il ne devrait contenir que vos nouvelles URL.

De plus, bien que les conseils de MOZ sonnent bien, si Google indexe toutes vos pages, il se fiche de tous les liens. Il se soucie des URL. Pas les URL des liens, mais les URL des pages. C'est l'une des deux clés de votre site dans l'index et la plus importante dans ce cas. Lorsque Google régénère les pages, il n'utilise pas l'index de lien, mais l'index d'URL. L'index de lien est principalement utilisé pour calculer le PageRank et découvrir de nouvelles pages.

Cela étant dit, il n'y a pas de mal à conserver les anciens liens pendant un certain temps, cependant, je suggérerais d'utiliser les nouveaux liens et de supprimer les anciens liens dès que possible afin que les entrées de l'index des liens soient mises à jour le plus rapidement possible. . Pourquoi prolonger l'avantage PageRank et confondre les choses?

Une autre chose que je recommanderais consiste à utiliser la balise canonique sur vos nouvelles pages pour pointer sur elle-même. Bien sûr, vous devez utiliser une URL complète pour cela. Ceci est votre principale assurance contre le contenu en double.

Les problèmes de contenu en double se résolvent souvent eux-mêmes rapidement. Je n'ai jamais entendu parler de problèmes de contenu dupliqué utilisant une redirection 301 pour restructurer un site. Il y a quelques années, j'ai subi une restructuration similaire avec 287 000 301 redirections et aucun problème de contenu dupliqué. J'ai laissé mes redirections 301 en place pendant 6 mois, ce qui était probablement beaucoup trop long. Je l'ai fait pour Bing et d'autres plus que Google. Une fois que Google a commencé à explorer mon site et à consulter les redirections 301, il a massivement réindexé mon site en une semaine à peu près.

Avec un tel profil de lien, vous ne voudrez peut-être jamais supprimer les redirections 301, cependant, je vous préviens qu'à un moment donné, vous devriez le faire. Comparez les profils de lien de votre nouvelle structure avec votre ancienne structure de lien. À un moment donné, vous ferez bien mieux de supprimer les redirections 301 et de gérer la perte, ce qui devrait être beaucoup plus facile avec un profil de lien fort pour la nouvelle structure. Certes, cela pourrait prendre un certain temps. Ne soit pas si pressé. Avec un tel profil de lien, vous avez une valeur que vous ne voudrez plus abandonner facilement et certainement pas sans trop de considération et en vous assurant que le profil de lien vers la nouvelle structure est plus solide que l'ancien.

Parfois, il est préférable de retirer rapidement le bandage. Je ne suggère pas que vous soyez négligent, cependant, vous devez décider vous-même d'un équilibre. Vu la taille de votre site, je suggère d’être plus prudent que moi. Personnellement, je m'en foutais. Je suggère que vous faites. Soyez prudent, sortez la feuille de calcul et rassemblez autant de preuves que possible avant de faire de gros changements à chaque étape du processus.

2
closetnoc