Nous avons redirigé correctement toutes les anciennes adresses URL vers les nouvelles en utilisant . Htaccess. Le problème est que Google cherche toujours du contenu dans l'ancienne page (ce qui ne devrait pas être le cas) et le stocke dans le cache plutôt que dans la nouvelle URL.
Par exemple:
http://www.natures-energies.com/iching.htm
http://www.natures-energies.com/index.php?option=com_content&view=article&id=760
Si vous tapez l'ancienne URL dans le navigateur, il est redirigé. Si vous récupérez l'ancienne URL en tant que Googlebot dans les outils pour les webmasters, l'en-tête indique 301/redirigé en permanence. Si j'essaye d'explorer comme n'importe quel autre bot, il dit toujours 301 redirigé. Même si vous cliquez sur l'ancien lien dans Google, il redirige vers la nouvelle URL.
Seulement dans son cache, il affiche l'ancienne URL et en plus, il affiche le nouveau contenu!
Je suis perplexe sur la façon dont Google parvient à récupérer le nouveau contenu et à insérer l'ancienne URL à la place de la nouvelle!
Une autre chose intéressante est que si j'essaie un cache pour la nouvelle page, il affiche le cache du nouveau contenu avec l'ancienne URL!
Toute aide serait appréciée. Je suis à bout de force. Je pense avoir presque tout essayé. Y a-t-il quelque chose que je manque à voir?
Vous pouvez utiliser cette recherche pour trouver l'ancienne URL. Peut-être aurez-vous des motifs que j'ai ratés. site:www.natures-energies.com inurl:htm -inurl:https|index
.
Cela vient très certainement de la façon dont ils sauvegardent les données dans leur index. Google utilise une base de données construite sur ce qu’ils appellent Big Tables. La base de données Cassandra est une réplique à code source ouvert de ce système de base de données si vous souhaitez en savoir plus à ce sujet.
Il est clair pour moi que la clé principale dans leurs index est l'URI des sites Web (écrit en sens inverse pour simplifier l'ordre de tri). Google ne prend pas littéralement un 301 . Le fait est que lorsque vous créez un 301, vous pouvez changer d’avis plusieurs fois (c’est-à-dire que vous vouliez vraiment dire 302 ou renommer à nouveau la page et que l’URI change à nouveau.) Je pense qu’une des raisons pour lesquelles ils mettent à jour leurs clés d’index ( l’URI) à un rythme plus lent que le contenu des pages car c’est beaucoup plus problématique que de changer le contenu. Cet URI étant une clé, il doit apparaître des milliards de fois dans la base de données et sa modification a un impact énorme.
Juste au cas où j’aurais vérifié votre site Drupal et que vous n’ayez pas défini d’URI canonique. Je suppose que cela pourrait aussi avoir un effet. Mais je pense qu'il sera mis à jour plus tard. Je ne sais pas combien de temps cela prend si. Pourquoi avez-vous décidé de supprimer les alias d'URL?
Une partie du problème peut être que votre nouvelle URL est beaucoup plus complexe que l'ancienne. Votre nouvelle URL est diffusée sur une page dynamique avec trois paramètres d'URL. L'ancienne URL semble être juste une page statique.
Pourquoi avez-vous trois paramètres d'URL? Cette version de la nouvelle URL semble bien fonctionner: http://www.natures-energies.com/index.php?id=76
Google serait peut-être plus disposé à croire la redirection 301 si l'URL était un peu simplifiée.