J'utilise mon propre module de routage personnalisé dans PHP et mod_rewrite. Une URL de page principale typique ressemble à ceci:
http://www.example.com/services
Une grande partie du site Web affiche les produits sur le site (6 000 pages indexées dans Google), pour lesquels les URL ressemblent à ceci:
http://www.example.com/products/model/bmw/cat/lubricants
Le problème est que dans certaines pages, il existe des liens vers les mêmes pages ci-dessus qui contiennent également un paramètre:
http://www.example.com/products/model/bmw/cat/lubricants/highlight/value
Donc, ces URL ont le même contenu, la seconde a juste un paramètre qui est utilisé pour mettre en évidence un produit donné.
Les problèmes que j'ai sont:
Google a indexé une version de chacune des URL. Je ne veux pas que les visiteurs atterrissent directement à la version avec le paramètre surligné , je ne veux donc pas que ces URL soient indexées.
Dans les Outils pour les webmasters, les pages apparaissent avec un titre en double (je ne sais pas pourquoi je ne reçois pas d'avertissement concernant le contenu en double/méta/etc aussi, car elles sont identiques, mais ..). Donc, cela doit être corrigé.
Je peux penser à ces solutions possibles:
Utilisez le <link rel="canonical">
lorsque la page est demandée avec le paramètre en surbrillance et pointez sur celle qui ne le contient pas. Laissez les URL sous la forme qu'elles sont maintenant. Attendez que Google les fusionne à temps.
Au lieu de "réécrire" le paramètre surligné (avec /), ajoutez-le de la manière classique: www.example.com/products/model/bmw/cat/lubricants/?highlight=value
et ajoutez surlignez dans les outils pour les webmasters pour ignorer la liste des paramètres; De cette façon, les moteurs de recherche distingueraient les paramètres qui ne changent pas vraiment le contenu de la page.
Cette solution permettrait également de raccourcir un peu la profondeur (vue par les moteurs de recherche), et je pense que c'est une bonne chose du point de vue du référencement.
Une combinaison de 1 et 2: liens canoniques et paramètres classiques.
Encore une fois, dois-je ajouter le paramètre dans Outils pour les webmasters afin de forcer Google fusionner les résultats sans attendre une analyse de ces pages?
Celui-ci est stupide, mais: ajoutez mettez en surbrillance dans Webmaster Tools et conservez les URL telles qu'elles sont, mais je ne pense pas que cela fonctionne de cette façon et Google attend que les URL sous la forme? x = y afin de détecter les paramètres et d'exclure les pages des résultats.
Alors, lequel de ceux-ci fonctionnerait le mieux? Y a-t-il autre chose que je devrais faire?
Il n'y a que 300 résultats indexés dans Google de pages avec le paramètre. Cela ne me dérangerait pas de les perdre, mais une "fusion" avec les pages sans paramètre serait préférable.
Et cette mention dans les Outils pour les webmasters sur les titres en double me dérange un peu. Cela affecte-t-il le classement de ces pages (ou de leurs correspondants sans paramètre)?
Oui, je pense qu'une combinaison d'URL canoniques et de paramètres de chaîne de requête classiques serait la meilleure solution dans ce cas. Google peut généralement détecter le contenu en double, mais parfois, il ne choisit pas la meilleure URL. L'utilisation d'un terme canonique signifie que tous les liens vers votre URL de surbrillance sont essentiellement considérés comme un lien pour l'URL canonique.
La seule autre solution envisageable serait de toujours créer un lien vers l'URL canonique et d'utiliser une sorte de détection pour décider d'afficher ou non la surbrillance. Mais cela dépend des conditions dans lesquelles vous montrez la surbrillance. Par exemple, vous pouvez détecter l'URL de référence (telle que search?q=value
), puis mettre en surbrillance ce qui correspond à la "valeur". L'approche n ° 3 ci-dessus est probablement plus facile que cela.