web-dev-qa-db-fra.com

sitemap contenant des millions de liens / URL

Je travaille actuellement sur un site de vente/vente aux enchères. La partie impliquée qui fait du conseil en référencement insiste pour générer des URL pour chaque combinaison de produits énumérés sur le site, exemples ci-dessous. Cela ne me semble pas juste de penser que chaque page de produit/catégorie a déjà un lien canonique, donc je suis maintenant vraiment sûr du gain que le nouveau plan du site ferait. Quelqu'un pourrait-il commenter la décision et faire des suggestions/recommandations dans le contexte donné? Merci.

Exemples:

  • www.mywebsite.com/CPU
  • www.mywebsite.com/CPU/Intel
  • www.mywebsite.com/CPU/Intel/Core2Duo
  • www.mywebsite.com/CPU/AMD
  • www.mywebsite.com/CPU/AMD/Phenom
  • www.mywebsite.com/RAM
  • etc...
4
Jeff

Votre question ne contient pas assez d'informations pour fournir une réponse "parfaite". J'ai tendance à penser que vous êtes peut-être en train d'aboyer le mauvais arbre, mais je le fais en supposant les choses suivantes.

Je suppose:

  • vous avez tellement de pages de produits (uniques) à présent que Google ne les a pas toutes explorées (plus de 100 000?)
  • produits vont et viennent avec une telle fréquence que l'araignée est une préoccupation sans fin, et d'une importance cruciale
  • sans plan du site, vous n'obtiendrez probablement pas une analyse de toutes les pages de produits; vous vous fiez donc au sitemap pour afficher toutes les pages dont vous avez besoin.

Mes suggestions:

  • architecte une hiérarchie navigable au profit des araignées (seulement); il est cliquable par les utilisateurs, bien sûr, mais son but est juste pour que l'araignée rampe
  • la hiérarchie de navigation nécessite que chaque produit ne dépasse pas quatre pages de profondeur
  • construisez votre réécriture d'URL pour suivre l'analyse (c'est-à-dire, premier répertoire = produit-catalogue (ou une phrase similaire), deuxième répertoire = explorer jusqu'au premier niveau de spécificité du produit ("stockage"), dernier répertoire = un mot clé, un trait d'union et ID produit, le dernier bit de la chaîne d'URL est Product-Name.html)
  • en ce qui concerne la conception, affichez de façon insignifiante les liens de répertoire consultables aux utilisateurs; vous avez vraiment fait cela pour l'araignée et du point de vue de la convivialité, il est préférable que vos utilisateurs cliquent sur l'interface utilisateur existante
  • orienter l'araignée en désignant tous les autres liens internes par NoFollow (certains diront peut-être que non tous autres liens internes; quelle que soit l'approche suivante/non suivie, vous devez encourager l'araignée à suivre le chemin hiérarchique facile, et non rebondir sur le site en utilisant tous les autres liens naturels)

En résumé, ce que je dis, c'est que vous devriez pas faire une page pour chaque combinaison de produits, après tout, c'est un nombre infini et une tâche impossible. Respectueusement, je ne suis pas d'accord avec votre gars du référencement et de @Eric. Au lieu de cela, je serais certain de créer un "catalogue" navigable pour le bénéfice des araignées et d'associer votre logique de réécriture d'URL aux clics d'exploration ET également votre texte d'ancrage lorsque l'araignée explose. Je serais heureux de partager avec vous une URL qui pourrait servir d'exemple en dehors de ce forum (email: [email protected]).

Si vous envisagez toujours les pages combinées, la logique d'URL existante que vous avez écrite et les cartes de site, travaillez avec ce calcul: vous pouvez avoir jusqu'à 50 000 URL par carte et jusqu'à 1 000 cartes de site. C’est un maximum de 50 millions de pages ... si vous voulez travailler en arrière, vous pouvez vous en servir pour déterminer la limite supérieure du nombre de combinaisons de produits à supprimer.

2
Chris Adragna

Je pense que seules les versions canoniques devraient figurer sur le plan du site. Suivre:

  • www.mywebsite.com/CPU
  • www.mywebsite.com/CPU/Intel
  • www.mywebsite.com/CPU/Intel/Core2Duo
  • www.mywebsite.com/CPU/AMD
  • www.mywebsite.com/CPU/AMD/Phenom

Si tous ces liens renvoient simplement à www.mywebsite.com/CPU, ajoutez uniquement cette adresse à la sitemap. Si chaque page est différente (même s’il ne s’agit que du titre), vous devez toutes les ajouter au sitemap, mais méfiez-vous des contenus en double.

0
Dave