web-dev-qa-db-fra.com

SEO: contenu similaire, mais non dupliqué, sur plusieurs sous-domaines

J'ai un site Web qui permet aux utilisateurs de trouver/soumettre des conseils pour faire des activités de fitness spécifiques.

Le site est structuré comme "[activité] .exemple.com"

  • exemple.com
  • natation.exemple.com
  • levage.exemple.com

Chaque sous-domaine est censé être une communauté (partiellement) fermée spécifique à cette activité. Par exemple, le sous-domaine de la natation est l'endroit où tous les conseils de natation sont créés et partagés.

Toutefois, certains conseils apparaissent sur tous les sous-domaines (par exemple, un conseil "d'étirement" apparaîtra probablement sur toutes les pages d'activité). Les meilleurs conseils peuvent également être regroupés dans le domaine racine. Cela se produit assez souvent et je me demande quelles sont les implications pour le référencement.

Reddit est un exemple de site ayant une configuration similaire. Ils ont leur site configuré pour rediriger 301 "[subreddit] .reddit.com" sur "reddit.com/r/[subreddit]". Vraisemblablement, c'est à des fins de référencement.

Suis-je blessé sur le plan SEO en ayant ces sous-domaines? C'est à dire. Google les voit-il comme des sites distincts avec un contenu en double? Devrais-je structurer le site plus comme reddit avec la structure de sous-répertoires à la place?

Je sais que des questions liées à celle-ci ont reçu une réponse, mais celles-ci concernent davantage le contenu dupliqué exact.

Merci d'avance pour votre aide.

4
venables

En ce qui concerne Google il n'y a pas de différence entre les sous-domaines et les sous-répertoires . Ils ne sont donc certainement pas considérés comme des sites distincts. En outre, le concept de site Web n'a aucune pertinence dans la mesure où le contenu dupliqué disparaît, car la page d'origine, quelle que soit son origine, reste dans les résultats de la recherche, tandis que toutes les autres sont filtrées (ou si c'est leur objectif).

Il est difficile de dire avec précision ou avec précision quelle quantité de contenu doit être dupliquée pour qu'une page soit considérée comme un contenu dupliqué et filtrée. Google n'a pas proposé de règles spécifiques sur la façon dont ils déterminent cela (pour des raisons évidentes) et personne n'a effectué d'étude de quelque nature que ce soit qui indique de manière probante quel pourcentage de contenu doit être dupliqué ou que d'autres facteurs contribuent à déterminer que le contenu est dupliqué.

Évidemment, plus le contenu d'une page est dupliqué, plus le risque d'être filtré est dupliqué. Mais puisque ce même contenu se trouve déjà sur votre site Web, ce n'est pas grave. Il sera toujours trouvé sur les pages que Google décidera d’être l’original et la liste dans ses résultats de recherche. Mais si vous voulez faire de votre mieux pour empêcher cela, essayez de vous assurer qu'un certain pourcentage, disons 50%, de vos pages est unique et non ce contenu qui peut être dupliqué sur plusieurs pages. En gros, essayez d'éviter de créer des pages entières à partir de ce contenu dynamique et éventuellement dupliqué.

4
John Conde

Pour le référencement, vous pouvez regrouper la version préférée du contenu dans un emplacement pour chaque sujet et utiliser la meilleure stratégie disponible (probablement 301 redirections) pour indiquer l'emplacement de la version préférée du contenu. Les balises canoniques pourraient fonctionner (en fonction des similitudes de contenu) dans certains cas, mais il n’ya aucune garantie, vous devrez le tester. Avec la dernière mise à jour de l'algorithme de Google ce mois-ci, visant apparemment à nuire aux batteries de contenu, il ne serait pas dommageable de ne disposer que d'une version préférée, vous ne ressemblerez donc pas à une batterie de contenu.

Assurez-vous de lire ceci, il contient de bons conseils pour votre situation. Je sais que vous dites que ce n'est pas pareil, mais quand même une bonne ressource si vous ne l'avez pas lue: http://googlewebmastercentral.blogspot.com/2009/10/reunifying-duplicate-content-on-on- votre.html

Edited , réponse mise à jour sur les balises canoniques basée sur les commentaires de John Conde.

1
JMC