web-dev-qa-db-fra.com

Comment Google traite-t-il les URL non liées?

Dans les outils pour les webmasters de Google, j'ai récemment remarqué plusieurs URL concaténées apparaissant dans les erreurs d'analyse. Après enquête, il semblerait que Google récupère ces liens sur une page contenant les messages d'un utilisateur publiés sur le forum. Je prends le texte brut (non-HTML), le tronque, puis ajoute "..." après, mais si une URL est coupée, je termine par quelque chose comme ceci:

Here's a good link you might find interesting: http://example.com/page...

En d'autres termes, juste un texte simple qui ressemble à une URL. Les erreurs d'exploration de GWT affichent maintenant http://example.com/page.. (notez uniquement 2 points) sous forme d'erreur.

Donc, Google analyse et suit évidemment les URL non liées, mais comment les traitent-elles? Les traitent-ils comme des "nofollow", même s’ils les suivent - c’est-à-dire qu’ils ne comptent pas comme un "vote" ou comme un lien normal?

De même, existe-t-il une solution pour éviter de tronquer les URL?

2
DisgruntledGoat

Google récupère les liens partout où il peut les trouver. Parfois, ces liens sont bons (et mènent à de nouvelles pages inconnues auparavant), parfois ils sont mauvais, ça va. Vous n'avez généralement pas besoin de faire quoi que ce soit de spécial à cet égard, sauf si vous rencontrez beaucoup de trafic d'utilisateurs vers ces URL, vous n'avez pas vraiment besoin de les rediriger. Si ces URL tronquées se trouvent sur votre site, vous pouvez simplement afficher le nom de l'hôte au lieu de l'URL tronquée, mais même cela n'est pas vraiment nécessaire du point de vue de Google.

Étant donné que nous trouvons des liens dans toutes sortes d’endroits et que nous les utilisons principalement pour découvrir des URL inconnues, je ne voudrais pas savoir s’ils passent ou non le PageRank. Je revérifierai ceci pour m'assurer que nous les utilisons correctement juste pour être sûr :).

(Sur une tangente ...) Cela nous indique également que Google est intéressé par la recherche et l'indexation de davantage de contenu sur votre site Web. Par conséquent, si certaines parties ne sont pas indexées de manière optimale, assurez-vous qu'elles Vous pouvez facilement les trouver grâce aux liens normaux sur votre site. Un bon moyen de vérifier l'état d'indexation de certaines parties de votre site Web consiste à diviser les URL en fichiers Sitemap distincts en fonction de la structure logique de votre site. Google indique le nombre d'URL soumises et indexées par fichier Sitemap dans les Outils pour les webmasters, ce qui peut vous aider à identifier les zones potentielles pouvant être révisées.

En général, trouver des 404 légitimes sur un site Web (lorsque les liens sont mauvais/tronqués) ne pose pas de problème et ne compte pas "contre" un site Web. Nous avons publié récemment un article de blog sur ce sujet.

1
John Mueller

Avoir des liens avec des valeurs href qui ne finissent nulle part entraîne généralement une erreur 404 d'une page non existante. Les liens brisés sont mauvais pour votre référencement. Je ne comprends pas pourquoi vous voudriez réellement tronquer les URL?

0
Luuk Barten