Après analyse de nos liens entrants, il apparaît que nous obtenons quelques milliers de liens d’un site particulier dont les pages de résultats de moteur de recherche (SERP) sont indexées par les moteurs de recherche. Le SERP du site Web comporte une barre latérale commune contenant des liens vers notre site.
Nous obtenons donc des liens à partir de pages avec des URL ressemblant à celles-ci:
http://example.com/search?q=foo
http://example.com/search?q=bar&page=10
En regardant le robots.txt
du site, on dirait qu'ils disent aux robots de ne pas indexer /search
.
Ces liens nuisent-ils à notre classement? Nous sommes à la page 1 ou 2 pour les mots-clés qui nous intéressent. Nous aimerions aller à la page 1 pour tout. Devrions-nous essayer de les désavouer ou de les laisser seuls?
Sans voir le site, rien ici ne le distingue comme étant un site à bloquer. Vous demandez si vous devriez bloquer les sites qui utilisent des chaînes de requête? Non! Ce serait probablement le champ de référence et Google utilise des chaînes de requête. Il utilise également/search. Si vous parlez du champ demandeur, cela n’a aucun sens.
Vous devez évaluer chaque site individuellement et ne pas regarder ces champs qui ne contiennent pas d’indice. Une fois que vous avez consulté le site, vous bloquez le site si cela est justifié.
En regardant le fichier robots.txt du site, il semble qu’ils disent aux robots de ne pas indexer/chercher.
le fichier robots.txt peut empêcher l'analyse, pas l'indexation.
pour être sûr que vous désavouez vraiment tous les liens, ce qui pourrait nuire à votre site, désavouer tout le domaine , comme:
Si vous souhaitez que Google ignore tous les liens d'un domaine entier (par exemple, exemple.com), ajoutez la ligne domaine: exemple.com.
Vous souhaitez principalement rechercher la duplication lorsque vous utilisez des chaînes de requête.
Les chaînes créent-elles une nouvelle URL avec un contenu identique à une autre page de votre site?
Si tel est le cas, vous devrez:
a) Empêchez Google d'explorer ces pages à l'aide du fichier robots.txt. b) Empêcher Google d’indexer ces pages à l’aide de la balise meta 'noindex'.
Il existe également une fonctionnalité dans les outils pour les webmasters (ou la console de recherche telle qu'elle s'appelle maintenant) qui vous permet d'indiquer spécifiquement à Google ce que font différents paramètres de recherche afin de vous assurer qu'ils gèrent ces URL correctement.