Plus de 40 000 pages de contenu dupliqué ont été marquées lors d'un audit. Il semble que la plupart sont dues aux paramètres dans les URL. Le format est ci-dessous:
http://example.org/site/UserLogin
http://example.org/site/UserLogin?NEXTURL=http://www.domain.org/folder1/page1
http://example.org/site/UserLogin?NEXTURL=http://www.domain.org/folder2/page2
http://example.org/site/UserLogin?NEXTURL=http://www.domain.org/folder3/page3
L'ajout du paramètre dans la console de recherche résoudrait-il ces problèmes?
rel="canonical"
n'est pas une option en raison du CMS utilisé par le client.
Je voudrais canoncilise la page originale sans les paramètres à elle-même, ce qui explique à google c'est l'original et vous pouvez ignorer le reste.
<link rel="canonical" href="http://domain.org/site/UserLogin" />
Nous avons dû faire cela récemment sur un site Web client. Il nous a fallu quelques jours pour intervenir, mais nous nous sommes débarrassés des doublons.
L'ajout du paramètre dans (Google) Search Console résoudrait-il ces problèmes?
Même dans ce cas, cela n’aiderait pas à 100%, car il existe d’autres moteurs de recherche que votre client voudrait que son site Web soit indexé par d’autres moteurs de recherche tels que Bing et Yandex, et vous devrez peut-être aussi utiliser leurs outils. trier les paramètres.
Etant donné que les pages mettant uniquement en évidence les formulaires de connexion des utilisateurs n'offrent aucune valeur aux invités occasionnels, nous vous conseillons de ne pas les indexer en ajoutant les éléments suivants entre les balises <head>
et </head>
de votre code HTML:
<META NAME="ROBOTS" CONTENT="NOINDEX">
Si cela n'est pas possible dans votre configuration, vous pouvez obtenir le même effet via la balise d'en-tête HTTP suivante:
X-Robots-Tag: noindex
Si la balise canonical de l'en-tête n'est pas une option, vous avez plusieurs solutions pour éviter les conséquences d'un contenu en double:
Spécifiez uniquement le contenu principal dans un sitemap sans tous les paramètres, n'incluez que l'URL canonique, mais pas les versions non canoniques * .
Indiquez comment gérer les paramètres avec l'outil Gestion des paramètres pour indiquer à Google les paramètres que vous souhaitez ignorer: - https://www.google.com/webmasters/tools/crawl-url-parameters