J'ai le formulaire get
suivant sur mon site Web pour le changement de langue.
<form method="get" action="?">
<label for="language">Language: </label>
<select id="language" name="lang">
<option disabled="disabled" value="es">Espanol</option>
<option disabled="disabled" value="da">Dansk</option>
<option value="de">Deutsch</option>
<option value="en">English</option>
<option disabled="disabled" value="fr">Francais</option>
<option disabled="disabled" value="it">Italiano</option>
</select>
<input type="submit" value="GO">
</form>
Cela crée des URL de la forme /?lang=en
et notez qu'actuellement, mon site ne dispose que des URL suivantes:
/?lang=en
/?lang=de
Visiter autre chose (par exemple, /?lang=fr
) renvoie un 404
afin que Google ne les indexe pas.
Le problème, cependant, est que les outils pour les webmasters de Google affichent toutes les langues désactivées sous forme de liens rompus, même si je les ai marquées avec disabled="disabled"
.
Je souhaite empêcher Google d'essayer de visiter ces liens, mais je ne peux pas utiliser rel="nofollow"
sur ces options désactivées, car je ne pense pas que rel
soit un attribut valide de <option />
. Que devrais-je faire?
Notez que je ne veux pas supprimer les options désactivées du formulaire.
Si l'option est désactivée, peu importe la valeur, les utilisateurs réels ne peuvent pas la choisir. Supprimez simplement la valeur de ces options quand elles sont désactivées pour empêcher Googlebot d’explorer:
<option disabled="disabled" value="">Francais</option>
Quelle que soit l'option que vous avez sélectionnée disabled
, Googlebot suit les liens et trouve les liens vers l'état HTTP 404. C'est pourquoi Google signale 404 pages d'erreur dans les outils pour les webmasters de Google.
Si vous ne souhaitez pas que Googlebot explore ces URL, vous pouvez les bloquer dans robots.txt.
Et si vous souhaitez supprimer les pages d'erreur 404 dans Google Webmaster Tools, vous pouvez marquer cet URL comme statut 410 HTTP avec . Htaccess (si votre serveur Web est Apache). Cela prend du temps, mais Google les supprimera des pages d'erreur 404.
Google continuera à signaler les 404 pages dans les Outils pour les webmasters pendant que les liens se trouvent sur votre site. C'est normal. Si vous les avez modifiées en 410 pages d'état, elles seront toujours signalées dans les outils pour les webmasters. Vous pouvez marquer les erreurs d'analyse comme étant "corrigées", mais elles apparaîtront probablement à nouveau si les liens sont toujours sur votre site. Si vous les avez bloqués par le fichier robots.txt, vous trouverez une mention des URL bloquées par le fichier robots.txt dans la section État de l'index.
Les rapports 404 dans les Outils pour les webmasters ne nuisent pas à votre site, mais à Google ce qui a été trouvé lors de l’exploration.