J'ai une page Web, disons http://domain/purchase
et dans cette page, j'ai un formulaire Web. Lorsqu’il soumet ce formulaire (qui a une validation côté client et côté serveur et ne sera pas validé tant que les champs ne sont pas renseignés correctement), il sera redirigé vers une autre page, où il pourra choisir d’autres choix et spécifier d'autres paramètres, puis achetez notre produit. Disons que la deuxième page est http://domain/options
.
Ainsi, l'utilisateur se rend sur notre site et visite http://domain/purchase
, remplit le formulaire, le soumet puis est redirigé vers la deuxième page, http://doamin/options?parameter1=value1¶meter2=value2
, qui contient les paramètres de la première page. Ceci est très courant lors du passage de paramètres entre des pages Web (ou techniquement, entre des URL).
À présent, je passais en revue mon site Web et constatais que Google avait indexé certaines de mes pages Web et URL redirigées, telles que:
http://domain/options?parameter1=value1¶meter2=value2
http://domain/options?parameter1=value3¶meter2=value4
http://domain/options?parameter1=value5¶meter2=value6
http://domain/options?parameter1=value7¶meter2=value8
http://domain/options?parameter1=value9¶meter2=value10
Cela signifie que Google Bot a visité notre page http://domain/purchase
et a rempli notre formulaire et l'a soumis. Il était redirigé vers l'autre URL avec les paramètres correspondants. C'est la seule façon qui me semble logique. Google remplit-il vraiment les formulaires?
PS: Tous les paramètres sont significatifs, ce qui signifie qu'ils ne sont pas remplis de manière arbitraire. Par exemple, le paramètre téléphone dans les pages indexées a des numéros de téléphone corrects. Comment est-ce possible?
Google a été capable d'explorer les formulaires HTML depuis 2008 .
Après avoir choisi les valeurs pour chaque entrée, nous générons et essayons ensuite d'analyser les URL qui correspondent à une requête éventuelle d'un utilisateur. Si nous vérifions que la page Web résultant de notre requête est valide, intéressante et qu'elle n'inclut pas de contenu dans notre index, nous pouvons l'inclure dans notre index de la même manière que nous inclurions toute autre page Web.
D'autre part, comme il est peu probable que GoogleBot connaisse les paramètres corrects à insérer dans ces champs, il peut y avoir une autre explication. Est-il possible que vos utilisateurs se connectent aux pages redirigées?
Google devient plus agressif lorsqu'il s'agit de soumettre des formulaires.