J'ai un site Web qui utilise . Htaccess pour transformer les URL paramétrées en une URL basée sur un modèle de dossier
Par exemple :
www.example.com?lang=de&cat=mycategory
devient
www.example.com/de/mycategory
Maintenant, Google affiche cette page comme
www.example.com/de/category?lang=de&cat=mycategory
dans sa liste de résultats et je ne sais pas pourquoi. Je vérifie le code source du site Web, mais le lien www.example.com/de/category?lang=de&cat=mycategory n'est pas dans le code source. Je ne sais donc pas pourquoi Google propose ce type de lien.
La règle de réécriture dans mon fichier . Htaccess se présente comme suit:
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^de/mycategory /index.php?lang=de&cat=mycategory [NC,L]
La source de votre problème peut être en html ou en javascript, et vous ne pouvez pas contrôler les liens que d'autres personnes mettent aussi sur le net. Et comme il trouve une page lorsqu'il en fait la demande, il l'indexe. Il me manque des informations pour donner une réponse avec un code (en utilisant un CMS? D'autres règles dans .htaccess, etc.), mais voici quelques façons:
Écrivez une redirection permanente en .htaccess pour supprimer la chaîne de requête, mais méfiez-vous de la boucle de redirection (/ de/mycat -> /index.php?lang=de&cat=mycat -> index.php)
Ce type de situation est généralement géré par le CMS: tout ce qui n'est pas un fichier statique existant sur le disque est placé dans le fichier index.php, qui vérifie l'exactitude de l'URL et envoie des redirections si nécessaire.
Vous devriez également aller à Google Webmaster Tools , et voir où ils donnent des statistiques d'exploration. Il y a une page où vous pouvez leur dire ce que font quels paramètres dans l'URL.
Utilisez un fichier robots.txt pour empêcher Google/les autres robots d’explorer et d’indexer certains de vos fichiers.