Je suis passé de Blogger à Wordpress. J'ai défini mon domaine préféré sur non-www dans les outils pour les webmasters. J'ai soumis un plan du site. Mon site Web est correct lorsque je le navigue. Les liens d'autres sites vers mes pages sont bien formés. Dans les outils pour les webmasters, chaque URL de page a un complément 404 se terminant par .htmlprint
Est-il possible de supprimer cette "impression" de mon site Web? Dois-je rediriger tous les liens avec .htmlprint
vers .html
?
Quelque part, votre site est lié à la version "htmlprint". La première chose à faire est de déterminer où se trouve ce lien brisé et de le réparer. Affichez la source de votre page et recherchez "htmlprint".
Au lieu de cela, il est possible que Googlebot interprète mal le code JavaScript de votre page. Googlebot essaie d'exécuter JavaScript pour trouver les URL. Vous pouvez avoir quelque chose comme document.location + "print"
quelque part dans votre JavaScript. Si tel est le cas, il n'y a aucun besoin urgent de le résoudre, Googlebot est juste stupide.
La troisième possibilité est qu’il existe un site tiers reliant ces URL. Dans ce cas, vous n'avez également rien à réparer.
Une fois que vous avez identifié la source des URL et corrigé si possible, vous pouvez rediriger toutes les URL. Vous pouvez utiliser la directive RedirectMatch
dans . Htaccess pour le faire pour tous avec une seule déclaration:
RedirectMatch "/(.*\.html)print$" "http://example.com/$1"
Redirection pour supprimer les paramètres d'URL est un peu différent. Pour supprimer une chaîne de requête de m=1
vous pouvez utiliser ces règles de réécriture:
RewriteEngine On
RewriteCond %{QUERY_STRING} ^m=1$
RewriteRule (.*) $1? [R=permanent]