Aujourd’hui, je cherchais sur mon site Web des outils Google Webmaster pour mon site Web, ainsi que des doublons de titres pour les pages suivantes sur mon site Web (petit exemple parmi d’autres sur mon index de site):
/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business
Ce ne sont certainement pas des pages que j'ai créées!
J'ai également jeté un coup d'œil aux données structurées que j'ai créées sur mon site et je peux voir ceci (petit échantillon parmi d'autres):
Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)
Rien de tout cela n'est le résultat de quelque chose que j'ai fait. C'est évidemment une sorte de plan de deuil ou élaboré pour voler un pagerank.
Hier, j'ai installé des redirections et des canoniques 301 automatisés sur toutes mes pages pour tenter de le renforcer (grâce à une aide merveilleuse de la part des personnes qui débordent de la pile). Mais j'aimerais en savoir plus sur ce sujet et sur son objectif.
Les pages inexistantes se retrouvent parfois dans l'index de Google
Les pages inexistantes peuvent être placées de trois manières sur Google ou sur tout autre moteur de recherche, à savoir:
Vos pages sont des liens vers ces pages. (Cela peut être dans un plan du site, une page de profil, un commentaire de blog ou un href basé sur un lien ...) J'ai vu des plugins de WordPress par exemple qui contiennent de tels liens car ils ont été développés sur un site, puis chargé dans la bibliothèque du plug-in, mais le développeur dispose d'une configuration de cache rencontrée avec le plug-in.
Un backlink pointe vers ces pages.
J'ai vu des pages d'index et des chaînes de Google qui n'existent tout simplement pas, bien que les vôtres semblent contenir des mots que je ne vois pas comment Googlebot pourrait les créer.
Liens internes
À présent, il s’agit probablement d’un lien interne, car j’ai cherché dans vos pages de titre sur Google et j’ai trouvé 3 pages, Pro Webmaster, un autre site illustrant ce site et le vôtre. Donc, il semble que quelqu'un ait créé ce lien ou qu'une application/plug-in/malware en ait un.
Enquête
Donc, pour exclure que vos utilisateurs, vous-même ou une application ayez créé ces liens, vous devez vous connecter au SQL (idéalement PHPMyadmin) et rechercher les chaînes .. Assurez-vous que la base de données est vierge de ces pages .. Assumez-vous vous n'obtenez aucun résultat son temps de rechercher des fichiers de cache, et des fichiers php pour ces pages. Si vous ne trouvez rien, c'est probablement parce que quelqu'un vous a associé et que ce n'est plus sur Google car il a été supprimé.
La redirection de la chaîne /?
peut être préjudiciable si quelqu'un veut l'obtenir
Maintenant, je vois que vous avez supprimé toutes les chaînes /?title=
et que vous les avez redirigées vers la page d’accueil. Bien que ce soit une bonne chose à faire, elle peut aussi être nocive en même temps et je vais vous expliquer.
Si quelqu'un spamme votre site avec des backlinks désagréables, la pire chose à faire est de commencer à les rediriger vers la page d'accueil, car Google pourrait considérer cela comme une manipulation du pagerank. C’est parce que 301 redirige le flux de jus depuis le lien externe. Si ce lien est un site Viagra, vous donnez une fausse indication à Google lors de la redirection, ce qui peut revenir et vous mordre.
Vous devez aimer les bons vieux 404
La bonne chose à faire sur les pages inexistantes est d’utiliser un 404, elles sont parfaitement normales et ne donnent en aucun cas à Google l’impression que votre site est brisé. Les pages qui n'existent pas ne figureront jamais dans l'index de Google et les personnes renvoyant des liens vers des pages inexistantes ne doivent pas nuire à votre site si un 404 est renvoyé, mais comme mentionné, un 301 vers la page d'accueil "PEUT", car il conserve le même.
Il y a 1-2 ans, je dirais que la redirection de chaînes est la meilleure méthode, mais depuis les mises à jour de Panda et de Penguin dans Google, j'ai vu des sites essayer de toutes sortes pour nuire à la réputation en ligne (essentiellement Panda, Penguin punit les sites pour des liens de spam, des liens payants et des liens généralement non pertinents) Même si Google affirme qu'il est impossible de nuire à la réputation des autres en ligne, cela soulève la question de savoir pourquoi tant de personnes envoient actuellement du spam et comment savent-elles que ce n'est pas le webmaster qui tente de manipuler son propre classement ? un domaine discutable, mais finissons-en ... Je pense qu'un 404 vous conviendra le mieux dans cette situation.
La modification de la requête doit être directe, plutôt que de rediriger vers /
, de supprimer la chaîne puis 301 en /404/
.