web-dev-qa-db-fra.com

Une balise <head> manquante empêchera-t-elle Google d'indexer un site WordPress?

J'essayais récemment de configurer un compte Outils Google Webmasters pour un client. J'ai passé presque une heure à me demander pourquoi je ne pouvais pas valider le site lorsque j'ai constaté que la balise d'ouverture était absente de header.php.

Le site est destiné à une organisation de grande taille, mais Google ne l'affiche même pas lorsque le nom de l'organisation est recherché. Je me demandais si le header.php défectueux pourrait être à blâmer? J'aimerais savoir si c'est vrai, car il serait bon que le client le sache pour certaines raisons.

4
user3648406

Google indexera tout ce qu'il peut, quelles que soient les erreurs/problèmes qu'il contient, à condition de ne pas explicitement indiquer à Googlebot de ne pas analyser.

Avec une section manquante <head> _, tout ce qui manque, comme le titre de la page, les balises méta, les feuilles de style, les appels javascript, etc. Sans voir le site en question, il est difficile de conseiller davantage.

4
zigojacko

Googlebot se soucie-t-il de la validité du code HTML?

Dans cette vidéo YouTube, Matt Cutts dit que le robot est conçu pour traiter les erreurs de syntaxe HTML.

Google ne vous pénalise pas si vous avez un code HTML invalide.

Google met davantage l'accent sur le contenu de qualité et non sur la syntaxe HTML.

Je ne m'attends donc pas à ce qu'une balise <head> défectueuse soit la seule raison pour laquelle le site n'est pas inclus. Compte tenu de cette erreur, il se peut que d’autres erreurs bloquent le bot, telles que votre fichier robots.txt, les règles de réécriture ou le code de détection du navigateur.

Je vérifierais les journaux des serveurs pour voir si Google visite effectivement votre site.

Ensuite, vérifiez votre balisage et utilisez Fetch comme GoogleBot pour tester le site.

1
jeffatrackaid

Il semble très probable que Google analysera le site. Comme tous les navigateurs, ils essaieront d'ignorer et de contourner les nombreuses erreurs que leur araignée doit rencontrer sur le beaucoup de sites qu'ils spider.

Cela ne veut pas dire que votre rang ne sera pas déprimé de manière drastique, car un tel problème cassé le fera probablement .

En ce qui concerne le fait de ne pas être indexé du tout, cela ressemble certainement à la nécessité de rechercher un fichier /robots.txt pour le site afin de s’assurer qu’il autorise le spidering et l’indexation. Certaines anciennes versions de wordpress facilitaient le basculement sur un fichier robots.txt qui recommandait que toutes les araignées et non araignées le blog. Donc, je regarderais certainement votre emplacement example.com/robots.txt en premier.

Vous devez également vérifier si le site n'est pas du tout indexé, ou s'il est simplement classé très bas (auquel contribuerait le <head>), en effectuant une recherche avec site:example.com pour trouver spécifiquement les résultats indexés à l'aide de la commande URL du site.

1
Kzqai

Vous aurez certainement besoin de la balise head pour pouvoir vérifier votre site Web pour les maîtres Google.

C'est notamment le cas pour Google Analytics:

Collez votre extrait (intégralement) dans chaque page Web que vous souhaitez suivre. Collez-le immédiatement avant la balise </head> de fermeture.

Source: Configurer le code de suivi Web - Aide sur Analytics

et les balises META sont déclarées dans la partie <head></head> aussi ce n’est pas bon pour le référencement, en particulier c’est là que Google recherche des informations sur l’indexation

0
codenathan

Google indexe les sites avec 'invalide' html. Vous pouvez voir si les pages sont indexées en effectuant un site: effectuez une recherche car les pages pourraient être indexées, mais leur classement n'est pas très bon.

0
user29671