J'utilise Google CSE sur mon site. Dès que la nouvelle entité est publiée, elle est immédiatement ajoutée au script de rendu sitemap.xml. Combien de temps après l'extraction de Googlebot, les nouvelles entités devraient être consultables avec le CST?
J'ai ajouté quelques entités la semaine dernière. J'ai consulté les journaux du serveur Web et Googlebot a téléchargé mon dernier sitemap le 10 avril, en même temps qu'il visitait de nouvelles pages d'entités. Nous sommes aujourd'hui le 12 avril et je ne trouve toujours pas mes nouveaux articles dans le CST et dans la recherche Google régulière, comme
"my entity name" site:mysite.com
Est-ce normal? Quand pourrai-je trouver de nouvelles pages? Ils peuvent ou non avoir des liens internes d'autres pages de site déjà indexés et actualisés périodiquement, mais de nouveaux éléments sont toujours ajoutés au sitemap.
Il n'y a pas d'heure fixe entre le moment où Google explore un site et son moment où il est disponible sur l'index. Il y a quelques années, il aurait fallu jusqu'à 6 semaines pour que le contenu soit ajouté car Google reconstruisait l'index principal par lots. Désormais, la mise à jour en direct prend plus de temps, mais il peut être ajouté à l'index à tout moment. quelques jours à quelques semaines après l'exploration du site. Cela dépend d'un grand nombre de facteurs, dont beaucoup ne seront pas publiés par Google, car ils les classent comme propriétaires.
Une fois que vous avez envoyé votre URL, vous devrez peut-être attendre un peu de temps pour que Google traite votre demande et analyse et indexe la page. De plus, sachez que nous ne pouvons pas garantir que Google indexera toutes vos modifications car il s’appuie sur un algorithme complexe pour mettre à jour les matériaux indexés.
- À partir de Google ( https://support.google.com/webmasters/answer/6065812?hl=fr )
Si vous souhaitez que vos pages soient indexées plus rapidement, vous devez faire plus que les ajouter à votre sitemap. Un sitemap ne transmet aucun lien aux pages et Google n'indexe généralement pas les pages sans lien. Voir Le sitemap Paradox pour plus d'informations.
Vous devez lier de nouvelles pages à partir d'autres pages de votre site. Par exemple, il pourrait être intéressant d’avoir une liste "récemment publiée" sur votre page d’accueil. Votre page d'accueil est une page de classement élevé qui peut généralement contenir suffisamment de jus de liens pour que les éléments liés y soient indexés.
Un autre moyen d'informer les moteurs de recherche de votre nouveau contenu consiste à utiliser des services de ping qui les alertent. Le logiciel de blog WordPress intègre cette fonctionnalité et comporte un page wiki expliquant comment procéder . Ils comptent principalement sur Ping-O-Matic pour diffuser le mot auprès des différents moteurs de recherche concernant votre contenu mis à jour.
Il s’agit du moteur de recherche personnalisé de Google, qui n’est pas le moteur de recherche de Google. C'est une fonctionnalité dans laquelle un site peut avoir un moteur de recherche personnalisé pour le site. Ceci, au moins, est une fonctionnalité de recherche de site.
Ce sont deux choses différentes bien qu'il existe une relation entre les deux.
En supposant qu'un propriétaire de site choisisse et implémente la fonctionnalité Google CSE et que toutes les pages du site n'aient pas été indexées dans le moteur de recherche Google, que se passe-t-il?
Google, pour les clients du CST, garantit que toutes les pages d'un site seront indexées rapidement. Ceci à condition qu'il n'y ait pas de pénalité pour le site qui gêne. Les choses ont assez changé récemment avec toutes les mises à jour de 2015. Il est plus possible qu'une pénalité vous gêne et il est donc primordial qu'un site s'assure qu'aucune pénalité n'existe.
Google va complètement récupérer des pages et récupérer des pages précédemment inconnues qu'il n'a pas encore vues. Il utilisera le plan du site en tant qu’audit pour s’assurer que toutes les pages sont récupérées. Google tentera de le faire très rapidement, bien que, en fonction de la taille et de la vitesse du site, cela puisse prendre des semaines, voire des mois.
Pour s'assurer que le CST est complet. Le moteur de recherche Google et le moteur de recherche personnalisé utilisent le même index. Si le site n'est pas entièrement indexé, le fait d'être client du CST garantira que Google tentera au moins d'indexer l'intégralité du site.
Nous revenons à la manière dont Google se comporte normalement et cela dépend en grande partie de vous.
Demandez-vous:
En supposant que tout va bien, Google verra les nouvelles pages très rapidement. Sinon, cela peut prendre un certain temps en fonction de tous les facteurs susmentionnés. En bref, cela peut prendre des minutes ou des semaines. À de rares occasions, des mois.
Non, pas toujours. Google peut choisir d'utiliser votre plan Sitemap uniquement pour vérifier s'il peut récupérer correctement les pages de vos sites. Ceci est plus commun que pas. Google est étonnamment old-school. Il préférera et continuera d’indexer votre site comme il l’a toujours fait pour tous les sites depuis le début du temps, s’il le peut. Avoir un plan du site la plupart du temps n’ajoute aucun avantage au site, à part des pages derrière un login, un paywall ou un site énorme.
Donc, ajouter une page à votre sitemap peut ne rien faire. Il est important qu’il y ait un lien vers une nouvelle page dans un lieu important, tel que la page d’accueil.
Non. Si un plan Sitemap contient des pages non liées, Google les récupère et les indexe. Cependant, Google n'aime pas cela. Google estime que toutes les pages devraient être accessibles via le site lui-même. Google pense également qu'un grand nombre de pages non liées dans le plan du site est un signal pour un site de spam. Ils ne peuvent pas avoir plus tort sur ce point. Pour cette raison, les pages trouvées après les liens sur le site sont indexées en premier et les pages trouvées dans le sitemap en second. Ce n'est peut-être pas strictement le cas, mais suffisamment proche pour être généralement vrai.
Vous et moi savons qu'il n'est pas possible de lier un grand nombre de pages et Google n'aime pas les pages de navigation. De plus, ces pages peuvent être lourdes et mauvaises pour l'expérience utilisateur (UX). J'ai abandonné le mien il y a longtemps et j'avais l'intention d'utiliser le CST comme remplaçant valide.
Pas très bien. Ce qui est dommage. Il s’agit de l’occasion idéale pour un webmaster d’utiliser le plan Sitemap pour signaler à Google toutes les pages d’un site et utiliser le moteur de recherche personnalisé en tant que mécanisme permettant à l’utilisateur de rechercher un contenu ne pouvant pas être lié efficacement.
Google semble être l'ours grincheux dans ce processus par ailleurs parfait qu'ils ont créé. Cela vous bat d'avoir des pages dans votre sitemap qui ne sont pas liées sur le site, cela vous bat si vous êtes frustré et essayez de lier ces pages à travers des pages de navigation, et cela prend du temps doux d'indexer les pages trouvées dans le sitemap et non trouvé à travers des liens.
En outre, la recherche sur les sites n’est pas une fonctionnalité aussi populaire et semble être sous-utilisée dans la plupart des sites. Il est difficile de convertir un utilisateur en utilisateur de recherche sur le site. C'est un fait triste. La plupart reviendront aux SERP et poursuivront la recherche même si leur prochain clic est de retour sur votre site. Fou hein?