web-dev-qa-db-fra.com

Dois-je fournir un lien vers un sitemap XML à partir de pages?

Un sitemap XML doit-il être lié à partir de pages de site "normales"? Existe-t-il un nom et un emplacement de sitemap standard où les robots le recherchent afin que je n’aie pas besoin d’y accéder? Puis-je simplement le mettre dans la racine du document et lui donner un nom standard?

Est-ce que cela dépend complètement d'un robot Web?

2
olegst

De la documentation :

Informer les robots d'exploration des moteurs de recherche

Une fois que vous avez créé le fichier Sitemap et que vous l'avez placé sur votre serveur Web, vous devez informer les moteurs de recherche prenant en charge ce protocole de son emplacement. Vous pouvez le faire en:

  • le leur soumettre via l'interface de soumission du moteur de recherche
  • en spécifiant l'emplacement dans le fichier robots.txt de votre site
  • envoi d'une requête HTTP

Les moteurs de recherche peuvent ensuite récupérer votre plan Sitemap et mettre les URL à la disposition de leurs moteurs de balayage.

Envoi de votre plan Sitemap via l'interface de soumission du moteur de recherche

Pour envoyer votre plan Sitemap directement à un moteur de recherche, ce qui vous permettra de recevoir des informations sur le statut et les erreurs de traitement, reportez-vous à la documentation de chaque moteur de recherche.

Spécification de l'emplacement du plan Sitemap dans votre fichier robots.txt

Vous pouvez spécifier l'emplacement du plan Sitemap à l'aide d'un fichier robots.txt. Pour ce faire, ajoutez simplement la ligne suivante, y compris l'URL complète du sitemap:

Sitemap: http://www.example.com/sitemap.xml

Cette directive est indépendante de la ligne agent-utilisateur, donc l'endroit où vous la placez dans votre fichier n'a pas d'importance. Si vous avez un fichier d'index Sitemap, vous pouvez inclure l'emplacement de ce fichier uniquement. Vous n'avez pas besoin de répertorier chaque plan Sitemap figurant dans le fichier d'index.

Vous pouvez spécifier plusieurs fichiers Sitemap par fichier robots.txt.

Sitemap: http://www.example.com/sitemap-Host1.xml

Sitemap: http://www.example.com/sitemap-Host2.xml

Envoi de votre plan Sitemap via une requête HTTP

Pour envoyer votre plan Sitemap à l'aide d'une requête HTTP (à remplacer par l'URL fournie par le moteur de recherche), envoyez votre demande à l'URL suivante:/ping? Sitemap = sitemap_url

Par exemple, si votre plan Sitemap se trouve à http://www.example.com/sitemap.gz , votre URL deviendra:

<searchengine_URL>/ping?sitemap=http://www.example.com/sitemap.gz

Les URL encodent tout ce qui suit/ping? Sitemap =:

<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz

Vous pouvez émettre la requête HTTP en utilisant wget, curl ou un autre mécanisme de votre choix. Une demande réussie renverra un code de réponse HTTP 200; Si vous recevez une réponse différente, vous devez soumettre à nouveau votre demande. Le code de réponse HTTP 200 indique uniquement que le moteur de recherche a reçu votre plan Sitemap, et non pas que le plan Sitemap lui-même ou les URL qu'il contient étaient valides. Une méthode simple consiste à configurer un travail automatisé pour générer et soumettre régulièrement des plans Sitemap.

Remarque: Si vous fournissez un fichier d'index Sitemap, il vous suffit d'émettre une seule requête HTTP incluant l'emplacement du fichier d'index Sitemap. vous n'avez pas besoin d'émettre des requêtes individuelles pour chaque plan Sitemap répertorié dans l'index.

1
John Conde