J'ai cherché dans Google mais je ne trouve pas de réponse à cette question.
Un fichier robots.txt peut contenir la ligne suivante:
Sitemap: http://www.mysite.com/sitemapindex.xml
mais est-il possible de spécifier plusieurs fichiers d'index de sitemaps dans le fichier robots.txt et de demander aux moteurs de recherche de reconnaître cela et d'explorer TOUS les sitemaps référencés dans chaque fichier d'index de sitemaps? Par exemple, cela fonctionnera-t-il:
Sitemap: http://www.mysite.com/sitemapindex1.xml
Sitemap: http://www.mysite.com/sitemapindex2.xml
Sitemap: http://www.mysite.com/sitemapindex3.xml
Oui, il est possible d'avoir plusieurs fichiers sitemap-index-file :
Vous pouvez avoir plus d'un Fichier d'index Sitemap.
Mettez en surbrillance par moi.
Oui, il est possible de répertorier plusieurs fichiers sitemap dans robots.txt
, voir aussi sur le site sitemap.org :
Vous pouvez spécifier plus d'un Fichier Sitemap par fichier robots.txt.
Sitemap: http://www.example.com/sitemap-Host1.xml Sitemap: http://www.example.com/sitemap-Host2.xml
Mettez en surbrillance par moi, cela ne peut pas être mal lu, je dirais, donc simplement parlé, cela peut être fait.
Cela est également nécessaire pour les soumissions croisées, pour lesquelles btw. les robots.txt
a été choisi.
Btw Google, Yahoo et Bing, tous sont membres de sitemaps.org :
Le plan du site 0.90 est proposé sous les termes de la licence Creative Commons Attribution-ShareAlike et a une large adoption, y compris le support de Google, Yahoo !, et Microsoft.
Ainsi, vous pouvez être assuré que vos entrées de plan de site seront correctement lues par les robots des moteurs de recherche.
Les soumettre via les outils pour les webmasters ne peut pas faire de mal non plus - comme John Muellercommenté .
Si votre plan de site fait plus de 10 Mo (non compressé) ou contient plus de 50 000 entrées, Google exige que vous utilisiez plusieurs plans de site groupés avec un fichier d'index de plan de site .
Dans votre fichier robots.txt, pointez sur un index de plan de site qui devrait ressembler à ceci:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2012-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2012-01-01</lastmod>
</sitemap>
</sitemapindex>
Il est recommandé de créer un fichier d'index de sitemap, plutôt des URL XML distinctes à insérer dans votre fichier robots.txt.
Ensuite, placez l'URL du plan du site indexé comme ci-dessous dans votre fichier robots.txt.
Sitemap: http://www.yoursite.com/sitemap_index.xml
Si vous souhaitez apprendre à créer une URL de sitemap indexée, suivez ces instructions guide de sitemap.org
Meilleures pratiques: