Comment trouver le fichier sitemap.xml des sites Web?
par exemple. Aller à stackoverflow/sitemap.xml me procure un 404.
Dans stackoverflow/robots.txt est écrit ce qui suit:
"techniquement, cela n’est pas valable car, pour une raison bien foutue les chemins d'accès aux sitemap doivent être ABSOLUS et non relatifs. Sitemap: /sitemap.xml"
Je ne pense pas qu'il existe une norme quant à l'emplacement du plan du site. C'est pourquoi vous devez spécifier une URL arbitraire dans votre sitemap lorsque vous en ajoutez une à l'aide des outils pour les webmasters de Google.
Il n'y a pas de standard, donc il n'y a pas de garantie. Cela dit, il est courant que le sitemap soit auto-étiqueté et à la racine, comme ceci:
example.com/sitemap.xml
La casse est sensible sur certains serveurs, alors gardez cela à l'esprit. Si ce n'est pas là, regardez dans le fichier robots à la racine:
example.com/robots.txt
Si vous ne le voyez pas dans le fichier de robots, dirigez-vous vers Google et recherchez ceci:
site:example.com filetype:xml
Cela limitera les résultats aux fichiers XML de votre domaine cible. À ce stade, ses essais et erreurs et basés sur les spécificités du site Web avec lequel vous travaillez. Si vous obtenez plusieurs pages de résultats à partir de la phrase de recherche Google ci-dessus, essayez de limiter davantage les résultats:
filetype:xml site:example.com inurl:sitemap
ou
filetype:xml site:example.com inurl:products
Si vous ne parvenez toujours pas à le trouver, vous pouvez right-click > "View Source"
et faire une recherche (ou "control find" ou Ctrl + F
) pour .xml
afin de voir si le code contient une référence.
L'emplacement du plan Sitemap affecte les URL qu'il peut inclure, mais sinon, il n'y a pas de standard. Voici un bon lien avec plus d'explications: http://www.sitemaps.org/protocol.html#location
Selon la documentation du protocole , il existe au moins trois options que les concepteurs de sites Web peuvent utiliser pour indiquer l'emplacement de sitemap.xml aux moteurs de recherche:
Ainsi, à moins d'avoir choisi de publier l'emplacement du sitemap sur leur fichier robots.txt, vous ne pouvez pas savoir vraiment où ils ont placé leurs fichiers sitemap.xml.
Utilisez les opérateurs de recherche Google pour le trouver pour vous
recherche google avec le code ci-dessous ..
inurl: domain.com type de fichier: xml
remplacez domain.com par le domaine dans lequel vous souhaitez trouver le plan du site. Cela devrait lister tous les fichiers XML listés pour le domaine donné .. y compris tous les sitemaps :)