J'ai des flux RSS sur mon site. J'ai décidé de suivre Stack Exchange et de ne pas autoriser mes flux RSS dans le fichier robots.txt.
Je ne veux pas que le moteur de recherche affiche la page de flux RSS aux gens, ce n'est pas vraiment une bonne page à voir pour les nouveaux visiteurs.
Y at-il un avantage à permettre au moteur de recherche d’explorer le RSS? Ou est-ce une bonne idée générale de l'interdire?
Il y a de nombreuses raisons de ne pas bloquer votre flux, mais vous seul pouvez savoir s'ils sont pertinents pour vous. Par exemple:
example.com feed
, site:example.com inurl:feed
, etc.Je pense que la plupart des moteurs de recherche ne seront pas déroutés lorsqu'ils trouveront un flux contenant un contenu similaire à celui de la page d'accueil du site Web, car les flux sont très courants (presque tous les blogs en contiennent, sites d'actualités, forums,…). Assurez-vous de les lier avec rel
-alternate
et indiquez le type MIME correspondant dans l'attribut type
:
Si le mot clé
alternate
est utilisé avec l'attributtype
défini sur la valeurapplication/rss+xml
ou sur la valeurapplication/atom+xml
Le mot clé crée un lien hypertexte faisant référence à un flux de syndication (bien que ne syndiquant pas nécessairement le même contenu que la page actuelle).
Si vos flux contiennent le même contenu (c'est-à-dire le même nombre d'articles et le même contenu ou moins du contenu) d'une page de votre site, vous pouvez utiliser le type de lien canonical
comme en-tête HTTP:
Link: <http://example.com/>; rel="canonical"
Mais cela ne devrait pas être nécessaire.