web-dev-qa-db-fra.com

Comment résoudre l'avertissement Google «indexé, bien que bloqué par robots.txt» pour une page protégée par la connexion utilisateur?

Ou, en d'autres termes, comment puis-je dire à Google qu'il s'agit d'une page protégée par connexion utilisateur?

Le site Web est essentiellement une application d'une seule page avec un rendu côté serveur. Cela dit, si le visiteur demande une page Web par text/html, le serveur fera un rendu côté serveur pour afficher le html, et téléchargera toute l'application. Après cela, l'application aura son propre routage et accédera à la page à l'intérieur de l'application. L'application ne demande des données que si nécessaire.

Maintenant, google affiche un avertissement Indexed, though blocked by robots.txt, l'URL est en fait une URL des pages de compte de l'utilisateur. C'est protégé, bien sûr.

Si google visite l'url, il verra 200 code http, puis télécharger le html, mais c'est en fait un conteneur vide. Ensuite, puisque ce visiteur n'est pas connecté. L'application accède immédiatement à l'itinéraire de connexion.

Je suppose que cet avertissement aura un impact négatif sur notre référencement. Je me demande ce que je dois faire pour le référencement Google, car notre référencement est assez mauvais maintenant.

1. Répondez avec 403 et tous les fichiers html/app, et naviguez pour vous connecter après le montage de l'application?

2. Tout comme le site Web traditionnel, répondez par 302 pour rediriger Google vers la page de connexion et demandez à nouveau le serveur?

Nous vous remercions de votre temps pour me faire savoir quelle est la bonne façon de dire à Google qu'il s'agit d'une page de connexion utilisateur requise. Il semble si difficile de plaire à Google.

1
Ben P.P. Tung

Je pense que vous voudrez opter pour le 403 - que Google ne devrait pas tenter d'indexer et supprimer de son index. S'il s'agit d'une page qui n'a que du contenu derrière une connexion, elle doit simplement être supprimée.

Un 302 suggère que le contenu a été temporairement déplacé, ce qui n'est pas le cas, et vous pourriez trouver Google indexant la page de connexion et la traitant comme l'URL de la page du compte d'utilisateur protégé, ce qui n'est pas ce que vous voulez.

0
Squiggs.