J'ai lu une quelques publications à propos de Google AJAX création d'instantanés et je me pose toujours quelques questions:
J'ai un site Web complet AJAX avec beaucoup de pages qui diffèrent les unes des autres avec quelques éléments (comme un annuaire): que se passe-t-il si l'instantané HTML que je sers à Google ne contient que la partie pertinente? (qui se soucie de l'en-tête et du pied de page?). Je crains que cela ne soit considéré comme un cloaker mais, à mon avis, j’aide Google à indexer ce que l’utilisateur cherchera!
De façon plus technique, je ne comprends clairement pas pourquoi les gens devraient utiliser des logiciels spécifiques (htmlunit ...) pour créer un instantané HTML. C'est tellement simple de servir à Googlebot la page EXACT qu'il demande avec quelque chose comme ceci:
# REMOVE "?_escaped_fragment_=" FROM URI
$Uri = str_replace("?_escaped_fragment_=", "", $Uri);
# CALL PAGE
$Html = file_get_contents($BaseURL."".$Uri);
# DISPLAY PAGE
echo $Html;
exit();
Google s'inquiète surtout de la dissimulation lorsque le robot voit quelque chose que l'utilisateur ne voit pas . Lorsque le serveur envoie à Googlebot des mots clés qui ne figurent pas sur la page, la page est indexée pour un contenu incorrect. Les utilisateurs sont frustrés lorsqu'ils visitent une page. Il ne s'agit pas des mots clés qu'ils ont recherchés.
L'inverse de cela est beaucoup moins un problème. Il est peu probable que Google pénalise le fait de retenir le contenu de Googlebot lorsqu'il est présenté aux utilisateurs. Il existe de nombreux cas où cela se produit déjà sans aucun risque de sanction:
Je ne voudrais pas m'inquiéter d'omettre l'en-tête et le pied de page dans les instantanés HTML. En fait, cela pourrait même rendre le développement plus facile, car le code JavaScript de votre site pourrait alors utiliser les mêmes URL de fragment échappées pour extraire le contenu utilisé par Googlebot.
Notons que Google recommande uniquement en utilisant htmlunit
lorsque les pages sont générées principalement par du code JavaScript côté client. Dans les cas où JavaScript récupère des morceaux de code HTML du serveur pour les insérer dans le contenu principal de la page, Google vous recommande votre approche. (Option 2 dans le lien, où htmlunit
est l'option 3.)