Google prétend être juste et il est dans l'intérêt de la société (la plupart du temps) de parcourir Internet à la recherche de tout ce à quoi ses spiders peuvent accéder. Je veux savoir:
Des références, en particulier à la propre documentation de Google, seraient particulièrement impressionnantes.
Quelques idées sur le type de choses:
robots.txt
d'un domaine est exclu de l'index Google.En savoir plus sur le Deep Web
Mis à part Twitter, Google n'indexe pas très bien Tumblr . Les articles de blog sur Tumblr sont plus faciles à trouver en utilisant la recherche sur Tumblr. De plus, tout ce qui se trouve sur Google Sites n'est pas (ou est à peine) indexé. Si vous démarrez un site Google, procurez-vous votre propre domaine.
Les petits blogs qui ne sont pas mis à jour régulièrement sont souvent vidés des résultats de recherche. Plus tout ce qu'ils pensent est un splog .
Eh bien, la plupart du contenu Twitter n’est pas indexé par Google, même s’il est public. Auparavant, il était disponible pour Google, mais ce n’est plus le cas depuis l’expiration de leur contrat.
Source .
Cela dépend dans quel pays vous êtes. Dans Allemagne , il ne montre pas des milliers de sites que le gouvernement pense ne pas être bons pour vous, et la liste s'allonge chaque année par milliers.
Google est le moteur de la censure sur Internet. Si vous voulez un Internet gratuit, utilisez des entreprises non perverses, telles que DuckDuckGo ou autres.
Vous ne pouvez pas recherchez un mot clé avec des caractères spéciaux dans Google Search :
En règle générale, la ponctuation est ignorée, y compris @ # $% ^ & * () = + []\et d'autres caractères spéciaux.
Ceci est particulièrement gênant lorsque Google utilise du code.
Google supprime les résultats de recherche considérés comme portant atteinte aux droits de propriété intellectuelle à la suite de la suppression de DMCA et de demandes similaires. Voir Formulaire de demande de suppression des résultats de recherche de Google (il peut contenir une URL supplémentaire, btw).
Les sites avec tellement de contenu que Google n'a tout simplement pas eu le temps (ni l'envie) de tout indexer.
Les sites qui ne disposent pas d'une carte de site explorable et qui nécessitent que Google fournisse des termes de recherche pour accéder aux résultats disponibles sur le site peuvent ne pas être entièrement indexés.