web-dev-qa-db-fra.com

Qu'est-ce qui détermine la fréquence à laquelle Wayback Machine explore son site Web?

Je comprends que archive.org prend sa liste de sites Web à explorer à partir d’Alexa , mais je ne comprends pas comment il détermine les fréquences des instantanés pour chaque site Web. Nous pouvons voir que certains sites Web sont explorés plusieurs fois par jour alors que d'autres sont explorés moins de ne fois par mois . Quelle est la fréquence d'archivage d'un site Web déterminé par la Wayback Machine?

5
Manu H

L'archive Wayback Machine est une combinaison de données provenant d'un grand nombre d'analyses différentes:

  • Alexa rampe, qui apparaît après un délai de 6 mois
  • Nos propres analyses, issues de la liste du million d’Alexa et d’autres
  • ArchiveTeam analyse, réalisé par des volontaires
  • ArchiveIt analyse, effectué par nos plus de 400 partenaires, principalement des bibliothèques, dont beaucoup permettent à leurs données d'être incluses dans la Wayback Machine générale.

Nous avons une interface expérimentale de recherche et d’exploration de Wayback Machine à l’adresse https://web-beta.archive.org/ , qui explique pourquoi chaque capture a été effectuée.

6
Greg Lindahl

Il y a quelques informations à ce sujet sur Wikipedia,

Les instantanés deviennent généralement disponibles plus de 6 mois après leur archivage ou, dans certains cas, même plus tard, 24 mois ou plus. La fréquence des instantanés étant variable, toutes les mises à jour de site Web suivies ne sont pas enregistrées. Il y a parfois des intervalles de plusieurs semaines ou années entre les instantanés. https://en.wikipedia.org/wiki/Wayback_Machine

1
Adam