Aujourd`hui, une petite news qui nous ramène dans le passé, celui du web. Internet Archive (archive.org) est une association à but non lucratif fondée en 1996 à San Francisco. Sont but est de proposer une bibliothèque de l`internet aux chercheurs, historiens, universitaires mais aussi au grand public.
A cet effet elle archive beaucoup de chose, textes, images, vidéos mais également, par extension, les sites tels qu`ils sont à un instant T avec leur contenu et mise en forme. Financée par les dons et notamment par Alexa (qui fournit des statistiques sur le trafic des sites web, j`y reviendrai prochainement), Internet Archive propose de nombreux services dont un très ludique et original: la Wayback Machine, une véritable machine à remonter le temps internet.
En tapant le nom d`un site dans le moteur de recherche, vous accédez à son historique de sauvegarde. Les fréquences de passage sont aléatoires et toutes les versions d`un site ne sont pas enregistrées. Mais il est par contre amusant de constater que pratiquement tous les sites ont une sauvegarde sur Internet Archive.
Je viens de faire l`expérience avec le nom d`une société qui me fut chère en son temps, Adonia. Il se trouve que j`avais créé son premier site en 1999. Internet Archive stockant des données depuis 1996, j`étais curieux de voir quelle version Wayback Machine avait sauvegardée de ce petit site d`une toute petite entreprise.
Voici d`abord à quoi ressemble la page de résultats de Wayback Machine :
A partir de cet écran, vous pouvez vous balader dans le temps, en choisissant une année puis en sélectionnant dans le calendrier les dates en bleu qui correspondent aux périodes d`archivage. En ce qui concerne le site d`Adonia, il a été archivé 66 fois et j`ai pu remonter jusqu`en juin 2000. Même si ce n`est pas vraiment flatteur, cela a le mérite d`être drôle, voici donc à quoi ressemblait mon premier site web :
Au delà de l`anecdote, le travail d`Internet Archive a de nombreuses utilisations pratiques dont, par exemple, la possibilité de retrouver la version sauvegardée d`une page passée en « 404 » (page introuvable).
Reste l`épineuse question du droit à l`oubli : stocker sans l`autorisation des auteurs des sites web et leur contenu, même partiellement, même dans un but noble et désintéressé, n`est ce pas dans certains cas conserver des traces que d`aucuns voudraient avoir oubliées, ou pire, croyaient avoir supprimées ? Je ne parle pas pour moi, évidemment, encore que…
Mes lectures sur ce sujet :
- L`article Wikipedia sur le sujet : http://fr.wikipedia.org/wiki/Internet_Archive
- La présentation par Internet Archive de leurs activités : http://archive.org/about/