Retrouver une ancienne version d’un site Web : présentation de la Wayback Machine et de deux alternatives

D’aucuns prétendent qu’Internet est immortel, mais il n’en va pas de même des différentes pages Web. Votre site Internet a planté et vous avez perdu tous vos contenus ? Vous souhaitez consulter votre site Internet préféré mais celui-ci est en panne ? Vous recherchez peut-être un post que vous avez lu il y a quelques jours, mais ne parvenez plus à mettre la main dessus. Les raisons à la recherche d’anciennes pages Web sont multiples. Malheureusement, ce qui a été supprimé ne peut plus être retrouvé ! Mais est-ce bien vrai ?

Même si la page originale a été supprimée, il existe une possibilité pour retrouver son contenu. En effet, certaines organisations réalisent des clichés instantanés de tous les sites Internet. Grâce à des technologies modernes, elles recueillent ces clichés de façon continue et les mettent gratuitement à disposition sur Internet. Le projet de ce type le plus connu est la Wayback Machine. Ce service du projet Internet Archive répertorie une grande partie du World Wide Web accessible publiquement depuis 1996. Nous vous expliquons ci-dessous le principe de fonctionnement de la Wayback Machine et vous présentons également deux alternatives qui vous permettront de consulter d’anciens contenus de pages Web.

Domaine Internet pas cher

Bien plus qu'un simple domaine !

Personnalisez votre présence en ligne avec un nom de domaine pertinent.

Email
Certificat SSL
Assistance 24/7

Projet Internet Archive : des sites Web, des images, des vidéos et des textes obsolètes

En 1992, Brewster Kahle vendait le service de recherche WAIS, son entreprise, pour 15 millions de dollars US à AOL. Il utilise alors ce capital pour fonder une nouvelle entreprise et une organisation à but non lucratif d’après le droit américain. L’entreprise s’appelait Alexa-Internet et a été revendue quelques années plus tard à Amazon.com pour la modique somme de 250 millions de dollars. Grâce à cette revente, Brewster Kahle a pu disposer librement de fonds encore plus substantiels et a investi plusieurs millions dans son projet à but non lucratif : Internet Archive.

C’est également dans le cadre de ce projet qu’a été développée la Wayback Machine : une archive Web permettant de trouver des clichés instantanés d’anciennes pages Web, et ce à différents moments. Sur l’image suivante, vous verrez par exemple à quoi ressemblait la page d’accueil de Facebook (qui s’appelait encore « Thefacebook » à l’époque) le 12 février 2004, c’est-à-dire huit jours après la première mise en ligne du site Internet.

À l’origine, le projet « Internet Archive » était pensé, comme son nom l’indique, comme une archive Web. Lors de la création de l’archive en 1996, Brewster Kahle a utilisé les données de son projet Alexa Internet qui enregistrait le trafic Web de domaines à travers tout le World Wide Web. Alexa est aujourd’hui proposé par Amazon comme un service d’analyse marketing. Au départ, l’Internet Archive devait enregistrer en priorité les sites Web les plus populaires. Selon une étude du magazine Forbes datée de 2015, le nombre de clichés instantanés d’un site Internet sur archive.org (le site Internet du projet) ne correspond pas toujours au rang Alexa ou à la fréquence de mise à jour d’un domaine. Il est donc difficile de savoir quelles sont exactement les méthodes de sélection utilisées par le projet pour scanner et enregistrer les pages Web.

L’Internet Archive ne permet pas uniquement de retrouver des archives de sites Web

En plus de deux décennies d’existence, l’Internet Archive a beaucoup avancé. Cette simple archive de sites Web est devenue une colossale bibliothèque virtuelle. D’après ses propres informations, archive.org utilisait en 2015 une capacité d’espace disque titanesque de 18,5 pétaoctets pour les contenus individuels (et au total 50 pétaoctets, c’est-à-dire 50 mille billions d’octets). Le site enregistrerait plusieurs téraoctets supplémentaires chaque semaine. Selon les dernières études, la Wayback Machine vous permettrait de consulter près de 327 milliards d’anciennes pages Web. Le projet collecte également :

  • des textes et des livres (environ 16 millions),
  • des enregistrements audio (environ 4,4 millions, dont 189 000 enregistrements de concerts live),
  • des productions vidéo et télévisuelles (environ 5,8 millions, dont près de 1,6 million de journaux télévisés),
  • des images (environ 3,1 millions),
  • des logiciels (environ 209 000).

(version : avril 2018)

Soit les médias sont tombés dans le domaine public soit ils ont été envoyés par les détenteurs des droits afin de les préserver pour la postérité. De nombreux contenus proviennent ainsi d’universités, d’organisations gouvernementales comme la NASA, de projets de numérisation de textes comme le projet Gutenberg ou Arvix ainsi que de banques de films et de sons telles que la Prelinger Collection, LibriVox ou l’archive de musique live Etree.

Brewster Kahle est un activiste d’Internet qui s’est engagé en faveur d’un Internet libre, mais aussi du libre accès à la connaissance. Il fut l’un des opposants les plus célèbres au « Mickey Mouse Protection Act » (nom réel : Copyright Term Extension Act), qui a notamment été soutenu par Disney et qui a entraîné une prolongation des droits d’auteur américains : désormais, les œuvres sont protégées par des droits d’auteur pouvant aller jusqu’à 70 ans (50 ans par le passé) après la mort de l’auteur ou du dessinateur. Selon ses détracteurs, dont fait partie Brewster Kahle, des droits d’auteur aussi longs profiteraient uniquement à l’exploitant alors que les œuvres ne seraient pas utilisables par le grand public.

En 2007, l’état de Californie a reconnu officiellement l’Internet Archive créée par Brewster Kahle. L’un des nombreux centres de calcul où sont stockées les copies de sauvegarde de l’archive est même situé dans la nouvelle bibliothèque d’Alexandrie inaugurée en 2002 sous l’égide de l’UNESCO.

Le site Internet de la filiale archive-it.org travaille avec de nombreuses organisations scientifiques qui souhaitent archiver numériquement leurs collections.

Retrouver une ancienne version d’un site Web : pourquoi archiver son site Internet

Internet est en constante évolution : l’augmentation de la vitesse de transmission des données permet l’émergence de nouveaux services alors que d’autres deviennent obsolètes et sombrent dans l’oubli. Les nouvelles informations remplacent souvent les informations anciennes ou obsolètes, notamment sur les portails d’information et les autres sites Internet dynamiques. Il est alors souvent impossible de consulter les anciens articles et les anciennes pages Web. Pourtant, de nombreux utilisateurs souhaiteraient avoir la possibilité de consulter d’anciennes versions d’un site Web. Cette volonté peut être motivée par la nostalgie, par exemple, lorsque vous vous demandez ce que vous aviez écrit à l’époque dans votre profil Myspace. Mais le besoin de consulter l’archive d’un site internet peut également reposer sur des raisons économiques ou juridiques :

  • Votre site est brusquement hors ligne : que votre hébergeur rencontre des problèmes techniques ou que vous n’ayez pas payé la facture, vous retrouverez probablement les contenus perdus dans une archive de sites Web.
  • Vous êtes journaliste, blogueur ou scientifique et souhaitez écrire un article spécialisé : il n’est pas rare que des sources essentielles puissent être trouvées plus rapidement sur Internet. Mais si la page source mise en lien est modifiée, vos lecteurs ne pourront pas trouver les informations et les citations ne correspondront plus au contenu de ces pages. Si vous citez la source à l’aide d’un cliché instantané et d’un timestamp, vos lecteurs pourront toujours retrouver la source.
  • Vous pratiquez le référencement et vous utilisez le « link power » d’anciens domaines. Des outils d’archivage peuvent par ailleurs vous permettre de retirer les liens erronés ou de comparer les modifications apportées aux pages. Certains experts SEO améliorent leur référencement avec des contenus archivés dans des réseaux de blogs privés.
  • Vous avez besoin de preuves juridiques : en cas d’insultes ou de menaces sur Internet, les captures d’écran vous aideront à documenter les attaques personnelles. Si les textes ont déjà été supprimés par leur auteur, utilisez simplement une version plus ancienne du site Internet pour recueillir des preuves. La documentation des processus de travail à l’aide d’une archive peut d’autre part s’avérer utile en cas de litige sur un brevet.

Tutoriel Wayback Machine : retrouver d’anciennes pages Web en 3 étapes

Vous exploitez un site Internet mais ne disposez pas de copie de sauvegarde ? Récupérez les contenus perdus en retrouvant votre ancienne page d’accueil à l’aide de clichés instantanés archive.org. Trois étapes suffisent pour localiser d’anciennes pages Web.

Remarque

Un snapshot (en français un cliché instantané) est toujours pris à un instant « t ». Il décrit l’état actuel des systèmes ou des objets, par exemple d’un site Internet. Les connexions entre les sous-domaines sont conservées, mais le système ne change pas d’état. Par conséquent, les anciennes pages Web sur archive.org permettent une navigation, mais les éléments dynamiques comme les formulaires ne sont plus fonctionnels dans un cliché instantané.

  1. Saisissez archive.org dans la barre de recherche. Wayback Machine offre trois possibilités pour retrouver d’anciennes pages Web :
  • Vous pouvez saisir directement l’URL souhaitée dans la barre de recherche de Wayback Machine en haut, comme indiqué sur l’image ci-dessous. Confirmez avec la touche Entrée pour accéder directement à la page de résultats.
  • Vous pouvez cliquer sur l’icône Web jaune pour accéder à la page principale de Wayback. Vous pourrez y saisir une URL de domaine ou essayer d’autres fonctionnalités. Pour accéder à un site Internet archivé, saisissez l’URL et cliquez sur « Browse History ».
  • Saisissez un mot-clé dans la barre de recherche en bas et sélectionnez « search archived Web sites » (chercher des archives de sites Web). Cliquez ensuite sur « Go » pour accéder à la liste de résultats comprenant les domaines et les descriptions de site Internet contenant ce mot-clé. Les différentes entrées affichent le nom de domaine, la description et le nombre de snapshots effectués au cours d’une période donnée. Par ailleurs, vous obtiendrez des informations sur le nombre de contenus média capturés. Cliquez sur le résultat souhaité.
  1. Sur la page principale de l’URL que vous avez saisie (dans l’exemple ci-dessous gutenberg.org), vous verrez une chronologie. Elle constitue l’axe inférieur d’un diagramme dans lequel chaque date est représentée par une colonne noire. La hauteur des différentes colonnes de ce diagramme en colonnes indique la fréquence à laquelle le robot de la Wayback Machine a scanné le domaine à la date en question. En l’absence de colonne, aucun cliché n’a été effectué à cette date. En 2007 par exemple, très peu de clichés ont été réalisés chaque mois. L’écart que l’on peut identifier indique qu’aucun snapshot n’a été réalisé en novembre.

Dans l’image ci-dessous, vous pouvez également voir les graphiques d’information pour les clichés instantanés pris en 2015. La taille des cercles dans la page de calendrier indique à quelle fréquence le robot a pris des clichés de l’ancienne page Web à la date concernée. Le code couleur est le suivant :

  • bleu pour un scan réussi de la page Web
  • vert pour une redirection
  • orange pour une URL introuvable (erreur 4xx)
  • rouge pour une erreur de serveur (erreur 5xx)
  1. Sélectionnez une date à laquelle l’ancien site Internet a été enregistré par un cliché. Ces enregistrements sont uniquement disponibles pour les jours identifiés par une couleur. Si vous cliquez directement sur la date, vous accédez au snapshot du site. Si vous maintenez le curseur de la souris au-dessus de la date, les différents timestamps, c’est-à-dire les moments précis auxquels un snapshot a été réalisé, sont affichés (comme on peut le voir dans l’image ci-dessous).

Si vous cliquez sur le timestamp, vous accédez à la capture d’écran du site Internet archivé qui vous montre à quoi ressemblait le site Internet à l’heure indiquée. Le timestamp 19:38:40 (orange) donne par exemple le message d’erreur 403. En revanche, le timestamp 21:54:09 vous affiche le site complet.

Pour naviguer dans le site Internet archivé et accéder à d’autres pages, procédez comme d’habitude en utilisant les liens. Les textes peuvent être copiés en toute simplicité. Si vous souhaitez également enregistrer la mise en page et le design, il est possible de réaliser des captures d’écran.

Remarque

Le nom Wayback Machine est inspiré d’un cartoon américain des années 1960. Dans « Mr Peabody’s Improbable History », les personnages Mr. Peabody et Sherman parcourent l’histoire à bord d’une machine à voyager dans le temps qu’ils ont appelée « WABAC-Machine ».

Les options « Summary of… » et « Site Map of… » (situées au-dessus de la chronologie dans l’image du haut) vous ouvrent d’autres possibilités. Le « Summary » révèle combien de fichiers de code, d’images et de fichiers flash ont été trouvés par le robot. La Sitemap présente quant à elle l’intégralité du domaine sous forme de cercle. Chaque section de cercle représente ici une page Web à laquelle vous pouvez directement accéder avec un clic.

Retrouver d’anciennes pages Web ultérieurement grâce au self-snapshot

Vous exploitez un site Internet ou un blog ou vous publiez votre travail auprès d’un prestataire tiers ? Dans ce cas, utilisez la Wayback Machine pour sauvegarder vos contenus. En effet, l’algorithme de Wayback n’enregistre pas automatiquement l’intégralité du World Wide Web. Il existe différentes raisons pour lesquelles archive.org n’archive pas certains sites Internet ou n’affiche pas certains contenus :

  • L’exploitant du site Internet refuse que le site soit indexé. (commande : noindex) ;
  • Le robots.txt décrète que le site Internet ou des parties du site Internet ne doivent pas être indexés ;
  • Le site Internet est protégé par un mot de passe ;
  • L’exploitant du site Internet a personnellement demandé à ce que le site Internet soit retiré de l’archive ;
  • Les éléments dynamiques, qui ne peuvent pas être affichés correctement, constituent une part considérable du site.

Par conséquent, si vous souhaitez archiver votre propre site Web, vous devez vous assurer que le robot peut lire le domaine. Pour ce faire, procédez comme suit :

  1. Visitez à nouveau la page principale de Wayback Machine (présentée dans l’image ci-dessous). Une barre de défilement vous montre les anciennes pages Web susceptibles d’intéresser les visiteurs. Vous y trouverez des outils pratiques, le service d’abonnement pour les institutions scientifiques et l’outil Save-Page-Now.
  1. Si vous souhaitez réaliser un snapshot d’une page Web, il vous suffit de connaître l’URL du domaine. Saisissez-la dans le champ de saisie sous « Save Page Now ». La forme simplifiée de l’adresse du domaine suffit. Dans l’exemple de l’image ci-dessous, il s’agirait de : « douglasadams.com ».
  2. Une petite fenêtre indiquant « Saving Page Now… » apparaît devant le site Internet chargé. Lorsque le processus est terminé, vous verrez apparaître un snapshot de votre site Internet. Vous avez désormais sauvegardé l’ensemble des contenus et des liens pour une utilisation future.
Conseil

Étant donné que les robots de l’archive ne connaissent pas les sites Internet peu connus, il peut être utile de créer vous-même régulièrement des snapshots pour les sites Internet avec une orientation plutôt régionale.

Assistant de téléchargement Wayback Machine pour le rétablissement d’anciennes pages Web

Wayback Machine vous permet de consulter d’anciennes pages Web qui ne sont plus accessibles à leur ancienne URL. Au minimum, vous pouvez ainsi retrouver et enregistrer le contenu textuel des pages correspondantes. Mais parfois, le texte d’un article ne suffit pas et le problème a des racines plus profondes. Il est possible que la page n’existe plus et dans ce cas, la sauvegarde n’apporte aucune aide. Vous souhaiteriez peut-être télécharger l’intégralité du site Internet pour en éditer le code source ou l’enregistrer, pour faire le tri dans les liens défectueux ou pour tester l’optimisation SEO de votre ancien site Internet ? C’est tout à fait possible, grâce à l’assistant de téléchargement Wayback Machine.

Pour utiliser l’assistant de téléchargement WaybackMachine disponible en open source sur GitHub, vous devez tout d’abord installer Ruby. Inutile d’être un expert en Ruby pour utiliser ce programme. En effet, les développeurs ont détaillé les principales commandes de code directement sur la page de téléchargement. Si vous saisissez l’URL souhaitée, le programme chargera les fichiers correspondants sur votre ordinateur. Il crée automatiquement des pages index.html compatibles avec Apache et NGINX. Les utilisateurs avancés pourront quant à eux définir plus en détail les paramètres concernant les timestamps, les filtres URL et les snapshots.

L’outil Archivarix basé sur le Web offre des interfaces utilisateurs clairement structurées et convient aux sites Internet ou aux blogs de petite taille. En effet, ce service normalement payant est gratuit lorsqu’il est utilisé pour des sites Internet comprenant moins de 200 fichiers. Le temps nécessaire pour apprendre à utiliser cet outil est relativement court. Vous devez toutefois vous inscrire pour utiliser Archivarix. Saisissez alors simplement le domaine souhaité et définissez en quelques clics les options d’optimisation et les structures des liens. Renseignez ensuite votre adresse email. Lorsque le téléchargement de l’archive du site Internet est terminé, Archivarix envoie un fichier zip à cette adresse.

L’assistant de téléchargement Wayback Machine est un autre outil en ligne (un grand nombre de ces outils ont des noms très similaires, voire identiques). Cet outil envoie également les copies d’anciennes pages Web par e-mail. La démo gratuite comprend les quatre premières pages de la Wayback Machine. Un site Internet HTML complet coûte environ 15 €, la conversion au format WordPress près de 45 € supplémentaires (version mai 2018). L’abonnement (actuellement 80 €) se révèle avantageux si vous téléchargez un grand nombre de domaines dans le mois.

Archive.org ne propose personnellement aucun assistant de téléchargement de site Internet. En tant que membre de la bibliothèque, c’est-à-dire en tant qu’utilisateur enregistré, vous avez toutefois accès à des millions de textes, d’images et de fichiers audio en téléchargement. Si vous disposez des droits sur une œuvre, vous pouvez la charger pour une utilisation non commerciale dans le domaine public comme le fait la NASA avec une grande partie de ses supports audio et visuels. Elle a par exemple archivé la vidéo suivante, filmée depuis l’ISS, en tant qu’œuvre du domaine public sous licence de la Creative Commons.

L’équipe du projet Open Library souhaite cataloguer l’intégralité des livres. Ce projet permet par ailleurs aux utilisateurs d’emprunter de nombreux livres, hébergés par des tiers, pour une durée de deux semaines. Vous y trouverez les e-books et les textes de l’Internet Archive dans une catégorie spécifique. La plupart du temps, vous pourrez les télécharger gratuitement.

Citation

It's not that expensive. For the cost of 60 miles of highway, we can have a 10 million-book digital library available to a generation that is growing up reading on-screen. Our job is to put the best works of humankind within reach of that generation. (Ce n’est pas particulièrement coûteux. Pour le prix de 96 kilomètres d’autoroute, nous pouvons mettre une bibliothèque numérique contenant 10 millions de livres à disposition d’une génération qui apprend à lire sur un écran. Notre objectif est de faire connaître à cette génération les plus grandes œuvres de l’humanité.) Brewster Kahle : How Google Threatens Books, Washington Post, 05/2009

Alternative 1 : retrouver des sites Internet encore relativement récents avec la recherche Google

L’information que vous recherchez est-elle véritablement ancienne ? Dans le cas contraire, une simple recherche Google peut suffire : à l’instar de la Wayback Machine, Google utilise également des robots pour scanner et indexer les sites Internet. Pour ce faire, Google prend un snapshot de l’intégralité du site Internet. Si le site a été modifié depuis le dernier scan, Google enregistre le snapshot de l’ancienne version du site Web dans le cache. Le nouveau snapshot devient alors l’aperçu actuel. Si le site Internet actuel tombe en panne, cela n’entraîne aucun blocage puisqu’une autre version est disponible dans le cache. Il existe donc un seul timestamp de la page en cache. Celui-ci peut toutefois être plus actuel qu’un snapshot d’Internet Archive. Si aucune ancienne page de ce domaine n’est disponible sur archive.org, Google pourrait donc être la seule possibilité de retrouver un cliché instantané de la page.

Pour afficher la version la plus récente de votre site Internet, saisissez-la simplement comme mot-clé dans Google. Dans la liste de résultats, l’URL devrait se trouver en dessous du titre. Si vous cliquez sur la flèche à droite, un petit menu déroulant apparaît (comme le montre l’image ci-dessous). Si vous cliquez sur « En cache », Google charge pour vous le site Internet dans sa version antérieure à la dernière actualisation.

Il peut arriver que la version actuelle d’un site ne soit pas affichée dans la liste de résultats Google. Cela peut se produire lorsque l’exploitant des pages a défini le domaine sur « noindex » qui indique au moteur de recherche que la page ne doit pas être reprise dans la liste. Une ancienne version d’un site Web peut éventuellement se trouver en cache. Si vous souhaitez consulter un ancien site Internet, mais si celui-ci n’apparaît pas dans les résultats de la recherche, saisissez la commande Google suivante dans votre barre d’adresse :

http://Webcache.googleusercontent.com/search?q=cache:https://www.DOMAIN.com

Dans l’exemple ci-dessus, « DOMAIN.com » fait office de balise pour l’URL recherchée. L’image ci-dessous vous montre la version en cache de archive.org telle qu’elle a été enregistrée par Google le 24 avril 2018. Notez également que les snapshots Google n’affichent pas les éléments dynamiques et les contenus des médias.

Alternative 2 : retrouver des références concernant d’anciennes pages Web avec WebCite

Les journalistes, les blogueurs et les universitaires se réfèrent toujours à des sources en ligne. Et tout comme les publications scientifiques imprimées, qui listent leurs sources dans une bibliographie, de nombreux textes en ligne contiennent également une liste de références qui se présentent généralement sous la forme de liens conduisant directement à la source Internet utilisée. Cependant, comme les pages Web évoluent et sont parfois retirées d’Internet, il est possible que ces liens ne mènent plus aux textes correspondants. Si les lecteurs suivent un lien obsolète, ils peuvent être redirigés vers un tout autre contenu que celui initialement mis en lien par l’auteur dans le cadre de ses recherches. Afin d’éviter cela, l’organisation WebCite® propose un service d’archivage. Vous pouvez ainsi sauvegarder les sources sous forme de snapshot et générer des références que vos lecteurs pourront utiliser. À l’aide d’un lien de destination ou d’un identifiant de snapshot, ils pourront alors consulter directement la source.

Voici comment archiver vos sources avec WebCite :

  1. Sur la page d’accueil de WebCite, vous trouverez le menu principal directement en dessous du nom de domaine. Sélectionnez l’onglet « Comb » (parcourir).
  2. Vous accédez alors au formulaire d’archivage (« archive form »). Si votre document est déjà en ligne, saisissez l’URL dans le premier champ de recherche (« URL to comb for links »), comme indiqué dans l’image ci-dessous. Si le texte n’a pas encore été chargé, mais comprend d’ores et déjà les références sous forme de liens, chargez simplement le fichier. Pour cela, cliquez sur « Explorer ». Si vous saisissez votre adresse e-mail, WebCite vous enverra ultérieurement une liste contenant les snapshots d’URL archivés. Cliquez sur « Comb this URL ».
  1. Après un bref temps d’attente, le site Internet affiche une liste avec les liens possibles. Sélectionnez vos sources en cochant la case adjacente. À la fin de la liste, cliquez sur le bouton « Cache these URLs ».
  2. La fenêtre affiche désormais un message indiquant que vos sources se trouvent dans la file d’attente d’archivage. En plus du lien original, vous obtenez également le lien vers votre snapshot que vous pouvez intégrer en toute simplicité dans vos références. De cette façon, vos lecteurs arriveront sur la même version de votre source que celle utilisée pour votre travail, même des années plus tard lorsque l’ancien site Internet aura été retiré du Web.
Note

Si vous publiez vos textes sur une plateforme avec de nombreux liens externes, les robots de WebCite les enregistrent dans la sélection. Cette liste devient donc rapidement ingérable. Dans un tel cas, nous vous recommandons de charger le document directement depuis votre disque dur.

Si vous souhaitez archiver une seule source ou votre travail personnel, utilisez simplement l’outil d’archivage. Pour cela, cliquez sur l’onglet « Archive » dans le menu principal. Dans le formulaire pour les sources uniques, saisissez l’URL de la source à citer ainsi que votre adresse email et la langue d’archivage. Lorsque vous complétez des métadonnées (titre, auteur, etc.), WebCite crée une référence à partir de ces données. Si des métadonnées sont déjà présentes sur la page Web, le programme peut également les ajouter. Cliquez sur « Submit ». Vous recevez alors un email contenant le lien du snapshot et la référence.

Voici comment indiquer une ancienne page Web comme source inaltérable :

  • Cliquez sur l’onglet « Search » dans le menu principal. Le formulaire de recherche apparaît.
  • Pour rechercher directement d’anciennes pages Web, saisissez l’URL du domaine dans le premier champ de saisie (à côté de « URL to find snapshots of »), comme indiqué dans l’image ci-dessous. En dessous, saisissez le timestamp au format AAAAMM (A=année, M=mois). Dans le cas contraire, lorsque vous cliquerez sur « Search », vous serez effectivement redirigé vers le domaine mis en cache, mais l’en-tête WebCite, qui vous permet de passer d’un timestamp à l’autre, n’apparaîtra pas.
  • Plutôt que d’explorer l’URL, vous pouvez indiquer directement l’ID de snapshot pour accéder à une version du site Internet enregistrée à un moment donné.
En résumé

Si vous avez déjà recherché, en vain, une ancienne page Web, vous saurez apprécier les outils présentés ici. Dans ce domaine, la Wayback Machine est sans conteste l’archive des sites Web la plus complète. Son interface utilisateur conviviale permet même aux utilisateurs les moins expérimentés de retrouver des pages Web ou de les archiver. Si vous cherchez des pages Web qui ont été retirées récemment, le cache de Google peut s’avérer utile. WebCite s’appuie en revanche sur un processus de contrôle effectué avant que les pages Web ne soient enregistrées dans l’archive. Ce service est tout indiqué pour les textes universitaires nécessitant des sources vérifiables.