Wayback Machine vous permet de consulter d’anciennes pages Web qui ne sont plus accessibles à leur ancienne URL. Au minimum, vous pouvez ainsi retrouver et enregistrer le contenu textuel des pages correspondantes. Mais parfois, le texte d’un article ne suffit pas et le problème a des racines plus profondes. Il est possible que la page n’existe plus et dans ce cas, la sauvegarde n’apporte aucune aide. Vous souhaiteriez peut-être télécharger l’intégralité du site Internet pour en éditer le code source ou l’enregistrer, pour faire le tri dans les liens défectueux ou pour tester l’optimisation SEO de votre ancien site Internet ? C’est tout à fait possible, grâce à l’assistant de téléchargement Wayback Machine.
Pour utiliser l’assistant de téléchargement WaybackMachine disponible en open source sur GitHub, vous devez tout d’abord installer Ruby. Inutile d’être un expert en Ruby pour utiliser ce programme. En effet, les développeurs ont détaillé les principales commandes de code directement sur la page de téléchargement. Si vous saisissez l’URL souhaitée, le programme chargera les fichiers correspondants sur votre ordinateur. Il crée automatiquement des pages index.htmlcompatibles avec Apache et NGINX. Les utilisateurs avancés pourront quant à eux définir plus en détail les paramètres concernant les timestamps, les filtres URL et les snapshots.
L’outil Archivarix basé sur le Web offre des interfaces utilisateurs clairement structurées et convient aux sites Internet ou aux blogs de petite taille. En effet, ce service normalement payant est gratuit lorsqu’il est utilisé pour des sites Internet comprenant moins de 200 fichiers. Le temps nécessaire pour apprendre à utiliser cet outil est relativement court. Vous devez toutefois vous inscrire pour utiliser Archivarix. Saisissez alors simplement le domaine souhaité et définissez en quelques clics les options d’optimisation et les structures des liens. Renseignez ensuite votre adresse email. Lorsque le téléchargement de l’archive du site Internet est terminé, Archivarix envoie un fichier zip à cette adresse.
L’assistant de téléchargement Wayback Machine est un autre outil en ligne (un grand nombre de ces outils ont des noms très similaires, voire identiques). Cet outil envoie également les copies d’anciennes pages Web par e-mail. La démo gratuite comprend les quatre premières pages de la Wayback Machine. Un site Internet HTML complet coûte environ 15 €, la conversion au format WordPress près de 45 € supplémentaires (version mai 2018). L’abonnement (actuellement 80 €) se révèle avantageux si vous téléchargez un grand nombre de domaines dans le mois.
Archive.org ne propose personnellement aucun assistant de téléchargement de site Internet. En tant que membre de la bibliothèque, c’est-à-dire en tant qu’utilisateur enregistré, vous avez toutefois accès à des millions de textes, d’images et de fichiers audio en téléchargement. Si vous disposez des droits sur une œuvre, vous pouvez la charger pour une utilisation non commerciale dans le domaine public comme le fait la NASA avec une grande partie de ses supports audio et visuels. Elle a par exemple archivé la vidéo suivante, filmée depuis l’ISS, en tant qu’œuvre du domaine public sous licence de la Creative Commons.