Stellen Sie sich folgende Situation vor: Sie erstellen eine Website. Stellen Sie einen Webmaster ein oder machen Sie es selbst, indem Sie viel Geld und persönliche Zeit dafür aufwenden. Sie hosten Ihre Idee und füllen sie liebevoll mit Informationen, ohne darüber nachzudenken, dass Sie eine Kopie der Website speichern müssen, um keine Daten zu verlieren.
Eines Tages, nicht so toll für dich, gehst du auf deine Seite, aber es funktioniert nicht. Sie beginnen herauszufinden, was los ist, und, oh Schreck, das Rechenzentrum ist abgebrannt oder das Hosting ist ausgefallen. Oder vielleicht ist ein Virus eingedrungen und hat Ihre Daten zerstört. Der Informationsverlust auf einer Website ist vergleichbar mit dem Informationsverlust auf einem Computer. Wie bewahren Sie also eine Kopie der Website auf?
Befassen wir uns zuerst mit der Definition. Der Prozess der Website-Archivierung ist die Aufbewahrung der aktuellen Version einer Seite oder Site in einem Archiv, um später damit arbeiten zu können. Für diese Zwecke wird spezielle Software verwendet. Das größte Unternehmen der Welt ist das Internetarchiv, auf das wir weiter unten eingehen werden.
Für ein privates Archiv können Sie Offline-Browser verwenden, die speziell für den Offline-Betrieb entwickelt wurden. Sie helfen bei der Erstellunglokale Kopien einzelner Webseiten oder ganzer Sites. Dazu gehören zum Beispiel:
- Ein plattformübergreifender HTTrack-Browser, der 29 Weltsprachen unterstützt und in der Lage ist, unterbrochene Downloads fortzusetzen und den Site-Mirror zu aktualisieren.
- Freigegebener kostenloser Offline-Explorer, mit dem Sie nicht nur Dateien oder Seiten, sondern ganze Seiten aus dem Internet über FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent herunterladen können.
- Download-Manager Kostenloser Download-Manager. Es lässt sich in alle Browser integrieren, hat ein eingebautes FTP, unterstützt das BitTorrent-Protokoll, kann Torrent-Dateien erstellen und Links aus der Zwischenablage abfangen.
- Teleport Pro Closed Source für Windows. Mit dem Programm können Sie ganze Seiten herunterladen.
- Ein kostenloses konsolenbasiertes, nicht interaktives Programm zum Herunterladen von Dateien und Websites aus dem Internet Wget. Das Programm unterstützt HTTPS-, HTTP- und FTP-Protokolle und kann auch über einen HTTP-Proxy-Server arbeiten. Geeignet für Linux.
Backup auf dem Hosting erstellen
Sie können bei Ihrem Hosting-Provider ein Site-Backup einrichten. Dazu müssen Sie zum Admin-Panel zum Abschnitt zum Erstellen von Backups gehen. Jedes Hosting hat sein eigenes Admin-Panel, und es ist schwer zu sagen, wo genau dieser Bereich bei Ihnen gehostet wird. Wenn Sie es nicht herausfinden können, schreiben Sie an den technischen Support.
Erstellen eines Backups mit Plugins
Wenn Ihre Website auf einer CMS-Plattform gehostet wird, wie beispielsweiseWordPress können Sie eine Kopie Ihrer Website speichern, indem Sie das Plugin wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) oder ähnliches installieren. Durch die richtige Konfiguration des Plugins erh alten Sie je nach Wunsch jeden Tag oder jede Woche ein Site-Backup.
So speichern Sie eine Kopie der Website auf Ihrem Computer
Sie können die Seite mit einem FTP-Client auf Ihrem Computer speichern. Wenn Sie das Programm FileZilla verwenden, erstellen Sie auf Ihrem Computer einen Ordner „Backup“(der Ordnername kann beliebig sein). Verbinden Sie sich über einen FTP-Client mit dem Server und ziehen Sie einfach per Drag-and-Drop eine vollständige Sicherung der Site in den Ordner „Backup“.
Außerdem können Sie den Site2ZIP-Dienst (Archivieren der Site) verwenden, ein Programm zum Herunterladen von WinHTTrack WebSite Copier. Wie kann ich die gespeicherte Kopie der Website anzeigen? Öffnen Sie dazu den Ordner, in dem die Seite gespeichert wurde, und klicken Sie auf die Datei index.html.
Internetarchiv
In San Farncisco gründete Brewster Cale 1996 das gemeinnützige Internetarchiv. Es sammelt Kopien aller Webseiten, Audio- und Videoaufzeichnungen, Grafikdateien und Programme. Archive des gesammelten Materials werden hier sehr lange aufbewahrt und es gibt freien Zugang zu seinen Datenbanken für jedermann.
Wenn Sie sich fragen, wie Sie eine gespeicherte Kopie einer Website öffnen können, gehen Sie zu archive.org/web/ und geben Sie die Adresse der Website oder Seite in das entsprechende Feld ein. Ende 2012 umfasste das Internetarchiv 10 Petabyte – das sind 10.000 Terabyte! Und bis Mitte 2016 hatte es 502 Milliarden Exemplare angesammelt. Webseiten.
Caching der Website durch Suchmaschinen
Eine gespeicherte Kopie der Google-Site ist nichts anderes als ein Cache der Seiten der Site, die von der Suchmaschine erstellt wurden. Jeder Benutzer kann jederzeit eine Kopie der Seite für seine Zwecke verwenden. Sie auf Suchmaschinenservern zu speichern, erfordert viele Ressourcen, und dafür wird viel Geld bereitgestellt, aber diese Hilfe zahlt sich aus, da wir uns immer noch an Suchmaschinen wenden. Diese Methode ist zwar nur für bestehende oder kürzlich entfernte Websites geeignet. Wenn dies schon lange her ist, löscht die Suchmaschine die Daten.
Spezialisierte Suchmaschine
Zusätzlich zu der Tatsache, dass Sie manuell nach gecachten Seiten in Google oder Yandex suchen können, können Sie die spezialisierte Suchmaschine cachedview.com verwenden. Es hat ein Analogon: cachedpages.com.
Wenn Sie eine Kopie der Website oder ihrer einzelnen Seite speichern möchten, können Sie dies selbst und kostenlos bei archive.is tun. Darüber hinaus gibt es auch eine globale Suche nach Versionen, die jemals vom Benutzer gespeichert wurden.
Aufbau eines Webarchivs in Nationalbibliotheken
Nationalbibliotheken stehen heute vor der Aufgabe, Internetdokumente zu archivieren, die Teil des wissenschaftlichen, kulturellen und historischen Erbes der Menschheit sind. Aber das ist sehr problematisch.
Studien haben gezeigt, dass die Zahl der Webdokumente im Web exponentiell wächst und im Durchschnitt ein Dokument lebtvon einem bis zu vier Monaten. Am bequemsten ist es, eine Website als Abrechnungseinheit für ein Web-Dokumentenarchiv zu verwenden. Der Vorgang zum Erstellen eines Fonds besteht darin, eine Kopie oder einen „Spiegel“der Website zu erstellen. Da sich die darin enth altenen Informationen im Laufe der Zeit ändern, muss die Bibliothek in regelmäßigen Abständen Spiegel derselben Website erstellen.
Daher gibt es in Schweden 60.000 Websites, das ist 20-mal so viele wie herkömmliche Printpublikationen. Kopien gedruckter Dokumente in der schwedischen Bibliothek belegen 1,7 km Regale pro Jahr. Ein Webarchiv würde 25 km Regale füllen! Jetzt enthält ihr Archiv 138 Millionen Dateien mit einem Gesamtgewicht von 4,5 Gigabyte.
Das Internet wächst jeden Tag. Es gibt viele Unternehmen und Websites, die darauf achten, Kopien von Webseiten in ihren Archiven aufzubewahren. Aber verlassen Sie sich nicht allein auf sie. Machen Sie rechtzeitig Backups und Sie werden Ihre Website nie verlieren.