Website-Umzug Teil 3: Content-Import mit dem WordPress-Plugin „Import HTML Pages“

Website-Umzug Teil 3: Content-Import mit dem WordPress-Plugin „Import HTML Pages“

In Teil 1 und 2 des Workshops hast Du korrekt formatierte statische HTML-Seiten erzeugt. Jetzt kannst Du den entscheidenden Schritt in Angriff nehmen: den tatsächlichen Import nach WordPress.

Für den eigentlichen Import installierst Du das Plugin „Import HTML Pages“ und aktivierst es. Alle Optionen für den Import findest Du im WordPress-Backend unter Einstellungen – HTML Import.

Lege vor dem Import ein komplettes Backup der WordPress-Installation an. Dann musst Du nach einem unbefriedigend verlaufenen Import lediglich das Backup einspielen und kannst sofort einen neuen Versuch starten.

Alternativ kannst Du aber auch manuell alle zuvor importierten Seiten wieder löschen. Das ist aber nur dann eine brauchbare Alternative, wenn Du nur wenige Seiten importierst.

HTML-Dateien hochladen

Zuvor hast Du die zu importierenden Seiten bereits als statische HTML-Dateien vorbereitet. Diese lädst Du nun per SFTP inklusive eventueller Bilder, die ebenfalls importiert werden sollen, in ein Unterverzeichnis Deines Webspaces hoch. Die Verzeichnisstruktur muss dabei unverändert bleiben.

Der Verzeichnisname spielt dagegen keine Rolle. Die Dateien müssen nur unter derselben Domain abrufbar sein wie das WordPress-Blog, in das Du sie importieren willst.

Die wichtigsten Einstellungen

Das Plugin benötigt vor allem in den Reitern Content sowie Title & Metadata die Angabe, welche eindeutigen HTML-Tags den Content beziehungsweise Titel umschließen. Dafür ist ein Blick in den HTML-Quellcode der zu importierenden Dateien nötig. Aber den hast Du ja wahrscheinlich ohnehin schon intensiv bearbeitet, sodass Du Dich da auskennst.

Screenshot_Import_Plugin
Optionen für die Erkennung des Contentbereichs der zu importierenden Seiten

Ist also in Deinen HTML-Dateien der Seiten-Content beispielsweise mit <div id=“meininhalt“> … </div> umschlossen, trägst Du in den Plugin-Optionen im Reiter Content als Tag div ein, als Attribute id und als Value meininhalt. Genauso gehst Du im Reiter Title & Metadata für den Titel vor.

Sehr wichtig sind die Einstellungen im Reiter Files:

  • Directory to import ist das Verzeichnis am Webserver, in dem die zu importierenden HTML-Dateien liegen. Das Plugin ermittelt den Server-Pfad automatisch, sodass Du den vorgegebenen Pfad lediglich um das Verzeichnis ergänzen musst, in dem die zu importierenden Dateien liegen.
  • Old Site URL ist die URL, unter der Deine Website bisher zu finden ist – das kann auch dieselbe wie Dein neues WordPress-Blog sein. Das Plugin benutzt die URL, um korrekte Weiterleitungen für die .htacess-Datei nach dem Import zu erzeugen, damit Deine Beiträge weiterhin unter der bisherigen URL erreichbar bleiben beziehungsweise entsprechend weitergeleitet werden.
  • Default file ist die HTML-Datei die bisher als Homepage fungiert hat.
  • Files extensions to include beinhaltet alle Dateiendungen von Dateien, die beim Import berücksichtigt werden sollen, oft also: htm oder html, manchmal auch php, shtml oder Ähnliches.
  • Preserve file names erhält die Dateinamen der Seiten Deiner alten Website, allerdings ohne Dateiendungen. Falls Du in der Nachbearbeitung Weiterleitungen komplett vermeiden willst und die Seiten unter exakt der gleichen URL abrufbar sein sollen wie vor dem Import, kannst Du das über die Permalink-Struktur von WordPress unter Einstellungen – Permalinks regeln. Aber die richtige Einstellung der Permalink-Struktur bei WordPress ist nochmal ein ganz eigenes Thema für sich.
Screenshot_HTML_Plugin_Einstellungen
Grundlegendes: Einstellungen im Plugin-Reiter „Files“

Tipp: Wenn Du alte Seiten in ein schon bestehendes WordPress-Blog importierst, gehst Du auf Nummer Sicher, wenn Du im Reiter Title & Metadata  die Option Set status to auf draft setzt.  Dann sind die importierten Beiträge nicht gleich öffentlich und Du kannst Sie noch bearbeiten oder korrigieren, bevor sie live gehen. Der Nachteil dabei: Du musst die Beiträge dann eben auch alle manuell veröffentlichen.

Spätestens wenn alle Plugin-Optionen gesetzt sind, klicke auf Save settings. Zum Import der HTML-Dateien klicke auf Import files. Nach erneutem Bestätigen der Import-Quelle startet der tatsächliche Import mit Klick auf Submit.

Screenshot_Import
Der eigentliche Import: Klick auf „Submit“

Nacharbeit: importierte Seiten prüfen und anpassen

Bevor Du anfängst, die importierten Beiträge oder Seiten zu bearbeiten: Kontrolliere, ob der Import so funktioniert hat, wie Du Dir das vorgestellt hast. Wenn nicht, spiele das Backup ein und probiere es mit entsprechend veränderten Einstellungen noch einmal.

Was nach dem erfolgreichen Import kommt, kann recht aufwändig sein. Denn das Plugin importiert lediglich den Inhalt der Seiten, behebt aber keine Fehler im HTML-Code oder der Content-Struktur, die dort schon vorhanden waren. In vielen Fällen wirst Du daher jede einzelne importierte Seite in WordPress öffnen und überarbeiten müssen. Ein HTML-Validator wie der von W3C oder Freeformatter kann Dir dabei helfen, HTML-Syntaxfehler zu finden.

Anpassungen, die alle importierten Seiten betreffen, hast Du idealerweise schon vor dem Import mit dem oben beschriebenen Suchen-und-Ersetzen-Verfahren vorgenommen. Wenn nicht, gibt es mit SearchReplace von Inpsyde aber auch ein gutes WordPress-Plugin für Suchen-und-Ersetzen-Operationen innerhalb Deiner Beiträge.

Die Sache mit den Permalinks

Gut für Deine Leser und Deine Internetpräsenz ist es, wenn die neuen Seiten weiterhin unter der alten URL erreichbar sind.  Am wenigsten aufwendig ist es hierbei, mit permanenten Weiterleitungen zu arbeiten. Für das Google-Ranking ergeben sich daraus keine Nachteile.

Das Plugin gibt praktischerweise am Ende des Import-Prozesses die passenden Redirects aus, die man nur noch in die .htaccess-Datei am Webeserver einfügen muss. Das funktioniert natürlich nur dann, wenn Du dort, wo Deine Website bisher gehostet wird, eine solche .htaccess-Daten bereits hast oder neu anlegen kannst.

Screenshot_htaccess_Redirects
Vom Plugin generierte Redirect-Anweisungen für .htaccess-Datei

Wenn Du Deine Seiten mit dem Status „draft“ importiert hast, ignoriert das Plugin die Permalink-Einstellungen und generiert die Redirects nach dem WordPress Standard-URL-Schema (?p=453). Gegebenenfalls kannst Du sie so belassen, denn WordPress regelt intern nochmals eine Weiterleitung auf den voreingestellten Permalink. Spielt aber SEO eine größere Rolle für das Blog, dann solltest Du die Weiterleitungen in der Nachbearbeitung der Seiten jeweils nach Veröffentlichung der Seite manuell anpassen. Denn Suchmaschinen reagieren nicht sonderlich wohlwollend auf doppelte Weiterleitungen.

Der Import von bestehendem Content nach WordPress ist meist ein steiniger Weg mit dem einen oder anderen Umweg und Fehlversuch. Dennoch lohnt sich der Aufwand, wenn Du letztlich all Deine Inhalte künftig bequem und zukunftssicher in WordPress verwalten und neue Beiträge hinzufügen kannst. Wir freuen uns auf Deinen Erfahrungsbericht – lass uns wissen, wie Dein Import gelungen ist!

Hole Dir jetzt Dein WordPress-Paket!

Teilen

Sie können erst kommentieren, wenn Sie unseren Datenschutzbestimmungen und den Cookies zugestimmt haben. Aus Datenschutzrechtlichen Gründen dürfen wir andernfalls keine personenbezogenen Daten von Ihnen aufzeichnen.

Klicken Sie dazu einfach unten im Browser Fenster auf den blauen Button Akzeptieren. Nach dem Neuladen der Seite können Sie Ihr Kommentar schreiben.