Aus Microsoft Word importieren
Der Import aus Microsoft Word ist komplex, da es sich hierbei nicht um ein strukturiertes Format handelt. Die Ergebnisse hängen daher stark von der Eingabequalität ab. Die wichtigste Überlegung ist in der Regel die, dass Word-Stile konsequent angewendet worden sein sollten.
Zur Vorbereitung des Imports aus Microsoft Word gibt es drei Möglichkeiten:
-
Importassistenten verwenden Sie können den ,um die Inhalte aus MS Word direkt zu importieren. Er kann die meisten gut strukturierten Word-Dokumente verarbeiten.
-
Sie können mithilfe des (optionalen) Oxygen XML Editor mit dem Paligo Plugin in DocBook konvertieren.
-
Sie können mit einer vom Support erworbenen Anpassung in XML konvertieren. Diese Möglichkeit wird genutzt, wenn Ihre Inhalte nicht einfach direkt importiert werden können. Bei sehr großen Dokumenten oder vielen Dokumenten kann dies am besten sein.
Die einfachste Methode besteht darin, die MS Word-Dateien mithilfe des Importassistenten direkt zu importieren. Paligo kann die meisten gut strukturierten Word-Dokumente verarbeiten.
-
Komprimieren Sie jede Word-Datei einzeln. Fügen Sie nicht mehrere Word-Dateien in eine ZIP-Datei ein.
Tipp
Informationen zum Komprimieren von Dateien in Word finden Sie in der Microsoft Word-Hilfe.
-
Importassistenten verwenden Sie können den, um die ZIP-Dateien zu importieren.
Wählen Sie Word (.docx) als zu importierenden Dateityp aus.
Mit dem Oxygen XML Editor können Sie die Inhalte vor dem Import in ein DocBook-Dokument konvertieren.
-
Erstellen Sie in Oxygen einen DocBook 5.1 Artikel, indem Sie Datei > Neu und dann die richtige DocBook-Vorlage auswählen.
-
Entfernen Sie das erste „sect1“-Element .
-
Fügen Sie ein neues
section
-Element ein, indem Sie die Eingabetaste auf Ihrer Tastatur drücken und in der ElementlisteSection
auswählen. Dieses Element wird nicht wirklich verwendet, und wir werden es am Ende entfernen. Aber es wird aufgrund einer Eigenart in Oxygen benötigt. -
Platzieren Sie den Cursor innerhalb des
section
-Elements. -
Speichern Sie das Dokument unter einem beliebigen Namen.
Es muss jedoch unter einem Namen gespeichert werden, da Bilder sonst nicht ordnungsgemäß gespeichert werden.
-
Kopieren Sie den Text aus Ihrem Word-Dokument. Sie sollten Inhaltsverzeichnisse und Ähnliches auslassen, da sie nicht benötigt werden.
-
Fügen Sie die Inhalte in das
section
-Element in Oxygen ein.Sie erhalten eine Warnung, dass sie im nächstgelegenen Artikelelement platziert werden müssen. Fahren Sie fort und akzeptieren Sie die Warnung.
-
Beim Einfügen werden die Inhalte automatisch in die richtigen XML-Elemente konvertiert.
-
Entfernen Sie das leere
section
-Tag. Es befindet sich unten oder oben im Dokument. -
Speichern Sie das Dokument erneut.
-
Importassistenten verwenden Sie können den, um das resultierende DocBook-Dokument zu importieren.
Bei der dritten Methode erfolgt eine Vorkonvertierung in XML mithilfe eines Skriptpakets, das eine erworbene Anpassung erfordert. Sie ist etwas komplexer, liefert aber gute Ergebnisse. Sie ist besonders bei sehr großen oder vielen Dokumenten zu bevorzugen, da sie sehr schnell ist und stärker an Ihre Inhalte angepasst werden kann.
Anmerkung
Wenden Sie sich an den Paligo Support, wenn Sie diese Methode anstelle der oben beschriebenen procedures
verwenden möchten.
Je nach Komplexität Ihrer Inhalte und Mapping der Struktur kann diese Konvertierung kostenpflichtig sein.
Sollten Sie Probleme beim MS Word-Import haben, finden Sie in den folgenden Abschnitten nützliche Informationen zu den häufigsten Problemen.
Anmerkung
Wenn Sie während des MS Word-Imports Probleme anderer Art feststellen, bitten Sie den Kundensupport um Hilfe.
Wenn der Importvorgang nicht abgeschlossen ist, stellen Sie sicher, dass MS Word-Dokument für den Import vorbereiten ordnungsgemäß ausgeführt wird. Es muss mindestens einen Titel aufweisen und Überschriften korrekt verwenden.
Anmerkung
Sollten weiterhin Probleme auftreten, wenden Sie sich bitte an den Kundensupport.
Wenn der Word-Importprozess von Paligo erfolgreich abgeschlossen wird, die Importordner jedoch keine Topics enthalten oder einige Topics fehlen, liegt dies wahrscheinlich an einer falschen Formatierung.
Stellen Sie sicher, dass Ihr Word-Dokument einen Titel aufweist und Überschriften korrekt verwendet, wie in MS Word-Dokument für den Import vorbereiten beschrieben.
Wenn Sie Ihr MS Word-Dokument richtig vorbereiten, sollte beim Import für jeden Inhaltsabschnitt mit einer Überschrift ein Topic erstellt werden. Sollten weiterhin Probleme auftreten, wenden Sie sich bitte an den Kundensupport.
Wenn eine aus MS Word importierte Tabelle die Grenzen des Paligo-Editors überschreitet, liegt dies daran, dass die Tabelle zu breit ist. Sie können sie dennoch in Paligo bearbeiten – verwenden Sie die Bildlaufleiste unten im Paligo-Editor, um horizontal zu den zusätzlichen Zellen zu scrollen.
Bei HTML-Ausgaben fügt Paligo der Website eine Bildlaufleiste hinzu, damit Ihre Leser zu Zellen außerhalb des Anzeigebereichs scrollen können.
Bei PDF-Ausgaben geht die Tabelle über den Seitenrand hinaus. Aus diesem Grund sollten Sie in Erwägung ziehen, die Tabelle nicht im Hochformat, sondern im Querformat anzuzeigen, siehe Rotieren einer Tabelle (PDF). Eventuell müssen Sie die Tabelle neu gestalten, wenn sie zu groß für die Seite ist, z. B. indem Sie stattdessen mehrere kleinere Tabellen erstellen.
[en] In MS Word, there are two ways to add content between steps:
-
[en] Make two lists appear as one list
[en] To achieve this, you create a list and when you want to add content between steps, you add the content after a list item. After the added content, you start a new list. You set the second list to "Continue numbering" so that the two lists appear as one continuous list.
1. List item 1 2. List item 2 3. List item 3 Content between steps 4. List item 1 for second list, set to Continue Numbering so becomes list item 4. 5. List item 2 for second list, follows numbering from previous step.
-
[en] Inline content with manual line break
[en] With this approach, you create one list. When you get to a position where there needs to be content between list items, you press Shift and Enter after the list item above the content. This creates a line break. You then add the content inline and press Enter to create the next list item. This creates one list with the added content inside a list item, like this:
1. List item 1 2. List item 2 3. List item 3 Content between steps 4. List item 4. 5. List item 5.
[en] If you import MS Word content into Paligo, lists with inline content will usually import correctly. With some imports, the Shift and Enter can sometimes be interpreted as the literallayout element instead of a regular para element.
[en] If you import MS Word content with lists that use Continue numbering, Paligo creates one list. It ignores the "two lists made to look like one" structure. The content between list items is nested inside the list item, like this:
1. List item 1 2. List item 2 3. List item 3 Content between steps 4. List item 4. 5. List item 5.
Anmerkung
[en] If your MS Word content has nested lists (lists inside lists), Paligo will not restructure them in the same way and they may appear with incorrect numbering and structure.
[en] You can fix the list structure manually in Paligo, for example, by dragging and dropping list items in the XML tree view. Alternatively, Paligo professional services can set up an import customization that disables the list reassembly during imports. This may provide better results for imports of multi-level lists. Please contact customer support to ask for an import customization.
Wenn Sie in Ihren Listen in MS Word weiche Zeilenumbrüche (Shift + Enter) verwendet haben, um Inhalte in der nächsten Zeile zu platzieren, werden sie innerhalb eines literallayout
-Elements in Paligo importiert. Sie erkennen dies im Paligo-Editor daran, dass sich um die Inhalte
ein schattiertes Feld befindet, und wenn Sie es auswählen, können Sie das Literallayout-Element im Menü „Elementstruktur“ sehen.
Dies ist zwar gültig, entspricht aber nicht der Art und Weise, in der Text und Bilder normalerweise in Paligo zu einem Listenelement hinzugefügt werden.
Für diese Inhalte wird eher folgende Struktur verwendet:
<orderedlist> <listitem> <para>This is step one.</para> <para>In MS Word, this line was created by using a soft return at the end of the previous line.</para> </listitem> <listitem> <para>This is step two.</para> </listitem> </orderedlist>
Der Unterschied besteht darin, dass sich die zusätzliche Textzeile im Schritt innerhalb eines zusätzlichen para
-Elements befindet und nicht in einem literallayout
-Element. Wenn es sich bei dem Inhalt in der Liste um ein Bild handelt,
befindet er sich stattdessen in einer mediaobject
-Struktur. In beiden Fällen sollten sich die Inhalte jedoch innerhalb des Listenelements befinden.
Um Ihre Inhalte zu korrigieren, können Sie entweder:
-
Die Listen in MS Word bearbeiten
Entfernen Sie die weichen Zeilenumbrüche und fügen Sie dann ein neues Listenelement für den Text oder das Bild hinzu. Dadurch entsteht ein unerwünschter zusätzlicher Schritt, das ist aber erst einmal richtig so. Positionieren Sie anschließend den Cursor am Anfang des neuen Listenelements und drücken Sie die Rücktaste. Dadurch wird der Text bzw. das Bild zu einem eingerückten Teil des vorherigen Listenelements. In dieser Form wird er sauber in Paligo importiert, ohne
literallayout
-Element.Weitere Informationen zum Hinzufügen von Inhalten innerhalb eines Listenelements finden Sie unter . MS Word-Dokument für den Import vorbereiten
-
Oder die Listen in Paligo bearbeiten
Fügen Sie für Text zwischen Listen ein
para
-Element innerhalb deslistitem
-Elements hinzu und fügen Sie diesem dann Ihren Textinhalt hinzu.Fügen Sie bei Bildern zwischen Listen entweder ein Bild in das
listitem
-Element ein oder verwenden Sie den XML-Baum, um das Medienobjekt-Element in daslistitem
-Element zu verschieben.
Tipp
Mehr erfahren über
-
Elemente hinzufügen, siehe Elemente hinzufügen.
-
XML-Baum verwenden, siehe Elemente verschieben.
Paligo importiert Microsoft Word-Nummernlisten als geordnete Listen. Wenn Sie möchten, dass diese als Verfahren importiert werden, kann dies eventuell als Anpassungsprojekt erfolgen (Anpassungsprojekte sind in der Regel kostenpflichtig). Bitte wenden Sie sich für weitere Informationen an den Kundensupport.
Im Paligo-Editor werden Tabellen immer im Hochformat angezeigt. Bei HTML-Ausgaben erhalten breite Tabellen eine Bildlaufleiste, damit Benutzer auf alle Daten in der Tabelle zugreifen können. Bei PDF-Ausgaben können Sie die Anzeige auf Querformat einstellen, siehe Rotieren einer Tabelle (PDF).