PDF2HTML-Converter

PDF2HTML: PDF-Dateien mit Tool in das HTML-Format konvertieren

Es gibt vie­le Tools mit denen sich PDFs in HTML umwan­deln las­sen. Für die meis­ten Ansprü­che genügt jedoch das kos­ten­lo­se Tool für die Kom­man­do­zei­le PDFToHTML. Hier fin­den Sie eine leicht bedien­ba­re gra­fi­sche Ober­flä­che dafür.

Das Kom­man­do­zei­len-Tool PDFToHTML (poppler.freedesktop.org, Binär­da­tei­en für Win­dows unter blog.alivate.com.au/poppler-windows) wan­delt auch kom­ple­xe PDF-Doku­men­te in HTML um. Das Ergeb­nis ist nicht immer opti­mal, aber für die meis­ten Anwen­der aus­rei­chend. Kom­mer­zi­el­le Tools erle­di­gen die Auf­ga­be meist auch nicht viel bes­ser.

Down­load zu die­sem Arti­kel:
PDF2HTML-Con­ver­ter 1.2:

Installation von PDF2HTML-Converter

PDF2HTML-Con­ver­ter ist ein por­ta­bles Tool. Ent­pa­cken Sie das Pro­gramm­ar­chiv in einen belie­bi­gen Ord­ner. Das Tool benö­tigt wei­te­re Pro­gram­me aus dem Ord­ner „pdftohtml“. Die­ser muss im glei­chen Ver­zeich­nis lie­gen. PDF2HTML-Con­ver­ter legt kei­ne Wer­te in der Regis­try ab, son­dern spei­chert sei­ne Kon­fi­gu­ra­ti­on im Instal­la­ti­ons­ord­ner. Für die De-Instal­la­ti­on löschen Sie ein­fach das Pro­gramm­ver­zeich­nis.

Export-Optionen

PDF2HTML-Converter
PDF2HTML-Con­ver­ter: GUI für PDFToHTML

PDF2HTML-Con­ver­ter steu­ert das Kom­man­do­zei­len-Tool PDFToHTML (pdftohtml.sourceforge.net). Die ein­stell­ba­ren Optio­nen ent­spre­chen daher den Schal­tern die­ses Tools.

Stan­dard­mä­ßig kon­ver­tiert das Tool PDF-Doku­men­te im ein­fa­chen Modus (kei­ne Opti­on ist gesetzt). Beson­de­re Lay­outs wer­den dabei nicht berück­sich­tigt. Es ergibt sich ein Fließ­text, Bil­der wer­den in das PNG-For­mat kon­ver­tiert. Die Aus­ga­be erfolgt in den Ord­ner, in dem auch das Quell-Doku­ment liegt. Der Name des erzeug­ten Doku­ments ent­spricht dem Ori­gi­nal­na­men mit ange­häng­tem „html“.

1. „Sei­ten von bis“: Mit die­ser Opti­on beschrän­ken Sie die zu kon­ver­tie­ren­den Sei­ten.

2. „nur ein Doku­ment erzeu­gen“. Besteht eine PDF-Datei aus meh­re­ren Sei­ten, wird eine ent­spre­chen­de Men­ge von HTML-Datei­en erstellt. Ist die­se Opti­on aktiv, lan­den alle Sei­ten in einer HTML-Datei.

3. „kom­ple­xe Doku­men­te“: Ver­wen­den Sie die­se Opti­on, wenn Sie Doku­men­te mit kom­ple­xen Lay­outs kon­ver­tie­ren möch­ten, bei­spiels­wei­se Doku­men­te mit meh­re­ren Spal­ten und Bil­dern.

4. „kei­ne Frames“: Stan­dard­mä­ßig erzeugt das Tool ein bei meh­re­ren Sei­ten ein HTML-Frame­do­ku­ment mit einer Navi­ga­ti­on auf der lin­ken Sei­te. Ist die­se Opti­on aktiv, ent­steht ein Doku­ment ohne Frames.

5. „kei­ne Bil­der“: Bil­der wer­den nicht extra­hiert.

6. „ver­steck­ten Text aus­ge­ben“: Ver­steck­ten Text mit aus­ge­ben.

7. „Titel durch Datei­na­men erset­zen“: pdftohtml fügt in den <Title>-Tage der HTML-Doku­men­te den kom­plet­ten Pfad zur Datei ein. Ist die­se Opti­on aktiv, wird nur der Datei­na­me ohne Datei­na­mens­er­wei­te­rung ein­ge­setzt.

8. „<html> erset­zen durch“: pdftohtml erstellt HTML-Datei­en mit „<html xmlns=„http://www.w3.org/1999/xhtml“ lang=““ xml:lang=““>“. Wenn Sie zusätz­lich die Spra­che ange­ben möch­ten, akti­vie­ren Sie die Opti­on und fügen Sie ins Ein­ga­be­feld „<html xmlns=„http://www.w3.org/1999/xhtml“ lang=„de“ xml:lang=„de“>“ ein.

9. „mit Unter­ver­zeich­nis­sen“: Wenn Sie einen Ord­ner mit Quell­do­ku­men­ten ange­ben, kon­ver­tiert das Tool auch alle gefun­de­nen Doku­men­te aus den Unter­ver­zeich­nis­sen.

10. „.pdf links durch .html“ erset­zen“: Ent­hält ein Doku­ment einen Link auf eine PDF-Datei, ersetzt das Tool die­sen durch einen Link auf eine HTML-Datei mit dem glei­chen Namen.

11. „Absät­ze nicht ver­bin­den“: Stan­dard­mä­ßig ver­bin­det das Tool Ansät­ze mit­ein­an­der. Ist die­se Opti­on aktiv blei­ben Absät­ze getrennt.

12. „Zoom Fak­tor“: Stan­dard­mä­ßig wer­den die Doku­men­te um den Fak­tor 1,5 ver­grö­ßert. Sie kön­nen hier bei Bedarf einen grö­ße­ren oder klei­ne­ren Wert ein­ge­ben.

13. „XML statt HTML erzeu­gen“: Das Tool kon­ver­tiert PDF nach XML statt nach HTML.

14. „nur mar­kier­te Doku­men­te“: Stan­dard­mä­ßig ver­ar­bei­tet das Tool alle Doku­men­te aus der Lis­te. Ist die­se Opti­on akti­ve, kon­ver­tiert es nur das gera­de mar­kier­te Doku­ment.

15. „Text-Enco­ding“: Stan­dard ist „UTF‑8“. Mög­li­che Wer­te sind ASCII7, Sym­bol, Zapf­Ding­bats, UTF‑8, UCS‑2 und Latin‑1. Ach­tung: Groß-/Klein­schrei­bung wer­den unter­schie­den.

16. „Bild­for­mat“: Stan­dard­mä­ßig erstellt das Tool PNG-Datei­en. Sie kön­nen aber auch „jpg“ wäh­len. Gilt nur in Ver­bin­dung mit „kom­ple­xe Doku­men­te“. Stan­dard­mä­ßig erzeugt das Tool PNG-Datei­en. Sie kön­nen hier aber bei­spiels­wei­se auch „jpeg“ ein­tra­gen.

17. „Aus­ga­be in“: Wäh­len Sie hier einen Ord­ner, in dem Sie die kon­ver­tier­ten Datei­en able­gen möch­ten. Andern­falls wer­den die Datei­en im glei­chen Ord­ner erstellt, in dem die Quell­da­tei liegt. Die Anga­be eines Ord­ners ist erfor­der­lich, wenn Sie jede Datei in einem ande­ren Ord­ner able­gen möch­ten oder einen Index.html erzeu­gen möch­ten.

18. „Neu­er Ord­ner für jede Datei“: Gilt nur in Ver­bin­dung mit „Aus­ga­be in“. Das Tool legt beim Kon­ver­tie­ren meh­re­rer Datei­en einen eige­nen Ord­ner für jedes Doku­ment an.

19: „Index.html erstel­len“: Es wird eine Index.html mit einer ver­link­ten Lis­te aller kon­ver­tier­ten Datei erstellt.

Weitere Optionen

Nach einem Klick auf „Optio­nen“ sehen Sie den abge­bil­de­ten Dia­log. Hier kön­nen Sie für pass­wort­ge­schütz­te PDF-Doku­men­te das Besit­zer- oder Anwen­der-Kenn­wort ein­ge­ben. Das  Kenn­wort gilt für alle Doku­men­te, die Sie kon­ver­tie­ren.
Stan­dard­mä­ßig bringt pcwPDF2HTML sein eige­nes PDFToHTML mit. Die­ses lie­gen im  ent­spre­chen­den Unter­ord­ner. Sie kön­nen das Pro­gramm aber auch aus einem ande­ren Ver­zeich­nis ver­wen­den. Geben Sie in die­sem Fall den Pfad zu der aus­führ­ba­ren Datei an.

Optionen
Optio­nen

PDF2HTML-Converter bedienen

Über die Schalt­flä­che „Hin­zu­fü­gen“ fügen Sie den kom­plet­ten Pfad zu den PDF-Doku­men­ten in die Lis­te ein. Endet der Pfad mit „*.pdf“, ver­ar­bei­tet das Tool alle PDF-Datei­en aus die­sem Ord­ner. Ist die Opti­on „mit Unter­ver­zeich­nis­sen“ aktiv, wer­den auch die Datei­en aus allen Unter­ver­zeich­nis­sen berück­sich­tigt.

Sie kön­nen Datei­en und Ord­ner auch per Drag & Drop vom Win­dows Explo­rer auf die Lis­te zie­hen.

Über die Schalt­flä­che „Löschen“ ent­fer­nen Sie den gera­de mar­kier­ten Ein­trag aus der Lis­te. Mit „Alle Löschen“ ent­fer­nen Sie alle Ein­trä­ge.

Mit einem Klick auf „Kon­ver­tie­ren“ star­ten Sie die Umwand­lung. Nach einem Klick auf „Log anzei­gen“ sehen Sie bei Bedarf die Aus­ga­ben der Kom­man­do­zei­len-Tools.

Mit „Abbre­chen“ stop­pen Sie den Export. Sie müs­sen dann war­ten, bis das Pro­gramm den gera­de lau­fen­den Export been­det hat. Das glei­che gilt, wenn Sie das Pro­gramm been­den.

Lizenz

PDF2HTML-Con­ver­ter ist freie Soft­ware. Sie kön­nen es unter den Bedin­gun­gen der GNU Gene­ral Public Licen­se, wie von der Free Soft­ware Foun­da­ti­on ver­öf­fent­licht, wei­ter­ge­ben und/oder modi­fi­zie­ren, ent­we­der gemäß Ver­si­on 2 der Lizenz oder (nach Ihrer Opti­on) jeder spä­te­ren Ver­si­on.
Die Ver­öf­fent­li­chung die­ses Pro­gramms erfolgt in der Hoff­nung, dass es Ihnen von Nut­zen sein wird, aber OHNE IRGENDEINE GARANTIE, sogar ohne die impli­zi­te Garan­tie der MARKTREIFE oder der VERWENDBARKEIT FÜR EINEN BESTIMMTEN ZWECK. Details fin­den Sie in der GNU Gene­ral Public Licen­se.

[amazon_auto_links id="323980"]


Schlagwörter:


Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Partner-Links

[amazon_auto_links id="323997"]

Neueste Kommentare

  1. Die digitale Abhängigkeit von Geräten wie dem Smartphone ist nicht mehr von der Hand zu weisen. Man soll am besten…

  2. Vielen herzlichen Dank für die Anleitung. Sie war äußerst hilfreich bei der Einrichtung meiner Fritzbox. Ich kann sie nur bestens…


Die Website durchsuchen