Anzeige:
Seite 1 von 2 12 LetzteLetzte
Ergebnis 1 bis 15 von 16

Thema: Umlaute im pdf werden nicht gefunden/sind nicht kopierbar

  1. #1
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68

    Umlaute im pdf werden nicht gefunden/sind nicht kopierbar

    Hallo,

    wenn ich folgendes Minimalbeispiel erstelle, dann erscheinen die Umlaute äöü im pdf als  a o u und werden deshalb nicht gefunden und können auch nicht kopiert werden.

    Code:
    \documentclass[a4paper]{article}
    %\usepackage{cmap} - ändert nichts
    \usepackage{ngerman}
    \usepackage[latin1]{inputenc}
    \begin{document}
    
    äöü
    ÄÖÜ
    \end{document}
    Ich arbeite auf windows.

    Nützt nichts:
    * \usepackage[ansinew]{inputenc}
    * \usepackage{cmap}

    Könnte mir bitte jemand ein Minimalbeispiel geben, in dem das funktioniert?

    Ziel:
    1. Umlaute im pdf sollen über Suche gefunden werden
    2. Umlaute sollen nach Kopieren von Text aus dem pdf erhalten bleiben

    Viele Grüße,

    Klaus

  2. #2
    Registrierter Benutzer Avatar von mechanicus
    Registriert seit
    10.07.2008
    Ort
    Hamburg
    Beiträge
    3.944
    Hi,

    unter Linux funktioniert die Suche im adobe mit dem Beispiel:
    Code:
    \documentclass[a4paper,ngerman]{article}
    \usepackage{babel}
    \usepackage[utf8]{inputenc}
    % \usepackage{cmap}
    %\usepackage[T1]{fontenc}
    \begin{document}
    äöü
    ÄÖÜ
    \end{document}
    Mit Okular funktioniert es nur so:
    Code:
    \documentclass[a4paper,ngerman]{article}
    \usepackage{babel}
    \usepackage[utf8]{inputenc}
    % \usepackage{cmap}
    \usepackage[T1]{fontenc}
    \begin{document}
    äöü
    ÄÖÜ
    \end{document}
    Gruß
    Marco

  3. #3
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68
    Hallo,

    da bekomme ich die Fehlermeldung:

    ! Package inputenc Error: Unicode char \u8:õ÷³ not set up for use with LaTeX.
    Der Grund liegt darin, dass äöü nicht als Unicode Zeichen eingegeben sind.

    Wenn ich das ändere, dann funktioniert es:

    Code:
    \documentclass[a4paper,ngerman]{article}
    \usepackage{babel}
    \usepackage[utf8]{inputenc}
    \usepackage[T1]{fontenc}
    \begin{document}
    äöü
    ÄÖÜ
    
    \end{document}
    Heißt das, dass ich alles auf Unicode umstellen muss? Und überall ä statt ä ... schreiben muss?

    (Mich wundert, dass andere das Problem einfach zu ignorieren scheinen. Ich habe zuerst hier im Forum gesucht. Sehr wenig gefunden.)

    Herzlichen Dank, schon mal, für die Antwort.

    Viele Grüße,

    Klaus

  4. #4
    Registrierter Benutzer Avatar von bischi
    Registriert seit
    10.04.2003
    Beiträge
    4.828
    Du musst einfach das inputenc so einstellen, dass es zu den Einstellungen deines Editors passt (also wenn dein Editor UTF8 abspeichert, dann UTF8 wählen - usw...). Sonst gibt es auch noch das selinput Package...

    MfG Bischi

    "There is an art, it says, or rather, a knack to flying. The knack lies in learning how to throw yourself at the ground and miss it" The hitchhiker's guide to the galaxy by Douglas Adams

    --> l2picfaq.pdf <-- www.n.ethz.ch/~dominikb/index.html LaTeX-Tutorial, LaTeX-Links, Java-Links,...

  5. #5
    Registrierter Benutzer Avatar von mechanicus
    Registriert seit
    10.07.2008
    Ort
    Hamburg
    Beiträge
    3.944
    Hi,

    ich habe ja geschrieben, dass ich Linux nutze. Wenn du
    \usepackage[latin1]{inputenc} verwendest, sollte s normal funktionieren. Oder du nimmst das von Bischi angesprochene Paket.

    Gruß
    Marco

  6. #6
    Registrierter Benutzer
    Registriert seit
    19.05.2009
    Beiträge
    4.045
    Es ist nicht wichtig, wie deine Datei kodiert ist, d.h. ob du inputenc mit der Option latin1, ansinew oder utf8 benutzt (solange die Option zu deiner Dateikodierung passt).

    Wichtig sind die Schriften: Du musst aber T1-kodierte Schriften benutzen, d.h. \usepackage[T1]{fontenc} ist zwingend. Die Schriften sollte auch type1-Schriften sein, d.h. pdflatex sollte am Ende der log-Datei pfb-Schriften einbinden.

  7. #7
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68
    Das heißt: OT1 funktioniert nicht?

    Code:
    \usepackage[OT1]{fontenc}
    funktioniert nicht?

  8. #8
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68
    OK, ich habe das Problem gelöst.

    Hier meine Zusammenfassung (bitte korrigieren, wenn irgendetwas nicht stimmt):
    1. das Problem hat nichts mit linux versus windows zu tun
    2. das Problem hat nichts mit encoding zu tun
    3. das Problem liegt am Schriftsatz: wenn gleichsam jemand die Bleilettern für die Umlaute gegossen hat, und ich lade diesen Schriftsatz, dann wird alles auf Anhieb funktionieren (mit \usepackage[T1]{fontenc}). Wenn ich allerdings einen Bleiletterkasten ohne Umlaute verwende, werden diese zwar im PDF erscheinen, aber es sind fakes/Mimikries und werden deshalb von der PDF-Suche nicht gefunden.

    Grund für genanntes Problem:
    * Ich verwende einen Schriftsatz/eine Schriftart, die keine Umlaute hat
    * Ich glaube, ich lade den richtigen Schriftsatz, aber in Wirklichkeit lade ich etwas Anderes, weil ein stylesheet, das ich benutze, etwas Anderes lädt - so war es bei mir (im log-file nachschauen!).

    Interessieren würde mich noch die oben gestellte offene Frage, wie man das Problem mit OT1 löst.

    Herzlichen Dank für die bisherigen Antworten!

    Klaus
    Geändert von KlausImMai (10-01-2010 um 15:09 Uhr)

  9. #9
    Registrierter Benutzer
    Registriert seit
    19.05.2009
    Beiträge
    4.045
    Ich verwende einen Schriftsatz/eine Schriftart, die keine Umlaute hat
    Nein, die Schrift könnte schon Umlaute haben, aber du verwendest die Schrift mit einer Kodierung (OT1), die diese Umlaute -- wenn es sie gibt -- nicht verwendet. OT1 ist sozusagen auf dem Auge blind.

    Interessieren würde mich noch die oben gestellte offene Frage, wie man das Problem mit OT1 löst.
    Gar nicht. Ich sagte doch schon, du musst T1 benutzen.

  10. #10
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68
    Natürlich möchte ich OT1 nur dann verwenden, wenn ich eine Schriftart verwende, die LaTeX selbst nicht mitbringt. Die Frage macht also schon Sinn, weil gewisse importierte Schriftarten einen dazu zwingen, OT1 zu verwenden. Wie schaut es dann aus?

  11. #11
    Registrierter Benutzer
    Registriert seit
    19.05.2009
    Beiträge
    4.045
    Bei OT1-kodierten Schriften können Umlaute nicht kopiert werden. Es geht nicht. Punkt. Mir ist aber keine aktuelle Schrift bekannt, die man nicht auch mit T1 benutzen kann. Was ist also konkret dein Problem?

  12. #12
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68
    OT bedeutet Open Type - nicht wahr?

    Adobe Janson Schriftart (http://store1.adobe.com/cfusion/stor...kage&code=1341) ist eine Open Type Schriftart.

    Können die Umlaute dieser Schriftart nach Import in LaTeX im generierten PDF gefunden werden? Und muss ich dann nicht "\usepackage[OT1]{fontenc}" statt "\usepackage[T1]{fontenc}" verwenden?

  13. #13
    Registrierter Benutzer
    Registriert seit
    19.05.2009
    Beiträge
    4.045
    Nein, OT1 und T1 sind Schriftkodierungen = Zeichentabellen. Das hat nichts mit den Schriftformaten Open Type oder type1 zu tun, auch wenn die Namen ähnlich klingen.

    Wenn du eine Open Type Schrift verwenden willst, musst du entweder xelatex benutzen, das kann das von Hause aus. Oder du musst die Open Type Schrift in eine Type1-Schrift (pfb) konvertieren, diverse tfm, vf, und sonstige Dateien erzeugen und alles installieren. Siehe auch:
    http://www.mrunix.de/forums/showthread.php?t=67058

  14. #14
    Registrierter Benutzer
    Registriert seit
    09.02.2009
    Beiträge
    68
    Ist es dann also möglich, Adobe Janson und \usepackage[T1]{fontenc} zu benutzen?

  15. #15
    Registrierter Benutzer
    Registriert seit
    19.05.2009
    Beiträge
    4.045
    Ja, wobei es wohl einfacher ist, die nötigen Dateien für die Kodierung LY1 zu erstellen (LY1=Alternative zu T1, aber nicht so verbreitet).

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •