Anzeige:
Ergebnis 1 bis 10 von 10

Thema: Suche nach 'ff' in PDF fehlerhaft

  1. #1
    Banned
    Registriert seit
    18.05.2009
    Beiträge
    112

    Suche nach 'ff' in PDF fehlerhaft

    Hallo zusammen,

    folgende SW habe ich:

    Texmaker v3.02
    MiKTeX 2.9
    Win7 - 32Bit

    Ich habe ein funktionierendes Minimalbeispiel erstellt, was sich ohne Warings und Error übersetzen lässt. Dies wandle ich dann noch in eine PDF-Datei.

    Wenn ich nun in der PDF nach dem String ff oder auch Sniffer suche,
    dann findet der PDF-Betrachter das Wort oder den String nicht.
    Suche ich aber nach ll ss dd oder bb, so lassen sich in der PDF die Strings finden.

    Das Problem ist PDF-Reader unabhängig, da ich gerade neben dem Adobe Reader noch einen weiteren portable ausprobiert habe und dort selbiges Verhalten zu bemerken ist.

    Hat jemand dafür eine Erklärung?
    Was muss ich am Source ändern, damit ich auch ff erfolgreich im PDF findet kann.

    Besten Dank im Voraus!
    Kind regards,
    Tux0r

    PS: Ich habe das TeX File an den Beitrag angehanden, aber als txt umbenannt, damit der Upload auch funktionert ;-)

    Nachtrag: Ich verwende ISO 8859-1 !
    Geändert von Tux (15-06-2011 um 10:50 Uhr)

  2. #2
    Registrierter Benutzer
    Registriert seit
    11.09.2005
    Beiträge
    1.712
    Die ff werden nicht als zwei f gesetzt (wie u.a. auch fi), sondern als eigenes Zeichen. Das nennt sich dann Ligatur und verschönert das Schriftbild. Wenn man sich die Buchstaben genau anschaut, sieht man die Ligatur.

    Um die Buchstabenkombinationen trotzdem suchbar und kopierbar zu machen, gibt es das Paket "cmap".

  3. #3
    Banned
    Registriert seit
    18.05.2009
    Beiträge
    112
    Na da sage ich mal besten Dank!
    Hätte ich den Beitrag direkt verfassen sollen, und nicht erst 1h Probleme aussondieren sollen!

    Grüße

  4. #4
    Registrierter Benutzer
    Registriert seit
    27.11.2007
    Beiträge
    375
    Hallo,

    dein Beispiel geht bei mir problemlos. Ich kann sowohl nach ff suchen, als auch ff kopieren. Dein angehängtes pdf dagegegen hat die Ligaturen anders kodiert. Ich vermute, dein LaTeX ist ziemlich veraltet?

    Christian.
    Ubuntu 16.04 -- TeX Live 2015 -- Emacs (AUCTeX, RefTeX)

  5. #5
    Registrierter Benutzer
    Registriert seit
    11.09.2005
    Beiträge
    1.712
    Grad nochmal bei mir probiert auf WinXP mit TeXLive2010 mit untenstehendem Code:
    Mit TeXnicCenter (vermutlich Windows-Standardencoding) ist das PDF durchsuchbar.
    Mit TeXMaker (UTF-8) ist das PDF nicht durchsuchbar.

    Code:
    \documentclass{scrreprt} 
    \usepackage[ngerman]{babel} 
    \usepackage[latin1]{inputenc}
    \usepackage[T1]{fontenc}	
    
    \begin{document}
    \subsection{Sniffer fi}
    Sniffer wird in der Suche nicht gefunden, wie jedes andere 
    Wort in dem zweimal aufeinanderfolgend ein F auftritt.
    
    \end{document}
    Offensichtlich liegts am Editor, was imho nicht unbedingt für TeXMaker spricht.

  6. #6
    Banned
    Registriert seit
    18.05.2009
    Beiträge
    112
    Hallo tral,
    also cmap behob das Problem, wie oben erwähnt.

    Meine SW: ist folgende:

    This is pdfTeX, Version 3.1415926-1.40.11 (MiKTeX 2.9)
    This is makeindex, version 2.15 [MiKTeX 2.9] (kpathsea + Thai support).
    MiKTeX-BibTeX 2.9.3877 (0.99d) (MiKTeX 2.9)

    Texmaker v3.02
    Win7 - 32Bit - SP1

    Was für SW bzw. SW-Stand nutzt du?

    MfG

  7. #7
    Banned
    Registriert seit
    18.05.2009
    Beiträge
    112
    Hallo Xenara,

    komisch ist es definitiv.
    Danke für deine Gegenprobe!
    Ich werde die Jungs bei Texmaker mal anschreiben!

    mfg

  8. #8
    Registrierter Benutzer
    Registriert seit
    19.05.2009
    Beiträge
    4.045
    Die Kodierung der tex-Datei ist völlig irrelevant. Das gilt auch für den verwendeten Editor. Die Ursprungsdatei verwendet Type3 (bitmap) Schriften. Als erstes sollte daher mal cm-super installiert werden (oder \usepackage{lmodern} verwendet werden).

    Wenn das Problem weiterhin besteht: cmap hilft gelegentlich bei den Standardschriften, versagt aber vielen anderen Schriften, weil es nicht mit virtuellen Schriften umgehen kann. Normalerweise ist \pdfglyphtounicode die bessere Lösung.

    http://tex.stackexchange.com/questio...and-searchable

  9. #9
    Registrierter Benutzer
    Registriert seit
    11.09.2005
    Beiträge
    1.712
    Update:
    Ich habe TeXMaker Unrecht getan. Es liegt nicht am LaTeX-Editor, sondern am Viewer.
    Mit TeXnicCenter verwende ich den AdobeReader, mit TeXMaker den eingebauten Viewer und öffne dann mit meinem standardmässigen Foxit.
    Mit dem AcrobatReader wird "ff" in den PDFs (mit TeXMaker und TeXnicCenter) gefunden.
    Mit Foxit funktioniert es nur, wenn cmap eingebunden ist.

    Wobei cmap ganz am Anfang geladen werden muss, sonst gibt es eine Warnung, dass fontenc schon geladen wäre.
    Code:
    \documentclass{scrreprt} 
    \usepackage{cmap}
    \usepackage[ngerman]{babel} 
    \usepackage[latin1]{inputenc}
    \usepackage[T1]{fontenc}	
    
    \begin{document}
    \subsection{Sniffer fi}
    Sniffer  fi wird in der Suche nicht gefunden, wie jedes andere 
    Wort in dem zweimal aufeinanderfolgend ein F auftritt.
    
    \end{document}

  10. #10
    Banned
    Registriert seit
    18.05.2009
    Beiträge
    112
    Hallo nocheinmal,
    vielen Dank für die detaillierte Beschreibung und Recherche!
    Mit besten Grüßen,...
    TuX0r

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •