Hallo,
ich stehe vor dem Problem das ich mit Python ein Textdokument (Mischung aus verschiedenen Formaten überwiegend Ascii) nach Latex konvertieren möchte. Habe schon einen großen Teil des Skripts in Python, der auch anstandsfrei läuft. Jetzt stehe ich nur vor dem Problem, dass die Textdatei auch einige (wenige) Unicodes enthält die nicht kodiert sind sondern schon wie gedruckt im Dokument vorliegen... wie kann ich diese strings entsprechend mit Python ERKENNEN, damit ich sie mit dem entsprechenden Latex-Gegenstück ersetzten kann.
Habe schon viel gesucht, aber bin noch auf keine Lösung gestoßen ...

Konkrete Beispiele die ich gerne erkennen würde sind
| (vertical line)
ö (small o with diaeresis)
und z.B. verschiedene griechische Buchstaben wie Delta, Kappa, Pi
und einige Sonderzeichen wie einen Pfeil

Diese Zeichen bedürfen tatsächlich auch der Bearbeitung um sie anschliessend in den entsprechenden Latexcode umzuformen.

Hat jemand einen entsprechenden Tip oder Hinweis für mich, wie man das anstellen könnte? Oder ist das mit Python gar nicht möglich?
Vielen Dank auf jeden Fall schon mal von meiner Seite.

cleo