Archiv verlassen und diese Seite im Standarddesign anzeigen : Word-Cloud eines LaTeX-Dokuments via LaTeX erzeugen lassen
Liebe Forengemeinde,
ich stehe vor einer für mich unlösbaren Aufgabe. Ich studiere Lehramt im Master-Studium und habe gerade mein Praxissemester absolviert. Mein Praktikumsbericht (70 Seiten A4) ist fertig, ich habe ihn mit LaTeX geschrieben. Mein Ex hatte mir das zu Beginn meines Studiums so weit beigebracht, dass ich die gängigen Sachen konnte und in der Lage war, damit meine Hausarbeiten etc. zu verfassen.
Auch der Praktikumsbericht war kein Problem - bis unser Dozent nun auf die glorreiche Idee kam, dass jeder Bericht eine Word-Cloud des Berichts enthalten soll. Er möchte mit uns dann dazu irgendwas erarbeiten, keine Ahnung. Nun brauche ich also eine Word-Cloud meines als tex-Datei und als pdf-Datei vorliegenden Berichts und muss diese in das pdf dann auch wieder einfügen.
Kann LaTeX sowas selbst? Oder muss ich auf Online-Word-Cloud-Generatoren zurückgreifen und das Ergebnis dann manuell in den Bericht mit aufnehmen?
So ein Generator müsste ja ne Menge können:
- deutsche Umlaute
- "Herausfiltern" von Wörtern, die in der Cloud nicht auftauchen sollen, wie "und", "oder", "nur", "auch", "der, die das", usw.
- Zugriff auf ein PDF
- ach ja, und, ganz vergessen: Erzeugung einer Cloud in wählbaren geometrischen Figuren (der Dozent meinte, unsere Clouds sollten nicht alle gleich aussehen, daher soll einer einen Stern machen, einer einen Kreis, einer ein Herz etc.)
Ich stehe vor dieser Aufgabe wie der Ochs vor dem Berg.
Wenn jemand Tipps zur Lösung hat, würde es mich echt freuen.
Euch allen hier ein gutes Jahr 2016!
Hast Du schon mal gegoogelt? Es gibt ein Programm namens Wordle. Mir ist nicht bekannt, dass LaTeX aus sich heraus das kann.
u_fischer
14-01-2016, 19:24
http://tex.stackexchange.com/search?q=word+cloud
Hast Du schon mal gegoogelt? Es gibt ein Programm namens Wordle. Mir ist nicht bekannt, dass LaTeX aus sich heraus das kann.
Ja, natürlich habe ich es gegooglet, das ist ja immer das erste, was man macht. Hab irrsinnig viele Programme gefunden, die Word-Clouds erzeugen können, aber keines, was den genannten Spezifika entspricht. Auch Wordle kann das nicht.
http://tex.stackexchange.com/search?q=word+cloud
Das ist alles in englischer Sprache, das verstehe ich leider nicht :-(
Du macht einen Master-Abschluss ohne jegliche Englisch-Kenntnisse? Das geht? WAU!¹
Extrahiere den Text Deines Berichts. Das geht beispielsweise aus dem PDF mit pdftotext oder aus dem TeX-Quellcode mit detex. Ggf. musst Du das Ergebnis noch ein wenig nachbearbeiten. Anschließend kannst Du mit Wordle oder einem anderen Word-Cloud-Programm ein Image erzeugen. Das wiederum bindest Du mit \includegraphics oder \includepdf in Dein Dokument ein.
Übrigens würde ich sagen, dass der Dozent mal lernen sollte, was die Merkmale eines Berichts sind. Künstlerische Ausschmückungen haben darin jedenfalls nichts zu suchen – nicht einmal, wenn es ein Bericht im Fach Bildende Kunst wäre. Auch dann gehören da nur Bilder rein, die in direktem Zusammenhang mit der berichteten Tätigkeit stehen. Unsere Kinder bekommen für so einen Unfug ggf. in der Schule sogar Punktabzug. Bei anderen Lehrern gibt es dafür Fleißsternchen. Im wahren Leben, lachen sich die Kollegen einen Ast und der Chef erklärt einem, dass man das so dem Kunden nicht präsentieren kann. Selbst als Coverbild sollte man das eher nicht in Herzchenform machen …
——
1 Versehentlich hätte ich fast WOW geschrieben. ;-)
lektorat
16-01-2016, 23:55
Du macht einen Master-Abschluss ohne jegliche Englisch-Kenntnisse? Das geht? WAU!
Das hat sie doch gar nicht geschrieben. Ich kann sie schon verstehen. Selbst dann, wenn man eine Fremdsprache in der Schule ganz gut konnte, ist es schwierig, Texte in dieser Sprache verstehend zu lesen, deren Inhalte einem auch im Deutschen schon wie ein Buch mit sieben Siegeln vorkommen. Sprich: LaTeX-Anfängern eine englischsprachige Quelle zu empfehlen, ist für manche Menschen einfach ne ziemliche Zumutung. Ich selbst bin es gewohnt, englische Fachtexte zu lesen, aber ich mache das auch beruflich und kann meine diesbezüglichen Kompetenzen nicht einfach bei anderen Menschen voraussetzen.
Extrahiere den Text Deines Berichts. Das geht beispielsweise aus dem PDF mit pdftotext oder aus dem TeX-Quellcode mit detex. Ggf. musst Du das Ergebnis noch ein wenig nachbearbeiten. Anschließend kannst Du mit Wordle oder einem anderen Word-Cloud-Programm ein Image erzeugen. Das wiederum bindest Du mit \includegraphics oder \includepdf in Dein Dokument ein.
Kann man so machen, man kann sich auch einfach die Worthäufigkeit ausgeben lassen (viele Editoren können das), daraus ne Tabelle machen, die ungewollten Wörter rauskicken und das Resultat an einen beliebigen Wordcloud-Generator geben.
Übrigens würde ich sagen, dass der Dozent mal lernen sollte, was die Merkmale eines Berichts sind. Künstlerische Ausschmückungen haben darin jedenfalls nichts zu suchen – nicht einmal, wenn es ein Bericht im Fach Bildende Kunst wäre. Auch dann gehören da nur Bilder rein, die in direktem Zusammenhang mit der berichteten Tätigkeit stehen. Unsere Kinder bekommen für so einen Unfug ggf. in der Schule sogar Punktabzug. Bei anderen Lehrern gibt es dafür Fleißsternchen. Im wahren Leben, lachen sich die Kollegen einen Ast und der Chef erklärt einem, dass man das so dem Kunden nicht präsentieren kann. Selbst als Coverbild sollte man das eher nicht in Herzchenform machen …
Solche Abbildungen sind keine künstlerischen Ausschmückungen, sondern sollen den Studierenden helfen, ihre eigene Schreibpraxis zu reflektieren. In meinem eigenen Studium war dies gängige Praxis, ebenso wie das Markieren von Füllwörtern im Text etc. Durch eine (wie auch immer geartete) Visualisierung des eigenen Schreibstils wird eine selbstkritische Auseinandersetzung gefördert, Besonderheiten und Unterschiede zu anderen Studierenden können leicht aufgezeigt werden. Das wird in bestimmten Fächern an jeder Uni so gemacht.
Die von dir genannten Beispiele aus Schule und Berufsleben haben also mit dem, was die Fragestellerin möchte, nichts zu tun.
Aber das ist typisch für Foren, nicht nur für LaTeX-Foren. Erstmal den Fragesteller ankacken und sich als Besserwisser aufspielen. Ne große Hilfe ist sowas nicht ...
Eigentlich hatte ich jetzt tatsächlich lang und breit ausgeführt, warum eine Wortwolke – selbst in der Ausführung als Schlagwortwolke (https://de.wikipedia.org/wiki/Schlagwortwolke) – wenig geeignet ist, nennenswerte Aussagen über den Schreibstil eines oder gar mehrere Autoren im Vergleich zu tätigen.
Aber letztlich ist das für die Frage unerheblich. Deshalb verwahre ich mich lediglich gegen den Vorwurf, ich hätte den Fragesteller »angekackt«. Ich bin zwar ein Primat, neige aber im Gegensatz zu einigen meiner Mitprimaten nicht dazu, mit Fäkalien zu werfen. Stattdessen übe ich – aus meiner begrenzten Sichtweise begründete – Kritik, die sich außerdem in diesem Fall nicht gegen den Fragesteller oder die Fragestellerin wendet, sondern gegen denjenigen, der die meiner Meinung nach wenig passende Anforderung gestellt hat. Aus der Wortwahl der Frage schließe ich übrigens, dass den Fragesteller oder die Fragestellerin die Anforderung auch nicht allzu sehr begeistert. Ich kann nichts verwerfliches darin finden, ihn oder sie in dieser Ansicht argumentativ zu bestärken.
Und ja, es ist typisch für Foren, dass man nicht nur Antworten auf die Frage bekommt, die man gestellt hat. Noch kann man den Helfern – glücklicherweise – nicht vorschreiben, was sie zusätzlich dazu beitragen. Und wenn mir Deine Aufregung über meine Antwort auch nicht gerade gefällt, ja ich sie sogar als recht beleidigend auffasse und sie sicher keine allzu große Hilfe zur Frage selbst ist, so würde ich doch jederzeit Deine Möglichkeit, diese zu äußern, verteidigen.
Powered by vBulletin® Version 4.2.5 Copyright ©2024 Adduco Digital e.K. und vBulletin Solutions, Inc. Alle Rechte vorbehalten.