PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Histogramm mit pstricks



Spindoctor
26-02-2009, 12:30
Hallo!

Ich hab eine sehr lange Liste von Daten im Text-Format

Beispiel

300406,1,"10","1997/ 1","1997/ 4",4,T,F
300406,3,"10","1997/ 55","1997/360",306,F,F
300406,5,"10","1998/ 61","1999/295",600,F,F
300406,8,"10","2000/ 52","2000/246",306,F,F(die rot markierten Daten sind für mich die interessanten)

Aus diesen Daten muss ich ein Histogramm erstellen, also ein Balkendiagramm mit dem roten Wert auf der x-Achse und die Häufigkeit des jeweiligen Werts auf der y-Achse.

Wie stelle ich das mit pstricks an?

Ich habe noch nie externe Daten in pstricks importiert, laut pstricks-add-Manual sollte das aber mit dem Befehl \listplot[plotstyle=bar] funktionieren.
Aber wie bewege ich pstricks dazu, (1) die nicht-roten Werte zu ignorieren (2) die Häufigkeit der roten Werte zu berechnen und (3) ein Histogramm daraus zu machen?

Ich habe im Forum nur diesen Eintrag (http://www.mrunix.de/forums/showthread.php?t=46265&highlight=histogramm) dazu gefunden, der hat mir aber nicht wirklich geholfen...

Ich weiß es ist viel verlangt, aber am aller dankbarsten wäre ich für ein kleines exemplarisches Beispiel mit den obigen Daten.

Vielen Dank,

Spin

mechanicus
26-02-2009, 17:05
Hallo,

hast du die Möglichkeit, die Daten des Histogramms irgendwo anders zu bearbieiten, so dass du nur noch x-y Werte hast?

Gruß
Marco

Spindoctor
26-02-2009, 17:37
Danke zunächst für die Antwort, mechanicus!

Habe die Daten jetzt mal in [R] (einem Open-Source-Statistik-Programm) (http://www.r-project.org/) weiterbearbeitet, was ich zunächst vermeiden wollte. pstricks wird ja immer wieder dafür gelobt, dass es im Prinzip eine Programmiersprache ist. Ich nahm also an, dass ich die notwendigen Operationen direkt in pstricks durchführen kann.
Da ich nicht weiß wie und ob das geht, hab ich also jetzt mal [R] bemüht und mir eine Tabelle mit x- und y-Werten ausgeben lassen.
Die Frage bleibt bestehen: kann man diese Operationen nicht direkt in pstricks durchführen?

Trotzdem häng ich noch ziemlich in der Luft :-(

Zwar funktioniert mit den Daten von [R] die Ausgabe des Balkendiagramms, allerdings sind noch sehr viele Anpassungen notwendig.
Ich muss über 40 Datensätze auswerten, würde das also gerne automatisieren.

Kurz mal zur Erklärung, was ich überhaupt mache:
Ich möchte für mehrere statistisch erhobene Personengruppen Histogramme ausgeben, aus denen hervorgeht wieviele Tage sie in einem Intervall von 10 Jahren durchgehend beschäftigt waren. Das heißt, der größte x-Wert liegt über 3.000 (durchgehend beschäftigt), der kleinste bei 0 (genaugenommen etwas höher, weil mich gar nicht Arbeitstätige derzeit nicht interessieren, aber egal).
Diese Auswertung soll bei über 40 Personengruppen stattfinden, ich bin also an einer möglichst automatisierten Lösung interessiert.

Mit [R] kann ich mir schonmal Tabellen erstellen, die sich (zumindest theoretisch) von pstricks auswerten lassen. In [R] kann ich auch einen batch erstellen, der für alle >40 Gruppen Tabellen ausspuckt.

Ich hab noch einige Probleme mit der Anpassung in pstricks, allerdings möchte ich Dich, mechanicus, und das ganze Forum damit nicht belasten, bevor ich mir nicht ganz im klaren bin, WELCHE Probleme das sind.

Ich werd also noch ein bisschen nachdenken.