Ausgewählte statistische Grundlagen und Analysemethoden/Darstellung

From Eksa
Jump to: navigation, search

Vorheriges Kapitel: 3.5 Der Zusammenhang zwischen Variablen

3.6 Die grafische Darstellung statistischer Ergebnisse

verfasst von Erwin Ebermann

Ein Bild sagt mehr als 1000 Worte

Dies trifft auch für die Statistik zu. Wer es versteht, mit einfachen, klaren und aussagekräftigen Diagrammen zu punkten, wird für eine leichten und einprägsamen Zugang zu seinen Analysen Anerkennung finden.

Vorteil von Diagrammen liegt in Einfachheit der Darstellung

Allzuleicht lässt man sich von der Vielfalt an grafischen Darstellungsmöglichkeiten beeinflussen und meint, Diagramme noch ein wenig optisch ausgefaller, dreidimensional, vermeintlich attraktiver mit zahlreichen Schmankerln machen zu müssen, bis irgendwann einmal der Vorteil eines Diagramms gegenüber einer komplexen Tabelle verloren geht und die BetrachterInnen ratlos vor einem schwierig zu deutenden Kunstwerk sitzen. Niemand ist bereit, einige Minuten vor einem komplexen Diagramm zu sitzen, um zu versuchen, es zu verstehen. Mit Diagrammen gewinnt man die BetrachterIn in wenigen Sekunden oder man verliert sie/ihn. Die Notwendigkeit der inhaltlichen Klarheit und dadurch Schlichtheit eines Diagramms hat klare Priorität vor der künstlerischen Gestaltung.

Nicht jedes Diagramm ist für jede Datenlage geeignet.

Man sollte bedenken, dass nicht jedes Diagramm für jede Art von Information geeignet ist. Manche Diagramme, wie Kreisdiagramme[1], werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und würden bei der Wiedergabe von Mehrfachantworten[2] zu falschen Schlüssen führen.

Begleitinformationen sind wichtig

Auch Diagramme benötigen Begleitinformationen, um sie voll verständlich zu machen und wissenschaftliche Seriösität nachzuweisen.

Was in Diagrammen, was im Text?

Zeigen Sie mit Diagrammen besondere Eigenheiten der Daten und packen Sie die Analysen und anderen notwendigen Begleitinformationen in den Text.


Verweise:
[1] Siehe Kapitel 3.6.1.1
[2] Siehe Kapitel 3.2.2

Inhalt

3.6.1 Arten von Diagrammen

Wesentliche Diagrammformen sind:

  • Balkendiagramme, inklusive gruppierten Diagrammen und Stapelbalkendiagrammen
  • Liniendiagramme
  • Flächendiagramme
  • Kreisdiagramme
  • Boxplots[1]
  • Streudiagramme
  • Histogramme
  • Kartogramme

Viele Programme ermöglichen die Erstellung von Diagrammen

Mit Ausnahme von Boxplots und Kartogrammen können alle Diagrammformen von den gängigen Programmen erstellt werden, wie sogar von WinWord (EINFÜGEN - GRAFIK - DIAGRAMM) oder Excel. In SPSS geht man in der Menüleiste zu GRAFIKEN und findet dort alle hier angeführten Diagrammformen und viele mehr zur Auswahl.

Auch hier gilt, dass professionelle statistische Programme wie z.B. SPSS oder Statistica Vorteile aufweisen, da sie eine Fülle feiner Einstellungen erlauben, welche mit Bordmitteln nicht zu erreichen sind. Auch verbinden sie in effizienter Form im gleichen Menüpunkt die gleichzeitige Berechnung und Erstellung komplexer Statistiken wie auch von Diagrammen.


Verweise:
[1] Siehe Kapitel 3.4.5.1



3.6.1.1 Kreisdiagramme

Kreisdiagramme (auch Tortendiagramme) genannt, sind eine beliebte grafische Darstellungsform, um die Aufteilung eines Ganzen aufzuzeigen.

Für die grafische Darstellung kategorieller Daten (Nominal[1]- oder Ordinalskalen[2]) verwendet man Diagrammformen, die eine möglichst klare Darstellung der relativen Anteile erlauben. Alle Anteile müssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick größenmäßig eingeordnet werden können, dürfen nicht zu viele Kategorien verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach Möglichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.

Besonders gut geeignet für die Darstellung relativer Anteile sind Torten- oder Kreisdiagramme:

Kreisdiagramm Religionszugehörigkeit in Nkorongoji (Mali)

Optimal große Teile, aber nicht zu viele.

Für das menschliche Auge sind Winkel von mehr als 90 Grad besonders gut zu erkennen. Deshalb eignen sich Tortendiagramme besonders zur Darstellung von Mehrheiten oder von Anteilen von mindestens einem Viertel.

Wird die Anzahl der Anteile und damit der Tortenstücke zu zahlreich, wird ein Tortendiagramm schnell unübersichtlich, besonders wenn gleichzeitig seine größten Stücke kleiner als ein Viertel werden:

Kreisdiagramm Religionszugehörigkeit in Matmatar

Hier ist es nur mehr mit Mühe möglich, die Tortenstücke nach ihrer Größe zu reihen, da die Rundung die Abschätzung der relativen Größe erschwert. Daher wären für die Darstellung vieler Subeinheiten eines Ganzen Stapelbalkendiagramme[3] besser geeignet.

Keinesfalls für Mehrfachantworten

Gänzlich ungeeignet sind Kreisdiagramme, um die Ergebnisse von Fragen mit Mehrfachantworten darzustellen:

Kreisdiagramm Mehrfachantworten

Bei Kreisdiagrammen neigen BetrachterInnen dazu, die gesamte Torte als etwas Ganzes, also als 100 % aufzufasssen.Da bei Mehrfachantworten jedoch mehr als 100 % auftreten können (auch weniger als 100 %), kann dies zu einer falschen Interpretation führen. Deutlich besser wären für diesen Zweck horizontale Balkendiagramme geeignet.


Verweise:
[1] Siehe Kapitel 3.1.2.2
[2] Siehe Kapitel 3.1.2.3
[3] Siehe Kapitel 3.6.1.3



3.6.1.2 Liniendiagramme

Liniendiagramme eignen sich besonders für die Darstellung von Entwicklungen, ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr Populationen[1] miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen Ländern die Akzeptanz der Aufnahme eines weiteren Landes in die Europäische Union veränderte.

Liniendiagramm

Man sieht auf einem Blick, dass in Schweden die Akzeptanz von einem hohen Niveau ausgehend stark zurückging, in Irland eher gering blieb, sich in Polen hingegen von einem sehr geringem zu einem relativ hohen Niveau entwickelte.


Verweise:
[1] Siehe Kapitel 2.1



3.6.1.3 Balkendiagramme

Einfache Balkendiagramme sind, da sie vom gleichen Nullpunkt ausgehen, sehr gut geeignet, um komparativ auch kleinste Unterschiede zwischen Subbereichen erkennbar zu machen.

Sie sind die beste Darstellungsform, um z.B. die Ergebnisse von Fragen mit Mehrfachantworten zu präsentieren.

Balkendiagramm Mehrfachantwort

Balkendiagramme können sowohl horizontal (wie das obige Beispiel) wie auch vertikal orientiert sein.

Das gruppierte Balkendiagramm

Dieses ist besonders geeignet für die kontrastive Darstellung der Ausprägungen einer Variable (z.B. männlich-weiblich für Geschlecht, Hinduismus-Islam etc. für Religionen). So kann man z.B. vergleichend zeigen, wie Männer und Frauen in verschiedenen Bereichen abschneiden. Siehe ein Beispiel dazu bei der Berechnung mit SPSS.

Stapelbalkendiagramme: Anteile vom Ganzen

Stapelbalkendiagramme werden - neben Kreisdiagrammen - oft verwendet, um Anteile am Ganzen darzustellen. Zur Darstellung von relativen Mehrheiten sind sie etwas weniger übersichtlich als Kreisdiagramme.

Stapelbalkendiagramm Religionszugehörigkeit in Nkorongoji (Mali)

Auch sie werden sehr schnell unübersichtlich, wenn die Kategorien zu zahlreich werden, bleiben bei einer größeren Zahl von Subeinheiten aber noch übersichtlicher als Kreisdiagramme:

Stapelbalkendiagramm Religionszugehörigkeit in Matmatar

Vergleich der Aufteilung: Stapelbalkendiagramme

Gestapelte Balkendiagramme sind besonders wertvoll beim Vergleich der Aufteilung der gleichen Variable in verschiedenen Stichproben/Populationen[1].

Stapelbalkendiagramm Religionszugehörigkeit in Matmatar


Verweise:
[1] Siehe Kapitel 2.1



3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS

Im folgenden Diagramm interessiert uns, inwieweit sich die männliche und die weibliche Lebenserwartung in den Ländern dieser Welt nach deren religiöser Ausrichtung unterscheiden. Wir greifen dabei auf Daten in world95.sav bei der Berechnung mit SPSS zurück. Der Vorgang mit SPSS erfolgt folgendermaßen:

A. Klicken Sie auf GRAFIKEN - BALKEN

B. Wählen Sie das Symbol für Gruppiert und dann Auswertung über verschiedene Variablen.

C. Nun wählen wir zumindest zwei numerische Variablen aus (welche wir vergleichend zu den Religionen betrachten wollen, in unserem Falle die männliche und die weibliche Lebenserwartung). Diese schieben wir in das Feld Bedeutung der Balken:

Definition von gruppierten Balkendiagrammen mit SPSS

D. Im Feld Kategorienachse fügen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.

E. Bei Klick auf Auswertungsfunktion können wir uns für bestimmte Kennzahlen entscheiden, wie den Median[1], das arithmetische Mittel[2], die Häufigkeit[3], Summe, welche für die numerischen Variablen berechnet werden..

Nach Klick auf OK erhalten wir das folgende Diagramm:

Gruppiertes Balkendiagramm Religion und Lebenserwartung aufgeteilt nach Geschlechtern


Verweise:
[1] Siehe Kapitel 3.3.3
[2] Siehe Kapitel 3.3.2
[3] Siehe Kapitel 3.2.2



3.6.1.4 Kartogramme

Kartogramme sind eine Sonderform von Diagrammen und zeigen die Ausprägungen einer Variable auf Landkarten.

Kartogramme sind meist nur mit relativ teuren Programmen möglich, wie z.B. Arcview. Zu Excel gibt es eine billigere Zusatzsoftware wie Mapland (99-999 $). MS Office 2000 Professional enthielt noch eine vereinfachte Excel-Komponente namens Microsoft Map.

Kartogramm Bevölkerungsdichte 1991

Kartogramme in Wahlanalysen häufig

Mittels Kartogrammen können v.a. regional unterschiedliche Ausprägungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpräferenzen in den verschiedenen Bundesländern und Regionen aufzuzeigen.



3.6.1.5 Histogramme

Unter einem Histogramm versteht man die grafische Darstellung der Häufigkeitsverteilung[1] von Messwerten.

Die Daten sind dabei größenmäßig auf der X-Achse geordnet, während auf der Y- Achse ihre Häufigkeiten stehen. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist.

Histogramm Kindersterblichkeit

Histogramme werden besonders zur Darstellung von Verteilungen verwendet, wie auch zur Demonstration der Normalverteilung[2].


Verweise:
[1] Siehe Kapitel 3.1.3.3.2
[2] Siehe Kapitel 3.1.3.3.1



3.6.1.6 Streudiagramme

Streudiagramme (oder Punktdiagramme) ermöglichen die grafische Darstellung des Zusammenhangs von zwei Variablen.

Die Ausprägung der Variable A wird auf der X- Achse eingetragen, die Ausprägung der Variable B auf der Y-Achse.

Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate

Basierend auf UN-Daten über die Entwicklung der Länder dieser Welt (siehe world95.sav) zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zurückgeht. Streudiagramme eignen sich vorzüglich zum Aufzeigen des Zusammenhangs zwischen Variablen[1] und somit auch zur Darstellung der Regression und der Korrelation[2].


Verweise:
[1] Siehe Kapitel 3.5.1
[2] Siehe Kapitel 3.5.4.2


3.6.2 Welches Diagramm für welche Daten?

Tabelle Eignung von Diagrammarten für verschiedene Daten



3.6.3 Notwendige Begleitinformationen von Diagrammen

Diagramme brauchen Begleitinformationen

Diagramme sollten genauso wie die tabellarische Darstellung statistischer Daten alle notwendigen Begleitinformationen aufweisen, die zum Verständnis des Diagramms sowie zum Nachweis der Seriösität der Arbeit wichtig sind. Dazu zählen:

A. Name des Erstellers, v.a. wenn es sich um Fremddiagramme handelt;

B. Falls es sich nicht um eigene Daten handelt, auf deren Grundlage das Diagramm erstellt wurde, sollte die Quelle der Daten angegeben werden (z.B. Statistikamt der Stadt Ulm 1997) (am besten unterhalb des Diagramms)

C. Jahr der Erhebung der Daten;

D. Größe der Stichprobe (am Besten die bereinigte Größe, welche Null-Eingaben und fehlerhafte Eingaben nicht berücksichtigt), v.a. wenn es sich um eigene Daten handelt. Bei gut bekannten Fremddatenquellen wird darauf meist verzichtet (z.B. bei Erhebungen statistischer Zentralämter etc.)

E. Angabe der Messeinheiten (cm, Zähleinheiten, Prozent etc.)

F. Aussagekräftiger Titel des Diagramms (ganz oben)

G. Aussagekräftige Bezeichnungen für die Bestandteile des Diagramms (z.B. für Daten auf der x- bzw. y-Achse.

H. Eventuell Hinweis auf Art der Erhebung der Daten

I. Bei Mehrfachantworten unbedingt Hinweis darauf

Das folgende Diagramm (Quelle: http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[1]) berücksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden müssen, bleibt der Erkenntnisgrad hoch.

Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbstätigen an der Gesamtheit der erwerbstätigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.


Verweise:
[1] http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf


↵ Zurück zur Übersicht


↑ Nach oben