Difference between revisions of "Grundlagen Statistischer Auswertungsverfahren"

From Eksa
Jump to: navigation, search
(Beispiel: Korrelation von Fertiliät und weiblicher Lebenserwartung)
m (Protected "Grundlagen Statistischer Auswertungsverfahren" ([Edit=Allow only administrators] (indefinite) [Move=Allow only administrators] (indefinite)) [cascading])
 
(37 intermediate revisions by the same user not shown)
Line 1: Line 1:
 +
[[Main_Page|'''↵ Zurück zur Hauptseite''']]
 
= Grundlagen statistischer Auswertungsverfahren =
 
= Grundlagen statistischer Auswertungsverfahren =
 +
<sup>verfasst von Erwin Ebermann</sup>[[File:Quanti_Logo.gif|right]]
  
Quelle: http://www.univie.ac.at/ksa/elearning/cp/quantitative/quantitative-titel.html<br />
+
=== Kapitel dieser Lernunterlage ===
Erwin Ebermann<br />
+
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
Institut für Kultur- und Sozialanthropologie<br />
+
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
  
 
==Kapitelübersicht==
 
==Kapitelübersicht==
Line 13: Line 18:
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
::[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
+
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
::[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
+
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
::[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
+
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
Line 22: Line 27:
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
Line 46: Line 51:
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
Line 67: Line 72:
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
Line 93: Line 98:
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
Line 101: Line 106:
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
Line 126: Line 131:
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
Line 161: Line 166:
  
  
 
+
<!--
\[(.*)\] Siehe Kapitel
+
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
 
 
 
 
 
 
 
 
  
 
= 1. Funktion und Sinn von Statistik =
 
= 1. Funktion und Sinn von Statistik =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== Weitverbreitete Scheu vor statistischen Methoden ===
+
==== Weitverbreitete Scheu vor statistischen Methoden ====
  
 
Was bringt Statistik, was bringen quantitative Forschungsmethoden? Viele Menschen stehen ihnen skeptisch gegenüber und dies teilweise leider zurecht. Allzuleicht kann mit Statistiken Unfug getrieben werden und nicht immer sind die BetrachterInnen statistisch aufbereiteter Daten genügend geschult, um bewusste Verzerrungen zu erkennen. Richtig verwendet jedoch, ist die Statistik ein unverzichtbares Hilfsmittel, um - losgelöst von der subjektiven Wahrnehmung - die Systematik von Tendenzen und Zusammenhängen in verschiedensten Lebensbereichen aufzeigen zu können.
 
Was bringt Statistik, was bringen quantitative Forschungsmethoden? Viele Menschen stehen ihnen skeptisch gegenüber und dies teilweise leider zurecht. Allzuleicht kann mit Statistiken Unfug getrieben werden und nicht immer sind die BetrachterInnen statistisch aufbereiteter Daten genügend geschult, um bewusste Verzerrungen zu erkennen. Richtig verwendet jedoch, ist die Statistik ein unverzichtbares Hilfsmittel, um - losgelöst von der subjektiven Wahrnehmung - die Systematik von Tendenzen und Zusammenhängen in verschiedensten Lebensbereichen aufzeigen zu können.
  
=== Statistik in der Alltagserfahrung ===
+
==== Statistik in der Alltagserfahrung ====
  
 
Ob wir wollen oder nicht, auch wenn wir niemals etwas von Statistik gehört haben, so wenden wir dennoch meist unreflektiert und unsystematisch Methoden an, welche statistischen Verfahren ähneln. D.h. wir versuchen, von einem begrenzten Erfahrungsschatz auf allgemeine Sachverhalte zu schließen. Jede Erfahrung, die wir machen, beeinflusst mit einer gewissen Wahrscheinlichkeit unsere zukünftigen Handlungs- und Denkweisen. Wir vermeiden vielleicht den Kontakt mit bestimmten Gruppen der Gesellschaft, weil sie uns wenig kooperativ erscheinen; wir fällen aufgrund einzelner Geschehnisse verallgemeinernde Urteile über Bekannte, dass sie diese oder jene Eigenschaft aufweisen, über Menschen, welche in der Öffentlichkeit stehen, über den öffentlichen Verkehr:
 
Ob wir wollen oder nicht, auch wenn wir niemals etwas von Statistik gehört haben, so wenden wir dennoch meist unreflektiert und unsystematisch Methoden an, welche statistischen Verfahren ähneln. D.h. wir versuchen, von einem begrenzten Erfahrungsschatz auf allgemeine Sachverhalte zu schließen. Jede Erfahrung, die wir machen, beeinflusst mit einer gewissen Wahrscheinlichkeit unsere zukünftigen Handlungs- und Denkweisen. Wir vermeiden vielleicht den Kontakt mit bestimmten Gruppen der Gesellschaft, weil sie uns wenig kooperativ erscheinen; wir fällen aufgrund einzelner Geschehnisse verallgemeinernde Urteile über Bekannte, dass sie diese oder jene Eigenschaft aufweisen, über Menschen, welche in der Öffentlichkeit stehen, über den öffentlichen Verkehr:
Line 186: Line 187:
 
Alle diese Aussagen basieren auf dem in der Statistik gängigen Vorgang, von einer begrenzten Erfahrung bzw. von einem begrenzten Datenschatz auf alle möglichen Erfahrungen bzw. Daten hochzurechnen, wobei wir bei diesen Aussagen jedoch wichtige Grundprinzipien der Statistik nicht berücksichtigen. Diese ’unbewussten’ Anwendungen statistischer Prinzipien ähneln den Versuchen von Couchpotatoes, die Fussballkünste eines Ronaldinho in der Praxis nachzuvollziehen.
 
Alle diese Aussagen basieren auf dem in der Statistik gängigen Vorgang, von einer begrenzten Erfahrung bzw. von einem begrenzten Datenschatz auf alle möglichen Erfahrungen bzw. Daten hochzurechnen, wobei wir bei diesen Aussagen jedoch wichtige Grundprinzipien der Statistik nicht berücksichtigen. Diese ’unbewussten’ Anwendungen statistischer Prinzipien ähneln den Versuchen von Couchpotatoes, die Fussballkünste eines Ronaldinho in der Praxis nachzuvollziehen.
  
=== Häufige Fehler bei der ’unbewussten’ Verwendung statistischer Methoden ===
+
==== Häufige Fehler bei der ’unbewussten’ Verwendung statistischer Methoden ====
  
 
Wir möchten mit diesen Aussagen ausdrücken, dass bestimmte Grundtendenzen vorkommen, dass diese systematisch sind. Aber sind sie das? Haben wir die Rahmbendingungen genügend beachtet? Ist Georg vielleicht nur mir gegenüber nicht gesprächsbereit? Gilt Ilse vielleicht allen anderen gegenüber als schroff und unkooperativ? Kommt die 5er-Linie nur zu bestimmten Tageszeiten, an welchen gerade ich sie immer benutze, zu spät und zu anderen Zeitpunkten pünktlich? Nehme ich schlechtes Wetter unter der Woche gar nicht wahr, weil ich mich im Büro befinde? Stimmt mein eigener Eindruck oder beharre ich auf meinem allerersten und möchte neue Erfahrungen nicht wahrnehmen?
 
Wir möchten mit diesen Aussagen ausdrücken, dass bestimmte Grundtendenzen vorkommen, dass diese systematisch sind. Aber sind sie das? Haben wir die Rahmbendingungen genügend beachtet? Ist Georg vielleicht nur mir gegenüber nicht gesprächsbereit? Gilt Ilse vielleicht allen anderen gegenüber als schroff und unkooperativ? Kommt die 5er-Linie nur zu bestimmten Tageszeiten, an welchen gerade ich sie immer benutze, zu spät und zu anderen Zeitpunkten pünktlich? Nehme ich schlechtes Wetter unter der Woche gar nicht wahr, weil ich mich im Büro befinde? Stimmt mein eigener Eindruck oder beharre ich auf meinem allerersten und möchte neue Erfahrungen nicht wahrnehmen?
  
=== Statistik muss mit Sorgfalt eingesetzt werden ===
+
==== Statistik muss mit Sorgfalt eingesetzt werden ====
  
Die Statistik gibt uns Methoden in die Hand, Vorurteile kritischer zu beleuchten und die '''Wahrscheinlichkeit[1]''' scheinbaren Wissens zu beurteilen, falls sie mit Verantwortungsbewusstsein und Sorgfalt verwendet werden. Sie ist besonders dann von großer Bedeutung, wenn wir - losgelöst von singulären Ereignissen oder Elementen - allgemeine Aussagen machen möchten. Sie ist dementsprechend kein Gegensatz zu '''qualitativen Forschungsmethoden''', sondern eine unverzichtbare '''Ergänzung[2]''' zu diesen.
+
Die Statistik gibt uns Methoden in die Hand, Vorurteile kritischer zu beleuchten und die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1]]]''' scheinbaren Wissens zu beurteilen, falls sie mit Verantwortungsbewusstsein und Sorgfalt verwendet werden. Sie ist besonders dann von großer Bedeutung, wenn wir - losgelöst von singulären Ereignissen oder Elementen - allgemeine Aussagen machen möchten. Sie ist dementsprechend kein Gegensatz zu '''qualitativen Forschungsmethoden''', sondern eine unverzichtbare '''Ergänzung[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[2]]]''' zu diesen.
  
+
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1] Siehe Kapitel 1.3]]<br />
 +
[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[2] Siehe Kapitel 5.1.3 der Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br/>
  
 +
==Inhaltsverzeichnisübersicht==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
</div>
  
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
  
'''Verweise:'''<br />
+
<br />
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1] Siehe Kapitel 1.3]]<br />
+
'''[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|Nächstes Kapitel: 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]'''
[2] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-50.html<br />
+
----
 +
[[#1. Funktion und Sinn von Statistik|&uarr; Nach oben]]
  
  
 +
'''[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|Vorheriges Kapitel: 1. Funktion und Sinn von Statistik]]'''
 
= 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung? =
 
= 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung? =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
'''Quantitative''' und '''qualitative Forschungsmethoden''' haben unterschiedliche Potentiale und Möglichkeiten und sind dementsprechend kein Gegensatz, sondern ergänzen sich gegenseitig.
 
'''Quantitative''' und '''qualitative Forschungsmethoden''' haben unterschiedliche Potentiale und Möglichkeiten und sind dementsprechend kein Gegensatz, sondern ergänzen sich gegenseitig.
  
=== Häufig Misstrauen gegenüber Statistik in Geistes- und Kulturwissenschaften ===
+
==== Häufig Misstrauen gegenüber Statistik in Geistes- und Kulturwissenschaften ====
  
In den Wissenschaften vom Menschen, wie z.B. der Sozial- und Kulturanthropologie, sind '''qualitative Forschungsmethoden[1]''' meist deutlich populärer als quantitative. Es mutet zu nüchtern an, zu festschreibend, zu klischeehaft, Menschen durch eine Reihe von meist kurzen Indikatoren '''beschreiben[2]''' zu wollen. GestaltpsychologInnen würden formulieren: "Das Ganze ist mehr als die Summe seiner Einzelteile."
+
In den Wissenschaften vom Menschen, wie z.B. der Sozial- und Kulturanthropologie, sind '''qualitative Forschungsmethoden[[Qualitative_Methoden_der_Kultur-_und_Sozialanthropologie|[1]]]''' meist deutlich populärer als quantitative. Es mutet zu nüchtern an, zu festschreibend, zu klischeehaft, Menschen durch eine Reihe von meist kurzen Indikatoren '''beschreiben[[Grundlagen des wissenschaftlichen Schreibens/Wissenschaftlicher Text|[2]]]''' zu wollen. GestaltpsychologInnen würden formulieren: "Das Ganze ist mehr als die Summe seiner Einzelteile."
  
=== Zur Tiefe benötigt man qualitative Ansätze ===
+
==== Zur Tiefe benötigt man qualitative Ansätze ====
  
 
Und sie haben in Vielem zweifellos recht. Wir benötigen in der Regel '''qualitative Methoden''', um feingewobene Motivforschung zu betreiben, um versteckte Aspirationen, Einstellungen, Eigenheiten zum Vorschein zu bringen. Wie könnte ein kurzer Fragebogen von einer halben Stunde Dauer das gleiche Wissen über die gleiche Person zum Vorschein bringen wie eine Befragung über mehrere Tage, die noch dazu weitgehend dem Rythmus des/der Befragten folgt? Das geht nicht. Und ginge es nur um die Befragung und Eigenheiten einzelner Individuen, etwa um eine Biographie, benötigen wir die '''Quantitativen Forschungsmethoden''' eigentlich gar nicht.
 
Und sie haben in Vielem zweifellos recht. Wir benötigen in der Regel '''qualitative Methoden''', um feingewobene Motivforschung zu betreiben, um versteckte Aspirationen, Einstellungen, Eigenheiten zum Vorschein zu bringen. Wie könnte ein kurzer Fragebogen von einer halben Stunde Dauer das gleiche Wissen über die gleiche Person zum Vorschein bringen wie eine Befragung über mehrere Tage, die noch dazu weitgehend dem Rythmus des/der Befragten folgt? Das geht nicht. Und ginge es nur um die Befragung und Eigenheiten einzelner Individuen, etwa um eine Biographie, benötigen wir die '''Quantitativen Forschungsmethoden''' eigentlich gar nicht.
  
=== Von der Tiefe zur Breite ===
+
==== Von der Tiefe zur Breite ====
  
 
Nehmen wir nun aber an, jemand hätte mit großer Sensiblität und Mühe aus zehn Personen sehr viel zum Vorschein gebracht, an Ängsten, Erwarungshaltungen, biographischen Daten, an Erfahrungen, Einstellungen usw. Nehmen wir an, alle zehn Befragten wären AfrikanerInnen gewesen. Könnten wir ihm/ihr nun die Frage stellen, uns zu sagen, wo AfrikanerInnen Elemente des Lebens anders wahrnehmen, anders reagieren, anders geprägt sind? Er/Sie könnte mit einem rein qualitativen Ansatz darauf keine Antwort geben. Er/Sie könnte nur antworten: "Die meisten der befragten zehn Personen sind wegen der Suche nach Arbeit nach Österreich gekommen. Die Hälfte von ihnen empfindet ein größeres Maß von Einsamkeit etc." Jede Aussage über Tendenzen der größeren Gruppe, zu der die Befragten gehören, wäre vermessen. Wie soll man wissen, ob die zehn Befragten nicht vielleicht die einzigen in der afrikanischen Community sind, die bestimmte Eigenschaften aufweisen, vielleicht auch die einzigen, welche überhaupt bereit sind, mit den weißen ForscherInnen darüber zu sprechen?
 
Nehmen wir nun aber an, jemand hätte mit großer Sensiblität und Mühe aus zehn Personen sehr viel zum Vorschein gebracht, an Ängsten, Erwarungshaltungen, biographischen Daten, an Erfahrungen, Einstellungen usw. Nehmen wir an, alle zehn Befragten wären AfrikanerInnen gewesen. Könnten wir ihm/ihr nun die Frage stellen, uns zu sagen, wo AfrikanerInnen Elemente des Lebens anders wahrnehmen, anders reagieren, anders geprägt sind? Er/Sie könnte mit einem rein qualitativen Ansatz darauf keine Antwort geben. Er/Sie könnte nur antworten: "Die meisten der befragten zehn Personen sind wegen der Suche nach Arbeit nach Österreich gekommen. Die Hälfte von ihnen empfindet ein größeres Maß von Einsamkeit etc." Jede Aussage über Tendenzen der größeren Gruppe, zu der die Befragten gehören, wäre vermessen. Wie soll man wissen, ob die zehn Befragten nicht vielleicht die einzigen in der afrikanischen Community sind, die bestimmte Eigenschaften aufweisen, vielleicht auch die einzigen, welche überhaupt bereit sind, mit den weißen ForscherInnen darüber zu sprechen?
  
=== Qualitative und quantitative Methoden ergänzen und erfordern einander ===
+
==== Qualitative und quantitative Methoden ergänzen und erfordern einander ====
  
An dieser Stelle werden quantitative Forschungsmethoden als '''Ergänzung[3]''' zu den qualitativen unverzichtbar. Beim quantitativen Untersuchungsansatz würde man mit geeigneten Methoden versuchen, die '''Befragten[4]''' bereits so auszuwählen, dass sie in den wesentlichen Bereichen ein realistisches Abbild der hier lebenden afrikanischen Community bilden.
+
An dieser Stelle werden quantitative Forschungsmethoden als '''Ergänzung[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[3]]]''' zu den qualitativen unverzichtbar. Beim quantitativen Untersuchungsansatz würde man mit geeigneten Methoden versuchen, die '''Befragten[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4]]]''' bereits so auszuwählen, dass sie in den wesentlichen Bereichen ein realistisches Abbild der hier lebenden afrikanischen Community bilden.
  
=== Tiefe durch qualitative, Breite durch quantitative Methoden ===
+
==== Tiefe durch qualitative, Breite durch quantitative Methoden ====
  
 
Quantitative Forschungsmethoden folgen oft qualitativen. Qualitative Untersuchungen liefern hochinteressante Informationen über Menschen, die zu einer bestimmten Berufsgruppe, Region oder Kultur gehören. In von Oralliteratur geprägten Regionen werden z.B. viele Bereiche einer häufigeren Neuinterpretation unterliegen, da mit der schriftlichen Fixierung oft auch eine erhöhte Stabilisierung eines Sachverhalts einhergeht. Zu Randbereichen mag es daher eine Fülle von Interpretationen geben. So mag ein Informant Gedanken äußern, welche erstaunliche Ähnlichkeit mit Reinkarnationsphilosophien anderer Weltgegenden aufweisen. Nun wird es - falls es ums Weltbild der betreffenden Kultur geht - wichtig sein, zu klären, ob nur diese Person oder die ganze Gesellschaft an das Phänomen der Reinkarnation glaubt. Nun könnte man mit einer kleinen quantitativen Erhebung, bei der die verschiedenen Gruppen der Gesellschaft befragt werden, schnell herausfinden, ob für diese Vorstellung die Biographie des Individuums (wie z.B. auf Reisen durch Kontakt mit anderen Völkern erworben), die Prägung einer Kaste innerhalb des Volkes oder die Prägung der ganzen Bevölkerung verantwortlich ist. Und dann könnte man eine allgemeinere Aussage über diesen Sachverhalt machen: "In diesem Volk glauben nur die Älteren an die Reinkarnation, die Jüngeren haben vorwiegend das christliche oder islamische Modell übernommen etc.".
 
Quantitative Forschungsmethoden folgen oft qualitativen. Qualitative Untersuchungen liefern hochinteressante Informationen über Menschen, die zu einer bestimmten Berufsgruppe, Region oder Kultur gehören. In von Oralliteratur geprägten Regionen werden z.B. viele Bereiche einer häufigeren Neuinterpretation unterliegen, da mit der schriftlichen Fixierung oft auch eine erhöhte Stabilisierung eines Sachverhalts einhergeht. Zu Randbereichen mag es daher eine Fülle von Interpretationen geben. So mag ein Informant Gedanken äußern, welche erstaunliche Ähnlichkeit mit Reinkarnationsphilosophien anderer Weltgegenden aufweisen. Nun wird es - falls es ums Weltbild der betreffenden Kultur geht - wichtig sein, zu klären, ob nur diese Person oder die ganze Gesellschaft an das Phänomen der Reinkarnation glaubt. Nun könnte man mit einer kleinen quantitativen Erhebung, bei der die verschiedenen Gruppen der Gesellschaft befragt werden, schnell herausfinden, ob für diese Vorstellung die Biographie des Individuums (wie z.B. auf Reisen durch Kontakt mit anderen Völkern erworben), die Prägung einer Kaste innerhalb des Volkes oder die Prägung der ganzen Bevölkerung verantwortlich ist. Und dann könnte man eine allgemeinere Aussage über diesen Sachverhalt machen: "In diesem Volk glauben nur die Älteren an die Reinkarnation, die Jüngeren haben vorwiegend das christliche oder islamische Modell übernommen etc.".
Line 232: Line 255:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-titel.html<br />
+
[[Qualitative_Methoden_der_Kultur-_und_Sozialanthropologie|[1] Siehe die Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br />
[2] &&& http://www.univie.ac.at/ksa/elearning/cp/schreiben/schreiben-2.html<br />
+
[[Grundlagen des wissenschaftlichen Schreibens/Wissenschaftlicher Text|[2] Siehe Kapitel 1.1 der Lernunterlage ''Das Verfassen Wissenschaftlicher Arbeiten'']]<br/>
[3] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-50.html<br />
+
[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[3] Siehe Kapitel 5.1.3 der Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4] Siehe Kapitel 2.1]]<br />
  
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Nächstes Kapitel: 1.2 Formen der Statistik]]'''
 +
----
 +
[[#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|&uarr; Nach oben]]
  
 +
 +
'''[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|Vorheriges Kapitel: 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]'''
 
= 1.2 Formen der Statistik =
 
= 1.2 Formen der Statistik =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Man unterscheidet im wesentlichen zwei verschiedene Formen der Statistik:
 
Man unterscheidet im wesentlichen zwei verschiedene Formen der Statistik:
Line 245: Line 275:
 
* die '''schließende oder analystische Statistik''', die sich im wesentlichen die Frage stellt, inwieweit das Gemessene als Abbild der Realität geeignet ist.
 
* die '''schließende oder analystische Statistik''', die sich im wesentlichen die Frage stellt, inwieweit das Gemessene als Abbild der Realität geeignet ist.
  
=== Vergleich anhand der Einkommenssituation in Bangladesh ===
+
==== Vergleich anhand der Einkommenssituation in Bangladesh ====
 
 
Nehmen wir an, wir untersuchen die Einkommensituation in zwei benachbarten Dörfern in Bangladesh. Wir stellen in den beiden Dörfern ein bestimmtes Durchschnittseinkommen fest und drücken dies in einer Maßzahl aus, z.B. dem '''Median[1]''' oder dem '''Mittelwert[2]'''. Mittels eines '''Balkendiagramms[3]''' zeigen wir auch optisch, dass das Durchschnitseinkommen von Dorf A höher ist als das von Dorf B. Bisher sind wir immer noch im Bereich der '''deskriptiven Statistik''' geblieben.
 
 
 
Wenn wir uns nun allerdings die Frage stellen, ob der von uns festgestellte Einkommensunterschied zwischen den beiden Dörfern zufälliger Natur oder '''hoch signifikant[4]''' ist, dann geraten wir mit den entsprechenden Methoden (z.B. dem '''T-Test (Wikipedia)[5]''') in den Bereich der '''schließenden Statistik'''.
 
  
 +
Nehmen wir an, wir untersuchen die Einkommensituation in zwei benachbarten Dörfern in Bangladesh. Wir stellen in den beiden Dörfern ein bestimmtes Durchschnittseinkommen fest und drücken dies in einer Maßzahl aus, z.B. dem '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''' oder dem '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]'''. Mittels eines '''Balkendiagramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3]]]''' zeigen wir auch optisch, dass das Durchschnitseinkommen von Dorf A höher ist als das von Dorf B. Bisher sind wir immer noch im Bereich der '''deskriptiven Statistik''' geblieben.
  
 +
Wenn wir uns nun allerdings die Frage stellen, ob der von uns festgestellte Einkommensunterschied zwischen den beiden Dörfern zufälliger Natur oder '''hoch signifikant[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4]]]''' ist, dann geraten wir mit den entsprechenden Methoden (z.B. dem '''T-Test (Wikipedia)[http://de.wikipedia.org/wiki/T-Test &#91;5&#93;]''') in den Bereich der '''schließenden Statistik'''.
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
Line 258: Line 286:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3] Siehe Kapitel 3.6.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3] Siehe Kapitel 3.6.1.3]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4] Siehe Kapitel 1.3.2]]<br />
[5] http://de.wikipedia.org/wiki/T-Test<br />
+
[http://de.wikipedia.org/wiki/T-Test &#91;5&#93; http://de.wikipedia.org/wiki/T-Test]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
</div>
  
 
== 1.2.1 Deskriptive Statistik ==
 
== 1.2.1 Deskriptive Statistik ==
Line 278: Line 312:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
[3] Siehe Kapitel 3.4<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3] Siehe Kapitel 3.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|[4] Siehe Kapitel 3.6.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|[4] Siehe Kapitel 3.6.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[5] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[5] Siehe Kapitel 2.1.1]]<br />
Line 286: Line 320:
 
== 1.2.2 Analytische Statistik ==
 
== 1.2.2 Analytische Statistik ==
  
Die '''analytische''' (auch '''schließende''' oder '''deduktive[1]''' genannt) '''Statistik''' beschäftigt sich im Wesentlichen mit der Frage der Zufälligkeit statistisch gemessener Phänomene. So stellt man sich die Frage, inwieweit ein in einer Stichprobe gemessener '''Mittelwert[2]''' vom Mittelwert der '''Grundgesamtheit[3]''' '''abweichen[4]''' könnte; man stellt sich bei verschiedenen '''Stichproben''' die Frage, ob sie angesichts ihrer gemessenen Unterschiede noch zur gleichen '''Grundgesamtheit''' gehören können u.a. Hier wird also versucht, die untersuchte Stichprobe in einem größeren Ganzen einzuordnen, wobei auch der Untersuchung der '''Wahrscheinlichkeit''' von '''Zusammenhängen[5]''' bzw. Differenzen breiter Raum eingeräumt wird.
+
Die '''analytische''' (auch '''schließende''' oder '''deduktive[[Arten_des_Schlussfolgerns#2.2 Deduktives Schlussfolgern|[1]]]''' genannt) '''Statistik''' beschäftigt sich im Wesentlichen mit der Frage der Zufälligkeit statistisch gemessener Phänomene. So stellt man sich die Frage, inwieweit ein in einer Stichprobe gemessener '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2]]]''' vom Mittelwert der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3]]]''' '''abweichen[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|[4]]]''' könnte; man stellt sich bei verschiedenen '''Stichproben''' die Frage, ob sie angesichts ihrer gemessenen Unterschiede noch zur gleichen '''Grundgesamtheit''' gehören können u.a. Hier wird also versucht, die untersuchte Stichprobe in einem größeren Ganzen einzuordnen, wobei auch der Untersuchung der '''Wahrscheinlichkeit''' von '''Zusammenhängen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|[5]]]''' bzw. Differenzen breiter Raum eingeräumt wird.
  
 
==== '''Beispiel 1: Sind Unterschiede (über-)zufällig?''' ====
 
==== '''Beispiel 1: Sind Unterschiede (über-)zufällig?''' ====
  
In einem Ort A findet man bei 50 Befragten ein Durchschnittseinkommen von € 1300 ermittelt, im Ort B bei einer gleich großen '''Stichprobe[6]''' ein Durchschnittseinkommen von € 1765. Mit Methoden der '''analytischen Statistik''' könnten wir herausfinden, ob der Einkommensunterschied zwischen diesen beiden Stichproben die Verallgemeinerung erlaubt, dass die Bevölkerungen der beiden Orte tatsächlich unterschiedlich gut verdienen oder ob der gemessene Unterschied '''rein zufälliger Natur[7]''' sein könnte (weil die Befragten sich trotz aller Sorgfalt bei ihrer Auswahl gerade an diesem Punkt von ihren MitbewohnerInnen unterscheiden).
+
In einem Ort A findet man bei 50 Befragten ein Durchschnittseinkommen von € 1300 ermittelt, im Ort B bei einer gleich großen '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[6]]]''' ein Durchschnittseinkommen von € 1765. Mit Methoden der '''analytischen Statistik''' könnten wir herausfinden, ob der Einkommensunterschied zwischen diesen beiden Stichproben die Verallgemeinerung erlaubt, dass die Bevölkerungen der beiden Orte tatsächlich unterschiedlich gut verdienen oder ob der gemessene Unterschied '''rein zufälliger Natur[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7]]]''' sein könnte (weil die Befragten sich trotz aller Sorgfalt bei ihrer Auswahl gerade an diesem Punkt von ihren MitbewohnerInnen unterscheiden).
  
 
==== '''Beispiel 2: Ist ein gemessenes Ergebnis noch ’normal’?''' ====
 
==== '''Beispiel 2: Ist ein gemessenes Ergebnis noch ’normal’?''' ====
Line 299: Line 333:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-6.html<br />
+
[[Arten_des_Schlussfolgerns#2.2 Deduktives Schlussfolgern|[1] Siehe Kapitel 2.2 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3] Siehe Kapitel 2.1]]<br />
Line 307: Line 341:
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7] Siehe Kapitel 1.3.2]]<br />
  
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|Nächstes Kapitel: 1.3 Wahrscheinlichkeiten, nicht Gewissheit]]'''
 +
----
 +
[[#1.2 Formen der Statistik|&uarr; Nach oben]]
  
 +
 +
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Vorheriges Kapitel: 1.2 Formen der Statistik]]'''
 
= 1.3 Wahrscheinlichkeiten, nicht Gewissheit =
 
= 1.3 Wahrscheinlichkeiten, nicht Gewissheit =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
==== '''(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.''' ====
 
==== '''(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.''' ====
  
In der Statistik beschreiben und analysieren wir meist '''Stichproben[1]''', also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgfältig zusammengesetzte Stichprobe in wesentlichen Parametern von der '''Grundgesamtheit[2]''' unterscheidet, sie also nicht wiederspiegelt.
+
In der Statistik beschreiben und analysieren wir meist '''Stichproben[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''', also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgfältig zusammengesetzte Stichprobe in wesentlichen Parametern von der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' unterscheidet, sie also nicht wiederspiegelt.
  
 
Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpräferenzen befragen, dann kann es sein, dass die Beliebtheit der SPÖ bei ihnen deutlich anders ausfällt als bei der Grundgesamtheit, auch wenn aus der Schichtung der '''Stichprobe''' keinerlei tendenziöse Verteilung der Personen ersichtlich war.
 
Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpräferenzen befragen, dann kann es sein, dass die Beliebtheit der SPÖ bei ihnen deutlich anders ausfällt als bei der Grundgesamtheit, auch wenn aus der Schichtung der '''Stichprobe''' keinerlei tendenziöse Verteilung der Personen ersichtlich war.
Line 323: Line 364:
  
 
Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.
 
Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.
 
  
  
Line 330: Line 370:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
</div>
  
 
== 1.3.1 Schwankungsbreiten und Konfidenzintervalle ==
 
== 1.3.1 Schwankungsbreiten und Konfidenzintervalle ==
Line 337: Line 383:
 
Die '''Schwankungsbreite''' oder das '''Konfidenzintervall''' hängen von folgenden Faktoren ab:<br />
 
Die '''Schwankungsbreite''' oder das '''Konfidenzintervall''' hängen von folgenden Faktoren ab:<br />
 
a. dem gewählten Signifikanzniveau (je signifikanter, dester größer die Schwankungsbreite);<br />
 
a. dem gewählten Signifikanzniveau (je signifikanter, dester größer die Schwankungsbreite);<br />
b. dem größenmäßigen Verhältnis zwischen '''Stichprobe''' und '''Grundpopulation[1]''' (je größer der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
+
b. dem größenmäßigen Verhältnis zwischen '''Stichprobe''' und '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' (je größer der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
c. der Größe der '''Stichprobe[2]''' (je kleiner, desto größer ist die Schwankungsbreite)
+
c. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' (je kleiner, desto größer ist die Schwankungsbreite)
  
 
'''Beispiel zu Punkt b am Wahlabend:'''<br />
 
'''Beispiel zu Punkt b am Wahlabend:'''<br />
 
Während die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgezählten Stimmen die Schwankungsbreite der Stimmen für Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgezählt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).
 
Während die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgezählten Stimmen die Schwankungsbreite der Stimmen für Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgezählt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).
  
Siehe auch '''Konfidenzintervall (Wikipedia)[3]'''.
+
Siehe auch '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93;]'''.
  
  
Line 350: Line 396:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
[3] http://de.wikipedia.org/wiki/Konfidenzintervall<br />
+
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
  
  
Line 367: Line 413:
 
Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer '''Irrtumswahrscheinlichkeit''' von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller Fälle das tatsächliche Endergebnis außerhalb dieses Bereiches liegen wird.
 
Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer '''Irrtumswahrscheinlichkeit''' von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller Fälle das tatsächliche Endergebnis außerhalb dieses Bereiches liegen wird.
  
Siehe auch '''Signifikanz (Wikipedia)[1]'''.
+
Siehe auch '''Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93;]'''.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Statistische_Signifikanz<br />
+
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
 +
 
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#1.3 Wahrscheinlichkeiten, nicht Gewissheit|&uarr; Nach oben]]
  
 +
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 2. Von der Fragestellung zur statistischen Analyse =
 
= 2. Von der Fragestellung zur statistischen Analyse =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
==== '''Wesentliche Elemente bei quantitativen Forschungsansätzen''' ====
 
==== '''Wesentliche Elemente bei quantitativen Forschungsansätzen''' ====
Line 389: Line 442:
 
==== '''Befragung der richtigen Personen mit den richtigen/relevanten Fragen''' ====
 
==== '''Befragung der richtigen Personen mit den richtigen/relevanten Fragen''' ====
  
Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und '''Repräsentativität[1]'''), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe '''Operationalisierung[2]''' und '''Messen[3]''').
+
Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[1]]]'''), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2]]]''' und '''Messen[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3]]]''').
  
 
Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).
 
Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).
Line 400: Line 453:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3] Siehe Kapitel 2.2.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3] Siehe Kapitel 2.2.2]]<br />
  
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|2.3 Gütekriterien quantitativer Untersuchungen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
</div>
  
 +
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Nächstes Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
 +
----
 +
[[#2. Von der Fragestellung zur statistischen Analyse|&uarr; Nach oben]]
 +
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|Vorheriges Kapitel: 2. Von der Fragestellung zur statistischen Analyse]]'''
 
= 2.1 Die Grundpopulation: worüber wir Aussagen machen =
 
= 2.1 Die Grundpopulation: worüber wir Aussagen machen =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Die '''empirische Grundgesamtheit''' ('''Grundpopulation''') ist jene abgegrenzte Menge von Personen (z.B. die Wiener Bevölkerung) oder Objekten (z.B. die Regenfälle in einer tropischen Region, die Autos im 7. Bezirk), über die man Aussagen machen möchte.
 
Die '''empirische Grundgesamtheit''' ('''Grundpopulation''') ist jene abgegrenzte Menge von Personen (z.B. die Wiener Bevölkerung) oder Objekten (z.B. die Regenfälle in einer tropischen Region, die Autos im 7. Bezirk), über die man Aussagen machen möchte.
Line 409: Line 509:
 
==== '''Elemente, Variable und Ausprägungen''' ====
 
==== '''Elemente, Variable und Ausprägungen''' ====
  
Ein Einzelobjekt aus dieser Grundgesamtheit bezeichnet man als '''statistische Einheit''' oder '''Element''' (z.B. Herr Moussa Bamba aus Bamako, der jetzt in Wien lebt). Die Einzelobjekte weisen jeweils '''Merkmale''' auf (auch '''Variablen''' genannt, z.B. Geschlecht, Einkommen, Autofarbe etc.), die uns interessieren und über deren Ausprägung in der Grundgesamtheit wir mehr erfahren möchten (die sogenannte '''Verteilung[1]'''). Die möglichen Werte dieser Merkmale bezeichnet man als '''Merkmalsausprägungen''.''''' So gibt es für das Merkmal Geschlecht die Ausprägungen männlich oder weiblich, für die Variable Körpergröße Zahlen zwischen theoretisch Null und deutlich über zwei Meter.
+
Ein Einzelobjekt aus dieser Grundgesamtheit bezeichnet man als '''statistische Einheit''' oder '''Element''' (z.B. Herr Moussa Bamba aus Bamako, der jetzt in Wien lebt). Die Einzelobjekte weisen jeweils '''Merkmale''' auf (auch '''Variablen''' genannt, z.B. Geschlecht, Einkommen, Autofarbe etc.), die uns interessieren und über deren Ausprägung in der Grundgesamtheit wir mehr erfahren möchten (die sogenannte '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]'''). Die möglichen Werte dieser Merkmale bezeichnet man als '''Merkmalsausprägungen''.''''' So gibt es für das Merkmal Geschlecht die Ausprägungen männlich oder weiblich, für die Variable Körpergröße Zahlen zwischen theoretisch Null und deutlich über zwei Meter.
  
 
==== '''Befragung der gesamten Grundpopulation nur selten möglich''' ====
 
==== '''Befragung der gesamten Grundpopulation nur selten möglich''' ====
Line 417: Line 517:
 
==== '''Öffentliche Quellen für Daten über Grundpopulationen''' ====
 
==== '''Öffentliche Quellen für Daten über Grundpopulationen''' ====
  
Grundinformationen über die Verteilung der '''Grundpopulationen''' kann man u.a. suchen bei '''Statistik Austria[2]''' und anderen Informationsstellen, in einschlägigen Publikationen etc.
+
Grundinformationen über die Verteilung der '''Grundpopulationen''' kann man u.a. suchen bei '''Statistik Austria[http://www.statistik.at/ &#91;2&#93;]''' und anderen Informationsstellen, in einschlägigen Publikationen etc.
  
  
Line 423: Line 523:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
[2] http://www.statistik.at/<br />
+
[http://www.statistik.at/ &#91;2&#93; http://www.statistik.at/]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
</div>
  
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
  
 
== 2.1.1 Die Stichprobe (Sample) ==
 
== 2.1.1 Die Stichprobe (Sample) ==
  
Eine '''Stichprobe''' ist eine Auswahl von Elementen der Grundgesamtheit, anhand derer die '''Grundgesamtheit[1]''' nachgebildet werden soll.
+
Eine '''Stichprobe''' ist eine Auswahl von Elementen der Grundgesamtheit, anhand derer die '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' nachgebildet werden soll.
  
 
==== '''Auswahl fast immer notwendig''' ====
 
==== '''Auswahl fast immer notwendig''' ====
  
Auf Grund der Größe der '''Grundpopulationen''' ist es kaum jemals möglich, alle Mitglieder derselben zu befragen. Daher greift man in der Regel zu '''Stichproben''', also einer Auswahl von Mitgliedern der Grundgesamtheit. Die Mitglieder der Stichproben sollten in der Regel so ausgewählt sein, dass sie ein '''unverzerrtes Abbild''' der '''Grundgesamtheit''' darstellen (siehe '''Repräsentativität[2]''').
+
Auf Grund der Größe der '''Grundpopulationen''' ist es kaum jemals möglich, alle Mitglieder derselben zu befragen. Daher greift man in der Regel zu '''Stichproben''', also einer Auswahl von Mitgliedern der Grundgesamtheit. Die Mitglieder der Stichproben sollten in der Regel so ausgewählt sein, dass sie ein '''unverzerrtes Abbild''' der '''Grundgesamtheit''' darstellen (siehe '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[2]]]''').
  
  
Line 468: Line 594:
 
=== 2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)  ===
 
=== 2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)  ===
  
Unter einer '''geschichteten Stichprobenauswahl''' versteht man ein Auswahlverfahren, bei dem wesentliche '''Verteilungscharakteristiken[1]''' der '''Grundgesamtheit[2]''' nachgebildet werden.
+
Unter einer '''geschichteten Stichprobenauswahl''' versteht man ein Auswahlverfahren, bei dem wesentliche '''Verteilungscharakteristiken[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' nachgebildet werden.
  
 
Einzelne für die Untersuchung als relevant erachtete Merkmale der Zielgruppe werden annähernd im gleichen Verhältnis auf die '''Stichprobe''' übertragen, wie sie in der Grundgesamtheit vorkommen.
 
Einzelne für die Untersuchung als relevant erachtete Merkmale der Zielgruppe werden annähernd im gleichen Verhältnis auf die '''Stichprobe''' übertragen, wie sie in der Grundgesamtheit vorkommen.
Line 501: Line 627:
 
Unter einer '''disproportional geschichteten Stichprobe''' versteht man die bewusste Verzerrung einzelner '''Verteilungsparameter''', um signifikante Aussagen über Randbereiche erhalten zu können. Dabei wird eine Bevölkerungsgruppe '''überproportional''' wiedergegeben, um genügend Interviews für sie zu erhalten.
 
Unter einer '''disproportional geschichteten Stichprobe''' versteht man die bewusste Verzerrung einzelner '''Verteilungsparameter''', um signifikante Aussagen über Randbereiche erhalten zu können. Dabei wird eine Bevölkerungsgruppe '''überproportional''' wiedergegeben, um genügend Interviews für sie zu erhalten.
  
Diese Methode wird v.a. angewandt, um bei beschränkten Stichprobengrößen '''signifikante[1]''' Aussagen über kleinere Bevölkerungsgruppen erhalten zu können, die für die Fragestellung besonders interessant sind.
+
Diese Methode wird v.a. angewandt, um bei beschränkten Stichprobengrößen '''signifikante[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' Aussagen über kleinere Bevölkerungsgruppen erhalten zu können, die für die Fragestellung besonders interessant sind.
  
 
==== '''Beispiel: Umfrage zu Reformen im Bildungsbereich''' ====
 
==== '''Beispiel: Umfrage zu Reformen im Bildungsbereich''' ====
Line 523: Line 649:
 
=== 2.1.3.1.3 Laufende Kontrolle der Schichtung  ===
 
=== 2.1.3.1.3 Laufende Kontrolle der Schichtung  ===
  
=== Während der Befragungsphase laufende Kontrolle der Schichtung erforderlich ===
+
==== Während der Befragungsphase laufende Kontrolle der Schichtung erforderlich ====
  
Bei einem quantitativen Forschungsprojekt führt man laufend Erhebungen, meist mit Fragebögen, durch. Dabei muss man stets einen Überblick über die '''Verteilung[1]''' der bereits Interviewten haben, um Abweichungen von der Verteilung in der '''Grundpopulation[2]''' korrigieren zu können. Wie? Indem man die nächsten Interviewten aus Personengruppen wählt, die bisher '''unterrepräsentiert''' waren, deren bisheriger Anteil in der Stichprobe also deutlich geringer als ihr Anteil in der Grundpopulation ist.
+
Bei einem quantitativen Forschungsprojekt führt man laufend Erhebungen, meist mit Fragebögen, durch. Dabei muss man stets einen Überblick über die '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' der bereits Interviewten haben, um Abweichungen von der Verteilung in der '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' korrigieren zu können. Wie? Indem man die nächsten Interviewten aus Personengruppen wählt, die bisher '''unterrepräsentiert''' waren, deren bisheriger Anteil in der Stichprobe also deutlich geringer als ihr Anteil in der Grundpopulation ist.
  
=== Berechnung ===
+
==== Berechnung ====
  
 
Bei ganz kleinen Umfragen kann man die '''Aufteilungsverhältnisse''' mit einer Matrix kontrollieren, in die man laufend mit ‚Stricherln’ einträgt, wen man interviewt hat. Nehmen wir an, in der Grundpopulation hätten wir eine Verteilung von 55 % Männern und 45 % Frauen bzw. von 25 % AkademikerInnen und 75 % NichtakademikerInnen. Mit den '''Schichtungsfragen''' stellen wir fest, ob die Verteilung der Interviewten mit der der Grundpopulation übereinstimmt. Daher müssen Schichtungsfragen auch fester Bestandteil der Fragebögen sein. Bisher haben wir folgende Interviews geführt:  
 
Bei ganz kleinen Umfragen kann man die '''Aufteilungsverhältnisse''' mit einer Matrix kontrollieren, in die man laufend mit ‚Stricherln’ einträgt, wen man interviewt hat. Nehmen wir an, in der Grundpopulation hätten wir eine Verteilung von 55 % Männern und 45 % Frauen bzw. von 25 % AkademikerInnen und 75 % NichtakademikerInnen. Mit den '''Schichtungsfragen''' stellen wir fest, ob die Verteilung der Interviewten mit der der Grundpopulation übereinstimmt. Daher müssen Schichtungsfragen auch fester Bestandteil der Fragebögen sein. Bisher haben wir folgende Interviews geführt:  
Line 546: Line 672:
 
=== 2.1.3.2 Zufallsstichproben  ===
 
=== 2.1.3.2 Zufallsstichproben  ===
  
Unter '''Zufallsstichproben''' versteht man Auswahlverfahren einer '''Stichprobe''', bei welchen bei einem theoretisch vorliegenden Register aller Elemente der '''Grundgesamtheit[1]''' die Elemente der '''Stichprobe''' zufällig gezogen werden.
+
Unter '''Zufallsstichproben''' versteht man Auswahlverfahren einer '''Stichprobe''', bei welchen bei einem theoretisch vorliegenden Register aller Elemente der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' die Elemente der '''Stichprobe''' zufällig gezogen werden.
  
 
Man vergleiche dies mit einer Lottoziehung. Man hat ein Register von 45 Lotto-Zahlen, welche die gleiche Ziehungwahrscheinlichkeit aufweisen. Aus diesen werden beim Lotto insgesamt sechs Zahlen gezogen.
 
Man vergleiche dies mit einer Lottoziehung. Man hat ein Register von 45 Lotto-Zahlen, welche die gleiche Ziehungwahrscheinlichkeit aufweisen. Aus diesen werden beim Lotto insgesamt sechs Zahlen gezogen.
Line 631: Line 757:
 
== 2.1.4 Repräsentativität ==
 
== 2.1.4 Repräsentativität ==
  
Unter '''Repräsentativität''' versteht man die angestrebte Eigenschaft von statistischen Erhebungen, die Grundgesamtheit in der ausgewählten Stichprobe möglichst unverzerrt nachzubilden. Eine statistische Erhebung ist '''repräsentativ''', wenn sie auf einer '''Zufallsstichprobe''' basiert und Aussagen über die '''Grundgesamtheit[1]''' zulässt.
+
Unter '''Repräsentativität''' versteht man die angestrebte Eigenschaft von statistischen Erhebungen, die Grundgesamtheit in der ausgewählten Stichprobe möglichst unverzerrt nachzubilden. Eine statistische Erhebung ist '''repräsentativ''', wenn sie auf einer '''Zufallsstichprobe''' basiert und Aussagen über die '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' zulässt.
  
 
Damit von der Stichprobe auf die Grundgesamtheit geschlossen werden kann, müssen bei den verschiedenen '''Formen der Ziehungen''' folgende Bedingungen erfüllt sein:
 
Damit von der Stichprobe auf die Grundgesamtheit geschlossen werden kann, müssen bei den verschiedenen '''Formen der Ziehungen''' folgende Bedingungen erfüllt sein:
Line 648: Line 774:
 
== 2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist? ==
 
== 2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist? ==
  
Sollte es unmöglich sein, statistische Daten über die Schichtung der '''Grundpopulation[1]''' zu erhalten, kann man entweder
+
Sollte es unmöglich sein, statistische Daten über die Schichtung der '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' zu erhalten, kann man entweder
  
 
* '''aufgrund vermutlich vergleichbarer Grundpopulationen verallgemeinern.''' Nehmen wir an, wir kennen den Frauenanteil von SudanesInnen in Wien nicht, Die ZuwanderInnen aus verschiedenen anderen vergleichbaren afrikanischen Ländern (islamisch, arabisch - englisch) weisen einen Frauenanteil von etwa 40 % auf, dann könnte man auch bei Sudanesinnen diesen Wert als Arbeitshypothese ansetzen. Man sollte jedoch unbedingt in der Publikation auf dieses Problem und die daraus folgende Annahme einer bestimmten Schichtung hinweisen.
 
* '''aufgrund vermutlich vergleichbarer Grundpopulationen verallgemeinern.''' Nehmen wir an, wir kennen den Frauenanteil von SudanesInnen in Wien nicht, Die ZuwanderInnen aus verschiedenen anderen vergleichbaren afrikanischen Ländern (islamisch, arabisch - englisch) weisen einen Frauenanteil von etwa 40 % auf, dann könnte man auch bei Sudanesinnen diesen Wert als Arbeitshypothese ansetzen. Man sollte jedoch unbedingt in der Publikation auf dieses Problem und die daraus folgende Annahme einer bestimmten Schichtung hinweisen.
Line 659: Line 785:
  
  
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|Nächstes Kapitel: 2.2 Die Operationalisierung]]'''
 +
----
 +
[[#2.1 Die Grundpopulation: worüber wir Aussagen machen|&uarr; Nach oben]]
 +
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Vorheriges Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
 
= 2.2 Die Operationalisierung =
 
= 2.2 Die Operationalisierung =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
Unter '''Operationalisierung''' versteht man die präzise Angabe der Vorgangsweise, mit der ein theoretisches Konstrukt gemessen werden soll (wie z.B. die Akzeptanz von Zuwanderergruppen). Dazu gehört die Auswahl der '''Indikatoren''', die genaue Formulierung der Fragen im '''Fragebogen''', dazu gehören die '''Antwortkategorien''', die Bestimmung der '''Messinstrumente''', die '''Bestimmung der Genauigkeit der Messung''', die '''Anweisungen an die InterviewerInnen''', wie sie die Fragen stellen und welche Zusatzinformationen sie geben dürfen etc. '''Operationalisierung[1]''' versucht also bis ins kleinste Detail sicherzustellen, dass die '''wissenschaftlichen Qualitätserfordernisse[2]''' für vergleichbare Forschungsarbeiten eingehalten werden können und tatsächlich brauchbare Antworten zu den Themen gefunden werden können, die man zu untersuchen vorgibt.
+
Unter '''Operationalisierung''' versteht man die präzise Angabe der Vorgangsweise, mit der ein theoretisches Konstrukt gemessen werden soll (wie z.B. die Akzeptanz von Zuwanderergruppen). Dazu gehört die Auswahl der '''Indikatoren''', die genaue Formulierung der Fragen im '''Fragebogen''', dazu gehören die '''Antwortkategorien''', die Bestimmung der '''Messinstrumente''', die '''Bestimmung der Genauigkeit der Messung''', die '''Anweisungen an die InterviewerInnen''', wie sie die Fragen stellen und welche Zusatzinformationen sie geben dürfen etc. '''Operationalisierung[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.1.1 Operationale Definition: Operationalisierung|[1]]]''' versucht also bis ins kleinste Detail sicherzustellen, dass die '''wissenschaftlichen Qualitätserfordernisse[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2]]]''' für vergleichbare Forschungsarbeiten eingehalten werden können und tatsächlich brauchbare Antworten zu den Themen gefunden werden können, die man zu untersuchen vorgibt.
  
 
==== '''Was man untersucht bzw. ’misst’, muss in seinen Ausprägungen in sinnvolle und voneinander abgrenzbare Untereinheiten unterteilt werden können.''' ====
 
==== '''Was man untersucht bzw. ’misst’, muss in seinen Ausprägungen in sinnvolle und voneinander abgrenzbare Untereinheiten unterteilt werden können.''' ====
Line 670: Line 804:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-43.html<br />
+
[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.1.1 Operationale Definition: Operationalisierung|[1] Siehe Kapitel 2.7.1.1 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2] Siehe Kapitel 2.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2] Siehe Kapitel 2.3]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
</div>
  
 
== 2.2.1 Die Suche nach Indikatoren ==
 
== 2.2.1 Die Suche nach Indikatoren ==
  
Im Forschungsentwurf werden verschiedene '''Hypothesen''' formuliert. Nun benötigt man eine Reihe von '''Indikatoren''', um die '''Hypothesen[1]''' beibehalten bzw. verwerfen zu können.
+
Im Forschungsentwurf werden verschiedene '''Hypothesen''' formuliert. Nun benötigt man eine Reihe von '''Indikatoren''', um die '''Hypothesen[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.4 Hypothesen|[1]]]''' beibehalten bzw. verwerfen zu können.
  
 
In vielen Fällen ist die Suche nach den '''Indikatoren''' einfach. Möchte man z.B. ermitteln, wie warm zur gleichen Jahreszeit verschiedene Orte sind, dann genügt eine Messung mit dem Thermometer. Meist jedoch sind die Forschungsfragen komplexer und nicht mit einer einzigen konkreten Messungsart zu beantworten.
 
In vielen Fällen ist die Suche nach den '''Indikatoren''' einfach. Möchte man z.B. ermitteln, wie warm zur gleichen Jahreszeit verschiedene Orte sind, dann genügt eine Messung mit dem Thermometer. Meist jedoch sind die Forschungsfragen komplexer und nicht mit einer einzigen konkreten Messungsart zu beantworten.
Line 693: Line 838:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-49.html<br />
+
[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.4 Hypothesen|[1] Siehe Kapitel 2.7.4 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
 
  
 
== 2.2.2 Das Messen ==
 
== 2.2.2 Das Messen ==
Line 717: Line 861:
 
==== '''A. Zufällige Messfehler:''' ====
 
==== '''A. Zufällige Messfehler:''' ====
  
Zufällige Messfehler sind von den Messenden nicht zu kontrollieren. Wenn man zum Beispiel eine bestimmte Personengruppe zu einem sensiblen Thema befragen möchte und gerade am Tag vorher ein (den InterviewerInnen unbekanntes) Ereignis eintritt, welches ihre Neigung zu ehrlichen Antworten temporär verändert, während bei Vergleichsgruppen im gleichen Zeitraum nichts Vergleichbares auftritt, können verfälschte Ergebnisse auftreten. Misst man die Regenfälle in der Sahelgegend, kann es sein, dass ein Ort deutlich besser und gleichmäßiger beregnet wird, als die nicht gemessenen Nachbarorte, im nächsten Jahr kann es umgekehrt sein. Es gibt jedoch einen sogenannten '''Zentralen Grenzwertsatz der Statistik (Wikibooks)[1]''', nach welchem zufällige Fehler sich im Laufe der Zeit ausgleichen und einer Normalverteilung zustreben. Man kann daher postulieren, dass die zufälligen Messfehler bei häufigen Messungen zum Ausgleich tendieren.
+
Zufällige Messfehler sind von den Messenden nicht zu kontrollieren. Wenn man zum Beispiel eine bestimmte Personengruppe zu einem sensiblen Thema befragen möchte und gerade am Tag vorher ein (den InterviewerInnen unbekanntes) Ereignis eintritt, welches ihre Neigung zu ehrlichen Antworten temporär verändert, während bei Vergleichsgruppen im gleichen Zeitraum nichts Vergleichbares auftritt, können verfälschte Ergebnisse auftreten. Misst man die Regenfälle in der Sahelgegend, kann es sein, dass ein Ort deutlich besser und gleichmäßiger beregnet wird, als die nicht gemessenen Nachbarorte, im nächsten Jahr kann es umgekehrt sein. Es gibt jedoch einen sogenannten '''Zentralen Grenzwertsatz der Statistik (Wikibooks)[https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz &#91;1&#93;]''', nach welchem zufällige Fehler sich im Laufe der Zeit ausgleichen und einer Normalverteilung zustreben. Man kann daher postulieren, dass die zufälligen Messfehler bei häufigen Messungen zum Ausgleich tendieren.
  
 
==== '''B. Systematische Messfehler:''' ====
 
==== '''B. Systematische Messfehler:''' ====
Line 731: Line 875:
 
Weiterführendes zu Messfehlern:
 
Weiterführendes zu Messfehlern:
  
'''Messfehler (Wikipedia)[2]'''
+
'''Messfehler (Wikipedia)[http://de.wikipedia.org/wiki/Messfehler &#91;2&#93;]'''
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz<br />
+
[https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz &#91;1&#93; https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz]<br />
[2] http://de.wikipedia.org/wiki/Messfehler<br />
+
[http://de.wikipedia.org/wiki/Messfehler &#91;2&#93; http://de.wikipedia.org/wiki/Messfehler]<br />
  
  
Line 748: Line 892:
 
==== '''Statistikprogramme benötigen automatisch interpretierbare Datentypen''' ====
 
==== '''Statistikprogramme benötigen automatisch interpretierbare Datentypen''' ====
  
Statistikprogramme benötigen für Berechnungen bestimmte Datentypen, die in der Regel '''numerisch''' sind. Kein Statistikprogramm kann in den Antwortkategorien ’sehr’, ’eher schon’, ’durchschnittlich’, ’eher weniger’, ’überhaupt nicht’ eine logische Reihe erkennen, dass also diese Bezeichnungen für verschiedene logische Abstufungen stehen, nämlich für eine '''Ordinalskala[1]'''.
+
Statistikprogramme benötigen für Berechnungen bestimmte Datentypen, die in der Regel '''numerisch''' sind. Kein Statistikprogramm kann in den Antwortkategorien ’sehr’, ’eher schon’, ’durchschnittlich’, ’eher weniger’, ’überhaupt nicht’ eine logische Reihe erkennen, dass also diese Bezeichnungen für verschiedene logische Abstufungen stehen, nämlich für eine '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1]]]'''.
  
 
Damit ein Statistikprogramm wie '''SPSS''' die logische Reihenfolge erkennen und danach Analysen über diese bilden kann, müssen die Textwerte in numerische umcodiert werden. Im '''Codeplan''', d.h. der Dokumentation über die ursprünglichen Text- Begriffe und ihrer numerischen Entsprechungen, werden diese Umcodierungen festgehalten. Im obigen Beispiel könnte man ’sehr’ immer durch 1, ’eher schon’ durch 2, ’durchschnittlich’ durch 3, ’eher weniger’ durch 4 und ’überhaupt nicht’ durch 5 ersetzen. Nun ist eine für die Software durchgehende Reihe von 1-5 entstanden, die vom kleinsten zum größten Wert gereiht ist.
 
Damit ein Statistikprogramm wie '''SPSS''' die logische Reihenfolge erkennen und danach Analysen über diese bilden kann, müssen die Textwerte in numerische umcodiert werden. Im '''Codeplan''', d.h. der Dokumentation über die ursprünglichen Text- Begriffe und ihrer numerischen Entsprechungen, werden diese Umcodierungen festgehalten. Im obigen Beispiel könnte man ’sehr’ immer durch 1, ’eher schon’ durch 2, ’durchschnittlich’ durch 3, ’eher weniger’ durch 4 und ’überhaupt nicht’ durch 5 ersetzen. Nun ist eine für die Software durchgehende Reihe von 1-5 entstanden, die vom kleinsten zum größten Wert gereiht ist.
Line 797: Line 941:
 
Falls Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen möchten, können Sie einen Bereich angeben (z.B. ''Bereich'' 20 ''bis'' 29), wenn Sie alle zwischen 20-29jährigen in eine einzige Altersklasse ’zwischen 20 und 30' einbringen möchten). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf ''Hinzufügen.''
 
Falls Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen möchten, können Sie einen Bereich angeben (z.B. ''Bereich'' 20 ''bis'' 29), wenn Sie alle zwischen 20-29jährigen in eine einzige Altersklasse ’zwischen 20 und 30' einbringen möchten). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf ''Hinzufügen.''
  
Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert. Erst jetzt wäre es Ihnen möglich, dass SPSS die Ausbildung nach Jahren und Qualität sinnvoll reihen kann und natürlich auch viele weitere (damit zusammenhängenden) Analysen rechnen kann. So wäre erst jetzt die Berechnung einer '''Korrelation[1]''' zwischen dem Ausbildungsgrad und dem Einkommen möglich.
+
Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert. Erst jetzt wäre es Ihnen möglich, dass SPSS die Ausbildung nach Jahren und Qualität sinnvoll reihen kann und natürlich auch viele weitere (damit zusammenhängenden) Analysen rechnen kann. So wäre erst jetzt die Berechnung einer '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' zwischen dem Ausbildungsgrad und dem Einkommen möglich.
  
  
Line 823: Line 967:
 
[[File:quantitative-33_3.gif|frame|center|Tabelle mit Wertelabels]]
 
[[File:quantitative-33_3.gif|frame|center|Tabelle mit Wertelabels]]
  
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|Nächstes Kapitel: 2.3 Gütekriterien quantitativer Untersuchungen]]'''
 +
----
 +
[[#2.2 Die Operationalisierung|&uarr; Nach oben]]
 +
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|Vorheriges Kapitel: 2.2 Die Operationalisierung]]'''
 
= 2.3 Gütekriterien quantitativer Untersuchungen =
 
= 2.3 Gütekriterien quantitativer Untersuchungen =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
Statistische Untersuchungen müssen wie jede andere Form wissenschaftlicher Betätigung den '''Kernansprüchen[1]''' der '''Reliabilität''', der '''Validität''' und der '''Objektivität''' genügen:
+
Statistische Untersuchungen müssen wie jede andere Form wissenschaftlicher Betätigung den '''Kernansprüchen[[Forschungsablauf/Qualitaet#4.3.1 Quantitative Qualitätskriterien|[1]]]''' der '''Reliabilität''', der '''Validität''' und der '''Objektivität''' genügen:
  
 
==== '''Reliabilität:''' ====
 
==== '''Reliabilität:''' ====
Line 843: Line 995:
 
Objektivität wäre z.B. zweifelhaft, wenn man verunsicherte Männer mit einem persönlich überreichten Fragebogen zu ihrem Sexualleben einmal von ebenfalls verunsicherten Männern und das andere Mal von jungen, attraktiven und selbstbewussten Frauen befragen lassen würde, wobei die Fragen von den InterviewerInnen persönlich gestellt und auch die Antworten von ihnen niedergeschrieben werden. Man würde mit hoher Wahrscheinlichkeit äußerst unterschiedliche Antworten erhalten. Genauso müßte man mit Verfälschungen rechnen, wenn Firmenchefs oder -chefinnen ihre Angestellten zur Zufriedenheit mit ihrer Arbeitssituation befragen.
 
Objektivität wäre z.B. zweifelhaft, wenn man verunsicherte Männer mit einem persönlich überreichten Fragebogen zu ihrem Sexualleben einmal von ebenfalls verunsicherten Männern und das andere Mal von jungen, attraktiven und selbstbewussten Frauen befragen lassen würde, wobei die Fragen von den InterviewerInnen persönlich gestellt und auch die Antworten von ihnen niedergeschrieben werden. Man würde mit hoher Wahrscheinlichkeit äußerst unterschiedliche Antworten erhalten. Genauso müßte man mit Verfälschungen rechnen, wenn Firmenchefs oder -chefinnen ihre Angestellten zur Zufriedenheit mit ihrer Arbeitssituation befragen.
  
'''Gütekriterien und andere Fehlerquellen''' erfordern, dass statistische Untersuchungen stets mit äußerster Sorgfalt durchgeführt werden: von der Erhebung der Daten bis zu deren Analyse, dass also die richtigen Methoden angewandt werden, deren Wahl auf der Eigenart der Daten und ihrer Verteilungen beruht und dass die Interpretation keineswegs über die Aussagekraft der Daten hinausgeht.
+
'''Gütekriterien und andere Fehlerquellen''' erfordern, dass statistische Untersuchungen stets mit äußerster Sorgfalt durchgeführt werden: von der Erhebung der Daten bis zu deren Analyse, dass also die richtigen Methoden angewandt werden, deren Wahl auf der Eigenart der Daten und ihrer Verteilungen beruht und dass die Interpretation keineswegs über die Aussagekraft der Daten hinausgeht.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-76.html<br />
+
[[Forschungsablauf/Qualitaet#4.3.1 Quantitative Qualitätskriterien|[1] Siehe Kapitel 4.3.1 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
  
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|Nächstes Kapitel: 2.4 Fehlerquellen bei statistischer Arbeit]]'''
 +
----
 +
[[#2.3 Gütekriterien quantitativer Untersuchungen|&uarr; Nach oben]]
  
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|Vorheriges Kapitel: 2.3 Gütekriterien quantitativer Untersuchungen]]'''
 
= 2.4 Fehlerquellen bei statistischer Arbeit =
 
= 2.4 Fehlerquellen bei statistischer Arbeit =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
Statistik ist der Versuch, aus einem Ausschnitt der Realität auf die Gesamtheit zu schließen. Dies bedeutet, dass unsere Aussagen über die (gesamte) Realität immer, ohne Ausnahme, mit einem Irrtumsrisiko behaftet sind, da wir nicht über vollständige Daten zur '''Grundgesamtheit[1]''' verfügen. Statistisch sprechen wir dabei von '''Fehlern der ersten und der zweiten Art.'''
+
Statistik ist der Versuch, aus einem Ausschnitt der Realität auf die Gesamtheit zu schließen. Dies bedeutet, dass unsere Aussagen über die (gesamte) Realität immer, ohne Ausnahme, mit einem Irrtumsrisiko behaftet sind, da wir nicht über vollständige Daten zur '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' verfügen. Statistisch sprechen wir dabei von '''Fehlern der ersten und der zweiten Art.'''
  
Während '''Fehler der ersten und der zweiten Art''' zu nicht eliminarbaren Risiken der statistischen Arbeit gehören und auch bei sorgfältiger Herangehensweise nicht ausgeschlossen, sondern nur berücksichtigt werden können (siehe '''Irrtumswahrscheinlichkeit[2]'''), hängen '''individuell bedingte Fehler''' mit Mängeln bei der Datenaufnahme, -übertragung oder Analyse zusammen. Wir könnten diese unter '''fehler-''' ''bzw.'' '''mangelhafte Daten''' zusammenfassen.
+
Während '''Fehler der ersten und der zweiten Art''' zu nicht eliminarbaren Risiken der statistischen Arbeit gehören und auch bei sorgfältiger Herangehensweise nicht ausgeschlossen, sondern nur berücksichtigt werden können (siehe '''Irrtumswahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]'''), hängen '''individuell bedingte Fehler''' mit Mängeln bei der Datenaufnahme, -übertragung oder Analyse zusammen. Wir könnten diese unter '''fehler-''' ''bzw.'' '''mangelhafte Daten''' zusammenfassen.
  
  
Line 863: Line 1,022:
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
</div>
  
 
== 2.4.1 Fehler erster und zweiter Art ==
 
== 2.4.1 Fehler erster und zweiter Art ==
Line 876: Line 1,047:
 
==== '''Annahme oder Verwerfung von Hypothesen ist immer an Wahrscheinlichkeiten gebunden''' ====
 
==== '''Annahme oder Verwerfung von Hypothesen ist immer an Wahrscheinlichkeiten gebunden''' ====
  
Bei statistischen Analysen versuchen wir, Ergebnisse auf hohem '''Signifikanzniveau[1]''' zu erreichen. Wir sprechen davon, dass die gefundene Aussage mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, weniger als 1 %, weniger als 1 ‰ zutrifft. Das bedeutet, dass unser Ergebnis, auf das wir so stolz sind, dennoch in 5 % aller Fälle, in 1 % aller Fälle etc. rein zufällig entstehen kann und, bei einer genügend häufigen Wiederholung, sogar muss.
+
Bei statistischen Analysen versuchen wir, Ergebnisse auf hohem '''Signifikanzniveau[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' zu erreichen. Wir sprechen davon, dass die gefundene Aussage mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, weniger als 1 %, weniger als 1 ‰ zutrifft. Das bedeutet, dass unser Ergebnis, auf das wir so stolz sind, dennoch in 5 % aller Fälle, in 1 % aller Fälle etc. rein zufällig entstehen kann und, bei einer genügend häufigen Wiederholung, sogar muss.
  
 
Andererseits ist genauso denkbar, dass unser Ergebnis rein zufällig nicht den starken Zusammenhang zeigt, der normalerweise erscheint. Wir könnten auch bei großer Sorgfalt bei der Auswahl der Stichprobe überdurchschnittlich häufig auf Personen treffen, welche AfrikanerInnen besonders positiv gegenüber stehen.
 
Andererseits ist genauso denkbar, dass unser Ergebnis rein zufällig nicht den starken Zusammenhang zeigt, der normalerweise erscheint. Wir könnten auch bei großer Sorgfalt bei der Auswahl der Stichprobe überdurchschnittlich häufig auf Personen treffen, welche AfrikanerInnen besonders positiv gegenüber stehen.
Line 906: Line 1,077:
 
Fehler und Mängel können bei einer Reihe von Vorgängen bei statistisch unterstützten Forschungsprojekten erfolgen bzw. auftreten, wie z.B.:
 
Fehler und Mängel können bei einer Reihe von Vorgängen bei statistisch unterstützten Forschungsprojekten erfolgen bzw. auftreten, wie z.B.:
  
A. '''Operationalisierungsfehler:''' bei der '''Operationalisierung[1]''' wurden verzerrende Messmethoden festgelegt;
+
A. '''Operationalisierungsfehler:''' bei der '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|[1]]]''' wurden verzerrende Messmethoden festgelegt;
  
B. '''Codierfehler:''' bei der '''Codierung[2]''' wurden, z.B. bei der Übertragung von Text-Daten in numerische Daten für interne Berechnungen von SPSS, Fehler begangen (z.B. die Vergabe des Zahlenwerts ''4'' in der Notenskala für ’Befriedigend’);
+
B. '''Codierfehler:''' bei der '''Codierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[2]]]''' wurden, z.B. bei der Übertragung von Text-Daten in numerische Daten für interne Berechnungen von SPSS, Fehler begangen (z.B. die Vergabe des Zahlenwerts ''4'' in der Notenskala für ’Befriedigend’);
  
 
C. '''Interviewerfehler:''' bei der Datenaufnahme wurden fehlerhafte Werte eingetragen (z.B. eine Kinderzahl von 71 statt 7);
 
C. '''Interviewerfehler:''' bei der Datenaufnahme wurden fehlerhafte Werte eingetragen (z.B. eine Kinderzahl von 71 statt 7);
Line 918: Line 1,089:
 
F. '''Eingabefehler:''' Datensätze wurden doppelt eingegeben;
 
F. '''Eingabefehler:''' Datensätze wurden doppelt eingegeben;
  
G. '''Analysefehler:''' für die Analyse der Daten wurden die '''falschen Methoden[3]''' verwendet;
+
G. '''Analysefehler:''' für die Analyse der Daten wurden die '''falschen Methoden[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|[3]]]''' verwendet;
  
 
H. '''Interpretationsfehler:''' die Ergebnisse wurden richtig gerechnet, aber falsch interpretiert;
 
H. '''Interpretationsfehler:''' die Ergebnisse wurden richtig gerechnet, aber falsch interpretiert;
  
I. '''Grafiken[4]''' und Tabellen werden falsch oder ungenügend mit Zusatzinformationen versehen, was sowohl zu mangelndem Verständnis wie auch zu Nichtüberprüfbarkeit der Ergebnisse führen kann.
+
I. '''Grafiken[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|[4]]]''' und Tabellen werden falsch oder ungenügend mit Zusatzinformationen versehen, was sowohl zu mangelndem Verständnis wie auch zu Nichtüberprüfbarkeit der Ergebnisse führen kann.
  
  
Line 1,037: Line 1,208:
 
SPSS erlaubt, leere Felder automatisch mit bestimmten Einträgen auszufüllen oder dieselben in keinerlei Berechnungen einfließen zu lassen.
 
SPSS erlaubt, leere Felder automatisch mit bestimmten Einträgen auszufüllen oder dieselben in keinerlei Berechnungen einfließen zu lassen.
  
SPSS unterscheidet zwischen ''Systembedingt fehlenden Werten'' und ''Benutzerdefinierten fehlenden Werten.'' Werden z.B. Variable als numerisch definiert, werden leere Felder automatisch mit einem Komma in der '''Datenmatrix[1]''' markiert (''Systembedingt''). Bei Textfeldern muss ein fehlender Wert spezifisch deklariert werden (''Benutzerdefinierter fehlender Wert):''
+
SPSS unterscheidet zwischen ''Systembedingt fehlenden Werten'' und ''Benutzerdefinierten fehlenden Werten.'' Werden z.B. Variable als numerisch definiert, werden leere Felder automatisch mit einem Komma in der '''Datenmatrix[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1]]]''' markiert (''Systembedingt''). Bei Textfeldern muss ein fehlender Wert spezifisch deklariert werden (''Benutzerdefinierter fehlender Wert):''
  
 
[[File:quantitative-43_1.jpg|frame|center|Definition von fehlenden Werten]]
 
[[File:quantitative-43_1.jpg|frame|center|Definition von fehlenden Werten]]
Line 1,066: Line 1,237:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1] Siehe Kapitel 2.2.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1] Siehe Kapitel 2.2.3]]<br />
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#2.4 Fehlerquellen bei statistischer Arbeit|&uarr; Nach oben]]
 +
 +
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 3. Ausgewählte statistische Grundlagen und Analysemethoden =
 
= 3. Ausgewählte statistische Grundlagen und Analysemethoden =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
In den folgenden Abschnitten werden eine Reihe von Methoden der '''deskriptiven[1]''', teilweise auch der einfachen '''analytischen[2]''' Statistik sowie auch deren Anwendungsvoraussetzungen und Rahmenbedingungen vorgestellt.
+
In den folgenden Abschnitten werden eine Reihe von Methoden der '''deskriptiven[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|[1]]]''', teilweise auch der einfachen '''analytischen[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|[2]]]''' Statistik sowie auch deren Anwendungsvoraussetzungen und Rahmenbedingungen vorgestellt.
  
Wir benötigen ausreichendes Wissen über die Art, '''Skalierung[3]''' und '''Verteilung[4]''' der Daten, um die dafür geeigneten statistischen Beschreibungs- und Analysemethoden wählen zu können. Dementsprechend wird dieses notwendige Hintergrundwissen intensiver diskutiert. Danach werden '''grundlegende deskriptive und analytische statistische Methoden''' dargestellt, wobei der Schwerpunkt auf ersteren liegt. Abschließend wird auf die grafische Darbietung der Ergebnisse in Form von '''Diagrammen''' eingegangen.
+
Wir benötigen ausreichendes Wissen über die Art, '''Skalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[3]]]''' und '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4]]]''' der Daten, um die dafür geeigneten statistischen Beschreibungs- und Analysemethoden wählen zu können. Dementsprechend wird dieses notwendige Hintergrundwissen intensiver diskutiert. Danach werden '''grundlegende deskriptive und analytische statistische Methoden''' dargestellt, wobei der Schwerpunkt auf ersteren liegt. Abschließend wird auf die grafische Darbietung der Ergebnisse in Form von '''Diagrammen''' eingegangen.
  
  
Line 1,080: Line 1,258:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4] Siehe Kapitel 3.1.3]]<br />
  
 +
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
</div>
 +
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|Nächstes Kapitel: 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]'''
 +
----
 +
[[#3. Ausgewählte statistische Grundlagen und Analysemethoden|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|Vorheriges Kapitel: 3. Ausgewählte statistische Grundlagen und Analysemethoden]]'''
 
= 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden =
 
= 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
==== '''Analysemethoden''' sind '''abhängig von Datenart, -ausprägung, -anzahl und -verteilung:''' ====
 
==== '''Analysemethoden''' sind '''abhängig von Datenart, -ausprägung, -anzahl und -verteilung:''' ====
Line 1,086: Line 1,365:
 
Die Statistik bietet eine Vielzahl von Verfahren, mit deren Hilfe man Aufschlüsse über Sachverhalte gewinnen kann. Die meisten Verfahren können jedoch nur verwendet werden, wenn bestimmte Bedingungen erfüllt sind. Die Auswahl der möglichen Verfahren hängt besonders ab von
 
Die Statistik bietet eine Vielzahl von Verfahren, mit deren Hilfe man Aufschlüsse über Sachverhalte gewinnen kann. Die meisten Verfahren können jedoch nur verwendet werden, wenn bestimmte Bedingungen erfüllt sind. Die Auswahl der möglichen Verfahren hängt besonders ab von
  
* der Art der Daten und den damit zusammenhängenden '''Skalenniveaus[1]'''
+
* der Art der Daten und den damit zusammenhängenden '''Skalenniveaus[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]'''
* der '''Verteilung[2]''' '''der Ausprägungen''' einer Variable
+
* der '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' '''der Ausprägungen''' einer Variable
* der '''Größe''' der '''Stichprobe[3]'''
+
* der '''Größe''' der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3]]]'''
 
* dem (Nicht-)Auftreten von sogenannten ’'''Ausreißern'''’ oder '''Extremdaten'''
 
* dem (Nicht-)Auftreten von sogenannten ’'''Ausreißern'''’ oder '''Extremdaten'''
  
Line 1,095: Line 1,374:
 
==== '''Körpergrößen und Lieblingsobst''' ====
 
==== '''Körpergrößen und Lieblingsobst''' ====
  
Wenn wir in einer Schulklasse die durchschnittliche Körpergröße der SchülerInnen ermitteln wollen, wäre das '''arithmetische Mittel[4]''' eine durchaus vernünftige Kennzahl. Wir zählen dazu alle Körpergrößen zusammen und dividieren die Summe durch die Anzahl der KlassenschülerInnen. Wenn wir hingegen ermitteln möchten, was diese Schulklasse als Lieblingsobst bevorzugt, wäre das '''arithmetische Mittel''' Schwachsinn. Wir kämen dann zu wenig sinnvollen Aussagen, dass die Klasse 0,17 Äpfel, 0,12 Orangen, 0,11 Bananen etc. als Lieblingsobst aufweist.
+
Wenn wir in einer Schulklasse die durchschnittliche Körpergröße der SchülerInnen ermitteln wollen, wäre das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4]]]''' eine durchaus vernünftige Kennzahl. Wir zählen dazu alle Körpergrößen zusammen und dividieren die Summe durch die Anzahl der KlassenschülerInnen. Wenn wir hingegen ermitteln möchten, was diese Schulklasse als Lieblingsobst bevorzugt, wäre das '''arithmetische Mittel''' Schwachsinn. Wir kämen dann zu wenig sinnvollen Aussagen, dass die Klasse 0,17 Äpfel, 0,12 Orangen, 0,11 Bananen etc. als Lieblingsobst aufweist.
  
Dass im ersten Fall das '''arithmetische Mittel''' verwendet werden konnte, im zweiten Falle jedoch nicht, hängt mit den unterschiedlichen Skalenniveaus zusammen. So gehört die Körpergröße zur '''Proportionalskala[5]''', während das Lieblingsobst in eine '''Nominalskala[6]''' eingeordnet wird.
+
Dass im ersten Fall das '''arithmetische Mittel''' verwendet werden konnte, im zweiten Falle jedoch nicht, hängt mit den unterschiedlichen Skalenniveaus zusammen. So gehört die Körpergröße zur '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[5]]]''', während das Lieblingsobst in eine '''Nominalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6]]]''' eingeordnet wird.
  
  
Line 1,109: Line 1,388:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6] Siehe Kapitel 3.1.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6] Siehe Kapitel 3.1.2.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
</div>
  
 
== 3.1.1 Arten von Messwerten (Daten) ==
 
== 3.1.1 Arten von Messwerten (Daten) ==
Line 1,228: Line 1,528:
 
[[File:quantitative-55_1.jpg|frame|center|Unterschiedliche Skalierungsformen, mögliche Aussagen und Analysemethoden mit Beispielen]]
 
[[File:quantitative-55_1.jpg|frame|center|Unterschiedliche Skalierungsformen, mögliche Aussagen und Analysemethoden mit Beispielen]]
  
'''Metrische Merkmale[1]''' finden sich bei '''Intervall'''- und '''Proportionalskalierung''', '''nichtmetrische''' bei '''Nominal- und Ordinalskalierung'''.
+
'''Metrische Merkmale[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1]]]''' finden sich bei '''Intervall'''- und '''Proportionalskalierung''', '''nichtmetrische''' bei '''Nominal- und Ordinalskalierung'''.
  
  
Line 1,241: Line 1,541:
 
'''Monovariable Verteilungen''' zeigen die '''Verteilung''' einer einzigen Variable, bei '''bivariablen Verteilungen''' werden die Häufigkeiten der einander entsprechenden Ausprägungen zweier Variablen aufgezählt, also z.B. 16 Personen sind sowohl weiblich wie auch Raucherinnen, 13 Personen männnlich und Nichtraucher.
 
'''Monovariable Verteilungen''' zeigen die '''Verteilung''' einer einzigen Variable, bei '''bivariablen Verteilungen''' werden die Häufigkeiten der einander entsprechenden Ausprägungen zweier Variablen aufgezählt, also z.B. 16 Personen sind sowohl weiblich wie auch Raucherinnen, 13 Personen männnlich und Nichtraucher.
  
Verteilungen können sowohl '''tabellarisch''' wie auch grafisch in Form von '''Diagrammen[1]''' dargestellt werden.
+
Verteilungen können sowohl '''tabellarisch''' wie auch grafisch in Form von '''Diagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1]]]''' dargestellt werden.
  
 
Zur tabellarischen Darstellung gelangt man, indem man die Werte (nach Möglichkeit sinnvoll) reiht und daneben die jeweilige Häufigkeit der Werte einträgt.
 
Zur tabellarischen Darstellung gelangt man, indem man die Werte (nach Möglichkeit sinnvoll) reiht und daneben die jeweilige Häufigkeit der Werte einträgt.
Line 1,247: Line 1,547:
 
[[File:quantitative-56_1.jpg|frame|center|Darstellung von Verteilungen]]
 
[[File:quantitative-56_1.jpg|frame|center|Darstellung von Verteilungen]]
  
Zur grafischen Form gelangt man, wenn man in einem '''Diagramm''' auf der x- Achse die Ausprägung von Werten einträgt (z.B. die Körpergröße einer Person x) und auf der y- Achse deren Häufigkeit (= Zahl der Personen, welche genau diese Körpergröße aufweisen), dann können wir die Schnittpunkte mit Linien verbinden, wodurch sich eine Verteilungskurve ergibt. Die Standard- Darstellungsform dafür ist das '''Streudiagramm[2]'''.
+
Zur grafischen Form gelangt man, wenn man in einem '''Diagramm''' auf der x- Achse die Ausprägung von Werten einträgt (z.B. die Körpergröße einer Person x) und auf der y- Achse deren Häufigkeit (= Zahl der Personen, welche genau diese Körpergröße aufweisen), dann können wir die Schnittpunkte mit Linien verbinden, wodurch sich eine Verteilungskurve ergibt. Die Standard- Darstellungsform dafür ist das '''Streudiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[2]]]'''.
  
 
Verschiedene Verfahren erforden eine vorliegende Normalverteilung, die mit verschiedenen Prozeduren abschätzbar ist.
 
Verschiedene Verfahren erforden eine vorliegende Normalverteilung, die mit verschiedenen Prozeduren abschätzbar ist.
Line 1,264: Line 1,564:
 
Von einer Normalverteilung sprechen wir, wenn
 
Von einer Normalverteilung sprechen wir, wenn
  
* die größte Häufigkeit in der Nähe des '''arithmetischen Mittel[1]''' auftritt und somit das arithmetische Mittel annähernd mit dem '''Median[2]''' und mit dem '''Modalwert[3]''' zusammenfällt;
+
* die größte Häufigkeit in der Nähe des '''arithmetischen Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' auftritt und somit das arithmetische Mittel annähernd mit dem '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2]]]''' und mit dem '''Modalwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3]]]''' zusammenfällt;
* die '''Häufigkeiten[4]''' der Werte umso mehr abnehmen, je weiter sie sich vom Mittelwert entfernen;
+
* die '''Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4]]]''' der Werte umso mehr abnehmen, je weiter sie sich vom Mittelwert entfernen;
 
* wenn sowohl links wie rechts des Mittelwerts eine '''prinzipielle Symmetrie''' vorliegt;
 
* wenn sowohl links wie rechts des Mittelwerts eine '''prinzipielle Symmetrie''' vorliegt;
 
* wenn die '''Verteilungskurve glockenförmig''' ist.
 
* wenn die '''Verteilungskurve glockenförmig''' ist.
Line 1,283: Line 1,583:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2] Siehe Kapitel 3.3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2] Siehe Kapitel 3.3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3] Siehe Kapitel 3.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3] Siehe Kapitel 3.3.1]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 1,294: Line 1,594:
 
Oft sind die Verteilungen '''schief''', man unterscheidet dann zwischen '''linksschiefen''' oder '''rechtsschiefen Verteilungen.'''
 
Oft sind die Verteilungen '''schief''', man unterscheidet dann zwischen '''linksschiefen''' oder '''rechtsschiefen Verteilungen.'''
  
Bei der '''linksschiefen''' Verteilung ('''negative skew''') liegt der höchste Punkt der Verteilung rechts (d.h. hier befindet sich der Großteil der Einträge), während nach links ein langgezogener Abfall eintritt (d.h. es treten dort selten verwendete Extremwerte auf). In '''linksschiefen''' Verteilungen ist der '''Median[1]''' größer als das '''arithmetische Mittel[2]'''.
+
Bei der '''linksschiefen''' Verteilung ('''negative skew''') liegt der höchste Punkt der Verteilung rechts (d.h. hier befindet sich der Großteil der Einträge), während nach links ein langgezogener Abfall eintritt (d.h. es treten dort selten verwendete Extremwerte auf). In '''linksschiefen''' Verteilungen ist der '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''' größer als das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]'''.
  
 
[[File:quantitative-58_1.jpg|frame|center|Grafische Darstellung einer linkschiefen Verteilung]]
 
[[File:quantitative-58_1.jpg|frame|center|Grafische Darstellung einer linkschiefen Verteilung]]
Line 1,310: Line 1,610:
 
[[File:quantitative-58_4.jpg|frame|center|Rechteckige Verteilung]]
 
[[File:quantitative-58_4.jpg|frame|center|Rechteckige Verteilung]]
  
Diese Verteilung ist rechteckig. Sie könnte bei einer kleinen '''Stichprobe[3]''' auftreten, wenn fast alle Werte die gleiche '''Häufigkeit[4]''' aufweisen.
+
Diese Verteilung ist rechteckig. Sie könnte bei einer kleinen '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3]]]''' auftreten, wenn fast alle Werte die gleiche '''Häufigkeit[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4]]]''' aufweisen.
  
 
[[File:quantitative-58_5.jpg|frame|center|U-förmige, bimodale Verteilung]]
 
[[File:quantitative-58_5.jpg|frame|center|U-förmige, bimodale Verteilung]]
Line 1,324: Line 1,624:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3] Siehe Kapitel 2.1.1]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 1,331: Line 1,631:
 
=== 3.1.3.3 Test auf Normalverteilung  ===
 
=== 3.1.3.3 Test auf Normalverteilung  ===
  
Verschiedene Verfahren sind nur sinnvoll anwendbar, falls annähernd eine '''Normalverteilung''' der Daten vorliegt. Dazu gehört z.B. die '''Maßkorrelation[1]''', aber auch das '''arithmetische Mittel[2]''' ist nur wenig aussagekräftig, wenn die '''Verteilung[3]''' der Daten durch '''Ausreißer''' und '''extreme Schiefe''' geprägt sind.
+
Verschiedene Verfahren sind nur sinnvoll anwendbar, falls annähernd eine '''Normalverteilung''' der Daten vorliegt. Dazu gehört z.B. die '''Maßkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1]]]''', aber auch das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' ist nur wenig aussagekräftig, wenn die '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3]]]''' der Daten durch '''Ausreißer''' und '''extreme Schiefe''' geprägt sind.
  
 
Für den Nachweis einer '''Normalverteilung''' kann auf drei wesentliche Methoden zurückgegriffen werden:
 
Für den Nachweis einer '''Normalverteilung''' kann auf drei wesentliche Methoden zurückgegriffen werden:
  
* '''optisch''': Für die optische Abschätzung der '''Normalverteilung''' kann auf die grafische Wiedergabe (siehe oben, mit Statistik- Programmen z.B. mit der grafischen Darstellung des '''Histogramms[4]''') zurückgegriffen werden
+
* '''optisch''': Für die optische Abschätzung der '''Normalverteilung''' kann auf die grafische Wiedergabe (siehe oben, mit Statistik- Programmen z.B. mit der grafischen Darstellung des '''Histogramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4]]]''') zurückgegriffen werden
 
* '''statistisch-mathematisch''' auf den '''Kolmogorov-Smirnov-Test''' (falls die Werte nicht in Klassen eingeteilt sind, besonders auch bei kleinen Stichproben)
 
* '''statistisch-mathematisch''' auf den '''Kolmogorov-Smirnov-Test''' (falls die Werte nicht in Klassen eingeteilt sind, besonders auch bei kleinen Stichproben)
* oder auf den '''Chi-Quadrat-Test (Wikipedia)[5]''' (bei in Klassen eingeteilten Daten)
+
* oder auf den '''Chi-Quadrat-Test (Wikipedia)[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;5&#93;]''' (bei in Klassen eingeteilten Daten)
  
=== '''Erkennung mit SPSS''' ===
+
==== '''Erkennung mit SPSS''' ====
  
 
Diese verschiedenen und als eigene Unterpunkte angeführten Untersuchungen können unter '''SPSS''' auch gleichzeitig getätigt werden. Klicken Sie dazu auf ANALYSIEREN -> DESKRIPTIVE STATISTIKEN -> EXPLORATIVE DATENANALYSE. Wählen Sie dort unter ’Anzeige’ die Alternative ’Beide’ und unter ’Diagramm’ die Alternative ’Normalverteilungsdiagramm mit Tests’. Dann wird in der Bildschirmausgabe der Resultate ein eigener Punkt aufgeführt: ’Tests auf Normalverteilung’, von denen uns besonders der erste der beiden Tests interessiert '''’Kolmogorov-Smirnov’''' (eigentlich eine verschärfte Variante dieses Tests). Liegt der Wert, welcher unter ’Signifikanz steht’, unter 0,05, so ist mit 95 % Sicherheit eine Normalverteilung zu verwerfen, liegt er unter 0,01, sogar mit 99 % Sicherheit.
 
Diese verschiedenen und als eigene Unterpunkte angeführten Untersuchungen können unter '''SPSS''' auch gleichzeitig getätigt werden. Klicken Sie dazu auf ANALYSIEREN -> DESKRIPTIVE STATISTIKEN -> EXPLORATIVE DATENANALYSE. Wählen Sie dort unter ’Anzeige’ die Alternative ’Beide’ und unter ’Diagramm’ die Alternative ’Normalverteilungsdiagramm mit Tests’. Dann wird in der Bildschirmausgabe der Resultate ein eigener Punkt aufgeführt: ’Tests auf Normalverteilung’, von denen uns besonders der erste der beiden Tests interessiert '''’Kolmogorov-Smirnov’''' (eigentlich eine verschärfte Variante dieses Tests). Liegt der Wert, welcher unter ’Signifikanz steht’, unter 0,05, so ist mit 95 % Sicherheit eine Normalverteilung zu verwerfen, liegt er unter 0,01, sogar mit 99 % Sicherheit.
Line 1,350: Line 1,650:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4] Siehe Kapitel 3.6.1.5]]<br />
[5] http://de.wikipedia.org/wiki/Chi-Quadrat-Test<br />
+
[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;5&#93; http://de.wikipedia.org/wiki/Chi-Quadrat-Test]<br />
  
  
Line 1,357: Line 1,657:
 
=== 3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm  ===
 
=== 3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm  ===
  
Das '''Histogramm[1]''' liefert uns einen ersten und recht brauchbaren Eindruck, ob die von uns analysierten Daten weitgehend normalverteilt sind. Mit SPSS ist die Herstellung eines derartigen Diagramms ein Kinderspiel:
+
Das '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''' liefert uns einen ersten und recht brauchbaren Eindruck, ob die von uns analysierten Daten weitgehend normalverteilt sind. Mit SPSS ist die Herstellung eines derartigen Diagramms ein Kinderspiel:
  
 
A. Klicken Sie in der Menüleiste auf GRAFIKEN
 
A. Klicken Sie in der Menüleiste auf GRAFIKEN
Line 1,373: Line 1,673:
 
[[File:quantitative-60_1.jpg|frame|center|Optischer Nachweis einer Normalverteilung mittels Histogramm]]
 
[[File:quantitative-60_1.jpg|frame|center|Optischer Nachweis einer Normalverteilung mittels Histogramm]]
  
Hier ist z.B. eine stärkere Abweichung von der '''Normalverteilung''' gegeben. Man beachte den großen Zwischenraum zwischen der Normalverteilungskurve und den tatsächlichen Werten bei einem Kalorien-Input von etwa 3000. Dennoch wäre auf dem 5-%-Signifikanz-Niveau die Annahme einer Normalverteilung mit dem '''Kolmogorov-Smirnov-Test[2]''' noch nicht widerlegt (wohl aber auf dem 10-%-Niveau).
+
Hier ist z.B. eine stärkere Abweichung von der '''Normalverteilung''' gegeben. Man beachte den großen Zwischenraum zwischen der Normalverteilungskurve und den tatsächlichen Werten bei einem Kalorien-Input von etwa 3000. Dennoch wäre auf dem 5-%-Signifikanz-Niveau die Annahme einer Normalverteilung mit dem '''Kolmogorov-Smirnov-Test[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2]]]''' noch nicht widerlegt (wohl aber auf dem 10-%-Niveau).
  
 
Das folgende Diagramm zeigt eine noch deutlich stärkere Abweichung von der '''Normalverteilung''':
 
Das folgende Diagramm zeigt eine noch deutlich stärkere Abweichung von der '''Normalverteilung''':
Line 1,391: Line 1,691:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 1,400: Line 1,700:
 
Der Kolmogorov-Smirnov-Test kann auch bei kleineren Stichproben eingesetzt werden, um zu überprüfen, ob eine gegebene Verteilung mit hoher Wahrscheinlichkeit von der Normalverteilung abweicht.
 
Der Kolmogorov-Smirnov-Test kann auch bei kleineren Stichproben eingesetzt werden, um zu überprüfen, ob eine gegebene Verteilung mit hoher Wahrscheinlichkeit von der Normalverteilung abweicht.
  
Die Berechnung basiert auf dem Vergleich mit einer hypothetischen Normalverteilungskurve (Bild von Internet-Enzyklopädie Wikipedia: '''http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test[1]'''):
+
Die Berechnung basiert auf dem Vergleich mit einer hypothetischen Normalverteilungskurve (Bild von Internet-Enzyklopädie Wikipedia: '''http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test[http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test &#91;1&#93;]'''):
  
 
[[File:quantitative-61_1.jpg|frame|center|Kolmogorov-Smirnov-Test - Vergleich einer vorliegenden Verteilung mit einer hypothetischen Normalverteilungskurve. Quelle: Wikipedia - http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test.]]
 
[[File:quantitative-61_1.jpg|frame|center|Kolmogorov-Smirnov-Test - Vergleich einer vorliegenden Verteilung mit einer hypothetischen Normalverteilungskurve. Quelle: Wikipedia - http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test.]]
Line 1,411: Line 1,711:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test<br />
+
[http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test &#91;1&#93; http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test]<br />
  
  
Line 1,440: Line 1,740:
 
Wir suchen nun den Wert für N = 8 und sehen dort die Zahl ''0,454''. Falls die ''Extremste Differenz'' in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine '''Normalverteilung''' vor. In unserem Fall haben wir jedoch eine ''Extremste Differenz'' von nur ''0,32''. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer '''Standardverteilung''' nicht verworfen werden muss. Ein wirklicher Beweis für eine Standard- Verteilung liegt allerdings dadurch nicht vor.
 
Wir suchen nun den Wert für N = 8 und sehen dort die Zahl ''0,454''. Falls die ''Extremste Differenz'' in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine '''Normalverteilung''' vor. In unserem Fall haben wir jedoch eine ''Extremste Differenz'' von nur ''0,32''. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer '''Standardverteilung''' nicht verworfen werden muss. Ein wirklicher Beweis für eine Standard- Verteilung liegt allerdings dadurch nicht vor.
  
Auch unser Wert für die ''Asymptotische Signifikanz'' ist weit größer als der Grenzwert 0,05. Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % '''Signifikanzniveau[1]'''). Da unser Wert jedoch deutlich darüber liegt, kann die Arbeitshypothese einer Normalverteilung auf diesem '''Signifikanzniveau''' nicht verworfen werden.
+
Auch unser Wert für die ''Asymptotische Signifikanz'' ist weit größer als der Grenzwert 0,05. Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % '''Signifikanzniveau[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]'''). Da unser Wert jedoch deutlich darüber liegt, kann die Arbeitshypothese einer Normalverteilung auf diesem '''Signifikanzniveau''' nicht verworfen werden.
  
'''Achtung:''' Der '''Kolmogorov-Smirnov-Test''' benötigt, v.a. bei kleinen '''Stichproben''', extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. Daher ist eine Nichtverwerfung der Annahme einer Normalverteilung durch diese Berechnungsform noch kein Beweis für das Vorliegen einer Normalverteilung. Sollte sich im '''Histogramm[2]''' eine extreme Abweichung von der fakultativ gezogenen Normalverteilungskurve zeigen, dann sollte man, auch wenn der Kolmogorov-Smirnov-Test diese nicht verwirft, dennoch eher zu nicht parametrischen Tests greifen (wie z.B. dem '''T-Test''' etc.)
+
'''Achtung:''' Der '''Kolmogorov-Smirnov-Test''' benötigt, v.a. bei kleinen '''Stichproben''', extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. Daher ist eine Nichtverwerfung der Annahme einer Normalverteilung durch diese Berechnungsform noch kein Beweis für das Vorliegen einer Normalverteilung. Sollte sich im '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2]]]''' eine extreme Abweichung von der fakultativ gezogenen Normalverteilungskurve zeigen, dann sollte man, auch wenn der Kolmogorov-Smirnov-Test diese nicht verwirft, dennoch eher zu nicht parametrischen Tests greifen (wie z.B. dem '''T-Test''' etc.)
  
Hier ein Link zu weiterführenden Tabellen, in welchen noch weitere Irrtumswahrscheinlichkeiten für die Berechnung der Abweichung von einer Standardverteilung herangezogen werden: '''https://www.erieri.com/dlc[3]'''
+
Hier ein Link zu weiterführenden Tabellen, in welchen noch weitere Irrtumswahrscheinlichkeiten für die Berechnung der Abweichung von einer Standardverteilung herangezogen werden: '''https://www.erieri.com/dlc[https://www.erieri.com/dlc/onlinetextbook/table7 &#91;3&#93;]'''
  
  
Line 1,451: Line 1,751:
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2] Siehe Kapitel 3.6.1.5]]<br />
[3] https://www.erieri.com/dlc/onlinetextbook/table7<br />
+
[https://www.erieri.com/dlc/onlinetextbook/table7 &#91;3&#93; https://www.erieri.com/dlc/onlinetextbook/table7]<br />
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|Nächstes Kapitel: 3.2 Die Ermittlung von Häufigkeiten]]'''
 +
----
 +
[[#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|Vorheriges Kapitel: 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]'''
 
= 3.2 Die Ermittlung von Häufigkeiten =
 
= 3.2 Die Ermittlung von Häufigkeiten =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Bei der '''Ermittlung von Häufigkeiten''' stellen wir fest, '''wie oft die verschiedenen Messwerte auftreten'''.
 
Bei der '''Ermittlung von Häufigkeiten''' stellen wir fest, '''wie oft die verschiedenen Messwerte auftreten'''.
  
Die Ermittlung von '''Häufigkeiten''' ist das einfachste statistische Verfahren und kann für jede Art von '''Skala[1]''' angewandt werden. Die Häufigkeiten der Messwerte geben uns Hinweise auf ihre '''Verteilung[2]''' d.h. wie oft die einzelnen Ausprägungen vorkamen. Die Kenntnis dieser Verteilung gibt uns somit Auskunft darüber, was in einer untersuchten Stichprobe der Normalfall, und was die Ausnahme ist.
+
Die Ermittlung von '''Häufigkeiten''' ist das einfachste statistische Verfahren und kann für jede Art von '''Skala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' angewandt werden. Die Häufigkeiten der Messwerte geben uns Hinweise auf ihre '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' d.h. wie oft die einzelnen Ausprägungen vorkamen. Die Kenntnis dieser Verteilung gibt uns somit Auskunft darüber, was in einer untersuchten Stichprobe der Normalfall, und was die Ausnahme ist.
  
 
Dabei wird das Auftreten von Werten gezählt. Prinzipiell unterscheiden wir zwischen
 
Dabei wird das Auftreten von Werten gezählt. Prinzipiell unterscheiden wir zwischen
Line 1,465: Line 1,773:
 
* '''Bi- bzw. multivariablen Verteilungen:''' Es wird gezählt, wie häufig Kombinationen von zwei oder mehr Variablen auftreten (z.B. Schulnoten und soziale Schicht; 17 SchülerInnen gehörten zur Oberschicht und hatten eine 1, 22 SchülerInnen zur Oberschicht und hatten eine 2 etc.). Mit '''Bi- oder multivariablen Verteilungen''' möchte man Zusammenhänge zwischen zwei Variablen feststellen.
 
* '''Bi- bzw. multivariablen Verteilungen:''' Es wird gezählt, wie häufig Kombinationen von zwei oder mehr Variablen auftreten (z.B. Schulnoten und soziale Schicht; 17 SchülerInnen gehörten zur Oberschicht und hatten eine 1, 22 SchülerInnen zur Oberschicht und hatten eine 2 etc.). Mit '''Bi- oder multivariablen Verteilungen''' möchte man Zusammenhänge zwischen zwei Variablen feststellen.
  
Die tabellarische Darstellung der Häufigkeiten in bi- bzw. multivariablen Verteilungen wird auch als '''Kreuztabelle[3]''' oder '''Kontingenztafel''' bezeichnet.
+
Die tabellarische Darstellung der Häufigkeiten in bi- bzw. multivariablen Verteilungen wird auch als '''Kreuztabelle[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3]]]''' oder '''Kontingenztafel''' bezeichnet.
  
 
Nach der Systematik der Darstellung unterscheidet man zwischen der '''Urliste''', der '''primären Tafel''' bzw. der '''Häufigkeitstabelle.'''
 
Nach der Systematik der Darstellung unterscheidet man zwischen der '''Urliste''', der '''primären Tafel''' bzw. der '''Häufigkeitstabelle.'''
Line 1,476: Line 1,784:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3] Siehe Kapitel 3.5.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3] Siehe Kapitel 3.5.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
</div>
  
 
== 3.2.1 Liste und Tafeln ==
 
== 3.2.1 Liste und Tafeln ==
Line 1,504: Line 1,823:
 
==== '''Akkumulierte Häufigkeit''' ====
 
==== '''Akkumulierte Häufigkeit''' ====
  
Wenn keine '''Nominalskalierung[1]''' vorliegt, ist auch die Darstellung der '''akkumulierten Häufigkeit''' sinnvoll. Sie gibt Auskunft über die '''Häufigkeit''' aller Messwerte, die bis zu einem bestimmten Niveau auftreten.
+
Wenn keine '''Nominalskalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1]]]''' vorliegt, ist auch die Darstellung der '''akkumulierten Häufigkeit''' sinnvoll. Sie gibt Auskunft über die '''Häufigkeit''' aller Messwerte, die bis zu einem bestimmten Niveau auftreten.
  
 
Man errechnet sie folgendermaßen: Man zählt alle relativen Häufigkeiten zusammen, die einschließlich dieser Zeile auftraten: Die akkumulierte Häufigkeit für die Note 3 (= alle EthnologInnen, die zumindest die Note 3 erhielten) wäre daher: 19,2 % + 21,8 % + 28,2 % = 69,2 %.
 
Man errechnet sie folgendermaßen: Man zählt alle relativen Häufigkeiten zusammen, die einschließlich dieser Zeile auftraten: Die akkumulierte Häufigkeit für die Note 3 (= alle EthnologInnen, die zumindest die Note 3 erhielten) wäre daher: 19,2 % + 21,8 % + 28,2 % = 69,2 %.
Line 1,555: Line 1,874:
 
Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIK - HÄUFIGKEITEN und wählen Sie dort die Variable aus, deren Häufigkeitsverteilung Sie grafisch darstellen möchten.
 
Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIK - HÄUFIGKEITEN und wählen Sie dort die Variable aus, deren Häufigkeitsverteilung Sie grafisch darstellen möchten.
  
Klicken Sie dann auf Diagramme. Sie haben nun die Auswahlmöglichkeit zwischen '''Balkendiagrammen[1]''', '''Kreisdiagrammen[2]''' und '''Histogrammen[3]'''. Je nach Datenlage sollten Sie unterschiedliche Diagrammtypen heranziehen. Siehe dazu den Punkt '''Diagramme[4]'''.
+
Klicken Sie dann auf Diagramme. Sie haben nun die Auswahlmöglichkeit zwischen '''Balkendiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1]]]''', '''Kreisdiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[2]]]''' und '''Histogrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3]]]'''. Je nach Datenlage sollten Sie unterschiedliche Diagrammtypen heranziehen. Siehe dazu den Punkt '''Diagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|[4]]]'''.
  
  
Line 1,568: Line 1,887:
 
== 3.2.3 Klassenbildung (Gruppierung) von Daten ==
 
== 3.2.3 Klassenbildung (Gruppierung) von Daten ==
  
Unter der '''Gruppierung von Daten''' verstehen wir die '''Zusammenfassung von verschiedenen Ausprägungen zu Klassen'''. Eine Klasse ist die '''Menge sämtlicher Messwerte''', die '''innerhalb festgelegter Grenzen''' liegen. Dadurch kann die '''Häufigkeitsverteilung[1]''' einer Variablen mit einer Vielzahl unterschiedlicher Ausprägungen übersichtlicher dargestellt werden.
+
Unter der '''Gruppierung von Daten''' verstehen wir die '''Zusammenfassung von verschiedenen Ausprägungen zu Klassen'''. Eine Klasse ist die '''Menge sämtlicher Messwerte''', die '''innerhalb festgelegter Grenzen''' liegen. Dadurch kann die '''Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' einer Variablen mit einer Vielzahl unterschiedlicher Ausprägungen übersichtlicher dargestellt werden.
  
 
'''Beispiel: Gemessene Körpergrößen und Umwandlung in Klassen'''<br />
 
'''Beispiel: Gemessene Körpergrößen und Umwandlung in Klassen'''<br />
Line 1,577: Line 1,896:
 
Viel übersichtlicher wäre es aber, diese 100 verschiedenen Ausprägungen zu '''Klassen''' von benachbarten Messwerten zusammenzufassen. Treten extrem viele unterschiedliche Ausprägungen auf, sind 10-19 Klassen sinnvoll. Wählt man bei diesem Beispiel 10 Klassen, fallen jeweils 10 Messwerte in eine Klasse (100:10=10): [[File:quantitative-68_2.jpg|frame|center|In Klassen eingeteilte Körpergrößen]]
 
Viel übersichtlicher wäre es aber, diese 100 verschiedenen Ausprägungen zu '''Klassen''' von benachbarten Messwerten zusammenzufassen. Treten extrem viele unterschiedliche Ausprägungen auf, sind 10-19 Klassen sinnvoll. Wählt man bei diesem Beispiel 10 Klassen, fallen jeweils 10 Messwerte in eine Klasse (100:10=10): [[File:quantitative-68_2.jpg|frame|center|In Klassen eingeteilte Körpergrößen]]
  
Die '''Klassenbreite''' ist bei '''diskreten Variablen[2]''' die Anzahl der in der Klasse zusammengefassten Messwerte. Berechnet wird sie mit: ''Höchster Wert der Klasse'' minus ''höchstem Wert der vorausgegangenen Klasse'' (hier also mit z.B. 1,89 m- 1,79 m= 0,10 m).
+
Die '''Klassenbreite''' ist bei '''diskreten Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[2]]]''' die Anzahl der in der Klasse zusammengefassten Messwerte. Berechnet wird sie mit: ''Höchster Wert der Klasse'' minus ''höchstem Wert der vorausgegangenen Klasse'' (hier also mit z.B. 1,89 m- 1,79 m= 0,10 m).
  
 
Die ''(exakten)'' '''Klassengrenzen (Intervallgrenzen)''' sind die kleinsten bzw. größten Messwerte einer Klasse (hier also z.B. 1,70 m und 1,79999 =1,8 m).
 
Die ''(exakten)'' '''Klassengrenzen (Intervallgrenzen)''' sind die kleinsten bzw. größten Messwerte einer Klasse (hier also z.B. 1,70 m und 1,79999 =1,8 m).
Line 1,596: Line 1,915:
 
=== 3.2.3.1 Gruppierung mit SPSS  ===
 
=== 3.2.3.1 Gruppierung mit SPSS  ===
  
In vielen Fällen, besonders bei '''stetigen Variablen[1]''', wird die Zahl der Ausprägungen einer Variablen so groß sein, dass '''Häufigkeitsverteilungen[2]''' unübersichtlich werden. Im folgenden Beispiel wurde die Altersverteilung der Antwortenden abgefragt:
+
In vielen Fällen, besonders bei '''stetigen Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[1]]]''', wird die Zahl der Ausprägungen einer Variablen so groß sein, dass '''Häufigkeitsverteilungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' unübersichtlich werden. Im folgenden Beispiel wurde die Altersverteilung der Antwortenden abgefragt:
  
 
[[File:quantitative-69_1.gif|frame|center|Häufigkeitsverteilung des Alters der Befragten]]
 
[[File:quantitative-69_1.gif|frame|center|Häufigkeitsverteilung des Alters der Befragten]]
  
Es wäre deutlich übersichtlicher, diese Werte in eine kleine Zahl von Klassen umzukodieren. Dazu benützen Sie die Funktion TRANSFORMIEREN - '''UMCODIEREN[3]''' in der Menüleiste. Nun können Sie sich entscheiden zwischen einer Umcodierung in die ''gleiche'' oder in ''eine andere Variable''. Es ist besser, sich für ''eine andere Variable'' zu entscheiden, da durch die '''Umcodierung''' (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch ''Umcodierung in eine neue Variable'' ausgeschlossen.
+
Es wäre deutlich übersichtlicher, diese Werte in eine kleine Zahl von Klassen umzukodieren. Dazu benützen Sie die Funktion TRANSFORMIEREN - '''UMCODIEREN[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[3]]]''' in der Menüleiste. Nun können Sie sich entscheiden zwischen einer Umcodierung in die ''gleiche'' oder in ''eine andere Variable''. Es ist besser, sich für ''eine andere Variable'' zu entscheiden, da durch die '''Umcodierung''' (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch ''Umcodierung in eine neue Variable'' ausgeschlossen.
  
 
Sie wählen nun die Variable aus, welche umcodiert werden soll und geben im Feld ''Ausgabevariable'' einen neuen Namen dafür ein, der aus Gründen der Kompatibilität mit älteren Programmen acht Zeichen nicht überschreiten darf. Im Feld darunter können Sie jedoch einen beliebig langen und expressiveren Namen wählen.
 
Sie wählen nun die Variable aus, welche umcodiert werden soll und geben im Feld ''Ausgabevariable'' einen neuen Namen dafür ein, der aus Gründen der Kompatibilität mit älteren Programmen acht Zeichen nicht überschreiten darf. Im Feld darunter können Sie jedoch einen beliebig langen und expressiveren Namen wählen.
Line 1,614: Line 1,933:
 
[[File:quantitative-69_3.gif|frame|center|Häufigkeitstabelle der umkodierten Altersverteilung]]
 
[[File:quantitative-69_3.gif|frame|center|Häufigkeitstabelle der umkodierten Altersverteilung]]
  
Nun müssen wir die neuen Werte, ausschließlich für die Ausgabe von '''SPSS''', '''rückcodieren''', um die Tabelle informativer zu machen, da wir nicht sofort erkennen können, dass ''0'' für ’unter 20’ steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben ('''Diagramme[4]''', Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die ''Variablenansicht.'' Im neuen Fenster finden wir bei der neuen Variable das Attribut ''Variablenlabel.'' Nach Doppelklick darauf erscheint folgendes Fenster:
+
Nun müssen wir die neuen Werte, ausschließlich für die Ausgabe von '''SPSS''', '''rückcodieren''', um die Tabelle informativer zu machen, da wir nicht sofort erkennen können, dass ''0'' für ’unter 20’ steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben ('''Diagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[4]]]''', Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die ''Variablenansicht.'' Im neuen Fenster finden wir bei der neuen Variable das Attribut ''Variablenlabel.'' Nach Doppelklick darauf erscheint folgendes Fenster:
  
 
[[File:quantitative-69_4.jpg|frame|center|Wertelabels definieren mit SPSS]]
 
[[File:quantitative-69_4.jpg|frame|center|Wertelabels definieren mit SPSS]]
Line 1,673: Line 1,992:
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|Nächstes Kapitel: 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]'''
 +
----
 +
[[#3.2 Die Ermittlung von Häufigkeiten|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|Vorheriges Kapitel: 3.2 Die Ermittlung von Häufigkeiten]]'''
 
= 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz =
 
= 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
'''Lagemaße''' beschreiben das '''Zentrum einer Verteilung''' durch eine Kennzahl.
 
'''Lagemaße''' beschreiben das '''Zentrum einer Verteilung''' durch eine Kennzahl.
Line 1,686: Line 2,013:
 
* der '''Modalwert''' bezeichnet ausschließlich den am häufigsten vorkommenden Wert, der keinerlei Hinweis über die Eigenheiten der anderen Werte gibt.
 
* der '''Modalwert''' bezeichnet ausschließlich den am häufigsten vorkommenden Wert, der keinerlei Hinweis über die Eigenheiten der anderen Werte gibt.
  
Je nach '''Verteilung[1]''', '''Skalenniveau[2]''' und '''Art der Daten[3]''' sind unterschiedliche '''Lagemaße''' sinnvoll. Bei gegebener '''Normalverteilung[4]''' stimmen sowohl '''Median''' wie auch der '''Modalwert''' mit dem '''Arithmetischen Mittel''' überein. In schiefen Verteilungen hingegen nehmen sie sehr unterschiedliche Positionen ein. In rechtsschiefen Verteilungen (der Abfall erfolgt nach rechts) ist der Modalwert am kleinsten, danach kommt der Median, am größten ist der Mittelwert. In '''linksschiefen Verteilungen''' ist es umgekehrt.
+
Je nach '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''', '''Skalenniveau[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[2]]]''' und '''Art der Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten Daten|[3]]]''' sind unterschiedliche '''Lagemaße''' sinnvoll. Bei gegebener '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4]9]''' stimmen sowohl '''Median''' wie auch der '''Modalwert''' mit dem '''Arithmetischen Mittel''' überein. In schiefen Verteilungen hingegen nehmen sie sehr unterschiedliche Positionen ein. In rechtsschiefen Verteilungen (der Abfall erfolgt nach rechts) ist der Modalwert am kleinsten, danach kommt der Median, am größten ist der Mittelwert. In '''linksschiefen Verteilungen''' ist es umgekehrt.
  
 
[[File:quantitative-71_1.jpg|frame|center|Unterschiedliche Lage von Median, Mittelwert und Modalwert in rechtsschiefer Verteilung]]
 
[[File:quantitative-71_1.jpg|frame|center|Unterschiedliche Lage von Median, Mittelwert und Modalwert in rechtsschiefer Verteilung]]
 
 
 
  
  
Line 1,700: Line 2,024:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4] Siehe Kapitel 3.1.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4] Siehe Kapitel 3.1.3.1]]<br />
  
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
</div>
  
 
== 3.3.1 Modalwert ==
 
== 3.3.1 Modalwert ==
Line 1,717: Line 2,054:
 
==== '''Modalklasse: Klasse mit größter Zahl an Einträgen''' ====
 
==== '''Modalklasse: Klasse mit größter Zahl an Einträgen''' ====
  
Bei '''klassierten Daten[1]''' ist die '''Modalklasse''' diejenige Klasse mit der größten Zahl an Einträgen
+
Bei '''klassierten Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]''' ist die '''Modalklasse''' diejenige Klasse mit der größten Zahl an Einträgen
  
 
==== '''Nur selten praktische Relevanz des Modalwerts''' ====
 
==== '''Nur selten praktische Relevanz des Modalwerts''' ====
  
Der '''Modalwert''' ist aussagekräftig, wenn ein einzelner Wert sehr häufig vorkommt (z.B. 27 '''Frauen''' und drei Männer) und unsinnig, wenn der häufigste Wert nur relativ selten vorkommt. Der '''Modalwert''' kann im Gegensatz zum '''arithmetischen Mittelwert''' oder zum '''Median''' auch sinnvoll in '''Nominalskalen[2]''' verwendet werden.
+
Der '''Modalwert''' ist aussagekräftig, wenn ein einzelner Wert sehr häufig vorkommt (z.B. 27 '''Frauen''' und drei Männer) und unsinnig, wenn der häufigste Wert nur relativ selten vorkommt. Der '''Modalwert''' kann im Gegensatz zum '''arithmetischen Mittelwert''' oder zum '''Median''' auch sinnvoll in '''Nominalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[2]]]''' verwendet werden.
  
  
Line 1,740: Line 2,077:
 
==== '''Arithmetisches Mittel bei Einteilung der Messwerte in Klassen:''' ====
 
==== '''Arithmetisches Mittel bei Einteilung der Messwerte in Klassen:''' ====
  
Wenn die Daten zahlreicher sind bzw. bereits in '''Klassen[1]''' eingeteilt wurden, kann man das '''arithmetische Mittel''' einfacher berechnen: man multipliziert in jeder Klasse die '''Klassenmitte''' (Durchschnitt aus dem theoretisch kleinstem und größten Wert einer Klasse) mit der Zahl der Einträge in der jeweiligen Klasse:  
+
Wenn die Daten zahlreicher sind bzw. bereits in '''Klassen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]''' eingeteilt wurden, kann man das '''arithmetische Mittel''' einfacher berechnen: man multipliziert in jeder Klasse die '''Klassenmitte''' (Durchschnitt aus dem theoretisch kleinstem und größten Wert einer Klasse) mit der Zahl der Einträge in der jeweiligen Klasse:  
  
 
[[File:quantitative-73_2.jpg|frame|center|Arithmetisches Mittel bei Einteilung der Messwerte in Klassen]]
 
[[File:quantitative-73_2.jpg|frame|center|Arithmetisches Mittel bei Einteilung der Messwerte in Klassen]]
Line 1,762: Line 2,099:
 
Der '''Median''' ist jener Wert, welcher in einer größenmäßig geordneten Reihe '''genau in der Mitte''' liegt. D.h. oberhalb wie unterhalb von ihm befindet sich eine gleichgroße Anzahl von Einträgen.
 
Der '''Median''' ist jener Wert, welcher in einer größenmäßig geordneten Reihe '''genau in der Mitte''' liegt. D.h. oberhalb wie unterhalb von ihm befindet sich eine gleichgroße Anzahl von Einträgen.
  
Warum benötigen wir ihn, da es doch auch das '''arithmetische Mittel[1]''' gibt? Das '''arithmetische Mittel''' ist der Mittelwert, der sich ergibt, wenn wir eine Summe durch die Anzahl der gezählten Elemente dividieren.
+
Warum benötigen wir ihn, da es doch auch das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' gibt? Das '''arithmetische Mittel''' ist der Mittelwert, der sich ergibt, wenn wir eine Summe durch die Anzahl der gezählten Elemente dividieren.
  
 
==== '''Beispiel: Verzerrung durch Mittel, nicht aber durch Median''' ====
 
==== '''Beispiel: Verzerrung durch Mittel, nicht aber durch Median''' ====
Line 1,770: Line 2,107:
 
[[File:quantitative-74_1.jpg|frame|center|Durchschnittseinkommen in Largebread]]
 
[[File:quantitative-74_1.jpg|frame|center|Durchschnittseinkommen in Largebread]]
  
Das durchschnittliche Einkommen von etwa 26000 $ scheint die Einkommenssituation der EinwohnerInnen von Largebread gut zu beschreiben. Die '''Normalverteilungskurve[2]''' zeigt uns an, dass das Einkommen relativ gut normalverteilt ist.
+
Das durchschnittliche Einkommen von etwa 26000 $ scheint die Einkommenssituation der EinwohnerInnen von Largebread gut zu beschreiben. Die '''Normalverteilungskurve[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2]]]''' zeigt uns an, dass das Einkommen relativ gut normalverteilt ist.
  
 
Was würde aber jetzt passieren, wenn der reichste Mann der Welt, Bill Gates, sich plötzlich entschließen würde, nach Largebread zu ziehen? Bill Gates verfügt über ein Jahreseinkommen von 5 Milliarden $. Das Diagramm verändert sich extrem:
 
Was würde aber jetzt passieren, wenn der reichste Mann der Welt, Bill Gates, sich plötzlich entschließen würde, nach Largebread zu ziehen? Bill Gates verfügt über ein Jahreseinkommen von 5 Milliarden $. Das Diagramm verändert sich extrem:
Line 1,785: Line 2,122:
 
* '''bei sehr kleiner Beobachtungszahl''' (einzelne Werte können besonders leicht den Durchschnittswert verzerren),
 
* '''bei sehr kleiner Beobachtungszahl''' (einzelne Werte können besonders leicht den Durchschnittswert verzerren),
 
* '''bei Verteilungen mit offenen Klassen''' (Schwierigkeit der Bestimmung der Klassenmitte der offenen Klassen),
 
* '''bei Verteilungen mit offenen Klassen''' (Schwierigkeit der Bestimmung der Klassenmitte der offenen Klassen),
* bei '''Ordinalskalen[3]''' (hier sollte er nicht verwendet werden).
+
* bei '''Ordinalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3]]]''' (hier sollte er nicht verwendet werden).
  
 
In all diesen Fällen ist es genauer, zum Median zu greifen. '''Der Median ist der Wert, der in einer geordneten Liste (oder primären Tafel) genau in der Mitte liegt, d.h. dass sich genauso viele Werte oberhalb wie unterhalb des Wertes befinden. Dieser Wert liegt an (n+1)/2ter Position.''' Hat man 3 Werte, dann ist der Medien der 2. Wert ([3+1]/2).
 
In all diesen Fällen ist es genauer, zum Median zu greifen. '''Der Median ist der Wert, der in einer geordneten Liste (oder primären Tafel) genau in der Mitte liegt, d.h. dass sich genauso viele Werte oberhalb wie unterhalb des Wertes befinden. Dieser Wert liegt an (n+1)/2ter Position.''' Hat man 3 Werte, dann ist der Medien der 2. Wert ([3+1]/2).
Line 1,801: Line 2,138:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3] Siehe Kapitel 3.1.2.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3] Siehe Kapitel 3.1.2.3]]<br />
  
Line 1,838: Line 2,175:
 
== 3.3.4 Geometrisches Mittel ==
 
== 3.3.4 Geometrisches Mittel ==
  
Das '''geometrische Mittel''' ist der '''Mittelwert bei mathematischen Produkten''', wie z.B. bei Wachstums- oder Zinsfaktoren. Das geometrische Mittel kann nur bei '''Proportionalskalen[1]''' verwendet werden. Dieses wird als n- te Wurzel aus der relativen Veränderung (Endwert dividiert durch Anfangswert) berechnet, wobei n der Zahl der Zeiteinheiten entspricht.
+
Das '''geometrische Mittel''' ist der '''Mittelwert bei mathematischen Produkten''', wie z.B. bei Wachstums- oder Zinsfaktoren. Das geometrische Mittel kann nur bei '''Proportionalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[1]]]''' verwendet werden. Dieses wird als n- te Wurzel aus der relativen Veränderung (Endwert dividiert durch Anfangswert) berechnet, wobei n der Zahl der Zeiteinheiten entspricht.
  
 
'''Beispiel: durchschnittliche Inflationsrate'''<br />
 
'''Beispiel: durchschnittliche Inflationsrate'''<br />
Line 1,889: Line 2,226:
 
Die Zahl in Klammern gibt die Priorität an. X(1) wird daher als wichtiger als X(2) eingestuft. Fett markiertes X bezeichnet Kennzahlen, welche bei der gegebenen Datenart absolut sinnvoll sind, nicht fettes X liefert mögliche, aber nicht besonders sinnvolle oder teilweise sogar in die Irre führende Werte.
 
Die Zahl in Klammern gibt die Priorität an. X(1) wird daher als wichtiger als X(2) eingestuft. Fett markiertes X bezeichnet Kennzahlen, welche bei der gegebenen Datenart absolut sinnvoll sind, nicht fettes X liefert mögliche, aber nicht besonders sinnvolle oder teilweise sogar in die Irre führende Werte.
  
Während Lagemaße bei '''eingipfeligen symmetrischen[1]''' '''Daten''' weitgehend übereinstimmen und typisch für die Daten sind, sind sie bei '''anderen Verteilungsformen[2]''' ('''U-förmige''', sehr '''schiefe''', '''mehrgipfelige''', '''gleichverteilte''') nicht aussagekräftig für die Verteilung.
+
Während Lagemaße bei '''eingipfeligen symmetrischen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1]]]''' '''Daten''' weitgehend übereinstimmen und typisch für die Daten sind, sind sie bei '''anderen Verteilungsformen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|[2]]]''' ('''U-förmige''', sehr '''schiefe''', '''mehrgipfelige''', '''gleichverteilte''') nicht aussagekräftig für die Verteilung.
  
  
Line 1,900: Line 2,237:
 
== 3.3.7 Berechnung von Lagemaßen mit SPSS ==
 
== 3.3.7 Berechnung von Lagemaßen mit SPSS ==
  
Während das '''geometrische Mittel[1]''' mit jedem mathematischen Taschenrechner leicht berechnet werden kann (einfach n-te Wurzel aus der Endzahl), sind die '''Lagemaße''' mit SPSS sehr einfach zu berechnen.
+
Während das '''geometrische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[1]]]''' mit jedem mathematischen Taschenrechner leicht berechnet werden kann (einfach n-te Wurzel aus der Endzahl), sind die '''Lagemaße''' mit SPSS sehr einfach zu berechnen.
  
 
Klicken Sie in der Menüleiste auf ANALYSIEREN - HÄUFIGKEITEN und wählen Sie dann ''Statistik'' aus:
 
Klicken Sie in der Menüleiste auf ANALYSIEREN - HÄUFIGKEITEN und wählen Sie dann ''Statistik'' aus:
Line 1,910: Line 2,247:
 
[[File:quantitative-80_2.gif|frame|center|Lagemaße des BNE aller Länder der Welt]]
 
[[File:quantitative-80_2.gif|frame|center|Lagemaße des BNE aller Länder der Welt]]
  
Wir sehen, dass die '''Lagemaße''' extrem auseinanderliegen. Warum, macht das '''Histogramm[2]''' mit '''Normalverteilungskurve[3]''' (anklicken unter ''Diagramme'') sofort sichtbar: Eine kleine Zahl von reichen Ländern hebt das '''arithmetische Mittel''' auf ein Niveau, welches außerhalb der Reichweite der meisten Länder dieser Welt liegt:
+
Wir sehen, dass die '''Lagemaße''' extrem auseinanderliegen. Warum, macht das '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2]]]''' mit '''Normalverteilungskurve[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[3]]]''' (anklicken unter ''Diagramme'') sofort sichtbar: Eine kleine Zahl von reichen Ländern hebt das '''arithmetische Mittel''' auf ein Niveau, welches außerhalb der Reichweite der meisten Länder dieser Welt liegt:
  
 
[[File:quantitative-80_3.jpg|frame|center|Histogramm des BNE aller Länder der Welt]]
 
[[File:quantitative-80_3.jpg|frame|center|Histogramm des BNE aller Länder der Welt]]
Line 1,924: Line 2,261:
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|Nächstes Kapitel: 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]'''
 +
----
 +
[[#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|Vorheriges Kapitel: 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]'''
 
= 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’ =
 
= 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’ =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
'''Streuungsmaße''' informieren über die Verteilung von Ausprägungen außerhalb des Zentrums. Sie liefern dadurch wertvolle Informationen über die (Un-)Ausgeglichenheit einer Verteilung.  
 
'''Streuungsmaße''' informieren über die Verteilung von Ausprägungen außerhalb des Zentrums. Sie liefern dadurch wertvolle Informationen über die (Un-)Ausgeglichenheit einer Verteilung.  
Line 1,930: Line 2,275:
 
==== '''Grafische Darstellung der Streuung durch Histogramme''' ====
 
==== '''Grafische Darstellung der Streuung durch Histogramme''' ====
  
'''Histogramme[1]''' zeigen die relative "Gerechtigkeit" einer Verteilung in graphischer Form, wie z.B. das folgende über das Bruttonationalprodukt der Länder dieser Welt im Jahr 1991.
+
'''Histogramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''' zeigen die relative "Gerechtigkeit" einer Verteilung in graphischer Form, wie z.B. das folgende über das Bruttonationalprodukt der Länder dieser Welt im Jahr 1991.
  
 
[[File:quantitative-81_1.jpg|frame|center|Histogramm Bruttonationalprodukt 1991]]
 
[[File:quantitative-81_1.jpg|frame|center|Histogramm Bruttonationalprodukt 1991]]
  
Dieses '''Histogramm''' zeigt optisch deutlich, dass im Jahr 1991 das durchschnittliche Bruttonationalprodukt von 5860 $ für die meisten Länder unerreichbar fern lag und damit keinerlei Aussagekraft für ihre Realität hatte. Der '''Median[2]''' lag damals bei der Hälfte des '''Mittelwerts[3]''', nämlich bei 2995 $. Ein Viertel der Länder wies ein Bruttonationalprodukt auf, welches unter 996 $ lag, ein Fünftel unter 681 $, ein Zehntel der Länder dieser Welt sogar unter 323 Dollar.
+
Dieses '''Histogramm''' zeigt optisch deutlich, dass im Jahr 1991 das durchschnittliche Bruttonationalprodukt von 5860 $ für die meisten Länder unerreichbar fern lag und damit keinerlei Aussagekraft für ihre Realität hatte. Der '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2]]]''' lag damals bei der Hälfte des '''Mittelwerts[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[3]]]''', nämlich bei 2995 $. Ein Viertel der Länder wies ein Bruttonationalprodukt auf, welches unter 996 $ lag, ein Fünftel unter 681 $, ein Zehntel der Länder dieser Welt sogar unter 323 Dollar.
  
 
==== '''Lagemaße zeigen oft nur verzerrtes Bild der Realität bzw. Normalität''' ====
 
==== '''Lagemaße zeigen oft nur verzerrtes Bild der Realität bzw. Normalität''' ====
  
Man ersieht daraus, dass Kennzahlen wie das '''arithmetische Mittel[4]''' oft nur wenig geeignet sind, die Normalität darzustellen, d.h. dass der Wert des arithmetischen Mittel erheblich von der '''Realität''' der meisten Ausprägungen verschieden sein kann.
+
Man ersieht daraus, dass Kennzahlen wie das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4]]]''' oft nur wenig geeignet sind, die Normalität darzustellen, d.h. dass der Wert des arithmetischen Mittel erheblich von der '''Realität''' der meisten Ausprägungen verschieden sein kann.
  
Wir benötigen daher weitere Kennzahlen, sogenannte '''Streuungsmaße''', um Auskunft über die Randbereiche der Ausprägungen zu erhalten. Dazu zählen besonders die '''Standardabweichung''' und '''Perzentile''' bzw. '''Quartile[5]'''.
+
Wir benötigen daher weitere Kennzahlen, sogenannte '''Streuungsmaße''', um Auskunft über die Randbereiche der Ausprägungen zu erhalten. Dazu zählen besonders die '''Standardabweichung''' und '''Perzentile''' bzw. '''Quartile[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5]]]'''.
  
  
Line 1,951: Line 2,296:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5] Siehe Kapitel 3.4.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5] Siehe Kapitel 3.4.3.1]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
</div>
  
 
== 3.4.1 Varianz ==
 
== 3.4.1 Varianz ==
  
'''Die Varianz ist eine Kennzahl, welche die Streuung aller Daten berücksichtigt.''' Sie wird berechnet, indem man den Durchschnitt der quadrierten Abweichung vom '''Arithmetischen Mittel[1]''' berechnet.
+
'''Die Varianz ist eine Kennzahl, welche die Streuung aller Daten berücksichtigt.''' Sie wird berechnet, indem man den Durchschnitt der quadrierten Abweichung vom '''Arithmetischen Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' berechnet.
  
 
[[File:quantitative-82_1.jpg|frame|center|Formel zu Bereichnung der Varianz]]
 
[[File:quantitative-82_1.jpg|frame|center|Formel zu Bereichnung der Varianz]]
Line 1,964: Line 2,321:
 
Ein '''Arithmetisches Mittel''' von 100 kann sich auch ergeben, wenn die Hälfte der Werte bei 0 und die andere Hälfte bei 200 liegt. In diesem Falle hätten wir eine extrem große Varianz (jeweils eine Abweichung von 100 vom '''Arithmetischen Mittel''', diese wird quadriert, die Ergebnisse zusammengezählt und durch ''N'' dividiert. In diesem Falle erhielten wir eine Varianz von 10.000, Ausdruck der maximalen individuellen Abweichung der Meßwerte vom '''Arithmetischen Mittel'''''.''
 
Ein '''Arithmetisches Mittel''' von 100 kann sich auch ergeben, wenn die Hälfte der Werte bei 0 und die andere Hälfte bei 200 liegt. In diesem Falle hätten wir eine extrem große Varianz (jeweils eine Abweichung von 100 vom '''Arithmetischen Mittel''', diese wird quadriert, die Ergebnisse zusammengezählt und durch ''N'' dividiert. In diesem Falle erhielten wir eine Varianz von 10.000, Ausdruck der maximalen individuellen Abweichung der Meßwerte vom '''Arithmetischen Mittel'''''.''
  
In der Praxis verwendet man vor allem die Wurzel aus der Varianz, die sogenannte '''Standardabweichung[2]'''.
+
In der Praxis verwendet man vor allem die Wurzel aus der Varianz, die sogenannte '''Standardabweichung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|[2]]]'''.
  
  
Line 1,974: Line 2,331:
 
== 3.4.2 Standardabweichung ==
 
== 3.4.2 Standardabweichung ==
  
Die '''Standardabweichung''' '''''s''''' gibt in einer '''Normalverteilung[1]''' einen Bereich um den '''Mittelwert[2]''' an, innerhalb dessen sich 68,2 % aller Einträge befinden. Innerhalb des Bereichs Mittelwert +/-2s befinden sich in einer Normalverteilung 95,44 % aller Einträge. Berechnet wird die Standardabweichung als Wurzel aus folgender Formel:
+
Die '''Standardabweichung''' '''''s''''' gibt in einer '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1]]]''' einen Bereich um den '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' an, innerhalb dessen sich 68,2 % aller Einträge befinden. Innerhalb des Bereichs Mittelwert +/-2s befinden sich in einer Normalverteilung 95,44 % aller Einträge. Berechnet wird die Standardabweichung als Wurzel aus folgender Formel:
  
 
[[File:quantitative-83_1.jpg|frame|center|Formel zur Berechnung der Standardabweichung]]
 
[[File:quantitative-83_1.jpg|frame|center|Formel zur Berechnung der Standardabweichung]]
Line 1,984: Line 2,341:
 
==== '''Kenntnis der Standardabweichung = Kenntnis des Verlaufs der Verteilung''' ====
 
==== '''Kenntnis der Standardabweichung = Kenntnis des Verlaufs der Verteilung''' ====
  
Auch wenn man die grafische Darstellung der '''Häufigkeitsverteilung,''' wie z.B. mit einem '''Histogramm[3]''', nicht kennt, kann man sie aufgrund der Kenntnis des '''Mittelwerts''' und der Standardabweichung weitgehend vorhersagen. Hat man einen '''Mittelwert''' von 100 und eine Standardabweichung von 10, wird die Verteilungskurve deutlich steiler sein, als wenn die '''Standardabweichung''' bei 30 liegt.
+
Auch wenn man die grafische Darstellung der '''Häufigkeitsverteilung,''' wie z.B. mit einem '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3]]]''', nicht kennt, kann man sie aufgrund der Kenntnis des '''Mittelwerts''' und der Standardabweichung weitgehend vorhersagen. Hat man einen '''Mittelwert''' von 100 und eine Standardabweichung von 10, wird die Verteilungskurve deutlich steiler sein, als wenn die '''Standardabweichung''' bei 30 liegt.
  
 
==== '''Kenntnis der Standardverteilung = Abschätzung der Häufigkeit von Ausprägungen''' ====
 
==== '''Kenntnis der Standardverteilung = Abschätzung der Häufigkeit von Ausprägungen''' ====
Line 2,011: Line 2,368:
 
=== 3.4.3.1 Quartile  ===
 
=== 3.4.3.1 Quartile  ===
  
'''Quartile''' teilen die Verteilung in vier gleich große Viertel: 25 % der Werte sind kleiner oder gleich groß mit dem 1. Quartil, 50 % sind kleiner oder gleich groß wie das 2. Quartil (daher ist das 2. Quartil gleichzusetzen mit dem Median), 75 % sind kleiner oder gleich groß mit dem 3. Quartil. '''Quartile''' sollten erst ab einer '''Stichprobengröße[1]''' von zumindest 20 eingesetzt werden.
+
'''Quartile''' teilen die Verteilung in vier gleich große Viertel: 25 % der Werte sind kleiner oder gleich groß mit dem 1. Quartil, 50 % sind kleiner oder gleich groß wie das 2. Quartil (daher ist das 2. Quartil gleichzusetzen mit dem Median), 75 % sind kleiner oder gleich groß mit dem 3. Quartil. '''Quartile''' sollten erst ab einer '''Stichprobengröße[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''' von zumindest 20 eingesetzt werden.
  
  
Line 2,051: Line 2,408:
 
[[File:quantitative-87_1.jpg|frame|center|Berechnung von Streuungsmaßen mit SPSS]]
 
[[File:quantitative-87_1.jpg|frame|center|Berechnung von Streuungsmaßen mit SPSS]]
  
Für die Berechnung von '''Quartilen[1]''' genügt das Setzen eines Häkchens in ''Quartile'', möchte man ''Dezile'' (also in 10%-Gruppen) berechnen, gibt man im Feld ''Trennwerte für'' die Zahl 10 ein (dadurch werden 100 % auf 10 gleiche Gruppen aufgeteilt, also besteht jede Gruppe aus 10 %). Gibt man einen Wert X im Feld neben ''Perzentile'' ein und klickt auf ''Hinzufügen'' (wie z.B. die Zahl 37), so wird ermittelt, unterhalb welchen Kennwerts X % der Einträge liegen (in diesem Fall 37 %). Man kann beliebig viele dieser '''Perzentile''' setzen.
+
Für die Berechnung von '''Quartilen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1]]]''' genügt das Setzen eines Häkchens in ''Quartile'', möchte man ''Dezile'' (also in 10%-Gruppen) berechnen, gibt man im Feld ''Trennwerte für'' die Zahl 10 ein (dadurch werden 100 % auf 10 gleiche Gruppen aufgeteilt, also besteht jede Gruppe aus 10 %). Gibt man einen Wert X im Feld neben ''Perzentile'' ein und klickt auf ''Hinzufügen'' (wie z.B. die Zahl 37), so wird ermittelt, unterhalb welchen Kennwerts X % der Einträge liegen (in diesem Fall 37 %). Man kann beliebig viele dieser '''Perzentile''' setzen.
  
 
[[File:quantitative-87_2.gif|frame|center|mit SPSS berechnete Streuungsmaße]]
 
[[File:quantitative-87_2.gif|frame|center|mit SPSS berechnete Streuungsmaße]]
Line 2,073: Line 2,430:
 
Boxplots enthalten eine Fülle von Hinweisen, wie im obigen Diagramm:
 
Boxplots enthalten eine Fülle von Hinweisen, wie im obigen Diagramm:
  
A. ein Kästchen, welches den Abstand zwischen dem 1. und dem 3. '''Quartil[1]''' markiert ('''Streuung''')
+
A. ein Kästchen, welches den Abstand zwischen dem 1. und dem 3. '''Quartil[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1]]]''' markiert ('''Streuung''')
  
 
B. eine langgezogene Linie, die von Extremwert zu Extremwert führt: '''Range''' ('''Streuung''');
 
B. eine langgezogene Linie, die von Extremwert zu Extremwert führt: '''Range''' ('''Streuung''');
  
C. Einen Querstrich im Kästchen, welcher das '''Arithmetische Mittel[2]''' markiert;
+
C. Einen Querstrich im Kästchen, welcher das '''Arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' markiert;
  
 
D. Mit * bezeichnete Einträge, welche mehr als 3 Kästchenlängen entfernt liegen ('''Ausreißer''').
 
D. Mit * bezeichnete Einträge, welche mehr als 3 Kästchenlängen entfernt liegen ('''Ausreißer''').
Line 2,104: Line 2,461:
 
[[File:quantitative-89_1.jpg|frame|center|Erstellung von Boxplots mit SPSS]]
 
[[File:quantitative-89_1.jpg|frame|center|Erstellung von Boxplots mit SPSS]]
  
Sie finden links die Liste der '''Variablen'''. Übertragen Sie ins Feld ''Abhängige Variablen'' die Variable, deren Lage und Streuung Sie mittels eines Boxplots darstellen möchten. Beachten Sie bitte, dass es sich dabei zwingend um eine '''metrische Variable[1]''' handeln muss. Falls Sie die '''Lage[2]''' und '''Streuung[3]''' der gesamten Einträge dieser Variablen wiederspiegeln möchten, können Sie auf ''OK'' klicken. Das '''Boxplot''' erscheint in der Ausgabe nach einer Reihe statistischer Berechnungen.
+
Sie finden links die Liste der '''Variablen'''. Übertragen Sie ins Feld ''Abhängige Variablen'' die Variable, deren Lage und Streuung Sie mittels eines Boxplots darstellen möchten. Beachten Sie bitte, dass es sich dabei zwingend um eine '''metrische Variable[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1]]]''' handeln muss. Falls Sie die '''Lage[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2]]]''' und '''Streuung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3]]]''' der gesamten Einträge dieser Variablen wiederspiegeln möchten, können Sie auf ''OK'' klicken. Das '''Boxplot''' erscheint in der Ausgabe nach einer Reihe statistischer Berechnungen.
  
 
Möchten Sie den Einfluss einer anderen '''Variable''' auf die gewählte Variable untersuchen, dann fügen Sie diese Variable in das Feld ''Faktorenliste'' ein. Sie erhalten dann verschiedene Boxplots, die jeweils Subgruppen der '''abhängigen Variablen''' bezeichnen:
 
Möchten Sie den Einfluss einer anderen '''Variable''' auf die gewählte Variable untersuchen, dann fügen Sie diese Variable in das Feld ''Faktorenliste'' ein. Sie erhalten dann verschiedene Boxplots, die jeweils Subgruppen der '''abhängigen Variablen''' bezeichnen:
  
[[File:quantitative-89_2.jpg|frame|center|Beispiel für Boxplots]]
+
[[File:quantitative-88_1.jpg|frame|center|Beispiel für Boxplots]]
  
 
   
 
   
Line 2,117: Line 2,474:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1] Siehe Kapitel 3.1.1.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1] Siehe Kapitel 3.1.1.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
[3] Siehe Kapitel 3.4<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3] Siehe Kapitel 3.4]]<br />
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|Nächstes Kapitel: 3.5 Der Zusammenhang zwischen Variablen]]'''
 +
----
 +
[[#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|Vorheriges Kapitel: 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]'''
 
= 3.5 Der Zusammenhang zwischen Variablen =
 
= 3.5 Der Zusammenhang zwischen Variablen =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Zu den spannendsten Fragen gehört die Untersuchung von '''Zusammenhängen''' zwischen '''Variablen'''. Es ist naheliegend, sich die Frage zu stellen, ob es z.B. einen Zusammenhang zwischen Rassismus und Bildung bzw. Sozialisation, Einkommen, Erfahrungen gibt. Es ist denkbar, dass die Religion einer Person Auswirkungen auf ihre Kinderzahl hat; es ist denkbar, dass Menschen eher zu biologischen und meist auch teureren Lebensmittel greifen, wenn auch ihr Einkommen höher ist usw.
 
Zu den spannendsten Fragen gehört die Untersuchung von '''Zusammenhängen''' zwischen '''Variablen'''. Es ist naheliegend, sich die Frage zu stellen, ob es z.B. einen Zusammenhang zwischen Rassismus und Bildung bzw. Sozialisation, Einkommen, Erfahrungen gibt. Es ist denkbar, dass die Religion einer Person Auswirkungen auf ihre Kinderzahl hat; es ist denkbar, dass Menschen eher zu biologischen und meist auch teureren Lebensmittel greifen, wenn auch ihr Einkommen höher ist usw.
Line 2,126: Line 2,491:
 
Um derartige Zusammenhänge aufzudecken, verfügen wir über verschiedene Methoden, wie z.B. die '''Kreuztabellen-Analyse''' oder die '''Korrelation'''(en).
 
Um derartige Zusammenhänge aufzudecken, verfügen wir über verschiedene Methoden, wie z.B. die '''Kreuztabellen-Analyse''' oder die '''Korrelation'''(en).
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
</div>
  
 
== 3.5.1 Optische Erkennung von Zusammenhängen ==
 
== 3.5.1 Optische Erkennung von Zusammenhängen ==
Line 2,141: Line 2,533:
 
==== '''Zusammenhänge bereits visuell erkennbar''' ====
 
==== '''Zusammenhänge bereits visuell erkennbar''' ====
  
Hier erkennen wir bereits optisch einen gewissen Zusammenhang. Die meisten Schnittpunkte befinden sich links oben und gehen in einer Linie nach rechts unten. Man könnte durch die Schnittpunkte annäherungsweise eine '''Gerade[1]''' ziehen, die von rechts oben nach links unten geht. Man spricht hier von einem '''linearen Zusammenhang'''''.''
+
Hier erkennen wir bereits optisch einen gewissen Zusammenhang. Die meisten Schnittpunkte befinden sich links oben und gehen in einer Linie nach rechts unten. Man könnte durch die Schnittpunkte annäherungsweise eine '''Gerade[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1]]]''' ziehen, die von rechts oben nach links unten geht. Man spricht hier von einem '''linearen Zusammenhang'''''.''
  
 
Die Aussage der Grafik ist: je höher der Alphabetisierungsgrad der Frauen, desto niedriger die Kindersterblichkeit.
 
Die Aussage der Grafik ist: je höher der Alphabetisierungsgrad der Frauen, desto niedriger die Kindersterblichkeit.
Line 2,163: Line 2,555:
 
== 3.5.2 Kreuztabellen-Analyse ==
 
== 3.5.2 Kreuztabellen-Analyse ==
  
Unter '''Kreuztabellen''' (auch '''Kontingenztafeln''' genannt) versteht man die tabellarische Darstellung der '''Häufigkeiten[1]''', welche bei der Kombination der Ausprägungen von zwei oder mehr '''Variablen''' auftreten.
+
Unter '''Kreuztabellen''' (auch '''Kontingenztafeln''' genannt) versteht man die tabellarische Darstellung der '''Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''', welche bei der Kombination der Ausprägungen von zwei oder mehr '''Variablen''' auftreten.
  
 
Wenn z.B. zwei '''Variablen''' vorliegen, werden die Ausprägungen der Variablen A in Spalten von links nach rechts und die Ausprägungen der Variablen B in Zeilen von oben nach unten eingetragen. In jeder einzelnen Zelle wird sodann die spezifische Häufigkeit der jeweiligen Kombination Ausprägung der Variablen A mit Ausprägung der Variablen B vermerkt.
 
Wenn z.B. zwei '''Variablen''' vorliegen, werden die Ausprägungen der Variablen A in Spalten von links nach rechts und die Ausprägungen der Variablen B in Zeilen von oben nach unten eingetragen. In jeder einzelnen Zelle wird sodann die spezifische Häufigkeit der jeweiligen Kombination Ausprägung der Variablen A mit Ausprägung der Variablen B vermerkt.
Line 2,174: Line 2,566:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 2,187: Line 2,579:
 
[[File:quantitative-93_1.gif|frame|center|Kreuztabelle Zusammenhang Muttersprache - Deutschkenntnisse]]
 
[[File:quantitative-93_1.gif|frame|center|Kreuztabelle Zusammenhang Muttersprache - Deutschkenntnisse]]
  
Man kann die Ergebnisse leichter interpretieren, wenn auch die '''relativen Häufigkeiten[1]''' ermittelt werden. Dazu klicken wir unter ''Zellen'' auf ''zeilenweise Prozentwerte'':
+
Man kann die Ergebnisse leichter interpretieren, wenn auch die '''relativen Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''' ermittelt werden. Dazu klicken wir unter ''Zellen'' auf ''zeilenweise Prozentwerte'':
  
 
[[File:quantitative-93_2.gif|frame|center|Kreuztabelle mit Zeilenprozentwerten zum Zusammenhang Muttersprache - Deutschkenntnisse]]
 
[[File:quantitative-93_2.gif|frame|center|Kreuztabelle mit Zeilenprozentwerten zum Zusammenhang Muttersprache - Deutschkenntnisse]]
Line 2,196: Line 2,588:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 2,203: Line 2,595:
 
=== 3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test  ===
 
=== 3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test  ===
  
Der '''Chi-Quadrat-Test''', angewandt auf '''Kreuztabellen''', ermittelt die '''Wahrscheinlichkeit[1]''', ob Zusammenhänge mehr als nur zufälliger Natur sind.
+
Der '''Chi-Quadrat-Test''', angewandt auf '''Kreuztabellen''', ermittelt die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1]]]''', ob Zusammenhänge mehr als nur zufälliger Natur sind.
  
 
Im vorigen Beispiel (Kreuztabelle) sahen wir, dass offensichtlich ein deutlich höherer Prozentsatz von frankophonen AfrikanerInnen besser Deutsch spricht als Anglophone. Wir wissen jedoch noch nicht, ob diese Unterschiede auch signifikant sind.
 
Im vorigen Beispiel (Kreuztabelle) sahen wir, dass offensichtlich ein deutlich höherer Prozentsatz von frankophonen AfrikanerInnen besser Deutsch spricht als Anglophone. Wir wissen jedoch noch nicht, ob diese Unterschiede auch signifikant sind.
Line 2,213: Line 2,605:
 
[[File:quantitative-94_1.gif|frame|center|Chi-Quadrat-Test]]
 
[[File:quantitative-94_1.gif|frame|center|Chi-Quadrat-Test]]
  
Für uns interessant ist hier der Wert für ''Asymptotische Signifikanz''. Dort wird 0,023 aufgeführt, also ein Wert kleiner als 0,05. Damit ist mit einer '''Wahrscheinlichkeit''' von mehr als 95 % anzunehmen (oder mit einer '''Irrtumswahrscheinlichkeit''' von weniger als 5 %), dass tatsächlich ein Zusammenhang zwischen Nationalsprache und Sprachkompetenz im Deutschen besteht. Bei einem Wert > 0,01 wäre die '''Wahrscheinlichkeit''' eines Zusammenhangs sogar größer als 99 %, also wäre das Ergebnis hoch '''signifikant[2]'''.
+
Für uns interessant ist hier der Wert für ''Asymptotische Signifikanz''. Dort wird 0,023 aufgeführt, also ein Wert kleiner als 0,05. Damit ist mit einer '''Wahrscheinlichkeit''' von mehr als 95 % anzunehmen (oder mit einer '''Irrtumswahrscheinlichkeit''' von weniger als 5 %), dass tatsächlich ein Zusammenhang zwischen Nationalsprache und Sprachkompetenz im Deutschen besteht. Bei einem Wert > 0,01 wäre die '''Wahrscheinlichkeit''' eines Zusammenhangs sogar größer als 99 %, also wäre das Ergebnis hoch '''signifikant[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]'''.
  
  
Line 2,226: Line 2,618:
 
=== 3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS  ===
 
=== 3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS  ===
  
Die Ergebnisse von '''Kreuztabellen''' können mit '''Gruppierten Balkendiagrammen[1]''' besonders anschaulich dargestellt werden.
+
Die Ergebnisse von '''Kreuztabellen''' können mit '''Gruppierten Balkendiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1]]]''' besonders anschaulich dargestellt werden.
  
 
Mit '''SPSS''' ist deren Erstellung sehr einfach.
 
Mit '''SPSS''' ist deren Erstellung sehr einfach.
Line 2,254: Line 2,646:
 
Korrelationskoeffizienten können '''Werte zwischen -1,00 und +1,00''' annehmen'''.''' Ein Wert von -1,0 bedeutet eine perfekte '''negative Korrelation''': Hohe Werte der Variablen A gehen ausnahmslos mit niedrigen Werten der Variablen B einher und umgekehrt. Ein Wert von (+)1,0 bezeichnet eine perfekte '''positive Korrelation''': hohe Werte von A entsprechen praktisch immer hohen Werten von B und umgekehrt.
 
Korrelationskoeffizienten können '''Werte zwischen -1,00 und +1,00''' annehmen'''.''' Ein Wert von -1,0 bedeutet eine perfekte '''negative Korrelation''': Hohe Werte der Variablen A gehen ausnahmslos mit niedrigen Werten der Variablen B einher und umgekehrt. Ein Wert von (+)1,0 bezeichnet eine perfekte '''positive Korrelation''': hohe Werte von A entsprechen praktisch immer hohen Werten von B und umgekehrt.
  
Je nach Art der '''Grundskalierung[1]''' muss man zu '''unterschiedlichen Korrelationskoeffizienten''' greifen:
+
Je nach Art der '''Grundskalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' muss man zu '''unterschiedlichen Korrelationskoeffizienten''' greifen:
  
 
[[File:quantitative-96_1.jpg|frame|center|Geeigneter Korrelationskoeffizient für unterschiedliche Skalenniveaus]]
 
[[File:quantitative-96_1.jpg|frame|center|Geeigneter Korrelationskoeffizient für unterschiedliche Skalenniveaus]]
Line 2,260: Line 2,652:
 
==== '''Vorsicht bei vorschneller Herstellung von Zusammenhängen''' ====
 
==== '''Vorsicht bei vorschneller Herstellung von Zusammenhängen''' ====
  
Gefundene Korrelationen müssen dennoch nochmals kritisch hinterfragt werden. Es gibt z.B. '''Scheinkorrelationen[2]''', die nur deshalb auftreten, weil beide Variablen hoch mit einer dritten Variable korrelieren, und '''verdeckte Korrelationen[3]''', bei welchen sich Subgruppen der '''Stichprobe[4]''' gegenseitig neutralisieren, selbst aber eine hohe '''Korrelation''' bei den beiden Variablen aufweisen. Erst die '''Signifikanz[5]''' gibt einer '''Korrelation''' die nötige Aussagekraft.
+
Gefundene Korrelationen müssen dennoch nochmals kritisch hinterfragt werden. Es gibt z.B. '''Scheinkorrelationen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2]]]''', die nur deshalb auftreten, weil beide Variablen hoch mit einer dritten Variable korrelieren, und '''verdeckte Korrelationen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3]]]''', bei welchen sich Subgruppen der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4]]]''' gegenseitig neutralisieren, selbst aber eine hohe '''Korrelation''' bei den beiden Variablen aufweisen. Erst die '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]''' gibt einer '''Korrelation''' die nötige Aussagekraft.
  
  
Line 2,266: Line 2,658:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2] Siehe Kapitel 3.5.3.4.3]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2] Siehe Kapitel 3.5.3.4.3]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3] Siehe Kapitel 3.5.3.4.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3] Siehe Kapitel 3.5.3.4.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4] Siehe Kapitel 2.1.1]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,280: Line 2,672:
 
Voraussetzungen zu seiner Anwendung:
 
Voraussetzungen zu seiner Anwendung:
  
• der Zusammenhang zwischen X und Y ist (annähernd) '''linear[1]''',
+
• der Zusammenhang zwischen X und Y ist (annähernd) '''linear[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1]]]''',
  
• beide Variablen sind '''normalverteilt[2]'''.
+
• beide Variablen sind '''normalverteilt[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2]]]'''.
  
 
Die Berechnung der '''Maßkorrelation''' ''r'' erfolgt durch folgende Formel:
 
Die Berechnung der '''Maßkorrelation''' ''r'' erfolgt durch folgende Formel:
Line 2,300: Line 2,692:
  
 
'''Beispiel:'''<br />
 
'''Beispiel:'''<br />
Wir möchten bei Fahrzeugen den Zusammenhang zwischen Gewicht und Beschleunigung feststellen. Wir kontrollieren mithilfe eines '''Histogramms[1]''', ob die beiden Variablen annähernd '''normalverteilt[2]''' sind:
+
Wir möchten bei Fahrzeugen den Zusammenhang zwischen Gewicht und Beschleunigung feststellen. Wir kontrollieren mithilfe eines '''Histogramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''', ob die beiden Variablen annähernd '''normalverteilt[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2]]]''' sind:
  
 
==== '''Kontrolle der ersten Bedingung (Normalverteilung)''' ====
 
==== '''Kontrolle der ersten Bedingung (Normalverteilung)''' ====
Line 2,308: Line 2,700:
 
==== '''Kontrolle der 2. Bedingung (linearer Zusammenhang)''' ====
 
==== '''Kontrolle der 2. Bedingung (linearer Zusammenhang)''' ====
  
Dann erstellen wir ein '''Streudiagramm''', welches uns einen Einblick gibt, ob die beiden Variablen systematische Entsprechungen zeigen und versuchen, in diese '''eine Regressionsgerade zu legen[3]'''. Falls dies möglich ist, ist auch die zweite Bedingung zur Anwendung der Maßkorrelation erfüllt.
+
Dann erstellen wir ein '''Streudiagramm''', welches uns einen Einblick gibt, ob die beiden Variablen systematische Entsprechungen zeigen und versuchen, in diese '''eine Regressionsgerade zu legen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3]]]'''. Falls dies möglich ist, ist auch die zweite Bedingung zur Anwendung der Maßkorrelation erfüllt.
  
 
[[File:quantitative-98_2.jpg|frame|center|Kontrolle der zweiten Bedingung (Linearer Zusammenhang)]]
 
[[File:quantitative-98_2.jpg|frame|center|Kontrolle der zweiten Bedingung (Linearer Zusammenhang)]]
Line 2,321: Line 2,713:
  
 
'''Ergebnis des Beispiels:'''<br />
 
'''Ergebnis des Beispiels:'''<br />
Es gibt einen nachweisbaren Zusammenhang zwischen der Beschleunigung von Fahrzeugen und ihrem Gewicht. Dieser Zusammenhang ist mit einer Irrtumswahrscheinlichkeit von 1 % '''signifikant[4]'''. Da es '''eine negative Korrelation''' ist, kann man sagen, dass mit steigendem Gewicht des Fahrzeugs seine Beschleunigung abnimmt, was nicht weiter überraschend ist.
+
Es gibt einen nachweisbaren Zusammenhang zwischen der Beschleunigung von Fahrzeugen und ihrem Gewicht. Dieser Zusammenhang ist mit einer Irrtumswahrscheinlichkeit von 1 % '''signifikant[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4]]]'''. Da es '''eine negative Korrelation''' ist, kann man sagen, dass mit steigendem Gewicht des Fahrzeugs seine Beschleunigung abnimmt, was nicht weiter überraschend ist.
  
  
Line 2,329: Line 2,721:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2] Siehe Kapitel 3.1.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2] Siehe Kapitel 3.1.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3] Siehe Kapitel 3.5.4.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3] Siehe Kapitel 3.5.4.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,342: Line 2,734:
 
==== '''Auch verwendet für Zusammenhänge zwischen metrischen und ordinalskalierten Daten''' ====
 
==== '''Auch verwendet für Zusammenhänge zwischen metrischen und ordinalskalierten Daten''' ====
  
Man setzt die '''Rangkorrelation''' häufig auch ein, wenn man den Zusammenhang von '''ordinalskalierten[1]''' und '''metrischen[2]''' Variablen berechnen möchte. Dabei wandelt man die Messwerte zuerst in Rangplätze um (nachdem man diese größenmäßig gereiht hat) um danach R berechnen zu können. Fallen mehrere umgewandelte Messwerte auf den gleichen Rangplatz, teilen sie sich diese Plätze (arithmetisches Mittel), also 6., 7., 8. und 9. Platz = 30 (6+7+8+9). 30 dividiert durch 4 (Anzahl der Rangplätze) =7,5. Jeder dieser 4 gleichen Messwerte erhält somit den Rangplatz 7,5.
+
Man setzt die '''Rangkorrelation''' häufig auch ein, wenn man den Zusammenhang von '''ordinalskalierten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1]]]''' und '''metrischen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[2]]]''' Variablen berechnen möchte. Dabei wandelt man die Messwerte zuerst in Rangplätze um (nachdem man diese größenmäßig gereiht hat) um danach R berechnen zu können. Fallen mehrere umgewandelte Messwerte auf den gleichen Rangplatz, teilen sie sich diese Plätze (arithmetisches Mittel), also 6., 7., 8. und 9. Platz = 30 (6+7+8+9). 30 dividiert durch 4 (Anzahl der Rangplätze) =7,5. Jeder dieser 4 gleichen Messwerte erhält somit den Rangplatz 7,5.
  
 
==== '''Berechnung der Rangkorrelation:''' ====
 
==== '''Berechnung der Rangkorrelation:''' ====
Line 2,367: Line 2,759:
 
=== 3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS  ===
 
=== 3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS  ===
  
Klicken Sie in der Menüleiste auf ANALYSIEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach '''Spearman'''. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[1]''' als die '''Ordinalskala[2]''' verfügen ('''Intervall-[3]''' oder '''Proportionalskala[4]'''), werden sie automatisch von '''SPSS''' in die entspechenden Rangplätze umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der Korrelation gemeinsam mit der Beurteilung ihrer '''Signifikanz[5]'''.
+
Klicken Sie in der Menüleiste auf ANALYSIEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach '''Spearman'''. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' als die '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''' verfügen ('''Intervall-[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3]]]''' oder '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4]]]'''), werden sie automatisch von '''SPSS''' in die entspechenden Rangplätze umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der Korrelation gemeinsam mit der Beurteilung ihrer '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]'''.
  
  
Line 2,376: Line 2,768:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,420: Line 2,812:
 
=== 3.5.3.3.1 Berechnung von TAU mit SPSS  ===
 
=== 3.5.3.3.1 Berechnung von TAU mit SPSS  ===
  
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich '''Kendall-Tau'''. Im Feld Variablen fügen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[1]''' als die '''Ordinalskala[2]''' verfügen ('''Intervall[3]''' - oder '''Proportionalskala[4]'''), werden sie automatisch umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der '''Korrelation''' gemeinsam mit der Beurteilung ihrer '''Signifikanz[5]'''.
+
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich '''Kendall-Tau'''. Im Feld Variablen fügen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' als die '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''' verfügen ('''Intervall[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3]]]''' - oder '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4]]]'''), werden sie automatisch umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der '''Korrelation''' gemeinsam mit der Beurteilung ihrer '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]'''.
  
  
Line 2,429: Line 2,821:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,440: Line 2,832:
 
A. der Höhe der '''Korrelation'''
 
A. der Höhe der '''Korrelation'''
  
B. der Größe der '''Stichprobe[1]'''(n)
+
B. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]'''(n)
  
 
C. der Sorgfalt beim Ausschluss einer möglichen Scheinkorrelation bzw. des Erkennens verdeckter Korrelationen.
 
C. der Sorgfalt beim Ausschluss einer möglichen Scheinkorrelation bzw. des Erkennens verdeckter Korrelationen.
  
Die statistische Kennzahl der '''Signifikanz''' berücksichtigt sowohl die Höhe der '''Korrelation''' wie auch die Größe der Stichprobe und gibt Auskunft über die '''Wahrscheinlichkeit[2]''', dass die erhaltene '''Korrelation''' rein zufällig auftrat. Sie ist statistisch von äußerst großer Bedeutung.
+
Die statistische Kennzahl der '''Signifikanz''' berücksichtigt sowohl die Höhe der '''Korrelation''' wie auch die Größe der Stichprobe und gibt Auskunft über die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]''', dass die erhaltene '''Korrelation''' rein zufällig auftrat. Sie ist statistisch von äußerst großer Bedeutung.
  
  
Line 2,488: Line 2,880:
 
[[File:quantitative-105_3.jpg|frame|center|Nach Geschlechern getrennte Histogramme zum Zigarettenkonsum]]
 
[[File:quantitative-105_3.jpg|frame|center|Nach Geschlechern getrennte Histogramme zum Zigarettenkonsum]]
  
Wir sehen, dass bei den Jungen eine '''perfekte negative Korrelation[1]''' vorliegt (r=-1), bei den Mädchen hingegen eine perfekte '''positive Korrelation''' (r=1). Die Jungen haben die Werbung eher als erschreckend für den Tabakkonsum aufgefasst, die Mädchen hingegen als ermutigend. Am Ende des Untersuchungszeitraums rauchten die Mädchen im gleichen Maße mehr als die Jungen weniger rauchten. Dadurch ergab sich eine '''Null-Korrelation''' auf der Ebene der gesamten '''Stichprobe[2]'''.
+
Wir sehen, dass bei den Jungen eine '''perfekte negative Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' vorliegt (r=-1), bei den Mädchen hingegen eine perfekte '''positive Korrelation''' (r=1). Die Jungen haben die Werbung eher als erschreckend für den Tabakkonsum aufgefasst, die Mädchen hingegen als ermutigend. Am Ende des Untersuchungszeitraums rauchten die Mädchen im gleichen Maße mehr als die Jungen weniger rauchten. Dadurch ergab sich eine '''Null-Korrelation''' auf der Ebene der gesamten '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]'''.
  
  
Line 2,555: Line 2,947:
 
=== 3.5.3.4.4 Signifikanz der Korrelation  ===
 
=== 3.5.3.4.4 Signifikanz der Korrelation  ===
  
Die '''Signifikanz''' ist eine Kennzahl, welche die Wahrscheinlichkeit eines systematischen Zusammenhangs zwischen den Variablen bezeichnet. Sie drückt aus, ob ein scheinbarer Zusammenhang rein zufälliger Natur sein könnte oder mit hoher '''Wahrscheinlichkeit[1]''' tatsächlich vorliegt. Man spricht bei der '''Signikanz''' von '''Irrtumswahrscheinlichkeiten''' oder '''Signifikanzniveaus'''. Gängige Formulierungen lauten etwa, dass zwischen den Variablen A und B eine Korrelation von r=0,5 auf dem '''Signifikanzniveau''' oder der '''Irrtumswahrscheinlichkeit''' von p ≤ 1 % besteht. Dies bedeutet, dass die zwischen den Variablen A und B gefundene Korrelation in dieser Höhe und bei dieser Stichprobengröße nur in weniger als 1 % aller Fälle rein zufällig auftritt.
+
Die '''Signifikanz''' ist eine Kennzahl, welche die Wahrscheinlichkeit eines systematischen Zusammenhangs zwischen den Variablen bezeichnet. Sie drückt aus, ob ein scheinbarer Zusammenhang rein zufälliger Natur sein könnte oder mit hoher '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' tatsächlich vorliegt. Man spricht bei der '''Signikanz''' von '''Irrtumswahrscheinlichkeiten''' oder '''Signifikanzniveaus'''. Gängige Formulierungen lauten etwa, dass zwischen den Variablen A und B eine Korrelation von r=0,5 auf dem '''Signifikanzniveau''' oder der '''Irrtumswahrscheinlichkeit''' von p ≤ 1 % besteht. Dies bedeutet, dass die zwischen den Variablen A und B gefundene Korrelation in dieser Höhe und bei dieser Stichprobengröße nur in weniger als 1 % aller Fälle rein zufällig auftritt.
  
Die Kennzahl ''p'' der '''Irrtumswahrscheinlichkeit''', auf deren komplexe Berechnung hier nicht eingegangen wird, berücksichtigt somit sowohl die '''Höhe der Korrelation''' wie auch die '''Größe der Stichprobe'''. Ist die '''Stichprobe[2]''' sehr klein, muss die Korrelation extrem groß ausfallen, um '''signifikant''' sein zu können. Hingegen kann auch eine Korrelation von r=0,2 bei sehr großen Stichproben '''signifikant''' werden.
+
Die Kennzahl ''p'' der '''Irrtumswahrscheinlichkeit''', auf deren komplexe Berechnung hier nicht eingegangen wird, berücksichtigt somit sowohl die '''Höhe der Korrelation''' wie auch die '''Größe der Stichprobe'''. Ist die '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' sehr klein, muss die Korrelation extrem groß ausfallen, um '''signifikant''' sein zu können. Hingegen kann auch eine Korrelation von r=0,2 bei sehr großen Stichproben '''signifikant''' werden.
  
 
==== '''Grenzwerte der Signifikanz bei n=20''' ====
 
==== '''Grenzwerte der Signifikanz bei n=20''' ====
Line 2,588: Line 2,980:
 
Statistikprogramme wie '''SPSS''' ermitteln selbstständig bei der Berechnung der Korrelation die dazugehörige '''Irrtumswahrscheinlichkeit'''. Bei SPSS wird '''mit Sternen ausgedrückt''' (1, 2 oder 3 Sterne), ob die Korrelation '''signifikant''' ist, d.h. ob der Zusammenhang weitgehend gesichert scheint oder nicht.
 
Statistikprogramme wie '''SPSS''' ermitteln selbstständig bei der Berechnung der Korrelation die dazugehörige '''Irrtumswahrscheinlichkeit'''. Bei SPSS wird '''mit Sternen ausgedrückt''' (1, 2 oder 3 Sterne), ob die Korrelation '''signifikant''' ist, d.h. ob der Zusammenhang weitgehend gesichert scheint oder nicht.
  
Drei wesentliche Schwellen der '''Irrtumswahrscheinlichkeit[1]''' haben breite Akzeptanz gefunden:
+
Drei wesentliche Schwellen der '''Irrtumswahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' haben breite Akzeptanz gefunden:
  
 
* p <=  0,05 (die Wahrscheinlichkeit einer rein zufälligen Korrelation liegt bei unter 5 %, SPSS vergibt einen Stern = *);
 
* p <=  0,05 (die Wahrscheinlichkeit einer rein zufälligen Korrelation liegt bei unter 5 %, SPSS vergibt einen Stern = *);
Line 2,618: Line 3,010:
 
Die '''Kovarianz''' ist '''negativ''', wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte von X gehen einher mit niedrigen Werten von Y und umgekehrt.
 
Die '''Kovarianz''' ist '''negativ''', wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte von X gehen einher mit niedrigen Werten von Y und umgekehrt.
  
Da die Kovarianz in ihrer Rohform von der Größe der zugrundeliegenden Daten abhängt, ist die Einschätzung ihres Wertes ohne die Kenntnis der zugrundeliegenden Daten nicht einschätzbar. Dazu muss sie erst standardisiert werden, was zur '''Korrelation[1]''' führt.
+
Da die Kovarianz in ihrer Rohform von der Größe der zugrundeliegenden Daten abhängt, ist die Einschätzung ihres Wertes ohne die Kenntnis der zugrundeliegenden Daten nicht einschätzbar. Dazu muss sie erst standardisiert werden, was zur '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' führt.
  
  
Line 2,628: Line 3,020:
 
== 3.5.4 Regression ==
 
== 3.5.4 Regression ==
  
'''Die Regression(sanalyse) ist ein Verfahren zur Analyse von Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen.''' Während die '''Korrelation[1]''' die Stärke eines Zusammenhangs zeigt, erlaubt es die '''Regression''', von einer bekannten Größe einer Variable auf die vermutliche Größe der abhängigen Variablen zu schließen, falls ein systematischer Zusammenhang zwischen zwei Variablen A und B vorliegt.
+
'''Die Regression(sanalyse) ist ein Verfahren zur Analyse von Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen.''' Während die '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' die Stärke eines Zusammenhangs zeigt, erlaubt es die '''Regression''', von einer bekannten Größe einer Variable auf die vermutliche Größe der abhängigen Variablen zu schließen, falls ein systematischer Zusammenhang zwischen zwei Variablen A und B vorliegt.
  
 
Prinzipiell unterscheidet man zwischen '''linearer''' und '''nicht-linearer Regression'''.
 
Prinzipiell unterscheidet man zwischen '''linearer''' und '''nicht-linearer Regression'''.
Line 2,666: Line 3,058:
 
'''Erklärungen:'''
 
'''Erklärungen:'''
  
Was in der ersten Tabelle ''R'' genannt wird, ist die Quadratwurzel aus dem '''Bestimmtheitsmaß''' und deckt sich bei der einfachen Regressionsanalyse mit dem '''Korrelationskoeffizienten[1]''' von '''Pearson'''. Die Korrelation von 0,711 ist durchaus ansehnlich.
+
Was in der ersten Tabelle ''R'' genannt wird, ist die Quadratwurzel aus dem '''Bestimmtheitsmaß''' und deckt sich bei der einfachen Regressionsanalyse mit dem '''Korrelationskoeffizienten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1]]]''' von '''Pearson'''. Die Korrelation von 0,711 ist durchaus ansehnlich.
  
 
Unter ''Koeffizienten'' stehen die zwei wesentlichen Werte für die Berechnung der '''Regressionsgerade''': Die ''Konstante'' (hier 127,203) ist der Ausgangswert, der darunter stehende Wert -1,129 der Multiplikationsfaktor.
 
Unter ''Koeffizienten'' stehen die zwei wesentlichen Werte für die Berechnung der '''Regressionsgerade''': Die ''Konstante'' (hier 127,203) ist der Ausgangswert, der darunter stehende Wert -1,129 der Multiplikationsfaktor.
Line 2,698: Line 3,090:
 
[[File:quantitative-113_2.jpg|frame|center|Schaltfläche Diagramm-Eigenschaften in SPSS]]
 
[[File:quantitative-113_2.jpg|frame|center|Schaltfläche Diagramm-Eigenschaften in SPSS]]
  
Kontrollieren Sie nochmals, ob hier ''Linear'' angeklickt ist. Nur ''linear'' realisiert eine '''Regressionsgerade'''. Nach ''Zuweisen'' erhalten Sie nun das '''Streudiagramm[1]''' mit der entsprechenden Regressionsgerade:
+
Kontrollieren Sie nochmals, ob hier ''Linear'' angeklickt ist. Nur ''linear'' realisiert eine '''Regressionsgerade'''. Nach ''Zuweisen'' erhalten Sie nun das '''Streudiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[1]]]''' mit der entsprechenden Regressionsgerade:
  
 
[[File:quantitative-113_3.jpg|frame|center|Streudiagramm mit Regressionsgerade]]
 
[[File:quantitative-113_3.jpg|frame|center|Streudiagramm mit Regressionsgerade]]
Line 2,708: Line 3,100:
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|Nächstes Kapitel: 3.6 Die grafische Darstellung statistischer Ergebnisse]]'''
 +
----
 +
[[#3.5 Der Zusammenhang zwischen Variablen|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|Vorheriges Kapitel: 3.5 Der Zusammenhang zwischen Variablen]]'''
 
= 3.6 Die grafische Darstellung statistischer Ergebnisse =
 
= 3.6 Die grafische Darstellung statistischer Ergebnisse =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
==== '''Ein Bild sagt mehr als 1000 Worte''' ====
 
==== '''Ein Bild sagt mehr als 1000 Worte''' ====
Line 2,720: Line 3,120:
 
==== '''Nicht jedes Diagramm ist für jede Datenlage geeignet.''' ====
 
==== '''Nicht jedes Diagramm ist für jede Datenlage geeignet.''' ====
  
Man sollte bedenken, dass nicht jedes '''Diagramm''' für jede Art von Information geeignet ist. Manche '''Diagramme''', wie '''Kreisdiagramme[1]''', werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und würden bei der Wiedergabe von '''Mehrfachantworten[2]''' zu falschen Schlüssen führen.
+
Man sollte bedenken, dass nicht jedes '''Diagramm''' für jede Art von Information geeignet ist. Manche '''Diagramme''', wie '''Kreisdiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[1]]]''', werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und würden bei der Wiedergabe von '''Mehrfachantworten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2]]]''' zu falschen Schlüssen führen.
  
 
==== '''Begleitinformationen sind wichtig''' ====
 
==== '''Begleitinformationen sind wichtig''' ====
Line 2,736: Line 3,136:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2] Siehe Kapitel 3.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2] Siehe Kapitel 3.2.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
</div>
  
 
== 3.6.1 Arten von Diagrammen ==
 
== 3.6.1 Arten von Diagrammen ==
Line 2,745: Line 3,159:
 
* '''Flächendiagramme'''
 
* '''Flächendiagramme'''
 
* '''Kreisdiagramme'''
 
* '''Kreisdiagramme'''
* '''Boxplots[1]'''
+
* '''Boxplots[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|[1]]]'''
 
* '''Streudiagramme'''
 
* '''Streudiagramme'''
 
* '''Histogramme'''
 
* '''Histogramme'''
Line 2,768: Line 3,182:
 
'''Kreisdiagramme''' (auch '''Tortendiagramme''') genannt, sind eine beliebte grafische Darstellungsform, um die '''Aufteilung eines Ganzen''' aufzuzeigen.
 
'''Kreisdiagramme''' (auch '''Tortendiagramme''') genannt, sind eine beliebte grafische Darstellungsform, um die '''Aufteilung eines Ganzen''' aufzuzeigen.
  
Für die grafische Darstellung '''kategorieller''' Daten ('''Nominal[1]'''- oder '''Ordinalskalen[2]''') verwendet man Diagrammformen, die eine möglichst klare Darstellung der relativen Anteile erlauben. Alle Anteile müssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick größenmäßig eingeordnet werden können, dürfen '''nicht zu viele Kategorien''' verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach Möglichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.
+
Für die grafische Darstellung '''kategorieller''' Daten ('''Nominal[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1]]]'''- oder '''Ordinalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''') verwendet man Diagrammformen, die eine möglichst klare Darstellung der relativen Anteile erlauben. Alle Anteile müssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick größenmäßig eingeordnet werden können, dürfen '''nicht zu viele Kategorien''' verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach Möglichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.
  
=== '''Besonders gut geeignet für die Darstellung relativer Anteile''' sind '''Torten'''- oder '''Kreisdiagramme''': ===
+
'''Besonders gut geeignet für die Darstellung relativer Anteile''' sind '''Torten'''- oder '''Kreisdiagramme''':
  
 
[[File:quantitative-116_1.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Nkorongoji (Mali)]]
 
[[File:quantitative-116_1.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Nkorongoji (Mali)]]
Line 2,782: Line 3,196:
 
[[File:quantitative-116_2.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Matmatar]]
 
[[File:quantitative-116_2.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Matmatar]]
  
Hier ist es nur mehr mit Mühe möglich, die Tortenstücke nach ihrer Größe zu reihen, da die Rundung die Abschätzung der relativen Größe erschwert. Daher wären für die Darstellung vieler Subeinheiten eines Ganzen '''Stapelbalkendiagramme[3]''' besser geeignet.
+
Hier ist es nur mehr mit Mühe möglich, die Tortenstücke nach ihrer Größe zu reihen, da die Rundung die Abschätzung der relativen Größe erschwert. Daher wären für die Darstellung vieler Subeinheiten eines Ganzen '''Stapelbalkendiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3]]]''' besser geeignet.
  
 
==== '''Keinesfalls für Mehrfachantworten''' ====
 
==== '''Keinesfalls für Mehrfachantworten''' ====
Line 2,804: Line 3,218:
 
=== 3.6.1.2 Liniendiagramme  ===
 
=== 3.6.1.2 Liniendiagramme  ===
  
'''Liniendiagramme''' eignen sich besonders für die '''Darstellung von Entwicklungen''', ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr '''Populationen[1]''' miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen Ländern die Akzeptanz der Aufnahme eines weiteren Landes in die Europäische Union veränderte.
+
'''Liniendiagramme''' eignen sich besonders für die '''Darstellung von Entwicklungen''', ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr '''Populationen[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen Ländern die Akzeptanz der Aufnahme eines weiteren Landes in die Europäische Union veränderte.
  
 
[[File:quantitative-117_1.jpg|frame|center|Liniendiagramm]]
 
[[File:quantitative-117_1.jpg|frame|center|Liniendiagramm]]
Line 2,844: Line 3,258:
 
==== '''Vergleich der Aufteilung: Stapelbalkendiagramme''' ====
 
==== '''Vergleich der Aufteilung: Stapelbalkendiagramme''' ====
  
'''Gestapelte Balkendiagramme''' sind besonders wertvoll beim Vergleich der Aufteilung der gleichen '''Variable''' in verschiedenen '''Stichproben/Populationen[1]'''.
+
'''Gestapelte Balkendiagramme''' sind besonders wertvoll beim Vergleich der Aufteilung der gleichen '''Variable''' in verschiedenen '''Stichproben/Populationen[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]'''.
  
[[File:quantitative-118_4.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Dörfern Malis]]
+
[[File:quantitative-118_4.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Matmatar]]
  
  
Line 2,870: Line 3,284:
 
D. Im Feld ''Kategorienachse'' fügen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.
 
D. Im Feld ''Kategorienachse'' fügen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.
  
E. Bei Klick auf ''Auswertungsfunktion'' können wir uns für bestimmte Kennzahlen entscheiden, wie den '''Median[1]''', das '''arithmetische Mittel[2]''', die '''Häufigkeit[3]''', '''Summe''', welche für die numerischen Variablen berechnet werden..
+
E. Bei Klick auf ''Auswertungsfunktion'' können wir uns für bestimmte Kennzahlen entscheiden, wie den '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''', das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''', die '''Häufigkeit[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3]]]''', '''Summe''', welche für die numerischen Variablen berechnet werden..
  
 
Nach Klick auf OK erhalten wir das folgende '''Diagramm''':
 
Nach Klick auf OK erhalten wir das folgende '''Diagramm''':
Line 2,894: Line 3,308:
 
[[File:quantitative-120_1.gif|frame|center|Kartogramm Bevölkerungsdichte 1991]]
 
[[File:quantitative-120_1.gif|frame|center|Kartogramm Bevölkerungsdichte 1991]]
  
=== '''Kartogramme in Wahlanalysen häufig''' ===
+
==== '''Kartogramme in Wahlanalysen häufig''' ====
  
 
Mittels '''Kartogrammen''' können v.a. regional unterschiedliche Ausprägungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpräferenzen in den verschiedenen Bundesländern und Regionen aufzuzeigen.
 
Mittels '''Kartogrammen''' können v.a. regional unterschiedliche Ausprägungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpräferenzen in den verschiedenen Bundesländern und Regionen aufzuzeigen.
Line 2,903: Line 3,317:
 
=== 3.6.1.5 Histogramme  ===
 
=== 3.6.1.5 Histogramme  ===
  
Unter einem '''Histogramm''' versteht man die grafische Darstellung der '''Häufigkeitsverteilung[1]''' von Messwerten.
+
Unter einem '''Histogramm''' versteht man die grafische Darstellung der '''Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''' von Messwerten.
  
 
Die Daten sind dabei größenmäßig auf der X-Achse geordnet, während auf der Y- Achse ihre Häufigkeiten stehen. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist.
 
Die Daten sind dabei größenmäßig auf der X-Achse geordnet, während auf der Y- Achse ihre Häufigkeiten stehen. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist.
Line 2,909: Line 3,323:
 
[[File:quantitative-121_1.jpg|frame|center|Histogramm Kindersterblichkeit]]
 
[[File:quantitative-121_1.jpg|frame|center|Histogramm Kindersterblichkeit]]
  
'''Histogramme''' werden '''besonders zur Darstellung von Verteilungen''' verwendet, wie auch zur Demonstration der '''Normalverteilung[2]'''.
+
'''Histogramme''' werden '''besonders zur Darstellung von Verteilungen''' verwendet, wie auch zur Demonstration der '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2]]]'''.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
  
  
Line 2,928: Line 3,342:
 
[[File:quantitative-122_1.jpg|frame|center|Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate]]
 
[[File:quantitative-122_1.jpg|frame|center|Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate]]
  
Basierend auf UN-Daten über die Entwicklung der Länder dieser Welt (siehe world95.sav) zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zurückgeht. '''Streudiagramme''' eignen sich vorzüglich zum '''Aufzeigen des Zusammenhangs zwischen Variablen[1]''' und somit auch zur '''Darstellung der Regression und der Korrelation[2]'''.
+
Basierend auf UN-Daten über die Entwicklung der Länder dieser Welt (siehe world95.sav) zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zurückgeht. '''Streudiagramme''' eignen sich vorzüglich zum '''Aufzeigen des Zusammenhangs zwischen Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[1]]]''' und somit auch zur '''Darstellung der Regression und der Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[2]]]'''.
  
  
Line 2,968: Line 3,382:
 
I. '''Bei Mehrfachantworten unbedingt Hinweis darauf'''
 
I. '''Bei Mehrfachantworten unbedingt Hinweis darauf'''
  
Das folgende Diagramm (Quelle: '''http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[1]''') berücksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden müssen, bleibt der Erkenntnisgrad hoch.
+
Das folgende Diagramm (Quelle: '''http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf &#91;1&#93;]''') berücksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden müssen, bleibt der Erkenntnisgrad hoch.
  
 
[[File:quantitative-124_1.jpg|frame|center|Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbstätigen an der Gesamtheit der erwerbstätigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.]]
 
[[File:quantitative-124_1.jpg|frame|center|Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbstätigen an der Gesamtheit der erwerbstätigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.]]
Line 2,981: Line 3,395:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf<br />
+
[http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf &#91;1&#93; http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf]<br />
  
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#3.6 Die grafische Darstellung statistischer Ergebnisse|&uarr; Nach oben]]
 +
 +
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 4. Software für quantitative Forschungsprojekte =
 
= 4. Software für quantitative Forschungsprojekte =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
==== '''Für zuhause Excel, an der Universität SPSS''' ====
 
==== '''Für zuhause Excel, an der Universität SPSS''' ====
Line 2,990: Line 3,411:
 
Nur wenige Menschen verfügen auf dem eigenen PC über spezifische Statistiksoftware. Viele Berechnungen und grafische Darstellungen lassen sich jedoch auch mit gängigen Software-Programmen erstellen.
 
Nur wenige Menschen verfügen auf dem eigenen PC über spezifische Statistiksoftware. Viele Berechnungen und grafische Darstellungen lassen sich jedoch auch mit gängigen Software-Programmen erstellen.
  
Besonders die Tabellenkalkulation '''Microsoft Excel''' (aber praktisch auch jede andere Tabellenkalkulation vergleichbarer Qualität) verfügt über eine Fülle statistischer Funktionen, mit welchen auch recht ausgefeilte statistische Analysen erledigt werden können und auch über zahlreiche Möglichkeiten, die Ergebnisse mit anschaulichen '''Diagrammen[1]''' darzustellen.
+
Besonders die Tabellenkalkulation '''Microsoft Excel''' (aber praktisch auch jede andere Tabellenkalkulation vergleichbarer Qualität) verfügt über eine Fülle statistischer Funktionen, mit welchen auch recht ausgefeilte statistische Analysen erledigt werden können und auch über zahlreiche Möglichkeiten, die Ergebnisse mit anschaulichen '''Diagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1]]]''' darzustellen.
  
 
Wer jedoch sehr viel mit Statistiken zu tun hat und leichten Zugang zu Software wie '''SPSS''' hat, welches auch auf den PCs im PC-Raum des Instituts für Kultur- und Sozialanthropologie zu finden ist, wird den leichten Wechsel zu diesem Programm nicht bereuen (zu finden unter Start - Programme - SPSS für Windwows). Daten von Standard-Programmen wie '''Excel''' können leicht übernommen werden, statistische Berechnungen können sehr komfortabel in jeder beliebigen Tiefe getätigt werden. Wer ein wenig eingearbeitet ist, kann mit Programmen wie '''SPSS''' viele Analysen um ein Vielfaches schneller als mit '''Excel''' abschließen.
 
Wer jedoch sehr viel mit Statistiken zu tun hat und leichten Zugang zu Software wie '''SPSS''' hat, welches auch auf den PCs im PC-Raum des Instituts für Kultur- und Sozialanthropologie zu finden ist, wird den leichten Wechsel zu diesem Programm nicht bereuen (zu finden unter Start - Programme - SPSS für Windwows). Daten von Standard-Programmen wie '''Excel''' können leicht übernommen werden, statistische Berechnungen können sehr komfortabel in jeder beliebigen Tiefe getätigt werden. Wer ein wenig eingearbeitet ist, kann mit Programmen wie '''SPSS''' viele Analysen um ein Vielfaches schneller als mit '''Excel''' abschließen.
Line 2,998: Line 3,419:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 +
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1 Was kann Excel?|4.1 Was kann Excel?]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1.1 Statistische Analysen mit Excel|4.1.1 Statistische Analysen mit Excel]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1.2 Grafische Aufbereitung von Daten mit Excel|4.1.2 Grafische Aufbereitung von Daten mit Excel]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.2 Was kann MS Access?|4.2 Was kann MS Access?]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.3 Profi-Programme: SPSS und Statistica|4.3 Profi-Programme: SPSS und Statistica]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS|4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.5 Umcodierung|4.5 Umcodierung]]<br />
 +
</div>
  
  
Line 3,009: Line 3,442:
  
 
Da Excel auf fast jedem PC vorhanden ist, eignet es sich sehr gut dazu, Daten zu sammeln und erste Voranalysen mit einfachen statistischen Methoden zu machen. Da sowohl Excel wie auch SPSS ein Datenblatt (Tabelle) zur Verwaltung der Daten verwenden, ist die Übernahme von Daten aus Excel ins SPSS ausgesprochen einfach.
 
Da Excel auf fast jedem PC vorhanden ist, eignet es sich sehr gut dazu, Daten zu sammeln und erste Voranalysen mit einfachen statistischen Methoden zu machen. Da sowohl Excel wie auch SPSS ein Datenblatt (Tabelle) zur Verwaltung der Daten verwenden, ist die Übernahme von Daten aus Excel ins SPSS ausgesprochen einfach.
 +
  
  
Line 3,074: Line 3,508:
  
 
C. Ihre Zahlenreihen wurden damit schon automatisch übernommen und Sie können jetzt das Diagramm feinjustieren (Titel, Diagrammart, Größe, Farben etc.)
 
C. Ihre Zahlenreihen wurden damit schon automatisch übernommen und Sie können jetzt das Diagramm feinjustieren (Titel, Diagrammart, Größe, Farben etc.)
 +
  
  
Line 3,081: Line 3,516:
  
 
Microsoft Access kann, da seine Daten ebenfalls in Form einer Tabelle verwaltet werden, sehr gut zum Sammeln der Daten verwendet werden. Seine Analysemöglichkeiten sind jedoch, abgesehen von einer sehr guten Kreuztabellenfunktion (zu finden unter Abfragen) eher beschränkt.
 
Microsoft Access kann, da seine Daten ebenfalls in Form einer Tabelle verwaltet werden, sehr gut zum Sammeln der Daten verwendet werden. Seine Analysemöglichkeiten sind jedoch, abgesehen von einer sehr guten Kreuztabellenfunktion (zu finden unter Abfragen) eher beschränkt.
 +
  
  
Line 3,088: Line 3,524:
  
 
Profiprogramme wie '''SPSS''' oder '''Statistica''' weisen eine enorme Vielfalt statistischer Funktionen auf, deutlich mehr als '''Excel''' oder '''MS Access'''. Da '''SPSS''' auf allen PCs an der KSA installiert ist, wird in diesem Online-Kurs die Umsetzung statistischer Analysen und Darstellungen mit '''SPSS''' in vielen Bereichen angeboten. '''Statistica''' ist ebenfall eine exzellente Software, deren Bedienung auf der vorliegenden Homepage jedoch nicht demonstriert werden kann.
 
Profiprogramme wie '''SPSS''' oder '''Statistica''' weisen eine enorme Vielfalt statistischer Funktionen auf, deutlich mehr als '''Excel''' oder '''MS Access'''. Da '''SPSS''' auf allen PCs an der KSA installiert ist, wird in diesem Online-Kurs die Umsetzung statistischer Analysen und Darstellungen mit '''SPSS''' in vielen Bereichen angeboten. '''Statistica''' ist ebenfall eine exzellente Software, deren Bedienung auf der vorliegenden Homepage jedoch nicht demonstriert werden kann.
 +
  
  
Line 3,109: Line 3,546:
  
 
G. Speichern Sie nun die Datei unter einem beliebigen Namen in SPSS (die Endung *.SAV wird automatisch angenommen).
 
G. Speichern Sie nun die Datei unter einem beliebigen Namen in SPSS (die Endung *.SAV wird automatisch angenommen).
 +
  
  
Line 3,115: Line 3,553:
 
==== '''Einfache Transformation von Daten mit SPSS''' ====
 
==== '''Einfache Transformation von Daten mit SPSS''' ====
  
'''SPSS''' benötigt zur internen Berechnung mitunter andere Datenarten (v.a. numerische), als sie von anderen Programmen, auch WinWord überliefert werden. SPSS bietet sehr komfortable Möglichkeiten der automatischen '''Umwandlung[1]''' von Daten, sowie auch ihrer automatischen '''Rückwandlung[2]''' für die Bildschirm- und Druckausgabe.
+
'''SPSS''' benötigt zur internen Berechnung mitunter andere Datenarten (v.a. numerische), als sie von anderen Programmen, auch WinWord überliefert werden. SPSS bietet sehr komfortable Möglichkeiten der automatischen '''Umwandlung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[1]]]''' von Daten, sowie auch ihrer automatischen '''Rückwandlung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2]]]''' für die Bildschirm- und Druckausgabe.
  
  
Line 3,122: Line 3,560:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[1] Siehe Kapitel 2.2.3.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[1] Siehe Kapitel 2.2.3.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2] Siehe Kapitel 2.2.3.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2] Siehe Kapitel 2.2.3.3]]<br />
 +
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#4. Software für quantitative Forschungsprojekte|&uarr; Nach oben]]
  
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 5. Lexikon statistischer Grundbegriffe =
 
= 5. Lexikon statistischer Grundbegriffe =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Hier finden Sie die wichtigsten statistischen Grundbegriffe alphabetisch geordnet.
 
Hier finden Sie die wichtigsten statistischen Grundbegriffe alphabetisch geordnet.
 +
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.1 A-C|5.1 A-C]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.2 D-F|5.2 D-F]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.3 G-I|5.3 G-I]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.4 J-M|5.4 J-M]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.5 N-P|5.5 N-P]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.6 Q-R|5.6 Q-R]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.7 S-T|5.7 S-T]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.8 U-Z|5.8 U-Z]]<br />
 +
</div>
  
  
Line 3,143: Line 3,607:
 
Unter einer Alternativhypothese versteht man bei statistischen Tests die Gegenhypothese H1 zur Nullhypothese H0. Vor Durchführung von Tests legt man Annahmen über die Grundgesamtheit fest, welche mit Tests überprüft werden.
 
Unter einer Alternativhypothese versteht man bei statistischen Tests die Gegenhypothese H1 zur Nullhypothese H0. Vor Durchführung von Tests legt man Annahmen über die Grundgesamtheit fest, welche mit Tests überprüft werden.
  
=== '''Analytische Statistik''' (auch Schließende Statistik oder Inferenzstatistik) ===
+
==== '''Analytische Statistik''' (auch Schließende Statistik oder Inferenzstatistik) ====
  
Mithilfe von Verfahren der analytischen Statistik versucht man, von Stichproben auf die Grundpopulation bei Berücksichtigung unterschiedlicher Wahrscheinlichkeiten zu schließen. Dazu kommen eine Vielzahl weiterer weiterführender Verfahren wie Clusteranalyse, Faktorenanlyse multivariate Verfahren,... Siehe auch: '''Induktive Statistik (Wikipedia)[1]'''.
+
Mithilfe von Verfahren der analytischen Statistik versucht man, von Stichproben auf die Grundpopulation bei Berücksichtigung unterschiedlicher Wahrscheinlichkeiten zu schließen. Dazu kommen eine Vielzahl weiterer weiterführender Verfahren wie Clusteranalyse, Faktorenanlyse multivariate Verfahren,... Siehe auch: '''Induktive Statistik (Wikipedia)[http://de.wikipedia.org/wiki/Induktive_Statistik &#91;1&#93;]'''.
  
 
==== '''Arbeitshypothese''' ====
 
==== '''Arbeitshypothese''' ====
Line 3,151: Line 3,615:
 
Darunter versteht man eine genau festzulegende Annahme, von der man zu Beginn eines Forschungsprojektes ausgeht. Siehe auch ''Nullhypothese''.
 
Darunter versteht man eine genau festzulegende Annahme, von der man zu Beginn eines Forschungsprojektes ausgeht. Siehe auch ''Nullhypothese''.
  
=== '''Arithmetisches Mittel''' (oder Durchschnitt/-swert) ===
+
==== '''Arithmetisches Mittel''' (oder Durchschnitt/-swert) ====
  
 
Das am häufigsten verwendete Lagemaß, welches den Durchschnittswert (Summe aller Werte dividiert durch ihre Anzahl) einer Variablen zeigt. Es sollte nur bei ''metrischen'' Variablen eingesetzt werden.
 
Das am häufigsten verwendete Lagemaß, welches den Durchschnittswert (Summe aller Werte dividiert durch ihre Anzahl) einer Variablen zeigt. Es sollte nur bei ''metrischen'' Variablen eingesetzt werden.
Line 3,163: Line 3,627:
 
Darunter versteht man einen extrem großen oder extrem kleinen Wert, welcher weit von den restlichen Einträgen entfernt ist. Dies könnte z.B. der Fall beim Einkommen eines Millionärs sein, welcher in einem sehr armen Dorf lebt.
 
Darunter versteht man einen extrem großen oder extrem kleinen Wert, welcher weit von den restlichen Einträgen entfernt ist. Dies könnte z.B. der Fall beim Einkommen eines Millionärs sein, welcher in einem sehr armen Dorf lebt.
  
=== '''Balkendiagramm''' (auch Säulen- oder Blockdiagramm) ===
+
==== '''Balkendiagramm''' (auch Säulen- oder Blockdiagramm) ====
  
 
Dabei handelt es sich um Diagramme, bei welchen die Größe der Werte mit der Länge von Balken bzw. Säulen ausgedrückt werden. Werden die Werte (oft Häufigkeiten) senkrecht aufgetragen, spricht man in engerer Terminologie von Säulendiagrammen, werden sie waagrecht aufgetragen, von Balkendiagrammen.
 
Dabei handelt es sich um Diagramme, bei welchen die Größe der Werte mit der Länge von Balken bzw. Säulen ausgedrückt werden. Werden die Werte (oft Häufigkeiten) senkrecht aufgetragen, spricht man in engerer Terminologie von Säulendiagrammen, werden sie waagrecht aufgetragen, von Balkendiagrammen.
  
=== '''Bestimmtheitsmaß''' (auch Determinationskoeffizient) ===
+
==== '''Bestimmtheitsmaß''' (auch Determinationskoeffizient) ====
  
Das Bestimmtheitsmaß ist ein Maß für den Zusammenhang zwischen zwei Variablen und entspricht dem Quadrat des Korrelationskoeffizienten ''r.'' Es gibt an, in welchem Ausmaß die Varianz der einen Variablen durch die Varianz der anderen Variablen bestimmt wird. Siehe auch: '''Bestimmtheitsmaß (Wikipedia)[2]'''.
+
Das Bestimmtheitsmaß ist ein Maß für den Zusammenhang zwischen zwei Variablen und entspricht dem Quadrat des Korrelationskoeffizienten ''r.'' Es gibt an, in welchem Ausmaß die Varianz der einen Variablen durch die Varianz der anderen Variablen bestimmt wird. Siehe auch: '''Bestimmtheitsmaß (Wikipedia)[http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F &#91;2&#93;]'''.
  
 
==== '''Beta-Fehler''' ====
 
==== '''Beta-Fehler''' ====
Line 3,185: Line 3,649:
 
==== '''bivariat''' ====
 
==== '''bivariat''' ====
  
Bivariat bezeichnet, dass von den Betrachtungen gleichzeitig zwei Variablen betroffen sind. Siehe z.B. die '''bivariate Häufigkeitsverteilung[3]'''.
+
Bivariat bezeichnet, dass von den Betrachtungen gleichzeitig zwei Variablen betroffen sind. Siehe z.B. die '''bivariate Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3]]]'''.
  
 
==== '''Blockbildung''' ====
 
==== '''Blockbildung''' ====
  
Unter Blockbildung, auch ''Clusterbildung'' genannt, versteht man die Zusammenfassung von Elementen der Untersuchung, welche wesentliche für die Untersuchung relevante Eigenschaften gemeinsam haben, zu Blöcken oder Clustern. SPSS ermöglicht es, derartige Cluster mithilfe der Clusteranalyse zu ermitteln. Der Vorteil der Clusterbildung liegt darin, dass durch die Schaffung größerer Einheiten sinkt auch die Fehlerwahrscheinlichkeit von Aussagen. Siehe zur Clusteranalyse: '''Clusteranalyse (Wikipedia)[4]'''.
+
Unter Blockbildung, auch ''Clusterbildung'' genannt, versteht man die Zusammenfassung von Elementen der Untersuchung, welche wesentliche für die Untersuchung relevante Eigenschaften gemeinsam haben, zu Blöcken oder Clustern. SPSS ermöglicht es, derartige Cluster mithilfe der Clusteranalyse zu ermitteln. Der Vorteil der Clusterbildung liegt darin, dass durch die Schaffung größerer Einheiten sinkt auch die Fehlerwahrscheinlichkeit von Aussagen. Siehe zur Clusteranalyse: '''Clusteranalyse (Wikipedia)[http://de.wikipedia.org/wiki/Clusteranalyse &#91;4&#93;]'''.
  
 
==== '''Blockdiagramm''' ====
 
==== '''Blockdiagramm''' ====
  
Siehe '''Balkendiagramm[5]'''.
+
Siehe '''Balkendiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5]]]'''.
  
 
==== '''Boxplot''' ====
 
==== '''Boxplot''' ====
  
Unter Boxplots versteht man eine graphische Darstellung der Lage und der Verteilung stetiger Merkmale beruhend auf den empirischen Quartilen. Der Abstand zwischen dem 1. und dem 3. Quartil wird als ein Rechteck dargestellt, in welchem durch einen waagrechten Strich auch der Median verzeichnet ist. Siehe wegen weiterer Eigenheiten dazu auch: '''Vergleichende grafische Darstellung[6]''' von Streuung und Lage mit Box-Plots.
+
Unter Boxplots versteht man eine graphische Darstellung der Lage und der Verteilung stetiger Merkmale beruhend auf den empirischen Quartilen. Der Abstand zwischen dem 1. und dem 3. Quartil wird als ein Rechteck dargestellt, in welchem durch einen waagrechten Strich auch der Median verzeichnet ist. Siehe wegen weiterer Eigenheiten dazu auch: '''Vergleichende grafische Darstellung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6]]]''' von Streuung und Lage mit Box-Plots.
  
 
==== '''Chi-Quadrat-Test''' ====
 
==== '''Chi-Quadrat-Test''' ====
  
Der Chi-Quadrat-Test ist ein statistisches Verfahren, um die Unabhängigkeit von zwei Merkmalen zu überprüfen. Er wird besonders gerne bei der '''Kreuztabellen-Analyse[7]''' eingesetzt. Siehe dazu auch: '''Chi-Quadrat-Test (Wikipedia)[8]'''.
+
Der Chi-Quadrat-Test ist ein statistisches Verfahren, um die Unabhängigkeit von zwei Merkmalen zu überprüfen. Er wird besonders gerne bei der '''Kreuztabellen-Analyse[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7]]]''' eingesetzt. Siehe dazu auch: '''Chi-Quadrat-Test (Wikipedia)[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;8&#93;]'''.
  
 
==== '''Clusterbildung''' ====
 
==== '''Clusterbildung''' ====
Line 3,209: Line 3,673:
 
==== '''Codeplan''' ====
 
==== '''Codeplan''' ====
  
Darunter versteht man die schriftliche Zusammenfassung der Umsetzung der erhobenen Daten in numerische Werte, welche von den Statistik- Programmen zur Analyse benötigt werden. Siehe auch: '''vom Fragebogen zum Codeplan[9]'''.
+
Darunter versteht man die schriftliche Zusammenfassung der Umsetzung der erhobenen Daten in numerische Werte, welche von den Statistik- Programmen zur Analyse benötigt werden. Siehe auch: '''vom Fragebogen zum Codeplan[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9]]]'''.
  
 
==== '''Codieren''' ====
 
==== '''Codieren''' ====
Line 3,218: Line 3,682:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Induktive_Statistik<br />
+
[http://de.wikipedia.org/wiki/Induktive_Statistik &#91;1&#93; http://de.wikipedia.org/wiki/Induktive_Statistik]<br />
[2] http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F<br />
+
[http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F &#91;2&#93; http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3] Siehe Kapitel 3.5.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3] Siehe Kapitel 3.5.1]]<br />
[4] http://de.wikipedia.org/wiki/Clusteranalyse<br />
+
[http://de.wikipedia.org/wiki/Clusteranalyse &#91;4&#93; http://de.wikipedia.org/wiki/Clusteranalyse]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5] Siehe Kapitel 3.6.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5] Siehe Kapitel 3.6.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6] Siehe Kapitel 3.4.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6] Siehe Kapitel 3.4.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7] Siehe Kapitel 3.5.2.1.1]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7] Siehe Kapitel 3.5.2.1.1]]<br />
[8] http://de.wikipedia.org/wiki/Chi-Quadrat-Test<br />
+
[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;8&#93; http://de.wikipedia.org/wiki/Chi-Quadrat-Test]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9] Siehe Kapitel 2.2.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9] Siehe Kapitel 2.2.3]]<br />
 +
  
  
Line 3,251: Line 3,716:
 
Siehe ''Streuungsmaße''
 
Siehe ''Streuungsmaße''
  
=== '''Einseitige Hypothese''' (auch gerichtete Hypothese) ===
+
==== '''Einseitige Hypothese''' (auch gerichtete Hypothese) ====
  
 
E. H. sind Hypothesen, welche eine bestimmte Richtung eines Zusammenhangs annehmen. Man nimmt also nicht nur an, dass z.B. die Körpergröße mit der Schuhgröße korreliert, sondern genauer, dass mit steigender Körpergröße eine größere Schuhgröße einhergeht. (siehe auch ''zweiseitige Hypothese'').
 
E. H. sind Hypothesen, welche eine bestimmte Richtung eines Zusammenhangs annehmen. Man nimmt also nicht nur an, dass z.B. die Körpergröße mit der Schuhgröße korreliert, sondern genauer, dass mit steigender Körpergröße eine größere Schuhgröße einhergeht. (siehe auch ''zweiseitige Hypothese'').
  
=== '''Fehler 1. und 2. Art''' (auch Alpha- und Beta-Fehler) ===
+
==== '''Fehler 1. und 2. Art''' (auch Alpha- und Beta-Fehler) ====
  
 
In der Statistik arbeitet man mit Wahrscheinlichkeiten. Wir drücken dabei z.B. aus, dass unsere Nullhypothese bei einem ''Signifikanzniveau'' von 0,01 richtig ist, anders formuliert, bei einer ''Irrtumswahrscheinlichkeit'' von 1 %. Das bedeutet, dass in 1 % aller Fälle die Nullhypothese falsch sein wird, obwohl unsere Daten auf das gemessene Phänomen hindeuten. Das bezeichnet man als den ''Fehler der 1. Art ='' Die Nullhypothese stimmt nicht, obwohl unsere Daten die Nullhypothese bestätigen.
 
In der Statistik arbeitet man mit Wahrscheinlichkeiten. Wir drücken dabei z.B. aus, dass unsere Nullhypothese bei einem ''Signifikanzniveau'' von 0,01 richtig ist, anders formuliert, bei einer ''Irrtumswahrscheinlichkeit'' von 1 %. Das bedeutet, dass in 1 % aller Fälle die Nullhypothese falsch sein wird, obwohl unsere Daten auf das gemessene Phänomen hindeuten. Das bezeichnet man als den ''Fehler der 1. Art ='' Die Nullhypothese stimmt nicht, obwohl unsere Daten die Nullhypothese bestätigen.
Line 3,264: Line 3,729:
  
 
Das F. ist eine Diagrammform, bei welchem die Fläche zwischen Kurve und X- Achse durch Schraffierung oder Muster markiert wird.
 
Das F. ist eine Diagrammform, bei welchem die Fläche zwischen Kurve und X- Achse durch Schraffierung oder Muster markiert wird.
 +
  
  
 
= 5.3 G-I =
 
= 5.3 G-I =
  
=== '''Gaußsche Glockenkurve''' ''(auch Gaußverteilung'') ===
+
==== '''Gaußsche Glockenkurve''' ''(auch Gaußverteilung'') ====
  
 
siehe ''Normalverteilung''
 
siehe ''Normalverteilung''
Line 3,284: Line 3,750:
 
Bei einer g. St. wird die Grundgesamtheit in Gruppen oder Schichten eingeteilt (z.B. FleischesserInnen und VegetarierInnen oder Männer und Frauen; Kinder, Jugendliche, Erwachsene, ältere Menschen). Man wird in der Regel versuchen (s. ''Repräsentativität''), das in der Grundpopulation vorhandene Verhältnis der Gruppen in der Stichprobe nachzubilden. Man spricht dann von einer proportionalen Schichtung.
 
Bei einer g. St. wird die Grundgesamtheit in Gruppen oder Schichten eingeteilt (z.B. FleischesserInnen und VegetarierInnen oder Männer und Frauen; Kinder, Jugendliche, Erwachsene, ältere Menschen). Man wird in der Regel versuchen (s. ''Repräsentativität''), das in der Grundpopulation vorhandene Verhältnis der Gruppen in der Stichprobe nachzubilden. Man spricht dann von einer proportionalen Schichtung.
  
=== '''Grundgesamtheit''' (auch ''Grundpopulation'') ===
+
==== '''Grundgesamtheit''' (auch ''Grundpopulation'') ====
  
 
Unter G. versteht man die Gesamtheit der Elemente, für welche die Aussagen der Untersuchung gelten sollen. Sie muss genau festgelegt werden. Erhebt man die Einstellungen von WienerInnen gegenüber ZuwandererInnen, so muss festgelegt werden, wer mit WienerInnen gemeint ist (ab welchem Alter; bei welchem rechtlichen Status, bei welcher Aufenthaltsdauer in der Stadt etc.). Da eine ''Vollerhebung'' nur selten möglich ist, wählt man in der Regel eine ''Stichprobe'' aus.
 
Unter G. versteht man die Gesamtheit der Elemente, für welche die Aussagen der Untersuchung gelten sollen. Sie muss genau festgelegt werden. Erhebt man die Einstellungen von WienerInnen gegenüber ZuwandererInnen, so muss festgelegt werden, wer mit WienerInnen gemeint ist (ab welchem Alter; bei welchem rechtlichen Status, bei welcher Aufenthaltsdauer in der Stadt etc.). Da eine ''Vollerhebung'' nur selten möglich ist, wählt man in der Regel eine ''Stichprobe'' aus.
Line 3,306: Line 3,772:
 
==== '''Histogramm''' ====
 
==== '''Histogramm''' ====
  
Ein H. ermöglicht die graphische Darstellung der Häufigkeitsverteilung quantitativer Merkmale. Die Daten werden in Klassen eingeteilt und auf einer Grundlinie aufgetragen. Über jeder Klasse wird ein Rechteck gezeichnet. Die Höhe des Rechtecks wird durch seine Häufigkeit bestimmt. Siehe auch: '''Histogramme[1]'''.
+
Ein H. ermöglicht die graphische Darstellung der Häufigkeitsverteilung quantitativer Merkmale. Die Daten werden in Klassen eingeteilt und auf einer Grundlinie aufgetragen. Über jeder Klasse wird ein Rechteck gezeichnet. Die Höhe des Rechtecks wird durch seine Häufigkeit bestimmt. Siehe auch: '''Histogramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]'''.
  
 
==== '''Hypothese''' ====
 
==== '''Hypothese''' ====
Line 3,332: Line 3,798:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 +
  
  
Line 3,338: Line 3,805:
 
==== '''Klasse''' ====
 
==== '''Klasse''' ====
  
Unter einer K. versteht man eine Gruppe von Ausprägungen stetiger und diskreter Variablen, welche durch die Zusammenfassung benachbarter Werte entstehen. Eine Klasse wird von festgelegten Klassengrenzen begrenzt. Den Vorgang der Klassenbildung nennt man ''Klassierung oder Klassifikation''. Eine Klassierung wird in der Regel verwendet, um die Darstellung enorm differenzierter Ausprägungen übersichtlicher zu gestalten (z.B. Zusammenfassung aller Einkommen in 0-500 €; eine zweite Klasse Einkommen bis 1000 €; eine dritte Klasse zwischen 1001-1500 € usw.). Siehe auch: '''Klassenbildung von Daten[1]'''.
+
Unter einer K. versteht man eine Gruppe von Ausprägungen stetiger und diskreter Variablen, welche durch die Zusammenfassung benachbarter Werte entstehen. Eine Klasse wird von festgelegten Klassengrenzen begrenzt. Den Vorgang der Klassenbildung nennt man ''Klassierung oder Klassifikation''. Eine Klassierung wird in der Regel verwendet, um die Darstellung enorm differenzierter Ausprägungen übersichtlicher zu gestalten (z.B. Zusammenfassung aller Einkommen in 0-500 €; eine zweite Klasse Einkommen bis 1000 €; eine dritte Klasse zwischen 1001-1500 € usw.). Siehe auch: '''Klassenbildung von Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]'''.
  
=== '''Klassifizerung''' (auch ''Klassierung''). ===
+
==== '''Klassifizerung''' (auch ''Klassierung''). ====
  
 
Siehe ''Klasse.''
 
Siehe ''Klasse.''
  
=== '''Konfidenzinterall''' (auch ''Vertrauensintervall'') ===
+
==== '''Konfidenzinterall''' (auch ''Vertrauensintervall'') ====
  
Aus Stichproben erhaltene Maßzahlen sind immer nur Annäherungen an die zugrundeliegenden, aber meist unbekannten Werte in der Grundpopulation. Man ermittelt daher ''Konfidenzintervalle,'' innerhalb welchen Bereichs sich der ’richtige’ Wert befindet. Diese Konfidenzintervalle hängen vom gewählten ''Signifikanzniveau'' ab. Wir erleben die Angabe derartiger Konfidenzintervalle an jedem Wahlsonntag, wenn bei den ersten Analysen des wahrscheinlichen Wahlergebnisses der/die Statistikexperte/in sagt, dass die Partei A mit zwischen 34,8 und 36,2 % der Stimmen rechnen kann. Mit wachsender Stichprobengröße (Auszählungsgrad) wird das Konfidenzintervall kleiner, weil immer mehr mit der Grundpopulation übereinstimmend, bis es bei Vollauszählung verschwindet. Siehe auch: '''Konfidenzintervall (Wikipedia)[2]'''.
+
Aus Stichproben erhaltene Maßzahlen sind immer nur Annäherungen an die zugrundeliegenden, aber meist unbekannten Werte in der Grundpopulation. Man ermittelt daher ''Konfidenzintervalle,'' innerhalb welchen Bereichs sich der ’richtige’ Wert befindet. Diese Konfidenzintervalle hängen vom gewählten ''Signifikanzniveau'' ab. Wir erleben die Angabe derartiger Konfidenzintervalle an jedem Wahlsonntag, wenn bei den ersten Analysen des wahrscheinlichen Wahlergebnisses der/die Statistikexperte/in sagt, dass die Partei A mit zwischen 34,8 und 36,2 % der Stimmen rechnen kann. Mit wachsender Stichprobengröße (Auszählungsgrad) wird das Konfidenzintervall kleiner, weil immer mehr mit der Grundpopulation übereinstimmend, bis es bei Vollauszählung verschwindet. Siehe auch: '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;2&#93;]'''.
  
 
==== '''Kontingenztafel''' ====
 
==== '''Kontingenztafel''' ====
Line 3,354: Line 3,821:
 
==== '''Kontingenzkoeffizient''' ====
 
==== '''Kontingenzkoeffizient''' ====
  
Ein K. ist eine Kennzahl für die Stärke des Zusammenhangs zwischen nominalskalierten Daten. Siehe auch: '''Kontingenzkoeffizient (Wikipedia)[3]'''.
+
Ein K. ist eine Kennzahl für die Stärke des Zusammenhangs zwischen nominalskalierten Daten. Siehe auch: '''Kontingenzkoeffizient (Wikipedia)[http://de.wikipedia.org/wiki/Kontingenzkoeffizient &#91;3&#93;]'''.
  
 
==== '''Korrelation''' ====
 
==== '''Korrelation''' ====
  
Unter K. versteht man den Zusammenhang zwischen zwei quantitativen Merkmalen. Die Stärke des Zusammenhangs wird durch den ''Korrelationskoeffizient'' ausgedrückt. Siehe auch: die '''Korrelation[4]'''.
+
Unter K. versteht man den Zusammenhang zwischen zwei quantitativen Merkmalen. Die Stärke des Zusammenhangs wird durch den ''Korrelationskoeffizient'' ausgedrückt. Siehe auch: die '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4]]]'''.
  
 
==== '''Korrelationskoeffizient''' ====
 
==== '''Korrelationskoeffizient''' ====
Line 3,366: Line 3,833:
 
==== '''Kovarianz''' ====
 
==== '''Kovarianz''' ====
  
Die Kovarianz beschreibt den Zusammenhang zwischen zwei metrischen Merkmalen. Da sie nicht standardisiert ist, wird in der Regel statt ihr auf die von ihr abgeleitete ''Korrelation'' zurückgegriffen. Siehe auch: '''Kovarianz (Wikipedia)[5]'''.
+
Die Kovarianz beschreibt den Zusammenhang zwischen zwei metrischen Merkmalen. Da sie nicht standardisiert ist, wird in der Regel statt ihr auf die von ihr abgeleitete ''Korrelation'' zurückgegriffen. Siehe auch: '''Kovarianz (Wikipedia)[http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29 &#91;5&#93;]'''.
  
=== '''Kreisdiagramm''' (oder Tortendiagramm) ===
+
==== '''Kreisdiagramm''' (oder Tortendiagramm) ====
  
 
Das K. ist eine Diagrammform, welche sich besonders gut zur Darstellung von Anteilen vom Ganzen eignet. Häufigkeiten werden durch Kreissektoren wiedergegeben. Die Größe eines Tortenstücks entspricht dem relativen Anteil am Ganzen oder an 100 %.
 
Das K. ist eine Diagrammform, welche sich besonders gut zur Darstellung von Anteilen vom Ganzen eignet. Häufigkeiten werden durch Kreissektoren wiedergegeben. Die Größe eines Tortenstücks entspricht dem relativen Anteil am Ganzen oder an 100 %.
  
=== '''Kreuztabelle''' (auch Kontingenztabelle, -tafel) ===
+
==== '''Kreuztabelle''' (auch Kontingenztabelle, -tafel) ====
  
In einer K. stellt man die gemeinsame Häufigkeitsverteilung von zumindest zwei Variablen (nominal- oder ordinalskaliert) dar. Man versucht dabei, auffällige Unterschiede zwischen beobachteter Häufigkeit und der zu erwarteder Häufigkeit festzustellen und mittels des ''Chi-Quadrat-Tests'' wahrscheinliche Zusammenhänge zu überprüfen. Siehe auch: '''Kreuztabellen-Analyse[6]'''.
+
In einer K. stellt man die gemeinsame Häufigkeitsverteilung von zumindest zwei Variablen (nominal- oder ordinalskaliert) dar. Man versucht dabei, auffällige Unterschiede zwischen beobachteter Häufigkeit und der zu erwarteder Häufigkeit festzustellen und mittels des ''Chi-Quadrat-Tests'' wahrscheinliche Zusammenhänge zu überprüfen. Siehe auch: '''Kreuztabellen-Analyse[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6]]]'''.
  
=== '''Kumulative Häufigkeit''' (auch ''kumulierte H.'') ===
+
==== '''Kumulative Häufigkeit''' (auch ''kumulierte H.'') ====
  
 
siehe ''Häufigkeit''
 
siehe ''Häufigkeit''
  
=== '''Lagemaße''' (auch ''Zentralwerte'' oder ''Maße der zentralen Tendenz)'' ===
+
==== '''Lagemaße''' (auch ''Zentralwerte'' oder ''Maße der zentralen Tendenz)'' ====
  
Mit L. kann man den Schwerpunkt der Ausprägungen quantitativer Variabler zeigen.Die gebräuchlichsten Lagemaße sind das ''arithmetische Mittelt'', der Median und der Modalwert. Siehe auch: '''Mittelwerte[7]'''.
+
Mit L. kann man den Schwerpunkt der Ausprägungen quantitativer Variabler zeigen.Die gebräuchlichsten Lagemaße sind das ''arithmetische Mittelt'', der Median und der Modalwert. Siehe auch: '''Mittelwerte[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7]]]'''.
  
=== '''Liniendiagramm''' (auch ''Kurvendiagramm'') ===
+
==== '''Liniendiagramm''' (auch ''Kurvendiagramm'') ====
  
Man verwendet L., um den zeitlichen Verlauf von Entwicklungen zu zeigen. Siehe auch: '''Liniendiagramme[8]'''.
+
Man verwendet L., um den zeitlichen Verlauf von Entwicklungen zu zeigen. Siehe auch: '''Liniendiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|[8]]]'''.
  
 
==== '''Maßzahlen''' ====
 
==== '''Maßzahlen''' ====
Line 3,392: Line 3,859:
 
M. zeigen charakteristische Eigenheiten quantitativer Variabler. Man unterscheidet ''Lagemaße'' und ''Streuungsmaße''.
 
M. zeigen charakteristische Eigenheiten quantitativer Variabler. Man unterscheidet ''Lagemaße'' und ''Streuungsmaße''.
  
=== '''Median''' (auch ''Zentralwert'') ===
+
==== '''Median''' (auch ''Zentralwert'') ====
  
 
Der Median kann bei mindestens ordinalskalierten Daten eingesetzt werden und bezeichnet jenes Element, welches in einer geordneten Reihe genau in der Mitte liegt. D.h. dass es oberhalb von ihm genauso viele (größere) Einträge wie unterhalb von ihm gibt.
 
Der Median kann bei mindestens ordinalskalierten Daten eingesetzt werden und bezeichnet jenes Element, welches in einer geordneten Reihe genau in der Mitte liegt. D.h. dass es oberhalb von ihm genauso viele (größere) Einträge wie unterhalb von ihm gibt.
Line 3,398: Line 3,865:
 
Der Median eignet sich besonders gut, wenn ''Ausreißer'' das ''arithmetische Mittel'' verzerren.
 
Der Median eignet sich besonders gut, wenn ''Ausreißer'' das ''arithmetische Mittel'' verzerren.
  
=== '''Merkmal''' (auch Variable) ===
+
==== '''Merkmal''' (auch Variable) ====
  
 
Unter einem M. versteht man Eigenheiten des Untersuchungsobjekts, deren Ausprägungen variieren können (im Gegensatz zu ''Konstanten'').
 
Unter einem M. versteht man Eigenheiten des Untersuchungsobjekts, deren Ausprägungen variieren können (im Gegensatz zu ''Konstanten'').
  
=== '''Messniveau''' (auch ''Skalenniveau'') ===
+
==== '''Messniveau''' (auch ''Skalenniveau'') ====
  
 
Unter ''Messen'' versteht man im weitesten Sinne die Zuordnung von Zahlen zu Beobachtung. Anhand des Messniveaus legt man fest, welche Interpretationen unterschiedlicher Ausprägungen sinnvoll sind, welche Verfahren angewendet werden dürfen. Es gibt vier Messniveaus: Nominal-, Ordinal-, Intervall- und Ratioskala. Die beiden ersten beziehen sich auf ''nicht metrische Variablen'', die beiden letzten auf ''metrische Variablen.''
 
Unter ''Messen'' versteht man im weitesten Sinne die Zuordnung von Zahlen zu Beobachtung. Anhand des Messniveaus legt man fest, welche Interpretationen unterschiedlicher Ausprägungen sinnvoll sind, welche Verfahren angewendet werden dürfen. Es gibt vier Messniveaus: Nominal-, Ordinal-, Intervall- und Ratioskala. Die beiden ersten beziehen sich auf ''nicht metrische Variablen'', die beiden letzten auf ''metrische Variablen.''
Line 3,416: Line 3,883:
 
==== '''Mittel''' ====
 
==== '''Mittel''' ====
  
Sammelbegriff für verschiedene Lagemaße, wie z.B. das ''arithmetische Mittel'', das '''''harmonische Mittel''[9]''', das '''''geometrische Mittel''[10]'''.
+
Sammelbegriff für verschiedene Lagemaße, wie z.B. das ''arithmetische Mittel'', das '''''harmonische Mittel''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9]]]''', das '''''geometrische Mittel''[10]'''.
  
=== '''Mittelwert''' (auch ''Arithmetisches Mittel'') ===
+
==== '''Mittelwert''' (auch ''Arithmetisches Mittel'') ====
  
 
Der M. eines metrischen Merkmals ist ein ''Lagemaß'' und entspricht der Summe aller Werte geteilt durch deren Anzahl.
 
Der M. eines metrischen Merkmals ist ein ''Lagemaß'' und entspricht der Summe aller Werte geteilt durch deren Anzahl.
  
=== '''Modalwert''' (auch Modus) ===
+
==== '''Modalwert''' (auch Modus) ====
  
 
Der M. ist ein ''Lagemaß''. Er bezeichnet den am häufigsten vorkommenden Wert.
 
Der M. ist ein ''Lagemaß''. Er bezeichnet den am häufigsten vorkommenden Wert.
  
=== '''Modus''' (siehe ''Modalwert'') ===
+
==== '''Modus''' (siehe ''Modalwert'') ====
  
=== '''Multivariate Verfahren''' (oder ''m. Analyse'') ===
+
==== '''Multivariate Verfahren''' (oder ''m. Analyse'') ====
  
Unter M. V. versteht man Verfahren, bei welchen mindestens drei Variablen und deren Wechselbeziehungen analysiert werden. Siehe auch: '''Multivariate Analyse (Wikipedia)[11]'''.
+
Unter M. V. versteht man Verfahren, bei welchen mindestens drei Variablen und deren Wechselbeziehungen analysiert werden. Siehe auch: '''Multivariate Analyse (Wikipedia)[http://de.wikipedia.org/wiki/Multivariate_Analyse &#91;11&#93;]'''.
  
  
Line 3,436: Line 3,903:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
[2] http://de.wikipedia.org/wiki/Konfidenzintervall<br />
+
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;2&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
[3] http://de.wikipedia.org/wiki/Kontingenzkoeffizient<br />
+
[http://de.wikipedia.org/wiki/Kontingenzkoeffizient &#91;3&#93; http://de.wikipedia.org/wiki/Kontingenzkoeffizient]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4] Siehe Kapitel 3.5.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4] Siehe Kapitel 3.5.3]]<br />
[5] http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29<br />
+
[http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29 &#91;5&#93; http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6] Siehe Kapitel 3.5.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6] Siehe Kapitel 3.5.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7] Siehe Kapitel 3.3]]<br />
Line 3,445: Line 3,912:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9] Siehe Kapitel 3.3.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9] Siehe Kapitel 3.3.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[10] Siehe Kapitel 3.3.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[10] Siehe Kapitel 3.3.4]]<br />
[11] http://de.wikipedia.org/wiki/Multivariate_Analyse<br />
+
[http://de.wikipedia.org/wiki/Multivariate_Analyse &#91;11&#93; http://de.wikipedia.org/wiki/Multivariate_Analyse]<br />
 +
 
  
  
 
= 5.5 N-P =
 
= 5.5 N-P =
  
=== '''Nichtparametrische Verfahren''' (auch ''parameterfreie Verfahren'') ===
+
==== '''Nichtparametrische Verfahren''' (auch ''parameterfreie Verfahren'') ====
  
Als N.T. werden alle statistischen Verfahren bezeichnet, welche nicht an bestimmte Verteilungsformen (wie der Normalverteilung) gebunden sind. Solche Tests sind z.B. der ''Chi-Quadrat-Test,'' der '''Wilcoxon-Test (Wikipedia)[1]''' und der '''Mann-Whitney (Wikipedia)[2]'''-Test.
+
Als N.T. werden alle statistischen Verfahren bezeichnet, welche nicht an bestimmte Verteilungsformen (wie der Normalverteilung) gebunden sind. Solche Tests sind z.B. der ''Chi-Quadrat-Test,'' der '''Wilcoxon-Test (Wikipedia)[http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest &#91;1&#93;]''' und der '''Mann-Whitney (Wikipedia)[http://de.wikipedia.org/wiki/Mann-Whitney-Test &#91;2&#93;]'''-Test.
  
 
==== '''nominal''' ====
 
==== '''nominal''' ====
  
Merkmale werden als ''nominal'' bezeichnet, wenn ihre Ausprägungen nicht sinnvoll oder ’natürlich’ gereiht werden können (wie z.B. Farben, Hobbies, Namen). Sie sind '''''nominalskaliert''[3]'''. Siehe ''Messniveau.''
+
Merkmale werden als ''nominal'' bezeichnet, wenn ihre Ausprägungen nicht sinnvoll oder ’natürlich’ gereiht werden können (wie z.B. Farben, Hobbies, Namen). Sie sind '''''nominalskaliert''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3]]]'''. Siehe ''Messniveau.''
  
=== '''Normalverteilung''' (auch Gaußverteilung) ===
+
==== '''Normalverteilung''' (auch Gaußverteilung) ====
  
Die N. in Form der ''Gaußschen Glockenkurve'' ist eine Verteilungsform mit folgenden Merkmalen: sie ist unimodal (hat nur einen Gipfel); der Gipfel befindet sich in der Mitte (d.h. die in der Mitte des Messspektrums auftretenden Ausprägungen kommen auch am häufigsten vor); sie sind symmetrisch (links wie rechts vom Mittelwert fallen die Häufigkeiten gleichmäßig ab); die Lagemaße wie ''Modalwert, Mittelwert'' und ''Median'' stimmen (fast) annähernd überein. Innerhalb des Bereichs Mittelwert ± der ''Standardabweichung s'' liegen ca. 68 % aller Messwerte. Siehe auch: '''Normalverteilung (Wikipedia)[4]'''.
+
Die N. in Form der ''Gaußschen Glockenkurve'' ist eine Verteilungsform mit folgenden Merkmalen: sie ist unimodal (hat nur einen Gipfel); der Gipfel befindet sich in der Mitte (d.h. die in der Mitte des Messspektrums auftretenden Ausprägungen kommen auch am häufigsten vor); sie sind symmetrisch (links wie rechts vom Mittelwert fallen die Häufigkeiten gleichmäßig ab); die Lagemaße wie ''Modalwert, Mittelwert'' und ''Median'' stimmen (fast) annähernd überein. Innerhalb des Bereichs Mittelwert ± der ''Standardabweichung s'' liegen ca. 68 % aller Messwerte. Siehe auch: '''Normalverteilung (Wikipedia)[http://de.wikipedia.org/wiki/Normalverteilung &#91;4&#93;]'''.
  
 
==== '''Nullhypothese''' ====
 
==== '''Nullhypothese''' ====
Line 3,490: Line 3,958:
 
Gesamtmenge aller Beobachtungseinheiten
 
Gesamtmenge aller Beobachtungseinheiten
  
=== '''p-Wert''' (auch Überschreitungswahrscheinlichkeit) ===
+
==== '''p-Wert''' (auch Überschreitungswahrscheinlichkeit) ====
  
 
Der p. Wert (Kurzform von ''probability'') gibt bei statistischen Tests die Wahrscheinlichkeit an, mit welcher eine gefundene Kennzahl rein zufällig auftreten könnte. Man legt vor der Durchführung eines Tests ein Signifikanzniveau fest, z.B. p= 0,05. Ergibt sich ein p-Wert von kleiner als 0,05, dann ist die Nullhypothese mit einer ''Irrtumswahrscheinlichkeit'' von kleiner als 5 % zu verwerfen.
 
Der p. Wert (Kurzform von ''probability'') gibt bei statistischen Tests die Wahrscheinlichkeit an, mit welcher eine gefundene Kennzahl rein zufällig auftreten könnte. Man legt vor der Durchführung eines Tests ein Signifikanzniveau fest, z.B. p= 0,05. Ergibt sich ein p-Wert von kleiner als 0,05, dann ist die Nullhypothese mit einer ''Irrtumswahrscheinlichkeit'' von kleiner als 5 % zu verwerfen.
Line 3,502: Line 3,970:
 
Unter p. V. versteht man statistische Tests, welche das Vorliegen einer bestimmten Verteilungsform mit den dafür typischen Parametern erfordern. Besonders häufig wird die Normalverteilung als Grundbedingung gesehen.
 
Unter p. V. versteht man statistische Tests, welche das Vorliegen einer bestimmten Verteilungsform mit den dafür typischen Parametern erfordern. Besonders häufig wird die Normalverteilung als Grundbedingung gesehen.
  
=== '''Partielle Korrelation''' (auch Partialkorrelation) ===
+
==== '''Partielle Korrelation''' (auch Partialkorrelation) ====
  
Eine P.K. ist das Ausmaß des Zusammenhangs (''Korrelation'') zwischen zwei Variablen, wobei gleichzeitig versucht wird, den Einfluss einer dritten Variablen auf diesen Zusammenhang herauszurechnen. Siehe auch: '''Scheinkorrelation und Störvariable[5]'''.
+
Eine P.K. ist das Ausmaß des Zusammenhangs (''Korrelation'') zwischen zwei Variablen, wobei gleichzeitig versucht wird, den Einfluss einer dritten Variablen auf diesen Zusammenhang herauszurechnen. Siehe auch: '''Scheinkorrelation und Störvariable[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5]]]'''.
  
 
==== '''Pearson’scher Korrelationskoeffizient''' ====
 
==== '''Pearson’scher Korrelationskoeffizient''' ====
Line 3,514: Line 3,982:
 
Siehe ''Quantil''
 
Siehe ''Quantil''
  
=== '''Proportionalskala''' (auch Verhältnisskala) ===
+
==== '''Proportionalskala''' (auch Verhältnisskala) ====
  
 
Eine P. gehört zu den vier wesentlichen ''Messniveaus'' (''Messskalen'') und liegt dann vor, wenn bei numerischen Daten ein absoluter Nullpunkt vorliegt. Bei einer P. können nicht nur die Abstände zwischen Ausprägungen interpretiert werden, sondern auch ihr Verhältnis. So ist z.B. ein Baum von 3 Metern Höhe doppelt so hoch wie ein Baum von 1,5 Meter Höhe.
 
Eine P. gehört zu den vier wesentlichen ''Messniveaus'' (''Messskalen'') und liegt dann vor, wenn bei numerischen Daten ein absoluter Nullpunkt vorliegt. Bei einer P. können nicht nur die Abstände zwischen Ausprägungen interpretiert werden, sondern auch ihr Verhältnis. So ist z.B. ein Baum von 3 Metern Höhe doppelt so hoch wie ein Baum von 1,5 Meter Höhe.
Line 3,526: Line 3,994:
 
Unter einem P. versteht man eine der Befragung der Stichprobe per Fragebogen vorausgehende Abtestung desselben durch Probeinterviews, um Schwächen im Vorfeld zu eliminieren. Man untersucht dabei z.B., ob die Fragen verständlich sind, wie sie interpretiert werden, ob alle Fragen zufriedenstellende Antworten bringen, ob die Befragten bereit sind, alle Fragen zu beantworten, ob die Befragten den Zeitaufwand für die Ausfüllung des Fragebogens akzeptieren etc.
 
Unter einem P. versteht man eine der Befragung der Stichprobe per Fragebogen vorausgehende Abtestung desselben durch Probeinterviews, um Schwächen im Vorfeld zu eliminieren. Man untersucht dabei z.B., ob die Fragen verständlich sind, wie sie interpretiert werden, ob alle Fragen zufriedenstellende Antworten bringen, ob die Befragten bereit sind, alle Fragen zu beantworten, ob die Befragten den Zeitaufwand für die Ausfüllung des Fragebogens akzeptieren etc.
  
=== '''Produkt-Moment-Korrelation''' (auch ''Pearson’scher Korrelationskoeffizient'') ===
+
==== '''Produkt-Moment-Korrelation''' (auch ''Pearson’scher Korrelationskoeffizient'') ====
  
Die ''P.M.''-''Korrelation'' ist eine Form der ''Korrelation'' und zeigt den Zusammenhang zwischen zwei standardisierten Variablen, die beide metrisch und normalverteilt sein müssen. Siehe auch: '''Maßkorrelation[6]'''.
+
Die ''P.M.''-''Korrelation'' ist eine Form der ''Korrelation'' und zeigt den Zusammenhang zwischen zwei standardisierten Variablen, die beide metrisch und normalverteilt sein müssen. Siehe auch: '''Maßkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6]]]'''.
  
 
==== '''Punktwolke''' ====
 
==== '''Punktwolke''' ====
Line 3,537: Line 4,005:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest<br />
+
[http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest &#91;1&#93; http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest]<br />
[2] http://de.wikipedia.org/wiki/Mann-Whitney-Test<br />
+
[http://de.wikipedia.org/wiki/Mann-Whitney-Test &#91;2&#93; http://de.wikipedia.org/wiki/Mann-Whitney-Test]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3] Siehe Kapitel 3.1.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3] Siehe Kapitel 3.1.2.2]]<br />
[4] http://de.wikipedia.org/wiki/Normalverteilung<br />
+
[http://de.wikipedia.org/wiki/Normalverteilung &#91;4&#93; http://de.wikipedia.org/wiki/Normalverteilung]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5] Siehe Kapitel 3.5.3.4.3]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5] Siehe Kapitel 3.5.3.4.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6] Siehe Kapitel 3.5.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6] Siehe Kapitel 3.5.3.1]]<br />
 +
  
  
Line 3,571: Line 4,040:
 
Siehe ''Interquartilabstand''
 
Siehe ''Interquartilabstand''
  
=== '''Range''' (auch Variationsweite, Spannweite) ===
+
==== '''Range''' (auch Variationsweite, Spannweite) ====
  
 
Unter R. versteht man den Abstand zwischen dem kleinsten und dem größten aufgetretenen Wert bei mindestens ordinalskalierten Daten. Die Range bei gemessenen Körpergrößen wäre demnach z.B. 2,18 m(größter Wert) - 1,54 m(kleinster Wert), also 64 cm.
 
Unter R. versteht man den Abstand zwischen dem kleinsten und dem größten aufgetretenen Wert bei mindestens ordinalskalierten Daten. Die Range bei gemessenen Körpergrößen wäre demnach z.B. 2,18 m(größter Wert) - 1,54 m(kleinster Wert), also 64 cm.
Line 3,577: Line 4,046:
 
==== '''Rangkorrelation''' ====
 
==== '''Rangkorrelation''' ====
  
Form der Korrelation, bei welcher nicht die Merkmalsausprägungen, sondern deren ''Rangzahlen'' verwendet werden. Dabei werden im wesentlichen zwei Verfahren verwendet, ''Spearman´s Rho'' und ''Kendall’s Tau''. Siehe auch: '''die Korrelation[1]'''.
+
Form der Korrelation, bei welcher nicht die Merkmalsausprägungen, sondern deren ''Rangzahlen'' verwendet werden. Dabei werden im wesentlichen zwei Verfahren verwendet, ''Spearman´s Rho'' und ''Kendall’s Tau''. Siehe auch: '''die Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]'''.
  
 
==== '''Rangzahlen''' ====
 
==== '''Rangzahlen''' ====
Line 3,585: Line 4,054:
 
==== '''Regression''' ====
 
==== '''Regression''' ====
  
Unter R. versteht man Verfahren, welche es erlauben, Werte einer anderen Variablen vorherzusagen, wenn der Wert einer bestimmten Variablen bekannt ist. Siehe auch: die '''Regression[2]'''.
+
Unter R. versteht man Verfahren, welche es erlauben, Werte einer anderen Variablen vorherzusagen, wenn der Wert einer bestimmten Variablen bekannt ist. Siehe auch: die '''Regression[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2]]]'''.
  
 
==== '''Relative Häufigkeit''' ====
 
==== '''Relative Häufigkeit''' ====
  
Während die ''absolute Häufigkeit'' einer Ausprägung anzeigt, wie oft dieser Wert insgesamt im Datensatz erscheint, gibt die r. H. an, wie hoch sein Anteil verglichen mit der Gesamtzahl der gültigen Einträge ist. Siehe auch: '''Häufigkeitstabelle[3]'''.
+
Während die ''absolute Häufigkeit'' einer Ausprägung anzeigt, wie oft dieser Wert insgesamt im Datensatz erscheint, gibt die r. H. an, wie hoch sein Anteil verglichen mit der Gesamtzahl der gültigen Einträge ist. Siehe auch: '''Häufigkeitstabelle[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3]]]'''.
  
=== '''Reliabiltität''' (auch Zuverlässigkeit) ===
+
==== '''Reliabiltität''' (auch Zuverlässigkeit) ====
  
 
R. ist eines der drei ''Gütekriterien'' bei ''Messungen.'' Dieses fordert, dass die Messinstrumente bei einer Wiederholung der Messung bei gleichbleibenden Bedingungen das gleiche Ergebnis erbringen sollten.
 
R. ist eines der drei ''Gütekriterien'' bei ''Messungen.'' Dieses fordert, dass die Messinstrumente bei einer Wiederholung der Messung bei gleichbleibenden Bedingungen das gleiche Ergebnis erbringen sollten.
  
Neben der Validität (Gültigkeit) das zweite zentrale Qualitätskriterium bei Messungen. Meint, dass Messinstrumente bei wiederholter Messung unter gleichen Bedingungen auch das gleiche Ergebnis produzieren müssen. Siehe auch: '''Reliabilität (Wikipedia)[4]'''.
+
Neben der Validität (Gültigkeit) das zweite zentrale Qualitätskriterium bei Messungen. Meint, dass Messinstrumente bei wiederholter Messung unter gleichen Bedingungen auch das gleiche Ergebnis produzieren müssen. Siehe auch: '''Reliabilität (Wikipedia)[http://de.wikipedia.org/wiki/Reliabilit%C3%A4t &#91;4&#93;]'''.
  
 
==== '''Repräsentativität''' ====
 
==== '''Repräsentativität''' ====
Line 3,615: Line 4,084:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2] Siehe Kapitel 3.5.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2] Siehe Kapitel 3.5.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3] Siehe Kapitel 3.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3] Siehe Kapitel 3.2.2]]<br />
[4] http://de.wikipedia.org/wiki/Reliabilit%C3%A4t<br />
+
[http://de.wikipedia.org/wiki/Reliabilit%C3%A4t &#91;4&#93; http://de.wikipedia.org/wiki/Reliabilit%C3%A4t]<br />
 +
 
  
  
Line 3,626: Line 4,096:
 
==== '''Schichtung''' ====
 
==== '''Schichtung''' ====
  
Unter Sch. versteht man eine Methode bei der Auswahl der Stichprobe. Die Grundpopulation wird in '''Schichten (Wikipedia)[1]''' zerlegt (in dieser gibt es z.B. 40 % Männer und 60 % Frauen; in dieser gibt es 26 % unter 25, 38 % zwischen 26- 50 und 36 % darüber). In der Stichprobe versucht man das Verhältnis dieser Schichten der Grundpopulation nachzubilden.
+
Unter Sch. versteht man eine Methode bei der Auswahl der Stichprobe. Die Grundpopulation wird in '''Schichten (Wikipedia)[http://de.wikipedia.org/wiki/Soziale_Schichtung &#91;1&#93;]''' zerlegt (in dieser gibt es z.B. 40 % Männer und 60 % Frauen; in dieser gibt es 26 % unter 25, 38 % zwischen 26- 50 und 36 % darüber). In der Stichprobe versucht man das Verhältnis dieser Schichten der Grundpopulation nachzubilden.
  
 
==== '''Schließende Statistik''' ====
 
==== '''Schließende Statistik''' ====
Line 3,638: Line 4,108:
 
==== '''Signifikanz''' ====
 
==== '''Signifikanz''' ====
  
Unter S. versteht man ein statistisch überprüftes Urteil über die Haltbarkeit einer ''Hypothese''. Da man nur selten eine ''Vollerhebung'' machen kann, ist ein Ergebnis einer Stichprobe stets vom Risiko begleitet, dass es vom Ergebnis der Grundpopulation abweichen könnte. Man überprüft daher die Wahrscheinlichkeit, dass ein gefundenes Ergebnis rein zufällig entstanden sein könnte. Als Maßstäbe nimmt man sogenannte ''Signifikanzniveaus,'' meist von 5 % oder p=0,05 oder 1 % oder p=0,01. Unterschreitet die erhaltene Wahrscheinlichkeit den letzten Wert, so könnte eine statische Aussage lauten: "Der Zusammenhang zwischen den Variablen A und B ist statistisch signifkant auf dem 1%-Niveau." Ein wichtiger Test zur Abschätzung der Signifikanz der Zusammenhänge in Kreuztabellen ist z.B. der ''Chi- Quadrat- Test.'' Siehe auch: '''Statistische Signifikanz (Wikipedia)[2]'''.
+
Unter S. versteht man ein statistisch überprüftes Urteil über die Haltbarkeit einer ''Hypothese''. Da man nur selten eine ''Vollerhebung'' machen kann, ist ein Ergebnis einer Stichprobe stets vom Risiko begleitet, dass es vom Ergebnis der Grundpopulation abweichen könnte. Man überprüft daher die Wahrscheinlichkeit, dass ein gefundenes Ergebnis rein zufällig entstanden sein könnte. Als Maßstäbe nimmt man sogenannte ''Signifikanzniveaus,'' meist von 5 % oder p=0,05 oder 1 % oder p=0,01. Unterschreitet die erhaltene Wahrscheinlichkeit den letzten Wert, so könnte eine statische Aussage lauten: "Der Zusammenhang zwischen den Variablen A und B ist statistisch signifkant auf dem 1%-Niveau." Ein wichtiger Test zur Abschätzung der Signifikanz der Zusammenhänge in Kreuztabellen ist z.B. der ''Chi- Quadrat- Test.'' Siehe auch: '''Statistische Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;2&#93;]'''.
  
 
==== '''Signifianzniveau''' ====
 
==== '''Signifianzniveau''' ====
Line 3,658: Line 4,128:
 
Siehe ''Range''.
 
Siehe ''Range''.
  
=== '''Spearman’s Rho''' (oder ''Spearmans Korrelationskoeffizient'') ===
+
==== '''Spearman’s Rho''' (oder ''Spearmans Korrelationskoeffizient'') ====
  
Falls zwei Merkmale ordinal verteilt sind, kann man den Rangkorrelationskoeffizienten R (oder ''Spearmans Rho)'' mithilfe einer ''Produkt- Moment-Korrelation'' der Rangplätze berechnen. Siehe auch: '''Rangkorrelation[3]''' .
+
Falls zwei Merkmale ordinal verteilt sind, kann man den Rangkorrelationskoeffizienten R (oder ''Spearmans Rho)'' mithilfe einer ''Produkt- Moment-Korrelation'' der Rangplätze berechnen. Siehe auch: '''Rangkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3]]]''' .
  
 
==== '''Stabdiagramm''' ====
 
==== '''Stabdiagramm''' ====
Line 3,668: Line 4,138:
 
==== '''Standardabweichung''' ====
 
==== '''Standardabweichung''' ====
  
Die St. ''s'' ist ein Kennwert, um die Variabilität (Streuung) eines Merkmals zu kennzeichnen. Sie wird als Wurzel aus der ''Varianz'' erreichnet. In einer Normalverteilung liegen im Bereich des ''Arithmetischen Mittels'' ± ''s'' ungefähr 68 % aller Ergebnisse. Siehe auch: '''Standardabweichung (Wikipedia)[4]'''.
+
Die St. ''s'' ist ein Kennwert, um die Variabilität (Streuung) eines Merkmals zu kennzeichnen. Sie wird als Wurzel aus der ''Varianz'' erreichnet. In einer Normalverteilung liegen im Bereich des ''Arithmetischen Mittels'' ± ''s'' ungefähr 68 % aller Ergebnisse. Siehe auch: '''Standardabweichung (Wikipedia)[http://de.wikipedia.org/wiki/Standardabweichung &#91;4&#93;]'''.
  
 
==== '''Standardisiertes Interview''' ====
 
==== '''Standardisiertes Interview''' ====
Line 3,682: Line 4,152:
 
Unter einer St. versteht man die Auswahl an Beobachtungseinheiten aus einer definierten (''Grund)Population''. Eine Stichprobe sollte diese Grundpopulation unverzerrt wiederspiegeln, z.B. durch das Modell der ''Repräsentativität''.
 
Unter einer St. versteht man die Auswahl an Beobachtungseinheiten aus einer definierten (''Grund)Population''. Eine Stichprobe sollte diese Grundpopulation unverzerrt wiederspiegeln, z.B. durch das Modell der ''Repräsentativität''.
  
=== '''Störvariable''' (oder ''Störgrößen'') ===
+
==== '''Störvariable''' (oder ''Störgrößen'') ====
  
 
Unter ''Störvariablen'' versteht man Variable, welche zusätzlich zu einer unabhängigen Variablen einen nicht einkalkulierten Einfluss auf eine abhängige Variable ausüben. Untersucht man z.B. den Zusammenhang zwischen Glatzenbildung und Einkommen, so wird man häufig auf eine höhere Korrelation kommen. Diese hängt mit einer nicht untersuchten Störvariable zusammen, nämlich dem Alter, mit dem sowohl Glatzenbildung wie auch Einkommen normalerweise hoch korrelieren.
 
Unter ''Störvariablen'' versteht man Variable, welche zusätzlich zu einer unabhängigen Variablen einen nicht einkalkulierten Einfluss auf eine abhängige Variable ausüben. Untersucht man z.B. den Zusammenhang zwischen Glatzenbildung und Einkommen, so wird man häufig auf eine höhere Korrelation kommen. Diese hängt mit einer nicht untersuchten Störvariable zusammen, nämlich dem Alter, mit dem sowohl Glatzenbildung wie auch Einkommen normalerweise hoch korrelieren.
Line 3,688: Line 4,158:
 
Die Existenz von Störvariablen ist besonders bei der Untersuchung von Korrelationen kritisch zu untersuchen.
 
Die Existenz von Störvariablen ist besonders bei der Untersuchung von Korrelationen kritisch zu untersuchen.
  
=== '''Streudiagramm''' (auch ''Scatterplot'') ===
+
==== '''Streudiagramm''' (auch ''Scatterplot'') ====
  
 
Ein St. zeigt graphisch den Zusammenhang zwischen zwei stetigen Merkmalen, wobei eine ''Punktwolke'' aus den Schnittpunkten der jeweiligen Ausprägungen der Variablen X und Y gebildet wird. ''Streudiagramme'' bieten eine gute Abschätzmöglichkeit für mögliche ''Korrelationen''.
 
Ein St. zeigt graphisch den Zusammenhang zwischen zwei stetigen Merkmalen, wobei eine ''Punktwolke'' aus den Schnittpunkten der jeweiligen Ausprägungen der Variablen X und Y gebildet wird. ''Streudiagramme'' bieten eine gute Abschätzmöglichkeit für mögliche ''Korrelationen''.
  
=== '''Streuungsmaße''' (auch Dispersionsmaße) ===
+
==== '''Streuungsmaße''' (auch Dispersionsmaße) ====
  
 
Streuungsmaße geben an, in welchen Bereichen die Daten liegen bzw. um die Lagemaße ''streuen''. Sie sind Kennwerte zur Charakterisierung einer Verteilung. Sie sind Indikatioren für die Variabilität von Merkmalen, wie z.B. von deren Abstand zum ''Arithmetischen Mittel''. Wichtige Streuungsmaße sind die ''Standardabweichung,'' die ''Varianz'' oder der ''Quartilabstand.''
 
Streuungsmaße geben an, in welchen Bereichen die Daten liegen bzw. um die Lagemaße ''streuen''. Sie sind Kennwerte zur Charakterisierung einer Verteilung. Sie sind Indikatioren für die Variabilität von Merkmalen, wie z.B. von deren Abstand zum ''Arithmetischen Mittel''. Wichtige Streuungsmaße sind die ''Standardabweichung,'' die ''Varianz'' oder der ''Quartilabstand.''
  
=== '''Tau''' (auch Kendall’s Tau) ===
+
==== '''Tau''' (auch Kendall’s Tau) ====
  
Form der Korrelation. Maß für den Zusammenhang zwischen ordinalskalierten Daten, besonders bei kleinen Zahlen. Siehe auch: '''Rangkorrelation Tau[5]'''.
+
Form der Korrelation. Maß für den Zusammenhang zwischen ordinalskalierten Daten, besonders bei kleinen Zahlen. Siehe auch: '''Rangkorrelation Tau[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5]]]'''.
  
 
==== '''Tortendiagramm''' ====
 
==== '''Tortendiagramm''' ====
Line 3,707: Line 4,177:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Soziale_Schichtung<br />
+
[http://de.wikipedia.org/wiki/Soziale_Schichtung &#91;1&#93; http://de.wikipedia.org/wiki/Soziale_Schichtung]<br />
[2] http://de.wikipedia.org/wiki/Statistische_Signifikanz<br />
+
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;2&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3] Siehe Kapitel 3.5.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3] Siehe Kapitel 3.5.3.2]]<br />
[4] http://de.wikipedia.org/wiki/Standardabweichung<br />
+
[http://de.wikipedia.org/wiki/Standardabweichung &#91;4&#93; http://de.wikipedia.org/wiki/Standardabweichung]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5] Siehe Kapitel 3.5.3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5] Siehe Kapitel 3.5.3.3]]<br />
 +
  
  
Line 3,726: Line 4,197:
 
==== '''Urliste''' ====
 
==== '''Urliste''' ====
  
Die U. ist die ungeordnete Zusammenstellung des Datenmaterials. Siehe auch: '''Listen und Tafeln[1]'''.
+
Die U. ist die ungeordnete Zusammenstellung des Datenmaterials. Siehe auch: '''Listen und Tafeln[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1]]]'''.
  
=== '''Validität''' (auch Gültigkeit) ===
+
==== '''Validität''' (auch Gültigkeit) ====
  
Die V. gehört zu den sogenannten ''Gütekriterien'' für die Qualität einer Datenerhebung. Sie bezeichnet die Eigenschaft, wirklich das zu messen, was bei der Untersuchung gemessen werden soll. Wenn z.B. die Fragen eines Fragebogens nur ungenügend geeignet sind, die Hypothesen zu überprüfen, dann ist die Validität in Frage gestellt. Siehe auch: '''Validität (Wikipedia)[2]'''.
+
Die V. gehört zu den sogenannten ''Gütekriterien'' für die Qualität einer Datenerhebung. Sie bezeichnet die Eigenschaft, wirklich das zu messen, was bei der Untersuchung gemessen werden soll. Wenn z.B. die Fragen eines Fragebogens nur ungenügend geeignet sind, die Hypothesen zu überprüfen, dann ist die Validität in Frage gestellt. Siehe auch: '''Validität (Wikipedia)[http://de.wikipedia.org/wiki/Validit%C3%A4t &#91;2&#93;]'''.
  
 
==== '''Variable''' ====
 
==== '''Variable''' ====
Line 3,736: Line 4,207:
 
Eine Variable ist ein in verschiedenen Ausprägungen vorhandenes Merkmal eines Untersuchungsgegenstandes: z.B. Geschlecht: männlich/weiblich; Größe gemessen in cm.
 
Eine Variable ist ein in verschiedenen Ausprägungen vorhandenes Merkmal eines Untersuchungsgegenstandes: z.B. Geschlecht: männlich/weiblich; Größe gemessen in cm.
  
=== '''Variationsweite''' (siehe Range). ===
+
==== '''Variationsweite''' (siehe Range). ====
  
 
==== '''Varianz''' ====
 
==== '''Varianz''' ====
  
Die V. ist ein Maß für die Variabilität bzw. die Streuung der Ausprägungen von Variablen und Ausgangswert für die ''Standardabweichung''. Siehe auch: '''Varianz (Wikipedia)[3]'''.
+
Die V. ist ein Maß für die Variabilität bzw. die Streuung der Ausprägungen von Variablen und Ausgangswert für die ''Standardabweichung''. Siehe auch: '''Varianz (Wikipedia)[http://de.wikipedia.org/wiki/Varianz &#91;3&#93;]'''.
  
 
==== '''Verhältnisskala''' ====
 
==== '''Verhältnisskala''' ====
Line 3,750: Line 4,221:
 
Siehe ''Häufigkeitsverteilung''
 
Siehe ''Häufigkeitsverteilung''
  
=== '''Vertrauensintervall''' (auch ''Konfidenzintervall'') ===
+
==== '''Vertrauensintervall''' (auch ''Konfidenzintervall'') ====
  
 
Siehe ''Konfidenzintervall''
 
Siehe ''Konfidenzintervall''
  
=== '''Vierfeldertafel''' (Form der ''Kreuztabelle'') ===
+
==== '''Vierfeldertafel''' (Form der ''Kreuztabelle'') ====
  
 
Eine V. ist die Anordnung zweier dichotomer Variablen in einer Tabelle mit zwei Spalten und zwei Zeilen, sodass jede Ausprägung jeder Variablen mit jeder Ausprägung der anderen gekreuzt wird.
 
Eine V. ist die Anordnung zweier dichotomer Variablen in einer Tabelle mit zwei Spalten und zwei Zeilen, sodass jede Ausprägung jeder Variablen mit jeder Ausprägung der anderen gekreuzt wird.
Line 3,764: Line 4,235:
 
==== '''Wahrscheinlichkeit''' ====
 
==== '''Wahrscheinlichkeit''' ====
  
Unter W. versteht man die Einstufung von Phänomenen nach dem Grade ihrer Gewissheit. Die W. ''p'' wird mit Werten zwischen ''0'' (Unmöglichkeit) und ''1'' (Sicherheit des Auftretens) wiedergegeben. Siehe auch: '''Wahrscheinlichkeit (Wikipedia)[4]'''.
+
Unter W. versteht man die Einstufung von Phänomenen nach dem Grade ihrer Gewissheit. Die W. ''p'' wird mit Werten zwischen ''0'' (Unmöglichkeit) und ''1'' (Sicherheit des Auftretens) wiedergegeben. Siehe auch: '''Wahrscheinlichkeit (Wikipedia)[http://de.wikipedia.org/wiki/Wahrscheinlichkeit &#91;4&#93;]'''.
  
 
==== '''Zentralwert''' ====
 
==== '''Zentralwert''' ====
Line 3,782: Line 4,253:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1] Siehe Kapitel 3.2.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1] Siehe Kapitel 3.2.1]]<br />
[2] http://de.wikipedia.org/wiki/Validit%C3%A4t<br />
+
[http://de.wikipedia.org/wiki/Validit%C3%A4t &#91;2&#93; http://de.wikipedia.org/wiki/Validit%C3%A4t]<br />
[3] http://de.wikipedia.org/wiki/Varianz<br />
+
[http://de.wikipedia.org/wiki/Varianz &#91;3&#93; http://de.wikipedia.org/wiki/Varianz]<br />
[4] http://de.wikipedia.org/wiki/Wahrscheinlichkeit<br />
+
[http://de.wikipedia.org/wiki/Wahrscheinlichkeit &#91;4&#93; http://de.wikipedia.org/wiki/Wahrscheinlichkeit]<br />
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#5. Lexikon statistischer Grundbegriffe|&uarr; Nach oben]]
  
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 6. Literatur, Ressourcen und Links =
 
= 6. Literatur, Ressourcen und Links =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
In diesem Bereich finden Sie Hinweise auf hochwertige Nachschlagswerke zu den angeschnittenen Bereichen sowie eine Selektion von Weblinks.
 
In diesem Bereich finden Sie Hinweise auf hochwertige Nachschlagswerke zu den angeschnittenen Bereichen sowie eine Selektion von Weblinks.
 +
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.1 Quantitative Forschungsmethoden|6.1 Quantitative Forschungsmethoden]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.2 Fragebogen-Abfrage|6.2 Fragebogen-Abfrage]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.3 Diagramme und Grafiken|6.3 Diagramme und Grafiken]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.3 Methoden|6.3 Methoden]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.4 Repräsentativität|6.4 Repräsentativität]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.5 Statistik-Software|6.5 Statistik-Software]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.6 Terminologie|6.6 Terminologie]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.7 Statistik-Quellen|6.7 Statistik-Quellen]]<br />
 +
</div>
  
  
Line 3,816: Line 4,314:
 
==== '''Weblinks:''' ====
 
==== '''Weblinks:''' ====
  
'''Basis-Statistik (FAES)[1]''', 05.02.2007.
+
'''Basis-Statistik (FAES)[http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html &#91;1&#93;]''', 05.02.2007.
  
'''HyperStat Online[2]''', 05.02.2007.
+
'''HyperStat Online[http://davidmlane.com/hyperstat/ &#91;2&#93;]''', 05.02.2007.
  
'''Help with Statistics (University of Leicester)[3]''', 21.11.2019.
+
'''Help with Statistics (University of Leicester)[https://www2.le.ac.uk/offices/ld/help-with/stats &#91;3&#93;]''', 21.11.2019.
  
Kromrey, Helmut. 1994. '''Empirische Sozialforschung[4]''', 21.11.2019.
+
Kromrey, Helmut. 1994. '''Empirische Sozialforschung[https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330 &#91;4&#93;]''', 21.11.2019.
  
Lohninger, H. '''Grundlagen der Statistik[5]''', 05.02.2007.
+
Lohninger, H. '''Grundlagen der Statistik[http://www.statistics4u.info/fundstat_germ/index_a.html &#91;5&#93;]''', 05.02.2007.
  
Neuwirth, Erich. 1997. '''Statistik für StatistikerInnen,[6]''' 05.02.2007.
+
Neuwirth, Erich. 1997. '''Statistik für StatistikerInnen,[http://tud.at/uni/stat1.htm &#91;6&#93;]''' 05.02.2007.
  
Rost, Jürgen. 2003. '''Zeitgeist und Moden empirischer Sozialforschung[7]'''. In Forum Qualitative Sozialforschung 4/2, 05.02.2007.
+
Rost, Jürgen. 2003. '''Zeitgeist und Moden empirischer Sozialforschung[http://www.qualitative-research.net/index.php/fqs/article/view/723 &#91;7&#93;]'''. In Forum Qualitative Sozialforschung 4/2, 05.02.2007.
  
'''Wahrscheinlichkeitstheorie und Statistik (Uni Osnabrück)[8]''', 21.11.2019.
+
'''Wahrscheinlichkeitstheorie und Statistik (Uni Osnabrück)[https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf &#91;8&#93;]''', 21.11.2019.
  
'''TU-Graz Statistik-Grundkurs[9]''', 05.02.2007.
+
'''TU-Graz Statistik-Grundkurs[http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm &#91;9&#93;]''', 05.02.2007.
  
<!-- https://de.serlo.org/mathe -->
+
--><!-- https://de.serlo.org/mathe --><!--
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html<br />
+
[http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html &#91;1&#93; http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html]<br />
[2] http://davidmlane.com/hyperstat/<br />
+
[http://davidmlane.com/hyperstat/ &#91;2&#93; http://davidmlane.com/hyperstat/]<br />
[3] https://www2.le.ac.uk/offices/ld/help-with/stats<br />
+
[https://www2.le.ac.uk/offices/ld/help-with/stats &#91;3&#93; https://www2.le.ac.uk/offices/ld/help-with/stats]<br />
[4] https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330<br />
+
[https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330 &#91;4&#93; https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330]<br />
[5] http://www.statistics4u.info/fundstat_germ/index_a.html<br />
+
[http://www.statistics4u.info/fundstat_germ/index_a.html &#91;5&#93; http://www.statistics4u.info/fundstat_germ/index_a.html]<br />
[6] http://tud.at/uni/stat1.htm<br />
+
[http://tud.at/uni/stat1.htm &#91;6&#93; http://tud.at/uni/stat1.htm]<br />
[7] http://www.qualitative-research.net/index.php/fqs/article/view/723<br />
+
[http://www.qualitative-research.net/index.php/fqs/article/view/723 &#91;7&#93; http://www.qualitative-research.net/index.php/fqs/article/view/723]<br />
[8] https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf<br />
+
[https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf &#91;8&#93; https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf]<br />
[9] http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm<br />
+
[http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm &#91;9&#93; http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm]<br />
 +
 
  
  
Line 3,862: Line 4,361:
 
==== '''Weblinks:''' ====
 
==== '''Weblinks:''' ====
  
Michael Vonrüden. 2002. '''Internetbasierte Umfragen[1]'''. (PDF-Dokument), 05.02.2007.
+
Michael Vonrüden. 2002. '''Internetbasierte Umfragen[http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf &#91;1&#93;]'''. (PDF-Dokument), 05.02.2007.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf<br />
+
[http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf &#91;1&#93; http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf]<br />
 +
 
  
  
Line 3,874: Line 4,374:
 
==== '''Korrelation und Regression''' ====
 
==== '''Korrelation und Regression''' ====
  
Die '''Korrelation[1]''' von Merkmalen. (PDF-Dokument), 05.02.2007.
+
Die '''Korrelation[http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf &#91;1&#93;]''' von Merkmalen. (PDF-Dokument), 05.02.2007.
  
Jörg '''Kovarianz und Korrelation[2]'''. In Psychologie-Seiten.de, 21.11.2019
+
Jörg '''Kovarianz und Korrelation[https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html &#91;2&#93;]'''. In Psychologie-Seiten.de, 21.11.2019
  
 
==== '''Verschiedene Methoden''' ====
 
==== '''Verschiedene Methoden''' ====
  
Berger, Klaus. Materialen für '''Mathe-Online[3]''', 05.02.2007.
+
Berger, Klaus. Materialen für '''Mathe-Online[http://www.mathe-online.at/materialien/klaus.berger/ &#91;3&#93;]''', 05.02.2007.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf<br />
+
[http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf &#91;1&#93; http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf]<br />
[2] https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html<br />
+
[https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html &#91;2&#93; https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html]<br />
[3] http://www.mathe-online.at/materialien/klaus.berger/<br />
+
[http://www.mathe-online.at/materialien/klaus.berger/ &#91;3&#93; http://www.mathe-online.at/materialien/klaus.berger/]<br />
 +
 
  
  
 
= 6.4 Repräsentativität =
 
= 6.4 Repräsentativität =
  
Höpflinger, François. 2011. '''Standardisierte Erhebungen - methodische Hinweise zu Umfragen[1]''', 21.11.2019.
+
Höpflinger, François. 2011. '''Standardisierte Erhebungen - methodische Hinweise zu Umfragen[http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf &#91;1&#93;]''', 21.11.2019.
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1]http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf<br />
+
[http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf &#91;1&#93; http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf]<br />
 +
 
  
  
Line 3,909: Line 4,411:
 
==== '''Links:''' ====
 
==== '''Links:''' ====
  
Ludwig-Mayerhofer, Wolfgang. '''Internet Guide to SPSS for Windows[1]''', 21.11.2019
+
Ludwig-Mayerhofer, Wolfgang. '''Internet Guide to SPSS for Windows[http://wlm.userweb.mwn.de/SPSS/ &#91;1&#93;]''', 21.11.2019
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://wlm.userweb.mwn.de/SPSS/<br />
+
[http://wlm.userweb.mwn.de/SPSS/ &#91;1&#93; http://wlm.userweb.mwn.de/SPSS/]<br />
 +
 
  
 
= 6.6 Terminologie =
 
= 6.6 Terminologie =
Line 3,919: Line 4,422:
 
==== '''Links zur Terminologie quantitativer Forschungsmethoden''' ====
 
==== '''Links zur Terminologie quantitativer Forschungsmethoden''' ====
  
FAES.DE. '''Basislexikon[1]''', 05.02.2007.
+
FAES.DE. '''Basislexikon[http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html &#91;1&#93;]''', 05.02.2007.
  
Lernstats. '''Glossar[2]''', 05.02.2007.
+
Lernstats. '''Glossar[http://www.lernstats.de/php/glossar.php?lang=de& &#91;2&#93;]''', 05.02.2007.
  
Ludwig-Mayerhofer, Wolfgang. '''Internet Lexikon der Empirischen Sozialforschung[3]''', 21.11.2019
+
Ludwig-Mayerhofer, Wolfgang. '''Internet Lexikon der Empirischen Sozialforschung[http://wlm.userweb.mwn.de/Ilmes/ &#91;3&#93;]''', 21.11.2019
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html<br />
+
[http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html &#91;1&#93; http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html]<br />
[2] http://www.lernstats.de/php/glossar.php?lang=de&<br />
+
[http://www.lernstats.de/php/glossar.php?lang=de& &#91;2&#93; http://www.lernstats.de/php/glossar.php?lang=de&]<br />
[3] http://wlm.userweb.mwn.de/Ilmes/<br />
+
[http://wlm.userweb.mwn.de/Ilmes/ &#91;3&#93; http://wlm.userweb.mwn.de/Ilmes/]<br />
 +
 
  
  
Line 3,937: Line 4,441:
 
Hier finden Sie die Webseiten verschiedener Institutionen, die laufend Statistiken erstellen:
 
Hier finden Sie die Webseiten verschiedener Institutionen, die laufend Statistiken erstellen:
  
'''Statistik-Austria[1]''', 05.02.2007.
+
'''Statistik-Austria[http://www.statistik.at/ &#91;1&#93;]''', 05.02.2007.
  
'''Eurostat - Statistikamt der Europäischen Union[2]''', 16.11.2009.
+
'''Eurostat - Statistikamt der Europäischen Union[https://ec.europa.eu/eurostat &#91;2&#93;]''', 16.11.2009.
  
'''Statistiken der Stadt Wien[3]''', 05.02.2007.
+
'''Statistiken der Stadt Wien[http://www.wien.gv.at/statistik/ &#91;3&#93;]''', 05.02.2007.
  
'''United Nations Statistics Division[4]''', 05.02.2007.
+
'''United Nations Statistics Division[https://unstats.un.org/home/ &#91;4&#93;]''', 05.02.2007.
  
'''World Bank Data[5]''', 05.02.2007.
+
'''World Bank Data[https://data.worldbank.org/ &#91;5&#93;]''', 05.02.2007.
  
'''FAO Statistics[6]''', 19.01.2010.
+
'''FAO Statistics[http://www.fao.org/faostat/en/ &#91;6&#93;]''', 19.01.2010.
  
'''UNDP - Human Development Report[7]''', 16.11.2009.
+
'''UNDP - Human Development Report[http://hdr.undp.org/en/data &#91;7&#93;]''', 16.11.2009.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.statistik.at/<br />
+
[http://www.statistik.at/ &#91;1&#93; http://www.statistik.at/]<br />
[2] https://ec.europa.eu/eurostat<br />
+
[https://ec.europa.eu/eurostat &#91;2&#93; https://ec.europa.eu/eurostat]<br />
[3] http://www.wien.gv.at/statistik/<br />
+
[http://www.wien.gv.at/statistik/ &#91;3&#93; http://www.wien.gv.at/statistik/]<br />
[4] https://unstats.un.org/home/<br />
+
[https://unstats.un.org/home/ &#91;4&#93; https://unstats.un.org/home/]<br />
[5] https://data.worldbank.org/<br />
+
[https://data.worldbank.org/ &#91;5&#93; https://data.worldbank.org/]<br />
[6] www.fao.org/faostat/en/#home<br />
+
[http://www.fao.org/faostat/en/ &#91;6&#93; http://www.fao.org/faostat/en/]<br />
[7] http://hdr.undp.org/en/data<br />
+
[http://hdr.undp.org/en/data &#91;7&#93; http://hdr.undp.org/en/data]<br />
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|&uarr; Nach oben]]
 +
-->

Latest revision as of 14:30, 24 September 2020

↵ Zurück zur Hauptseite

Grundlagen statistischer Auswertungsverfahren

verfasst von Erwin Ebermann
Quanti Logo.gif

Kapitel dieser Lernunterlage

1. Funktion und Sinn von Statistik
2. Von der Fragestellung zur statistischen Analyse
3. Ausgewählte statistische Grundlagen und Analysemethoden
4. Software für quantitative Forschungsprojekte
5. Lexikon statistischer Grundbegriffe
6. Literatur, Ressourcen und Links

Kapitelübersicht

1. Funktion und Sinn von Statistik

1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?
1.2 Formen der Statistik
1.2.1 Deskriptive Statistik
1.2.2 Analytische Statistik
1.3 Wahrscheinlichkeiten, nicht Gewissheit
1.3.1 Schwankungsbreiten und Konfidenzintervalle
1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau

2. Von der Fragestellung zur statistischen Analyse

2.1 Die Grundpopulation: worüber wir Aussagen machen
2.1.1 Die Stichprobe (Sample)
2.1.2 Teil- oder Vollerhebung?
2.1.3 Die Ziehung (Auswahl) der Stichprobe
2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)
2.1.3.1.1 Proportional geschichtete Stichproben
2.1.3.1.2 Disproportional geschichtete Stichproben
2.1.3.1.3 Laufende Kontrolle der Schichtung
2.1.3.2 Zufallsstichproben
2.1.3.2.1 Einfache Zufallsstichprobe
2.1.3.2.2 Systematische Zufallsstichprobe
2.1.3.2.3 Geschichtete Zufallsstichprobe
2.1.3.3 Willkürliches Auswahlverfahren
2.1.3.4 Klumpenstichproben
2.1.4 Repräsentativität
2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?
2.2 Die Operationalisierung
2.2.1 Die Suche nach Indikatoren
2.2.2 Das Messen
2.2.2.1 Messfehler
2.2.3 Vom Fragebogen zum Codeplan
2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix
2.2.3.2 Umcodierung mit SPSS
2.2.3.3 Automatische Rückcodierung mit SPSS
2.3 Gütekriterien quantitativer Untersuchungen
2.4 Fehlerquellen bei statistischer Arbeit
2.4.1 Fehler erster und zweiter Art
2.4.2 Fehlerhafte oder mangelnde Daten
2.4.2.1 Eingabefehler
2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS
2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel
2.4.2.2 Doppelte Datensätze
2.4.2.3 Fehlende Einträge
2.4.2.3.1 Behandlung fehlender Daten mit SPSS

3. Ausgewählte statistische Grundlagen und Analysemethoden

3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden
3.1.1 Arten von Messwerten (Daten)
3.1.1.1 Metrische und nichtmetrische Variablen
3.1.1.2 Stetige und diskrete Variablen
3.1.2 Skalenniveaus
3.1.2.1 Skalierungsniveaus bildlich erklärt
3.1.2.2 Nominalskalierung
3.1.2.3 Ordinalskalierung
3.1.2.4 Intervallskalierung
3.1.2.5 Proportionalskalierung
3.1.2.6 Skalierungstypen, Aussagen und Methoden
3.1.3 Verteilungen
3.1.3.1 Normalverteilung
3.1.3.2 Andere Verteilungsformen
3.1.3.3 Test auf Normalverteilung
3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm
3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test
3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS
3.2 Die Ermittlung von Häufigkeiten
3.2.1 Liste und Tafeln
3.2.2 Häufigkeitstabelle
3.2.2.1 Häufigkeitsberechnung mit SPSS
3.2.2.2 Grafische Darstellung mit SPSS
3.2.3 Klassenbildung (Gruppierung) von Daten
3.2.3.1 Gruppierung mit SPSS
3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS
3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz
3.3.1 Modalwert
3.3.2 Arithmetisches Mittel
3.3.3 Median
3.3.3.1 Median bei gruppierten Daten
3.3.4 Geometrisches Mittel
3.3.5 Harmonisches Mittel
3.3.5.1 Harmonisches Mittel mit SPSS
3.3.6 Wann welche Lagemaße?
3.3.7 Berechnung von Lagemaßen mit SPSS
3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’
3.4.1 Varianz
3.4.2 Standardabweichung
3.4.3 Perzentile
3.4.3.1 Quartile
3.4.3.1.1 Die Ermittlung von Quartilen
3.4.4 Berechnung von Streuungsmaßen mit SPSS
3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots
3.4.5.1 Erstellung von Boxplots mit SPSS
3.5 Der Zusammenhang zwischen Variablen
3.5.1 Optische Erkennung von Zusammenhängen
3.5.2 Kreuztabellen-Analyse
3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS
3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test
3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS
3.5.3 Die Korrelation
3.5.3.1 Maßkorrelation
3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS
3.5.3.2 Rangkorrelation R (Krueger-Spearman)
3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS
3.5.3.3 Rangkorrelation Tau (Kendall)
3.5.3.3.1 Berechnung von TAU mit SPSS
3.5.3.4 Aussagekraft einer Korrelation
3.5.3.4.1 Wann sind Korrelationen bemerkenswert?
3.5.3.4.2 Verdeckte Korrelation
3.5.3.4.3 Scheinkorrelationen und Störvariable
3.5.3.4.3.1 Partielle Korrelation mit SPSS
3.5.3.4.4 Signifikanz der Korrelation
3.5.3.4.4.1 Signifikanz mit SPSS
3.5.3.5 Kovarianz
3.5.4 Regression
3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression
3.5.4.2 Grafische Darstellung der Regression
3.6 Die grafische Darstellung statistischer Ergebnisse
3.6.1 Arten von Diagrammen
3.6.1.1 Kreisdiagramme
3.6.1.2 Liniendiagramme
3.6.1.3 Balkendiagramme
3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS
3.6.1.4 Kartogramme
3.6.1.5 Histogramme
3.6.1.6 Streudiagramme
3.6.2 Welches Diagramm für welche Daten?
3.6.3 Notwendige Begleitinformationen von Diagrammen

4. Software für quantitative Forschungsprojekte

4.1 Was kann Excel?
4.1.1 Statistische Analysen mit Excel
4.1.2 Grafische Aufbereitung von Daten mit Excel
4.2 Was kann MS Access?
4.3 Profi-Programme: SPSS und Statistica
4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS
4.5 Umcodierung

5. Lexikon statistischer Grundbegriffe

5.1 A-C
5.2 D-F
5.3 G-I
5.4 J-M
5.5 N-P
5.6 Q-R
5.7 S-T
5.8 U-Z

6. Literatur, Ressourcen und Links

6.1 Quantitative Forschungsmethoden
6.2 Fragebogen-Abfrage
6.3 Diagramme und Grafiken
6.3 Methoden
6.4 Repräsentativität
6.5 Statistik-Software
6.6 Terminologie
6.7 Statistik-Quellen