Difference between revisions of "Grundlagen Statistischer Auswertungsverfahren"

From Eksa
Jump to: navigation, search
(3.4.2 Standardabweichung)
m (Protected "Grundlagen Statistischer Auswertungsverfahren" ([Edit=Allow only administrators] (indefinite) [Move=Allow only administrators] (indefinite)) [cascading])
 
(43 intermediate revisions by the same user not shown)
Line 1: Line 1:
 +
[[Main_Page|'''↵ Zurück zur Hauptseite''']]
 
= Grundlagen statistischer Auswertungsverfahren =
 
= Grundlagen statistischer Auswertungsverfahren =
 +
<sup>verfasst von Erwin Ebermann</sup>[[File:Quanti_Logo.gif|right]]
  
Quelle: http://www.univie.ac.at/ksa/elearning/cp/quantitative/quantitative-titel.html<br />
+
=== Kapitel dieser Lernunterlage ===
Erwin Ebermann<br />
+
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
Institut für Kultur- und Sozialanthropologie<br />
+
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
  
 
==Kapitelübersicht==
 
==Kapitelübersicht==
Line 13: Line 18:
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
::[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
+
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
::[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
+
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
::[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
+
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
Line 22: Line 27:
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
Line 46: Line 51:
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
+
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
Line 67: Line 72:
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
Line 93: Line 98:
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
Line 101: Line 106:
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
Line 126: Line 131:
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
+
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
Line 161: Line 166:
  
  
 
+
<!--
\[(.*)\] Siehe Kapitel
+
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
 
 
 
 
 
 
 
 
  
 
= 1. Funktion und Sinn von Statistik =
 
= 1. Funktion und Sinn von Statistik =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== Weitverbreitete Scheu vor statistischen Methoden ===
+
==== Weitverbreitete Scheu vor statistischen Methoden ====
  
 
Was bringt Statistik, was bringen quantitative Forschungsmethoden? Viele Menschen stehen ihnen skeptisch gegenüber und dies teilweise leider zurecht. Allzuleicht kann mit Statistiken Unfug getrieben werden und nicht immer sind die BetrachterInnen statistisch aufbereiteter Daten genügend geschult, um bewusste Verzerrungen zu erkennen. Richtig verwendet jedoch, ist die Statistik ein unverzichtbares Hilfsmittel, um - losgelöst von der subjektiven Wahrnehmung - die Systematik von Tendenzen und Zusammenhängen in verschiedensten Lebensbereichen aufzeigen zu können.
 
Was bringt Statistik, was bringen quantitative Forschungsmethoden? Viele Menschen stehen ihnen skeptisch gegenüber und dies teilweise leider zurecht. Allzuleicht kann mit Statistiken Unfug getrieben werden und nicht immer sind die BetrachterInnen statistisch aufbereiteter Daten genügend geschult, um bewusste Verzerrungen zu erkennen. Richtig verwendet jedoch, ist die Statistik ein unverzichtbares Hilfsmittel, um - losgelöst von der subjektiven Wahrnehmung - die Systematik von Tendenzen und Zusammenhängen in verschiedensten Lebensbereichen aufzeigen zu können.
  
=== Statistik in der Alltagserfahrung ===
+
==== Statistik in der Alltagserfahrung ====
  
 
Ob wir wollen oder nicht, auch wenn wir niemals etwas von Statistik gehört haben, so wenden wir dennoch meist unreflektiert und unsystematisch Methoden an, welche statistischen Verfahren ähneln. D.h. wir versuchen, von einem begrenzten Erfahrungsschatz auf allgemeine Sachverhalte zu schließen. Jede Erfahrung, die wir machen, beeinflusst mit einer gewissen Wahrscheinlichkeit unsere zukünftigen Handlungs- und Denkweisen. Wir vermeiden vielleicht den Kontakt mit bestimmten Gruppen der Gesellschaft, weil sie uns wenig kooperativ erscheinen; wir fällen aufgrund einzelner Geschehnisse verallgemeinernde Urteile über Bekannte, dass sie diese oder jene Eigenschaft aufweisen, über Menschen, welche in der Öffentlichkeit stehen, über den öffentlichen Verkehr:
 
Ob wir wollen oder nicht, auch wenn wir niemals etwas von Statistik gehört haben, so wenden wir dennoch meist unreflektiert und unsystematisch Methoden an, welche statistischen Verfahren ähneln. D.h. wir versuchen, von einem begrenzten Erfahrungsschatz auf allgemeine Sachverhalte zu schließen. Jede Erfahrung, die wir machen, beeinflusst mit einer gewissen Wahrscheinlichkeit unsere zukünftigen Handlungs- und Denkweisen. Wir vermeiden vielleicht den Kontakt mit bestimmten Gruppen der Gesellschaft, weil sie uns wenig kooperativ erscheinen; wir fällen aufgrund einzelner Geschehnisse verallgemeinernde Urteile über Bekannte, dass sie diese oder jene Eigenschaft aufweisen, über Menschen, welche in der Öffentlichkeit stehen, über den öffentlichen Verkehr:
Line 186: Line 187:
 
Alle diese Aussagen basieren auf dem in der Statistik gängigen Vorgang, von einer begrenzten Erfahrung bzw. von einem begrenzten Datenschatz auf alle möglichen Erfahrungen bzw. Daten hochzurechnen, wobei wir bei diesen Aussagen jedoch wichtige Grundprinzipien der Statistik nicht berücksichtigen. Diese ’unbewussten’ Anwendungen statistischer Prinzipien ähneln den Versuchen von Couchpotatoes, die Fussballkünste eines Ronaldinho in der Praxis nachzuvollziehen.
 
Alle diese Aussagen basieren auf dem in der Statistik gängigen Vorgang, von einer begrenzten Erfahrung bzw. von einem begrenzten Datenschatz auf alle möglichen Erfahrungen bzw. Daten hochzurechnen, wobei wir bei diesen Aussagen jedoch wichtige Grundprinzipien der Statistik nicht berücksichtigen. Diese ’unbewussten’ Anwendungen statistischer Prinzipien ähneln den Versuchen von Couchpotatoes, die Fussballkünste eines Ronaldinho in der Praxis nachzuvollziehen.
  
=== Häufige Fehler bei der ’unbewussten’ Verwendung statistischer Methoden ===
+
==== Häufige Fehler bei der ’unbewussten’ Verwendung statistischer Methoden ====
  
 
Wir möchten mit diesen Aussagen ausdrücken, dass bestimmte Grundtendenzen vorkommen, dass diese systematisch sind. Aber sind sie das? Haben wir die Rahmbendingungen genügend beachtet? Ist Georg vielleicht nur mir gegenüber nicht gesprächsbereit? Gilt Ilse vielleicht allen anderen gegenüber als schroff und unkooperativ? Kommt die 5er-Linie nur zu bestimmten Tageszeiten, an welchen gerade ich sie immer benutze, zu spät und zu anderen Zeitpunkten pünktlich? Nehme ich schlechtes Wetter unter der Woche gar nicht wahr, weil ich mich im Büro befinde? Stimmt mein eigener Eindruck oder beharre ich auf meinem allerersten und möchte neue Erfahrungen nicht wahrnehmen?
 
Wir möchten mit diesen Aussagen ausdrücken, dass bestimmte Grundtendenzen vorkommen, dass diese systematisch sind. Aber sind sie das? Haben wir die Rahmbendingungen genügend beachtet? Ist Georg vielleicht nur mir gegenüber nicht gesprächsbereit? Gilt Ilse vielleicht allen anderen gegenüber als schroff und unkooperativ? Kommt die 5er-Linie nur zu bestimmten Tageszeiten, an welchen gerade ich sie immer benutze, zu spät und zu anderen Zeitpunkten pünktlich? Nehme ich schlechtes Wetter unter der Woche gar nicht wahr, weil ich mich im Büro befinde? Stimmt mein eigener Eindruck oder beharre ich auf meinem allerersten und möchte neue Erfahrungen nicht wahrnehmen?
  
=== Statistik muss mit Sorgfalt eingesetzt werden ===
+
==== Statistik muss mit Sorgfalt eingesetzt werden ====
  
Die Statistik gibt uns Methoden in die Hand, Vorurteile kritischer zu beleuchten und die '''Wahrscheinlichkeit[1]''' scheinbaren Wissens zu beurteilen, falls sie mit Verantwortungsbewusstsein und Sorgfalt verwendet werden. Sie ist besonders dann von großer Bedeutung, wenn wir - losgelöst von singulären Ereignissen oder Elementen - allgemeine Aussagen machen möchten. Sie ist dementsprechend kein Gegensatz zu '''qualitativen Forschungsmethoden''', sondern eine unverzichtbare '''Ergänzung[2]''' zu diesen.
+
Die Statistik gibt uns Methoden in die Hand, Vorurteile kritischer zu beleuchten und die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1]]]''' scheinbaren Wissens zu beurteilen, falls sie mit Verantwortungsbewusstsein und Sorgfalt verwendet werden. Sie ist besonders dann von großer Bedeutung, wenn wir - losgelöst von singulären Ereignissen oder Elementen - allgemeine Aussagen machen möchten. Sie ist dementsprechend kein Gegensatz zu '''qualitativen Forschungsmethoden''', sondern eine unverzichtbare '''Ergänzung[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[2]]]''' zu diesen.
  
+
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1] Siehe Kapitel 1.3]]<br />
 +
[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[2] Siehe Kapitel 5.1.3 der Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br/>
  
 +
==Inhaltsverzeichnisübersicht==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
</div>
  
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
  
'''Verweise:'''<br />
+
<br />
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1] Siehe Kapitel 1.3]]<br />
+
'''[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|Nächstes Kapitel: 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]'''
[2] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-50.html<br />
+
----
 +
[[#1. Funktion und Sinn von Statistik|&uarr; Nach oben]]
  
  
 +
'''[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|Vorheriges Kapitel: 1. Funktion und Sinn von Statistik]]'''
 
= 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung? =
 
= 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung? =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
'''Quantitative''' und '''qualitative Forschungsmethoden''' haben unterschiedliche Potentiale und Möglichkeiten und sind dementsprechend kein Gegensatz, sondern ergänzen sich gegenseitig.
 
'''Quantitative''' und '''qualitative Forschungsmethoden''' haben unterschiedliche Potentiale und Möglichkeiten und sind dementsprechend kein Gegensatz, sondern ergänzen sich gegenseitig.
  
=== Häufig Misstrauen gegenüber Statistik in Geistes- und Kulturwissenschaften ===
+
==== Häufig Misstrauen gegenüber Statistik in Geistes- und Kulturwissenschaften ====
  
In den Wissenschaften vom Menschen, wie z.B. der Sozial- und Kulturanthropologie, sind '''qualitative Forschungsmethoden[1]''' meist deutlich populärer als quantitative. Es mutet zu nüchtern an, zu festschreibend, zu klischeehaft, Menschen durch eine Reihe von meist kurzen Indikatoren '''beschreiben[2]''' zu wollen. GestaltpsychologInnen würden formulieren: "Das Ganze ist mehr als die Summe seiner Einzelteile."
+
In den Wissenschaften vom Menschen, wie z.B. der Sozial- und Kulturanthropologie, sind '''qualitative Forschungsmethoden[[Qualitative_Methoden_der_Kultur-_und_Sozialanthropologie|[1]]]''' meist deutlich populärer als quantitative. Es mutet zu nüchtern an, zu festschreibend, zu klischeehaft, Menschen durch eine Reihe von meist kurzen Indikatoren '''beschreiben[[Grundlagen des wissenschaftlichen Schreibens/Wissenschaftlicher Text|[2]]]''' zu wollen. GestaltpsychologInnen würden formulieren: "Das Ganze ist mehr als die Summe seiner Einzelteile."
  
=== Zur Tiefe benötigt man qualitative Ansätze ===
+
==== Zur Tiefe benötigt man qualitative Ansätze ====
  
 
Und sie haben in Vielem zweifellos recht. Wir benötigen in der Regel '''qualitative Methoden''', um feingewobene Motivforschung zu betreiben, um versteckte Aspirationen, Einstellungen, Eigenheiten zum Vorschein zu bringen. Wie könnte ein kurzer Fragebogen von einer halben Stunde Dauer das gleiche Wissen über die gleiche Person zum Vorschein bringen wie eine Befragung über mehrere Tage, die noch dazu weitgehend dem Rythmus des/der Befragten folgt? Das geht nicht. Und ginge es nur um die Befragung und Eigenheiten einzelner Individuen, etwa um eine Biographie, benötigen wir die '''Quantitativen Forschungsmethoden''' eigentlich gar nicht.
 
Und sie haben in Vielem zweifellos recht. Wir benötigen in der Regel '''qualitative Methoden''', um feingewobene Motivforschung zu betreiben, um versteckte Aspirationen, Einstellungen, Eigenheiten zum Vorschein zu bringen. Wie könnte ein kurzer Fragebogen von einer halben Stunde Dauer das gleiche Wissen über die gleiche Person zum Vorschein bringen wie eine Befragung über mehrere Tage, die noch dazu weitgehend dem Rythmus des/der Befragten folgt? Das geht nicht. Und ginge es nur um die Befragung und Eigenheiten einzelner Individuen, etwa um eine Biographie, benötigen wir die '''Quantitativen Forschungsmethoden''' eigentlich gar nicht.
  
=== Von der Tiefe zur Breite ===
+
==== Von der Tiefe zur Breite ====
  
 
Nehmen wir nun aber an, jemand hätte mit großer Sensiblität und Mühe aus zehn Personen sehr viel zum Vorschein gebracht, an Ängsten, Erwarungshaltungen, biographischen Daten, an Erfahrungen, Einstellungen usw. Nehmen wir an, alle zehn Befragten wären AfrikanerInnen gewesen. Könnten wir ihm/ihr nun die Frage stellen, uns zu sagen, wo AfrikanerInnen Elemente des Lebens anders wahrnehmen, anders reagieren, anders geprägt sind? Er/Sie könnte mit einem rein qualitativen Ansatz darauf keine Antwort geben. Er/Sie könnte nur antworten: "Die meisten der befragten zehn Personen sind wegen der Suche nach Arbeit nach Österreich gekommen. Die Hälfte von ihnen empfindet ein größeres Maß von Einsamkeit etc." Jede Aussage über Tendenzen der größeren Gruppe, zu der die Befragten gehören, wäre vermessen. Wie soll man wissen, ob die zehn Befragten nicht vielleicht die einzigen in der afrikanischen Community sind, die bestimmte Eigenschaften aufweisen, vielleicht auch die einzigen, welche überhaupt bereit sind, mit den weißen ForscherInnen darüber zu sprechen?
 
Nehmen wir nun aber an, jemand hätte mit großer Sensiblität und Mühe aus zehn Personen sehr viel zum Vorschein gebracht, an Ängsten, Erwarungshaltungen, biographischen Daten, an Erfahrungen, Einstellungen usw. Nehmen wir an, alle zehn Befragten wären AfrikanerInnen gewesen. Könnten wir ihm/ihr nun die Frage stellen, uns zu sagen, wo AfrikanerInnen Elemente des Lebens anders wahrnehmen, anders reagieren, anders geprägt sind? Er/Sie könnte mit einem rein qualitativen Ansatz darauf keine Antwort geben. Er/Sie könnte nur antworten: "Die meisten der befragten zehn Personen sind wegen der Suche nach Arbeit nach Österreich gekommen. Die Hälfte von ihnen empfindet ein größeres Maß von Einsamkeit etc." Jede Aussage über Tendenzen der größeren Gruppe, zu der die Befragten gehören, wäre vermessen. Wie soll man wissen, ob die zehn Befragten nicht vielleicht die einzigen in der afrikanischen Community sind, die bestimmte Eigenschaften aufweisen, vielleicht auch die einzigen, welche überhaupt bereit sind, mit den weißen ForscherInnen darüber zu sprechen?
  
=== Qualitative und quantitative Methoden ergänzen und erfordern einander ===
+
==== Qualitative und quantitative Methoden ergänzen und erfordern einander ====
  
An dieser Stelle werden quantitative Forschungsmethoden als '''Ergänzung[3]''' zu den qualitativen unverzichtbar. Beim quantitativen Untersuchungsansatz würde man mit geeigneten Methoden versuchen, die '''Befragten[4]''' bereits so auszuwählen, dass sie in den wesentlichen Bereichen ein realistisches Abbild der hier lebenden afrikanischen Community bilden.
+
An dieser Stelle werden quantitative Forschungsmethoden als '''Ergänzung[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[3]]]''' zu den qualitativen unverzichtbar. Beim quantitativen Untersuchungsansatz würde man mit geeigneten Methoden versuchen, die '''Befragten[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4]]]''' bereits so auszuwählen, dass sie in den wesentlichen Bereichen ein realistisches Abbild der hier lebenden afrikanischen Community bilden.
  
=== Tiefe durch qualitative, Breite durch quantitative Methoden ===
+
==== Tiefe durch qualitative, Breite durch quantitative Methoden ====
  
 
Quantitative Forschungsmethoden folgen oft qualitativen. Qualitative Untersuchungen liefern hochinteressante Informationen über Menschen, die zu einer bestimmten Berufsgruppe, Region oder Kultur gehören. In von Oralliteratur geprägten Regionen werden z.B. viele Bereiche einer häufigeren Neuinterpretation unterliegen, da mit der schriftlichen Fixierung oft auch eine erhöhte Stabilisierung eines Sachverhalts einhergeht. Zu Randbereichen mag es daher eine Fülle von Interpretationen geben. So mag ein Informant Gedanken äußern, welche erstaunliche Ähnlichkeit mit Reinkarnationsphilosophien anderer Weltgegenden aufweisen. Nun wird es - falls es ums Weltbild der betreffenden Kultur geht - wichtig sein, zu klären, ob nur diese Person oder die ganze Gesellschaft an das Phänomen der Reinkarnation glaubt. Nun könnte man mit einer kleinen quantitativen Erhebung, bei der die verschiedenen Gruppen der Gesellschaft befragt werden, schnell herausfinden, ob für diese Vorstellung die Biographie des Individuums (wie z.B. auf Reisen durch Kontakt mit anderen Völkern erworben), die Prägung einer Kaste innerhalb des Volkes oder die Prägung der ganzen Bevölkerung verantwortlich ist. Und dann könnte man eine allgemeinere Aussage über diesen Sachverhalt machen: "In diesem Volk glauben nur die Älteren an die Reinkarnation, die Jüngeren haben vorwiegend das christliche oder islamische Modell übernommen etc.".
 
Quantitative Forschungsmethoden folgen oft qualitativen. Qualitative Untersuchungen liefern hochinteressante Informationen über Menschen, die zu einer bestimmten Berufsgruppe, Region oder Kultur gehören. In von Oralliteratur geprägten Regionen werden z.B. viele Bereiche einer häufigeren Neuinterpretation unterliegen, da mit der schriftlichen Fixierung oft auch eine erhöhte Stabilisierung eines Sachverhalts einhergeht. Zu Randbereichen mag es daher eine Fülle von Interpretationen geben. So mag ein Informant Gedanken äußern, welche erstaunliche Ähnlichkeit mit Reinkarnationsphilosophien anderer Weltgegenden aufweisen. Nun wird es - falls es ums Weltbild der betreffenden Kultur geht - wichtig sein, zu klären, ob nur diese Person oder die ganze Gesellschaft an das Phänomen der Reinkarnation glaubt. Nun könnte man mit einer kleinen quantitativen Erhebung, bei der die verschiedenen Gruppen der Gesellschaft befragt werden, schnell herausfinden, ob für diese Vorstellung die Biographie des Individuums (wie z.B. auf Reisen durch Kontakt mit anderen Völkern erworben), die Prägung einer Kaste innerhalb des Volkes oder die Prägung der ganzen Bevölkerung verantwortlich ist. Und dann könnte man eine allgemeinere Aussage über diesen Sachverhalt machen: "In diesem Volk glauben nur die Älteren an die Reinkarnation, die Jüngeren haben vorwiegend das christliche oder islamische Modell übernommen etc.".
Line 232: Line 255:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-titel.html<br />
+
[[Qualitative_Methoden_der_Kultur-_und_Sozialanthropologie|[1] Siehe die Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br />
[2] &&& http://www.univie.ac.at/ksa/elearning/cp/schreiben/schreiben-2.html<br />
+
[[Grundlagen des wissenschaftlichen Schreibens/Wissenschaftlicher Text|[2] Siehe Kapitel 1.1 der Lernunterlage ''Das Verfassen Wissenschaftlicher Arbeiten'']]<br/>
[3] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-50.html<br />
+
[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[3] Siehe Kapitel 5.1.3 der Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4] Siehe Kapitel 2.1]]<br />
  
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Nächstes Kapitel: 1.2 Formen der Statistik]]'''
 +
----
 +
[[#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|&uarr; Nach oben]]
  
 +
 +
'''[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|Vorheriges Kapitel: 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]'''
 
= 1.2 Formen der Statistik =
 
= 1.2 Formen der Statistik =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Man unterscheidet im wesentlichen zwei verschiedene Formen der Statistik:
 
Man unterscheidet im wesentlichen zwei verschiedene Formen der Statistik:
Line 245: Line 275:
 
* die '''schließende oder analystische Statistik''', die sich im wesentlichen die Frage stellt, inwieweit das Gemessene als Abbild der Realität geeignet ist.
 
* die '''schließende oder analystische Statistik''', die sich im wesentlichen die Frage stellt, inwieweit das Gemessene als Abbild der Realität geeignet ist.
  
=== Vergleich anhand der Einkommenssituation in Bangladesh ===
+
==== Vergleich anhand der Einkommenssituation in Bangladesh ====
 
 
Nehmen wir an, wir untersuchen die Einkommensituation in zwei benachbarten Dörfern in Bangladesh. Wir stellen in den beiden Dörfern ein bestimmtes Durchschnittseinkommen fest und drücken dies in einer Maßzahl aus, z.B. dem '''Median[1]''' oder dem '''Mittelwert[2]'''. Mittels eines '''Balkendiagramms[3]''' zeigen wir auch optisch, dass das Durchschnitseinkommen von Dorf A höher ist als das von Dorf B. Bisher sind wir immer noch im Bereich der '''deskriptiven Statistik''' geblieben.
 
 
 
Wenn wir uns nun allerdings die Frage stellen, ob der von uns festgestellte Einkommensunterschied zwischen den beiden Dörfern zufälliger Natur oder '''hoch signifikant[4]''' ist, dann geraten wir mit den entsprechenden Methoden (z.B. dem '''T-Test (Wikipedia)[5]''') in den Bereich der '''schließenden Statistik'''.
 
  
 +
Nehmen wir an, wir untersuchen die Einkommensituation in zwei benachbarten Dörfern in Bangladesh. Wir stellen in den beiden Dörfern ein bestimmtes Durchschnittseinkommen fest und drücken dies in einer Maßzahl aus, z.B. dem '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''' oder dem '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]'''. Mittels eines '''Balkendiagramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3]]]''' zeigen wir auch optisch, dass das Durchschnitseinkommen von Dorf A höher ist als das von Dorf B. Bisher sind wir immer noch im Bereich der '''deskriptiven Statistik''' geblieben.
  
 +
Wenn wir uns nun allerdings die Frage stellen, ob der von uns festgestellte Einkommensunterschied zwischen den beiden Dörfern zufälliger Natur oder '''hoch signifikant[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4]]]''' ist, dann geraten wir mit den entsprechenden Methoden (z.B. dem '''T-Test (Wikipedia)[http://de.wikipedia.org/wiki/T-Test &#91;5&#93;]''') in den Bereich der '''schließenden Statistik'''.
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
Line 258: Line 286:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3] Siehe Kapitel 3.6.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3] Siehe Kapitel 3.6.1.3]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4] Siehe Kapitel 1.3.2]]<br />
[5] http://de.wikipedia.org/wiki/T-Test<br />
+
[http://de.wikipedia.org/wiki/T-Test &#91;5&#93; http://de.wikipedia.org/wiki/T-Test]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
</div>
  
 
== 1.2.1 Deskriptive Statistik ==
 
== 1.2.1 Deskriptive Statistik ==
Line 267: Line 301:
 
Die Aussagen der '''deskriptiven Statistik''' beziehen sich dabei immer nur auf die untersuchte Stichprobe. Die Darstellungsformen liegen in Maßzahlen, in '''Grafiken[1]''' und Tabellen. Häufige Maßzahlen der deskriptiven Statistik sind z.B. '''Mittelwerte[2]''' oder die '''Streuung einer Stichprobe[3]''' oder deren grafische Entsprechungen in Form z.B. von '''Kreis- oder Stabdiagrammen[4]'''.
 
Die Aussagen der '''deskriptiven Statistik''' beziehen sich dabei immer nur auf die untersuchte Stichprobe. Die Darstellungsformen liegen in Maßzahlen, in '''Grafiken[1]''' und Tabellen. Häufige Maßzahlen der deskriptiven Statistik sind z.B. '''Mittelwerte[2]''' oder die '''Streuung einer Stichprobe[3]''' oder deren grafische Entsprechungen in Form z.B. von '''Kreis- oder Stabdiagrammen[4]'''.
  
=== '''Beispiel: Vergleichende Dorfstudien in Mali''' ===
+
==== '''Beispiel: Vergleichende Dorfstudien in Mali''' ====
  
 
Wir untersuchen zwei Siedlungen in Mali in Westafrika. Wir befragen jeweils 50 Personen aus den beiden Siedlungen zu Einschätzungen eines in der Gegend lebenden Volkes. Wir halten nüchtern fest, wie diese Einschätzungen ausfallen. Wir können dann z.B. angeben, dass das rinderzüchtende Volk der Fulbe in Nkorongoji relativ negativ betrachtet wird, in der Stadt Kita hingegen eher positiv. Das sind nüchterne Beschreibungen = Deskriptionen.
 
Wir untersuchen zwei Siedlungen in Mali in Westafrika. Wir befragen jeweils 50 Personen aus den beiden Siedlungen zu Einschätzungen eines in der Gegend lebenden Volkes. Wir halten nüchtern fest, wie diese Einschätzungen ausfallen. Wir können dann z.B. angeben, dass das rinderzüchtende Volk der Fulbe in Nkorongoji relativ negativ betrachtet wird, in der Stadt Kita hingegen eher positiv. Das sind nüchterne Beschreibungen = Deskriptionen.
Line 278: Line 312:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
[3] Siehe Kapitel 3.4<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3] Siehe Kapitel 3.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|[4] Siehe Kapitel 3.6.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|[4] Siehe Kapitel 3.6.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[5] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[5] Siehe Kapitel 2.1.1]]<br />
Line 286: Line 320:
 
== 1.2.2 Analytische Statistik ==
 
== 1.2.2 Analytische Statistik ==
  
Die '''analytische''' (auch '''schließende''' oder '''deduktive[1]''' genannt) '''Statistik''' beschäftigt sich im Wesentlichen mit der Frage der Zufälligkeit statistisch gemessener Phänomene. So stellt man sich die Frage, inwieweit ein in einer Stichprobe gemessener '''Mittelwert[2]''' vom Mittelwert der '''Grundgesamtheit[3]''' '''abweichen[4]''' könnte; man stellt sich bei verschiedenen '''Stichproben''' die Frage, ob sie angesichts ihrer gemessenen Unterschiede noch zur gleichen '''Grundgesamtheit''' gehören können u.a. Hier wird also versucht, die untersuchte Stichprobe in einem größeren Ganzen einzuordnen, wobei auch der Untersuchung der '''Wahrscheinlichkeit''' von '''Zusammenhängen[5]''' bzw. Differenzen breiter Raum eingeräumt wird.
+
Die '''analytische''' (auch '''schließende''' oder '''deduktive[[Arten_des_Schlussfolgerns#2.2 Deduktives Schlussfolgern|[1]]]''' genannt) '''Statistik''' beschäftigt sich im Wesentlichen mit der Frage der Zufälligkeit statistisch gemessener Phänomene. So stellt man sich die Frage, inwieweit ein in einer Stichprobe gemessener '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2]]]''' vom Mittelwert der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3]]]''' '''abweichen[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|[4]]]''' könnte; man stellt sich bei verschiedenen '''Stichproben''' die Frage, ob sie angesichts ihrer gemessenen Unterschiede noch zur gleichen '''Grundgesamtheit''' gehören können u.a. Hier wird also versucht, die untersuchte Stichprobe in einem größeren Ganzen einzuordnen, wobei auch der Untersuchung der '''Wahrscheinlichkeit''' von '''Zusammenhängen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|[5]]]''' bzw. Differenzen breiter Raum eingeräumt wird.
  
=== '''Beispiel 1: Sind Unterschiede (über-)zufällig?''' ===
+
==== '''Beispiel 1: Sind Unterschiede (über-)zufällig?''' ====
  
In einem Ort A findet man bei 50 Befragten ein Durchschnittseinkommen von € 1300 ermittelt, im Ort B bei einer gleich großen '''Stichprobe[6]''' ein Durchschnittseinkommen von € 1765. Mit Methoden der '''analytischen Statistik''' könnten wir herausfinden, ob der Einkommensunterschied zwischen diesen beiden Stichproben die Verallgemeinerung erlaubt, dass die Bevölkerungen der beiden Orte tatsächlich unterschiedlich gut verdienen oder ob der gemessene Unterschied '''rein zufälliger Natur[7]''' sein könnte (weil die Befragten sich trotz aller Sorgfalt bei ihrer Auswahl gerade an diesem Punkt von ihren MitbewohnerInnen unterscheiden).
+
In einem Ort A findet man bei 50 Befragten ein Durchschnittseinkommen von € 1300 ermittelt, im Ort B bei einer gleich großen '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[6]]]''' ein Durchschnittseinkommen von € 1765. Mit Methoden der '''analytischen Statistik''' könnten wir herausfinden, ob der Einkommensunterschied zwischen diesen beiden Stichproben die Verallgemeinerung erlaubt, dass die Bevölkerungen der beiden Orte tatsächlich unterschiedlich gut verdienen oder ob der gemessene Unterschied '''rein zufälliger Natur[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7]]]''' sein könnte (weil die Befragten sich trotz aller Sorgfalt bei ihrer Auswahl gerade an diesem Punkt von ihren MitbewohnerInnen unterscheiden).
  
=== '''Beispiel 2: Ist ein gemessenes Ergebnis noch ’normal’?''' ===
+
==== '''Beispiel 2: Ist ein gemessenes Ergebnis noch ’normal’?''' ====
  
 
Normalerweise sollten beim Roulette-Spiel in einem längeren Untersuchungszeitraum alle 37 Zahlen etwa gleich häufig auftreten. In einem Spielcasino kamen im Untersuchungszeitraum am Roulette-Tisch verschiedene Zahlen deutlich häufiger als andere vor. Mit den geeigneten (analytischen) Methoden der '''Wahrscheinlichkeitsrechnung''' ermittelt man, ob der Roulette-Tisch möglicherweise einseitig so beschaffen oder abgenützt ist, dass man wahrscheinlich auf Dauer mit unterschiedlichen Häufigkeiten rechnen muss oder ob die gemessenen Ergebnisse rein zufälliger Natur waren.
 
Normalerweise sollten beim Roulette-Spiel in einem längeren Untersuchungszeitraum alle 37 Zahlen etwa gleich häufig auftreten. In einem Spielcasino kamen im Untersuchungszeitraum am Roulette-Tisch verschiedene Zahlen deutlich häufiger als andere vor. Mit den geeigneten (analytischen) Methoden der '''Wahrscheinlichkeitsrechnung''' ermittelt man, ob der Roulette-Tisch möglicherweise einseitig so beschaffen oder abgenützt ist, dass man wahrscheinlich auf Dauer mit unterschiedlichen Häufigkeiten rechnen muss oder ob die gemessenen Ergebnisse rein zufälliger Natur waren.
Line 299: Line 333:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-6.html<br />
+
[[Arten_des_Schlussfolgerns#2.2 Deduktives Schlussfolgern|[1] Siehe Kapitel 2.2 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3] Siehe Kapitel 2.1]]<br />
Line 307: Line 341:
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7] Siehe Kapitel 1.3.2]]<br />
  
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|Nächstes Kapitel: 1.3 Wahrscheinlichkeiten, nicht Gewissheit]]'''
 +
----
 +
[[#1.2 Formen der Statistik|&uarr; Nach oben]]
  
 +
 +
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Vorheriges Kapitel: 1.2 Formen der Statistik]]'''
 
= 1.3 Wahrscheinlichkeiten, nicht Gewissheit =
 
= 1.3 Wahrscheinlichkeiten, nicht Gewissheit =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== '''(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.''' ===
+
==== '''(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.''' ====
  
In der Statistik beschreiben und analysieren wir meist '''Stichproben[1]''', also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgfältig zusammengesetzte Stichprobe in wesentlichen Parametern von der '''Grundgesamtheit[2]''' unterscheidet, sie also nicht wiederspiegelt.
+
In der Statistik beschreiben und analysieren wir meist '''Stichproben[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''', also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgfältig zusammengesetzte Stichprobe in wesentlichen Parametern von der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' unterscheidet, sie also nicht wiederspiegelt.
  
 
Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpräferenzen befragen, dann kann es sein, dass die Beliebtheit der SPÖ bei ihnen deutlich anders ausfällt als bei der Grundgesamtheit, auch wenn aus der Schichtung der '''Stichprobe''' keinerlei tendenziöse Verteilung der Personen ersichtlich war.
 
Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpräferenzen befragen, dann kann es sein, dass die Beliebtheit der SPÖ bei ihnen deutlich anders ausfällt als bei der Grundgesamtheit, auch wenn aus der Schichtung der '''Stichprobe''' keinerlei tendenziöse Verteilung der Personen ersichtlich war.
  
=== '''Konfidenzintervalle''' ===
+
==== '''Konfidenzintervalle''' ====
  
 
Besonders in der analytischen Statistik gibt man daher '''Konfidenzintervalle''' bzw. '''Schwankungsbreiten''' an, innerhalb derer sich ein wahrer Wert bewegen soll, d.h. der vermutete Wert in der '''Grundpopulation'''. '''Die Breite der Konfidenzintervalle hängt von der Größe der Stichprobe, deren relativer Größe im Verhältnis zur Grundpopulation sowie von der gewählten Irrtumswahrscheinlichkeit ab.'''
 
Besonders in der analytischen Statistik gibt man daher '''Konfidenzintervalle''' bzw. '''Schwankungsbreiten''' an, innerhalb derer sich ein wahrer Wert bewegen soll, d.h. der vermutete Wert in der '''Grundpopulation'''. '''Die Breite der Konfidenzintervalle hängt von der Größe der Stichprobe, deren relativer Größe im Verhältnis zur Grundpopulation sowie von der gewählten Irrtumswahrscheinlichkeit ab.'''
  
=== '''Beispiel Hochrechnung am Wahlsonntag:''' ===
+
==== '''Beispiel Hochrechnung am Wahlsonntag:''' ====
  
 
Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.
 
Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.
 
  
  
Line 330: Line 370:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
</div>
  
 
== 1.3.1 Schwankungsbreiten und Konfidenzintervalle ==
 
== 1.3.1 Schwankungsbreiten und Konfidenzintervalle ==
Line 337: Line 383:
 
Die '''Schwankungsbreite''' oder das '''Konfidenzintervall''' hängen von folgenden Faktoren ab:<br />
 
Die '''Schwankungsbreite''' oder das '''Konfidenzintervall''' hängen von folgenden Faktoren ab:<br />
 
a. dem gewählten Signifikanzniveau (je signifikanter, dester größer die Schwankungsbreite);<br />
 
a. dem gewählten Signifikanzniveau (je signifikanter, dester größer die Schwankungsbreite);<br />
b. dem größenmäßigen Verhältnis zwischen '''Stichprobe''' und '''Grundpopulation[1]''' (je größer der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
+
b. dem größenmäßigen Verhältnis zwischen '''Stichprobe''' und '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' (je größer der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
c. der Größe der '''Stichprobe[2]''' (je kleiner, desto größer ist die Schwankungsbreite)
+
c. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' (je kleiner, desto größer ist die Schwankungsbreite)
  
 
'''Beispiel zu Punkt b am Wahlabend:'''<br />
 
'''Beispiel zu Punkt b am Wahlabend:'''<br />
 
Während die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgezählten Stimmen die Schwankungsbreite der Stimmen für Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgezählt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).
 
Während die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgezählten Stimmen die Schwankungsbreite der Stimmen für Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgezählt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).
  
Siehe auch '''Konfidenzintervall (Wikipedia)[3]'''.
+
Siehe auch '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93;]'''.
  
  
Line 350: Line 396:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
[3] http://de.wikipedia.org/wiki/Konfidenzintervall<br />
+
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
  
  
Line 367: Line 413:
 
Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer '''Irrtumswahrscheinlichkeit''' von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller Fälle das tatsächliche Endergebnis außerhalb dieses Bereiches liegen wird.
 
Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer '''Irrtumswahrscheinlichkeit''' von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller Fälle das tatsächliche Endergebnis außerhalb dieses Bereiches liegen wird.
  
Siehe auch '''Signifikanz (Wikipedia)[1]'''.
+
Siehe auch '''Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93;]'''.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Statistische_Signifikanz<br />
+
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#1.3 Wahrscheinlichkeiten, nicht Gewissheit|&uarr; Nach oben]]
  
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 2. Von der Fragestellung zur statistischen Analyse =
 
= 2. Von der Fragestellung zur statistischen Analyse =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== '''Wesentliche Elemente bei quantitativen Forschungsansätzen''' ===
+
==== '''Wesentliche Elemente bei quantitativen Forschungsansätzen''' ====
  
 
Bei quantitativen Forschungsansätzen sind die folgenden Teilbereiche von besonderer Bedeutung:
 
Bei quantitativen Forschungsansätzen sind die folgenden Teilbereiche von besonderer Bedeutung:
Line 387: Line 440:
 
Interessiert uns z.B. die Einstellung der lokalen Bevölkerung zur Entwicklungszusammenarbeit, dann ist das zu untersuchende Objekt die Bevölkerung (die Grundpopulation), während die thematischen Fragen die Einstellungen der Bevölkerung zur EZA darstellen.
 
Interessiert uns z.B. die Einstellung der lokalen Bevölkerung zur Entwicklungszusammenarbeit, dann ist das zu untersuchende Objekt die Bevölkerung (die Grundpopulation), während die thematischen Fragen die Einstellungen der Bevölkerung zur EZA darstellen.
  
=== '''Befragung der richtigen Personen mit den richtigen/relevanten Fragen''' ===
+
==== '''Befragung der richtigen Personen mit den richtigen/relevanten Fragen''' ====
  
Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und '''Repräsentativität[1]'''), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe '''Operationalisierung[2]''' und '''Messen[3]''').
+
Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[1]]]'''), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2]]]''' und '''Messen[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3]]]''').
  
 
Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).
 
Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).
Line 399: Line 452:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2] Siehe Kapitel 2.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2] Siehe Kapitel 2.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3] Siehe Kapitel 2.2.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3] Siehe Kapitel 2.2.2]]<br />
 +
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|2.3 Gütekriterien quantitativer Untersuchungen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
</div>
 +
 +
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Nächstes Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
 +
----
 +
[[#2. Von der Fragestellung zur statistischen Analyse|&uarr; Nach oben]]
  
  
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|Vorheriges Kapitel: 2. Von der Fragestellung zur statistischen Analyse]]'''
 
= 2.1 Die Grundpopulation: worüber wir Aussagen machen =
 
= 2.1 Die Grundpopulation: worüber wir Aussagen machen =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Die '''empirische Grundgesamtheit''' ('''Grundpopulation''') ist jene abgegrenzte Menge von Personen (z.B. die Wiener Bevölkerung) oder Objekten (z.B. die Regenfälle in einer tropischen Region, die Autos im 7. Bezirk), über die man Aussagen machen möchte.
 
Die '''empirische Grundgesamtheit''' ('''Grundpopulation''') ist jene abgegrenzte Menge von Personen (z.B. die Wiener Bevölkerung) oder Objekten (z.B. die Regenfälle in einer tropischen Region, die Autos im 7. Bezirk), über die man Aussagen machen möchte.
Line 407: Line 507:
 
Anders ausgedrückt: Wenn wir eine Studie zu AfrikanerInnen in Österreich durchführen, dann möchten wir als Ergebnis zu Aussagen kommen, welche Tendenzen sich in dieser Bevölkerungsgruppe zeigen. Alle Mitglieder der Gruppe AfrikanerInnen in Österreich bilden gemeinsam die '''Grundgesamtheit'''.
 
Anders ausgedrückt: Wenn wir eine Studie zu AfrikanerInnen in Österreich durchführen, dann möchten wir als Ergebnis zu Aussagen kommen, welche Tendenzen sich in dieser Bevölkerungsgruppe zeigen. Alle Mitglieder der Gruppe AfrikanerInnen in Österreich bilden gemeinsam die '''Grundgesamtheit'''.
  
=== '''Elemente, Variable und Ausprägungen''' ===
+
==== '''Elemente, Variable und Ausprägungen''' ====
  
Ein Einzelobjekt aus dieser Grundgesamtheit bezeichnet man als '''statistische Einheit''' oder '''Element''' (z.B. Herr Moussa Bamba aus Bamako, der jetzt in Wien lebt). Die Einzelobjekte weisen jeweils '''Merkmale''' auf (auch '''Variablen''' genannt, z.B. Geschlecht, Einkommen, Autofarbe etc.), die uns interessieren und über deren Ausprägung in der Grundgesamtheit wir mehr erfahren möchten (die sogenannte '''Verteilung[1]'''). Die möglichen Werte dieser Merkmale bezeichnet man als '''Merkmalsausprägungen''.''''' So gibt es für das Merkmal Geschlecht die Ausprägungen männlich oder weiblich, für die Variable Körpergröße Zahlen zwischen theoretisch Null und deutlich über zwei Meter.
+
Ein Einzelobjekt aus dieser Grundgesamtheit bezeichnet man als '''statistische Einheit''' oder '''Element''' (z.B. Herr Moussa Bamba aus Bamako, der jetzt in Wien lebt). Die Einzelobjekte weisen jeweils '''Merkmale''' auf (auch '''Variablen''' genannt, z.B. Geschlecht, Einkommen, Autofarbe etc.), die uns interessieren und über deren Ausprägung in der Grundgesamtheit wir mehr erfahren möchten (die sogenannte '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]'''). Die möglichen Werte dieser Merkmale bezeichnet man als '''Merkmalsausprägungen''.''''' So gibt es für das Merkmal Geschlecht die Ausprägungen männlich oder weiblich, für die Variable Körpergröße Zahlen zwischen theoretisch Null und deutlich über zwei Meter.
  
=== '''Befragung der gesamten Grundpopulation nur selten möglich''' ===
+
==== '''Befragung der gesamten Grundpopulation nur selten möglich''' ====
  
 
Meist ist die '''Grundpopulation''' so groß, dass wir nur einen Teil der Grundpopulation befragen können, eine sogenannte '''Stichprobe'''.
 
Meist ist die '''Grundpopulation''' so groß, dass wir nur einen Teil der Grundpopulation befragen können, eine sogenannte '''Stichprobe'''.
  
=== '''Öffentliche Quellen für Daten über Grundpopulationen''' ===
+
==== '''Öffentliche Quellen für Daten über Grundpopulationen''' ====
  
Grundinformationen über die Verteilung der '''Grundpopulationen''' kann man u.a. suchen bei '''Statistik Austria[2]''' und anderen Informationsstellen, in einschlägigen Publikationen etc.
+
Grundinformationen über die Verteilung der '''Grundpopulationen''' kann man u.a. suchen bei '''Statistik Austria[http://www.statistik.at/ &#91;2&#93;]''' und anderen Informationsstellen, in einschlägigen Publikationen etc.
  
  
Line 423: Line 523:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
[2] http://www.statistik.at/<br />
+
[http://www.statistik.at/ &#91;2&#93; http://www.statistik.at/]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
</div>
 +
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
  
 
== 2.1.1 Die Stichprobe (Sample) ==
 
== 2.1.1 Die Stichprobe (Sample) ==
  
Eine '''Stichprobe''' ist eine Auswahl von Elementen der Grundgesamtheit, anhand derer die '''Grundgesamtheit[1]''' nachgebildet werden soll.
+
Eine '''Stichprobe''' ist eine Auswahl von Elementen der Grundgesamtheit, anhand derer die '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' nachgebildet werden soll.
  
=== '''Auswahl fast immer notwendig''' ===
+
==== '''Auswahl fast immer notwendig''' ====
  
Auf Grund der Größe der '''Grundpopulationen''' ist es kaum jemals möglich, alle Mitglieder derselben zu befragen. Daher greift man in der Regel zu '''Stichproben''', also einer Auswahl von Mitgliedern der Grundgesamtheit. Die Mitglieder der Stichproben sollten in der Regel so ausgewählt sein, dass sie ein '''unverzerrtes Abbild''' der '''Grundgesamtheit''' darstellen (siehe '''Repräsentativität[2]''').
+
Auf Grund der Größe der '''Grundpopulationen''' ist es kaum jemals möglich, alle Mitglieder derselben zu befragen. Daher greift man in der Regel zu '''Stichproben''', also einer Auswahl von Mitgliedern der Grundgesamtheit. Die Mitglieder der Stichproben sollten in der Regel so ausgewählt sein, dass sie ein '''unverzerrtes Abbild''' der '''Grundgesamtheit''' darstellen (siehe '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[2]]]''').
  
  
Line 443: Line 569:
 
== 2.1.2 Teil- oder Vollerhebung? ==
 
== 2.1.2 Teil- oder Vollerhebung? ==
  
=== '''Teil- oder Vollerhebung?''' ===
+
==== '''Teil- oder Vollerhebung?''' ====
  
 
Je nach Größe der '''Grundpopulation''', der Zahl der BefragerInnen und der finanziellen Ressourcen eines Forschungsprojekts kann eine Stichprobe unterschiedlich groß gewählt werden. Quantitativ sinnvolle Stichprobengrößen beginnen bei einer Befragtenanzahl von 100 und sind auch dann noch von großen Fehlermöglichkeiten gekennzeichnet. Sinnvoller wären auch hier deutlich höhere Stichprobengrößen. Wenn z.B. ein Meinungsforschungsinstitut die Wahlpräferenzen erhebt, befragt es in der Regel 300- 1000 Personen.
 
Je nach Größe der '''Grundpopulation''', der Zahl der BefragerInnen und der finanziellen Ressourcen eines Forschungsprojekts kann eine Stichprobe unterschiedlich groß gewählt werden. Quantitativ sinnvolle Stichprobengrößen beginnen bei einer Befragtenanzahl von 100 und sind auch dann noch von großen Fehlermöglichkeiten gekennzeichnet. Sinnvoller wären auch hier deutlich höhere Stichprobengrößen. Wenn z.B. ein Meinungsforschungsinstitut die Wahlpräferenzen erhebt, befragt es in der Regel 300- 1000 Personen.
Line 468: Line 594:
 
=== 2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)  ===
 
=== 2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)  ===
  
Unter einer '''geschichteten Stichprobenauswahl''' versteht man ein Auswahlverfahren, bei dem wesentliche '''Verteilungscharakteristiken[1]''' der '''Grundgesamtheit[2]''' nachgebildet werden.
+
Unter einer '''geschichteten Stichprobenauswahl''' versteht man ein Auswahlverfahren, bei dem wesentliche '''Verteilungscharakteristiken[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' nachgebildet werden.
  
 
Einzelne für die Untersuchung als relevant erachtete Merkmale der Zielgruppe werden annähernd im gleichen Verhältnis auf die '''Stichprobe''' übertragen, wie sie in der Grundgesamtheit vorkommen.
 
Einzelne für die Untersuchung als relevant erachtete Merkmale der Zielgruppe werden annähernd im gleichen Verhältnis auf die '''Stichprobe''' übertragen, wie sie in der Grundgesamtheit vorkommen.
Line 488: Line 614:
 
-----
 
-----
  
==== 2.1.3.1.1 Proportional geschichtete Stichproben  ====
+
=== 2.1.3.1.1 Proportional geschichtete Stichproben  ===
  
 
Bei der '''proportional geschichteten Stichprobe''' werden die '''Schichten''' entsprechend ihrer Verteilung in der Grundgesamtheit ausgewählt. Es wird ein durchgehend treues und '''unverzerrtes Abbild der Grundgesamtheit''' angestrebt.
 
Bei der '''proportional geschichteten Stichprobe''' werden die '''Schichten''' entsprechend ihrer Verteilung in der Grundgesamtheit ausgewählt. Es wird ein durchgehend treues und '''unverzerrtes Abbild der Grundgesamtheit''' angestrebt.
Line 497: Line 623:
 
-----
 
-----
  
==== 2.1.3.1.2 Disproportional geschichtete Stichproben  ====
+
=== 2.1.3.1.2 Disproportional geschichtete Stichproben  ===
  
 
Unter einer '''disproportional geschichteten Stichprobe''' versteht man die bewusste Verzerrung einzelner '''Verteilungsparameter''', um signifikante Aussagen über Randbereiche erhalten zu können. Dabei wird eine Bevölkerungsgruppe '''überproportional''' wiedergegeben, um genügend Interviews für sie zu erhalten.
 
Unter einer '''disproportional geschichteten Stichprobe''' versteht man die bewusste Verzerrung einzelner '''Verteilungsparameter''', um signifikante Aussagen über Randbereiche erhalten zu können. Dabei wird eine Bevölkerungsgruppe '''überproportional''' wiedergegeben, um genügend Interviews für sie zu erhalten.
  
Diese Methode wird v.a. angewandt, um bei beschränkten Stichprobengrößen '''signifikante[1]''' Aussagen über kleinere Bevölkerungsgruppen erhalten zu können, die für die Fragestellung besonders interessant sind.
+
Diese Methode wird v.a. angewandt, um bei beschränkten Stichprobengrößen '''signifikante[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' Aussagen über kleinere Bevölkerungsgruppen erhalten zu können, die für die Fragestellung besonders interessant sind.
  
=== '''Beispiel: Umfrage zu Reformen im Bildungsbereich''' ===
+
==== '''Beispiel: Umfrage zu Reformen im Bildungsbereich''' ====
  
 
Problemstellung: Man möchte herausfinden, wie die österreichische Bevölkerung eine große Bildungsreform einschließlich des Hochschulwesens einschätzt. Man kann dabei insgesamt 1000 Personen befragen. Befragt man die österreichische Bevölkerung proportional geschichtet, würde man etwa 27 Studierende zu diesem Thema befragen, da mit etwa 220.000 Studierenden an öffentlichen Hochschulen ihr Anteil an der Bevölkerung bei ca. 2,7 % liegt. Man könnte somit bei bloß 27 befragten Studierenden keine verlässliche Aussage über sie bekommen, da ihre spezifische Anzahl zu klein ist. Da sie als Betroffene jedoch für die Fragestellung von besonderer Relevanz sind, könnte man sie übergewichten und 100 oder mehr von ihnen befragen.
 
Problemstellung: Man möchte herausfinden, wie die österreichische Bevölkerung eine große Bildungsreform einschließlich des Hochschulwesens einschätzt. Man kann dabei insgesamt 1000 Personen befragen. Befragt man die österreichische Bevölkerung proportional geschichtet, würde man etwa 27 Studierende zu diesem Thema befragen, da mit etwa 220.000 Studierenden an öffentlichen Hochschulen ihr Anteil an der Bevölkerung bei ca. 2,7 % liegt. Man könnte somit bei bloß 27 befragten Studierenden keine verlässliche Aussage über sie bekommen, da ihre spezifische Anzahl zu klein ist. Da sie als Betroffene jedoch für die Fragestellung von besonderer Relevanz sind, könnte man sie übergewichten und 100 oder mehr von ihnen befragen.
  
=== '''Vorteil Kenntnis von Randbereichen, Nachteil Verzerrung des Meinungsbildes''' ===
+
==== '''Vorteil Kenntnis von Randbereichen, Nachteil Verzerrung des Meinungsbildes''' ====
  
 
Der Vorteil liegt in einer besseren Kenntnis des Meinungsbilds dieser thematisch wichtigen Subgruppe, '''der Nachteil dieser Methode in einem Verlust an Repräsentativität.''' Die Stichprobe ist verzerrt. Wollte man nun allgemeine Aussagen über das Meinungsbild bezüglich dieser Bildungsreform in der österreichischen Öffentlichkeit treffen, müsste man das Meinungsbild der Studierenden auf ihren tatsächlichen Anteil in der Bevölkerung hinuntergewichten.
 
Der Vorteil liegt in einer besseren Kenntnis des Meinungsbilds dieser thematisch wichtigen Subgruppe, '''der Nachteil dieser Methode in einem Verlust an Repräsentativität.''' Die Stichprobe ist verzerrt. Wollte man nun allgemeine Aussagen über das Meinungsbild bezüglich dieser Bildungsreform in der österreichischen Öffentlichkeit treffen, müsste man das Meinungsbild der Studierenden auf ihren tatsächlichen Anteil in der Bevölkerung hinuntergewichten.
Line 521: Line 647:
 
-----
 
-----
  
==== 2.1.3.1.3 Laufende Kontrolle der Schichtung  ====
+
=== 2.1.3.1.3 Laufende Kontrolle der Schichtung  ===
  
=== Während der Befragungsphase laufende Kontrolle der Schichtung erforderlich ===
+
==== Während der Befragungsphase laufende Kontrolle der Schichtung erforderlich ====
  
Bei einem quantitativen Forschungsprojekt führt man laufend Erhebungen, meist mit Fragebögen, durch. Dabei muss man stets einen Überblick über die '''Verteilung[1]''' der bereits Interviewten haben, um Abweichungen von der Verteilung in der '''Grundpopulation[2]''' korrigieren zu können. Wie? Indem man die nächsten Interviewten aus Personengruppen wählt, die bisher '''unterrepräsentiert''' waren, deren bisheriger Anteil in der Stichprobe also deutlich geringer als ihr Anteil in der Grundpopulation ist.
+
Bei einem quantitativen Forschungsprojekt führt man laufend Erhebungen, meist mit Fragebögen, durch. Dabei muss man stets einen Überblick über die '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' der bereits Interviewten haben, um Abweichungen von der Verteilung in der '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' korrigieren zu können. Wie? Indem man die nächsten Interviewten aus Personengruppen wählt, die bisher '''unterrepräsentiert''' waren, deren bisheriger Anteil in der Stichprobe also deutlich geringer als ihr Anteil in der Grundpopulation ist.
  
=== Berechnung ===
+
==== Berechnung ====
  
 
Bei ganz kleinen Umfragen kann man die '''Aufteilungsverhältnisse''' mit einer Matrix kontrollieren, in die man laufend mit ‚Stricherln’ einträgt, wen man interviewt hat. Nehmen wir an, in der Grundpopulation hätten wir eine Verteilung von 55 % Männern und 45 % Frauen bzw. von 25 % AkademikerInnen und 75 % NichtakademikerInnen. Mit den '''Schichtungsfragen''' stellen wir fest, ob die Verteilung der Interviewten mit der der Grundpopulation übereinstimmt. Daher müssen Schichtungsfragen auch fester Bestandteil der Fragebögen sein. Bisher haben wir folgende Interviews geführt:  
 
Bei ganz kleinen Umfragen kann man die '''Aufteilungsverhältnisse''' mit einer Matrix kontrollieren, in die man laufend mit ‚Stricherln’ einträgt, wen man interviewt hat. Nehmen wir an, in der Grundpopulation hätten wir eine Verteilung von 55 % Männern und 45 % Frauen bzw. von 25 % AkademikerInnen und 75 % NichtakademikerInnen. Mit den '''Schichtungsfragen''' stellen wir fest, ob die Verteilung der Interviewten mit der der Grundpopulation übereinstimmt. Daher müssen Schichtungsfragen auch fester Bestandteil der Fragebögen sein. Bisher haben wir folgende Interviews geführt:  
Line 546: Line 672:
 
=== 2.1.3.2 Zufallsstichproben  ===
 
=== 2.1.3.2 Zufallsstichproben  ===
  
Unter '''Zufallsstichproben''' versteht man Auswahlverfahren einer '''Stichprobe''', bei welchen bei einem theoretisch vorliegenden Register aller Elemente der '''Grundgesamtheit[1]''' die Elemente der '''Stichprobe''' zufällig gezogen werden.
+
Unter '''Zufallsstichproben''' versteht man Auswahlverfahren einer '''Stichprobe''', bei welchen bei einem theoretisch vorliegenden Register aller Elemente der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' die Elemente der '''Stichprobe''' zufällig gezogen werden.
  
 
Man vergleiche dies mit einer Lottoziehung. Man hat ein Register von 45 Lotto-Zahlen, welche die gleiche Ziehungwahrscheinlichkeit aufweisen. Aus diesen werden beim Lotto insgesamt sechs Zahlen gezogen.
 
Man vergleiche dies mit einer Lottoziehung. Man hat ein Register von 45 Lotto-Zahlen, welche die gleiche Ziehungwahrscheinlichkeit aufweisen. Aus diesen werden beim Lotto insgesamt sechs Zahlen gezogen.
Line 552: Line 678:
 
Man unterscheidet zwischen '''einfachen''' und '''systematischen Zufallsstichproben.''' Eine Sonderform der '''Zufallsstichproben''' sind die '''geschichteten Zuallsstichproben.'''
 
Man unterscheidet zwischen '''einfachen''' und '''systematischen Zufallsstichproben.''' Eine Sonderform der '''Zufallsstichproben''' sind die '''geschichteten Zuallsstichproben.'''
  
=== '''Allgemeines Problem von Zufallsstichproben:''' ===
+
==== '''Allgemeines Problem von Zufallsstichproben:''' ====
  
 
Es ist äußerst schwierig, Register aufzutreiben oder zu erstellen, welche tatsächlich jedem Element der Grundgesamtheit die gleiche Chance des Gezogenwerdens erlauben. Im Telefonregister scheinen viele Nummern nicht auf, da sie als Geheimnummern unterdrückt werden. Geheimnummern werden wiederum häufiger von besser etablierten Personen verwendet, weshalb sie über das Telefonregister eine geringere Chance haben, erreicht zu werden.
 
Es ist äußerst schwierig, Register aufzutreiben oder zu erstellen, welche tatsächlich jedem Element der Grundgesamtheit die gleiche Chance des Gezogenwerdens erlauben. Im Telefonregister scheinen viele Nummern nicht auf, da sie als Geheimnummern unterdrückt werden. Geheimnummern werden wiederum häufiger von besser etablierten Personen verwendet, weshalb sie über das Telefonregister eine geringere Chance haben, erreicht zu werden.
Line 564: Line 690:
 
-----
 
-----
  
==== 2.1.3.2.1 Einfache Zufallsstichprobe  ====
+
=== 2.1.3.2.1 Einfache Zufallsstichprobe  ===
  
 
Bei der '''einfachen Zufallsstichprobe''' gibt es keinerlei Systematik der Ziehung.
 
Bei der '''einfachen Zufallsstichprobe''' gibt es keinerlei Systematik der Ziehung.
Line 573: Line 699:
 
-----
 
-----
  
==== 2.1.3.2.2 Systematische Zufallsstichprobe  ====
+
=== 2.1.3.2.2 Systematische Zufallsstichprobe  ===
  
 
Bei der '''systematischen Zufallsstichprobe''' erfolgt die Ziehung mit System, mit einem bestimmten Ziehungsschlüssel, und damit nicht mehr ganz zufällig.
 
Bei der '''systematischen Zufallsstichprobe''' erfolgt die Ziehung mit System, mit einem bestimmten Ziehungsschlüssel, und damit nicht mehr ganz zufällig.
Line 580: Line 706:
 
Man möchte die Einstellung der Wiener Bevölkerung zur Fristenlösung befragen. Man nimmt das Telefonbuch der Stadt Wien und wählt jede 100. Telefonnummer an.
 
Man möchte die Einstellung der Wiener Bevölkerung zur Fristenlösung befragen. Man nimmt das Telefonbuch der Stadt Wien und wählt jede 100. Telefonnummer an.
  
=== '''Potentielle Probleme der systematischen Zufallsstichproben:''' ===
+
==== '''Potentielle Probleme der systematischen Zufallsstichproben:''' ====
  
 
Ein Problem dieses Verfahrens kann in einer nicht erkannten Systematik der Verteilung liegen. Wenn man alle Personen befragt, welche jeweils die Türnummer 1 in den Häusern aufweisen, dann wäre die Wahrscheinlichkeit groß, dass Hausmeister deutlich überrrepräsentiert sind.
 
Ein Problem dieses Verfahrens kann in einer nicht erkannten Systematik der Verteilung liegen. Wenn man alle Personen befragt, welche jeweils die Türnummer 1 in den Häusern aufweisen, dann wäre die Wahrscheinlichkeit groß, dass Hausmeister deutlich überrrepräsentiert sind.
  
=== '''Systematik darf nicht zu starr sein:''' ===
+
==== '''Systematik darf nicht zu starr sein:''' ====
  
 
Daher sollte die Systematik nicht zu starr sein. Man könnte z.B. bei der ersten Befragung im 1. Haus das Alter der Person abfragen und aus dem Alter die Türnummer des nächsten abzufragenden Hauses ermitteln, z.B. aus der Ziffernsumme. Nehmen wir an, ein Alter von 32 wird angegeben, dann ist die Ziffernsumme 3+2 = 5, beim nächsten Haus wird also die BewohnerIn der Türnummer 5 befragt usw.
 
Daher sollte die Systematik nicht zu starr sein. Man könnte z.B. bei der ersten Befragung im 1. Haus das Alter der Person abfragen und aus dem Alter die Türnummer des nächsten abzufragenden Hauses ermitteln, z.B. aus der Ziffernsumme. Nehmen wir an, ein Alter von 32 wird angegeben, dann ist die Ziffernsumme 3+2 = 5, beim nächsten Haus wird also die BewohnerIn der Türnummer 5 befragt usw.
Line 593: Line 719:
 
-----
 
-----
  
==== 2.1.3.2.3 Geschichtete Zufallsstichprobe  ====
+
=== 2.1.3.2.3 Geschichtete Zufallsstichprobe  ===
  
 
Eine Sonderform der '''Zufallsstichprobe''' ist die '''geschichtete Zufallsstichprobe''.''''' Bei dieser findet zuerst eine Einteilung der Stichprobe in sich nicht überlappende Schichten statt. Aus diesen werden wiederum '''einfache''' oder '''systematische Zufallsstichproben''' entnommen.
 
Eine Sonderform der '''Zufallsstichprobe''' ist die '''geschichtete Zufallsstichprobe''.''''' Bei dieser findet zuerst eine Einteilung der Stichprobe in sich nicht überlappende Schichten statt. Aus diesen werden wiederum '''einfache''' oder '''systematische Zufallsstichproben''' entnommen.
  
=== '''Beispiel: Befragung von WienerInnen''' ===
+
==== '''Beispiel: Befragung von WienerInnen''' ====
  
 
Man entscheidet sich zuerst für eine Berücksichtigung der Größenverhältnisse der einzelnen Bezirke, danach realisiert man mit der festgelegten Anzahl von Personen aus diesen Bezirken '''einfache''' oder '''systematische Zufallsstichproben.'''
 
Man entscheidet sich zuerst für eine Berücksichtigung der Größenverhältnisse der einzelnen Bezirke, danach realisiert man mit der festgelegten Anzahl von Personen aus diesen Bezirken '''einfache''' oder '''systematische Zufallsstichproben.'''
Line 611: Line 737:
 
Eine LehrerIn fragt in der Schule, welche SchülerInnen sich bereit erklären, bei einem sportlichen Ausdauertraining mit Vor- und Nachtest mitzumachen. Eine kleine Zahl von SchülerInnen meldet sich, die wahrscheinlich um einiges fitter als die anderen sind.
 
Eine LehrerIn fragt in der Schule, welche SchülerInnen sich bereit erklären, bei einem sportlichen Ausdauertraining mit Vor- und Nachtest mitzumachen. Eine kleine Zahl von SchülerInnen meldet sich, die wahrscheinlich um einiges fitter als die anderen sind.
  
=== '''Sinnvoll für Rückschlüsse auf Methoden''' ===
+
==== '''Sinnvoll für Rückschlüsse auf Methoden''' ====
  
 
Auch eine derartige Auswahl kann sinnvoll sein, wenn man z.B. messen möchte, ob sich die Fitness der ausgewählten TeilnehmerInnen durch das Training verbesserte. In der Medizin verwendet man oft dieses Auswahlverfahren, um die Wirksamkeit von Medikamenten zu testen.
 
Auch eine derartige Auswahl kann sinnvoll sein, wenn man z.B. messen möchte, ob sich die Fitness der ausgewählten TeilnehmerInnen durch das Training verbesserte. In der Medizin verwendet man oft dieses Auswahlverfahren, um die Wirksamkeit von Medikamenten zu testen.
  
=== '''Kein Rückschluss auf die Grundgesamtheit''' ===
+
==== '''Kein Rückschluss auf die Grundgesamtheit''' ====
  
 
Ein Rückschluss auf die Grundgesamtheit ist jedoch mit dem '''willkürlichen Auswahlverfahren''' nicht erlaubt.
 
Ein Rückschluss auf die Grundgesamtheit ist jedoch mit dem '''willkürlichen Auswahlverfahren''' nicht erlaubt.
Line 631: Line 757:
 
== 2.1.4 Repräsentativität ==
 
== 2.1.4 Repräsentativität ==
  
Unter '''Repräsentativität''' versteht man die angestrebte Eigenschaft von statistischen Erhebungen, die Grundgesamtheit in der ausgewählten Stichprobe möglichst unverzerrt nachzubilden. Eine statistische Erhebung ist '''repräsentativ''', wenn sie auf einer '''Zufallsstichprobe''' basiert und Aussagen über die '''Grundgesamtheit[1]''' zulässt.
+
Unter '''Repräsentativität''' versteht man die angestrebte Eigenschaft von statistischen Erhebungen, die Grundgesamtheit in der ausgewählten Stichprobe möglichst unverzerrt nachzubilden. Eine statistische Erhebung ist '''repräsentativ''', wenn sie auf einer '''Zufallsstichprobe''' basiert und Aussagen über die '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' zulässt.
  
 
Damit von der Stichprobe auf die Grundgesamtheit geschlossen werden kann, müssen bei den verschiedenen '''Formen der Ziehungen''' folgende Bedingungen erfüllt sein:
 
Damit von der Stichprobe auf die Grundgesamtheit geschlossen werden kann, müssen bei den verschiedenen '''Formen der Ziehungen''' folgende Bedingungen erfüllt sein:
Line 648: Line 774:
 
== 2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist? ==
 
== 2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist? ==
  
Sollte es unmöglich sein, statistische Daten über die Schichtung der '''Grundpopulation[1]''' zu erhalten, kann man entweder
+
Sollte es unmöglich sein, statistische Daten über die Schichtung der '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' zu erhalten, kann man entweder
  
 
* '''aufgrund vermutlich vergleichbarer Grundpopulationen verallgemeinern.''' Nehmen wir an, wir kennen den Frauenanteil von SudanesInnen in Wien nicht, Die ZuwanderInnen aus verschiedenen anderen vergleichbaren afrikanischen Ländern (islamisch, arabisch - englisch) weisen einen Frauenanteil von etwa 40 % auf, dann könnte man auch bei Sudanesinnen diesen Wert als Arbeitshypothese ansetzen. Man sollte jedoch unbedingt in der Publikation auf dieses Problem und die daraus folgende Annahme einer bestimmten Schichtung hinweisen.
 
* '''aufgrund vermutlich vergleichbarer Grundpopulationen verallgemeinern.''' Nehmen wir an, wir kennen den Frauenanteil von SudanesInnen in Wien nicht, Die ZuwanderInnen aus verschiedenen anderen vergleichbaren afrikanischen Ländern (islamisch, arabisch - englisch) weisen einen Frauenanteil von etwa 40 % auf, dann könnte man auch bei Sudanesinnen diesen Wert als Arbeitshypothese ansetzen. Man sollte jedoch unbedingt in der Publikation auf dieses Problem und die daraus folgende Annahme einer bestimmten Schichtung hinweisen.
Line 659: Line 785:
  
  
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|Nächstes Kapitel: 2.2 Die Operationalisierung]]'''
 +
----
 +
[[#2.1 Die Grundpopulation: worüber wir Aussagen machen|&uarr; Nach oben]]
 +
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Vorheriges Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
 
= 2.2 Die Operationalisierung =
 
= 2.2 Die Operationalisierung =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
Unter '''Operationalisierung''' versteht man die präzise Angabe der Vorgangsweise, mit der ein theoretisches Konstrukt gemessen werden soll (wie z.B. die Akzeptanz von Zuwanderergruppen). Dazu gehört die Auswahl der '''Indikatoren''', die genaue Formulierung der Fragen im '''Fragebogen''', dazu gehören die '''Antwortkategorien''', die Bestimmung der '''Messinstrumente''', die '''Bestimmung der Genauigkeit der Messung''', die '''Anweisungen an die InterviewerInnen''', wie sie die Fragen stellen und welche Zusatzinformationen sie geben dürfen etc. '''Operationalisierung[1]''' versucht also bis ins kleinste Detail sicherzustellen, dass die '''wissenschaftlichen Qualitätserfordernisse[2]''' für vergleichbare Forschungsarbeiten eingehalten werden können und tatsächlich brauchbare Antworten zu den Themen gefunden werden können, die man zu untersuchen vorgibt.
+
Unter '''Operationalisierung''' versteht man die präzise Angabe der Vorgangsweise, mit der ein theoretisches Konstrukt gemessen werden soll (wie z.B. die Akzeptanz von Zuwanderergruppen). Dazu gehört die Auswahl der '''Indikatoren''', die genaue Formulierung der Fragen im '''Fragebogen''', dazu gehören die '''Antwortkategorien''', die Bestimmung der '''Messinstrumente''', die '''Bestimmung der Genauigkeit der Messung''', die '''Anweisungen an die InterviewerInnen''', wie sie die Fragen stellen und welche Zusatzinformationen sie geben dürfen etc. '''Operationalisierung[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.1.1 Operationale Definition: Operationalisierung|[1]]]''' versucht also bis ins kleinste Detail sicherzustellen, dass die '''wissenschaftlichen Qualitätserfordernisse[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2]]]''' für vergleichbare Forschungsarbeiten eingehalten werden können und tatsächlich brauchbare Antworten zu den Themen gefunden werden können, die man zu untersuchen vorgibt.
  
=== '''Was man untersucht bzw. ’misst’, muss in seinen Ausprägungen in sinnvolle und voneinander abgrenzbare Untereinheiten unterteilt werden können.''' ===
+
==== '''Was man untersucht bzw. ’misst’, muss in seinen Ausprägungen in sinnvolle und voneinander abgrenzbare Untereinheiten unterteilt werden können.''' ====
  
 
Untersucht man z.B. die mathematischen Fähigkeiten von Schulkindern, kann man zur Notenskala greifen. Das Geschlecht kann in männlich und weiblich unterteilt werden. Bei der Untersuchung der Körpergröße wird man in Maßeinheiten wie cm oder mm messen. Die Einstellung gegenüber Zuwanderergruppen können wir z.B. in einer fünfteiligen Abstufung wiedergeben, wie z.B. ’sehr positiv’, ’eher positiv’, ’neutral’, ’eher ablehnend’ oder ’absolut ablehnend’. Den Erfolg bei den Bewerbungen von Zuwanderern am Arbeitsmarkt könnte man unterteilen in ’sofort abgelehnt’, ’zu Bewerbungsgespräch eingeladen, aber dann abgelehnt’ und ’aufgenommen’ unterteilen. Den Familienstand kann man in ’ledig’, ’geschieden’, ’verheiratet’, ’verwitwet’ unterteilen.
 
Untersucht man z.B. die mathematischen Fähigkeiten von Schulkindern, kann man zur Notenskala greifen. Das Geschlecht kann in männlich und weiblich unterteilt werden. Bei der Untersuchung der Körpergröße wird man in Maßeinheiten wie cm oder mm messen. Die Einstellung gegenüber Zuwanderergruppen können wir z.B. in einer fünfteiligen Abstufung wiedergeben, wie z.B. ’sehr positiv’, ’eher positiv’, ’neutral’, ’eher ablehnend’ oder ’absolut ablehnend’. Den Erfolg bei den Bewerbungen von Zuwanderern am Arbeitsmarkt könnte man unterteilen in ’sofort abgelehnt’, ’zu Bewerbungsgespräch eingeladen, aber dann abgelehnt’ und ’aufgenommen’ unterteilen. Den Familienstand kann man in ’ledig’, ’geschieden’, ’verheiratet’, ’verwitwet’ unterteilen.
Line 670: Line 804:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-43.html<br />
+
[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.1.1 Operationale Definition: Operationalisierung|[1] Siehe Kapitel 2.7.1.1 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2] Siehe Kapitel 2.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2] Siehe Kapitel 2.3]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
</div>
  
 
== 2.2.1 Die Suche nach Indikatoren ==
 
== 2.2.1 Die Suche nach Indikatoren ==
  
Im Forschungsentwurf werden verschiedene '''Hypothesen''' formuliert. Nun benötigt man eine Reihe von '''Indikatoren''', um die '''Hypothesen[1]''' beibehalten bzw. verwerfen zu können.
+
Im Forschungsentwurf werden verschiedene '''Hypothesen''' formuliert. Nun benötigt man eine Reihe von '''Indikatoren''', um die '''Hypothesen[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.4 Hypothesen|[1]]]''' beibehalten bzw. verwerfen zu können.
  
 
In vielen Fällen ist die Suche nach den '''Indikatoren''' einfach. Möchte man z.B. ermitteln, wie warm zur gleichen Jahreszeit verschiedene Orte sind, dann genügt eine Messung mit dem Thermometer. Meist jedoch sind die Forschungsfragen komplexer und nicht mit einer einzigen konkreten Messungsart zu beantworten.
 
In vielen Fällen ist die Suche nach den '''Indikatoren''' einfach. Möchte man z.B. ermitteln, wie warm zur gleichen Jahreszeit verschiedene Orte sind, dann genügt eine Messung mit dem Thermometer. Meist jedoch sind die Forschungsfragen komplexer und nicht mit einer einzigen konkreten Messungsart zu beantworten.
Line 693: Line 838:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-49.html<br />
+
[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.4 Hypothesen|[1] Siehe Kapitel 2.7.4 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 
 
  
 
== 2.2.2 Das Messen ==
 
== 2.2.2 Das Messen ==
Line 702: Line 846:
 
Misst man die Temperatur eines Körpers, wird man in unseren Regionen in der Messgröße Celsius messen, in anderen in Fahrenheit etc. Messen wir die Körpergröße, dann messen wir bei größeren Körpern in Metern und Zentimetern, bei Kleinstlebewesen aber auch in Millionstel Metern und darunter. Messen wir das Haushaltseinkommen, werden wir in Euro messen. Bei der Messung von Einstellungen und sozialen Sachverhalten kann man selbst die Messgrößen bestimmen. So könnte man bei der Einschätzung der Sympathie für eine bestimmte Kultur fünf verschiedene Messgrößen festlegen, wie z.B. ’sehr sympathisch’, ’sympathisch’, ’neutral’, ’weniger sympathisch’ und ’unsympathisch’.  
 
Misst man die Temperatur eines Körpers, wird man in unseren Regionen in der Messgröße Celsius messen, in anderen in Fahrenheit etc. Messen wir die Körpergröße, dann messen wir bei größeren Körpern in Metern und Zentimetern, bei Kleinstlebewesen aber auch in Millionstel Metern und darunter. Messen wir das Haushaltseinkommen, werden wir in Euro messen. Bei der Messung von Einstellungen und sozialen Sachverhalten kann man selbst die Messgrößen bestimmen. So könnte man bei der Einschätzung der Sympathie für eine bestimmte Kultur fünf verschiedene Messgrößen festlegen, wie z.B. ’sehr sympathisch’, ’sympathisch’, ’neutral’, ’weniger sympathisch’ und ’unsympathisch’.  
  
=== '''Die Antwortkategorien müssen fair und ausgewogen sein''' ===
+
==== '''Die Antwortkategorien müssen fair und ausgewogen sein''' ====
  
 
Es wäre tendenziös und unseriös, in der obigen Sympathie-Skala im positiven Bereich nur ’sehr sympathisch’ anzugeben, im negativen jedoch die zwei vorhandenen Unterscheidungen. Dies könnte dazu führen, dass Antwortende, die nur eine leichte Sympathie für die andere Kultur empfinden, zum neutralen Wert ausweichen. Daher gilt als Grundregel, dass die Zahl der möglichen Antwortvarianten bei derartigen Fragen im negativen Bereich genauso hoch wie im positiven Bereich sein soll.
 
Es wäre tendenziös und unseriös, in der obigen Sympathie-Skala im positiven Bereich nur ’sehr sympathisch’ anzugeben, im negativen jedoch die zwei vorhandenen Unterscheidungen. Dies könnte dazu führen, dass Antwortende, die nur eine leichte Sympathie für die andere Kultur empfinden, zum neutralen Wert ausweichen. Daher gilt als Grundregel, dass die Zahl der möglichen Antwortvarianten bei derartigen Fragen im negativen Bereich genauso hoch wie im positiven Bereich sein soll.
Line 715: Line 859:
 
Unter '''Messfehler''' versteht man die Abweichung des Ergebnisses von Messungen von den realen Gegebenheiten. Wo eine Messung erfolgt, sollte man immer die Möglichkeit von Messfehlern berücksichtigen. Man kann zwischen '''zufälligen''', '''systematischen und fahrlässigen Messfehlern''' unterscheiden.
 
Unter '''Messfehler''' versteht man die Abweichung des Ergebnisses von Messungen von den realen Gegebenheiten. Wo eine Messung erfolgt, sollte man immer die Möglichkeit von Messfehlern berücksichtigen. Man kann zwischen '''zufälligen''', '''systematischen und fahrlässigen Messfehlern''' unterscheiden.
  
=== '''A. Zufällige Messfehler:''' ===
+
==== '''A. Zufällige Messfehler:''' ====
  
Zufällige Messfehler sind von den Messenden nicht zu kontrollieren. Wenn man zum Beispiel eine bestimmte Personengruppe zu einem sensiblen Thema befragen möchte und gerade am Tag vorher ein (den InterviewerInnen unbekanntes) Ereignis eintritt, welches ihre Neigung zu ehrlichen Antworten temporär verändert, während bei Vergleichsgruppen im gleichen Zeitraum nichts Vergleichbares auftritt, können verfälschte Ergebnisse auftreten. Misst man die Regenfälle in der Sahelgegend, kann es sein, dass ein Ort deutlich besser und gleichmäßiger beregnet wird, als die nicht gemessenen Nachbarorte, im nächsten Jahr kann es umgekehrt sein. Es gibt jedoch einen sogenannten '''Zentralen Grenzwertsatz der Statistik (Wikibooks)[1]''', nach welchem zufällige Fehler sich im Laufe der Zeit ausgleichen und einer Normalverteilung zustreben. Man kann daher postulieren, dass die zufälligen Messfehler bei häufigen Messungen zum Ausgleich tendieren.
+
Zufällige Messfehler sind von den Messenden nicht zu kontrollieren. Wenn man zum Beispiel eine bestimmte Personengruppe zu einem sensiblen Thema befragen möchte und gerade am Tag vorher ein (den InterviewerInnen unbekanntes) Ereignis eintritt, welches ihre Neigung zu ehrlichen Antworten temporär verändert, während bei Vergleichsgruppen im gleichen Zeitraum nichts Vergleichbares auftritt, können verfälschte Ergebnisse auftreten. Misst man die Regenfälle in der Sahelgegend, kann es sein, dass ein Ort deutlich besser und gleichmäßiger beregnet wird, als die nicht gemessenen Nachbarorte, im nächsten Jahr kann es umgekehrt sein. Es gibt jedoch einen sogenannten '''Zentralen Grenzwertsatz der Statistik (Wikibooks)[https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz &#91;1&#93;]''', nach welchem zufällige Fehler sich im Laufe der Zeit ausgleichen und einer Normalverteilung zustreben. Man kann daher postulieren, dass die zufälligen Messfehler bei häufigen Messungen zum Ausgleich tendieren.
  
=== '''B. Systematische Messfehler:''' ===
+
==== '''B. Systematische Messfehler:''' ====
  
 
Systematische Messfehler können durch '''fehlerhafte Messgeräte''' entstehen, wie z.B. die Gewichtsmessung durch eine verstellte Waage; die Zeitmessung durch eine ungenaue Uhr; aber auch z.B. eine Kommunikationsform, welche den Zugang zu manchen Informationen kaum erlaubt. So ist es möglich, dass besonders hoch emotionale Angelegenheiten in einer Fremdsprache zu anderen Antworten als in seiner Muttersprache führen. Man überlege sich, ob es einem in einer Fremdsprache ähnlich schwer wie in seiner Muttersprache fällt, z.B. ''Ich liebe Dich'' zu sagen, wo beim Aussprechen ähnlicher Sätze auch Assoziationen mit Enttäuschungen u.a. verbunden sein können und damit auch die Angst vor Zurückweisung.
 
Systematische Messfehler können durch '''fehlerhafte Messgeräte''' entstehen, wie z.B. die Gewichtsmessung durch eine verstellte Waage; die Zeitmessung durch eine ungenaue Uhr; aber auch z.B. eine Kommunikationsform, welche den Zugang zu manchen Informationen kaum erlaubt. So ist es möglich, dass besonders hoch emotionale Angelegenheiten in einer Fremdsprache zu anderen Antworten als in seiner Muttersprache führen. Man überlege sich, ob es einem in einer Fremdsprache ähnlich schwer wie in seiner Muttersprache fällt, z.B. ''Ich liebe Dich'' zu sagen, wo beim Aussprechen ähnlicher Sätze auch Assoziationen mit Enttäuschungen u.a. verbunden sein können und damit auch die Angst vor Zurückweisung.
Line 725: Line 869:
 
Ein Teil der systematischen Messfehler kann durch '''stetige Kontrolle''' und '''kritische Hinterfragung''' der Messinstrumente behoben werden.
 
Ein Teil der systematischen Messfehler kann durch '''stetige Kontrolle''' und '''kritische Hinterfragung''' der Messinstrumente behoben werden.
  
=== '''C. Fahrlässige Messfehler:''' ===
+
==== '''C. Fahrlässige Messfehler:''' ====
  
 
'''Grobe Messfehler''' '''beruhen auf menschlichen Fehlern'''. Man trägt z.B. beim Alter 15 statt 51 ein, schreibt eine Antwort in die falsche Spalte; vergisst eine Frage zu stellen oder zu beantworten. Man vermittelt beim Interview eigene Einstellungen, welche mit großer Wahrscheinlichkeit zu einer veränderten Reaktion des Befragten führen (wenn man z.B. einem Befragten deutlich zeigt, dass man seine Einstellungen und Meinungen geringschätzt).
 
'''Grobe Messfehler''' '''beruhen auf menschlichen Fehlern'''. Man trägt z.B. beim Alter 15 statt 51 ein, schreibt eine Antwort in die falsche Spalte; vergisst eine Frage zu stellen oder zu beantworten. Man vermittelt beim Interview eigene Einstellungen, welche mit großer Wahrscheinlichkeit zu einer veränderten Reaktion des Befragten führen (wenn man z.B. einem Befragten deutlich zeigt, dass man seine Einstellungen und Meinungen geringschätzt).
Line 731: Line 875:
 
Weiterführendes zu Messfehlern:
 
Weiterführendes zu Messfehlern:
  
'''Messfehler (Wikipedia)[2]'''
+
'''Messfehler (Wikipedia)[http://de.wikipedia.org/wiki/Messfehler &#91;2&#93;]'''
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz<br />
+
[https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz &#91;1&#93; https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz]<br />
[2] http://de.wikipedia.org/wiki/Messfehler<br />
+
[http://de.wikipedia.org/wiki/Messfehler &#91;2&#93; http://de.wikipedia.org/wiki/Messfehler]<br />
  
  
Line 746: Line 890:
 
In einem Codeplan halten wir eindeutig fest, '''welchen Variablennamen Fragen des Fragebogens entsprechen''', '''wie verschiedene Ausprägungen von Variablen gemessen werden''' (z.B. in cm für die Körpergröße oder in Ja/Nein für bestimmte Erfahrungen) und '''wie diese Ausprägungen in eine numerische Form übersetzt werden''', was überhaupt erst eine maschinelle quantitative Analyse erlaubt.
 
In einem Codeplan halten wir eindeutig fest, '''welchen Variablennamen Fragen des Fragebogens entsprechen''', '''wie verschiedene Ausprägungen von Variablen gemessen werden''' (z.B. in cm für die Körpergröße oder in Ja/Nein für bestimmte Erfahrungen) und '''wie diese Ausprägungen in eine numerische Form übersetzt werden''', was überhaupt erst eine maschinelle quantitative Analyse erlaubt.
  
=== '''Statistikprogramme benötigen automatisch interpretierbare Datentypen''' ===
+
==== '''Statistikprogramme benötigen automatisch interpretierbare Datentypen''' ====
  
Statistikprogramme benötigen für Berechnungen bestimmte Datentypen, die in der Regel '''numerisch''' sind. Kein Statistikprogramm kann in den Antwortkategorien ’sehr’, ’eher schon’, ’durchschnittlich’, ’eher weniger’, ’überhaupt nicht’ eine logische Reihe erkennen, dass also diese Bezeichnungen für verschiedene logische Abstufungen stehen, nämlich für eine '''Ordinalskala[1]'''.
+
Statistikprogramme benötigen für Berechnungen bestimmte Datentypen, die in der Regel '''numerisch''' sind. Kein Statistikprogramm kann in den Antwortkategorien ’sehr’, ’eher schon’, ’durchschnittlich’, ’eher weniger’, ’überhaupt nicht’ eine logische Reihe erkennen, dass also diese Bezeichnungen für verschiedene logische Abstufungen stehen, nämlich für eine '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1]]]'''.
  
 
Damit ein Statistikprogramm wie '''SPSS''' die logische Reihenfolge erkennen und danach Analysen über diese bilden kann, müssen die Textwerte in numerische umcodiert werden. Im '''Codeplan''', d.h. der Dokumentation über die ursprünglichen Text- Begriffe und ihrer numerischen Entsprechungen, werden diese Umcodierungen festgehalten. Im obigen Beispiel könnte man ’sehr’ immer durch 1, ’eher schon’ durch 2, ’durchschnittlich’ durch 3, ’eher weniger’ durch 4 und ’überhaupt nicht’ durch 5 ersetzen. Nun ist eine für die Software durchgehende Reihe von 1-5 entstanden, die vom kleinsten zum größten Wert gereiht ist.
 
Damit ein Statistikprogramm wie '''SPSS''' die logische Reihenfolge erkennen und danach Analysen über diese bilden kann, müssen die Textwerte in numerische umcodiert werden. Im '''Codeplan''', d.h. der Dokumentation über die ursprünglichen Text- Begriffe und ihrer numerischen Entsprechungen, werden diese Umcodierungen festgehalten. Im obigen Beispiel könnte man ’sehr’ immer durch 1, ’eher schon’ durch 2, ’durchschnittlich’ durch 3, ’eher weniger’ durch 4 und ’überhaupt nicht’ durch 5 ersetzen. Nun ist eine für die Software durchgehende Reihe von 1-5 entstanden, die vom kleinsten zum größten Wert gereiht ist.
Line 797: Line 941:
 
Falls Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen möchten, können Sie einen Bereich angeben (z.B. ''Bereich'' 20 ''bis'' 29), wenn Sie alle zwischen 20-29jährigen in eine einzige Altersklasse ’zwischen 20 und 30' einbringen möchten). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf ''Hinzufügen.''
 
Falls Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen möchten, können Sie einen Bereich angeben (z.B. ''Bereich'' 20 ''bis'' 29), wenn Sie alle zwischen 20-29jährigen in eine einzige Altersklasse ’zwischen 20 und 30' einbringen möchten). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf ''Hinzufügen.''
  
Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert. Erst jetzt wäre es Ihnen möglich, dass SPSS die Ausbildung nach Jahren und Qualität sinnvoll reihen kann und natürlich auch viele weitere (damit zusammenhängenden) Analysen rechnen kann. So wäre erst jetzt die Berechnung einer '''Korrelation[1]''' zwischen dem Ausbildungsgrad und dem Einkommen möglich.
+
Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert. Erst jetzt wäre es Ihnen möglich, dass SPSS die Ausbildung nach Jahren und Qualität sinnvoll reihen kann und natürlich auch viele weitere (damit zusammenhängenden) Analysen rechnen kann. So wäre erst jetzt die Berechnung einer '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' zwischen dem Ausbildungsgrad und dem Einkommen möglich.
  
  
Line 823: Line 967:
 
[[File:quantitative-33_3.gif|frame|center|Tabelle mit Wertelabels]]
 
[[File:quantitative-33_3.gif|frame|center|Tabelle mit Wertelabels]]
  
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|Nächstes Kapitel: 2.3 Gütekriterien quantitativer Untersuchungen]]'''
 +
----
 +
[[#2.2 Die Operationalisierung|&uarr; Nach oben]]
 +
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|Vorheriges Kapitel: 2.2 Die Operationalisierung]]'''
 
= 2.3 Gütekriterien quantitativer Untersuchungen =
 
= 2.3 Gütekriterien quantitativer Untersuchungen =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
Statistische Untersuchungen müssen wie jede andere Form wissenschaftlicher Betätigung den '''Kernansprüchen[1]''' der '''Reliabilität''', der '''Validität''' und der '''Objektivität''' genügen:
+
Statistische Untersuchungen müssen wie jede andere Form wissenschaftlicher Betätigung den '''Kernansprüchen[[Forschungsablauf/Qualitaet#4.3.1 Quantitative Qualitätskriterien|[1]]]''' der '''Reliabilität''', der '''Validität''' und der '''Objektivität''' genügen:
  
=== '''Reliabilität:''' ===
+
==== '''Reliabilität:''' ====
  
 
Unter Reliabilität oder '''Zuverlässigkeit''' versteht man die '''formale Genauigkeit wissenschaftlicher Untersuchungen'''. Darunter versteht man, dass die Untersuchungen mit einem Höchstmaß an Anstrengungen verbunden werden, Messfehler jeder Art auszuschließen. Reliabilität ist somit ein '''Indikator''' für die '''Replizierbarkeit''' (Wiederholbarkeit) der Ergebnisse. Fragen müssen z.B. so eindeutig formuliert sein, dass sie nicht höchst unterschiedlich verstanden werden können.
 
Unter Reliabilität oder '''Zuverlässigkeit''' versteht man die '''formale Genauigkeit wissenschaftlicher Untersuchungen'''. Darunter versteht man, dass die Untersuchungen mit einem Höchstmaß an Anstrengungen verbunden werden, Messfehler jeder Art auszuschließen. Reliabilität ist somit ein '''Indikator''' für die '''Replizierbarkeit''' (Wiederholbarkeit) der Ergebnisse. Fragen müssen z.B. so eindeutig formuliert sein, dass sie nicht höchst unterschiedlich verstanden werden können.
  
=== '''Validität:''' ===
+
==== '''Validität:''' ====
  
 
'''Validität''' liegt vor, wenn wenn die gewählten Indikatoren, Fragen und Antwortmöglichkieten wirklich und präzise das messen, was gemessen werden soll.
 
'''Validität''' liegt vor, wenn wenn die gewählten Indikatoren, Fragen und Antwortmöglichkieten wirklich und präzise das messen, was gemessen werden soll.
Line 837: Line 989:
 
Wenn man die Frage stellt, ob der Proband Schweinefleisch isst, so ist die Verneinung noch keineswegs ein Beweis dafür, dass er Vegetarier ist, sondern nur, dass er eben Schweinefleisch aus verschiedenen Gründen nicht mag. Wäre die Frage nach dem Essen von Schweinefleisch die einzige auf Fleisch bezogene Frage im Fragebogen, so wäre der Fragebogen nicht valide, um auf Vegetarismus zu schließen.
 
Wenn man die Frage stellt, ob der Proband Schweinefleisch isst, so ist die Verneinung noch keineswegs ein Beweis dafür, dass er Vegetarier ist, sondern nur, dass er eben Schweinefleisch aus verschiedenen Gründen nicht mag. Wäre die Frage nach dem Essen von Schweinefleisch die einzige auf Fleisch bezogene Frage im Fragebogen, so wäre der Fragebogen nicht valide, um auf Vegetarismus zu schließen.
  
=== '''Objektivität:''' ===
+
==== '''Objektivität:''' ====
  
 
Die Objektivität von '''Messverfahren''' und '''Fragen''' ist weitgehend gewährleistet, '''wenn die Wahl der Messenden, InterviewerInnen, PrüferInnen keinen Einfluss auf die Ergebnisse hat'''.
 
Die Objektivität von '''Messverfahren''' und '''Fragen''' ist weitgehend gewährleistet, '''wenn die Wahl der Messenden, InterviewerInnen, PrüferInnen keinen Einfluss auf die Ergebnisse hat'''.
Line 843: Line 995:
 
Objektivität wäre z.B. zweifelhaft, wenn man verunsicherte Männer mit einem persönlich überreichten Fragebogen zu ihrem Sexualleben einmal von ebenfalls verunsicherten Männern und das andere Mal von jungen, attraktiven und selbstbewussten Frauen befragen lassen würde, wobei die Fragen von den InterviewerInnen persönlich gestellt und auch die Antworten von ihnen niedergeschrieben werden. Man würde mit hoher Wahrscheinlichkeit äußerst unterschiedliche Antworten erhalten. Genauso müßte man mit Verfälschungen rechnen, wenn Firmenchefs oder -chefinnen ihre Angestellten zur Zufriedenheit mit ihrer Arbeitssituation befragen.
 
Objektivität wäre z.B. zweifelhaft, wenn man verunsicherte Männer mit einem persönlich überreichten Fragebogen zu ihrem Sexualleben einmal von ebenfalls verunsicherten Männern und das andere Mal von jungen, attraktiven und selbstbewussten Frauen befragen lassen würde, wobei die Fragen von den InterviewerInnen persönlich gestellt und auch die Antworten von ihnen niedergeschrieben werden. Man würde mit hoher Wahrscheinlichkeit äußerst unterschiedliche Antworten erhalten. Genauso müßte man mit Verfälschungen rechnen, wenn Firmenchefs oder -chefinnen ihre Angestellten zur Zufriedenheit mit ihrer Arbeitssituation befragen.
  
'''Gütekriterien und andere Fehlerquellen''' erfordern, dass statistische Untersuchungen stets mit äußerster Sorgfalt durchgeführt werden: von der Erhebung der Daten bis zu deren Analyse, dass also die richtigen Methoden angewandt werden, deren Wahl auf der Eigenart der Daten und ihrer Verteilungen beruht und dass die Interpretation keineswegs über die Aussagekraft der Daten hinausgeht.
+
'''Gütekriterien und andere Fehlerquellen''' erfordern, dass statistische Untersuchungen stets mit äußerster Sorgfalt durchgeführt werden: von der Erhebung der Daten bis zu deren Analyse, dass also die richtigen Methoden angewandt werden, deren Wahl auf der Eigenart der Daten und ihrer Verteilungen beruht und dass die Interpretation keineswegs über die Aussagekraft der Daten hinausgeht.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] &&& http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-76.html<br />
+
[[Forschungsablauf/Qualitaet#4.3.1 Quantitative Qualitätskriterien|[1] Siehe Kapitel 4.3.1 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
  
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|Nächstes Kapitel: 2.4 Fehlerquellen bei statistischer Arbeit]]'''
 +
----
 +
[[#2.3 Gütekriterien quantitativer Untersuchungen|&uarr; Nach oben]]
  
 +
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|Vorheriges Kapitel: 2.3 Gütekriterien quantitativer Untersuchungen]]'''
 
= 2.4 Fehlerquellen bei statistischer Arbeit =
 
= 2.4 Fehlerquellen bei statistischer Arbeit =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
Statistik ist der Versuch, aus einem Ausschnitt der Realität auf die Gesamtheit zu schließen. Dies bedeutet, dass unsere Aussagen über die (gesamte) Realität immer, ohne Ausnahme, mit einem Irrtumsrisiko behaftet sind, da wir nicht über vollständige Daten zur '''Grundgesamtheit[1]''' verfügen. Statistisch sprechen wir dabei von '''Fehlern der ersten und der zweiten Art.'''
+
Statistik ist der Versuch, aus einem Ausschnitt der Realität auf die Gesamtheit zu schließen. Dies bedeutet, dass unsere Aussagen über die (gesamte) Realität immer, ohne Ausnahme, mit einem Irrtumsrisiko behaftet sind, da wir nicht über vollständige Daten zur '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' verfügen. Statistisch sprechen wir dabei von '''Fehlern der ersten und der zweiten Art.'''
  
Während '''Fehler der ersten und der zweiten Art''' zu nicht eliminarbaren Risiken der statistischen Arbeit gehören und auch bei sorgfältiger Herangehensweise nicht ausgeschlossen, sondern nur berücksichtigt werden können (siehe '''Irrtumswahrscheinlichkeit[2]'''), hängen '''individuell bedingte Fehler''' mit Mängeln bei der Datenaufnahme, -übertragung oder Analyse zusammen. Wir könnten diese unter '''fehler-''' ''bzw.'' '''mangelhafte Daten''' zusammenfassen.
+
Während '''Fehler der ersten und der zweiten Art''' zu nicht eliminarbaren Risiken der statistischen Arbeit gehören und auch bei sorgfältiger Herangehensweise nicht ausgeschlossen, sondern nur berücksichtigt werden können (siehe '''Irrtumswahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]'''), hängen '''individuell bedingte Fehler''' mit Mängeln bei der Datenaufnahme, -übertragung oder Analyse zusammen. Wir könnten diese unter '''fehler-''' ''bzw.'' '''mangelhafte Daten''' zusammenfassen.
  
  
Line 863: Line 1,022:
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
</div>
  
 
== 2.4.1 Fehler erster und zweiter Art ==
 
== 2.4.1 Fehler erster und zweiter Art ==
Line 868: Line 1,039:
 
Unter '''Fehler der ersten bzw. zweiten Art''' verstehen wir das systembedingte Problem, dass Hypothesen auch bei sorgfältigem Vorgehen fälschlich bestätigt oder verworfen werden.
 
Unter '''Fehler der ersten bzw. zweiten Art''' verstehen wir das systembedingte Problem, dass Hypothesen auch bei sorgfältigem Vorgehen fälschlich bestätigt oder verworfen werden.
  
=== '''Hypothesen am Beginn der Untersuchung''' ===
+
==== '''Hypothesen am Beginn der Untersuchung''' ====
  
 
Bei Forschungsprojekten formulieren wir Hypothesen, deren Richtigkeit wir mit geeigneten Forschungs- und Analysemethoden untersuchen wollen. Eine derartige '''Ausgangshypothese''' oder '''Nullhypothese''' (in Kurzform oft auch '''H0''' bezeichnet) könnte lauten: ’AfrikanerInnen werden am Arbeitsplatz weniger geschätzt als ChinesInnen.’.
 
Bei Forschungsprojekten formulieren wir Hypothesen, deren Richtigkeit wir mit geeigneten Forschungs- und Analysemethoden untersuchen wollen. Eine derartige '''Ausgangshypothese''' oder '''Nullhypothese''' (in Kurzform oft auch '''H0''' bezeichnet) könnte lauten: ’AfrikanerInnen werden am Arbeitsplatz weniger geschätzt als ChinesInnen.’.
Line 874: Line 1,045:
 
Das Vorliegen einer Hypothese bedingt auch, dass es als Kontrast eine '''alternative Hypothese''' gibt (die wir bei der Erstellung des Konzepts als meist weniger wahrscheinlich einschätzen), die '''Alternativhypothese''' (in Kurzform oft auch '''H1''' genannt). In unserem Fall könnte diese lauten: ’AfrikanerInnen werden am Arbeitsmarkt nicht weniger geschätzt als ChinesInnen.’.
 
Das Vorliegen einer Hypothese bedingt auch, dass es als Kontrast eine '''alternative Hypothese''' gibt (die wir bei der Erstellung des Konzepts als meist weniger wahrscheinlich einschätzen), die '''Alternativhypothese''' (in Kurzform oft auch '''H1''' genannt). In unserem Fall könnte diese lauten: ’AfrikanerInnen werden am Arbeitsmarkt nicht weniger geschätzt als ChinesInnen.’.
  
=== '''Annahme oder Verwerfung von Hypothesen ist immer an Wahrscheinlichkeiten gebunden''' ===
+
==== '''Annahme oder Verwerfung von Hypothesen ist immer an Wahrscheinlichkeiten gebunden''' ====
  
Bei statistischen Analysen versuchen wir, Ergebnisse auf hohem '''Signifikanzniveau[1]''' zu erreichen. Wir sprechen davon, dass die gefundene Aussage mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, weniger als 1 %, weniger als 1 ‰ zutrifft. Das bedeutet, dass unser Ergebnis, auf das wir so stolz sind, dennoch in 5 % aller Fälle, in 1 % aller Fälle etc. rein zufällig entstehen kann und, bei einer genügend häufigen Wiederholung, sogar muss.
+
Bei statistischen Analysen versuchen wir, Ergebnisse auf hohem '''Signifikanzniveau[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' zu erreichen. Wir sprechen davon, dass die gefundene Aussage mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, weniger als 1 %, weniger als 1 ‰ zutrifft. Das bedeutet, dass unser Ergebnis, auf das wir so stolz sind, dennoch in 5 % aller Fälle, in 1 % aller Fälle etc. rein zufällig entstehen kann und, bei einer genügend häufigen Wiederholung, sogar muss.
  
 
Andererseits ist genauso denkbar, dass unser Ergebnis rein zufällig nicht den starken Zusammenhang zeigt, der normalerweise erscheint. Wir könnten auch bei großer Sorgfalt bei der Auswahl der Stichprobe überdurchschnittlich häufig auf Personen treffen, welche AfrikanerInnen besonders positiv gegenüber stehen.
 
Andererseits ist genauso denkbar, dass unser Ergebnis rein zufällig nicht den starken Zusammenhang zeigt, der normalerweise erscheint. Wir könnten auch bei großer Sorgfalt bei der Auswahl der Stichprobe überdurchschnittlich häufig auf Personen treffen, welche AfrikanerInnen besonders positiv gegenüber stehen.
  
=== '''Fehlerhafte Verwerfung bzw. Annahme von Hypothesen möglich''' ===
+
==== '''Fehlerhafte Verwerfung bzw. Annahme von Hypothesen möglich''' ====
  
 
Es können also zwei verschiedene Fehler auftreten:
 
Es können also zwei verschiedene Fehler auftreten:
Line 888: Line 1,059:
 
B. die Nullhypothese wird angenommen, obwohl sie falsch ist. Dies bezeichnet man auch als '''Fehler der zweiten Art''' oder '''Beta-Fehler'''''.''
 
B. die Nullhypothese wird angenommen, obwohl sie falsch ist. Dies bezeichnet man auch als '''Fehler der zweiten Art''' oder '''Beta-Fehler'''''.''
  
=== '''Mit der Zahl der statistischen Berechnungen steigt die Wahrscheinlichkeit von Fehlern der 1. oder 2. Art''' ===
+
==== '''Mit der Zahl der statistischen Berechnungen steigt die Wahrscheinlichkeit von Fehlern der 1. oder 2. Art''' ====
  
 
Das Risiko, einem der beiden Fehler aufzusitzen, steigt natürlich mit der Höhe der '''Irrtumswahrscheinlichkeit''' sowie mit der Zahl der durchgeführten Analysen. Moderne PCs und Statistik-Software laden geradezu dazu ein, in kurzer Zeit tausende von Hypothesen zu überprüfen. Wenn wir 100 Variable miteinander kreuzen, erhalten wir (100x99)/2 Vergleiche, d.s. 4950 einzelne Untersuchungen auf signifikante Zusammenhänge. Wenn wir diese mit Chi-Quadrat-Tests auf dem 5 %-Irrtumsniveau untersuchen, erhalten wir im Normalfall 247,5 falsche Zusammenhänge (4950*0,05). Wir würden also in 247 Fällen einen Zusammenhang annehmen, obwohl er nicht vorhanden ist (Alpha-Fehler).
 
Das Risiko, einem der beiden Fehler aufzusitzen, steigt natürlich mit der Höhe der '''Irrtumswahrscheinlichkeit''' sowie mit der Zahl der durchgeführten Analysen. Moderne PCs und Statistik-Software laden geradezu dazu ein, in kurzer Zeit tausende von Hypothesen zu überprüfen. Wenn wir 100 Variable miteinander kreuzen, erhalten wir (100x99)/2 Vergleiche, d.s. 4950 einzelne Untersuchungen auf signifikante Zusammenhänge. Wenn wir diese mit Chi-Quadrat-Tests auf dem 5 %-Irrtumsniveau untersuchen, erhalten wir im Normalfall 247,5 falsche Zusammenhänge (4950*0,05). Wir würden also in 247 Fällen einen Zusammenhang annehmen, obwohl er nicht vorhanden ist (Alpha-Fehler).
  
=== '''Kontrolle durch qualitative Überlegungen erforderlich''' ===
+
==== '''Kontrolle durch qualitative Überlegungen erforderlich''' ====
  
 
Derartige Massenvergleiche zeigen auch deutlich, dass '''statistische Berechnungen nicht losgelöst von qualitativen Überlegungen stattfinden dürfen'''. Bei statistischen Untersuchungen überraschend aufgetauchte Zusammenhänge müssen auch eine gewisse Stabilität und Systemkohärenz aufweisen, um akzeptiert werden zu können. D.h. sie müssen in einem gewissen Rahmen reproduzierbar sein und sie sollten nicht im Widerspruch zu offensichtlichen Fakten sein.
 
Derartige Massenvergleiche zeigen auch deutlich, dass '''statistische Berechnungen nicht losgelöst von qualitativen Überlegungen stattfinden dürfen'''. Bei statistischen Untersuchungen überraschend aufgetauchte Zusammenhänge müssen auch eine gewisse Stabilität und Systemkohärenz aufweisen, um akzeptiert werden zu können. D.h. sie müssen in einem gewissen Rahmen reproduzierbar sein und sie sollten nicht im Widerspruch zu offensichtlichen Fakten sein.
Line 906: Line 1,077:
 
Fehler und Mängel können bei einer Reihe von Vorgängen bei statistisch unterstützten Forschungsprojekten erfolgen bzw. auftreten, wie z.B.:
 
Fehler und Mängel können bei einer Reihe von Vorgängen bei statistisch unterstützten Forschungsprojekten erfolgen bzw. auftreten, wie z.B.:
  
A. '''Operationalisierungsfehler:''' bei der '''Operationalisierung[1]''' wurden verzerrende Messmethoden festgelegt;
+
A. '''Operationalisierungsfehler:''' bei der '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|[1]]]''' wurden verzerrende Messmethoden festgelegt;
  
B. '''Codierfehler:''' bei der '''Codierung[2]''' wurden, z.B. bei der Übertragung von Text-Daten in numerische Daten für interne Berechnungen von SPSS, Fehler begangen (z.B. die Vergabe des Zahlenwerts ''4'' in der Notenskala für ’Befriedigend’);
+
B. '''Codierfehler:''' bei der '''Codierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[2]]]''' wurden, z.B. bei der Übertragung von Text-Daten in numerische Daten für interne Berechnungen von SPSS, Fehler begangen (z.B. die Vergabe des Zahlenwerts ''4'' in der Notenskala für ’Befriedigend’);
  
 
C. '''Interviewerfehler:''' bei der Datenaufnahme wurden fehlerhafte Werte eingetragen (z.B. eine Kinderzahl von 71 statt 7);
 
C. '''Interviewerfehler:''' bei der Datenaufnahme wurden fehlerhafte Werte eingetragen (z.B. eine Kinderzahl von 71 statt 7);
Line 918: Line 1,089:
 
F. '''Eingabefehler:''' Datensätze wurden doppelt eingegeben;
 
F. '''Eingabefehler:''' Datensätze wurden doppelt eingegeben;
  
G. '''Analysefehler:''' für die Analyse der Daten wurden die '''falschen Methoden[3]''' verwendet;
+
G. '''Analysefehler:''' für die Analyse der Daten wurden die '''falschen Methoden[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|[3]]]''' verwendet;
  
 
H. '''Interpretationsfehler:''' die Ergebnisse wurden richtig gerechnet, aber falsch interpretiert;
 
H. '''Interpretationsfehler:''' die Ergebnisse wurden richtig gerechnet, aber falsch interpretiert;
  
I. '''Grafiken[4]''' und Tabellen werden falsch oder ungenügend mit Zusatzinformationen versehen, was sowohl zu mangelndem Verständnis wie auch zu Nichtüberprüfbarkeit der Ergebnisse führen kann.
+
I. '''Grafiken[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|[4]]]''' und Tabellen werden falsch oder ungenügend mit Zusatzinformationen versehen, was sowohl zu mangelndem Verständnis wie auch zu Nichtüberprüfbarkeit der Ergebnisse führen kann.
  
  
Line 948: Line 1,119:
 
-----
 
-----
  
==== 2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS  ====
+
=== 2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS  ===
  
 
'''Verringerung des Risikos durch Wahl geeigneter Datentypen'''
 
'''Verringerung des Risikos durch Wahl geeigneter Datentypen'''
Line 958: Line 1,129:
 
-----
 
-----
  
==== 2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel  ====
+
=== 2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel  ===
  
 
Unter '''Gültigkeitsprüfung''' von Daten versteht man die automatische Prüfung, ob aufgenommene Ausprägungen sich innerhalb eines vorgegebenen Bereichs befinden. Jeder außerhalb dieses Bereichs liegende Wert wird bei der Eingabe mit einer '''Fehlermeldung''' abgewiesen.  
 
Unter '''Gültigkeitsprüfung''' von Daten versteht man die automatische Prüfung, ob aufgenommene Ausprägungen sich innerhalb eines vorgegebenen Bereichs befinden. Jeder außerhalb dieses Bereichs liegende Wert wird bei der Eingabe mit einer '''Fehlermeldung''' abgewiesen.  
Line 1,010: Line 1,181:
 
=== 2.4.2.3 Fehlende Einträge  ===
 
=== 2.4.2.3 Fehlende Einträge  ===
  
=== '''Was tun, wenn Einträge fehlen?''' ===
+
==== '''Was tun, wenn Einträge fehlen?''' ====
  
 
Nur bei den wenigsten Umfragen werden alle Fragen von allen Befragten beantwortet. Besonders tabuisierte Fragen wie vielleicht nach Bereichen der Sexualität, dem Einkommen, den politischen Neigungen werden oft nicht oder nur neutral beantwortet. Es stellt sich daher die Frage, ob und wie man die fehlenden Einträge interpretieren kann. Ein weiser Spruch der Kommunikationsforschung lautet: ’'''Man kann nicht nicht kommunizieren’''' (Paul Watzlawick)'''.''' Das bedeutet, dass vor allem bei tabusierten Fragen auch die Nichtbeantwortung von Fragen eine Information darstellt. Es könnte dementsprechend sein, dass bei manchen Fragen eine Nichtbeantwortung bedeutet: "Ich möchte nicht, dass man weiß, wie ich über diesen Bereich denke."
 
Nur bei den wenigsten Umfragen werden alle Fragen von allen Befragten beantwortet. Besonders tabuisierte Fragen wie vielleicht nach Bereichen der Sexualität, dem Einkommen, den politischen Neigungen werden oft nicht oder nur neutral beantwortet. Es stellt sich daher die Frage, ob und wie man die fehlenden Einträge interpretieren kann. Ein weiser Spruch der Kommunikationsforschung lautet: ’'''Man kann nicht nicht kommunizieren’''' (Paul Watzlawick)'''.''' Das bedeutet, dass vor allem bei tabusierten Fragen auch die Nichtbeantwortung von Fragen eine Information darstellt. Es könnte dementsprechend sein, dass bei manchen Fragen eine Nichtbeantwortung bedeutet: "Ich möchte nicht, dass man weiß, wie ich über diesen Bereich denke."
  
=== '''Beispiel: geringe Bekenntnisquote von FPÖ- WählerInnen''' ===
+
==== '''Beispiel: geringe Bekenntnisquote von FPÖ- WählerInnen''' ====
  
 
Viele Jahre lang hatten besonders FPÖ-WählerInnen während der Haider-Jahre große Angst, sich in Umfragen vor Wahlen zu ihrer Partei zu bekennen. Die Wahlergebnisse fielen daher für die FPÖ durch 1,5 Jahrzehnte stets wesentlich besser aus als die Umfrageergebnisse, was u.a. dazu führte, dass ihre Bekennerzahlen in Umfragen von den Meinungsforschungsinstituten einen substantiellen Zuschlag bekamen, um sich der tatsächlichen Unterstützung dieser Partei anzunähern.
 
Viele Jahre lang hatten besonders FPÖ-WählerInnen während der Haider-Jahre große Angst, sich in Umfragen vor Wahlen zu ihrer Partei zu bekennen. Die Wahlergebnisse fielen daher für die FPÖ durch 1,5 Jahrzehnte stets wesentlich besser aus als die Umfrageergebnisse, was u.a. dazu führte, dass ihre Bekennerzahlen in Umfragen von den Meinungsforschungsinstituten einen substantiellen Zuschlag bekamen, um sich der tatsächlichen Unterstützung dieser Partei anzunähern.
  
=== '''Nichtbeantwortung auch durch Fehler möglich''' ===
+
==== '''Nichtbeantwortung auch durch Fehler möglich''' ====
  
 
In anderen, neutralen, Bereichen wird eine Nichtbeantwortung wieder eher als Übersehen oder als Ratlosigkeit (die Frage ist vielleicht unverständlich formuliert) gedeutet werden. Es gäbe kaum einen denkbaren Grund, die Frage nach seinem Lieblingsobst nicht zu beantworten.
 
In anderen, neutralen, Bereichen wird eine Nichtbeantwortung wieder eher als Übersehen oder als Ratlosigkeit (die Frage ist vielleicht unverständlich formuliert) gedeutet werden. Es gäbe kaum einen denkbaren Grund, die Frage nach seinem Lieblingsobst nicht zu beantworten.
  
=== '''Je nach Tabuisierungsgrad der Frage sind fehlende Einträge unterschiedlich aussagekräftig''' ===
+
==== '''Je nach Tabuisierungsgrad der Frage sind fehlende Einträge unterschiedlich aussagekräftig''' ====
  
 
Je nach Sachlage kann daher eine Nichtbeantwortung eine Art von Information oder einen Mangel darstellen. Im ersten Fall könnte es sein, dass z.B. besonders Personen, welche eine extrem abwehrende Haltung gegenüber MigrantInnen aufweisen (wie aus einer anderen Fragestellung erkennbar), besonders zur Nichtbeantwortung der Frage ’Welche Partei würden Sie wählen, wenn morgen Wahltag wäre?". Das heißt, dass wir uns bei auffallend häufiger Nichtbeantwortung von bestimmten Fragen die Frage stellen sollten, ob es bei den Nichtbeantwortenden gewisse Gemeinsamkeiten gibt und damit auch spezifische Motive der Nichtbeantwortung.
 
Je nach Sachlage kann daher eine Nichtbeantwortung eine Art von Information oder einen Mangel darstellen. Im ersten Fall könnte es sein, dass z.B. besonders Personen, welche eine extrem abwehrende Haltung gegenüber MigrantInnen aufweisen (wie aus einer anderen Fragestellung erkennbar), besonders zur Nichtbeantwortung der Frage ’Welche Partei würden Sie wählen, wenn morgen Wahltag wäre?". Das heißt, dass wir uns bei auffallend häufiger Nichtbeantwortung von bestimmten Fragen die Frage stellen sollten, ob es bei den Nichtbeantwortenden gewisse Gemeinsamkeiten gibt und damit auch spezifische Motive der Nichtbeantwortung.
Line 1,033: Line 1,204:
 
-----
 
-----
  
==== 2.4.2.3.1 Behandlung fehlender Daten mit SPSS  ====
+
=== 2.4.2.3.1 Behandlung fehlender Daten mit SPSS  ===
  
 
SPSS erlaubt, leere Felder automatisch mit bestimmten Einträgen auszufüllen oder dieselben in keinerlei Berechnungen einfließen zu lassen.
 
SPSS erlaubt, leere Felder automatisch mit bestimmten Einträgen auszufüllen oder dieselben in keinerlei Berechnungen einfließen zu lassen.
  
SPSS unterscheidet zwischen ''Systembedingt fehlenden Werten'' und ''Benutzerdefinierten fehlenden Werten.'' Werden z.B. Variable als numerisch definiert, werden leere Felder automatisch mit einem Komma in der '''Datenmatrix[1]''' markiert (''Systembedingt''). Bei Textfeldern muss ein fehlender Wert spezifisch deklariert werden (''Benutzerdefinierter fehlender Wert):''
+
SPSS unterscheidet zwischen ''Systembedingt fehlenden Werten'' und ''Benutzerdefinierten fehlenden Werten.'' Werden z.B. Variable als numerisch definiert, werden leere Felder automatisch mit einem Komma in der '''Datenmatrix[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1]]]''' markiert (''Systembedingt''). Bei Textfeldern muss ein fehlender Wert spezifisch deklariert werden (''Benutzerdefinierter fehlender Wert):''
  
 
[[File:quantitative-43_1.jpg|frame|center|Definition von fehlenden Werten]]
 
[[File:quantitative-43_1.jpg|frame|center|Definition von fehlenden Werten]]
Line 1,066: Line 1,237:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1] Siehe Kapitel 2.2.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1] Siehe Kapitel 2.2.3]]<br />
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#2.4 Fehlerquellen bei statistischer Arbeit|&uarr; Nach oben]]
 +
 +
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 3. Ausgewählte statistische Grundlagen und Analysemethoden =
 
= 3. Ausgewählte statistische Grundlagen und Analysemethoden =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
In den folgenden Abschnitten werden eine Reihe von Methoden der '''deskriptiven[1]''', teilweise auch der einfachen '''analytischen[2]''' Statistik sowie auch deren Anwendungsvoraussetzungen und Rahmenbedingungen vorgestellt.
+
In den folgenden Abschnitten werden eine Reihe von Methoden der '''deskriptiven[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|[1]]]''', teilweise auch der einfachen '''analytischen[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|[2]]]''' Statistik sowie auch deren Anwendungsvoraussetzungen und Rahmenbedingungen vorgestellt.
  
Wir benötigen ausreichendes Wissen über die Art, '''Skalierung[3]''' und '''Verteilung[4]''' der Daten, um die dafür geeigneten statistischen Beschreibungs- und Analysemethoden wählen zu können. Dementsprechend wird dieses notwendige Hintergrundwissen intensiver diskutiert. Danach werden '''grundlegende deskriptive und analytische statistische Methoden''' dargestellt, wobei der Schwerpunkt auf ersteren liegt. Abschließend wird auf die grafische Darbietung der Ergebnisse in Form von '''Diagrammen''' eingegangen.
+
Wir benötigen ausreichendes Wissen über die Art, '''Skalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[3]]]''' und '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4]]]''' der Daten, um die dafür geeigneten statistischen Beschreibungs- und Analysemethoden wählen zu können. Dementsprechend wird dieses notwendige Hintergrundwissen intensiver diskutiert. Danach werden '''grundlegende deskriptive und analytische statistische Methoden''' dargestellt, wobei der Schwerpunkt auf ersteren liegt. Abschließend wird auf die grafische Darbietung der Ergebnisse in Form von '''Diagrammen''' eingegangen.
  
  
Line 1,080: Line 1,258:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4] Siehe Kapitel 3.1.3]]<br />
  
 +
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
</div>
 +
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|Nächstes Kapitel: 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]'''
 +
----
 +
[[#3. Ausgewählte statistische Grundlagen und Analysemethoden|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|Vorheriges Kapitel: 3. Ausgewählte statistische Grundlagen und Analysemethoden]]'''
 
= 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden =
 
= 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== '''Analysemethoden''' sind '''abhängig von Datenart, -ausprägung, -anzahl und -verteilung:''' ===
+
==== '''Analysemethoden''' sind '''abhängig von Datenart, -ausprägung, -anzahl und -verteilung:''' ====
  
 
Die Statistik bietet eine Vielzahl von Verfahren, mit deren Hilfe man Aufschlüsse über Sachverhalte gewinnen kann. Die meisten Verfahren können jedoch nur verwendet werden, wenn bestimmte Bedingungen erfüllt sind. Die Auswahl der möglichen Verfahren hängt besonders ab von
 
Die Statistik bietet eine Vielzahl von Verfahren, mit deren Hilfe man Aufschlüsse über Sachverhalte gewinnen kann. Die meisten Verfahren können jedoch nur verwendet werden, wenn bestimmte Bedingungen erfüllt sind. Die Auswahl der möglichen Verfahren hängt besonders ab von
  
* der Art der Daten und den damit zusammenhängenden '''Skalenniveaus[1]'''
+
* der Art der Daten und den damit zusammenhängenden '''Skalenniveaus[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]'''
* der '''Verteilung[2]''' '''der Ausprägungen''' einer Variable
+
* der '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' '''der Ausprägungen''' einer Variable
* der '''Größe''' der '''Stichprobe[3]'''
+
* der '''Größe''' der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3]]]'''
 
* dem (Nicht-)Auftreten von sogenannten ’'''Ausreißern'''’ oder '''Extremdaten'''
 
* dem (Nicht-)Auftreten von sogenannten ’'''Ausreißern'''’ oder '''Extremdaten'''
  
 
Falls Verfahren außerhalb ihrer Anwendungsbedingungen verwendet werden, ist die Wahrscheinlichkeit groß, dass sinnleere oder falsche Aussagen erhalten werden.
 
Falls Verfahren außerhalb ihrer Anwendungsbedingungen verwendet werden, ist die Wahrscheinlichkeit groß, dass sinnleere oder falsche Aussagen erhalten werden.
  
=== '''Körpergrößen und Lieblingsobst''' ===
+
==== '''Körpergrößen und Lieblingsobst''' ====
  
Wenn wir in einer Schulklasse die durchschnittliche Körpergröße der SchülerInnen ermitteln wollen, wäre das '''arithmetische Mittel[4]''' eine durchaus vernünftige Kennzahl. Wir zählen dazu alle Körpergrößen zusammen und dividieren die Summe durch die Anzahl der KlassenschülerInnen. Wenn wir hingegen ermitteln möchten, was diese Schulklasse als Lieblingsobst bevorzugt, wäre das '''arithmetische Mittel''' Schwachsinn. Wir kämen dann zu wenig sinnvollen Aussagen, dass die Klasse 0,17 Äpfel, 0,12 Orangen, 0,11 Bananen etc. als Lieblingsobst aufweist.
+
Wenn wir in einer Schulklasse die durchschnittliche Körpergröße der SchülerInnen ermitteln wollen, wäre das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4]]]''' eine durchaus vernünftige Kennzahl. Wir zählen dazu alle Körpergrößen zusammen und dividieren die Summe durch die Anzahl der KlassenschülerInnen. Wenn wir hingegen ermitteln möchten, was diese Schulklasse als Lieblingsobst bevorzugt, wäre das '''arithmetische Mittel''' Schwachsinn. Wir kämen dann zu wenig sinnvollen Aussagen, dass die Klasse 0,17 Äpfel, 0,12 Orangen, 0,11 Bananen etc. als Lieblingsobst aufweist.
  
Dass im ersten Fall das '''arithmetische Mittel''' verwendet werden konnte, im zweiten Falle jedoch nicht, hängt mit den unterschiedlichen Skalenniveaus zusammen. So gehört die Körpergröße zur '''Proportionalskala[5]''', während das Lieblingsobst in eine '''Nominalskala[6]''' eingeordnet wird.
+
Dass im ersten Fall das '''arithmetische Mittel''' verwendet werden konnte, im zweiten Falle jedoch nicht, hängt mit den unterschiedlichen Skalenniveaus zusammen. So gehört die Körpergröße zur '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[5]]]''', während das Lieblingsobst in eine '''Nominalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6]]]''' eingeordnet wird.
  
  
Line 1,109: Line 1,388:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6] Siehe Kapitel 3.1.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6] Siehe Kapitel 3.1.2.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
</div>
  
 
== 3.1.1 Arten von Messwerten (Daten) ==
 
== 3.1.1 Arten von Messwerten (Daten) ==
Line 1,122: Line 1,422:
 
=== 3.1.1.1 Metrische und nichtmetrische Variablen  ===
 
=== 3.1.1.1 Metrische und nichtmetrische Variablen  ===
  
=== '''Metrische und nichtmetrische Variablen''' ===
+
==== '''Metrische und nichtmetrische Variablen''' ====
  
 
Prinzipiell können wir zwischen '''metrischen''' und '''nichtmetrischen''' '''Variablen''' unterscheiden. Als '''metrische''' Merkmale (auch '''quantitative''' genannt) bezeichnet man '''Merkmale''', deren '''Ausprägungen''' sich mittels Zahlen darstellen lassen, wobei auch '''Rangunterschiede und Abstand sinnvoll interpretiert''' werden können. Als '''nichtmetrische Variablen''' werden dementsprechend alle anderen bezeichnet.
 
Prinzipiell können wir zwischen '''metrischen''' und '''nichtmetrischen''' '''Variablen''' unterscheiden. Als '''metrische''' Merkmale (auch '''quantitative''' genannt) bezeichnet man '''Merkmale''', deren '''Ausprägungen''' sich mittels Zahlen darstellen lassen, wobei auch '''Rangunterschiede und Abstand sinnvoll interpretiert''' werden können. Als '''nichtmetrische Variablen''' werden dementsprechend alle anderen bezeichnet.
Line 1,159: Line 1,459:
 
Stellen Sie sich vor, Tischler sehr unterschiedlicher Begabung und Erfahrung würden Stufen für eine Treppe bauen.
 
Stellen Sie sich vor, Tischler sehr unterschiedlicher Begabung und Erfahrung würden Stufen für eine Treppe bauen.
  
=== '''Nominalskala:''' ===
+
==== '''Nominalskala:''' ====
  
 
Wir hätten zuerst den Amateurtischler, welcher extrem ungleichförmige Stufen baut. Die eine Stufe ist links viel höher als rechts, die andere hinten höher als vorne. Keine einzige ist so gleichförmig, dass sie überall höher ist als alle anderen, keine einzige ist so gleichförmig, dass sie überall niedriger ist als alle anderen. Mit anderen Worten: wir können die Stufen beliebig hintereinander reihen. Wir finden keinen eindeutigen logischen und zwingenden Ansatz zur Reihung. Nehmen wir die Höhe links, würden wir die Stufe A vor der Stufe B vor der Stufe C reihen; nehmen wir die Höhe rechts, die Stufe B vor der Stufe C vor der Stufe A; nehmen wir die Höhe vorne etc.
 
Wir hätten zuerst den Amateurtischler, welcher extrem ungleichförmige Stufen baut. Die eine Stufe ist links viel höher als rechts, die andere hinten höher als vorne. Keine einzige ist so gleichförmig, dass sie überall höher ist als alle anderen, keine einzige ist so gleichförmig, dass sie überall niedriger ist als alle anderen. Mit anderen Worten: wir können die Stufen beliebig hintereinander reihen. Wir finden keinen eindeutigen logischen und zwingenden Ansatz zur Reihung. Nehmen wir die Höhe links, würden wir die Stufe A vor der Stufe B vor der Stufe C reihen; nehmen wir die Höhe rechts, die Stufe B vor der Stufe C vor der Stufe A; nehmen wir die Höhe vorne etc.
Line 1,165: Line 1,465:
 
'''Eine derartige Treppe, die sich beliebig zusammensetzen lässt und eigentlich gar keine Treppe ist''', weil man auf ihr nicht höher steigen kann, würde der '''Nominalskala''' entsprechen: Was besitzt man: Äpfel, Birnen, ein Auto, einen Hund etc.
 
'''Eine derartige Treppe, die sich beliebig zusammensetzen lässt und eigentlich gar keine Treppe ist''', weil man auf ihr nicht höher steigen kann, würde der '''Nominalskala''' entsprechen: Was besitzt man: Äpfel, Birnen, ein Auto, einen Hund etc.
  
=== '''Ordinalskala:''' ===
+
==== '''Ordinalskala:''' ====
  
 
Der Tischler wird nun etwas geschickter. Er schafft es, die Stufen jeweils unterschiedlich hoch zu machen und zwar überall. Die Stufe B ist 1,2x so hoch wie die Stufe A, die Stufe C doppelt so hoch wie die Stufe B, die Stufe D 3x so hoch wie die Stufe C, die Stufe E 1,3x so hoch wie die Stufe D. '''Es ist nicht vorauszusagen, um wieviel die nächsthöhere Stufe höher sein wird, aber man weiß, sie ist höher'''. Es ist ein beschwerlicher Aufstieg, aber es ist ein Aufstieg. Das würde einer '''Ordinalskala''' entsprechen. Ein Beispiel dafür wäre eine Notenskala. Man weiß zwar nicht, um wieviel besser ein Schüler mit einem Sehr Gut als ein Schüler mit einem Gut war, aber dass es einen Unterschied gegeben hat, erscheint klar zu sein (außer der Lehrer war bekannt subjektiv, was vorkommen soll).
 
Der Tischler wird nun etwas geschickter. Er schafft es, die Stufen jeweils unterschiedlich hoch zu machen und zwar überall. Die Stufe B ist 1,2x so hoch wie die Stufe A, die Stufe C doppelt so hoch wie die Stufe B, die Stufe D 3x so hoch wie die Stufe C, die Stufe E 1,3x so hoch wie die Stufe D. '''Es ist nicht vorauszusagen, um wieviel die nächsthöhere Stufe höher sein wird, aber man weiß, sie ist höher'''. Es ist ein beschwerlicher Aufstieg, aber es ist ein Aufstieg. Das würde einer '''Ordinalskala''' entsprechen. Ein Beispiel dafür wäre eine Notenskala. Man weiß zwar nicht, um wieviel besser ein Schüler mit einem Sehr Gut als ein Schüler mit einem Gut war, aber dass es einen Unterschied gegeben hat, erscheint klar zu sein (außer der Lehrer war bekannt subjektiv, was vorkommen soll).
  
=== '''Intervallskala:''' ===
+
==== '''Intervallskala:''' ====
  
 
Der Tischler wird noch geschickter. er schafft es sogar alle Stufen jeweils um 30 cm höher zu machen als die jeweils vorausgegangene. Man kann nun blind die Stufen hinaufgehen, weil man die Abstände kennt. Das Problem: Die Stiege steht auf einem Schiff, welches im Mittelmeer herumfährt. Ich weiss nun zwar, dass ich 30 cm höher steige, wenn ich eine Stufe hinaufschreite und 90, wenn ich drei Stufen hinaufschreite, aber ich kann nicht angeben, in welcher Höhe über dem Meeresboden ich mich befinde. Sind es 150 m, sind es 300? Dadurch kann ich auch nicht angeben, ob ich mich auf der übernächsten Stufe doppelt so hoch befinde wie jetzt. '''Ich kann zwar mit fixen Abständen rechnen, aber ich habe keinen absoluten Nullpunkt''' (wo es nicht mehr tiefer geht, wie zum Meeresboden) zum Vergleich und daher kann ich nicht angeben, um wieviel höher ich sein werde, wenn ich x Stufen höhersteige. Dies nennt man eine '''Intervallskala''', die Stufen werden in gleichen Intervallen höher.
 
Der Tischler wird noch geschickter. er schafft es sogar alle Stufen jeweils um 30 cm höher zu machen als die jeweils vorausgegangene. Man kann nun blind die Stufen hinaufgehen, weil man die Abstände kennt. Das Problem: Die Stiege steht auf einem Schiff, welches im Mittelmeer herumfährt. Ich weiss nun zwar, dass ich 30 cm höher steige, wenn ich eine Stufe hinaufschreite und 90, wenn ich drei Stufen hinaufschreite, aber ich kann nicht angeben, in welcher Höhe über dem Meeresboden ich mich befinde. Sind es 150 m, sind es 300? Dadurch kann ich auch nicht angeben, ob ich mich auf der übernächsten Stufe doppelt so hoch befinde wie jetzt. '''Ich kann zwar mit fixen Abständen rechnen, aber ich habe keinen absoluten Nullpunkt''' (wo es nicht mehr tiefer geht, wie zum Meeresboden) zum Vergleich und daher kann ich nicht angeben, um wieviel höher ich sein werde, wenn ich x Stufen höhersteige. Dies nennt man eine '''Intervallskala''', die Stufen werden in gleichen Intervallen höher.
Line 1,175: Line 1,475:
 
Ein Beispiel dafür wäre unsere Temperaturskala in Celsius, wo wir nicht vom absoluten Nullpunkt ausgehen (das wäre der Meeresboden oder - 273 Grad Celsius), sondern von einem willkürlichen (nämlich vom Schiffsboden aus oder 0 Grad). Daher ist die Aussage, 10 Grad ist 5 Grad wärmer als 5 Grad richtig, aber die Aussage falsch, dass es damit doppelt so warm ist, denn tatsächlich hätte ich ein Verhältnis von 283 Grad: 278 Grad (vom absoluten Nullpunkt aus gemessen).
 
Ein Beispiel dafür wäre unsere Temperaturskala in Celsius, wo wir nicht vom absoluten Nullpunkt ausgehen (das wäre der Meeresboden oder - 273 Grad Celsius), sondern von einem willkürlichen (nämlich vom Schiffsboden aus oder 0 Grad). Daher ist die Aussage, 10 Grad ist 5 Grad wärmer als 5 Grad richtig, aber die Aussage falsch, dass es damit doppelt so warm ist, denn tatsächlich hätte ich ein Verhältnis von 283 Grad: 278 Grad (vom absoluten Nullpunkt aus gemessen).
  
=== '''Proportionalskala:''' ===
+
==== '''Proportionalskala:''' ====
  
 
Wenn wir die gleiche Stiege wie bei der Intervallskala nun an Land bringen und sie auf festen Boden stellen, dann können wir von einer '''Proportionalskala''' sprechen. Endlich können wir, wenn wir uns auf der dritten Stufe befinden, nicht nur sagen, wir sind jetzt 60 cm höher als auf der ersten. Wir können auch endlich die '''Verhältni'''ss'''e richtig interpretieren'''. Wir können nun auch korrekt angeben, dass wir uns jetzt auf der dritten Stufe dreimal so hoch wie auf der ersten Stufe befinden (mit dem festen Boden als absolutem Nullpunkt, unter den kein Abstieg möglich ist). Dies ist nun eine Proportionalskala. Ein Beispiel dafür wären Körpergrößen. Jemand, der 1,80 m groß ist, ist doppelt so groß wie jemand, der 90 cm groß ist.
 
Wenn wir die gleiche Stiege wie bei der Intervallskala nun an Land bringen und sie auf festen Boden stellen, dann können wir von einer '''Proportionalskala''' sprechen. Endlich können wir, wenn wir uns auf der dritten Stufe befinden, nicht nur sagen, wir sind jetzt 60 cm höher als auf der ersten. Wir können auch endlich die '''Verhältni'''ss'''e richtig interpretieren'''. Wir können nun auch korrekt angeben, dass wir uns jetzt auf der dritten Stufe dreimal so hoch wie auf der ersten Stufe befinden (mit dem festen Boden als absolutem Nullpunkt, unter den kein Abstieg möglich ist). Dies ist nun eine Proportionalskala. Ein Beispiel dafür wären Körpergrößen. Jemand, der 1,80 m groß ist, ist doppelt so groß wie jemand, der 90 cm groß ist.
Line 1,197: Line 1,497:
 
Beispiele wären die Beliebtheit von SchülerInnen (hier kann ich diese eindeutig danach reihen), die Sympathie für Zuwanderer etc.
 
Beispiele wären die Beliebtheit von SchülerInnen (hier kann ich diese eindeutig danach reihen), die Sympathie für Zuwanderer etc.
  
=== '''Schulnoten ordinal- oder intervallskaliert?''' ===
+
==== '''Schulnoten ordinal- oder intervallskaliert?''' ====
  
 
Schulnoten werden von vielen behandelt, wie wenn sie zur '''Intervallskalierung''' gehören würden, in welcher Abstände interpretiert werden können. Daher errechnen viele zur Beurteilung der Qualität einer Klasse das arithmetische Mittel von Noten, was man jedoch nur bei zumindest intervallskalierten Variablen machen sollte. Überlegen wir: Falls Schulnoten intervallskaliert wären, müsste der Abstand von einer Schulnote zur nächstbesseren/- schlechteren einem präzisen und stabilen Leistungsunterschied zwischen SchülerInnen entsprechen. Oft ’steht’ man jedoch zwischen zwei Noten, die PrüferIn muss sich dennoch für eine entscheiden. Auch wenn alle SchülerInnen einer extrem begabten Klasse eine sehr gute Arbeit abgeben, wird die PrüferIn dennoch meistens versuchen, zwischen ihnen durch unterschiedliche Noten zu differenzieren, um die Motivation und den anspornenden Wettbewerb hochzuhalten. Daher gibt es trotz des offiziellen objektiven Anspruchs von Schulnoten einen zu hohen subjektiven Einfluss, um sie als '''intervallskalierte''' Variablen behandeln zu können.
 
Schulnoten werden von vielen behandelt, wie wenn sie zur '''Intervallskalierung''' gehören würden, in welcher Abstände interpretiert werden können. Daher errechnen viele zur Beurteilung der Qualität einer Klasse das arithmetische Mittel von Noten, was man jedoch nur bei zumindest intervallskalierten Variablen machen sollte. Überlegen wir: Falls Schulnoten intervallskaliert wären, müsste der Abstand von einer Schulnote zur nächstbesseren/- schlechteren einem präzisen und stabilen Leistungsunterschied zwischen SchülerInnen entsprechen. Oft ’steht’ man jedoch zwischen zwei Noten, die PrüferIn muss sich dennoch für eine entscheiden. Auch wenn alle SchülerInnen einer extrem begabten Klasse eine sehr gute Arbeit abgeben, wird die PrüferIn dennoch meistens versuchen, zwischen ihnen durch unterschiedliche Noten zu differenzieren, um die Motivation und den anspornenden Wettbewerb hochzuhalten. Daher gibt es trotz des offiziellen objektiven Anspruchs von Schulnoten einen zu hohen subjektiven Einfluss, um sie als '''intervallskalierte''' Variablen behandeln zu können.
Line 1,228: Line 1,528:
 
[[File:quantitative-55_1.jpg|frame|center|Unterschiedliche Skalierungsformen, mögliche Aussagen und Analysemethoden mit Beispielen]]
 
[[File:quantitative-55_1.jpg|frame|center|Unterschiedliche Skalierungsformen, mögliche Aussagen und Analysemethoden mit Beispielen]]
  
'''Metrische Merkmale[1]''' finden sich bei '''Intervall'''- und '''Proportionalskalierung''', '''nichtmetrische''' bei '''Nominal- und Ordinalskalierung'''.
+
'''Metrische Merkmale[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1]]]''' finden sich bei '''Intervall'''- und '''Proportionalskalierung''', '''nichtmetrische''' bei '''Nominal- und Ordinalskalierung'''.
  
  
Line 1,241: Line 1,541:
 
'''Monovariable Verteilungen''' zeigen die '''Verteilung''' einer einzigen Variable, bei '''bivariablen Verteilungen''' werden die Häufigkeiten der einander entsprechenden Ausprägungen zweier Variablen aufgezählt, also z.B. 16 Personen sind sowohl weiblich wie auch Raucherinnen, 13 Personen männnlich und Nichtraucher.
 
'''Monovariable Verteilungen''' zeigen die '''Verteilung''' einer einzigen Variable, bei '''bivariablen Verteilungen''' werden die Häufigkeiten der einander entsprechenden Ausprägungen zweier Variablen aufgezählt, also z.B. 16 Personen sind sowohl weiblich wie auch Raucherinnen, 13 Personen männnlich und Nichtraucher.
  
Verteilungen können sowohl '''tabellarisch''' wie auch grafisch in Form von '''Diagrammen[1]''' dargestellt werden.
+
Verteilungen können sowohl '''tabellarisch''' wie auch grafisch in Form von '''Diagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1]]]''' dargestellt werden.
  
 
Zur tabellarischen Darstellung gelangt man, indem man die Werte (nach Möglichkeit sinnvoll) reiht und daneben die jeweilige Häufigkeit der Werte einträgt.
 
Zur tabellarischen Darstellung gelangt man, indem man die Werte (nach Möglichkeit sinnvoll) reiht und daneben die jeweilige Häufigkeit der Werte einträgt.
Line 1,247: Line 1,547:
 
[[File:quantitative-56_1.jpg|frame|center|Darstellung von Verteilungen]]
 
[[File:quantitative-56_1.jpg|frame|center|Darstellung von Verteilungen]]
  
Zur grafischen Form gelangt man, wenn man in einem '''Diagramm''' auf der x- Achse die Ausprägung von Werten einträgt (z.B. die Körpergröße einer Person x) und auf der y- Achse deren Häufigkeit (= Zahl der Personen, welche genau diese Körpergröße aufweisen), dann können wir die Schnittpunkte mit Linien verbinden, wodurch sich eine Verteilungskurve ergibt. Die Standard- Darstellungsform dafür ist das '''Streudiagramm[2]'''.
+
Zur grafischen Form gelangt man, wenn man in einem '''Diagramm''' auf der x- Achse die Ausprägung von Werten einträgt (z.B. die Körpergröße einer Person x) und auf der y- Achse deren Häufigkeit (= Zahl der Personen, welche genau diese Körpergröße aufweisen), dann können wir die Schnittpunkte mit Linien verbinden, wodurch sich eine Verteilungskurve ergibt. Die Standard- Darstellungsform dafür ist das '''Streudiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[2]]]'''.
  
 
Verschiedene Verfahren erforden eine vorliegende Normalverteilung, die mit verschiedenen Prozeduren abschätzbar ist.
 
Verschiedene Verfahren erforden eine vorliegende Normalverteilung, die mit verschiedenen Prozeduren abschätzbar ist.
Line 1,264: Line 1,564:
 
Von einer Normalverteilung sprechen wir, wenn
 
Von einer Normalverteilung sprechen wir, wenn
  
* die größte Häufigkeit in der Nähe des '''arithmetischen Mittel[1]''' auftritt und somit das arithmetische Mittel annähernd mit dem '''Median[2]''' und mit dem '''Modalwert[3]''' zusammenfällt;
+
* die größte Häufigkeit in der Nähe des '''arithmetischen Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' auftritt und somit das arithmetische Mittel annähernd mit dem '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2]]]''' und mit dem '''Modalwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3]]]''' zusammenfällt;
* die '''Häufigkeiten[4]''' der Werte umso mehr abnehmen, je weiter sie sich vom Mittelwert entfernen;
+
* die '''Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4]]]''' der Werte umso mehr abnehmen, je weiter sie sich vom Mittelwert entfernen;
 
* wenn sowohl links wie rechts des Mittelwerts eine '''prinzipielle Symmetrie''' vorliegt;
 
* wenn sowohl links wie rechts des Mittelwerts eine '''prinzipielle Symmetrie''' vorliegt;
 
* wenn die '''Verteilungskurve glockenförmig''' ist.
 
* wenn die '''Verteilungskurve glockenförmig''' ist.
Line 1,283: Line 1,583:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2] Siehe Kapitel 3.3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2] Siehe Kapitel 3.3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3] Siehe Kapitel 3.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3] Siehe Kapitel 3.3.1]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 1,294: Line 1,594:
 
Oft sind die Verteilungen '''schief''', man unterscheidet dann zwischen '''linksschiefen''' oder '''rechtsschiefen Verteilungen.'''
 
Oft sind die Verteilungen '''schief''', man unterscheidet dann zwischen '''linksschiefen''' oder '''rechtsschiefen Verteilungen.'''
  
Bei der '''linksschiefen''' Verteilung ('''negative skew''') liegt der höchste Punkt der Verteilung rechts (d.h. hier befindet sich der Großteil der Einträge), während nach links ein langgezogener Abfall eintritt (d.h. es treten dort selten verwendete Extremwerte auf). In '''linksschiefen''' Verteilungen ist der '''Median[1]''' größer als das '''arithmetische Mittel[2]'''.
+
Bei der '''linksschiefen''' Verteilung ('''negative skew''') liegt der höchste Punkt der Verteilung rechts (d.h. hier befindet sich der Großteil der Einträge), während nach links ein langgezogener Abfall eintritt (d.h. es treten dort selten verwendete Extremwerte auf). In '''linksschiefen''' Verteilungen ist der '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''' größer als das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]'''.
  
 
[[File:quantitative-58_1.jpg|frame|center|Grafische Darstellung einer linkschiefen Verteilung]]
 
[[File:quantitative-58_1.jpg|frame|center|Grafische Darstellung einer linkschiefen Verteilung]]
Line 1,310: Line 1,610:
 
[[File:quantitative-58_4.jpg|frame|center|Rechteckige Verteilung]]
 
[[File:quantitative-58_4.jpg|frame|center|Rechteckige Verteilung]]
  
Diese Verteilung ist rechteckig. Sie könnte bei einer kleinen '''Stichprobe[3]''' auftreten, wenn fast alle Werte die gleiche '''Häufigkeit[4]''' aufweisen.
+
Diese Verteilung ist rechteckig. Sie könnte bei einer kleinen '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3]]]''' auftreten, wenn fast alle Werte die gleiche '''Häufigkeit[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4]]]''' aufweisen.
  
 
[[File:quantitative-58_5.jpg|frame|center|U-förmige, bimodale Verteilung]]
 
[[File:quantitative-58_5.jpg|frame|center|U-förmige, bimodale Verteilung]]
Line 1,324: Line 1,624:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3] Siehe Kapitel 2.1.1]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 1,331: Line 1,631:
 
=== 3.1.3.3 Test auf Normalverteilung  ===
 
=== 3.1.3.3 Test auf Normalverteilung  ===
  
Verschiedene Verfahren sind nur sinnvoll anwendbar, falls annähernd eine '''Normalverteilung''' der Daten vorliegt. Dazu gehört z.B. die '''Maßkorrelation[1]''', aber auch das '''arithmetische Mittel[2]''' ist nur wenig aussagekräftig, wenn die '''Verteilung[3]''' der Daten durch '''Ausreißer''' und '''extreme Schiefe''' geprägt sind.
+
Verschiedene Verfahren sind nur sinnvoll anwendbar, falls annähernd eine '''Normalverteilung''' der Daten vorliegt. Dazu gehört z.B. die '''Maßkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1]]]''', aber auch das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' ist nur wenig aussagekräftig, wenn die '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3]]]''' der Daten durch '''Ausreißer''' und '''extreme Schiefe''' geprägt sind.
  
 
Für den Nachweis einer '''Normalverteilung''' kann auf drei wesentliche Methoden zurückgegriffen werden:
 
Für den Nachweis einer '''Normalverteilung''' kann auf drei wesentliche Methoden zurückgegriffen werden:
  
* '''optisch''': Für die optische Abschätzung der '''Normalverteilung''' kann auf die grafische Wiedergabe (siehe oben, mit Statistik- Programmen z.B. mit der grafischen Darstellung des '''Histogramms[4]''') zurückgegriffen werden
+
* '''optisch''': Für die optische Abschätzung der '''Normalverteilung''' kann auf die grafische Wiedergabe (siehe oben, mit Statistik- Programmen z.B. mit der grafischen Darstellung des '''Histogramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4]]]''') zurückgegriffen werden
 
* '''statistisch-mathematisch''' auf den '''Kolmogorov-Smirnov-Test''' (falls die Werte nicht in Klassen eingeteilt sind, besonders auch bei kleinen Stichproben)
 
* '''statistisch-mathematisch''' auf den '''Kolmogorov-Smirnov-Test''' (falls die Werte nicht in Klassen eingeteilt sind, besonders auch bei kleinen Stichproben)
* oder auf den '''Chi-Quadrat-Test (Wikipedia)[5]''' (bei in Klassen eingeteilten Daten)
+
* oder auf den '''Chi-Quadrat-Test (Wikipedia)[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;5&#93;]''' (bei in Klassen eingeteilten Daten)
  
=== '''Erkennung mit SPSS''' ===
+
==== '''Erkennung mit SPSS''' ====
  
 
Diese verschiedenen und als eigene Unterpunkte angeführten Untersuchungen können unter '''SPSS''' auch gleichzeitig getätigt werden. Klicken Sie dazu auf ANALYSIEREN -> DESKRIPTIVE STATISTIKEN -> EXPLORATIVE DATENANALYSE. Wählen Sie dort unter ’Anzeige’ die Alternative ’Beide’ und unter ’Diagramm’ die Alternative ’Normalverteilungsdiagramm mit Tests’. Dann wird in der Bildschirmausgabe der Resultate ein eigener Punkt aufgeführt: ’Tests auf Normalverteilung’, von denen uns besonders der erste der beiden Tests interessiert '''’Kolmogorov-Smirnov’''' (eigentlich eine verschärfte Variante dieses Tests). Liegt der Wert, welcher unter ’Signifikanz steht’, unter 0,05, so ist mit 95 % Sicherheit eine Normalverteilung zu verwerfen, liegt er unter 0,01, sogar mit 99 % Sicherheit.
 
Diese verschiedenen und als eigene Unterpunkte angeführten Untersuchungen können unter '''SPSS''' auch gleichzeitig getätigt werden. Klicken Sie dazu auf ANALYSIEREN -> DESKRIPTIVE STATISTIKEN -> EXPLORATIVE DATENANALYSE. Wählen Sie dort unter ’Anzeige’ die Alternative ’Beide’ und unter ’Diagramm’ die Alternative ’Normalverteilungsdiagramm mit Tests’. Dann wird in der Bildschirmausgabe der Resultate ein eigener Punkt aufgeführt: ’Tests auf Normalverteilung’, von denen uns besonders der erste der beiden Tests interessiert '''’Kolmogorov-Smirnov’''' (eigentlich eine verschärfte Variante dieses Tests). Liegt der Wert, welcher unter ’Signifikanz steht’, unter 0,05, so ist mit 95 % Sicherheit eine Normalverteilung zu verwerfen, liegt er unter 0,01, sogar mit 99 % Sicherheit.
Line 1,350: Line 1,650:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3] Siehe Kapitel 3.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4] Siehe Kapitel 3.6.1.5]]<br />
[5] http://de.wikipedia.org/wiki/Chi-Quadrat-Test<br />
+
[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;5&#93; http://de.wikipedia.org/wiki/Chi-Quadrat-Test]<br />
  
  
 
-----
 
-----
  
==== 3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm  ====
+
=== 3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm  ===
  
Das '''Histogramm[1]''' liefert uns einen ersten und recht brauchbaren Eindruck, ob die von uns analysierten Daten weitgehend normalverteilt sind. Mit SPSS ist die Herstellung eines derartigen Diagramms ein Kinderspiel:
+
Das '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''' liefert uns einen ersten und recht brauchbaren Eindruck, ob die von uns analysierten Daten weitgehend normalverteilt sind. Mit SPSS ist die Herstellung eines derartigen Diagramms ein Kinderspiel:
  
 
A. Klicken Sie in der Menüleiste auf GRAFIKEN
 
A. Klicken Sie in der Menüleiste auf GRAFIKEN
Line 1,373: Line 1,673:
 
[[File:quantitative-60_1.jpg|frame|center|Optischer Nachweis einer Normalverteilung mittels Histogramm]]
 
[[File:quantitative-60_1.jpg|frame|center|Optischer Nachweis einer Normalverteilung mittels Histogramm]]
  
Hier ist z.B. eine stärkere Abweichung von der '''Normalverteilung''' gegeben. Man beachte den großen Zwischenraum zwischen der Normalverteilungskurve und den tatsächlichen Werten bei einem Kalorien-Input von etwa 3000. Dennoch wäre auf dem 5-%-Signifikanz-Niveau die Annahme einer Normalverteilung mit dem '''Kolmogorov-Smirnov-Test[2]''' noch nicht widerlegt (wohl aber auf dem 10-%-Niveau).
+
Hier ist z.B. eine stärkere Abweichung von der '''Normalverteilung''' gegeben. Man beachte den großen Zwischenraum zwischen der Normalverteilungskurve und den tatsächlichen Werten bei einem Kalorien-Input von etwa 3000. Dennoch wäre auf dem 5-%-Signifikanz-Niveau die Annahme einer Normalverteilung mit dem '''Kolmogorov-Smirnov-Test[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2]]]''' noch nicht widerlegt (wohl aber auf dem 10-%-Niveau).
  
 
Das folgende Diagramm zeigt eine noch deutlich stärkere Abweichung von der '''Normalverteilung''':
 
Das folgende Diagramm zeigt eine noch deutlich stärkere Abweichung von der '''Normalverteilung''':
Line 1,391: Line 1,691:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
 
-----
 
-----
  
==== 3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test  ====
+
=== 3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test  ===
  
 
Der Kolmogorov-Smirnov-Test kann auch bei kleineren Stichproben eingesetzt werden, um zu überprüfen, ob eine gegebene Verteilung mit hoher Wahrscheinlichkeit von der Normalverteilung abweicht.
 
Der Kolmogorov-Smirnov-Test kann auch bei kleineren Stichproben eingesetzt werden, um zu überprüfen, ob eine gegebene Verteilung mit hoher Wahrscheinlichkeit von der Normalverteilung abweicht.
  
Die Berechnung basiert auf dem Vergleich mit einer hypothetischen Normalverteilungskurve (Bild von Internet-Enzyklopädie Wikipedia: '''http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test[1]'''):
+
Die Berechnung basiert auf dem Vergleich mit einer hypothetischen Normalverteilungskurve (Bild von Internet-Enzyklopädie Wikipedia: '''http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test[http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test &#91;1&#93;]'''):
  
 
[[File:quantitative-61_1.jpg|frame|center|Kolmogorov-Smirnov-Test - Vergleich einer vorliegenden Verteilung mit einer hypothetischen Normalverteilungskurve. Quelle: Wikipedia - http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test.]]
 
[[File:quantitative-61_1.jpg|frame|center|Kolmogorov-Smirnov-Test - Vergleich einer vorliegenden Verteilung mit einer hypothetischen Normalverteilungskurve. Quelle: Wikipedia - http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test.]]
Line 1,411: Line 1,711:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test<br />
+
[http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test &#91;1&#93; http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test]<br />
  
  
 
-----
 
-----
  
===== 3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS  =====
+
=== 3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS  ===
  
 
A. Sie wählen in SPSS den Menüpunkt ANALYSIEREN
 
A. Sie wählen in SPSS den Menüpunkt ANALYSIEREN
Line 1,440: Line 1,740:
 
Wir suchen nun den Wert für N = 8 und sehen dort die Zahl ''0,454''. Falls die ''Extremste Differenz'' in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine '''Normalverteilung''' vor. In unserem Fall haben wir jedoch eine ''Extremste Differenz'' von nur ''0,32''. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer '''Standardverteilung''' nicht verworfen werden muss. Ein wirklicher Beweis für eine Standard- Verteilung liegt allerdings dadurch nicht vor.
 
Wir suchen nun den Wert für N = 8 und sehen dort die Zahl ''0,454''. Falls die ''Extremste Differenz'' in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine '''Normalverteilung''' vor. In unserem Fall haben wir jedoch eine ''Extremste Differenz'' von nur ''0,32''. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer '''Standardverteilung''' nicht verworfen werden muss. Ein wirklicher Beweis für eine Standard- Verteilung liegt allerdings dadurch nicht vor.
  
Auch unser Wert für die ''Asymptotische Signifikanz'' ist weit größer als der Grenzwert 0,05. Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % '''Signifikanzniveau[1]'''). Da unser Wert jedoch deutlich darüber liegt, kann die Arbeitshypothese einer Normalverteilung auf diesem '''Signifikanzniveau''' nicht verworfen werden.
+
Auch unser Wert für die ''Asymptotische Signifikanz'' ist weit größer als der Grenzwert 0,05. Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % '''Signifikanzniveau[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]'''). Da unser Wert jedoch deutlich darüber liegt, kann die Arbeitshypothese einer Normalverteilung auf diesem '''Signifikanzniveau''' nicht verworfen werden.
  
'''Achtung:''' Der '''Kolmogorov-Smirnov-Test''' benötigt, v.a. bei kleinen '''Stichproben''', extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. Daher ist eine Nichtverwerfung der Annahme einer Normalverteilung durch diese Berechnungsform noch kein Beweis für das Vorliegen einer Normalverteilung. Sollte sich im '''Histogramm[2]''' eine extreme Abweichung von der fakultativ gezogenen Normalverteilungskurve zeigen, dann sollte man, auch wenn der Kolmogorov-Smirnov-Test diese nicht verwirft, dennoch eher zu nicht parametrischen Tests greifen (wie z.B. dem '''T-Test''' etc.)
+
'''Achtung:''' Der '''Kolmogorov-Smirnov-Test''' benötigt, v.a. bei kleinen '''Stichproben''', extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. Daher ist eine Nichtverwerfung der Annahme einer Normalverteilung durch diese Berechnungsform noch kein Beweis für das Vorliegen einer Normalverteilung. Sollte sich im '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2]]]''' eine extreme Abweichung von der fakultativ gezogenen Normalverteilungskurve zeigen, dann sollte man, auch wenn der Kolmogorov-Smirnov-Test diese nicht verwirft, dennoch eher zu nicht parametrischen Tests greifen (wie z.B. dem '''T-Test''' etc.)
  
Hier ein Link zu weiterführenden Tabellen, in welchen noch weitere Irrtumswahrscheinlichkeiten für die Berechnung der Abweichung von einer Standardverteilung herangezogen werden: '''https://www.erieri.com/dlc[3]'''
+
Hier ein Link zu weiterführenden Tabellen, in welchen noch weitere Irrtumswahrscheinlichkeiten für die Berechnung der Abweichung von einer Standardverteilung herangezogen werden: '''https://www.erieri.com/dlc[https://www.erieri.com/dlc/onlinetextbook/table7 &#91;3&#93;]'''
  
  
Line 1,451: Line 1,751:
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2] Siehe Kapitel 3.6.1.5]]<br />
[3] https://www.erieri.com/dlc/onlinetextbook/table7<br />
+
[https://www.erieri.com/dlc/onlinetextbook/table7 &#91;3&#93; https://www.erieri.com/dlc/onlinetextbook/table7]<br />
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|Nächstes Kapitel: 3.2 Die Ermittlung von Häufigkeiten]]'''
 +
----
 +
[[#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|Vorheriges Kapitel: 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]'''
 
= 3.2 Die Ermittlung von Häufigkeiten =
 
= 3.2 Die Ermittlung von Häufigkeiten =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Bei der '''Ermittlung von Häufigkeiten''' stellen wir fest, '''wie oft die verschiedenen Messwerte auftreten'''.
 
Bei der '''Ermittlung von Häufigkeiten''' stellen wir fest, '''wie oft die verschiedenen Messwerte auftreten'''.
  
Die Ermittlung von '''Häufigkeiten''' ist das einfachste statistische Verfahren und kann für jede Art von '''Skala[1]''' angewandt werden. Die Häufigkeiten der Messwerte geben uns Hinweise auf ihre '''Verteilung[2]''' d.h. wie oft die einzelnen Ausprägungen vorkamen. Die Kenntnis dieser Verteilung gibt uns somit Auskunft darüber, was in einer untersuchten Stichprobe der Normalfall, und was die Ausnahme ist.
+
Die Ermittlung von '''Häufigkeiten''' ist das einfachste statistische Verfahren und kann für jede Art von '''Skala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' angewandt werden. Die Häufigkeiten der Messwerte geben uns Hinweise auf ihre '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' d.h. wie oft die einzelnen Ausprägungen vorkamen. Die Kenntnis dieser Verteilung gibt uns somit Auskunft darüber, was in einer untersuchten Stichprobe der Normalfall, und was die Ausnahme ist.
  
 
Dabei wird das Auftreten von Werten gezählt. Prinzipiell unterscheiden wir zwischen
 
Dabei wird das Auftreten von Werten gezählt. Prinzipiell unterscheiden wir zwischen
Line 1,465: Line 1,773:
 
* '''Bi- bzw. multivariablen Verteilungen:''' Es wird gezählt, wie häufig Kombinationen von zwei oder mehr Variablen auftreten (z.B. Schulnoten und soziale Schicht; 17 SchülerInnen gehörten zur Oberschicht und hatten eine 1, 22 SchülerInnen zur Oberschicht und hatten eine 2 etc.). Mit '''Bi- oder multivariablen Verteilungen''' möchte man Zusammenhänge zwischen zwei Variablen feststellen.
 
* '''Bi- bzw. multivariablen Verteilungen:''' Es wird gezählt, wie häufig Kombinationen von zwei oder mehr Variablen auftreten (z.B. Schulnoten und soziale Schicht; 17 SchülerInnen gehörten zur Oberschicht und hatten eine 1, 22 SchülerInnen zur Oberschicht und hatten eine 2 etc.). Mit '''Bi- oder multivariablen Verteilungen''' möchte man Zusammenhänge zwischen zwei Variablen feststellen.
  
Die tabellarische Darstellung der Häufigkeiten in bi- bzw. multivariablen Verteilungen wird auch als '''Kreuztabelle[3]''' oder '''Kontingenztafel''' bezeichnet.
+
Die tabellarische Darstellung der Häufigkeiten in bi- bzw. multivariablen Verteilungen wird auch als '''Kreuztabelle[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3]]]''' oder '''Kontingenztafel''' bezeichnet.
  
 
Nach der Systematik der Darstellung unterscheidet man zwischen der '''Urliste''', der '''primären Tafel''' bzw. der '''Häufigkeitstabelle.'''
 
Nach der Systematik der Darstellung unterscheidet man zwischen der '''Urliste''', der '''primären Tafel''' bzw. der '''Häufigkeitstabelle.'''
Line 1,476: Line 1,784:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3] Siehe Kapitel 3.5.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3] Siehe Kapitel 3.5.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
</div>
  
 
== 3.2.1 Liste und Tafeln ==
 
== 3.2.1 Liste und Tafeln ==
  
=== '''Urliste''' ===
+
==== '''Urliste''' ====
  
 
Aufgenommene '''Messwerte''' sind anfangs ungeordnet. Denken Sie z.B. an 30 Personen, deren Alter Sie abgefragt haben, ohne die Einträge größenmäßig zu ordnen. Diese '''ungeordnete Liste''' wird als so genannte '''Urliste''' bezeichnet. Eine '''Urliste''' ist die ungeordnete Aufzählung der Werte in der gleichen Reihenfolge, in der sie während der Abfrage aufgenommen wurden.
 
Aufgenommene '''Messwerte''' sind anfangs ungeordnet. Denken Sie z.B. an 30 Personen, deren Alter Sie abgefragt haben, ohne die Einträge größenmäßig zu ordnen. Diese '''ungeordnete Liste''' wird als so genannte '''Urliste''' bezeichnet. Eine '''Urliste''' ist die ungeordnete Aufzählung der Werte in der gleichen Reihenfolge, in der sie während der Abfrage aufgenommen wurden.
Line 1,487: Line 1,806:
 
[[File:quantitative-64_1.jpg|frame|center|Beispiel für eine Urliste - Kinderanzahl der Befragten]]
 
[[File:quantitative-64_1.jpg|frame|center|Beispiel für eine Urliste - Kinderanzahl der Befragten]]
  
=== '''Primäre Tafel''' ===
+
==== '''Primäre Tafel''' ====
  
 
Wesentlich übersichtlicher ist bereits die '''primäre Tafel, in welcher die Ausprägungen sortiert werden.''' Sie gibt deutlich mehr Aufschluss über die Charakteristiken der Daten. Hier ist auf einen Blick erkennbar, dass die Messwerte 1 und 2 am häufigsten vorkommen:
 
Wesentlich übersichtlicher ist bereits die '''primäre Tafel, in welcher die Ausprägungen sortiert werden.''' Sie gibt deutlich mehr Aufschluss über die Charakteristiken der Daten. Hier ist auf einen Blick erkennbar, dass die Messwerte 1 und 2 am häufigsten vorkommen:
Line 1,502: Line 1,821:
 
Dabei trägt man in der 1. Spalte die Messwerte ein (wie z.B. Kinderzahl oder hier Ländernamen), in der 2. Spalte die absolute Häufigkeit der Messwerte (durchzählen, wie oft z.B. Frankreich genannt wird) und in Spalte 3 berechnet man die ''relative Häufigkeit''. Die relative Häufigkeit errechnet man folgendermaßen: man nimmt die absolute Häufigkeit eines Messwertes (z.B. waren 16 FranzösInnen beim Kongress), dividiert diesen durch die Summe der Messwerte (hier insgesamt 50 anwesende WissenschaftlerInnen) und multipliziert das Ergebnis mit 10 (um auf Prozentwerte zu kommen). Für FranzösInnen daher 16/50*100=32 %. [[File:quantitative-65_1.jpg|frame|center|Häufigkeitstabelle - Herkunft der WissenschaftlerInnen eines Kongreß]]
 
Dabei trägt man in der 1. Spalte die Messwerte ein (wie z.B. Kinderzahl oder hier Ländernamen), in der 2. Spalte die absolute Häufigkeit der Messwerte (durchzählen, wie oft z.B. Frankreich genannt wird) und in Spalte 3 berechnet man die ''relative Häufigkeit''. Die relative Häufigkeit errechnet man folgendermaßen: man nimmt die absolute Häufigkeit eines Messwertes (z.B. waren 16 FranzösInnen beim Kongress), dividiert diesen durch die Summe der Messwerte (hier insgesamt 50 anwesende WissenschaftlerInnen) und multipliziert das Ergebnis mit 10 (um auf Prozentwerte zu kommen). Für FranzösInnen daher 16/50*100=32 %. [[File:quantitative-65_1.jpg|frame|center|Häufigkeitstabelle - Herkunft der WissenschaftlerInnen eines Kongreß]]
  
=== '''Akkumulierte Häufigkeit''' ===
+
==== '''Akkumulierte Häufigkeit''' ====
  
Wenn keine '''Nominalskalierung[1]''' vorliegt, ist auch die Darstellung der '''akkumulierten Häufigkeit''' sinnvoll. Sie gibt Auskunft über die '''Häufigkeit''' aller Messwerte, die bis zu einem bestimmten Niveau auftreten.
+
Wenn keine '''Nominalskalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1]]]''' vorliegt, ist auch die Darstellung der '''akkumulierten Häufigkeit''' sinnvoll. Sie gibt Auskunft über die '''Häufigkeit''' aller Messwerte, die bis zu einem bestimmten Niveau auftreten.
  
 
Man errechnet sie folgendermaßen: Man zählt alle relativen Häufigkeiten zusammen, die einschließlich dieser Zeile auftraten: Die akkumulierte Häufigkeit für die Note 3 (= alle EthnologInnen, die zumindest die Note 3 erhielten) wäre daher: 19,2 % + 21,8 % + 28,2 % = 69,2 %.
 
Man errechnet sie folgendermaßen: Man zählt alle relativen Häufigkeiten zusammen, die einschließlich dieser Zeile auftraten: Die akkumulierte Häufigkeit für die Note 3 (= alle EthnologInnen, die zumindest die Note 3 erhielten) wäre daher: 19,2 % + 21,8 % + 28,2 % = 69,2 %.
Line 1,555: Line 1,874:
 
Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIK - HÄUFIGKEITEN und wählen Sie dort die Variable aus, deren Häufigkeitsverteilung Sie grafisch darstellen möchten.
 
Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIK - HÄUFIGKEITEN und wählen Sie dort die Variable aus, deren Häufigkeitsverteilung Sie grafisch darstellen möchten.
  
Klicken Sie dann auf Diagramme. Sie haben nun die Auswahlmöglichkeit zwischen '''Balkendiagrammen[1]''', '''Kreisdiagrammen[2]''' und '''Histogrammen[3]'''. Je nach Datenlage sollten Sie unterschiedliche Diagrammtypen heranziehen. Siehe dazu den Punkt '''Diagramme[4]'''.
+
Klicken Sie dann auf Diagramme. Sie haben nun die Auswahlmöglichkeit zwischen '''Balkendiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1]]]''', '''Kreisdiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[2]]]''' und '''Histogrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3]]]'''. Je nach Datenlage sollten Sie unterschiedliche Diagrammtypen heranziehen. Siehe dazu den Punkt '''Diagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|[4]]]'''.
  
  
Line 1,568: Line 1,887:
 
== 3.2.3 Klassenbildung (Gruppierung) von Daten ==
 
== 3.2.3 Klassenbildung (Gruppierung) von Daten ==
  
Unter der '''Gruppierung von Daten''' verstehen wir die '''Zusammenfassung von verschiedenen Ausprägungen zu Klassen'''. Eine Klasse ist die '''Menge sämtlicher Messwerte''', die '''innerhalb festgelegter Grenzen''' liegen. Dadurch kann die '''Häufigkeitsverteilung[1]''' einer Variablen mit einer Vielzahl unterschiedlicher Ausprägungen übersichtlicher dargestellt werden.
+
Unter der '''Gruppierung von Daten''' verstehen wir die '''Zusammenfassung von verschiedenen Ausprägungen zu Klassen'''. Eine Klasse ist die '''Menge sämtlicher Messwerte''', die '''innerhalb festgelegter Grenzen''' liegen. Dadurch kann die '''Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' einer Variablen mit einer Vielzahl unterschiedlicher Ausprägungen übersichtlicher dargestellt werden.
  
 
'''Beispiel: Gemessene Körpergrößen und Umwandlung in Klassen'''<br />
 
'''Beispiel: Gemessene Körpergrößen und Umwandlung in Klassen'''<br />
Line 1,577: Line 1,896:
 
Viel übersichtlicher wäre es aber, diese 100 verschiedenen Ausprägungen zu '''Klassen''' von benachbarten Messwerten zusammenzufassen. Treten extrem viele unterschiedliche Ausprägungen auf, sind 10-19 Klassen sinnvoll. Wählt man bei diesem Beispiel 10 Klassen, fallen jeweils 10 Messwerte in eine Klasse (100:10=10): [[File:quantitative-68_2.jpg|frame|center|In Klassen eingeteilte Körpergrößen]]
 
Viel übersichtlicher wäre es aber, diese 100 verschiedenen Ausprägungen zu '''Klassen''' von benachbarten Messwerten zusammenzufassen. Treten extrem viele unterschiedliche Ausprägungen auf, sind 10-19 Klassen sinnvoll. Wählt man bei diesem Beispiel 10 Klassen, fallen jeweils 10 Messwerte in eine Klasse (100:10=10): [[File:quantitative-68_2.jpg|frame|center|In Klassen eingeteilte Körpergrößen]]
  
Die '''Klassenbreite''' ist bei '''diskreten Variablen[2]''' die Anzahl der in der Klasse zusammengefassten Messwerte. Berechnet wird sie mit: ''Höchster Wert der Klasse'' minus ''höchstem Wert der vorausgegangenen Klasse'' (hier also mit z.B. 1,89 m- 1,79 m= 0,10 m).
+
Die '''Klassenbreite''' ist bei '''diskreten Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[2]]]''' die Anzahl der in der Klasse zusammengefassten Messwerte. Berechnet wird sie mit: ''Höchster Wert der Klasse'' minus ''höchstem Wert der vorausgegangenen Klasse'' (hier also mit z.B. 1,89 m- 1,79 m= 0,10 m).
  
 
Die ''(exakten)'' '''Klassengrenzen (Intervallgrenzen)''' sind die kleinsten bzw. größten Messwerte einer Klasse (hier also z.B. 1,70 m und 1,79999 =1,8 m).
 
Die ''(exakten)'' '''Klassengrenzen (Intervallgrenzen)''' sind die kleinsten bzw. größten Messwerte einer Klasse (hier also z.B. 1,70 m und 1,79999 =1,8 m).
Line 1,596: Line 1,915:
 
=== 3.2.3.1 Gruppierung mit SPSS  ===
 
=== 3.2.3.1 Gruppierung mit SPSS  ===
  
In vielen Fällen, besonders bei '''stetigen Variablen[1]''', wird die Zahl der Ausprägungen einer Variablen so groß sein, dass '''Häufigkeitsverteilungen[2]''' unübersichtlich werden. Im folgenden Beispiel wurde die Altersverteilung der Antwortenden abgefragt:
+
In vielen Fällen, besonders bei '''stetigen Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[1]]]''', wird die Zahl der Ausprägungen einer Variablen so groß sein, dass '''Häufigkeitsverteilungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' unübersichtlich werden. Im folgenden Beispiel wurde die Altersverteilung der Antwortenden abgefragt:
  
 
[[File:quantitative-69_1.gif|frame|center|Häufigkeitsverteilung des Alters der Befragten]]
 
[[File:quantitative-69_1.gif|frame|center|Häufigkeitsverteilung des Alters der Befragten]]
  
Es wäre deutlich übersichtlicher, diese Werte in eine kleine Zahl von Klassen umzukodieren. Dazu benützen Sie die Funktion TRANSFORMIEREN - '''UMCODIEREN[3]''' in der Menüleiste. Nun können Sie sich entscheiden zwischen einer Umcodierung in die ''gleiche'' oder in ''eine andere Variable''. Es ist besser, sich für ''eine andere Variable'' zu entscheiden, da durch die '''Umcodierung''' (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch ''Umcodierung in eine neue Variable'' ausgeschlossen.
+
Es wäre deutlich übersichtlicher, diese Werte in eine kleine Zahl von Klassen umzukodieren. Dazu benützen Sie die Funktion TRANSFORMIEREN - '''UMCODIEREN[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[3]]]''' in der Menüleiste. Nun können Sie sich entscheiden zwischen einer Umcodierung in die ''gleiche'' oder in ''eine andere Variable''. Es ist besser, sich für ''eine andere Variable'' zu entscheiden, da durch die '''Umcodierung''' (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch ''Umcodierung in eine neue Variable'' ausgeschlossen.
  
 
Sie wählen nun die Variable aus, welche umcodiert werden soll und geben im Feld ''Ausgabevariable'' einen neuen Namen dafür ein, der aus Gründen der Kompatibilität mit älteren Programmen acht Zeichen nicht überschreiten darf. Im Feld darunter können Sie jedoch einen beliebig langen und expressiveren Namen wählen.
 
Sie wählen nun die Variable aus, welche umcodiert werden soll und geben im Feld ''Ausgabevariable'' einen neuen Namen dafür ein, der aus Gründen der Kompatibilität mit älteren Programmen acht Zeichen nicht überschreiten darf. Im Feld darunter können Sie jedoch einen beliebig langen und expressiveren Namen wählen.
Line 1,614: Line 1,933:
 
[[File:quantitative-69_3.gif|frame|center|Häufigkeitstabelle der umkodierten Altersverteilung]]
 
[[File:quantitative-69_3.gif|frame|center|Häufigkeitstabelle der umkodierten Altersverteilung]]
  
Nun müssen wir die neuen Werte, ausschließlich für die Ausgabe von '''SPSS''', '''rückcodieren''', um die Tabelle informativer zu machen, da wir nicht sofort erkennen können, dass ''0'' für ’unter 20’ steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben ('''Diagramme[4]''', Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die ''Variablenansicht.'' Im neuen Fenster finden wir bei der neuen Variable das Attribut ''Variablenlabel.'' Nach Doppelklick darauf erscheint folgendes Fenster:
+
Nun müssen wir die neuen Werte, ausschließlich für die Ausgabe von '''SPSS''', '''rückcodieren''', um die Tabelle informativer zu machen, da wir nicht sofort erkennen können, dass ''0'' für ’unter 20’ steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben ('''Diagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[4]]]''', Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die ''Variablenansicht.'' Im neuen Fenster finden wir bei der neuen Variable das Attribut ''Variablenlabel.'' Nach Doppelklick darauf erscheint folgendes Fenster:
  
 
[[File:quantitative-69_4.jpg|frame|center|Wertelabels definieren mit SPSS]]
 
[[File:quantitative-69_4.jpg|frame|center|Wertelabels definieren mit SPSS]]
Line 1,636: Line 1,955:
 
Falls Sie bei einer Frage explizit Mehrfachantworten zugelassen haben, können Sie deren '''Häufigkeiten''' mit '''SPSS''' komfortabel tabellarisch darstellen.
 
Falls Sie bei einer Frage explizit Mehrfachantworten zugelassen haben, können Sie deren '''Häufigkeiten''' mit '''SPSS''' komfortabel tabellarisch darstellen.
  
=== '''1. Definition eines Mehrfachantwortensets''' ===
+
==== '''1. Definition eines Mehrfachantwortensets''' ====
  
 
Sie müssen dazu zuerst ein ''(Mehrfachantworten-)Set'' definieren:
 
Sie müssen dazu zuerst ein ''(Mehrfachantworten-)Set'' definieren:
Line 1,660: Line 1,979:
 
Das Set ist nun definiert, Sie können zur Analyse gehen:
 
Das Set ist nun definiert, Sie können zur Analyse gehen:
  
=== '''2. Analyse''' ===
+
==== '''2. Analyse''' ====
  
 
A. Klicken Sie auf ANALYSIEREN - MEHRFACHANTWORT - HÄUFIGKEITEN. Das folgende Fenster öffnet sich:
 
A. Klicken Sie auf ANALYSIEREN - MEHRFACHANTWORT - HÄUFIGKEITEN. Das folgende Fenster öffnet sich:
Line 1,673: Line 1,992:
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|Nächstes Kapitel: 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]'''
 +
----
 +
[[#3.2 Die Ermittlung von Häufigkeiten|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|Vorheriges Kapitel: 3.2 Die Ermittlung von Häufigkeiten]]'''
 
= 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz =
 
= 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
'''Lagemaße''' beschreiben das '''Zentrum einer Verteilung''' durch eine Kennzahl.
 
'''Lagemaße''' beschreiben das '''Zentrum einer Verteilung''' durch eine Kennzahl.
Line 1,686: Line 2,013:
 
* der '''Modalwert''' bezeichnet ausschließlich den am häufigsten vorkommenden Wert, der keinerlei Hinweis über die Eigenheiten der anderen Werte gibt.
 
* der '''Modalwert''' bezeichnet ausschließlich den am häufigsten vorkommenden Wert, der keinerlei Hinweis über die Eigenheiten der anderen Werte gibt.
  
Je nach '''Verteilung[1]''', '''Skalenniveau[2]''' und '''Art der Daten[3]''' sind unterschiedliche '''Lagemaße''' sinnvoll. Bei gegebener '''Normalverteilung[4]''' stimmen sowohl '''Median''' wie auch der '''Modalwert''' mit dem '''Arithmetischen Mittel''' überein. In schiefen Verteilungen hingegen nehmen sie sehr unterschiedliche Positionen ein. In rechtsschiefen Verteilungen (der Abfall erfolgt nach rechts) ist der Modalwert am kleinsten, danach kommt der Median, am größten ist der Mittelwert. In '''linksschiefen Verteilungen''' ist es umgekehrt.
+
Je nach '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''', '''Skalenniveau[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[2]]]''' und '''Art der Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten Daten|[3]]]''' sind unterschiedliche '''Lagemaße''' sinnvoll. Bei gegebener '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4]9]''' stimmen sowohl '''Median''' wie auch der '''Modalwert''' mit dem '''Arithmetischen Mittel''' überein. In schiefen Verteilungen hingegen nehmen sie sehr unterschiedliche Positionen ein. In rechtsschiefen Verteilungen (der Abfall erfolgt nach rechts) ist der Modalwert am kleinsten, danach kommt der Median, am größten ist der Mittelwert. In '''linksschiefen Verteilungen''' ist es umgekehrt.
  
 
[[File:quantitative-71_1.jpg|frame|center|Unterschiedliche Lage von Median, Mittelwert und Modalwert in rechtsschiefer Verteilung]]
 
[[File:quantitative-71_1.jpg|frame|center|Unterschiedliche Lage von Median, Mittelwert und Modalwert in rechtsschiefer Verteilung]]
 
 
 
  
  
Line 1,700: Line 2,024:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4] Siehe Kapitel 3.1.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4] Siehe Kapitel 3.1.3.1]]<br />
  
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
</div>
  
 
== 3.3.1 Modalwert ==
 
== 3.3.1 Modalwert ==
Line 1,708: Line 2,045:
 
In der folgenden geordneten Zahlenreihe 2, 3, 3, 3, 4, 4, 5, 6, 7 wäre ''3'' der Modalwert (weil diese Zahl dreimal auftritt, häufiger als jede andere Zahl).
 
In der folgenden geordneten Zahlenreihe 2, 3, 3, 3, 4, 4, 5, 6, 7 wäre ''3'' der Modalwert (weil diese Zahl dreimal auftritt, häufiger als jede andere Zahl).
  
=== '''Mittelung bei benachbarten gleichgroßen Werten''' ===
+
==== '''Mittelung bei benachbarten gleichgroßen Werten''' ====
  
 
Falls mehrere benachbarte Werte die größte Häufigkeit aufweisen, so wird ihr '''arithmetisches Mittel''' berechnet. Haben z.B. die Werte 5 und 6 gleichermaßen die größte Häufigkeit, so ist der Modalwert der Durchschnitt dieser beiden Werte.
 
Falls mehrere benachbarte Werte die größte Häufigkeit aufweisen, so wird ihr '''arithmetisches Mittel''' berechnet. Haben z.B. die Werte 5 und 6 gleichermaßen die größte Häufigkeit, so ist der Modalwert der Durchschnitt dieser beiden Werte.
Line 1,715: Line 2,052:
 
In der Zahlenreihe 2, 3, 3, 3, 4, 4, 4, 5, 6, 7 liegt der Modalwert bei 3,5. Sowohl ''3'' wie auch ''4'' kommen mit jeweilig dreimaligem Auftreten häufiger als die anderen Werte vor. Das arithmetische Mittel von ''3'' und ''4'' liegt bei 3,5.
 
In der Zahlenreihe 2, 3, 3, 3, 4, 4, 4, 5, 6, 7 liegt der Modalwert bei 3,5. Sowohl ''3'' wie auch ''4'' kommen mit jeweilig dreimaligem Auftreten häufiger als die anderen Werte vor. Das arithmetische Mittel von ''3'' und ''4'' liegt bei 3,5.
  
=== '''Modalklasse: Klasse mit größter Zahl an Einträgen''' ===
+
==== '''Modalklasse: Klasse mit größter Zahl an Einträgen''' ====
  
Bei '''klassierten Daten[1]''' ist die '''Modalklasse''' diejenige Klasse mit der größten Zahl an Einträgen
+
Bei '''klassierten Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]''' ist die '''Modalklasse''' diejenige Klasse mit der größten Zahl an Einträgen
  
=== '''Nur selten praktische Relevanz des Modalwerts''' ===
+
==== '''Nur selten praktische Relevanz des Modalwerts''' ====
  
Der '''Modalwert''' ist aussagekräftig, wenn ein einzelner Wert sehr häufig vorkommt (z.B. 27 '''Frauen''' und drei Männer) und unsinnig, wenn der häufigste Wert nur relativ selten vorkommt. Der '''Modalwert''' kann im Gegensatz zum '''arithmetischen Mittelwert''' oder zum '''Median''' auch sinnvoll in '''Nominalskalen[2]''' verwendet werden.
+
Der '''Modalwert''' ist aussagekräftig, wenn ein einzelner Wert sehr häufig vorkommt (z.B. 27 '''Frauen''' und drei Männer) und unsinnig, wenn der häufigste Wert nur relativ selten vorkommt. Der '''Modalwert''' kann im Gegensatz zum '''arithmetischen Mittelwert''' oder zum '''Median''' auch sinnvoll in '''Nominalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[2]]]''' verwendet werden.
  
  
Line 1,738: Line 2,075:
 
Z.B. die durchschnittliche Zahl von Schafen der Bauern im Dorf Nkorongoji in Mali: Die Messwerte sind: 5, 12, 3, 4, 7, 6. Die Summe ist 37, die Zahl der Messwerte ist 6, also ist das arithmetische Mittel 37/6= 6,17.  
 
Z.B. die durchschnittliche Zahl von Schafen der Bauern im Dorf Nkorongoji in Mali: Die Messwerte sind: 5, 12, 3, 4, 7, 6. Die Summe ist 37, die Zahl der Messwerte ist 6, also ist das arithmetische Mittel 37/6= 6,17.  
  
=== '''Arithmetisches Mittel bei Einteilung der Messwerte in Klassen:''' ===
+
==== '''Arithmetisches Mittel bei Einteilung der Messwerte in Klassen:''' ====
  
Wenn die Daten zahlreicher sind bzw. bereits in '''Klassen[1]''' eingeteilt wurden, kann man das '''arithmetische Mittel''' einfacher berechnen: man multipliziert in jeder Klasse die '''Klassenmitte''' (Durchschnitt aus dem theoretisch kleinstem und größten Wert einer Klasse) mit der Zahl der Einträge in der jeweiligen Klasse:  
+
Wenn die Daten zahlreicher sind bzw. bereits in '''Klassen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]''' eingeteilt wurden, kann man das '''arithmetische Mittel''' einfacher berechnen: man multipliziert in jeder Klasse die '''Klassenmitte''' (Durchschnitt aus dem theoretisch kleinstem und größten Wert einer Klasse) mit der Zahl der Einträge in der jeweiligen Klasse:  
  
 
[[File:quantitative-73_2.jpg|frame|center|Arithmetisches Mittel bei Einteilung der Messwerte in Klassen]]
 
[[File:quantitative-73_2.jpg|frame|center|Arithmetisches Mittel bei Einteilung der Messwerte in Klassen]]
Line 1,762: Line 2,099:
 
Der '''Median''' ist jener Wert, welcher in einer größenmäßig geordneten Reihe '''genau in der Mitte''' liegt. D.h. oberhalb wie unterhalb von ihm befindet sich eine gleichgroße Anzahl von Einträgen.
 
Der '''Median''' ist jener Wert, welcher in einer größenmäßig geordneten Reihe '''genau in der Mitte''' liegt. D.h. oberhalb wie unterhalb von ihm befindet sich eine gleichgroße Anzahl von Einträgen.
  
Warum benötigen wir ihn, da es doch auch das '''arithmetische Mittel[1]''' gibt? Das '''arithmetische Mittel''' ist der Mittelwert, der sich ergibt, wenn wir eine Summe durch die Anzahl der gezählten Elemente dividieren.
+
Warum benötigen wir ihn, da es doch auch das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' gibt? Das '''arithmetische Mittel''' ist der Mittelwert, der sich ergibt, wenn wir eine Summe durch die Anzahl der gezählten Elemente dividieren.
  
=== '''Beispiel: Verzerrung durch Mittel, nicht aber durch Median''' ===
+
==== '''Beispiel: Verzerrung durch Mittel, nicht aber durch Median''' ====
  
 
Die folgende Grafik zeigt das individuelle Einkommen der EinwohnerInnen des fiktiven Ortes Largebread im Jahr 2002:
 
Die folgende Grafik zeigt das individuelle Einkommen der EinwohnerInnen des fiktiven Ortes Largebread im Jahr 2002:
Line 1,770: Line 2,107:
 
[[File:quantitative-74_1.jpg|frame|center|Durchschnittseinkommen in Largebread]]
 
[[File:quantitative-74_1.jpg|frame|center|Durchschnittseinkommen in Largebread]]
  
Das durchschnittliche Einkommen von etwa 26000 $ scheint die Einkommenssituation der EinwohnerInnen von Largebread gut zu beschreiben. Die '''Normalverteilungskurve[2]''' zeigt uns an, dass das Einkommen relativ gut normalverteilt ist.
+
Das durchschnittliche Einkommen von etwa 26000 $ scheint die Einkommenssituation der EinwohnerInnen von Largebread gut zu beschreiben. Die '''Normalverteilungskurve[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2]]]''' zeigt uns an, dass das Einkommen relativ gut normalverteilt ist.
  
 
Was würde aber jetzt passieren, wenn der reichste Mann der Welt, Bill Gates, sich plötzlich entschließen würde, nach Largebread zu ziehen? Bill Gates verfügt über ein Jahreseinkommen von 5 Milliarden $. Das Diagramm verändert sich extrem:
 
Was würde aber jetzt passieren, wenn der reichste Mann der Welt, Bill Gates, sich plötzlich entschließen würde, nach Largebread zu ziehen? Bill Gates verfügt über ein Jahreseinkommen von 5 Milliarden $. Das Diagramm verändert sich extrem:
Line 1,785: Line 2,122:
 
* '''bei sehr kleiner Beobachtungszahl''' (einzelne Werte können besonders leicht den Durchschnittswert verzerren),
 
* '''bei sehr kleiner Beobachtungszahl''' (einzelne Werte können besonders leicht den Durchschnittswert verzerren),
 
* '''bei Verteilungen mit offenen Klassen''' (Schwierigkeit der Bestimmung der Klassenmitte der offenen Klassen),
 
* '''bei Verteilungen mit offenen Klassen''' (Schwierigkeit der Bestimmung der Klassenmitte der offenen Klassen),
* bei '''Ordinalskalen[3]''' (hier sollte er nicht verwendet werden).
+
* bei '''Ordinalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3]]]''' (hier sollte er nicht verwendet werden).
  
 
In all diesen Fällen ist es genauer, zum Median zu greifen. '''Der Median ist der Wert, der in einer geordneten Liste (oder primären Tafel) genau in der Mitte liegt, d.h. dass sich genauso viele Werte oberhalb wie unterhalb des Wertes befinden. Dieser Wert liegt an (n+1)/2ter Position.''' Hat man 3 Werte, dann ist der Medien der 2. Wert ([3+1]/2).
 
In all diesen Fällen ist es genauer, zum Median zu greifen. '''Der Median ist der Wert, der in einer geordneten Liste (oder primären Tafel) genau in der Mitte liegt, d.h. dass sich genauso viele Werte oberhalb wie unterhalb des Wertes befinden. Dieser Wert liegt an (n+1)/2ter Position.''' Hat man 3 Werte, dann ist der Medien der 2. Wert ([3+1]/2).
Line 1,801: Line 2,138:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3] Siehe Kapitel 3.1.2.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3] Siehe Kapitel 3.1.2.3]]<br />
  
Line 1,838: Line 2,175:
 
== 3.3.4 Geometrisches Mittel ==
 
== 3.3.4 Geometrisches Mittel ==
  
Das '''geometrische Mittel''' ist der '''Mittelwert bei mathematischen Produkten''', wie z.B. bei Wachstums- oder Zinsfaktoren. Das geometrische Mittel kann nur bei '''Proportionalskalen[1]''' verwendet werden. Dieses wird als n- te Wurzel aus der relativen Veränderung (Endwert dividiert durch Anfangswert) berechnet, wobei n der Zahl der Zeiteinheiten entspricht.
+
Das '''geometrische Mittel''' ist der '''Mittelwert bei mathematischen Produkten''', wie z.B. bei Wachstums- oder Zinsfaktoren. Das geometrische Mittel kann nur bei '''Proportionalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[1]]]''' verwendet werden. Dieses wird als n- te Wurzel aus der relativen Veränderung (Endwert dividiert durch Anfangswert) berechnet, wobei n der Zahl der Zeiteinheiten entspricht.
  
 
'''Beispiel: durchschnittliche Inflationsrate'''<br />
 
'''Beispiel: durchschnittliche Inflationsrate'''<br />
Line 1,845: Line 2,182:
 
Ähnlich müssen wir zurückrechnen, wenn wir von einem bestimmten Preisniveau nach 10 Jahren auf die durchschnittliche Inflationsrate dieser 10 Jahre schließen wollen.
 
Ähnlich müssen wir zurückrechnen, wenn wir von einem bestimmten Preisniveau nach 10 Jahren auf die durchschnittliche Inflationsrate dieser 10 Jahre schließen wollen.
  
=== '''Errechnung der durchschnittlichen Inflationsrate''' ===
+
==== '''Errechnung der durchschnittlichen Inflationsrate''' ====
  
 
Der Lebenshaltungskostenindex liegt 2006 bei 136,5, vor 10 Jahren lag dieser bei 100. Somit erfolgte eine Preissteigerung von 36,5 % im Laufe der letzten 10 Jahre. Es wäre hier falsch, als durchschnittliche Preissteigerung/Jahr den Wert 3,65 % anzunehmen (36,5 % durch die Zahl der Jahre, also 10, dividiert), da sich die Werte gegenseitig beeinflussten (multiplizierten).
 
Der Lebenshaltungskostenindex liegt 2006 bei 136,5, vor 10 Jahren lag dieser bei 100. Somit erfolgte eine Preissteigerung von 36,5 % im Laufe der letzten 10 Jahre. Es wäre hier falsch, als durchschnittliche Preissteigerung/Jahr den Wert 3,65 % anzunehmen (36,5 % durch die Zahl der Jahre, also 10, dividiert), da sich die Werte gegenseitig beeinflussten (multiplizierten).
Line 1,889: Line 2,226:
 
Die Zahl in Klammern gibt die Priorität an. X(1) wird daher als wichtiger als X(2) eingestuft. Fett markiertes X bezeichnet Kennzahlen, welche bei der gegebenen Datenart absolut sinnvoll sind, nicht fettes X liefert mögliche, aber nicht besonders sinnvolle oder teilweise sogar in die Irre führende Werte.
 
Die Zahl in Klammern gibt die Priorität an. X(1) wird daher als wichtiger als X(2) eingestuft. Fett markiertes X bezeichnet Kennzahlen, welche bei der gegebenen Datenart absolut sinnvoll sind, nicht fettes X liefert mögliche, aber nicht besonders sinnvolle oder teilweise sogar in die Irre führende Werte.
  
Während Lagemaße bei '''eingipfeligen symmetrischen[1]''' '''Daten''' weitgehend übereinstimmen und typisch für die Daten sind, sind sie bei '''anderen Verteilungsformen[2]''' ('''U-förmige''', sehr '''schiefe''', '''mehrgipfelige''', '''gleichverteilte''') nicht aussagekräftig für die Verteilung.
+
Während Lagemaße bei '''eingipfeligen symmetrischen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1]]]''' '''Daten''' weitgehend übereinstimmen und typisch für die Daten sind, sind sie bei '''anderen Verteilungsformen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|[2]]]''' ('''U-förmige''', sehr '''schiefe''', '''mehrgipfelige''', '''gleichverteilte''') nicht aussagekräftig für die Verteilung.
  
  
Line 1,900: Line 2,237:
 
== 3.3.7 Berechnung von Lagemaßen mit SPSS ==
 
== 3.3.7 Berechnung von Lagemaßen mit SPSS ==
  
Während das '''geometrische Mittel[1]''' mit jedem mathematischen Taschenrechner leicht berechnet werden kann (einfach n-te Wurzel aus der Endzahl), sind die '''Lagemaße''' mit SPSS sehr einfach zu berechnen.
+
Während das '''geometrische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[1]]]''' mit jedem mathematischen Taschenrechner leicht berechnet werden kann (einfach n-te Wurzel aus der Endzahl), sind die '''Lagemaße''' mit SPSS sehr einfach zu berechnen.
  
 
Klicken Sie in der Menüleiste auf ANALYSIEREN - HÄUFIGKEITEN und wählen Sie dann ''Statistik'' aus:
 
Klicken Sie in der Menüleiste auf ANALYSIEREN - HÄUFIGKEITEN und wählen Sie dann ''Statistik'' aus:
Line 1,910: Line 2,247:
 
[[File:quantitative-80_2.gif|frame|center|Lagemaße des BNE aller Länder der Welt]]
 
[[File:quantitative-80_2.gif|frame|center|Lagemaße des BNE aller Länder der Welt]]
  
Wir sehen, dass die '''Lagemaße''' extrem auseinanderliegen. Warum, macht das '''Histogramm[2]''' mit '''Normalverteilungskurve[3]''' (anklicken unter ''Diagramme'') sofort sichtbar: Eine kleine Zahl von reichen Ländern hebt das '''arithmetische Mittel''' auf ein Niveau, welches außerhalb der Reichweite der meisten Länder dieser Welt liegt:
+
Wir sehen, dass die '''Lagemaße''' extrem auseinanderliegen. Warum, macht das '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2]]]''' mit '''Normalverteilungskurve[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[3]]]''' (anklicken unter ''Diagramme'') sofort sichtbar: Eine kleine Zahl von reichen Ländern hebt das '''arithmetische Mittel''' auf ein Niveau, welches außerhalb der Reichweite der meisten Länder dieser Welt liegt:
  
 
[[File:quantitative-80_3.jpg|frame|center|Histogramm des BNE aller Länder der Welt]]
 
[[File:quantitative-80_3.jpg|frame|center|Histogramm des BNE aller Länder der Welt]]
Line 1,924: Line 2,261:
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|Nächstes Kapitel: 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]'''
 +
----
 +
[[#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|Vorheriges Kapitel: 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]'''
 
= 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’ =
 
= 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’ =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
'''Streuungsmaße''' informieren über die Verteilung von Ausprägungen außerhalb des Zentrums. Sie liefern dadurch wertvolle Informationen über die (Un-)Ausgeglichenheit einer Verteilung.  
 
'''Streuungsmaße''' informieren über die Verteilung von Ausprägungen außerhalb des Zentrums. Sie liefern dadurch wertvolle Informationen über die (Un-)Ausgeglichenheit einer Verteilung.  
  
=== '''Grafische Darstellung der Streuung durch Histogramme''' ===
+
==== '''Grafische Darstellung der Streuung durch Histogramme''' ====
  
'''Histogramme[1]''' zeigen die relative "Gerechtigkeit" einer Verteilung in graphischer Form, wie z.B. das folgende über das Bruttonationalprodukt der Länder dieser Welt im Jahr 1991.
+
'''Histogramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''' zeigen die relative "Gerechtigkeit" einer Verteilung in graphischer Form, wie z.B. das folgende über das Bruttonationalprodukt der Länder dieser Welt im Jahr 1991.
  
 
[[File:quantitative-81_1.jpg|frame|center|Histogramm Bruttonationalprodukt 1991]]
 
[[File:quantitative-81_1.jpg|frame|center|Histogramm Bruttonationalprodukt 1991]]
  
Dieses '''Histogramm''' zeigt optisch deutlich, dass im Jahr 1991 das durchschnittliche Bruttonationalprodukt von 5860 $ für die meisten Länder unerreichbar fern lag und damit keinerlei Aussagekraft für ihre Realität hatte. Der '''Median[2]''' lag damals bei der Hälfte des '''Mittelwerts[3]''', nämlich bei 2995 $. Ein Viertel der Länder wies ein Bruttonationalprodukt auf, welches unter 996 $ lag, ein Fünftel unter 681 $, ein Zehntel der Länder dieser Welt sogar unter 323 Dollar.
+
Dieses '''Histogramm''' zeigt optisch deutlich, dass im Jahr 1991 das durchschnittliche Bruttonationalprodukt von 5860 $ für die meisten Länder unerreichbar fern lag und damit keinerlei Aussagekraft für ihre Realität hatte. Der '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2]]]''' lag damals bei der Hälfte des '''Mittelwerts[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[3]]]''', nämlich bei 2995 $. Ein Viertel der Länder wies ein Bruttonationalprodukt auf, welches unter 996 $ lag, ein Fünftel unter 681 $, ein Zehntel der Länder dieser Welt sogar unter 323 Dollar.
  
=== '''Lagemaße zeigen oft nur verzerrtes Bild der Realität bzw. Normalität''' ===
+
==== '''Lagemaße zeigen oft nur verzerrtes Bild der Realität bzw. Normalität''' ====
  
Man ersieht daraus, dass Kennzahlen wie das '''arithmetische Mittel[4]''' oft nur wenig geeignet sind, die Normalität darzustellen, d.h. dass der Wert des arithmetischen Mittel erheblich von der '''Realität''' der meisten Ausprägungen verschieden sein kann.
+
Man ersieht daraus, dass Kennzahlen wie das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4]]]''' oft nur wenig geeignet sind, die Normalität darzustellen, d.h. dass der Wert des arithmetischen Mittel erheblich von der '''Realität''' der meisten Ausprägungen verschieden sein kann.
  
Wir benötigen daher weitere Kennzahlen, sogenannte '''Streuungsmaße''', um Auskunft über die Randbereiche der Ausprägungen zu erhalten. Dazu zählen besonders die '''Standardabweichung''' und '''Perzentile''' bzw. '''Quartile[5]'''.
+
Wir benötigen daher weitere Kennzahlen, sogenannte '''Streuungsmaße''', um Auskunft über die Randbereiche der Ausprägungen zu erhalten. Dazu zählen besonders die '''Standardabweichung''' und '''Perzentile''' bzw. '''Quartile[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5]]]'''.
  
  
Line 1,951: Line 2,296:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5] Siehe Kapitel 3.4.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5] Siehe Kapitel 3.4.3.1]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
</div>
  
 
== 3.4.1 Varianz ==
 
== 3.4.1 Varianz ==
  
'''Die Varianz ist eine Kennzahl, welche die Streuung aller Daten berücksichtigt.''' Sie wird berechnet, indem man den Durchschnitt der quadrierten Abweichung vom '''Arithmetischen Mittel[1]''' berechnet.
+
'''Die Varianz ist eine Kennzahl, welche die Streuung aller Daten berücksichtigt.''' Sie wird berechnet, indem man den Durchschnitt der quadrierten Abweichung vom '''Arithmetischen Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' berechnet.
  
 
[[File:quantitative-82_1.jpg|frame|center|Formel zu Bereichnung der Varianz]]
 
[[File:quantitative-82_1.jpg|frame|center|Formel zu Bereichnung der Varianz]]
Line 1,964: Line 2,321:
 
Ein '''Arithmetisches Mittel''' von 100 kann sich auch ergeben, wenn die Hälfte der Werte bei 0 und die andere Hälfte bei 200 liegt. In diesem Falle hätten wir eine extrem große Varianz (jeweils eine Abweichung von 100 vom '''Arithmetischen Mittel''', diese wird quadriert, die Ergebnisse zusammengezählt und durch ''N'' dividiert. In diesem Falle erhielten wir eine Varianz von 10.000, Ausdruck der maximalen individuellen Abweichung der Meßwerte vom '''Arithmetischen Mittel'''''.''
 
Ein '''Arithmetisches Mittel''' von 100 kann sich auch ergeben, wenn die Hälfte der Werte bei 0 und die andere Hälfte bei 200 liegt. In diesem Falle hätten wir eine extrem große Varianz (jeweils eine Abweichung von 100 vom '''Arithmetischen Mittel''', diese wird quadriert, die Ergebnisse zusammengezählt und durch ''N'' dividiert. In diesem Falle erhielten wir eine Varianz von 10.000, Ausdruck der maximalen individuellen Abweichung der Meßwerte vom '''Arithmetischen Mittel'''''.''
  
In der Praxis verwendet man vor allem die Wurzel aus der Varianz, die sogenannte '''Standardabweichung[2]'''.
+
In der Praxis verwendet man vor allem die Wurzel aus der Varianz, die sogenannte '''Standardabweichung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|[2]]]'''.
  
  
Line 1,974: Line 2,331:
 
== 3.4.2 Standardabweichung ==
 
== 3.4.2 Standardabweichung ==
  
Die '''Standardabweichung''' '''''s''''' gibt in einer '''Normalverteilung[1]''' einen Bereich um den '''Mittelwert[2]''' an, innerhalb dessen sich 68,2 % aller Einträge befinden. Innerhalb des Bereichs Mittelwert +/-2s befinden sich in einer Normalverteilung 95,44 % aller Einträge. Berechnet wird die Standardabweichung als Wurzel aus folgender Formel:
+
Die '''Standardabweichung''' '''''s''''' gibt in einer '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1]]]''' einen Bereich um den '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' an, innerhalb dessen sich 68,2 % aller Einträge befinden. Innerhalb des Bereichs Mittelwert +/-2s befinden sich in einer Normalverteilung 95,44 % aller Einträge. Berechnet wird die Standardabweichung als Wurzel aus folgender Formel:
  
 
[[File:quantitative-83_1.jpg|frame|center|Formel zur Berechnung der Standardabweichung]]
 
[[File:quantitative-83_1.jpg|frame|center|Formel zur Berechnung der Standardabweichung]]
Line 1,982: Line 2,339:
 
[[File:quantitative-83_2.jpg|frame|center|Intelligenzquotient]]
 
[[File:quantitative-83_2.jpg|frame|center|Intelligenzquotient]]
  
=== '''Kenntnis der Standardabweichung = Kenntnis des Verlaufs der Verteilung''' ===
+
==== '''Kenntnis der Standardabweichung = Kenntnis des Verlaufs der Verteilung''' ====
  
Auch wenn man die grafische Darstellung der '''Häufigkeitsverteilung,''' wie z.B. mit einem '''Histogramm[3]''', nicht kennt, kann man sie aufgrund der Kenntnis des '''Mittelwerts''' und der Standardabweichung weitgehend vorhersagen. Hat man einen '''Mittelwert''' von 100 und eine Standardabweichung von 10, wird die Verteilungskurve deutlich steiler sein, als wenn die '''Standardabweichung''' bei 30 liegt.
+
Auch wenn man die grafische Darstellung der '''Häufigkeitsverteilung,''' wie z.B. mit einem '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3]]]''', nicht kennt, kann man sie aufgrund der Kenntnis des '''Mittelwerts''' und der Standardabweichung weitgehend vorhersagen. Hat man einen '''Mittelwert''' von 100 und eine Standardabweichung von 10, wird die Verteilungskurve deutlich steiler sein, als wenn die '''Standardabweichung''' bei 30 liegt.
  
=== '''Kenntnis der Standardverteilung = Abschätzung der Häufigkeit von Ausprägungen''' ===
+
==== '''Kenntnis der Standardverteilung = Abschätzung der Häufigkeit von Ausprägungen''' ====
  
 
Die Kenntnis der '''Standardverteilung''' erlaubt uns, die Häufigkeit von Ausprägungen sofort einschätzen zu können. Wenn z.B. wie oben bekannt ist, dass der durchschnittliche Intelligenzquotient bei 100, die Standardabweichung bei 15 liegt, dann kann man sofort abschätzen, wie ein bestimmter Intelligenzquotient einzustufen ist. Wenn eine Person X einen IQ von 130 aufweist, dann liegt dieser beim Mittelwert +2 Standardabweichungen. Daher kann man sofort abschätzen, dass der betreffende IQ höher ist als 98 % aller Einträge.
 
Die Kenntnis der '''Standardverteilung''' erlaubt uns, die Häufigkeit von Ausprägungen sofort einschätzen zu können. Wenn z.B. wie oben bekannt ist, dass der durchschnittliche Intelligenzquotient bei 100, die Standardabweichung bei 15 liegt, dann kann man sofort abschätzen, wie ein bestimmter Intelligenzquotient einzustufen ist. Wenn eine Person X einen IQ von 130 aufweist, dann liegt dieser beim Mittelwert +2 Standardabweichungen. Daher kann man sofort abschätzen, dass der betreffende IQ höher ist als 98 % aller Einträge.
Line 2,011: Line 2,368:
 
=== 3.4.3.1 Quartile  ===
 
=== 3.4.3.1 Quartile  ===
  
'''Quartile''' teilen die Verteilung in vier gleich große Viertel: 25 % der Werte sind kleiner oder gleich groß mit dem 1. Quartil, 50 % sind kleiner oder gleich groß wie das 2. Quartil (daher ist das 2. Quartil gleichzusetzen mit dem Median), 75 % sind kleiner oder gleich groß mit dem 3. Quartil. '''Quartile''' sollten erst ab einer '''Stichprobengröße[1]''' von zumindest 20 eingesetzt werden.
+
'''Quartile''' teilen die Verteilung in vier gleich große Viertel: 25 % der Werte sind kleiner oder gleich groß mit dem 1. Quartil, 50 % sind kleiner oder gleich groß wie das 2. Quartil (daher ist das 2. Quartil gleichzusetzen mit dem Median), 75 % sind kleiner oder gleich groß mit dem 3. Quartil. '''Quartile''' sollten erst ab einer '''Stichprobengröße[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''' von zumindest 20 eingesetzt werden.
  
  
Line 2,021: Line 2,378:
 
-----
 
-----
  
==== 3.4.3.1.1 Die Ermittlung von Quartilen  ====
+
=== 3.4.3.1.1 Die Ermittlung von Quartilen  ===
  
=== '''Die Ermittlung von Quartilen (gewichtet):''' ===
+
==== '''Die Ermittlung von Quartilen (gewichtet):''' ====
  
 
* man reiht die Werte nach ihrer Größe (unser Beispiel: Besitz von Büchern zur Ethnologie)
 
* man reiht die Werte nach ihrer Größe (unser Beispiel: Besitz von Büchern zur Ethnologie)
Line 2,051: Line 2,408:
 
[[File:quantitative-87_1.jpg|frame|center|Berechnung von Streuungsmaßen mit SPSS]]
 
[[File:quantitative-87_1.jpg|frame|center|Berechnung von Streuungsmaßen mit SPSS]]
  
Für die Berechnung von '''Quartilen[1]''' genügt das Setzen eines Häkchens in ''Quartile'', möchte man ''Dezile'' (also in 10%-Gruppen) berechnen, gibt man im Feld ''Trennwerte für'' die Zahl 10 ein (dadurch werden 100 % auf 10 gleiche Gruppen aufgeteilt, also besteht jede Gruppe aus 10 %). Gibt man einen Wert X im Feld neben ''Perzentile'' ein und klickt auf ''Hinzufügen'' (wie z.B. die Zahl 37), so wird ermittelt, unterhalb welchen Kennwerts X % der Einträge liegen (in diesem Fall 37 %). Man kann beliebig viele dieser '''Perzentile''' setzen.
+
Für die Berechnung von '''Quartilen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1]]]''' genügt das Setzen eines Häkchens in ''Quartile'', möchte man ''Dezile'' (also in 10%-Gruppen) berechnen, gibt man im Feld ''Trennwerte für'' die Zahl 10 ein (dadurch werden 100 % auf 10 gleiche Gruppen aufgeteilt, also besteht jede Gruppe aus 10 %). Gibt man einen Wert X im Feld neben ''Perzentile'' ein und klickt auf ''Hinzufügen'' (wie z.B. die Zahl 37), so wird ermittelt, unterhalb welchen Kennwerts X % der Einträge liegen (in diesem Fall 37 %). Man kann beliebig viele dieser '''Perzentile''' setzen.
  
 
[[File:quantitative-87_2.gif|frame|center|mit SPSS berechnete Streuungsmaße]]
 
[[File:quantitative-87_2.gif|frame|center|mit SPSS berechnete Streuungsmaße]]
Line 2,069: Line 2,426:
 
[[File:quantitative-88_1.jpg|frame|center|Beispiel Boxplots]]
 
[[File:quantitative-88_1.jpg|frame|center|Beispiel Boxplots]]
  
=== '''Informationen der Boxplots:''' ===
+
==== '''Informationen der Boxplots:''' ====
  
 
Boxplots enthalten eine Fülle von Hinweisen, wie im obigen Diagramm:
 
Boxplots enthalten eine Fülle von Hinweisen, wie im obigen Diagramm:
  
A. ein Kästchen, welches den Abstand zwischen dem 1. und dem 3. '''Quartil[1]''' markiert ('''Streuung''')
+
A. ein Kästchen, welches den Abstand zwischen dem 1. und dem 3. '''Quartil[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1]]]''' markiert ('''Streuung''')
  
 
B. eine langgezogene Linie, die von Extremwert zu Extremwert führt: '''Range''' ('''Streuung''');
 
B. eine langgezogene Linie, die von Extremwert zu Extremwert führt: '''Range''' ('''Streuung''');
  
C. Einen Querstrich im Kästchen, welcher das '''Arithmetische Mittel[2]''' markiert;
+
C. Einen Querstrich im Kästchen, welcher das '''Arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' markiert;
  
 
D. Mit * bezeichnete Einträge, welche mehr als 3 Kästchenlängen entfernt liegen ('''Ausreißer''').
 
D. Mit * bezeichnete Einträge, welche mehr als 3 Kästchenlängen entfernt liegen ('''Ausreißer''').
Line 2,085: Line 2,442:
 
F. Neben diesen '''Ausreißern''' steht auch jeweils die Nummer des Datensatzes, in welchem diese '''Ausreißer''' gefunden werden können.
 
F. Neben diesen '''Ausreißern''' steht auch jeweils die Nummer des Datensatzes, in welchem diese '''Ausreißer''' gefunden werden können.
  
=== '''Extreme Informationsdichte durch Boxplots:''' ===
+
==== '''Extreme Informationsdichte durch Boxplots:''' ====
  
 
Durch diese konzentrierten Informationen erlauben '''Boxplots''' eine sehr schnelle Abschätzung sowohl der '''Lage''' wie auch der '''Streuung.''' Im obigen Boxplot, welches auf der y-Achse die Zahl der in Österreich verbrachten Jahre, auf der x-Achse das Migrationsmotiv widerspiegelt, kann man auf den ersten Blick ersehen, dass das Gros der AsylwerberInnen erst in den letzten Jahren kam, hingegen das Motiv Schulbesuch ein länger zurückliegender Migrationsgrund war. Die große '''Streuung''' (ausgedrückt durch die Länge des Kästchens) bei der Arbeitsuche gibt einen Hinweis darauf, dass viele Menschen über längere Zeit hinweg aus diesem Grund zuwanderten, während der Asylgrund einen wesentlich kürzeren Zeitraum betraf.
 
Durch diese konzentrierten Informationen erlauben '''Boxplots''' eine sehr schnelle Abschätzung sowohl der '''Lage''' wie auch der '''Streuung.''' Im obigen Boxplot, welches auf der y-Achse die Zahl der in Österreich verbrachten Jahre, auf der x-Achse das Migrationsmotiv widerspiegelt, kann man auf den ersten Blick ersehen, dass das Gros der AsylwerberInnen erst in den letzten Jahren kam, hingegen das Motiv Schulbesuch ein länger zurückliegender Migrationsgrund war. Die große '''Streuung''' (ausgedrückt durch die Länge des Kästchens) bei der Arbeitsuche gibt einen Hinweis darauf, dass viele Menschen über längere Zeit hinweg aus diesem Grund zuwanderten, während der Asylgrund einen wesentlich kürzeren Zeitraum betraf.
Line 2,104: Line 2,461:
 
[[File:quantitative-89_1.jpg|frame|center|Erstellung von Boxplots mit SPSS]]
 
[[File:quantitative-89_1.jpg|frame|center|Erstellung von Boxplots mit SPSS]]
  
Sie finden links die Liste der '''Variablen'''. Übertragen Sie ins Feld ''Abhängige Variablen'' die Variable, deren Lage und Streuung Sie mittels eines Boxplots darstellen möchten. Beachten Sie bitte, dass es sich dabei zwingend um eine '''metrische Variable[1]''' handeln muss. Falls Sie die '''Lage[2]''' und '''Streuung[3]''' der gesamten Einträge dieser Variablen wiederspiegeln möchten, können Sie auf ''OK'' klicken. Das '''Boxplot''' erscheint in der Ausgabe nach einer Reihe statistischer Berechnungen.
+
Sie finden links die Liste der '''Variablen'''. Übertragen Sie ins Feld ''Abhängige Variablen'' die Variable, deren Lage und Streuung Sie mittels eines Boxplots darstellen möchten. Beachten Sie bitte, dass es sich dabei zwingend um eine '''metrische Variable[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1]]]''' handeln muss. Falls Sie die '''Lage[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2]]]''' und '''Streuung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3]]]''' der gesamten Einträge dieser Variablen wiederspiegeln möchten, können Sie auf ''OK'' klicken. Das '''Boxplot''' erscheint in der Ausgabe nach einer Reihe statistischer Berechnungen.
  
 
Möchten Sie den Einfluss einer anderen '''Variable''' auf die gewählte Variable untersuchen, dann fügen Sie diese Variable in das Feld ''Faktorenliste'' ein. Sie erhalten dann verschiedene Boxplots, die jeweils Subgruppen der '''abhängigen Variablen''' bezeichnen:
 
Möchten Sie den Einfluss einer anderen '''Variable''' auf die gewählte Variable untersuchen, dann fügen Sie diese Variable in das Feld ''Faktorenliste'' ein. Sie erhalten dann verschiedene Boxplots, die jeweils Subgruppen der '''abhängigen Variablen''' bezeichnen:
  
[[File:quantitative-89_2.jpg|frame|center|Beispiel für Boxplots]]
+
[[File:quantitative-88_1.jpg|frame|center|Beispiel für Boxplots]]
  
 
   
 
   
Line 2,117: Line 2,474:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1] Siehe Kapitel 3.1.1.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1] Siehe Kapitel 3.1.1.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
[3] Siehe Kapitel 3.4<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3] Siehe Kapitel 3.4]]<br />
 +
 
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|Nächstes Kapitel: 3.5 Der Zusammenhang zwischen Variablen]]'''
 +
----
 +
[[#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|&uarr; Nach oben]]
  
  
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|Vorheriges Kapitel: 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]'''
 
= 3.5 Der Zusammenhang zwischen Variablen =
 
= 3.5 Der Zusammenhang zwischen Variablen =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Zu den spannendsten Fragen gehört die Untersuchung von '''Zusammenhängen''' zwischen '''Variablen'''. Es ist naheliegend, sich die Frage zu stellen, ob es z.B. einen Zusammenhang zwischen Rassismus und Bildung bzw. Sozialisation, Einkommen, Erfahrungen gibt. Es ist denkbar, dass die Religion einer Person Auswirkungen auf ihre Kinderzahl hat; es ist denkbar, dass Menschen eher zu biologischen und meist auch teureren Lebensmittel greifen, wenn auch ihr Einkommen höher ist usw.
 
Zu den spannendsten Fragen gehört die Untersuchung von '''Zusammenhängen''' zwischen '''Variablen'''. Es ist naheliegend, sich die Frage zu stellen, ob es z.B. einen Zusammenhang zwischen Rassismus und Bildung bzw. Sozialisation, Einkommen, Erfahrungen gibt. Es ist denkbar, dass die Religion einer Person Auswirkungen auf ihre Kinderzahl hat; es ist denkbar, dass Menschen eher zu biologischen und meist auch teureren Lebensmittel greifen, wenn auch ihr Einkommen höher ist usw.
Line 2,126: Line 2,491:
 
Um derartige Zusammenhänge aufzudecken, verfügen wir über verschiedene Methoden, wie z.B. die '''Kreuztabellen-Analyse''' oder die '''Korrelation'''(en).
 
Um derartige Zusammenhänge aufzudecken, verfügen wir über verschiedene Methoden, wie z.B. die '''Kreuztabellen-Analyse''' oder die '''Korrelation'''(en).
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
</div>
  
 
== 3.5.1 Optische Erkennung von Zusammenhängen ==
 
== 3.5.1 Optische Erkennung von Zusammenhängen ==
  
=== '''Optische Darstellung von Zusammenhängen: das Streudiagramm''' ===
+
==== '''Optische Darstellung von Zusammenhängen: das Streudiagramm''' ====
  
 
Trägt man auf einer Matrix von links nach rechts die Ausprägungen für die Variable A ein und die Ausprägungen für die Variable B auf der Y- Achse, so erhält man eine Reihe von Schnittpunkten. Das sich aus den Schnittpunkten ergebende '''Diagramm''' wird auch '''Verteilungsgrafik''' (auch '''Streuungsdiagramm''', '''Streudiagramm''' oder '''Scatterplot''' genannt).
 
Trägt man auf einer Matrix von links nach rechts die Ausprägungen für die Variable A ein und die Ausprägungen für die Variable B auf der Y- Achse, so erhält man eine Reihe von Schnittpunkten. Das sich aus den Schnittpunkten ergebende '''Diagramm''' wird auch '''Verteilungsgrafik''' (auch '''Streuungsdiagramm''', '''Streudiagramm''' oder '''Scatterplot''' genannt).
  
=== '''Herstellung eines Streudiagramms''' ===
+
==== '''Herstellung eines Streudiagramms''' ====
  
 
'''Streudiagramme''' eignen sich zur grafischen Darstellung '''bivariater Daten''', also zur Darstellung von Wertepaaren in einem Koordinatensystem. An Lage und Dichte des Punkteschwarms lässt sich anschaulich ablesen, ob ein Zusammenhang zwischen den Variablen besteht. Sie werden folgendermaßen erstellt: Man trägt in einem Diagramm jeweils die Schnittpunkte der beiden Variablen ein, wobei der Wert der 1. Variablen auf der X- Achse, der Wert der 2. Variable auf der Y- Achse liegt. Im Beispiel unten trägt man auf der X- Achse den Alphabetisierungsgrad des Landes ein, auf der Y-Achse das Bruttonationalprodukt des gleichen Landes. Wo beide Einträge aufeinander treffen, wird eine Markierung (ein Punkt) eingefügt.
 
'''Streudiagramme''' eignen sich zur grafischen Darstellung '''bivariater Daten''', also zur Darstellung von Wertepaaren in einem Koordinatensystem. An Lage und Dichte des Punkteschwarms lässt sich anschaulich ablesen, ob ein Zusammenhang zwischen den Variablen besteht. Sie werden folgendermaßen erstellt: Man trägt in einem Diagramm jeweils die Schnittpunkte der beiden Variablen ein, wobei der Wert der 1. Variablen auf der X- Achse, der Wert der 2. Variable auf der Y- Achse liegt. Im Beispiel unten trägt man auf der X- Achse den Alphabetisierungsgrad des Landes ein, auf der Y-Achse das Bruttonationalprodukt des gleichen Landes. Wo beide Einträge aufeinander treffen, wird eine Markierung (ein Punkt) eingefügt.
Line 2,139: Line 2,531:
 
[[File:quantitative-91_1.gif|frame|center|Streudiagramm Zusammenhang zwischen weiblicher Bildung und Kindersterblichkeit]]
 
[[File:quantitative-91_1.gif|frame|center|Streudiagramm Zusammenhang zwischen weiblicher Bildung und Kindersterblichkeit]]
  
=== '''Zusammenhänge bereits visuell erkennbar''' ===
+
==== '''Zusammenhänge bereits visuell erkennbar''' ====
  
Hier erkennen wir bereits optisch einen gewissen Zusammenhang. Die meisten Schnittpunkte befinden sich links oben und gehen in einer Linie nach rechts unten. Man könnte durch die Schnittpunkte annäherungsweise eine '''Gerade[1]''' ziehen, die von rechts oben nach links unten geht. Man spricht hier von einem '''linearen Zusammenhang'''''.''
+
Hier erkennen wir bereits optisch einen gewissen Zusammenhang. Die meisten Schnittpunkte befinden sich links oben und gehen in einer Linie nach rechts unten. Man könnte durch die Schnittpunkte annäherungsweise eine '''Gerade[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1]]]''' ziehen, die von rechts oben nach links unten geht. Man spricht hier von einem '''linearen Zusammenhang'''''.''
  
 
Die Aussage der Grafik ist: je höher der Alphabetisierungsgrad der Frauen, desto niedriger die Kindersterblichkeit.
 
Die Aussage der Grafik ist: je höher der Alphabetisierungsgrad der Frauen, desto niedriger die Kindersterblichkeit.
Line 2,163: Line 2,555:
 
== 3.5.2 Kreuztabellen-Analyse ==
 
== 3.5.2 Kreuztabellen-Analyse ==
  
Unter '''Kreuztabellen''' (auch '''Kontingenztafeln''' genannt) versteht man die tabellarische Darstellung der '''Häufigkeiten[1]''', welche bei der Kombination der Ausprägungen von zwei oder mehr '''Variablen''' auftreten.
+
Unter '''Kreuztabellen''' (auch '''Kontingenztafeln''' genannt) versteht man die tabellarische Darstellung der '''Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''', welche bei der Kombination der Ausprägungen von zwei oder mehr '''Variablen''' auftreten.
  
 
Wenn z.B. zwei '''Variablen''' vorliegen, werden die Ausprägungen der Variablen A in Spalten von links nach rechts und die Ausprägungen der Variablen B in Zeilen von oben nach unten eingetragen. In jeder einzelnen Zelle wird sodann die spezifische Häufigkeit der jeweiligen Kombination Ausprägung der Variablen A mit Ausprägung der Variablen B vermerkt.
 
Wenn z.B. zwei '''Variablen''' vorliegen, werden die Ausprägungen der Variablen A in Spalten von links nach rechts und die Ausprägungen der Variablen B in Zeilen von oben nach unten eingetragen. In jeder einzelnen Zelle wird sodann die spezifische Häufigkeit der jeweiligen Kombination Ausprägung der Variablen A mit Ausprägung der Variablen B vermerkt.
Line 2,174: Line 2,566:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
Line 2,187: Line 2,579:
 
[[File:quantitative-93_1.gif|frame|center|Kreuztabelle Zusammenhang Muttersprache - Deutschkenntnisse]]
 
[[File:quantitative-93_1.gif|frame|center|Kreuztabelle Zusammenhang Muttersprache - Deutschkenntnisse]]
  
Man kann die Ergebnisse leichter interpretieren, wenn auch die '''relativen Häufigkeiten[1]''' ermittelt werden. Dazu klicken wir unter ''Zellen'' auf ''zeilenweise Prozentwerte'':
+
Man kann die Ergebnisse leichter interpretieren, wenn auch die '''relativen Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''' ermittelt werden. Dazu klicken wir unter ''Zellen'' auf ''zeilenweise Prozentwerte'':
  
 
[[File:quantitative-93_2.gif|frame|center|Kreuztabelle mit Zeilenprozentwerten zum Zusammenhang Muttersprache - Deutschkenntnisse]]
 
[[File:quantitative-93_2.gif|frame|center|Kreuztabelle mit Zeilenprozentwerten zum Zusammenhang Muttersprache - Deutschkenntnisse]]
Line 2,196: Line 2,588:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
  
  
 
-----
 
-----
  
==== 3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test  ====
+
=== 3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test  ===
  
Der '''Chi-Quadrat-Test''', angewandt auf '''Kreuztabellen''', ermittelt die '''Wahrscheinlichkeit[1]''', ob Zusammenhänge mehr als nur zufälliger Natur sind.
+
Der '''Chi-Quadrat-Test''', angewandt auf '''Kreuztabellen''', ermittelt die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1]]]''', ob Zusammenhänge mehr als nur zufälliger Natur sind.
  
 
Im vorigen Beispiel (Kreuztabelle) sahen wir, dass offensichtlich ein deutlich höherer Prozentsatz von frankophonen AfrikanerInnen besser Deutsch spricht als Anglophone. Wir wissen jedoch noch nicht, ob diese Unterschiede auch signifikant sind.
 
Im vorigen Beispiel (Kreuztabelle) sahen wir, dass offensichtlich ein deutlich höherer Prozentsatz von frankophonen AfrikanerInnen besser Deutsch spricht als Anglophone. Wir wissen jedoch noch nicht, ob diese Unterschiede auch signifikant sind.
  
=== '''Berechnung des Chi-Quadrat-Tests mit SPSS''' ===
+
==== '''Berechnung des Chi-Quadrat-Tests mit SPSS''' ====
  
 
Dazu wählen wir unter ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN den Punkt ''Statistik,'' setzen dort bei ''Chi-Quadrat'' ein Häkchen und erhalten als zusätzliche Ausgabe:
 
Dazu wählen wir unter ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN den Punkt ''Statistik,'' setzen dort bei ''Chi-Quadrat'' ein Häkchen und erhalten als zusätzliche Ausgabe:
Line 2,213: Line 2,605:
 
[[File:quantitative-94_1.gif|frame|center|Chi-Quadrat-Test]]
 
[[File:quantitative-94_1.gif|frame|center|Chi-Quadrat-Test]]
  
Für uns interessant ist hier der Wert für ''Asymptotische Signifikanz''. Dort wird 0,023 aufgeführt, also ein Wert kleiner als 0,05. Damit ist mit einer '''Wahrscheinlichkeit''' von mehr als 95 % anzunehmen (oder mit einer '''Irrtumswahrscheinlichkeit''' von weniger als 5 %), dass tatsächlich ein Zusammenhang zwischen Nationalsprache und Sprachkompetenz im Deutschen besteht. Bei einem Wert > 0,01 wäre die '''Wahrscheinlichkeit''' eines Zusammenhangs sogar größer als 99 %, also wäre das Ergebnis hoch '''signifikant[2]'''.
+
Für uns interessant ist hier der Wert für ''Asymptotische Signifikanz''. Dort wird 0,023 aufgeführt, also ein Wert kleiner als 0,05. Damit ist mit einer '''Wahrscheinlichkeit''' von mehr als 95 % anzunehmen (oder mit einer '''Irrtumswahrscheinlichkeit''' von weniger als 5 %), dass tatsächlich ein Zusammenhang zwischen Nationalsprache und Sprachkompetenz im Deutschen besteht. Bei einem Wert > 0,01 wäre die '''Wahrscheinlichkeit''' eines Zusammenhangs sogar größer als 99 %, also wäre das Ergebnis hoch '''signifikant[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]'''.
  
  
Line 2,226: Line 2,618:
 
=== 3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS  ===
 
=== 3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS  ===
  
Die Ergebnisse von '''Kreuztabellen''' können mit '''Gruppierten Balkendiagrammen[1]''' besonders anschaulich dargestellt werden.
+
Die Ergebnisse von '''Kreuztabellen''' können mit '''Gruppierten Balkendiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1]]]''' besonders anschaulich dargestellt werden.
  
 
Mit '''SPSS''' ist deren Erstellung sehr einfach.
 
Mit '''SPSS''' ist deren Erstellung sehr einfach.
Line 2,254: Line 2,646:
 
Korrelationskoeffizienten können '''Werte zwischen -1,00 und +1,00''' annehmen'''.''' Ein Wert von -1,0 bedeutet eine perfekte '''negative Korrelation''': Hohe Werte der Variablen A gehen ausnahmslos mit niedrigen Werten der Variablen B einher und umgekehrt. Ein Wert von (+)1,0 bezeichnet eine perfekte '''positive Korrelation''': hohe Werte von A entsprechen praktisch immer hohen Werten von B und umgekehrt.
 
Korrelationskoeffizienten können '''Werte zwischen -1,00 und +1,00''' annehmen'''.''' Ein Wert von -1,0 bedeutet eine perfekte '''negative Korrelation''': Hohe Werte der Variablen A gehen ausnahmslos mit niedrigen Werten der Variablen B einher und umgekehrt. Ein Wert von (+)1,0 bezeichnet eine perfekte '''positive Korrelation''': hohe Werte von A entsprechen praktisch immer hohen Werten von B und umgekehrt.
  
Je nach Art der '''Grundskalierung[1]''' muss man zu '''unterschiedlichen Korrelationskoeffizienten''' greifen:
+
Je nach Art der '''Grundskalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' muss man zu '''unterschiedlichen Korrelationskoeffizienten''' greifen:
  
 
[[File:quantitative-96_1.jpg|frame|center|Geeigneter Korrelationskoeffizient für unterschiedliche Skalenniveaus]]
 
[[File:quantitative-96_1.jpg|frame|center|Geeigneter Korrelationskoeffizient für unterschiedliche Skalenniveaus]]
  
=== '''Vorsicht bei vorschneller Herstellung von Zusammenhängen''' ===
+
==== '''Vorsicht bei vorschneller Herstellung von Zusammenhängen''' ====
  
Gefundene Korrelationen müssen dennoch nochmals kritisch hinterfragt werden. Es gibt z.B. '''Scheinkorrelationen[2]''', die nur deshalb auftreten, weil beide Variablen hoch mit einer dritten Variable korrelieren, und '''verdeckte Korrelationen[3]''', bei welchen sich Subgruppen der '''Stichprobe[4]''' gegenseitig neutralisieren, selbst aber eine hohe '''Korrelation''' bei den beiden Variablen aufweisen. Erst die '''Signifikanz[5]''' gibt einer '''Korrelation''' die nötige Aussagekraft.
+
Gefundene Korrelationen müssen dennoch nochmals kritisch hinterfragt werden. Es gibt z.B. '''Scheinkorrelationen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2]]]''', die nur deshalb auftreten, weil beide Variablen hoch mit einer dritten Variable korrelieren, und '''verdeckte Korrelationen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3]]]''', bei welchen sich Subgruppen der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4]]]''' gegenseitig neutralisieren, selbst aber eine hohe '''Korrelation''' bei den beiden Variablen aufweisen. Erst die '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]''' gibt einer '''Korrelation''' die nötige Aussagekraft.
  
  
Line 2,266: Line 2,658:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2] Siehe Kapitel 3.5.3.4.3]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2] Siehe Kapitel 3.5.3.4.3]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3] Siehe Kapitel 3.5.3.4.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3] Siehe Kapitel 3.5.3.4.2]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4] Siehe Kapitel 2.1.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4] Siehe Kapitel 2.1.1]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,280: Line 2,672:
 
Voraussetzungen zu seiner Anwendung:
 
Voraussetzungen zu seiner Anwendung:
  
• der Zusammenhang zwischen X und Y ist (annähernd) '''linear[1]''',
+
• der Zusammenhang zwischen X und Y ist (annähernd) '''linear[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1]]]''',
  
• beide Variablen sind '''normalverteilt[2]'''.
+
• beide Variablen sind '''normalverteilt[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2]]]'''.
  
 
Die Berechnung der '''Maßkorrelation''' ''r'' erfolgt durch folgende Formel:
 
Die Berechnung der '''Maßkorrelation''' ''r'' erfolgt durch folgende Formel:
Line 2,297: Line 2,689:
 
-----
 
-----
  
==== 3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS  ====
+
=== 3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS  ===
  
 
'''Beispiel:'''<br />
 
'''Beispiel:'''<br />
Wir möchten bei Fahrzeugen den Zusammenhang zwischen Gewicht und Beschleunigung feststellen. Wir kontrollieren mithilfe eines '''Histogramms[1]''', ob die beiden Variablen annähernd '''normalverteilt[2]''' sind:
+
Wir möchten bei Fahrzeugen den Zusammenhang zwischen Gewicht und Beschleunigung feststellen. Wir kontrollieren mithilfe eines '''Histogramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''', ob die beiden Variablen annähernd '''normalverteilt[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2]]]''' sind:
  
=== '''Kontrolle der ersten Bedingung (Normalverteilung)''' ===
+
==== '''Kontrolle der ersten Bedingung (Normalverteilung)''' ====
  
 
[[File:quantitative-98_1.jpg|frame|center|Kontrolle der ersten Bedingung (Normalverteilung)]]
 
[[File:quantitative-98_1.jpg|frame|center|Kontrolle der ersten Bedingung (Normalverteilung)]]
  
=== '''Kontrolle der 2. Bedingung (linearer Zusammenhang)''' ===
+
==== '''Kontrolle der 2. Bedingung (linearer Zusammenhang)''' ====
  
Dann erstellen wir ein '''Streudiagramm''', welches uns einen Einblick gibt, ob die beiden Variablen systematische Entsprechungen zeigen und versuchen, in diese '''eine Regressionsgerade zu legen[3]'''. Falls dies möglich ist, ist auch die zweite Bedingung zur Anwendung der Maßkorrelation erfüllt.
+
Dann erstellen wir ein '''Streudiagramm''', welches uns einen Einblick gibt, ob die beiden Variablen systematische Entsprechungen zeigen und versuchen, in diese '''eine Regressionsgerade zu legen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3]]]'''. Falls dies möglich ist, ist auch die zweite Bedingung zur Anwendung der Maßkorrelation erfüllt.
  
 
[[File:quantitative-98_2.jpg|frame|center|Kontrolle der zweiten Bedingung (Linearer Zusammenhang)]]
 
[[File:quantitative-98_2.jpg|frame|center|Kontrolle der zweiten Bedingung (Linearer Zusammenhang)]]
Line 2,314: Line 2,706:
 
Wir sehen einen merkbaren, wenn auch nicht extrem eindeutigen '''linearen Zusammenhang'''. Nun haben wir die Voraussetzungen geprüft, um diese Korrelationsberechnung anwenden zu können.
 
Wir sehen einen merkbaren, wenn auch nicht extrem eindeutigen '''linearen Zusammenhang'''. Nun haben wir die Voraussetzungen geprüft, um diese Korrelationsberechnung anwenden zu können.
  
=== '''Berechnung der Maßkorrelation mit SPSS:''' ===
+
==== '''Berechnung der Maßkorrelation mit SPSS:''' ====
  
 
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach Pearson. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Klicken Sie auf OK:  
 
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach Pearson. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Klicken Sie auf OK:  
Line 2,321: Line 2,713:
  
 
'''Ergebnis des Beispiels:'''<br />
 
'''Ergebnis des Beispiels:'''<br />
Es gibt einen nachweisbaren Zusammenhang zwischen der Beschleunigung von Fahrzeugen und ihrem Gewicht. Dieser Zusammenhang ist mit einer Irrtumswahrscheinlichkeit von 1 % '''signifikant[4]'''. Da es '''eine negative Korrelation''' ist, kann man sagen, dass mit steigendem Gewicht des Fahrzeugs seine Beschleunigung abnimmt, was nicht weiter überraschend ist.
+
Es gibt einen nachweisbaren Zusammenhang zwischen der Beschleunigung von Fahrzeugen und ihrem Gewicht. Dieser Zusammenhang ist mit einer Irrtumswahrscheinlichkeit von 1 % '''signifikant[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4]]]'''. Da es '''eine negative Korrelation''' ist, kann man sagen, dass mit steigendem Gewicht des Fahrzeugs seine Beschleunigung abnimmt, was nicht weiter überraschend ist.
  
  
Line 2,329: Line 2,721:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2] Siehe Kapitel 3.1.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2] Siehe Kapitel 3.1.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3] Siehe Kapitel 3.5.4.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3] Siehe Kapitel 3.5.4.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,340: Line 2,732:
 
Z.B. kann man Kameradschaftlichkeit oder Egoismus kaum sinnvoll in Zahlenwerten messen, aber dennoch Menschen ersuchen, Mitmenschen bezüglich dieser Eigenschaften rangzureihen.
 
Z.B. kann man Kameradschaftlichkeit oder Egoismus kaum sinnvoll in Zahlenwerten messen, aber dennoch Menschen ersuchen, Mitmenschen bezüglich dieser Eigenschaften rangzureihen.
  
=== '''Auch verwendet für Zusammenhänge zwischen metrischen und ordinalskalierten Daten''' ===
+
==== '''Auch verwendet für Zusammenhänge zwischen metrischen und ordinalskalierten Daten''' ====
  
Man setzt die '''Rangkorrelation''' häufig auch ein, wenn man den Zusammenhang von '''ordinalskalierten[1]''' und '''metrischen[2]''' Variablen berechnen möchte. Dabei wandelt man die Messwerte zuerst in Rangplätze um (nachdem man diese größenmäßig gereiht hat) um danach R berechnen zu können. Fallen mehrere umgewandelte Messwerte auf den gleichen Rangplatz, teilen sie sich diese Plätze (arithmetisches Mittel), also 6., 7., 8. und 9. Platz = 30 (6+7+8+9). 30 dividiert durch 4 (Anzahl der Rangplätze) =7,5. Jeder dieser 4 gleichen Messwerte erhält somit den Rangplatz 7,5.
+
Man setzt die '''Rangkorrelation''' häufig auch ein, wenn man den Zusammenhang von '''ordinalskalierten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1]]]''' und '''metrischen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[2]]]''' Variablen berechnen möchte. Dabei wandelt man die Messwerte zuerst in Rangplätze um (nachdem man diese größenmäßig gereiht hat) um danach R berechnen zu können. Fallen mehrere umgewandelte Messwerte auf den gleichen Rangplatz, teilen sie sich diese Plätze (arithmetisches Mittel), also 6., 7., 8. und 9. Platz = 30 (6+7+8+9). 30 dividiert durch 4 (Anzahl der Rangplätze) =7,5. Jeder dieser 4 gleichen Messwerte erhält somit den Rangplatz 7,5.
  
=== '''Berechnung der Rangkorrelation:''' ===
+
==== '''Berechnung der Rangkorrelation:''' ====
  
 
[[File:quantitative-99_1.jpg|frame|center|Formel zur Berechnung der Rangkorrelation R]]
 
[[File:quantitative-99_1.jpg|frame|center|Formel zur Berechnung der Rangkorrelation R]]
Line 2,365: Line 2,757:
 
-----
 
-----
  
==== 3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS  ====
+
=== 3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS  ===
  
Klicken Sie in der Menüleiste auf ANALYSIEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach '''Spearman'''. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[1]''' als die '''Ordinalskala[2]''' verfügen ('''Intervall-[3]''' oder '''Proportionalskala[4]'''), werden sie automatisch von '''SPSS''' in die entspechenden Rangplätze umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der Korrelation gemeinsam mit der Beurteilung ihrer '''Signifikanz[5]'''.
+
Klicken Sie in der Menüleiste auf ANALYSIEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach '''Spearman'''. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' als die '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''' verfügen ('''Intervall-[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3]]]''' oder '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4]]]'''), werden sie automatisch von '''SPSS''' in die entspechenden Rangplätze umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der Korrelation gemeinsam mit der Beurteilung ihrer '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]'''.
  
  
Line 2,376: Line 2,768:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,418: Line 2,810:
 
-----
 
-----
  
==== 3.5.3.3.1 Berechnung von TAU mit SPSS  ====
+
=== 3.5.3.3.1 Berechnung von TAU mit SPSS  ===
  
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich '''Kendall-Tau'''. Im Feld Variablen fügen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[1]''' als die '''Ordinalskala[2]''' verfügen ('''Intervall[3]''' - oder '''Proportionalskala[4]'''), werden sie automatisch umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der '''Korrelation''' gemeinsam mit der Beurteilung ihrer '''Signifikanz[5]'''.
+
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich '''Kendall-Tau'''. Im Feld Variablen fügen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' als die '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''' verfügen ('''Intervall[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3]]]''' - oder '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4]]]'''), werden sie automatisch umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der '''Korrelation''' gemeinsam mit der Beurteilung ihrer '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]'''.
  
  
Line 2,429: Line 2,821:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
  
  
Line 2,440: Line 2,832:
 
A. der Höhe der '''Korrelation'''
 
A. der Höhe der '''Korrelation'''
  
B. der Größe der '''Stichprobe[1]'''(n)
+
B. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]'''(n)
  
 
C. der Sorgfalt beim Ausschluss einer möglichen Scheinkorrelation bzw. des Erkennens verdeckter Korrelationen.
 
C. der Sorgfalt beim Ausschluss einer möglichen Scheinkorrelation bzw. des Erkennens verdeckter Korrelationen.
  
Die statistische Kennzahl der '''Signifikanz''' berücksichtigt sowohl die Höhe der '''Korrelation''' wie auch die Größe der Stichprobe und gibt Auskunft über die '''Wahrscheinlichkeit[2]''', dass die erhaltene '''Korrelation''' rein zufällig auftrat. Sie ist statistisch von äußerst großer Bedeutung.
+
Die statistische Kennzahl der '''Signifikanz''' berücksichtigt sowohl die Höhe der '''Korrelation''' wie auch die Größe der Stichprobe und gibt Auskunft über die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]''', dass die erhaltene '''Korrelation''' rein zufällig auftrat. Sie ist statistisch von äußerst großer Bedeutung.
  
  
Line 2,455: Line 2,847:
 
-----
 
-----
  
==== 3.5.3.4.1 Wann sind Korrelationen bemerkenswert?  ====
+
=== 3.5.3.4.1 Wann sind Korrelationen bemerkenswert?  ===
  
 
Die Größe einer Korrelation sagt alleine noch nichts über ihre Aussagekraft aus. Prinzipiell gilt, dass '''eine hohe Korrelation umso leichter zu erzielen ist, je kleiner die Stichprobe ausfällt.''' Bei einer Stichprobengröße von 1 liegt jede Korrelation beim Maximalwert r=1.
 
Die Größe einer Korrelation sagt alleine noch nichts über ihre Aussagekraft aus. Prinzipiell gilt, dass '''eine hohe Korrelation umso leichter zu erzielen ist, je kleiner die Stichprobe ausfällt.''' Bei einer Stichprobengröße von 1 liegt jede Korrelation beim Maximalwert r=1.
Line 2,468: Line 2,860:
 
-----
 
-----
  
==== 3.5.3.4.2 Verdeckte Korrelation  ====
+
=== 3.5.3.4.2 Verdeckte Korrelation  ===
  
 
Von einer '''verdeckten Korrelation''' spricht man, wenn '''statistisch keinerlei Korrelation''' errechnet wurde, obwohl '''sachlich eindeutig Zusammenhänge''' vorliegen.
 
Von einer '''verdeckten Korrelation''' spricht man, wenn '''statistisch keinerlei Korrelation''' errechnet wurde, obwohl '''sachlich eindeutig Zusammenhänge''' vorliegen.
Line 2,474: Line 2,866:
 
Dies ist z.B. möglich, wenn Subgruppen der untersuchten Population in hohem Maße Tendenzen aufweisen, welche durch andere Subgruppen neutralisiert werden, weil diese sich gegenläufig verhalten.
 
Dies ist z.B. möglich, wenn Subgruppen der untersuchten Population in hohem Maße Tendenzen aufweisen, welche durch andere Subgruppen neutralisiert werden, weil diese sich gegenläufig verhalten.
  
=== '''Fiktives Beispiel: Zusammenhang von Zigarettenkonsum und -werbung''' ===
+
==== '''Fiktives Beispiel: Zusammenhang von Zigarettenkonsum und -werbung''' ====
  
 
Wir untersuchen, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabak-Werbung auf das Rauchverhalten von Jugendlichen ausübt. Wir stellen fest, dass es keinen messbaren Zusammenhang zwischen dem Konsum der Werbung und dem Zigarettenkonsum gibt. Der Zigarettenkonsum hat sich durch die Wahrnehmung der Werbung nicht verändert.  
 
Wir untersuchen, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabak-Werbung auf das Rauchverhalten von Jugendlichen ausübt. Wir stellen fest, dass es keinen messbaren Zusammenhang zwischen dem Konsum der Werbung und dem Zigarettenkonsum gibt. Der Zigarettenkonsum hat sich durch die Wahrnehmung der Werbung nicht verändert.  
Line 2,488: Line 2,880:
 
[[File:quantitative-105_3.jpg|frame|center|Nach Geschlechern getrennte Histogramme zum Zigarettenkonsum]]
 
[[File:quantitative-105_3.jpg|frame|center|Nach Geschlechern getrennte Histogramme zum Zigarettenkonsum]]
  
Wir sehen, dass bei den Jungen eine '''perfekte negative Korrelation[1]''' vorliegt (r=-1), bei den Mädchen hingegen eine perfekte '''positive Korrelation''' (r=1). Die Jungen haben die Werbung eher als erschreckend für den Tabakkonsum aufgefasst, die Mädchen hingegen als ermutigend. Am Ende des Untersuchungszeitraums rauchten die Mädchen im gleichen Maße mehr als die Jungen weniger rauchten. Dadurch ergab sich eine '''Null-Korrelation''' auf der Ebene der gesamten '''Stichprobe[2]'''.
+
Wir sehen, dass bei den Jungen eine '''perfekte negative Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' vorliegt (r=-1), bei den Mädchen hingegen eine perfekte '''positive Korrelation''' (r=1). Die Jungen haben die Werbung eher als erschreckend für den Tabakkonsum aufgefasst, die Mädchen hingegen als ermutigend. Am Ende des Untersuchungszeitraums rauchten die Mädchen im gleichen Maße mehr als die Jungen weniger rauchten. Dadurch ergab sich eine '''Null-Korrelation''' auf der Ebene der gesamten '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]'''.
  
  
Line 2,499: Line 2,891:
 
-----
 
-----
  
==== 3.5.3.4.3 Scheinkorrelationen und Störvariable  ====
+
=== 3.5.3.4.3 Scheinkorrelationen und Störvariable  ===
  
 
Eine '''Scheinkorrelation''' ist ein '''statistisch gemessener Zusammenhang zwischen zwei Variablen''', welcher nur deshalb auftritt, weil beide Variablen '''systematisch von einer dritten Variablen beeinflusst''' werden.
 
Eine '''Scheinkorrelation''' ist ein '''statistisch gemessener Zusammenhang zwischen zwei Variablen''', welcher nur deshalb auftritt, weil beide Variablen '''systematisch von einer dritten Variablen beeinflusst''' werden.
  
=== '''Zusammenhang kann auf Störfaktoren zurückgehen''' ===
+
==== '''Zusammenhang kann auf Störfaktoren zurückgehen''' ====
  
 
Die '''Korrelation''' ist eine interessante Methode zur Berechnung von Zusammenhängen. Jedoch sollte man sich vergewissern, dass der gemessene Zusammenhang tatsächlich prioritär und somit kausal ist.
 
Die '''Korrelation''' ist eine interessante Methode zur Berechnung von Zusammenhängen. Jedoch sollte man sich vergewissern, dass der gemessene Zusammenhang tatsächlich prioritär und somit kausal ist.
Line 2,520: Line 2,912:
 
-----
 
-----
  
===== 3.5.3.4.3.1 Partielle Korrelation mit SPSS  =====
+
=== 3.5.3.4.3.1 Partielle Korrelation mit SPSS  ===
  
=== '''Beispiel: Korrelation von Fertiliät und weiblicher Lebenserwartung''' ===
+
==== '''Beispiel: Korrelation von Fertiliät und weiblicher Lebenserwartung''' ====
  
 
Wir untersuchen den Zusammenhang zwischen Fertilität und weiblicher Lebenserwartung (basierend auf den Daten in world95.sav der UNO). Eine Rangkorrelation zwischen beiden liefert folgendes Resultat:
 
Wir untersuchen den Zusammenhang zwischen Fertilität und weiblicher Lebenserwartung (basierend auf den Daten in world95.sav der UNO). Eine Rangkorrelation zwischen beiden liefert folgendes Resultat:
Line 2,528: Line 2,920:
 
[[File:quantitative-107_1.jpg|frame|center|Korrelation zwischen weiblicher Fertilität und Lebenserwartung]]
 
[[File:quantitative-107_1.jpg|frame|center|Korrelation zwischen weiblicher Fertilität und Lebenserwartung]]
  
=== '''Überlegung:''' ===
+
==== '''Überlegung:''' ====
  
 
Wir sehen einen hohen und signifikanten Zusammenhang zwischen beiden '''Variablen'''. Offensichtlich führt eine große Kinderzahl zu stark abnehmender weiblicher Lebenserwartung und umgekehrt. Doch warum sollte dies so sein? Wir kennen doch Personen in unserer Gesellschaft, welche viele Kinder haben und dennoch in voller Gesundheit sehr alt wurden, während wir auch viele kränkliche einzelstehende Personen kennen. Wir suchen daher nach Variablen, welche die beiden vorhandenen beeinflusst haben könnten und dadurch indirekt deren hohen Zusammenhang begründen. Eine derartige mögliche (Stör-)variable ist die weibliche Alphabetisierungsrate. Sie verbessert den Zugang zu Informationen über verbesserte Gesundheitsvorsorge. Damit erhöht sie die Lebenserwartung. Gleichzeitig bietet sie durch verbesserte Berufschancen in qualifizierteren Bereichen auch häufig bessere Einkommensschancen. Bleibt eine gut verdienende Frau wegen zahlreicher Kinder zuhause, stellt dies gleichzeitig für die Familie einen größeren finanziellen Verlust dar, wie wenn eine schlecht verdienende Frau zuhause bleiben würde. Daher entscheiden sich gebildete Frauen häufig gegen höhere Kinderzahlen. Auch wird die Geburt der ersten Kinder oft hinter den abgeschlossenen Bildungsweg zurückgeschoben, was ebenfalls die Fertilität verringert.
 
Wir sehen einen hohen und signifikanten Zusammenhang zwischen beiden '''Variablen'''. Offensichtlich führt eine große Kinderzahl zu stark abnehmender weiblicher Lebenserwartung und umgekehrt. Doch warum sollte dies so sein? Wir kennen doch Personen in unserer Gesellschaft, welche viele Kinder haben und dennoch in voller Gesundheit sehr alt wurden, während wir auch viele kränkliche einzelstehende Personen kennen. Wir suchen daher nach Variablen, welche die beiden vorhandenen beeinflusst haben könnten und dadurch indirekt deren hohen Zusammenhang begründen. Eine derartige mögliche (Stör-)variable ist die weibliche Alphabetisierungsrate. Sie verbessert den Zugang zu Informationen über verbesserte Gesundheitsvorsorge. Damit erhöht sie die Lebenserwartung. Gleichzeitig bietet sie durch verbesserte Berufschancen in qualifizierteren Bereichen auch häufig bessere Einkommensschancen. Bleibt eine gut verdienende Frau wegen zahlreicher Kinder zuhause, stellt dies gleichzeitig für die Familie einen größeren finanziellen Verlust dar, wie wenn eine schlecht verdienende Frau zuhause bleiben würde. Daher entscheiden sich gebildete Frauen häufig gegen höhere Kinderzahlen. Auch wird die Geburt der ersten Kinder oft hinter den abgeschlossenen Bildungsweg zurückgeschoben, was ebenfalls die Fertilität verringert.
Line 2,536: Line 2,928:
 
[[File:quantitative-107_2.jpg|frame|center|Korrelation zwischen weiblicher Fertilität, Lebenserwartung und Alphabetisierungsrate]]
 
[[File:quantitative-107_2.jpg|frame|center|Korrelation zwischen weiblicher Fertilität, Lebenserwartung und Alphabetisierungsrate]]
  
=== '''<br />
+
==== '''Herausrechnung der Störvariable mit SPSS:''' ====
Herausrechnung der Störvariable mit SPSS:''' ===
 
  
 
Um nun den Einfluss der ''Störvariable'' aus der Beziehung ''weibliche Lebenserwartung/Geburtenrate'' herauszurechnen, gehen wir in SPSS folgendermaßen vor:
 
Um nun den Einfluss der ''Störvariable'' aus der Beziehung ''weibliche Lebenserwartung/Geburtenrate'' herauszurechnen, gehen wir in SPSS folgendermaßen vor:
Line 2,554: Line 2,945:
 
-----
 
-----
  
==== 3.5.3.4.4 Signifikanz der Korrelation  ====
+
=== 3.5.3.4.4 Signifikanz der Korrelation  ===
  
Die '''Signifikanz''' ist eine Kennzahl, welche die Wahrscheinlichkeit eines systematischen Zusammenhangs zwischen den Variablen bezeichnet. Sie drückt aus, ob ein scheinbarer Zusammenhang rein zufälliger Natur sein könnte oder mit hoher '''Wahrscheinlichkeit[1]''' tatsächlich vorliegt. Man spricht bei der '''Signikanz''' von '''Irrtumswahrscheinlichkeiten''' oder '''Signifikanzniveaus'''. Gängige Formulierungen lauten etwa, dass zwischen den Variablen A und B eine Korrelation von r=0,5 auf dem '''Signifikanzniveau''' oder der '''Irrtumswahrscheinlichkeit''' von p ≤ 1 % besteht. Dies bedeutet, dass die zwischen den Variablen A und B gefundene Korrelation in dieser Höhe und bei dieser Stichprobengröße nur in weniger als 1 % aller Fälle rein zufällig auftritt.
+
Die '''Signifikanz''' ist eine Kennzahl, welche die Wahrscheinlichkeit eines systematischen Zusammenhangs zwischen den Variablen bezeichnet. Sie drückt aus, ob ein scheinbarer Zusammenhang rein zufälliger Natur sein könnte oder mit hoher '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' tatsächlich vorliegt. Man spricht bei der '''Signikanz''' von '''Irrtumswahrscheinlichkeiten''' oder '''Signifikanzniveaus'''. Gängige Formulierungen lauten etwa, dass zwischen den Variablen A und B eine Korrelation von r=0,5 auf dem '''Signifikanzniveau''' oder der '''Irrtumswahrscheinlichkeit''' von p ≤ 1 % besteht. Dies bedeutet, dass die zwischen den Variablen A und B gefundene Korrelation in dieser Höhe und bei dieser Stichprobengröße nur in weniger als 1 % aller Fälle rein zufällig auftritt.
  
Die Kennzahl ''p'' der '''Irrtumswahrscheinlichkeit''', auf deren komplexe Berechnung hier nicht eingegangen wird, berücksichtigt somit sowohl die '''Höhe der Korrelation''' wie auch die '''Größe der Stichprobe'''. Ist die '''Stichprobe[2]''' sehr klein, muss die Korrelation extrem groß ausfallen, um '''signifikant''' sein zu können. Hingegen kann auch eine Korrelation von r=0,2 bei sehr großen Stichproben '''signifikant''' werden.
+
Die Kennzahl ''p'' der '''Irrtumswahrscheinlichkeit''', auf deren komplexe Berechnung hier nicht eingegangen wird, berücksichtigt somit sowohl die '''Höhe der Korrelation''' wie auch die '''Größe der Stichprobe'''. Ist die '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' sehr klein, muss die Korrelation extrem groß ausfallen, um '''signifikant''' sein zu können. Hingegen kann auch eine Korrelation von r=0,2 bei sehr großen Stichproben '''signifikant''' werden.
  
=== '''Grenzwerte der Signifikanz bei n=20''' ===
+
==== '''Grenzwerte der Signifikanz bei n=20''' ====
  
 
Für eine Stichprobe der Größe n = 20 finden wir für einseitige Irrtumswahrscheinlichkeit (Signifikanz) folgende Grenzwerte:
 
Für eine Stichprobe der Größe n = 20 finden wir für einseitige Irrtumswahrscheinlichkeit (Signifikanz) folgende Grenzwerte:
Line 2,570: Line 2,961:
 
D.h. wenn man eine Korrelation von 0,6 bei einer Stichprobe von n=20 ermittelt, dann ist die Wahrscheinlichkeit geringer als 1 %, dass dieser Zusammenhang rein zufälliger Natur ist.
 
D.h. wenn man eine Korrelation von 0,6 bei einer Stichprobe von n=20 ermittelt, dann ist die Wahrscheinlichkeit geringer als 1 %, dass dieser Zusammenhang rein zufälliger Natur ist.
  
=== '''Bestimmtheitsmaß: Anteil der Korrelation an Veränderung''' ===
+
==== '''Bestimmtheitsmaß: Anteil der Korrelation an Veränderung''' ====
  
 
Wenn der Korrelationskoeffizient quadriert wird, erhält man das '''Bestimmtheitsmaß''' (R<sup>2</sup>), den Anteil der durch eine Variable erklärten Streuung an der Streuung der anderen. R/r=0,8 bedeutet nicht, dass 80 % der Stichprobe einander entsprechen. R<sup>2</sup> gibt Aufschluss darüber, dass 0,8*0,8=0,64 = 64 % der Variabilität der Werte beider Variablen durch den Zusammenhang bestimmt sind.
 
Wenn der Korrelationskoeffizient quadriert wird, erhält man das '''Bestimmtheitsmaß''' (R<sup>2</sup>), den Anteil der durch eine Variable erklärten Streuung an der Streuung der anderen. R/r=0,8 bedeutet nicht, dass 80 % der Stichprobe einander entsprechen. R<sup>2</sup> gibt Aufschluss darüber, dass 0,8*0,8=0,64 = 64 % der Variabilität der Werte beider Variablen durch den Zusammenhang bestimmt sind.
Line 2,583: Line 2,974:
 
-----
 
-----
  
===== 3.5.3.4.4.1 Signifikanz mit SPSS  =====
+
=== 3.5.3.4.4.1 Signifikanz mit SPSS  ===
  
=== '''Signifkanz von Korrelationen wird von SPSS automatisch ermittelt''' ===
+
==== '''Signifkanz von Korrelationen wird von SPSS automatisch ermittelt''' ====
  
 
Statistikprogramme wie '''SPSS''' ermitteln selbstständig bei der Berechnung der Korrelation die dazugehörige '''Irrtumswahrscheinlichkeit'''. Bei SPSS wird '''mit Sternen ausgedrückt''' (1, 2 oder 3 Sterne), ob die Korrelation '''signifikant''' ist, d.h. ob der Zusammenhang weitgehend gesichert scheint oder nicht.
 
Statistikprogramme wie '''SPSS''' ermitteln selbstständig bei der Berechnung der Korrelation die dazugehörige '''Irrtumswahrscheinlichkeit'''. Bei SPSS wird '''mit Sternen ausgedrückt''' (1, 2 oder 3 Sterne), ob die Korrelation '''signifikant''' ist, d.h. ob der Zusammenhang weitgehend gesichert scheint oder nicht.
  
Drei wesentliche Schwellen der '''Irrtumswahrscheinlichkeit[1]''' haben breite Akzeptanz gefunden:
+
Drei wesentliche Schwellen der '''Irrtumswahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' haben breite Akzeptanz gefunden:
  
 
* p <=  0,05 (die Wahrscheinlichkeit einer rein zufälligen Korrelation liegt bei unter 5 %, SPSS vergibt einen Stern = *);
 
* p <=  0,05 (die Wahrscheinlichkeit einer rein zufälligen Korrelation liegt bei unter 5 %, SPSS vergibt einen Stern = *);
Line 2,619: Line 3,010:
 
Die '''Kovarianz''' ist '''negativ''', wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte von X gehen einher mit niedrigen Werten von Y und umgekehrt.
 
Die '''Kovarianz''' ist '''negativ''', wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte von X gehen einher mit niedrigen Werten von Y und umgekehrt.
  
Da die Kovarianz in ihrer Rohform von der Größe der zugrundeliegenden Daten abhängt, ist die Einschätzung ihres Wertes ohne die Kenntnis der zugrundeliegenden Daten nicht einschätzbar. Dazu muss sie erst standardisiert werden, was zur '''Korrelation[1]''' führt.
+
Da die Kovarianz in ihrer Rohform von der Größe der zugrundeliegenden Daten abhängt, ist die Einschätzung ihres Wertes ohne die Kenntnis der zugrundeliegenden Daten nicht einschätzbar. Dazu muss sie erst standardisiert werden, was zur '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' führt.
  
  
Line 2,629: Line 3,020:
 
== 3.5.4 Regression ==
 
== 3.5.4 Regression ==
  
'''Die Regression(sanalyse) ist ein Verfahren zur Analyse von Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen.''' Während die '''Korrelation[1]''' die Stärke eines Zusammenhangs zeigt, erlaubt es die '''Regression''', von einer bekannten Größe einer Variable auf die vermutliche Größe der abhängigen Variablen zu schließen, falls ein systematischer Zusammenhang zwischen zwei Variablen A und B vorliegt.
+
'''Die Regression(sanalyse) ist ein Verfahren zur Analyse von Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen.''' Während die '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' die Stärke eines Zusammenhangs zeigt, erlaubt es die '''Regression''', von einer bekannten Größe einer Variable auf die vermutliche Größe der abhängigen Variablen zu schließen, falls ein systematischer Zusammenhang zwischen zwei Variablen A und B vorliegt.
  
 
Prinzipiell unterscheidet man zwischen '''linearer''' und '''nicht-linearer Regression'''.
 
Prinzipiell unterscheidet man zwischen '''linearer''' und '''nicht-linearer Regression'''.
Line 2,667: Line 3,058:
 
'''Erklärungen:'''
 
'''Erklärungen:'''
  
Was in der ersten Tabelle ''R'' genannt wird, ist die Quadratwurzel aus dem '''Bestimmtheitsmaß''' und deckt sich bei der einfachen Regressionsanalyse mit dem '''Korrelationskoeffizienten[1]''' von '''Pearson'''. Die Korrelation von 0,711 ist durchaus ansehnlich.
+
Was in der ersten Tabelle ''R'' genannt wird, ist die Quadratwurzel aus dem '''Bestimmtheitsmaß''' und deckt sich bei der einfachen Regressionsanalyse mit dem '''Korrelationskoeffizienten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1]]]''' von '''Pearson'''. Die Korrelation von 0,711 ist durchaus ansehnlich.
  
 
Unter ''Koeffizienten'' stehen die zwei wesentlichen Werte für die Berechnung der '''Regressionsgerade''': Die ''Konstante'' (hier 127,203) ist der Ausgangswert, der darunter stehende Wert -1,129 der Multiplikationsfaktor.
 
Unter ''Koeffizienten'' stehen die zwei wesentlichen Werte für die Berechnung der '''Regressionsgerade''': Die ''Konstante'' (hier 127,203) ist der Ausgangswert, der darunter stehende Wert -1,129 der Multiplikationsfaktor.
Line 2,699: Line 3,090:
 
[[File:quantitative-113_2.jpg|frame|center|Schaltfläche Diagramm-Eigenschaften in SPSS]]
 
[[File:quantitative-113_2.jpg|frame|center|Schaltfläche Diagramm-Eigenschaften in SPSS]]
  
Kontrollieren Sie nochmals, ob hier ''Linear'' angeklickt ist. Nur ''linear'' realisiert eine '''Regressionsgerade'''. Nach ''Zuweisen'' erhalten Sie nun das '''Streudiagramm[1]''' mit der entsprechenden Regressionsgerade:
+
Kontrollieren Sie nochmals, ob hier ''Linear'' angeklickt ist. Nur ''linear'' realisiert eine '''Regressionsgerade'''. Nach ''Zuweisen'' erhalten Sie nun das '''Streudiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[1]]]''' mit der entsprechenden Regressionsgerade:
  
 
[[File:quantitative-113_3.jpg|frame|center|Streudiagramm mit Regressionsgerade]]
 
[[File:quantitative-113_3.jpg|frame|center|Streudiagramm mit Regressionsgerade]]
Line 2,709: Line 3,100:
  
  
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|Nächstes Kapitel: 3.6 Die grafische Darstellung statistischer Ergebnisse]]'''
 +
----
 +
[[#3.5 Der Zusammenhang zwischen Variablen|&uarr; Nach oben]]
 +
 +
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|Vorheriges Kapitel: 3.5 Der Zusammenhang zwischen Variablen]]'''
 
= 3.6 Die grafische Darstellung statistischer Ergebnisse =
 
= 3.6 Die grafische Darstellung statistischer Ergebnisse =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== '''Ein Bild sagt mehr als 1000 Worte''' ===
+
==== '''Ein Bild sagt mehr als 1000 Worte''' ====
  
 
Dies trifft auch für die Statistik zu. Wer es versteht, mit einfachen, klaren und aussagekräftigen '''Diagrammen''' zu punkten, wird für eine leichten und einprägsamen Zugang zu seinen Analysen Anerkennung finden.
 
Dies trifft auch für die Statistik zu. Wer es versteht, mit einfachen, klaren und aussagekräftigen '''Diagrammen''' zu punkten, wird für eine leichten und einprägsamen Zugang zu seinen Analysen Anerkennung finden.
  
=== '''Vorteil von Diagrammen liegt in Einfachheit der Darstellung''' ===
+
==== '''Vorteil von Diagrammen liegt in Einfachheit der Darstellung''' ====
  
 
Allzuleicht lässt man sich von der Vielfalt an grafischen Darstellungsmöglichkeiten beeinflussen und meint, Diagramme noch ein wenig optisch ausgefaller, dreidimensional, vermeintlich attraktiver mit zahlreichen Schmankerln machen zu müssen, bis irgendwann einmal der Vorteil eines '''Diagramms''' gegenüber einer komplexen '''Tabelle''' verloren geht und die BetrachterInnen ratlos vor einem schwierig zu deutenden Kunstwerk sitzen. Niemand ist bereit, einige Minuten vor einem komplexen '''Diagramm''' zu sitzen, um zu versuchen, es zu verstehen. Mit Diagrammen gewinnt man die BetrachterIn in wenigen Sekunden oder man verliert sie/ihn. '''Die Notwendigkeit der inhaltlichen Klarheit und dadurch Schlichtheit eines Diagramms hat klare Priorität vor der künstlerischen Gestaltung.'''
 
Allzuleicht lässt man sich von der Vielfalt an grafischen Darstellungsmöglichkeiten beeinflussen und meint, Diagramme noch ein wenig optisch ausgefaller, dreidimensional, vermeintlich attraktiver mit zahlreichen Schmankerln machen zu müssen, bis irgendwann einmal der Vorteil eines '''Diagramms''' gegenüber einer komplexen '''Tabelle''' verloren geht und die BetrachterInnen ratlos vor einem schwierig zu deutenden Kunstwerk sitzen. Niemand ist bereit, einige Minuten vor einem komplexen '''Diagramm''' zu sitzen, um zu versuchen, es zu verstehen. Mit Diagrammen gewinnt man die BetrachterIn in wenigen Sekunden oder man verliert sie/ihn. '''Die Notwendigkeit der inhaltlichen Klarheit und dadurch Schlichtheit eines Diagramms hat klare Priorität vor der künstlerischen Gestaltung.'''
  
=== '''Nicht jedes Diagramm ist für jede Datenlage geeignet.''' ===
+
==== '''Nicht jedes Diagramm ist für jede Datenlage geeignet.''' ====
  
Man sollte bedenken, dass nicht jedes '''Diagramm''' für jede Art von Information geeignet ist. Manche '''Diagramme''', wie '''Kreisdiagramme[1]''', werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und würden bei der Wiedergabe von '''Mehrfachantworten[2]''' zu falschen Schlüssen führen.
+
Man sollte bedenken, dass nicht jedes '''Diagramm''' für jede Art von Information geeignet ist. Manche '''Diagramme''', wie '''Kreisdiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[1]]]''', werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und würden bei der Wiedergabe von '''Mehrfachantworten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2]]]''' zu falschen Schlüssen führen.
  
=== '''Begleitinformationen sind wichtig''' ===
+
==== '''Begleitinformationen sind wichtig''' ====
  
 
Auch '''Diagramme''' benötigen '''Begleitinformationen''', um sie voll verständlich zu machen und wissenschaftliche Seriösität nachzuweisen.
 
Auch '''Diagramme''' benötigen '''Begleitinformationen''', um sie voll verständlich zu machen und wissenschaftliche Seriösität nachzuweisen.
  
=== '''Was in Diagrammen, was im Text?''' ===
+
==== '''Was in Diagrammen, was im Text?''' ====
  
 
Zeigen Sie mit Diagrammen besondere Eigenheiten der Daten und packen Sie die Analysen und anderen notwendigen Begleitinformationen in den Text.
 
Zeigen Sie mit Diagrammen besondere Eigenheiten der Daten und packen Sie die Analysen und anderen notwendigen Begleitinformationen in den Text.
Line 2,737: Line 3,136:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2] Siehe Kapitel 3.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2] Siehe Kapitel 3.2.2]]<br />
  
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
</div>
  
 
== 3.6.1 Arten von Diagrammen ==
 
== 3.6.1 Arten von Diagrammen ==
Line 2,746: Line 3,159:
 
* '''Flächendiagramme'''
 
* '''Flächendiagramme'''
 
* '''Kreisdiagramme'''
 
* '''Kreisdiagramme'''
* '''Boxplots[1]'''
+
* '''Boxplots[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|[1]]]'''
 
* '''Streudiagramme'''
 
* '''Streudiagramme'''
 
* '''Histogramme'''
 
* '''Histogramme'''
 
* '''Kartogramme'''
 
* '''Kartogramme'''
  
=== '''Viele Programme ermöglichen die Erstellung von Diagrammen''' ===
+
==== '''Viele Programme ermöglichen die Erstellung von Diagrammen''' ====
  
 
Mit Ausnahme von '''Boxplots''' und '''Kartogrammen''' können alle Diagrammformen von den gängigen Programmen erstellt werden, wie sogar von '''WinWord''' (EINFÜGEN - GRAFIK - DIAGRAMM) oder '''Excel'''. In SPSS geht man in der Menüleiste zu ''GRAFIKEN'' und findet dort alle hier angeführten Diagrammformen und viele mehr zur Auswahl.
 
Mit Ausnahme von '''Boxplots''' und '''Kartogrammen''' können alle Diagrammformen von den gängigen Programmen erstellt werden, wie sogar von '''WinWord''' (EINFÜGEN - GRAFIK - DIAGRAMM) oder '''Excel'''. In SPSS geht man in der Menüleiste zu ''GRAFIKEN'' und findet dort alle hier angeführten Diagrammformen und viele mehr zur Auswahl.
Line 2,769: Line 3,182:
 
'''Kreisdiagramme''' (auch '''Tortendiagramme''') genannt, sind eine beliebte grafische Darstellungsform, um die '''Aufteilung eines Ganzen''' aufzuzeigen.
 
'''Kreisdiagramme''' (auch '''Tortendiagramme''') genannt, sind eine beliebte grafische Darstellungsform, um die '''Aufteilung eines Ganzen''' aufzuzeigen.
  
Für die grafische Darstellung '''kategorieller''' Daten ('''Nominal[1]'''- oder '''Ordinalskalen[2]''') verwendet man Diagrammformen, die eine möglichst klare Darstellung der relativen Anteile erlauben. Alle Anteile müssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick größenmäßig eingeordnet werden können, dürfen '''nicht zu viele Kategorien''' verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach Möglichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.
+
Für die grafische Darstellung '''kategorieller''' Daten ('''Nominal[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1]]]'''- oder '''Ordinalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''') verwendet man Diagrammformen, die eine möglichst klare Darstellung der relativen Anteile erlauben. Alle Anteile müssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick größenmäßig eingeordnet werden können, dürfen '''nicht zu viele Kategorien''' verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach Möglichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.
  
=== '''Besonders gut geeignet für die Darstellung relativer Anteile''' sind '''Torten'''- oder '''Kreisdiagramme''': ===
+
'''Besonders gut geeignet für die Darstellung relativer Anteile''' sind '''Torten'''- oder '''Kreisdiagramme''':
  
 
[[File:quantitative-116_1.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Nkorongoji (Mali)]]
 
[[File:quantitative-116_1.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Nkorongoji (Mali)]]
  
=== '''Optimal große Teile, aber nicht zu viele.''' ===
+
==== '''Optimal große Teile, aber nicht zu viele.''' ====
  
 
'''Für das menschliche Auge sind Winkel von mehr als 90 Grad besonders gut zu erkennen.''' Deshalb eignen sich Tortendiagramme besonders zur Darstellung von Mehrheiten oder von Anteilen von mindestens einem Viertel.
 
'''Für das menschliche Auge sind Winkel von mehr als 90 Grad besonders gut zu erkennen.''' Deshalb eignen sich Tortendiagramme besonders zur Darstellung von Mehrheiten oder von Anteilen von mindestens einem Viertel.
Line 2,783: Line 3,196:
 
[[File:quantitative-116_2.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Matmatar]]
 
[[File:quantitative-116_2.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Matmatar]]
  
Hier ist es nur mehr mit Mühe möglich, die Tortenstücke nach ihrer Größe zu reihen, da die Rundung die Abschätzung der relativen Größe erschwert. Daher wären für die Darstellung vieler Subeinheiten eines Ganzen '''Stapelbalkendiagramme[3]''' besser geeignet.
+
Hier ist es nur mehr mit Mühe möglich, die Tortenstücke nach ihrer Größe zu reihen, da die Rundung die Abschätzung der relativen Größe erschwert. Daher wären für die Darstellung vieler Subeinheiten eines Ganzen '''Stapelbalkendiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3]]]''' besser geeignet.
  
=== '''Keinesfalls für Mehrfachantworten''' ===
+
==== '''Keinesfalls für Mehrfachantworten''' ====
  
 
Gänzlich ungeeignet sind '''Kreisdiagramme''', um die Ergebnisse von Fragen mit '''Mehrfachantworten''' darzustellen:
 
Gänzlich ungeeignet sind '''Kreisdiagramme''', um die Ergebnisse von Fragen mit '''Mehrfachantworten''' darzustellen:
Line 2,805: Line 3,218:
 
=== 3.6.1.2 Liniendiagramme  ===
 
=== 3.6.1.2 Liniendiagramme  ===
  
'''Liniendiagramme''' eignen sich besonders für die '''Darstellung von Entwicklungen''', ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr '''Populationen[1]''' miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen Ländern die Akzeptanz der Aufnahme eines weiteren Landes in die Europäische Union veränderte.
+
'''Liniendiagramme''' eignen sich besonders für die '''Darstellung von Entwicklungen''', ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr '''Populationen[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen Ländern die Akzeptanz der Aufnahme eines weiteren Landes in die Europäische Union veränderte.
  
 
[[File:quantitative-117_1.jpg|frame|center|Liniendiagramm]]
 
[[File:quantitative-117_1.jpg|frame|center|Liniendiagramm]]
Line 2,829: Line 3,242:
 
Balkendiagramme können sowohl '''horizontal''' (wie das obige Beispiel) wie auch vertikal orientiert sein.
 
Balkendiagramme können sowohl '''horizontal''' (wie das obige Beispiel) wie auch vertikal orientiert sein.
  
=== '''Das gruppierte Balkendiagramm''' ===
+
==== '''Das gruppierte Balkendiagramm''' ====
  
 
Dieses ist besonders geeignet für die '''kontrastive Darstellung der Ausprägungen einer Variable''' (z.B. männlich-weiblich für Geschlecht, Hinduismus-Islam etc. für Religionen). So kann man z.B. vergleichend zeigen, wie Männer und Frauen in verschiedenen Bereichen abschneiden. Siehe ein Beispiel dazu bei der Berechnung mit SPSS.
 
Dieses ist besonders geeignet für die '''kontrastive Darstellung der Ausprägungen einer Variable''' (z.B. männlich-weiblich für Geschlecht, Hinduismus-Islam etc. für Religionen). So kann man z.B. vergleichend zeigen, wie Männer und Frauen in verschiedenen Bereichen abschneiden. Siehe ein Beispiel dazu bei der Berechnung mit SPSS.
  
=== '''Stapelbalkendiagramme: Anteile vom Ganzen''' ===
+
==== '''Stapelbalkendiagramme: Anteile vom Ganzen''' ====
  
 
'''Stapelbalkendiagramme''' werden - neben '''Kreisdiagrammen''' - oft verwendet, um Anteile am Ganzen darzustellen. Zur Darstellung von relativen Mehrheiten sind sie etwas weniger übersichtlich als '''Kreisdiagramme'''.
 
'''Stapelbalkendiagramme''' werden - neben '''Kreisdiagrammen''' - oft verwendet, um Anteile am Ganzen darzustellen. Zur Darstellung von relativen Mehrheiten sind sie etwas weniger übersichtlich als '''Kreisdiagramme'''.
Line 2,843: Line 3,256:
 
[[File:quantitative-118_3.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Matmatar]]
 
[[File:quantitative-118_3.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Matmatar]]
  
=== '''Vergleich der Aufteilung: Stapelbalkendiagramme''' ===
+
==== '''Vergleich der Aufteilung: Stapelbalkendiagramme''' ====
  
'''Gestapelte Balkendiagramme''' sind besonders wertvoll beim Vergleich der Aufteilung der gleichen '''Variable''' in verschiedenen '''Stichproben/Populationen[1]'''.
+
'''Gestapelte Balkendiagramme''' sind besonders wertvoll beim Vergleich der Aufteilung der gleichen '''Variable''' in verschiedenen '''Stichproben/Populationen[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]'''.
  
[[File:quantitative-118_4.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Dörfern Malis]]
+
[[File:quantitative-118_4.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Matmatar]]
  
  
Line 2,857: Line 3,270:
 
-----
 
-----
  
==== 3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS  ====
+
=== 3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS  ===
  
 
Im folgenden '''Diagramm''' interessiert uns, inwieweit sich die männliche und die weibliche Lebenserwartung in den Ländern dieser Welt nach deren religiöser Ausrichtung unterscheiden. Wir greifen dabei auf Daten in world95.sav bei der Berechnung mit SPSS zurück. Der Vorgang mit SPSS erfolgt folgendermaßen:
 
Im folgenden '''Diagramm''' interessiert uns, inwieweit sich die männliche und die weibliche Lebenserwartung in den Ländern dieser Welt nach deren religiöser Ausrichtung unterscheiden. Wir greifen dabei auf Daten in world95.sav bei der Berechnung mit SPSS zurück. Der Vorgang mit SPSS erfolgt folgendermaßen:
Line 2,871: Line 3,284:
 
D. Im Feld ''Kategorienachse'' fügen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.
 
D. Im Feld ''Kategorienachse'' fügen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.
  
E. Bei Klick auf ''Auswertungsfunktion'' können wir uns für bestimmte Kennzahlen entscheiden, wie den '''Median[1]''', das '''arithmetische Mittel[2]''', die '''Häufigkeit[3]''', '''Summe''', welche für die numerischen Variablen berechnet werden..
+
E. Bei Klick auf ''Auswertungsfunktion'' können wir uns für bestimmte Kennzahlen entscheiden, wie den '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''', das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''', die '''Häufigkeit[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3]]]''', '''Summe''', welche für die numerischen Variablen berechnet werden..
  
 
Nach Klick auf OK erhalten wir das folgende '''Diagramm''':
 
Nach Klick auf OK erhalten wir das folgende '''Diagramm''':
Line 2,895: Line 3,308:
 
[[File:quantitative-120_1.gif|frame|center|Kartogramm Bevölkerungsdichte 1991]]
 
[[File:quantitative-120_1.gif|frame|center|Kartogramm Bevölkerungsdichte 1991]]
  
=== '''Kartogramme in Wahlanalysen häufig''' ===
+
==== '''Kartogramme in Wahlanalysen häufig''' ====
  
 
Mittels '''Kartogrammen''' können v.a. regional unterschiedliche Ausprägungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpräferenzen in den verschiedenen Bundesländern und Regionen aufzuzeigen.
 
Mittels '''Kartogrammen''' können v.a. regional unterschiedliche Ausprägungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpräferenzen in den verschiedenen Bundesländern und Regionen aufzuzeigen.
Line 2,904: Line 3,317:
 
=== 3.6.1.5 Histogramme  ===
 
=== 3.6.1.5 Histogramme  ===
  
Unter einem '''Histogramm''' versteht man die grafische Darstellung der '''Häufigkeitsverteilung[1]''' von Messwerten.
+
Unter einem '''Histogramm''' versteht man die grafische Darstellung der '''Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''' von Messwerten.
  
 
Die Daten sind dabei größenmäßig auf der X-Achse geordnet, während auf der Y- Achse ihre Häufigkeiten stehen. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist.
 
Die Daten sind dabei größenmäßig auf der X-Achse geordnet, während auf der Y- Achse ihre Häufigkeiten stehen. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist.
Line 2,910: Line 3,323:
 
[[File:quantitative-121_1.jpg|frame|center|Histogramm Kindersterblichkeit]]
 
[[File:quantitative-121_1.jpg|frame|center|Histogramm Kindersterblichkeit]]
  
'''Histogramme''' werden '''besonders zur Darstellung von Verteilungen''' verwendet, wie auch zur Demonstration der '''Normalverteilung[2]'''.
+
'''Histogramme''' werden '''besonders zur Darstellung von Verteilungen''' verwendet, wie auch zur Demonstration der '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2]]]'''.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
  
  
Line 2,929: Line 3,342:
 
[[File:quantitative-122_1.jpg|frame|center|Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate]]
 
[[File:quantitative-122_1.jpg|frame|center|Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate]]
  
Basierend auf UN-Daten über die Entwicklung der Länder dieser Welt (siehe world95.sav) zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zurückgeht. '''Streudiagramme''' eignen sich vorzüglich zum '''Aufzeigen des Zusammenhangs zwischen Variablen[1]''' und somit auch zur '''Darstellung der Regression und der Korrelation[2]'''.
+
Basierend auf UN-Daten über die Entwicklung der Länder dieser Welt (siehe world95.sav) zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zurückgeht. '''Streudiagramme''' eignen sich vorzüglich zum '''Aufzeigen des Zusammenhangs zwischen Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[1]]]''' und somit auch zur '''Darstellung der Regression und der Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[2]]]'''.
  
  
Line 2,947: Line 3,360:
 
== 3.6.3 Notwendige Begleitinformationen von Diagrammen ==
 
== 3.6.3 Notwendige Begleitinformationen von Diagrammen ==
  
=== '''Diagramme brauchen Begleitinformationen''' ===
+
==== '''Diagramme brauchen Begleitinformationen''' ====
  
 
Diagramme sollten genauso wie die tabellarische Darstellung statistischer Daten alle notwendigen Begleitinformationen aufweisen, die zum Verständnis des Diagramms sowie zum Nachweis der Seriösität der Arbeit wichtig sind. Dazu zählen:
 
Diagramme sollten genauso wie die tabellarische Darstellung statistischer Daten alle notwendigen Begleitinformationen aufweisen, die zum Verständnis des Diagramms sowie zum Nachweis der Seriösität der Arbeit wichtig sind. Dazu zählen:
Line 2,969: Line 3,382:
 
I. '''Bei Mehrfachantworten unbedingt Hinweis darauf'''
 
I. '''Bei Mehrfachantworten unbedingt Hinweis darauf'''
  
Das folgende Diagramm (Quelle: '''http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[1]''') berücksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden müssen, bleibt der Erkenntnisgrad hoch.
+
Das folgende Diagramm (Quelle: '''http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf &#91;1&#93;]''') berücksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden müssen, bleibt der Erkenntnisgrad hoch.
  
 
[[File:quantitative-124_1.jpg|frame|center|Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbstätigen an der Gesamtheit der erwerbstätigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.]]
 
[[File:quantitative-124_1.jpg|frame|center|Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbstätigen an der Gesamtheit der erwerbstätigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.]]
Line 2,982: Line 3,395:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf<br />
+
[http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf &#91;1&#93; http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf]<br />
  
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#3.6 Die grafische Darstellung statistischer Ergebnisse|&uarr; Nach oben]]
 +
 +
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 4. Software für quantitative Forschungsprojekte =
 
= 4. Software für quantitative Forschungsprojekte =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
=== '''Für zuhause Excel, an der Universität SPSS''' ===
+
==== '''Für zuhause Excel, an der Universität SPSS''' ====
  
 
Nur wenige Menschen verfügen auf dem eigenen PC über spezifische Statistiksoftware. Viele Berechnungen und grafische Darstellungen lassen sich jedoch auch mit gängigen Software-Programmen erstellen.
 
Nur wenige Menschen verfügen auf dem eigenen PC über spezifische Statistiksoftware. Viele Berechnungen und grafische Darstellungen lassen sich jedoch auch mit gängigen Software-Programmen erstellen.
  
Besonders die Tabellenkalkulation '''Microsoft Excel''' (aber praktisch auch jede andere Tabellenkalkulation vergleichbarer Qualität) verfügt über eine Fülle statistischer Funktionen, mit welchen auch recht ausgefeilte statistische Analysen erledigt werden können und auch über zahlreiche Möglichkeiten, die Ergebnisse mit anschaulichen '''Diagrammen[1]''' darzustellen.
+
Besonders die Tabellenkalkulation '''Microsoft Excel''' (aber praktisch auch jede andere Tabellenkalkulation vergleichbarer Qualität) verfügt über eine Fülle statistischer Funktionen, mit welchen auch recht ausgefeilte statistische Analysen erledigt werden können und auch über zahlreiche Möglichkeiten, die Ergebnisse mit anschaulichen '''Diagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1]]]''' darzustellen.
  
 
Wer jedoch sehr viel mit Statistiken zu tun hat und leichten Zugang zu Software wie '''SPSS''' hat, welches auch auf den PCs im PC-Raum des Instituts für Kultur- und Sozialanthropologie zu finden ist, wird den leichten Wechsel zu diesem Programm nicht bereuen (zu finden unter Start - Programme - SPSS für Windwows). Daten von Standard-Programmen wie '''Excel''' können leicht übernommen werden, statistische Berechnungen können sehr komfortabel in jeder beliebigen Tiefe getätigt werden. Wer ein wenig eingearbeitet ist, kann mit Programmen wie '''SPSS''' viele Analysen um ein Vielfaches schneller als mit '''Excel''' abschließen.
 
Wer jedoch sehr viel mit Statistiken zu tun hat und leichten Zugang zu Software wie '''SPSS''' hat, welches auch auf den PCs im PC-Raum des Instituts für Kultur- und Sozialanthropologie zu finden ist, wird den leichten Wechsel zu diesem Programm nicht bereuen (zu finden unter Start - Programme - SPSS für Windwows). Daten von Standard-Programmen wie '''Excel''' können leicht übernommen werden, statistische Berechnungen können sehr komfortabel in jeder beliebigen Tiefe getätigt werden. Wer ein wenig eingearbeitet ist, kann mit Programmen wie '''SPSS''' viele Analysen um ein Vielfaches schneller als mit '''Excel''' abschließen.
Line 2,999: Line 3,419:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 +
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1 Was kann Excel?|4.1 Was kann Excel?]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1.1 Statistische Analysen mit Excel|4.1.1 Statistische Analysen mit Excel]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1.2 Grafische Aufbereitung von Daten mit Excel|4.1.2 Grafische Aufbereitung von Daten mit Excel]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.2 Was kann MS Access?|4.2 Was kann MS Access?]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.3 Profi-Programme: SPSS und Statistica|4.3 Profi-Programme: SPSS und Statistica]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS|4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.5 Umcodierung|4.5 Umcodierung]]<br />
 +
</div>
  
  
 
= 4.1 Was kann Excel? =
 
= 4.1 Was kann Excel? =
  
=== '''Excel gut geeignet für einfache Berechnungen und schöne Diagramme''' ===
+
==== '''Excel gut geeignet für einfache Berechnungen und schöne Diagramme''' ====
  
 
Excel ist als Teil des Programms '''Microsoft Office''' fast auf jedem PC vorhanden. Bereits mit Excel kann man, wenn auch nicht so komfortabel wie mit '''SPSS''', viele statistische Verfahren durchrechnen und auch grafisch darstellen.
 
Excel ist als Teil des Programms '''Microsoft Office''' fast auf jedem PC vorhanden. Bereits mit Excel kann man, wenn auch nicht so komfortabel wie mit '''SPSS''', viele statistische Verfahren durchrechnen und auch grafisch darstellen.
  
=== '''Übernahme von Excel in SPSS problemlos möglich''' ===
+
==== '''Übernahme von Excel in SPSS problemlos möglich''' ====
  
 
Da Excel auf fast jedem PC vorhanden ist, eignet es sich sehr gut dazu, Daten zu sammeln und erste Voranalysen mit einfachen statistischen Methoden zu machen. Da sowohl Excel wie auch SPSS ein Datenblatt (Tabelle) zur Verwaltung der Daten verwenden, ist die Übernahme von Daten aus Excel ins SPSS ausgesprochen einfach.
 
Da Excel auf fast jedem PC vorhanden ist, eignet es sich sehr gut dazu, Daten zu sammeln und erste Voranalysen mit einfachen statistischen Methoden zu machen. Da sowohl Excel wie auch SPSS ein Datenblatt (Tabelle) zur Verwaltung der Daten verwenden, ist die Übernahme von Daten aus Excel ins SPSS ausgesprochen einfach.
 +
  
  
Line 3,051: Line 3,484:
 
== 4.1.2 Grafische Aufbereitung von Daten mit Excel ==
 
== 4.1.2 Grafische Aufbereitung von Daten mit Excel ==
  
=== '''Viele statistische Funktionen''' ===
+
==== '''Viele statistische Funktionen''' ====
  
 
Excel hat eine sehr leistungsfähige und einfache Funktion für die Herstellung ansehnlicher statistischer Grafiken.
 
Excel hat eine sehr leistungsfähige und einfache Funktion für die Herstellung ansehnlicher statistischer Grafiken.
Line 3,066: Line 3,499:
 
* Netz usw.
 
* Netz usw.
  
=== '''Die Erstellung von Diagrammen mit Excel:''' ===
+
==== '''Die Erstellung von Diagrammen mit Excel:''' ====
  
 
Sie ist extrem einfach:
 
Sie ist extrem einfach:
Line 3,075: Line 3,508:
  
 
C. Ihre Zahlenreihen wurden damit schon automatisch übernommen und Sie können jetzt das Diagramm feinjustieren (Titel, Diagrammart, Größe, Farben etc.)
 
C. Ihre Zahlenreihen wurden damit schon automatisch übernommen und Sie können jetzt das Diagramm feinjustieren (Titel, Diagrammart, Größe, Farben etc.)
 +
  
  
 
= 4.2 Was kann MS Access? =
 
= 4.2 Was kann MS Access? =
  
=== '''Gut zum Sammeln von Daten, wenige Analysemöglichkeiten''' ===
+
==== '''Gut zum Sammeln von Daten, wenige Analysemöglichkeiten''' ====
  
 
Microsoft Access kann, da seine Daten ebenfalls in Form einer Tabelle verwaltet werden, sehr gut zum Sammeln der Daten verwendet werden. Seine Analysemöglichkeiten sind jedoch, abgesehen von einer sehr guten Kreuztabellenfunktion (zu finden unter Abfragen) eher beschränkt.
 
Microsoft Access kann, da seine Daten ebenfalls in Form einer Tabelle verwaltet werden, sehr gut zum Sammeln der Daten verwendet werden. Seine Analysemöglichkeiten sind jedoch, abgesehen von einer sehr guten Kreuztabellenfunktion (zu finden unter Abfragen) eher beschränkt.
 +
  
  
 
= 4.3 Profi-Programme: SPSS und Statistica =
 
= 4.3 Profi-Programme: SPSS und Statistica =
  
=== '''Komfort, Schnelligkeit und großer Funktionsumfang: die Profiprogramme''' ===
+
==== '''Komfort, Schnelligkeit und großer Funktionsumfang: die Profiprogramme''' ====
  
 
Profiprogramme wie '''SPSS''' oder '''Statistica''' weisen eine enorme Vielfalt statistischer Funktionen auf, deutlich mehr als '''Excel''' oder '''MS Access'''. Da '''SPSS''' auf allen PCs an der KSA installiert ist, wird in diesem Online-Kurs die Umsetzung statistischer Analysen und Darstellungen mit '''SPSS''' in vielen Bereichen angeboten. '''Statistica''' ist ebenfall eine exzellente Software, deren Bedienung auf der vorliegenden Homepage jedoch nicht demonstriert werden kann.
 
Profiprogramme wie '''SPSS''' oder '''Statistica''' weisen eine enorme Vielfalt statistischer Funktionen auf, deutlich mehr als '''Excel''' oder '''MS Access'''. Da '''SPSS''' auf allen PCs an der KSA installiert ist, wird in diesem Online-Kurs die Umsetzung statistischer Analysen und Darstellungen mit '''SPSS''' in vielen Bereichen angeboten. '''Statistica''' ist ebenfall eine exzellente Software, deren Bedienung auf der vorliegenden Homepage jedoch nicht demonstriert werden kann.
 +
  
  
 
= 4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS =
 
= 4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS =
  
=== '''Leichter Datentransfer zwischen Excel bzw. Access und SPSS''' ===
+
==== '''Leichter Datentransfer zwischen Excel bzw. Access und SPSS''' ====
  
 
Der Datentransfer zwischen diesen Programmen ist ausgesprochen einfach:
 
Der Datentransfer zwischen diesen Programmen ist ausgesprochen einfach:
Line 3,110: Line 3,546:
  
 
G. Speichern Sie nun die Datei unter einem beliebigen Namen in SPSS (die Endung *.SAV wird automatisch angenommen).
 
G. Speichern Sie nun die Datei unter einem beliebigen Namen in SPSS (die Endung *.SAV wird automatisch angenommen).
 +
  
  
 
= 4.5 Umcodierung =
 
= 4.5 Umcodierung =
  
=== '''Einfache Transformation von Daten mit SPSS''' ===
+
==== '''Einfache Transformation von Daten mit SPSS''' ====
  
'''SPSS''' benötigt zur internen Berechnung mitunter andere Datenarten (v.a. numerische), als sie von anderen Programmen, auch WinWord überliefert werden. SPSS bietet sehr komfortable Möglichkeiten der automatischen '''Umwandlung[1]''' von Daten, sowie auch ihrer automatischen '''Rückwandlung[2]''' für die Bildschirm- und Druckausgabe.
+
'''SPSS''' benötigt zur internen Berechnung mitunter andere Datenarten (v.a. numerische), als sie von anderen Programmen, auch WinWord überliefert werden. SPSS bietet sehr komfortable Möglichkeiten der automatischen '''Umwandlung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[1]]]''' von Daten, sowie auch ihrer automatischen '''Rückwandlung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2]]]''' für die Bildschirm- und Druckausgabe.
  
  
Line 3,124: Line 3,561:
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2] Siehe Kapitel 2.2.3.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2] Siehe Kapitel 2.2.3.3]]<br />
  
 
+
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#4. Software für quantitative Forschungsprojekte|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 5. Lexikon statistischer Grundbegriffe =
 
= 5. Lexikon statistischer Grundbegriffe =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
Hier finden Sie die wichtigsten statistischen Grundbegriffe alphabetisch geordnet.
 
Hier finden Sie die wichtigsten statistischen Grundbegriffe alphabetisch geordnet.
 +
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.1 A-C|5.1 A-C]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.2 D-F|5.2 D-F]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.3 G-I|5.3 G-I]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.4 J-M|5.4 J-M]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.5 N-P|5.5 N-P]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.6 Q-R|5.6 Q-R]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.7 S-T|5.7 S-T]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.8 U-Z|5.8 U-Z]]<br />
 +
</div>
  
  
 
= 5.1 A-C =
 
= 5.1 A-C =
  
=== '''Abhängige Variable''' ===
+
==== '''Abhängige Variable''' ====
  
 
Darunter versteht man '''Variable''', deren Ausprägung durch eine oder mehrere andere Variablen systematisch beeinflusst werden. So wäre z.B. in der Landwirtschaft der Ernteertrag abhängig z.B. von der Bodenqualität wie auch vom Einsatz von Düngemitteln.
 
Darunter versteht man '''Variable''', deren Ausprägung durch eine oder mehrere andere Variablen systematisch beeinflusst werden. So wäre z.B. in der Landwirtschaft der Ernteertrag abhängig z.B. von der Bodenqualität wie auch vom Einsatz von Düngemitteln.
  
=== '''Alpha-Fehler''' ===
+
==== '''Alpha-Fehler''' ====
  
 
Siehe ''Fehler der 1. Art''
 
Siehe ''Fehler der 1. Art''
  
=== '''Alternativhypothese''' ===
+
==== '''Alternativhypothese''' ====
  
 
Unter einer Alternativhypothese versteht man bei statistischen Tests die Gegenhypothese H1 zur Nullhypothese H0. Vor Durchführung von Tests legt man Annahmen über die Grundgesamtheit fest, welche mit Tests überprüft werden.
 
Unter einer Alternativhypothese versteht man bei statistischen Tests die Gegenhypothese H1 zur Nullhypothese H0. Vor Durchführung von Tests legt man Annahmen über die Grundgesamtheit fest, welche mit Tests überprüft werden.
  
=== '''Analytische Statistik''' (auch Schließende Statistik oder Inferenzstatistik) ===
+
==== '''Analytische Statistik''' (auch Schließende Statistik oder Inferenzstatistik) ====
  
Mithilfe von Verfahren der analytischen Statistik versucht man, von Stichproben auf die Grundpopulation bei Berücksichtigung unterschiedlicher Wahrscheinlichkeiten zu schließen. Dazu kommen eine Vielzahl weiterer weiterführender Verfahren wie Clusteranalyse, Faktorenanlyse multivariate Verfahren,... Siehe auch: '''Induktive Statistik (Wikipedia)[1]'''.
+
Mithilfe von Verfahren der analytischen Statistik versucht man, von Stichproben auf die Grundpopulation bei Berücksichtigung unterschiedlicher Wahrscheinlichkeiten zu schließen. Dazu kommen eine Vielzahl weiterer weiterführender Verfahren wie Clusteranalyse, Faktorenanlyse multivariate Verfahren,... Siehe auch: '''Induktive Statistik (Wikipedia)[http://de.wikipedia.org/wiki/Induktive_Statistik &#91;1&#93;]'''.
  
=== '''Arbeitshypothese''' ===
+
==== '''Arbeitshypothese''' ====
  
 
Darunter versteht man eine genau festzulegende Annahme, von der man zu Beginn eines Forschungsprojektes ausgeht. Siehe auch ''Nullhypothese''.
 
Darunter versteht man eine genau festzulegende Annahme, von der man zu Beginn eines Forschungsprojektes ausgeht. Siehe auch ''Nullhypothese''.
  
=== '''Arithmetisches Mittel''' (oder Durchschnitt/-swert) ===
+
==== '''Arithmetisches Mittel''' (oder Durchschnitt/-swert) ====
  
 
Das am häufigsten verwendete Lagemaß, welches den Durchschnittswert (Summe aller Werte dividiert durch ihre Anzahl) einer Variablen zeigt. Es sollte nur bei ''metrischen'' Variablen eingesetzt werden.
 
Das am häufigsten verwendete Lagemaß, welches den Durchschnittswert (Summe aller Werte dividiert durch ihre Anzahl) einer Variablen zeigt. Es sollte nur bei ''metrischen'' Variablen eingesetzt werden.
  
=== '''Ausprägungen''' ===
+
==== '''Ausprägungen''' ====
  
 
Unter Ausprägungen versteht man die Gesamtheit der möglichen Werte eines Merkmals.So kann z.B. die Variable Geschlecht die Ausprägungen ''männlich'' und ''weiblich'' annehmen.
 
Unter Ausprägungen versteht man die Gesamtheit der möglichen Werte eines Merkmals.So kann z.B. die Variable Geschlecht die Ausprägungen ''männlich'' und ''weiblich'' annehmen.
  
=== '''Ausreißer''' ===
+
==== '''Ausreißer''' ====
  
 
Darunter versteht man einen extrem großen oder extrem kleinen Wert, welcher weit von den restlichen Einträgen entfernt ist. Dies könnte z.B. der Fall beim Einkommen eines Millionärs sein, welcher in einem sehr armen Dorf lebt.
 
Darunter versteht man einen extrem großen oder extrem kleinen Wert, welcher weit von den restlichen Einträgen entfernt ist. Dies könnte z.B. der Fall beim Einkommen eines Millionärs sein, welcher in einem sehr armen Dorf lebt.
  
=== '''Balkendiagramm''' (auch Säulen- oder Blockdiagramm) ===
+
==== '''Balkendiagramm''' (auch Säulen- oder Blockdiagramm) ====
  
 
Dabei handelt es sich um Diagramme, bei welchen die Größe der Werte mit der Länge von Balken bzw. Säulen ausgedrückt werden. Werden die Werte (oft Häufigkeiten) senkrecht aufgetragen, spricht man in engerer Terminologie von Säulendiagrammen, werden sie waagrecht aufgetragen, von Balkendiagrammen.
 
Dabei handelt es sich um Diagramme, bei welchen die Größe der Werte mit der Länge von Balken bzw. Säulen ausgedrückt werden. Werden die Werte (oft Häufigkeiten) senkrecht aufgetragen, spricht man in engerer Terminologie von Säulendiagrammen, werden sie waagrecht aufgetragen, von Balkendiagrammen.
  
=== '''Bestimmtheitsmaß''' (auch Determinationskoeffizient) ===
+
==== '''Bestimmtheitsmaß''' (auch Determinationskoeffizient) ====
  
Das Bestimmtheitsmaß ist ein Maß für den Zusammenhang zwischen zwei Variablen und entspricht dem Quadrat des Korrelationskoeffizienten ''r.'' Es gibt an, in welchem Ausmaß die Varianz der einen Variablen durch die Varianz der anderen Variablen bestimmt wird. Siehe auch: '''Bestimmtheitsmaß (Wikipedia)[2]'''.
+
Das Bestimmtheitsmaß ist ein Maß für den Zusammenhang zwischen zwei Variablen und entspricht dem Quadrat des Korrelationskoeffizienten ''r.'' Es gibt an, in welchem Ausmaß die Varianz der einen Variablen durch die Varianz der anderen Variablen bestimmt wird. Siehe auch: '''Bestimmtheitsmaß (Wikipedia)[http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F &#91;2&#93;]'''.
  
=== '''Beta-Fehler''' ===
+
==== '''Beta-Fehler''' ====
  
 
Siehe ''Fehler der 1. und 2. Art.''
 
Siehe ''Fehler der 1. und 2. Art.''
  
=== '''bimodal''' ===
+
==== '''bimodal''' ====
  
 
Darunter versteht man das Auftreten von zwei Gipfeln in einer Häufigkeitsverteilung, d.h. von zwei ''Modalwerten''.
 
Darunter versteht man das Auftreten von zwei Gipfeln in einer Häufigkeitsverteilung, d.h. von zwei ''Modalwerten''.
  
=== '''Biseriale Korrelation''' ===
+
==== '''Biseriale Korrelation''' ====
  
 
Die biseriale Korrelation ''rbis'' zeigt den Zusammenhang von zwei ''metrischen'' und ''normalverteilten''Variablen, von denen eine künstlich dichotomisiert wurde (in zwei Gruppen unterteilt).
 
Die biseriale Korrelation ''rbis'' zeigt den Zusammenhang von zwei ''metrischen'' und ''normalverteilten''Variablen, von denen eine künstlich dichotomisiert wurde (in zwei Gruppen unterteilt).
  
=== '''bivariat''' ===
+
==== '''bivariat''' ====
  
Bivariat bezeichnet, dass von den Betrachtungen gleichzeitig zwei Variablen betroffen sind. Siehe z.B. die '''bivariate Häufigkeitsverteilung[3]'''.
+
Bivariat bezeichnet, dass von den Betrachtungen gleichzeitig zwei Variablen betroffen sind. Siehe z.B. die '''bivariate Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3]]]'''.
  
=== '''Blockbildung''' ===
+
==== '''Blockbildung''' ====
  
Unter Blockbildung, auch ''Clusterbildung'' genannt, versteht man die Zusammenfassung von Elementen der Untersuchung, welche wesentliche für die Untersuchung relevante Eigenschaften gemeinsam haben, zu Blöcken oder Clustern. SPSS ermöglicht es, derartige Cluster mithilfe der Clusteranalyse zu ermitteln. Der Vorteil der Clusterbildung liegt darin, dass durch die Schaffung größerer Einheiten sinkt auch die Fehlerwahrscheinlichkeit von Aussagen. Siehe zur Clusteranalyse: '''Clusteranalyse (Wikipedia)[4]'''.
+
Unter Blockbildung, auch ''Clusterbildung'' genannt, versteht man die Zusammenfassung von Elementen der Untersuchung, welche wesentliche für die Untersuchung relevante Eigenschaften gemeinsam haben, zu Blöcken oder Clustern. SPSS ermöglicht es, derartige Cluster mithilfe der Clusteranalyse zu ermitteln. Der Vorteil der Clusterbildung liegt darin, dass durch die Schaffung größerer Einheiten sinkt auch die Fehlerwahrscheinlichkeit von Aussagen. Siehe zur Clusteranalyse: '''Clusteranalyse (Wikipedia)[http://de.wikipedia.org/wiki/Clusteranalyse &#91;4&#93;]'''.
  
=== '''Blockdiagramm''' ===
+
==== '''Blockdiagramm''' ====
  
Siehe '''Balkendiagramm[5]'''.
+
Siehe '''Balkendiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5]]]'''.
  
=== '''Boxplot''' ===
+
==== '''Boxplot''' ====
  
Unter Boxplots versteht man eine graphische Darstellung der Lage und der Verteilung stetiger Merkmale beruhend auf den empirischen Quartilen. Der Abstand zwischen dem 1. und dem 3. Quartil wird als ein Rechteck dargestellt, in welchem durch einen waagrechten Strich auch der Median verzeichnet ist. Siehe wegen weiterer Eigenheiten dazu auch: '''Vergleichende grafische Darstellung[6]''' von Streuung und Lage mit Box-Plots.
+
Unter Boxplots versteht man eine graphische Darstellung der Lage und der Verteilung stetiger Merkmale beruhend auf den empirischen Quartilen. Der Abstand zwischen dem 1. und dem 3. Quartil wird als ein Rechteck dargestellt, in welchem durch einen waagrechten Strich auch der Median verzeichnet ist. Siehe wegen weiterer Eigenheiten dazu auch: '''Vergleichende grafische Darstellung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6]]]''' von Streuung und Lage mit Box-Plots.
  
=== '''Chi-Quadrat-Test''' ===
+
==== '''Chi-Quadrat-Test''' ====
  
Der Chi-Quadrat-Test ist ein statistisches Verfahren, um die Unabhängigkeit von zwei Merkmalen zu überprüfen. Er wird besonders gerne bei der '''Kreuztabellen-Analyse[7]''' eingesetzt. Siehe dazu auch: '''Chi-Quadrat-Test (Wikipedia)[8]'''.
+
Der Chi-Quadrat-Test ist ein statistisches Verfahren, um die Unabhängigkeit von zwei Merkmalen zu überprüfen. Er wird besonders gerne bei der '''Kreuztabellen-Analyse[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7]]]''' eingesetzt. Siehe dazu auch: '''Chi-Quadrat-Test (Wikipedia)[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;8&#93;]'''.
  
=== '''Clusterbildung''' ===
+
==== '''Clusterbildung''' ====
  
 
siehe ''Blockbildung''
 
siehe ''Blockbildung''
  
=== '''Codeplan''' ===
+
==== '''Codeplan''' ====
  
Darunter versteht man die schriftliche Zusammenfassung der Umsetzung der erhobenen Daten in numerische Werte, welche von den Statistik- Programmen zur Analyse benötigt werden. Siehe auch: '''vom Fragebogen zum Codeplan[9]'''.
+
Darunter versteht man die schriftliche Zusammenfassung der Umsetzung der erhobenen Daten in numerische Werte, welche von den Statistik- Programmen zur Analyse benötigt werden. Siehe auch: '''vom Fragebogen zum Codeplan[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9]]]'''.
  
=== '''Codieren''' ===
+
==== '''Codieren''' ====
  
 
C. bezeichnet die Zuordnung von festgelegten Schlüsseln (Zahlen oder Buchstaben) zu Merkmalsausprägungen für die Datenerfassung (z.B. bei Noten ’Sehr gut’ als 1, ’Gut’ als 2 etc.; oder bei Altersgruppen 1 für Kleinkinder, 2 für Jugendliche, 3 für Erwachsene, 4 für PensionistInnen).
 
C. bezeichnet die Zuordnung von festgelegten Schlüsseln (Zahlen oder Buchstaben) zu Merkmalsausprägungen für die Datenerfassung (z.B. bei Noten ’Sehr gut’ als 1, ’Gut’ als 2 etc.; oder bei Altersgruppen 1 für Kleinkinder, 2 für Jugendliche, 3 für Erwachsene, 4 für PensionistInnen).
Line 3,219: Line 3,682:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Induktive_Statistik<br />
+
[http://de.wikipedia.org/wiki/Induktive_Statistik &#91;1&#93; http://de.wikipedia.org/wiki/Induktive_Statistik]<br />
[2] http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F<br />
+
[http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F &#91;2&#93; http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3] Siehe Kapitel 3.5.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3] Siehe Kapitel 3.5.1]]<br />
[4] http://de.wikipedia.org/wiki/Clusteranalyse<br />
+
[http://de.wikipedia.org/wiki/Clusteranalyse &#91;4&#93; http://de.wikipedia.org/wiki/Clusteranalyse]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5] Siehe Kapitel 3.6.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5] Siehe Kapitel 3.6.1.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6] Siehe Kapitel 3.4.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6] Siehe Kapitel 3.4.5]]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7] Siehe Kapitel 3.5.2.1.1]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7] Siehe Kapitel 3.5.2.1.1]]<br />
[8] http://de.wikipedia.org/wiki/Chi-Quadrat-Test<br />
+
[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;8&#93; http://de.wikipedia.org/wiki/Chi-Quadrat-Test]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9] Siehe Kapitel 2.2.3]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9] Siehe Kapitel 2.2.3]]<br />
 +
  
  
 
= 5.2 D-F =
 
= 5.2 D-F =
  
=== '''Datenmatrix''' ===
+
==== '''Datenmatrix''' ====
  
 
Eine D. ist eine Anordnung der Daten, bei der die Untersuchungseinheiten in den Zeilen und die zu ihnen untersuchten Variablen in den Spalten eingetragen werden. Von oben nach unten könnten also z.B. die Versuchspersonen eingetragen werden, von links nach rechts ihre Körpergröße, ihre Leistungen, ihre Matrikelnummer etc. Eine Datenmatrix wird von jedem für statistische Zwecke verwendeten Programm zur Verwaltung der Daten verwendet.
 
Eine D. ist eine Anordnung der Daten, bei der die Untersuchungseinheiten in den Zeilen und die zu ihnen untersuchten Variablen in den Spalten eingetragen werden. Von oben nach unten könnten also z.B. die Versuchspersonen eingetragen werden, von links nach rechts ihre Körpergröße, ihre Leistungen, ihre Matrikelnummer etc. Eine Datenmatrix wird von jedem für statistische Zwecke verwendeten Programm zur Verwaltung der Daten verwendet.
  
=== '''Deskriptive Statistik''' ===
+
==== '''Deskriptive Statistik''' ====
  
 
In der deskriptiven Statistik erstellt man Maßzahlen zur Charakterisierung von Daten, wie ''Lagemaße'' (z.B. Durchschnitt), ''Streuungsmaße'' (z.B. Quartile) oder Maße für den Zusammenhang von Variablen (z.B. ''Korrelation''). Dazu gehört auch die grafische Aufbereitung der Daten und Ergebnisse in Form von Diagrammen. Im Gegensatz zur ''Analytischen Statistik'' beschäftigt sie sich nicht damit, von der ''Stichprobe'' unter Berücksichtigung verschiedener Wahrscheinlichkeiten auf die ''Grundgesamtheit'' zu schließen.
 
In der deskriptiven Statistik erstellt man Maßzahlen zur Charakterisierung von Daten, wie ''Lagemaße'' (z.B. Durchschnitt), ''Streuungsmaße'' (z.B. Quartile) oder Maße für den Zusammenhang von Variablen (z.B. ''Korrelation''). Dazu gehört auch die grafische Aufbereitung der Daten und Ergebnisse in Form von Diagrammen. Im Gegensatz zur ''Analytischen Statistik'' beschäftigt sie sich nicht damit, von der ''Stichprobe'' unter Berücksichtigung verschiedener Wahrscheinlichkeiten auf die ''Grundgesamtheit'' zu schließen.
  
=== '''Dichotome Variable''' ===
+
==== '''Dichotome Variable''' ====
  
 
Eine d.V. ist eine Variable, bei welcher nur zwei Ausprägungen möglich sind, wie z.B. lebendig/nicht lebendig; männlich/weiblich; bestanden/nicht bestanden. Jede ''stetige Variable'' kann zu dichotomen umgewandelt werden, wie z.B. differenziertes Einkommen zu ’unter 1000 €’ und ’über 1000 €).
 
Eine d.V. ist eine Variable, bei welcher nur zwei Ausprägungen möglich sind, wie z.B. lebendig/nicht lebendig; männlich/weiblich; bestanden/nicht bestanden. Jede ''stetige Variable'' kann zu dichotomen umgewandelt werden, wie z.B. differenziertes Einkommen zu ’unter 1000 €’ und ’über 1000 €).
  
=== '''Diskrete Variable''' ===
+
==== '''Diskrete Variable''' ====
  
 
Eine d.V. ist eine Variable, bei welcher nur abzählbar viele Ausprägungen möglich sind, also eine unendliche feine Differenzierung nicht möglich ist (das wäre eine ''stetige Variable''). Beispiele für eine d.V. sind die Punktzahlen eines Würfels, die Kinderzahlen von Familien, die Noten bei Prüfungen etc.
 
Eine d.V. ist eine Variable, bei welcher nur abzählbar viele Ausprägungen möglich sind, also eine unendliche feine Differenzierung nicht möglich ist (das wäre eine ''stetige Variable''). Beispiele für eine d.V. sind die Punktzahlen eines Würfels, die Kinderzahlen von Familien, die Noten bei Prüfungen etc.
  
=== '''Dispersionsmaße''' ===
+
==== '''Dispersionsmaße''' ====
  
 
Siehe ''Streuungsmaße''
 
Siehe ''Streuungsmaße''
  
=== '''Einseitige Hypothese''' (auch gerichtete Hypothese) ===
+
==== '''Einseitige Hypothese''' (auch gerichtete Hypothese) ====
  
 
E. H. sind Hypothesen, welche eine bestimmte Richtung eines Zusammenhangs annehmen. Man nimmt also nicht nur an, dass z.B. die Körpergröße mit der Schuhgröße korreliert, sondern genauer, dass mit steigender Körpergröße eine größere Schuhgröße einhergeht. (siehe auch ''zweiseitige Hypothese'').
 
E. H. sind Hypothesen, welche eine bestimmte Richtung eines Zusammenhangs annehmen. Man nimmt also nicht nur an, dass z.B. die Körpergröße mit der Schuhgröße korreliert, sondern genauer, dass mit steigender Körpergröße eine größere Schuhgröße einhergeht. (siehe auch ''zweiseitige Hypothese'').
  
=== '''Fehler 1. und 2. Art''' (auch Alpha- und Beta-Fehler) ===
+
==== '''Fehler 1. und 2. Art''' (auch Alpha- und Beta-Fehler) ====
  
 
In der Statistik arbeitet man mit Wahrscheinlichkeiten. Wir drücken dabei z.B. aus, dass unsere Nullhypothese bei einem ''Signifikanzniveau'' von 0,01 richtig ist, anders formuliert, bei einer ''Irrtumswahrscheinlichkeit'' von 1 %. Das bedeutet, dass in 1 % aller Fälle die Nullhypothese falsch sein wird, obwohl unsere Daten auf das gemessene Phänomen hindeuten. Das bezeichnet man als den ''Fehler der 1. Art ='' Die Nullhypothese stimmt nicht, obwohl unsere Daten die Nullhypothese bestätigen.
 
In der Statistik arbeitet man mit Wahrscheinlichkeiten. Wir drücken dabei z.B. aus, dass unsere Nullhypothese bei einem ''Signifikanzniveau'' von 0,01 richtig ist, anders formuliert, bei einer ''Irrtumswahrscheinlichkeit'' von 1 %. Das bedeutet, dass in 1 % aller Fälle die Nullhypothese falsch sein wird, obwohl unsere Daten auf das gemessene Phänomen hindeuten. Das bezeichnet man als den ''Fehler der 1. Art ='' Die Nullhypothese stimmt nicht, obwohl unsere Daten die Nullhypothese bestätigen.
Line 3,262: Line 3,726:
 
Der ''Fehler der 2. Art'' ist das Gegenteil. Die Nullhypothese wird zu Unrecht verworfen, weil die Daten (z.B. durch schlechte Auswahl der Mitglieder der Stichprobe) dazu anleiten.
 
Der ''Fehler der 2. Art'' ist das Gegenteil. Die Nullhypothese wird zu Unrecht verworfen, weil die Daten (z.B. durch schlechte Auswahl der Mitglieder der Stichprobe) dazu anleiten.
  
=== '''Flächendiagramm''' ===
+
==== '''Flächendiagramm''' ====
  
 
Das F. ist eine Diagrammform, bei welchem die Fläche zwischen Kurve und X- Achse durch Schraffierung oder Muster markiert wird.
 
Das F. ist eine Diagrammform, bei welchem die Fläche zwischen Kurve und X- Achse durch Schraffierung oder Muster markiert wird.
 +
  
  
 
= 5.3 G-I =
 
= 5.3 G-I =
  
=== '''Gaußsche Glockenkurve''' ''(auch Gaußverteilung'') ===
+
==== '''Gaußsche Glockenkurve''' ''(auch Gaußverteilung'') ====
  
 
siehe ''Normalverteilung''
 
siehe ''Normalverteilung''
  
=== '''Geometrisches Mittel''' ===
+
==== '''Geometrisches Mittel''' ====
  
 
siehe ''Mittel''
 
siehe ''Mittel''
  
=== '''Geschlossene Frage''' ===
+
==== '''Geschlossene Frage''' ====
  
 
Eine g. Fr. ist eine Frage mit vorgegebenen Antwortkategorien, z.B. ’Verdienen Sie ... A. unter 1000 €, B. über 1000 €’.
 
Eine g. Fr. ist eine Frage mit vorgegebenen Antwortkategorien, z.B. ’Verdienen Sie ... A. unter 1000 €, B. über 1000 €’.
  
=== '''Geschichtete Stichprobe''' ===
+
==== '''Geschichtete Stichprobe''' ====
  
 
Bei einer g. St. wird die Grundgesamtheit in Gruppen oder Schichten eingeteilt (z.B. FleischesserInnen und VegetarierInnen oder Männer und Frauen; Kinder, Jugendliche, Erwachsene, ältere Menschen). Man wird in der Regel versuchen (s. ''Repräsentativität''), das in der Grundpopulation vorhandene Verhältnis der Gruppen in der Stichprobe nachzubilden. Man spricht dann von einer proportionalen Schichtung.
 
Bei einer g. St. wird die Grundgesamtheit in Gruppen oder Schichten eingeteilt (z.B. FleischesserInnen und VegetarierInnen oder Männer und Frauen; Kinder, Jugendliche, Erwachsene, ältere Menschen). Man wird in der Regel versuchen (s. ''Repräsentativität''), das in der Grundpopulation vorhandene Verhältnis der Gruppen in der Stichprobe nachzubilden. Man spricht dann von einer proportionalen Schichtung.
  
=== '''Grundgesamtheit''' (auch ''Grundpopulation'') ===
+
==== '''Grundgesamtheit''' (auch ''Grundpopulation'') ====
  
 
Unter G. versteht man die Gesamtheit der Elemente, für welche die Aussagen der Untersuchung gelten sollen. Sie muss genau festgelegt werden. Erhebt man die Einstellungen von WienerInnen gegenüber ZuwandererInnen, so muss festgelegt werden, wer mit WienerInnen gemeint ist (ab welchem Alter; bei welchem rechtlichen Status, bei welcher Aufenthaltsdauer in der Stadt etc.). Da eine ''Vollerhebung'' nur selten möglich ist, wählt man in der Regel eine ''Stichprobe'' aus.
 
Unter G. versteht man die Gesamtheit der Elemente, für welche die Aussagen der Untersuchung gelten sollen. Sie muss genau festgelegt werden. Erhebt man die Einstellungen von WienerInnen gegenüber ZuwandererInnen, so muss festgelegt werden, wer mit WienerInnen gemeint ist (ab welchem Alter; bei welchem rechtlichen Status, bei welcher Aufenthaltsdauer in der Stadt etc.). Da eine ''Vollerhebung'' nur selten möglich ist, wählt man in der Regel eine ''Stichprobe'' aus.
  
=== '''Gütekriterium''' ===
+
==== '''Gütekriterium''' ====
  
 
Unter G. versteht man Kriterien zur Abschätzung der Qualität und Seriösität wissenschaftlicher Forschung (Datenerhebung, Analyse etc.). Die wesentlichen G. sind ''Validität'', ''Reliabilität'' und ''Objektivität''.
 
Unter G. versteht man Kriterien zur Abschätzung der Qualität und Seriösität wissenschaftlicher Forschung (Datenerhebung, Analyse etc.). Die wesentlichen G. sind ''Validität'', ''Reliabilität'' und ''Objektivität''.
  
=== '''Harmonisches Mittel''' ===
+
==== '''Harmonisches Mittel''' ====
  
 
siehe ''Mittel.''
 
siehe ''Mittel.''
  
=== '''Häufigkeit''' ===
+
==== '''Häufigkeit''' ====
  
 
Die Häufigkeit informiert, wie oft ein bestimmter Messwert auftritt. Man unterscheidet zwischen ''absoluter Häufigkeit'' (die gezählte Häufigkeit eines Messwerts, z.B. 18 Männer), die ''kumulierte Häufigkeit'' (die aufsummierte Häufigkeit bis zu einem bestimmten Niveau, z.B. 23 SchülerInnen hatten ein Gut oder Sehr Gut auf die Schularbeit), ''die prozentuelle Häufigkeit'' (in Prozent gemessen) bzw. ''die relative Häufigkeit'' (in Teilen von 1 gemessen).
 
Die Häufigkeit informiert, wie oft ein bestimmter Messwert auftritt. Man unterscheidet zwischen ''absoluter Häufigkeit'' (die gezählte Häufigkeit eines Messwerts, z.B. 18 Männer), die ''kumulierte Häufigkeit'' (die aufsummierte Häufigkeit bis zu einem bestimmten Niveau, z.B. 23 SchülerInnen hatten ein Gut oder Sehr Gut auf die Schularbeit), ''die prozentuelle Häufigkeit'' (in Prozent gemessen) bzw. ''die relative Häufigkeit'' (in Teilen von 1 gemessen).
  
=== '''Häufigkeitsverteilung''' ===
+
==== '''Häufigkeitsverteilung''' ====
  
 
Unter einer H. versteht man eine tabellarische oder grafische Anordnung von Werten, bei der die jeweiligen Ausprägungen mit der dazugehörigen Häufigkeit vermerkt werden.
 
Unter einer H. versteht man eine tabellarische oder grafische Anordnung von Werten, bei der die jeweiligen Ausprägungen mit der dazugehörigen Häufigkeit vermerkt werden.
  
=== '''Histogramm''' ===
+
==== '''Histogramm''' ====
  
Ein H. ermöglicht die graphische Darstellung der Häufigkeitsverteilung quantitativer Merkmale. Die Daten werden in Klassen eingeteilt und auf einer Grundlinie aufgetragen. Über jeder Klasse wird ein Rechteck gezeichnet. Die Höhe des Rechtecks wird durch seine Häufigkeit bestimmt. Siehe auch: '''Histogramme[1]'''.
+
Ein H. ermöglicht die graphische Darstellung der Häufigkeitsverteilung quantitativer Merkmale. Die Daten werden in Klassen eingeteilt und auf einer Grundlinie aufgetragen. Über jeder Klasse wird ein Rechteck gezeichnet. Die Höhe des Rechtecks wird durch seine Häufigkeit bestimmt. Siehe auch: '''Histogramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]'''.
  
=== '''Hypothese''' ===
+
==== '''Hypothese''' ====
  
 
Eine H. ist eine Annahme über die Beziehung zwischen zwei oder mehr Variablen, die mithilfe eines Untersuchungsverfahrens verifiziert oder falsifiziert werden kann. Siehe auch ''Nullhypothese''.
 
Eine H. ist eine Annahme über die Beziehung zwischen zwei oder mehr Variablen, die mithilfe eines Untersuchungsverfahrens verifiziert oder falsifiziert werden kann. Siehe auch ''Nullhypothese''.
  
=== '''Inferenzstatistik''' ===
+
==== '''Inferenzstatistik''' ====
  
 
Siehe ''Analytische Statistik''
 
Siehe ''Analytische Statistik''
  
=== '''Interquartilsabstand''' ===
+
==== '''Interquartilsabstand''' ====
  
 
Als I. bezeichnet man die Differenz zwischen dem ersten und dem dritten Quartil. Grafisch wird er z.B. mit dem ''Boxplot'' dargestellt.
 
Als I. bezeichnet man die Differenz zwischen dem ersten und dem dritten Quartil. Grafisch wird er z.B. mit dem ''Boxplot'' dargestellt.
  
=== '''Intervallskalierung''' ===
+
==== '''Intervallskalierung''' ====
  
 
Bei der I. können die Abstände zwischen den Ausprägungen ''metrischer Werte'' richtig interpretiert werden, jedoch gibt es keinen natürlichen Nullpunkt, sodass das Verhältnis der Werte nicht interpretiert werden kann. Der Abstand zwischen 12 und 13 Grad ist genauso groß wie der zwischen 34 und 35 Grad. Man kann jedoch nicht sagen, dass 10 Grad doppelt so heiß wie 5 Grad ist (es gibt einen absoluten Nullpunkt bei - 273 Grad, unsere gewohnte Null-Gradgrenze ist willkürlich und lässt sich nach unten unterschreiten).
 
Bei der I. können die Abstände zwischen den Ausprägungen ''metrischer Werte'' richtig interpretiert werden, jedoch gibt es keinen natürlichen Nullpunkt, sodass das Verhältnis der Werte nicht interpretiert werden kann. Der Abstand zwischen 12 und 13 Grad ist genauso groß wie der zwischen 34 und 35 Grad. Man kann jedoch nicht sagen, dass 10 Grad doppelt so heiß wie 5 Grad ist (es gibt einen absoluten Nullpunkt bei - 273 Grad, unsere gewohnte Null-Gradgrenze ist willkürlich und lässt sich nach unten unterschreiten).
  
=== '''Irrtumswahrscheinlichkeit''' ===
+
==== '''Irrtumswahrscheinlichkeit''' ====
  
 
Unter I. versteht man die Wahrscheinlichkeit für das Auftreten des ''Fehlers 1. Art.'' Die I. ist somit die präzisierte Wahrscheinlichkeit, dass - obwohl die Daten einen bestimmten Schluss zulassen - dieser Schluss falsch ist. Als gängige Niveaus der Irrtumswahrscheinlichkeit nimmt man 5 %, 1 % und 1 ‰.
 
Unter I. versteht man die Wahrscheinlichkeit für das Auftreten des ''Fehlers 1. Art.'' Die I. ist somit die präzisierte Wahrscheinlichkeit, dass - obwohl die Daten einen bestimmten Schluss zulassen - dieser Schluss falsch ist. Als gängige Niveaus der Irrtumswahrscheinlichkeit nimmt man 5 %, 1 % und 1 ‰.
Line 3,333: Line 3,798:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 +
  
  
 
= 5.4 J-M =
 
= 5.4 J-M =
  
=== '''Klasse''' ===
+
==== '''Klasse''' ====
  
Unter einer K. versteht man eine Gruppe von Ausprägungen stetiger und diskreter Variablen, welche durch die Zusammenfassung benachbarter Werte entstehen. Eine Klasse wird von festgelegten Klassengrenzen begrenzt. Den Vorgang der Klassenbildung nennt man ''Klassierung oder Klassifikation''. Eine Klassierung wird in der Regel verwendet, um die Darstellung enorm differenzierter Ausprägungen übersichtlicher zu gestalten (z.B. Zusammenfassung aller Einkommen in 0-500 €; eine zweite Klasse Einkommen bis 1000 €; eine dritte Klasse zwischen 1001-1500 € usw.). Siehe auch: '''Klassenbildung von Daten[1]'''.
+
Unter einer K. versteht man eine Gruppe von Ausprägungen stetiger und diskreter Variablen, welche durch die Zusammenfassung benachbarter Werte entstehen. Eine Klasse wird von festgelegten Klassengrenzen begrenzt. Den Vorgang der Klassenbildung nennt man ''Klassierung oder Klassifikation''. Eine Klassierung wird in der Regel verwendet, um die Darstellung enorm differenzierter Ausprägungen übersichtlicher zu gestalten (z.B. Zusammenfassung aller Einkommen in 0-500 €; eine zweite Klasse Einkommen bis 1000 €; eine dritte Klasse zwischen 1001-1500 € usw.). Siehe auch: '''Klassenbildung von Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]'''.
  
=== '''Klassifizerung''' (auch ''Klassierung''). ===
+
==== '''Klassifizerung''' (auch ''Klassierung''). ====
  
 
Siehe ''Klasse.''
 
Siehe ''Klasse.''
  
=== '''Konfidenzinterall''' (auch ''Vertrauensintervall'') ===
+
==== '''Konfidenzinterall''' (auch ''Vertrauensintervall'') ====
  
Aus Stichproben erhaltene Maßzahlen sind immer nur Annäherungen an die zugrundeliegenden, aber meist unbekannten Werte in der Grundpopulation. Man ermittelt daher ''Konfidenzintervalle,'' innerhalb welchen Bereichs sich der ’richtige’ Wert befindet. Diese Konfidenzintervalle hängen vom gewählten ''Signifikanzniveau'' ab. Wir erleben die Angabe derartiger Konfidenzintervalle an jedem Wahlsonntag, wenn bei den ersten Analysen des wahrscheinlichen Wahlergebnisses der/die Statistikexperte/in sagt, dass die Partei A mit zwischen 34,8 und 36,2 % der Stimmen rechnen kann. Mit wachsender Stichprobengröße (Auszählungsgrad) wird das Konfidenzintervall kleiner, weil immer mehr mit der Grundpopulation übereinstimmend, bis es bei Vollauszählung verschwindet. Siehe auch: '''Konfidenzintervall (Wikipedia)[2]'''.
+
Aus Stichproben erhaltene Maßzahlen sind immer nur Annäherungen an die zugrundeliegenden, aber meist unbekannten Werte in der Grundpopulation. Man ermittelt daher ''Konfidenzintervalle,'' innerhalb welchen Bereichs sich der ’richtige’ Wert befindet. Diese Konfidenzintervalle hängen vom gewählten ''Signifikanzniveau'' ab. Wir erleben die Angabe derartiger Konfidenzintervalle an jedem Wahlsonntag, wenn bei den ersten Analysen des wahrscheinlichen Wahlergebnisses der/die Statistikexperte/in sagt, dass die Partei A mit zwischen 34,8 und 36,2 % der Stimmen rechnen kann. Mit wachsender Stichprobengröße (Auszählungsgrad) wird das Konfidenzintervall kleiner, weil immer mehr mit der Grundpopulation übereinstimmend, bis es bei Vollauszählung verschwindet. Siehe auch: '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;2&#93;]'''.
  
=== '''Kontingenztafel''' ===
+
==== '''Kontingenztafel''' ====
  
 
Eine K. ist die tabellarische Darstellung der Häufigkeitsverteilung von zumindest zwei Merkmalen. Siehe ''Kreuztabelle.''
 
Eine K. ist die tabellarische Darstellung der Häufigkeitsverteilung von zumindest zwei Merkmalen. Siehe ''Kreuztabelle.''
  
=== '''Kontingenzkoeffizient''' ===
+
==== '''Kontingenzkoeffizient''' ====
  
Ein K. ist eine Kennzahl für die Stärke des Zusammenhangs zwischen nominalskalierten Daten. Siehe auch: '''Kontingenzkoeffizient (Wikipedia)[3]'''.
+
Ein K. ist eine Kennzahl für die Stärke des Zusammenhangs zwischen nominalskalierten Daten. Siehe auch: '''Kontingenzkoeffizient (Wikipedia)[http://de.wikipedia.org/wiki/Kontingenzkoeffizient &#91;3&#93;]'''.
  
=== '''Korrelation''' ===
+
==== '''Korrelation''' ====
  
Unter K. versteht man den Zusammenhang zwischen zwei quantitativen Merkmalen. Die Stärke des Zusammenhangs wird durch den ''Korrelationskoeffizient'' ausgedrückt. Siehe auch: die '''Korrelation[4]'''.
+
Unter K. versteht man den Zusammenhang zwischen zwei quantitativen Merkmalen. Die Stärke des Zusammenhangs wird durch den ''Korrelationskoeffizient'' ausgedrückt. Siehe auch: die '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4]]]'''.
  
=== '''Korrelationskoeffizient''' ===
+
==== '''Korrelationskoeffizient''' ====
  
 
Der K. ist eine Kennzahl für den linearen Zusammenhang zwischen zwei quantitativen Merkmalen. Er liegt zwischen den Extremen -1 und +1. Wenn er positiv ist, bedeutet dies, dass ein hoher Wert der Variablen A mit einem hohen Wert der Variablen B einhergeht, genauso verhält es sich mit den niedrigen Werten. Ist der K. negativ, bedeutet dies, dass hohe Werte von Variable A mit niedrigen der Variable B einhergehen und umgekehrt.
 
Der K. ist eine Kennzahl für den linearen Zusammenhang zwischen zwei quantitativen Merkmalen. Er liegt zwischen den Extremen -1 und +1. Wenn er positiv ist, bedeutet dies, dass ein hoher Wert der Variablen A mit einem hohen Wert der Variablen B einhergeht, genauso verhält es sich mit den niedrigen Werten. Ist der K. negativ, bedeutet dies, dass hohe Werte von Variable A mit niedrigen der Variable B einhergehen und umgekehrt.
  
=== '''Kovarianz''' ===
+
==== '''Kovarianz''' ====
  
Die Kovarianz beschreibt den Zusammenhang zwischen zwei metrischen Merkmalen. Da sie nicht standardisiert ist, wird in der Regel statt ihr auf die von ihr abgeleitete ''Korrelation'' zurückgegriffen. Siehe auch: '''Kovarianz (Wikipedia)[5]'''.
+
Die Kovarianz beschreibt den Zusammenhang zwischen zwei metrischen Merkmalen. Da sie nicht standardisiert ist, wird in der Regel statt ihr auf die von ihr abgeleitete ''Korrelation'' zurückgegriffen. Siehe auch: '''Kovarianz (Wikipedia)[http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29 &#91;5&#93;]'''.
  
=== '''Kreisdiagramm''' (oder Tortendiagramm) ===
+
==== '''Kreisdiagramm''' (oder Tortendiagramm) ====
  
 
Das K. ist eine Diagrammform, welche sich besonders gut zur Darstellung von Anteilen vom Ganzen eignet. Häufigkeiten werden durch Kreissektoren wiedergegeben. Die Größe eines Tortenstücks entspricht dem relativen Anteil am Ganzen oder an 100 %.
 
Das K. ist eine Diagrammform, welche sich besonders gut zur Darstellung von Anteilen vom Ganzen eignet. Häufigkeiten werden durch Kreissektoren wiedergegeben. Die Größe eines Tortenstücks entspricht dem relativen Anteil am Ganzen oder an 100 %.
  
=== '''Kreuztabelle''' (auch Kontingenztabelle, -tafel) ===
+
==== '''Kreuztabelle''' (auch Kontingenztabelle, -tafel) ====
  
In einer K. stellt man die gemeinsame Häufigkeitsverteilung von zumindest zwei Variablen (nominal- oder ordinalskaliert) dar. Man versucht dabei, auffällige Unterschiede zwischen beobachteter Häufigkeit und der zu erwarteder Häufigkeit festzustellen und mittels des ''Chi-Quadrat-Tests'' wahrscheinliche Zusammenhänge zu überprüfen. Siehe auch: '''Kreuztabellen-Analyse[6]'''.
+
In einer K. stellt man die gemeinsame Häufigkeitsverteilung von zumindest zwei Variablen (nominal- oder ordinalskaliert) dar. Man versucht dabei, auffällige Unterschiede zwischen beobachteter Häufigkeit und der zu erwarteder Häufigkeit festzustellen und mittels des ''Chi-Quadrat-Tests'' wahrscheinliche Zusammenhänge zu überprüfen. Siehe auch: '''Kreuztabellen-Analyse[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6]]]'''.
  
=== '''Kumulative Häufigkeit''' (auch ''kumulierte H.'') ===
+
==== '''Kumulative Häufigkeit''' (auch ''kumulierte H.'') ====
  
 
siehe ''Häufigkeit''
 
siehe ''Häufigkeit''
  
=== '''Lagemaße''' (auch ''Zentralwerte'' oder ''Maße der zentralen Tendenz)'' ===
+
==== '''Lagemaße''' (auch ''Zentralwerte'' oder ''Maße der zentralen Tendenz)'' ====
  
Mit L. kann man den Schwerpunkt der Ausprägungen quantitativer Variabler zeigen.Die gebräuchlichsten Lagemaße sind das ''arithmetische Mittelt'', der Median und der Modalwert. Siehe auch: '''Mittelwerte[7]'''.
+
Mit L. kann man den Schwerpunkt der Ausprägungen quantitativer Variabler zeigen.Die gebräuchlichsten Lagemaße sind das ''arithmetische Mittelt'', der Median und der Modalwert. Siehe auch: '''Mittelwerte[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7]]]'''.
  
=== '''Liniendiagramm''' (auch ''Kurvendiagramm'') ===
+
==== '''Liniendiagramm''' (auch ''Kurvendiagramm'') ====
  
Man verwendet L., um den zeitlichen Verlauf von Entwicklungen zu zeigen. Siehe auch: '''Liniendiagramme[8]'''.
+
Man verwendet L., um den zeitlichen Verlauf von Entwicklungen zu zeigen. Siehe auch: '''Liniendiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|[8]]]'''.
  
=== '''Maßzahlen''' ===
+
==== '''Maßzahlen''' ====
  
 
M. zeigen charakteristische Eigenheiten quantitativer Variabler. Man unterscheidet ''Lagemaße'' und ''Streuungsmaße''.
 
M. zeigen charakteristische Eigenheiten quantitativer Variabler. Man unterscheidet ''Lagemaße'' und ''Streuungsmaße''.
  
=== '''Median''' (auch ''Zentralwert'') ===
+
==== '''Median''' (auch ''Zentralwert'') ====
  
 
Der Median kann bei mindestens ordinalskalierten Daten eingesetzt werden und bezeichnet jenes Element, welches in einer geordneten Reihe genau in der Mitte liegt. D.h. dass es oberhalb von ihm genauso viele (größere) Einträge wie unterhalb von ihm gibt.
 
Der Median kann bei mindestens ordinalskalierten Daten eingesetzt werden und bezeichnet jenes Element, welches in einer geordneten Reihe genau in der Mitte liegt. D.h. dass es oberhalb von ihm genauso viele (größere) Einträge wie unterhalb von ihm gibt.
Line 3,399: Line 3,865:
 
Der Median eignet sich besonders gut, wenn ''Ausreißer'' das ''arithmetische Mittel'' verzerren.
 
Der Median eignet sich besonders gut, wenn ''Ausreißer'' das ''arithmetische Mittel'' verzerren.
  
=== '''Merkmal''' (auch Variable) ===
+
==== '''Merkmal''' (auch Variable) ====
  
 
Unter einem M. versteht man Eigenheiten des Untersuchungsobjekts, deren Ausprägungen variieren können (im Gegensatz zu ''Konstanten'').
 
Unter einem M. versteht man Eigenheiten des Untersuchungsobjekts, deren Ausprägungen variieren können (im Gegensatz zu ''Konstanten'').
  
=== '''Messniveau''' (auch ''Skalenniveau'') ===
+
==== '''Messniveau''' (auch ''Skalenniveau'') ====
  
 
Unter ''Messen'' versteht man im weitesten Sinne die Zuordnung von Zahlen zu Beobachtung. Anhand des Messniveaus legt man fest, welche Interpretationen unterschiedlicher Ausprägungen sinnvoll sind, welche Verfahren angewendet werden dürfen. Es gibt vier Messniveaus: Nominal-, Ordinal-, Intervall- und Ratioskala. Die beiden ersten beziehen sich auf ''nicht metrische Variablen'', die beiden letzten auf ''metrische Variablen.''
 
Unter ''Messen'' versteht man im weitesten Sinne die Zuordnung von Zahlen zu Beobachtung. Anhand des Messniveaus legt man fest, welche Interpretationen unterschiedlicher Ausprägungen sinnvoll sind, welche Verfahren angewendet werden dürfen. Es gibt vier Messniveaus: Nominal-, Ordinal-, Intervall- und Ratioskala. Die beiden ersten beziehen sich auf ''nicht metrische Variablen'', die beiden letzten auf ''metrische Variablen.''
  
=== '''Metrik''' ===
+
==== '''Metrik''' ====
  
 
Unter M. versteht man ein definiertes System von Kennzahlen/Maßeinheiten (z.B. Liter, Kilometer, Minuten).
 
Unter M. versteht man ein definiertes System von Kennzahlen/Maßeinheiten (z.B. Liter, Kilometer, Minuten).
  
=== '''metrisch''' ===
+
==== '''metrisch''' ====
  
 
Als ''metrisch'' werden Variable bezeichnet, wenn der Abstand zwischen zwei Ausprägungen der Variablen interpretiert werden kann, wenn also der Abstand zwischen 12 und 15 genauso großist wie der Abstand zwischen 23 und 26. Metrische Variable sind daher entweder ''intervall''- oder ''proportionalskaliert''. ''Nichtmetrische Variablen'' sind ''nominal-'' oder ''ordinalskaliert.''
 
Als ''metrisch'' werden Variable bezeichnet, wenn der Abstand zwischen zwei Ausprägungen der Variablen interpretiert werden kann, wenn also der Abstand zwischen 12 und 15 genauso großist wie der Abstand zwischen 23 und 26. Metrische Variable sind daher entweder ''intervall''- oder ''proportionalskaliert''. ''Nichtmetrische Variablen'' sind ''nominal-'' oder ''ordinalskaliert.''
  
=== '''Mittel''' ===
+
==== '''Mittel''' ====
  
Sammelbegriff für verschiedene Lagemaße, wie z.B. das ''arithmetische Mittel'', das '''''harmonische Mittel''[9]''', das '''''geometrische Mittel''[10]'''.
+
Sammelbegriff für verschiedene Lagemaße, wie z.B. das ''arithmetische Mittel'', das '''''harmonische Mittel''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9]]]''', das '''''geometrische Mittel''[10]'''.
  
=== '''Mittelwert''' (auch ''Arithmetisches Mittel'') ===
+
==== '''Mittelwert''' (auch ''Arithmetisches Mittel'') ====
  
 
Der M. eines metrischen Merkmals ist ein ''Lagemaß'' und entspricht der Summe aller Werte geteilt durch deren Anzahl.
 
Der M. eines metrischen Merkmals ist ein ''Lagemaß'' und entspricht der Summe aller Werte geteilt durch deren Anzahl.
  
=== '''Modalwert''' (auch Modus) ===
+
==== '''Modalwert''' (auch Modus) ====
  
 
Der M. ist ein ''Lagemaß''. Er bezeichnet den am häufigsten vorkommenden Wert.
 
Der M. ist ein ''Lagemaß''. Er bezeichnet den am häufigsten vorkommenden Wert.
  
=== '''Modus''' (siehe ''Modalwert'') ===
+
==== '''Modus''' (siehe ''Modalwert'') ====
  
=== '''Multivariate Verfahren''' (oder ''m. Analyse'') ===
+
==== '''Multivariate Verfahren''' (oder ''m. Analyse'') ====
  
Unter M. V. versteht man Verfahren, bei welchen mindestens drei Variablen und deren Wechselbeziehungen analysiert werden. Siehe auch: '''Multivariate Analyse (Wikipedia)[11]'''.
+
Unter M. V. versteht man Verfahren, bei welchen mindestens drei Variablen und deren Wechselbeziehungen analysiert werden. Siehe auch: '''Multivariate Analyse (Wikipedia)[http://de.wikipedia.org/wiki/Multivariate_Analyse &#91;11&#93;]'''.
  
  
Line 3,437: Line 3,903:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
[2] http://de.wikipedia.org/wiki/Konfidenzintervall<br />
+
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;2&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
[3] http://de.wikipedia.org/wiki/Kontingenzkoeffizient<br />
+
[http://de.wikipedia.org/wiki/Kontingenzkoeffizient &#91;3&#93; http://de.wikipedia.org/wiki/Kontingenzkoeffizient]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4] Siehe Kapitel 3.5.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4] Siehe Kapitel 3.5.3]]<br />
[5] http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29<br />
+
[http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29 &#91;5&#93; http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6] Siehe Kapitel 3.5.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6] Siehe Kapitel 3.5.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7] Siehe Kapitel 3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7] Siehe Kapitel 3.3]]<br />
Line 3,446: Line 3,912:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9] Siehe Kapitel 3.3.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9] Siehe Kapitel 3.3.5]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[10] Siehe Kapitel 3.3.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[10] Siehe Kapitel 3.3.4]]<br />
[11] http://de.wikipedia.org/wiki/Multivariate_Analyse<br />
+
[http://de.wikipedia.org/wiki/Multivariate_Analyse &#91;11&#93; http://de.wikipedia.org/wiki/Multivariate_Analyse]<br />
 +
 
  
  
 
= 5.5 N-P =
 
= 5.5 N-P =
  
=== '''Nichtparametrische Verfahren''' (auch ''parameterfreie Verfahren'') ===
+
==== '''Nichtparametrische Verfahren''' (auch ''parameterfreie Verfahren'') ====
  
Als N.T. werden alle statistischen Verfahren bezeichnet, welche nicht an bestimmte Verteilungsformen (wie der Normalverteilung) gebunden sind. Solche Tests sind z.B. der ''Chi-Quadrat-Test,'' der '''Wilcoxon-Test (Wikipedia)[1]''' und der '''Mann-Whitney (Wikipedia)[2]'''-Test.
+
Als N.T. werden alle statistischen Verfahren bezeichnet, welche nicht an bestimmte Verteilungsformen (wie der Normalverteilung) gebunden sind. Solche Tests sind z.B. der ''Chi-Quadrat-Test,'' der '''Wilcoxon-Test (Wikipedia)[http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest &#91;1&#93;]''' und der '''Mann-Whitney (Wikipedia)[http://de.wikipedia.org/wiki/Mann-Whitney-Test &#91;2&#93;]'''-Test.
  
=== '''nominal''' ===
+
==== '''nominal''' ====
  
Merkmale werden als ''nominal'' bezeichnet, wenn ihre Ausprägungen nicht sinnvoll oder ’natürlich’ gereiht werden können (wie z.B. Farben, Hobbies, Namen). Sie sind '''''nominalskaliert''[3]'''. Siehe ''Messniveau.''
+
Merkmale werden als ''nominal'' bezeichnet, wenn ihre Ausprägungen nicht sinnvoll oder ’natürlich’ gereiht werden können (wie z.B. Farben, Hobbies, Namen). Sie sind '''''nominalskaliert''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3]]]'''. Siehe ''Messniveau.''
  
=== '''Normalverteilung''' (auch Gaußverteilung) ===
+
==== '''Normalverteilung''' (auch Gaußverteilung) ====
  
Die N. in Form der ''Gaußschen Glockenkurve'' ist eine Verteilungsform mit folgenden Merkmalen: sie ist unimodal (hat nur einen Gipfel); der Gipfel befindet sich in der Mitte (d.h. die in der Mitte des Messspektrums auftretenden Ausprägungen kommen auch am häufigsten vor); sie sind symmetrisch (links wie rechts vom Mittelwert fallen die Häufigkeiten gleichmäßig ab); die Lagemaße wie ''Modalwert, Mittelwert'' und ''Median'' stimmen (fast) annähernd überein. Innerhalb des Bereichs Mittelwert ± der ''Standardabweichung s'' liegen ca. 68 % aller Messwerte. Siehe auch: '''Normalverteilung (Wikipedia)[4]'''.
+
Die N. in Form der ''Gaußschen Glockenkurve'' ist eine Verteilungsform mit folgenden Merkmalen: sie ist unimodal (hat nur einen Gipfel); der Gipfel befindet sich in der Mitte (d.h. die in der Mitte des Messspektrums auftretenden Ausprägungen kommen auch am häufigsten vor); sie sind symmetrisch (links wie rechts vom Mittelwert fallen die Häufigkeiten gleichmäßig ab); die Lagemaße wie ''Modalwert, Mittelwert'' und ''Median'' stimmen (fast) annähernd überein. Innerhalb des Bereichs Mittelwert ± der ''Standardabweichung s'' liegen ca. 68 % aller Messwerte. Siehe auch: '''Normalverteilung (Wikipedia)[http://de.wikipedia.org/wiki/Normalverteilung &#91;4&#93;]'''.
  
=== '''Nullhypothese''' ===
+
==== '''Nullhypothese''' ====
  
 
Unter einer N. versteht man die Annahme bei statistischen Tests, dass ein postulierter Zusammenhang oder Unterschied nicht besteht. Mit geeigneten Verfahren wird untersucht, ob die Unterschiede oder Zusammenhänge bei einem gewählten Signifikanzniveau noch als zufällig erklärt werden können. Wird das Signifikanzniveau erreicht, wird die Nullhypothese verworfen und die ''Alternativhypothese'' angenommen.
 
Unter einer N. versteht man die Annahme bei statistischen Tests, dass ein postulierter Zusammenhang oder Unterschied nicht besteht. Mit geeigneten Verfahren wird untersucht, ob die Unterschiede oder Zusammenhänge bei einem gewählten Signifikanzniveau noch als zufällig erklärt werden können. Wird das Signifikanzniveau erreicht, wird die Nullhypothese verworfen und die ''Alternativhypothese'' angenommen.
  
=== '''Offene Frage''' ===
+
==== '''Offene Frage''' ====
  
 
Bei o. Fr. werden im Gegensatz zu geschlossenen Frage keine Antwortkategorien vorgegeben. Daher ist die Auswertung o. Fr. deutlich aufwendiger, weil sie erst interpretiert und eingeordnet werden müssen.
 
Bei o. Fr. werden im Gegensatz zu geschlossenen Frage keine Antwortkategorien vorgegeben. Daher ist die Auswertung o. Fr. deutlich aufwendiger, weil sie erst interpretiert und eingeordnet werden müssen.
  
=== '''Objektivität''' ===
+
==== '''Objektivität''' ====
  
 
Unter O. versteht man eine Grundanforderung an Methoden der Datenerhebung. Die Untersuchenden müssen versuchen sicherzustellen, dass andere ForscherInnen bei gleichen Erhebungsmethoden zum gleichen Ergebnis kommen. Dadurch soll eine Unabhängigkeit der Ergebnisse von den Erhebenden angestrebt werden. Im weiteren Sinne bezieht sich O. auch auf die Auswertung der Daten und deren Interpretation. Siehe auch andere ''Gütekriterien'' von Datenerhebungen, wie die ''Variablität'' und ''Validität''.
 
Unter O. versteht man eine Grundanforderung an Methoden der Datenerhebung. Die Untersuchenden müssen versuchen sicherzustellen, dass andere ForscherInnen bei gleichen Erhebungsmethoden zum gleichen Ergebnis kommen. Dadurch soll eine Unabhängigkeit der Ergebnisse von den Erhebenden angestrebt werden. Im weiteren Sinne bezieht sich O. auch auf die Auswertung der Daten und deren Interpretation. Siehe auch andere ''Gütekriterien'' von Datenerhebungen, wie die ''Variablität'' und ''Validität''.
  
=== '''Operationalisierung''' ===
+
==== '''Operationalisierung''' ====
  
 
Unter O. versteht man eine möglichst exakte Festlegung der Vorgangsweise bei der Datenerhebung, wie z.B. Frageformulierungen, Anwortvorgaben, Anweisungen an InterviewerInnen usw. Die O. gibt genau an, wie ein bestimmtes Phänomen gemessen werden soll (wie z.B. die angenommene Ablehnung bestimmter Zuwanderergruppen). Die O. inkludiert alle Vorgänge von der Formulierung einer Hypothese, ihrer Umsetzung in konkrete Fragen und die Aufnahme der Daten.
 
Unter O. versteht man eine möglichst exakte Festlegung der Vorgangsweise bei der Datenerhebung, wie z.B. Frageformulierungen, Anwortvorgaben, Anweisungen an InterviewerInnen usw. Die O. gibt genau an, wie ein bestimmtes Phänomen gemessen werden soll (wie z.B. die angenommene Ablehnung bestimmter Zuwanderergruppen). Die O. inkludiert alle Vorgänge von der Formulierung einer Hypothese, ihrer Umsetzung in konkrete Fragen und die Aufnahme der Daten.
  
=== '''ordinal''' ===
+
==== '''ordinal''' ====
  
 
Eine Variable gilt als ''ordinal'', wenn ihre Ausprägungen natürlich geordnet werden können, nicht aber die Unterschiede zwischen den Ausprägungen. So weiß man, dass eine Schulnote 1 besser als die Schulnote 2 ist, aber es ist nicht gesichert, dass der Schüler mit der Note 1 den Schüler mit der Note 2 im gleichen Maße übertrifft wie ein Schüler mit der Note 4 einen Schüler mit der Note 5.
 
Eine Variable gilt als ''ordinal'', wenn ihre Ausprägungen natürlich geordnet werden können, nicht aber die Unterschiede zwischen den Ausprägungen. So weiß man, dass eine Schulnote 1 besser als die Schulnote 2 ist, aber es ist nicht gesichert, dass der Schüler mit der Note 1 den Schüler mit der Note 2 im gleichen Maße übertrifft wie ein Schüler mit der Note 4 einen Schüler mit der Note 5.
  
=== '''Ordinalskalierung''' ===
+
==== '''Ordinalskalierung''' ====
  
 
Messniveau ordinaler Daten (siehe ''ordinal'').
 
Messniveau ordinaler Daten (siehe ''ordinal'').
  
=== '''Population''' ===
+
==== '''Population''' ====
  
 
Gesamtmenge aller Beobachtungseinheiten
 
Gesamtmenge aller Beobachtungseinheiten
  
=== '''p-Wert''' (auch Überschreitungswahrscheinlichkeit) ===
+
==== '''p-Wert''' (auch Überschreitungswahrscheinlichkeit) ====
  
 
Der p. Wert (Kurzform von ''probability'') gibt bei statistischen Tests die Wahrscheinlichkeit an, mit welcher eine gefundene Kennzahl rein zufällig auftreten könnte. Man legt vor der Durchführung eines Tests ein Signifikanzniveau fest, z.B. p= 0,05. Ergibt sich ein p-Wert von kleiner als 0,05, dann ist die Nullhypothese mit einer ''Irrtumswahrscheinlichkeit'' von kleiner als 5 % zu verwerfen.
 
Der p. Wert (Kurzform von ''probability'') gibt bei statistischen Tests die Wahrscheinlichkeit an, mit welcher eine gefundene Kennzahl rein zufällig auftreten könnte. Man legt vor der Durchführung eines Tests ein Signifikanzniveau fest, z.B. p= 0,05. Ergibt sich ein p-Wert von kleiner als 0,05, dann ist die Nullhypothese mit einer ''Irrtumswahrscheinlichkeit'' von kleiner als 5 % zu verwerfen.
  
=== '''Parameter''' ===
+
==== '''Parameter''' ====
  
 
P. sind Kennzahlenn, welche eine Grundpopulation charakterisieren. Dazu zählen insbesonders die ''Lagemaße'' und die ''Streuungsmaße''. Da sie in der Regel für die Grundpopulation nicht bekannt sind, müssen sie auf der Basis von Stichproben hochgerechnet werden.
 
P. sind Kennzahlenn, welche eine Grundpopulation charakterisieren. Dazu zählen insbesonders die ''Lagemaße'' und die ''Streuungsmaße''. Da sie in der Regel für die Grundpopulation nicht bekannt sind, müssen sie auf der Basis von Stichproben hochgerechnet werden.
  
=== '''Parametrische Verfahren''' ===
+
==== '''Parametrische Verfahren''' ====
  
 
Unter p. V. versteht man statistische Tests, welche das Vorliegen einer bestimmten Verteilungsform mit den dafür typischen Parametern erfordern. Besonders häufig wird die Normalverteilung als Grundbedingung gesehen.
 
Unter p. V. versteht man statistische Tests, welche das Vorliegen einer bestimmten Verteilungsform mit den dafür typischen Parametern erfordern. Besonders häufig wird die Normalverteilung als Grundbedingung gesehen.
  
=== '''Partielle Korrelation''' (auch Partialkorrelation) ===
+
==== '''Partielle Korrelation''' (auch Partialkorrelation) ====
  
Eine P.K. ist das Ausmaß des Zusammenhangs (''Korrelation'') zwischen zwei Variablen, wobei gleichzeitig versucht wird, den Einfluss einer dritten Variablen auf diesen Zusammenhang herauszurechnen. Siehe auch: '''Scheinkorrelation und Störvariable[5]'''.
+
Eine P.K. ist das Ausmaß des Zusammenhangs (''Korrelation'') zwischen zwei Variablen, wobei gleichzeitig versucht wird, den Einfluss einer dritten Variablen auf diesen Zusammenhang herauszurechnen. Siehe auch: '''Scheinkorrelation und Störvariable[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5]]]'''.
  
=== '''Pearson’scher Korrelationskoeffizient''' ===
+
==== '''Pearson’scher Korrelationskoeffizient''' ====
  
 
Siehe ''Produkt-Moment-Korrelation''
 
Siehe ''Produkt-Moment-Korrelation''
  
=== '''Perzentil''' ===
+
==== '''Perzentil''' ====
  
 
Siehe ''Quantil''
 
Siehe ''Quantil''
  
=== '''Proportionalskala''' (auch Verhältnisskala) ===
+
==== '''Proportionalskala''' (auch Verhältnisskala) ====
  
 
Eine P. gehört zu den vier wesentlichen ''Messniveaus'' (''Messskalen'') und liegt dann vor, wenn bei numerischen Daten ein absoluter Nullpunkt vorliegt. Bei einer P. können nicht nur die Abstände zwischen Ausprägungen interpretiert werden, sondern auch ihr Verhältnis. So ist z.B. ein Baum von 3 Metern Höhe doppelt so hoch wie ein Baum von 1,5 Meter Höhe.
 
Eine P. gehört zu den vier wesentlichen ''Messniveaus'' (''Messskalen'') und liegt dann vor, wenn bei numerischen Daten ein absoluter Nullpunkt vorliegt. Bei einer P. können nicht nur die Abstände zwischen Ausprägungen interpretiert werden, sondern auch ihr Verhältnis. So ist z.B. ein Baum von 3 Metern Höhe doppelt so hoch wie ein Baum von 1,5 Meter Höhe.
  
=== '''Population''' ===
+
==== '''Population''' ====
  
 
Siehe ''Grundpopulation''
 
Siehe ''Grundpopulation''
  
=== '''Pretest''' ===
+
==== '''Pretest''' ====
  
 
Unter einem P. versteht man eine der Befragung der Stichprobe per Fragebogen vorausgehende Abtestung desselben durch Probeinterviews, um Schwächen im Vorfeld zu eliminieren. Man untersucht dabei z.B., ob die Fragen verständlich sind, wie sie interpretiert werden, ob alle Fragen zufriedenstellende Antworten bringen, ob die Befragten bereit sind, alle Fragen zu beantworten, ob die Befragten den Zeitaufwand für die Ausfüllung des Fragebogens akzeptieren etc.
 
Unter einem P. versteht man eine der Befragung der Stichprobe per Fragebogen vorausgehende Abtestung desselben durch Probeinterviews, um Schwächen im Vorfeld zu eliminieren. Man untersucht dabei z.B., ob die Fragen verständlich sind, wie sie interpretiert werden, ob alle Fragen zufriedenstellende Antworten bringen, ob die Befragten bereit sind, alle Fragen zu beantworten, ob die Befragten den Zeitaufwand für die Ausfüllung des Fragebogens akzeptieren etc.
  
=== '''Produkt-Moment-Korrelation''' (auch ''Pearson’scher Korrelationskoeffizient'') ===
+
==== '''Produkt-Moment-Korrelation''' (auch ''Pearson’scher Korrelationskoeffizient'') ====
  
Die ''P.M.''-''Korrelation'' ist eine Form der ''Korrelation'' und zeigt den Zusammenhang zwischen zwei standardisierten Variablen, die beide metrisch und normalverteilt sein müssen. Siehe auch: '''Maßkorrelation[6]'''.
+
Die ''P.M.''-''Korrelation'' ist eine Form der ''Korrelation'' und zeigt den Zusammenhang zwischen zwei standardisierten Variablen, die beide metrisch und normalverteilt sein müssen. Siehe auch: '''Maßkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6]]]'''.
  
=== '''Punktwolke''' ===
+
==== '''Punktwolke''' ====
  
 
siehe ''Streudiagramm''
 
siehe ''Streudiagramm''
Line 3,538: Line 4,005:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest<br />
+
[http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest &#91;1&#93; http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest]<br />
[2] http://de.wikipedia.org/wiki/Mann-Whitney-Test<br />
+
[http://de.wikipedia.org/wiki/Mann-Whitney-Test &#91;2&#93; http://de.wikipedia.org/wiki/Mann-Whitney-Test]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3] Siehe Kapitel 3.1.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3] Siehe Kapitel 3.1.2.2]]<br />
[4] http://de.wikipedia.org/wiki/Normalverteilung<br />
+
[http://de.wikipedia.org/wiki/Normalverteilung &#91;4&#93; http://de.wikipedia.org/wiki/Normalverteilung]<br />
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5] Siehe Kapitel 3.5.3.4.3]]<br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5] Siehe Kapitel 3.5.3.4.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6] Siehe Kapitel 3.5.3.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6] Siehe Kapitel 3.5.3.1]]<br />
 +
  
  
 
= 5.6 Q-R =
 
= 5.6 Q-R =
  
=== '''Quantitativ''' ===
+
==== '''Quantitativ''' ====
  
 
Eigenschaft, dass die Ausprägung von Elementen in Zahlen wiedergegeben werden kann, wobei eine größere Zahl auch eine größere Ausprägung impliziert.
 
Eigenschaft, dass die Ausprägung von Elementen in Zahlen wiedergegeben werden kann, wobei eine größere Zahl auch eine größere Ausprägung impliziert.
  
=== '''Quantil''' ===
+
==== '''Quantil''' ====
  
 
Unter Q. versteht man Orientierungspunkte einer statistischen Verteilung; sie dienen als ''Streuungsmaße'' zur Beschreibung der Verteilung. Dabei wird die Verteilung stets in gleich große Teile aufgeteilt. Bei vier gleichen Teilen spricht man von ''Quartilen'', bei fünf von ''Quintilen'', bei zehn von ''Dezilen'' und bei 100 von ''Perzentilen.'' Besonders gerne verwendet werden die ''Quartile''. Das erste Quartil gibt den Wert an, unterhalb desselben sich 25 % der Einträge befinden. Das zweite Quartil oder ''Median'' gibt den Wert an, unterhalb desselben sich 50 % der Einträge befinden usw.
 
Unter Q. versteht man Orientierungspunkte einer statistischen Verteilung; sie dienen als ''Streuungsmaße'' zur Beschreibung der Verteilung. Dabei wird die Verteilung stets in gleich große Teile aufgeteilt. Bei vier gleichen Teilen spricht man von ''Quartilen'', bei fünf von ''Quintilen'', bei zehn von ''Dezilen'' und bei 100 von ''Perzentilen.'' Besonders gerne verwendet werden die ''Quartile''. Das erste Quartil gibt den Wert an, unterhalb desselben sich 25 % der Einträge befinden. Das zweite Quartil oder ''Median'' gibt den Wert an, unterhalb desselben sich 50 % der Einträge befinden usw.
  
=== '''Quantifizierung''' ===
+
==== '''Quantifizierung''' ====
  
 
Unter Qu. versteht man die numerische Beschreibung von Merkmalsausprägungen einer Variablen auf Basis von Messungen oder Zählungen.
 
Unter Qu. versteht man die numerische Beschreibung von Merkmalsausprägungen einer Variablen auf Basis von Messungen oder Zählungen.
  
=== '''quantitativ''' ===
+
==== '''quantitativ''' ====
  
 
Ein Merkmal wird quantitativ genannt, wenn es sich (z.B. durch Messen), zahlenmäßig erfassen lässt. Quantitative Merkmale werden in ''diskrete'' und ''stetige'' Merkmale unterteilt.
 
Ein Merkmal wird quantitativ genannt, wenn es sich (z.B. durch Messen), zahlenmäßig erfassen lässt. Quantitative Merkmale werden in ''diskrete'' und ''stetige'' Merkmale unterteilt.
  
=== '''Quartil''' ===
+
==== '''Quartil''' ====
  
 
Siehe ''Quantil''
 
Siehe ''Quantil''
  
=== '''Quartilabstand''' ===
+
==== '''Quartilabstand''' ====
  
 
Siehe ''Interquartilabstand''
 
Siehe ''Interquartilabstand''
  
=== '''Range''' (auch Variationsweite, Spannweite) ===
+
==== '''Range''' (auch Variationsweite, Spannweite) ====
  
 
Unter R. versteht man den Abstand zwischen dem kleinsten und dem größten aufgetretenen Wert bei mindestens ordinalskalierten Daten. Die Range bei gemessenen Körpergrößen wäre demnach z.B. 2,18 m(größter Wert) - 1,54 m(kleinster Wert), also 64 cm.
 
Unter R. versteht man den Abstand zwischen dem kleinsten und dem größten aufgetretenen Wert bei mindestens ordinalskalierten Daten. Die Range bei gemessenen Körpergrößen wäre demnach z.B. 2,18 m(größter Wert) - 1,54 m(kleinster Wert), also 64 cm.
  
=== '''Rangkorrelation''' ===
+
==== '''Rangkorrelation''' ====
  
Form der Korrelation, bei welcher nicht die Merkmalsausprägungen, sondern deren ''Rangzahlen'' verwendet werden. Dabei werden im wesentlichen zwei Verfahren verwendet, ''Spearman´s Rho'' und ''Kendall’s Tau''. Siehe auch: '''die Korrelation[1]'''.
+
Form der Korrelation, bei welcher nicht die Merkmalsausprägungen, sondern deren ''Rangzahlen'' verwendet werden. Dabei werden im wesentlichen zwei Verfahren verwendet, ''Spearman´s Rho'' und ''Kendall’s Tau''. Siehe auch: '''die Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]'''.
  
=== '''Rangzahlen''' ===
+
==== '''Rangzahlen''' ====
  
 
Man erhält sie, wenn quantitative Daten größenmäßig geordnet werden und die geordneten Werte, mit 1 beginnend, fortlaufend nummeriert. Im Falle gleicher Ursprungsgröße müssen die Rangplätze gemittelt werden. Ein Beispiel: Die Punktezahl 12 tritt sowohl auf den Rangplätzen 13 wie 14 auf. Beide Rangplätze erhalten daher die gemittelte Rangzahl 13,5 (beide Zahlen addiert und durch die Anzahl der Werte, also 2, dividiert).
 
Man erhält sie, wenn quantitative Daten größenmäßig geordnet werden und die geordneten Werte, mit 1 beginnend, fortlaufend nummeriert. Im Falle gleicher Ursprungsgröße müssen die Rangplätze gemittelt werden. Ein Beispiel: Die Punktezahl 12 tritt sowohl auf den Rangplätzen 13 wie 14 auf. Beide Rangplätze erhalten daher die gemittelte Rangzahl 13,5 (beide Zahlen addiert und durch die Anzahl der Werte, also 2, dividiert).
  
=== '''Regression''' ===
+
==== '''Regression''' ====
  
Unter R. versteht man Verfahren, welche es erlauben, Werte einer anderen Variablen vorherzusagen, wenn der Wert einer bestimmten Variablen bekannt ist. Siehe auch: die '''Regression[2]'''.
+
Unter R. versteht man Verfahren, welche es erlauben, Werte einer anderen Variablen vorherzusagen, wenn der Wert einer bestimmten Variablen bekannt ist. Siehe auch: die '''Regression[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2]]]'''.
  
=== '''Relative Häufigkeit''' ===
+
==== '''Relative Häufigkeit''' ====
  
Während die ''absolute Häufigkeit'' einer Ausprägung anzeigt, wie oft dieser Wert insgesamt im Datensatz erscheint, gibt die r. H. an, wie hoch sein Anteil verglichen mit der Gesamtzahl der gültigen Einträge ist. Siehe auch: '''Häufigkeitstabelle[3]'''.
+
Während die ''absolute Häufigkeit'' einer Ausprägung anzeigt, wie oft dieser Wert insgesamt im Datensatz erscheint, gibt die r. H. an, wie hoch sein Anteil verglichen mit der Gesamtzahl der gültigen Einträge ist. Siehe auch: '''Häufigkeitstabelle[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3]]]'''.
  
=== '''Reliabiltität''' (auch Zuverlässigkeit) ===
+
==== '''Reliabiltität''' (auch Zuverlässigkeit) ====
  
 
R. ist eines der drei ''Gütekriterien'' bei ''Messungen.'' Dieses fordert, dass die Messinstrumente bei einer Wiederholung der Messung bei gleichbleibenden Bedingungen das gleiche Ergebnis erbringen sollten.
 
R. ist eines der drei ''Gütekriterien'' bei ''Messungen.'' Dieses fordert, dass die Messinstrumente bei einer Wiederholung der Messung bei gleichbleibenden Bedingungen das gleiche Ergebnis erbringen sollten.
  
Neben der Validität (Gültigkeit) das zweite zentrale Qualitätskriterium bei Messungen. Meint, dass Messinstrumente bei wiederholter Messung unter gleichen Bedingungen auch das gleiche Ergebnis produzieren müssen. Siehe auch: '''Reliabilität (Wikipedia)[4]'''.
+
Neben der Validität (Gültigkeit) das zweite zentrale Qualitätskriterium bei Messungen. Meint, dass Messinstrumente bei wiederholter Messung unter gleichen Bedingungen auch das gleiche Ergebnis produzieren müssen. Siehe auch: '''Reliabilität (Wikipedia)[http://de.wikipedia.org/wiki/Reliabilit%C3%A4t &#91;4&#93;]'''.
  
=== '''Repräsentativität''' ===
+
==== '''Repräsentativität''' ====
  
 
Unter R. versteht man, dass bei der Auswahl der Elemente der Stichprobe die Zusammensetzung der Grundpopulation nachgebildet wird. Wenn z.B. 2/3 der Zuwanderer aus Afrika in Österreich männlich sind, sollten dementsprechend auch 2/3 der Befragten in der Stichprobe männlich sein, will man den Bedingungen der Repräsentativität genügen.
 
Unter R. versteht man, dass bei der Auswahl der Elemente der Stichprobe die Zusammensetzung der Grundpopulation nachgebildet wird. Wenn z.B. 2/3 der Zuwanderer aus Afrika in Österreich männlich sind, sollten dementsprechend auch 2/3 der Befragten in der Stichprobe männlich sein, will man den Bedingungen der Repräsentativität genügen.
  
=== '''Robust''' ===
+
==== '''Robust''' ====
  
 
Bezeichnung für Verfahren, welche bezüglich vorhandener Ausreißer kaum empfindlich sind, wie z.B. der ''Median.''
 
Bezeichnung für Verfahren, welche bezüglich vorhandener Ausreißer kaum empfindlich sind, wie z.B. der ''Median.''
  
=== '''Rohdaten''' ===
+
==== '''Rohdaten''' ====
  
 
statistisch nicht veränderte Untersuchungsergebnisse, welche die ursprüngliche Merkmalsausprägung anzeigen (z.B. die Zahl der Punkte bei einem Eignungstest statt deren Umsetzung in Noten).
 
statistisch nicht veränderte Untersuchungsergebnisse, welche die ursprüngliche Merkmalsausprägung anzeigen (z.B. die Zahl der Punkte bei einem Eignungstest statt deren Umsetzung in Noten).
Line 3,616: Line 4,084:
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2] Siehe Kapitel 3.5.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2] Siehe Kapitel 3.5.4]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3] Siehe Kapitel 3.2.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3] Siehe Kapitel 3.2.2]]<br />
[4] http://de.wikipedia.org/wiki/Reliabilit%C3%A4t<br />
+
[http://de.wikipedia.org/wiki/Reliabilit%C3%A4t &#91;4&#93; http://de.wikipedia.org/wiki/Reliabilit%C3%A4t]<br />
 +
 
  
  
 
= 5.7 S-T =
 
= 5.7 S-T =
  
=== '''Säulendiagramm''' ===
+
==== '''Säulendiagramm''' ====
  
 
Siehe ''Balkendiagramm''.
 
Siehe ''Balkendiagramm''.
  
=== '''Schichtung''' ===
+
==== '''Schichtung''' ====
  
Unter Sch. versteht man eine Methode bei der Auswahl der Stichprobe. Die Grundpopulation wird in '''Schichten (Wikipedia)[1]''' zerlegt (in dieser gibt es z.B. 40 % Männer und 60 % Frauen; in dieser gibt es 26 % unter 25, 38 % zwischen 26- 50 und 36 % darüber). In der Stichprobe versucht man das Verhältnis dieser Schichten der Grundpopulation nachzubilden.
+
Unter Sch. versteht man eine Methode bei der Auswahl der Stichprobe. Die Grundpopulation wird in '''Schichten (Wikipedia)[http://de.wikipedia.org/wiki/Soziale_Schichtung &#91;1&#93;]''' zerlegt (in dieser gibt es z.B. 40 % Männer und 60 % Frauen; in dieser gibt es 26 % unter 25, 38 % zwischen 26- 50 und 36 % darüber). In der Stichprobe versucht man das Verhältnis dieser Schichten der Grundpopulation nachzubilden.
  
=== '''Schließende Statistik''' ===
+
==== '''Schließende Statistik''' ====
  
 
s. ''Analytische Statistik''
 
s. ''Analytische Statistik''
  
=== '''Selektion''' ===
+
==== '''Selektion''' ====
  
 
Bei der Selektion schränkt man die Grundgesamtheit, für die eine bestimmte Hypothese geprüft werden soll, auf eine Teilgesamtheit von Beobachtungseinheiten ein.
 
Bei der Selektion schränkt man die Grundgesamtheit, für die eine bestimmte Hypothese geprüft werden soll, auf eine Teilgesamtheit von Beobachtungseinheiten ein.
  
=== '''Signifikanz''' ===
+
==== '''Signifikanz''' ====
  
Unter S. versteht man ein statistisch überprüftes Urteil über die Haltbarkeit einer ''Hypothese''. Da man nur selten eine ''Vollerhebung'' machen kann, ist ein Ergebnis einer Stichprobe stets vom Risiko begleitet, dass es vom Ergebnis der Grundpopulation abweichen könnte. Man überprüft daher die Wahrscheinlichkeit, dass ein gefundenes Ergebnis rein zufällig entstanden sein könnte. Als Maßstäbe nimmt man sogenannte ''Signifikanzniveaus,'' meist von 5 % oder p=0,05 oder 1 % oder p=0,01. Unterschreitet die erhaltene Wahrscheinlichkeit den letzten Wert, so könnte eine statische Aussage lauten: "Der Zusammenhang zwischen den Variablen A und B ist statistisch signifkant auf dem 1%-Niveau." Ein wichtiger Test zur Abschätzung der Signifikanz der Zusammenhänge in Kreuztabellen ist z.B. der ''Chi- Quadrat- Test.'' Siehe auch: '''Statistische Signifikanz (Wikipedia)[2]'''.
+
Unter S. versteht man ein statistisch überprüftes Urteil über die Haltbarkeit einer ''Hypothese''. Da man nur selten eine ''Vollerhebung'' machen kann, ist ein Ergebnis einer Stichprobe stets vom Risiko begleitet, dass es vom Ergebnis der Grundpopulation abweichen könnte. Man überprüft daher die Wahrscheinlichkeit, dass ein gefundenes Ergebnis rein zufällig entstanden sein könnte. Als Maßstäbe nimmt man sogenannte ''Signifikanzniveaus,'' meist von 5 % oder p=0,05 oder 1 % oder p=0,01. Unterschreitet die erhaltene Wahrscheinlichkeit den letzten Wert, so könnte eine statische Aussage lauten: "Der Zusammenhang zwischen den Variablen A und B ist statistisch signifkant auf dem 1%-Niveau." Ein wichtiger Test zur Abschätzung der Signifikanz der Zusammenhänge in Kreuztabellen ist z.B. der ''Chi- Quadrat- Test.'' Siehe auch: '''Statistische Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;2&#93;]'''.
  
=== '''Signifianzniveau''' ===
+
==== '''Signifianzniveau''' ====
  
 
Das Signifikanzniveau ist synonym für die obere Grenze der Irrtumswahrscheinlichkeit eines statistischen Tests.
 
Das Signifikanzniveau ist synonym für die obere Grenze der Irrtumswahrscheinlichkeit eines statistischen Tests.
Line 3,647: Line 4,116:
 
Siehe auch ''Signifikanz''
 
Siehe auch ''Signifikanz''
  
=== '''Skala''' ===
+
==== '''Skala''' ====
  
 
S. (ital. Treppe) bezeichnet eine Folge von Positionen, die unterschiedliche Ausprägungsgrade eines Merkmals anzeigen (z.B. die Temperatur eines Körpers in Celsius, Lieblingszeitschriften durch die Angabe des jeweiligen Titels etc.). Siehe ''Messniveau''.
 
S. (ital. Treppe) bezeichnet eine Folge von Positionen, die unterschiedliche Ausprägungsgrade eines Merkmals anzeigen (z.B. die Temperatur eines Körpers in Celsius, Lieblingszeitschriften durch die Angabe des jeweiligen Titels etc.). Siehe ''Messniveau''.
  
=== '''Skalenniveau''' ===
+
==== '''Skalenniveau''' ====
  
 
siehe ''Messniveau''
 
siehe ''Messniveau''
  
=== '''Spannweite''' ===
+
==== '''Spannweite''' ====
  
 
Siehe ''Range''.
 
Siehe ''Range''.
  
=== '''Spearman’s Rho''' (oder ''Spearmans Korrelationskoeffizient'') ===
+
==== '''Spearman’s Rho''' (oder ''Spearmans Korrelationskoeffizient'') ====
  
Falls zwei Merkmale ordinal verteilt sind, kann man den Rangkorrelationskoeffizienten R (oder ''Spearmans Rho)'' mithilfe einer ''Produkt- Moment-Korrelation'' der Rangplätze berechnen. Siehe auch: '''Rangkorrelation[3]''' .
+
Falls zwei Merkmale ordinal verteilt sind, kann man den Rangkorrelationskoeffizienten R (oder ''Spearmans Rho)'' mithilfe einer ''Produkt- Moment-Korrelation'' der Rangplätze berechnen. Siehe auch: '''Rangkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3]]]''' .
  
=== '''Stabdiagramm''' ===
+
==== '''Stabdiagramm''' ====
  
 
Siehe ''Balkendiagramm.''
 
Siehe ''Balkendiagramm.''
  
=== '''Standardabweichung''' ===
+
==== '''Standardabweichung''' ====
  
Die St. ''s'' ist ein Kennwert, um die Variabilität (Streuung) eines Merkmals zu kennzeichnen. Sie wird als Wurzel aus der ''Varianz'' erreichnet. In einer Normalverteilung liegen im Bereich des ''Arithmetischen Mittels'' ± ''s'' ungefähr 68 % aller Ergebnisse. Siehe auch: '''Standardabweichung (Wikipedia)[4]'''.
+
Die St. ''s'' ist ein Kennwert, um die Variabilität (Streuung) eines Merkmals zu kennzeichnen. Sie wird als Wurzel aus der ''Varianz'' erreichnet. In einer Normalverteilung liegen im Bereich des ''Arithmetischen Mittels'' ± ''s'' ungefähr 68 % aller Ergebnisse. Siehe auch: '''Standardabweichung (Wikipedia)[http://de.wikipedia.org/wiki/Standardabweichung &#91;4&#93;]'''.
  
=== '''Standardisiertes Interview''' ===
+
==== '''Standardisiertes Interview''' ====
  
 
Das st. I. ist eine Interviewform, bei welcher alle Details der Befragung (was soll man wie fragen, wie soll man reagieren, welche Zusatzinformationen darf man liefern etc.) genau festgelegt wurden, um den Einfluss der InterviewerInnen möglichst gering zu halten.
 
Das st. I. ist eine Interviewform, bei welcher alle Details der Befragung (was soll man wie fragen, wie soll man reagieren, welche Zusatzinformationen darf man liefern etc.) genau festgelegt wurden, um den Einfluss der InterviewerInnen möglichst gering zu halten.
  
=== '''stetig''' ===
+
==== '''stetig''' ====
  
 
Ein quantitatives Merkmal wird st. genannt, wenn es alle Werte innerhalb eines Intervalls annehmen kann. So kann z.B. eine Körpergröße beliebig fein gemessen werden, in cm, in mm und bei Kleinstlebewesen sogar noch deutlich darunter. ''Diskrete Variable'' hingegen können nur bestimmte und abzählbare Werte einnehmen (Beispiel Würfel).
 
Ein quantitatives Merkmal wird st. genannt, wenn es alle Werte innerhalb eines Intervalls annehmen kann. So kann z.B. eine Körpergröße beliebig fein gemessen werden, in cm, in mm und bei Kleinstlebewesen sogar noch deutlich darunter. ''Diskrete Variable'' hingegen können nur bestimmte und abzählbare Werte einnehmen (Beispiel Würfel).
  
=== '''Stichprobe''' ===
+
==== '''Stichprobe''' ====
  
 
Unter einer St. versteht man die Auswahl an Beobachtungseinheiten aus einer definierten (''Grund)Population''. Eine Stichprobe sollte diese Grundpopulation unverzerrt wiederspiegeln, z.B. durch das Modell der ''Repräsentativität''.
 
Unter einer St. versteht man die Auswahl an Beobachtungseinheiten aus einer definierten (''Grund)Population''. Eine Stichprobe sollte diese Grundpopulation unverzerrt wiederspiegeln, z.B. durch das Modell der ''Repräsentativität''.
  
=== '''Störvariable''' (oder ''Störgrößen'') ===
+
==== '''Störvariable''' (oder ''Störgrößen'') ====
  
 
Unter ''Störvariablen'' versteht man Variable, welche zusätzlich zu einer unabhängigen Variablen einen nicht einkalkulierten Einfluss auf eine abhängige Variable ausüben. Untersucht man z.B. den Zusammenhang zwischen Glatzenbildung und Einkommen, so wird man häufig auf eine höhere Korrelation kommen. Diese hängt mit einer nicht untersuchten Störvariable zusammen, nämlich dem Alter, mit dem sowohl Glatzenbildung wie auch Einkommen normalerweise hoch korrelieren.
 
Unter ''Störvariablen'' versteht man Variable, welche zusätzlich zu einer unabhängigen Variablen einen nicht einkalkulierten Einfluss auf eine abhängige Variable ausüben. Untersucht man z.B. den Zusammenhang zwischen Glatzenbildung und Einkommen, so wird man häufig auf eine höhere Korrelation kommen. Diese hängt mit einer nicht untersuchten Störvariable zusammen, nämlich dem Alter, mit dem sowohl Glatzenbildung wie auch Einkommen normalerweise hoch korrelieren.
Line 3,689: Line 4,158:
 
Die Existenz von Störvariablen ist besonders bei der Untersuchung von Korrelationen kritisch zu untersuchen.
 
Die Existenz von Störvariablen ist besonders bei der Untersuchung von Korrelationen kritisch zu untersuchen.
  
=== '''Streudiagramm''' (auch ''Scatterplot'') ===
+
==== '''Streudiagramm''' (auch ''Scatterplot'') ====
  
 
Ein St. zeigt graphisch den Zusammenhang zwischen zwei stetigen Merkmalen, wobei eine ''Punktwolke'' aus den Schnittpunkten der jeweiligen Ausprägungen der Variablen X und Y gebildet wird. ''Streudiagramme'' bieten eine gute Abschätzmöglichkeit für mögliche ''Korrelationen''.
 
Ein St. zeigt graphisch den Zusammenhang zwischen zwei stetigen Merkmalen, wobei eine ''Punktwolke'' aus den Schnittpunkten der jeweiligen Ausprägungen der Variablen X und Y gebildet wird. ''Streudiagramme'' bieten eine gute Abschätzmöglichkeit für mögliche ''Korrelationen''.
  
=== '''Streuungsmaße''' (auch Dispersionsmaße) ===
+
==== '''Streuungsmaße''' (auch Dispersionsmaße) ====
  
 
Streuungsmaße geben an, in welchen Bereichen die Daten liegen bzw. um die Lagemaße ''streuen''. Sie sind Kennwerte zur Charakterisierung einer Verteilung. Sie sind Indikatioren für die Variabilität von Merkmalen, wie z.B. von deren Abstand zum ''Arithmetischen Mittel''. Wichtige Streuungsmaße sind die ''Standardabweichung,'' die ''Varianz'' oder der ''Quartilabstand.''
 
Streuungsmaße geben an, in welchen Bereichen die Daten liegen bzw. um die Lagemaße ''streuen''. Sie sind Kennwerte zur Charakterisierung einer Verteilung. Sie sind Indikatioren für die Variabilität von Merkmalen, wie z.B. von deren Abstand zum ''Arithmetischen Mittel''. Wichtige Streuungsmaße sind die ''Standardabweichung,'' die ''Varianz'' oder der ''Quartilabstand.''
  
=== '''Tau''' (auch Kendall’s Tau) ===
+
==== '''Tau''' (auch Kendall’s Tau) ====
  
Form der Korrelation. Maß für den Zusammenhang zwischen ordinalskalierten Daten, besonders bei kleinen Zahlen. Siehe auch: '''Rangkorrelation Tau[5]'''.
+
Form der Korrelation. Maß für den Zusammenhang zwischen ordinalskalierten Daten, besonders bei kleinen Zahlen. Siehe auch: '''Rangkorrelation Tau[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5]]]'''.
  
=== '''Tortendiagramm''' ===
+
==== '''Tortendiagramm''' ====
  
 
Siehe ''Kreisdiagramm''
 
Siehe ''Kreisdiagramm''
Line 3,708: Line 4,177:
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://de.wikipedia.org/wiki/Soziale_Schichtung<br />
+
[http://de.wikipedia.org/wiki/Soziale_Schichtung &#91;1&#93; http://de.wikipedia.org/wiki/Soziale_Schichtung]<br />
[2] http://de.wikipedia.org/wiki/Statistische_Signifikanz<br />
+
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;2&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3] Siehe Kapitel 3.5.3.2]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3] Siehe Kapitel 3.5.3.2]]<br />
[4] http://de.wikipedia.org/wiki/Standardabweichung<br />
+
[http://de.wikipedia.org/wiki/Standardabweichung &#91;4&#93; http://de.wikipedia.org/wiki/Standardabweichung]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5] Siehe Kapitel 3.5.3.3]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5] Siehe Kapitel 3.5.3.3]]<br />
 +
  
  
 
= 5.8 U-Z =
 
= 5.8 U-Z =
  
=== '''unabhängig''' ===
+
==== '''unabhängig''' ====
  
 
Eine Variable ist ''unabhängig'', wenn sie in einer Untersuchung variiert werden kann, um ihre Auswirkungen auf eine abhängige Variable zu erfassen (z.B. Menge von Düngemitteln: unabhängige Variable, Ernte-Ergebnis: abhängige Variable).
 
Eine Variable ist ''unabhängig'', wenn sie in einer Untersuchung variiert werden kann, um ihre Auswirkungen auf eine abhängige Variable zu erfassen (z.B. Menge von Düngemitteln: unabhängige Variable, Ernte-Ergebnis: abhängige Variable).
  
=== '''univariat''' ===
+
==== '''univariat''' ====
  
 
Als u. werden Methoden und Kennzahlen bezeichnet, die sich auf eine einzige Variable beziehen.
 
Als u. werden Methoden und Kennzahlen bezeichnet, die sich auf eine einzige Variable beziehen.
  
=== '''Urliste''' ===
+
==== '''Urliste''' ====
  
Die U. ist die ungeordnete Zusammenstellung des Datenmaterials. Siehe auch: '''Listen und Tafeln[1]'''.
+
Die U. ist die ungeordnete Zusammenstellung des Datenmaterials. Siehe auch: '''Listen und Tafeln[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1]]]'''.
  
=== '''Validität''' (auch Gültigkeit) ===
+
==== '''Validität''' (auch Gültigkeit) ====
  
Die V. gehört zu den sogenannten ''Gütekriterien'' für die Qualität einer Datenerhebung. Sie bezeichnet die Eigenschaft, wirklich das zu messen, was bei der Untersuchung gemessen werden soll. Wenn z.B. die Fragen eines Fragebogens nur ungenügend geeignet sind, die Hypothesen zu überprüfen, dann ist die Validität in Frage gestellt. Siehe auch: '''Validität (Wikipedia)[2]'''.
+
Die V. gehört zu den sogenannten ''Gütekriterien'' für die Qualität einer Datenerhebung. Sie bezeichnet die Eigenschaft, wirklich das zu messen, was bei der Untersuchung gemessen werden soll. Wenn z.B. die Fragen eines Fragebogens nur ungenügend geeignet sind, die Hypothesen zu überprüfen, dann ist die Validität in Frage gestellt. Siehe auch: '''Validität (Wikipedia)[http://de.wikipedia.org/wiki/Validit%C3%A4t &#91;2&#93;]'''.
  
=== '''Variable''' ===
+
==== '''Variable''' ====
  
 
Eine Variable ist ein in verschiedenen Ausprägungen vorhandenes Merkmal eines Untersuchungsgegenstandes: z.B. Geschlecht: männlich/weiblich; Größe gemessen in cm.
 
Eine Variable ist ein in verschiedenen Ausprägungen vorhandenes Merkmal eines Untersuchungsgegenstandes: z.B. Geschlecht: männlich/weiblich; Größe gemessen in cm.
  
=== '''Variationsweite''' (siehe Range). ===
+
==== '''Variationsweite''' (siehe Range). ====
  
=== '''Varianz''' ===
+
==== '''Varianz''' ====
  
Die V. ist ein Maß für die Variabilität bzw. die Streuung der Ausprägungen von Variablen und Ausgangswert für die ''Standardabweichung''. Siehe auch: '''Varianz (Wikipedia)[3]'''.
+
Die V. ist ein Maß für die Variabilität bzw. die Streuung der Ausprägungen von Variablen und Ausgangswert für die ''Standardabweichung''. Siehe auch: '''Varianz (Wikipedia)[http://de.wikipedia.org/wiki/Varianz &#91;3&#93;]'''.
  
=== '''Verhältnisskala''' ===
+
==== '''Verhältnisskala''' ====
  
 
Siehe ''Proportionalskala''
 
Siehe ''Proportionalskala''
  
=== '''Verteilung''' ===
+
==== '''Verteilung''' ====
  
 
Siehe ''Häufigkeitsverteilung''
 
Siehe ''Häufigkeitsverteilung''
  
=== '''Vertrauensintervall''' (auch ''Konfidenzintervall'') ===
+
==== '''Vertrauensintervall''' (auch ''Konfidenzintervall'') ====
  
 
Siehe ''Konfidenzintervall''
 
Siehe ''Konfidenzintervall''
  
=== '''Vierfeldertafel''' (Form der ''Kreuztabelle'') ===
+
==== '''Vierfeldertafel''' (Form der ''Kreuztabelle'') ====
  
 
Eine V. ist die Anordnung zweier dichotomer Variablen in einer Tabelle mit zwei Spalten und zwei Zeilen, sodass jede Ausprägung jeder Variablen mit jeder Ausprägung der anderen gekreuzt wird.
 
Eine V. ist die Anordnung zweier dichotomer Variablen in einer Tabelle mit zwei Spalten und zwei Zeilen, sodass jede Ausprägung jeder Variablen mit jeder Ausprägung der anderen gekreuzt wird.
  
=== '''Vollerhebung''' ===
+
==== '''Vollerhebung''' ====
  
 
Eine V. liegt vor, wenn alle Elemente einer Grundpopulation befragt werden und nicht nur eine Auswahl (eine ''Stichprobe'') derselben. Eine V. ist dementsprechend nur bei einer kleineren Grundpopulation möglich.
 
Eine V. liegt vor, wenn alle Elemente einer Grundpopulation befragt werden und nicht nur eine Auswahl (eine ''Stichprobe'') derselben. Eine V. ist dementsprechend nur bei einer kleineren Grundpopulation möglich.
  
=== '''Wahrscheinlichkeit''' ===
+
==== '''Wahrscheinlichkeit''' ====
  
Unter W. versteht man die Einstufung von Phänomenen nach dem Grade ihrer Gewissheit. Die W. ''p'' wird mit Werten zwischen ''0'' (Unmöglichkeit) und ''1'' (Sicherheit des Auftretens) wiedergegeben. Siehe auch: '''Wahrscheinlichkeit (Wikipedia)[4]'''.
+
Unter W. versteht man die Einstufung von Phänomenen nach dem Grade ihrer Gewissheit. Die W. ''p'' wird mit Werten zwischen ''0'' (Unmöglichkeit) und ''1'' (Sicherheit des Auftretens) wiedergegeben. Siehe auch: '''Wahrscheinlichkeit (Wikipedia)[http://de.wikipedia.org/wiki/Wahrscheinlichkeit &#91;4&#93;]'''.
  
=== '''Zentralwert''' ===
+
==== '''Zentralwert''' ====
  
 
Siehe ''Median''
 
Siehe ''Median''
  
=== '''Zusammenhang''' ===
+
==== '''Zusammenhang''' ====
  
 
Mit einem Z. bezeichnet man, dass zwischen den Ausprägungen zweier Variablen eine systematische Entsprechung besteht. Siehe ''Korrelation.''
 
Mit einem Z. bezeichnet man, dass zwischen den Ausprägungen zweier Variablen eine systematische Entsprechung besteht. Siehe ''Korrelation.''
  
=== '''Zweiseitige Hypothese''' ===
+
==== '''Zweiseitige Hypothese''' ====
  
 
Bei einer z. H. nimmt man an, dass zwischen zwei Variablen oder zwischen zwei Teilgruppen ein Zusammenhang besteht. Man nimmt jedoch nicht von vornherein an, dass dieser Zusammenhang nur in einer bestimmten Richtung besteht. Beispiel: Die Annahme ist, dass sich das Wetter auf die Arbeitslust auswirkt, wobei man nicht von vornherein einschränkt, ob ein schöneres Wetter zu einer größeren Arbeitslust oder zu einer geringeren führen wird. Bei der ''einseitigen H.'' würde nur eine Richtung untersucht werden: Sorgt schöneres Wetter für eine größere Arbeitslust?
 
Bei einer z. H. nimmt man an, dass zwischen zwei Variablen oder zwischen zwei Teilgruppen ein Zusammenhang besteht. Man nimmt jedoch nicht von vornherein an, dass dieser Zusammenhang nur in einer bestimmten Richtung besteht. Beispiel: Die Annahme ist, dass sich das Wetter auf die Arbeitslust auswirkt, wobei man nicht von vornherein einschränkt, ob ein schöneres Wetter zu einer größeren Arbeitslust oder zu einer geringeren führen wird. Bei der ''einseitigen H.'' würde nur eine Richtung untersucht werden: Sorgt schöneres Wetter für eine größere Arbeitslust?
Line 3,783: Line 4,253:
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1] Siehe Kapitel 3.2.1]]<br />
 
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1] Siehe Kapitel 3.2.1]]<br />
[2] http://de.wikipedia.org/wiki/Validit%C3%A4t<br />
+
[http://de.wikipedia.org/wiki/Validit%C3%A4t &#91;2&#93; http://de.wikipedia.org/wiki/Validit%C3%A4t]<br />
[3] http://de.wikipedia.org/wiki/Varianz<br />
+
[http://de.wikipedia.org/wiki/Varianz &#91;3&#93; http://de.wikipedia.org/wiki/Varianz]<br />
[4] http://de.wikipedia.org/wiki/Wahrscheinlichkeit<br />
+
[http://de.wikipedia.org/wiki/Wahrscheinlichkeit &#91;4&#93; http://de.wikipedia.org/wiki/Wahrscheinlichkeit]<br />
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#5. Lexikon statistischer Grundbegriffe|&uarr; Nach oben]]
  
  
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
= 6. Literatur, Ressourcen und Links =
 
= 6. Literatur, Ressourcen und Links =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
 
In diesem Bereich finden Sie Hinweise auf hochwertige Nachschlagswerke zu den angeschnittenen Bereichen sowie eine Selektion von Weblinks.
 
In diesem Bereich finden Sie Hinweise auf hochwertige Nachschlagswerke zu den angeschnittenen Bereichen sowie eine Selektion von Weblinks.
 +
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.1 Quantitative Forschungsmethoden|6.1 Quantitative Forschungsmethoden]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.2 Fragebogen-Abfrage|6.2 Fragebogen-Abfrage]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.3 Diagramme und Grafiken|6.3 Diagramme und Grafiken]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.3 Methoden|6.3 Methoden]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.4 Repräsentativität|6.4 Repräsentativität]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.5 Statistik-Software|6.5 Statistik-Software]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.6 Terminologie|6.6 Terminologie]]<br />
 +
[[Literatur_Ressourcen_und_Links#6.7 Statistik-Quellen|6.7 Statistik-Quellen]]<br />
 +
</div>
  
  
Line 3,815: Line 4,312:
 
Zöfel, Peter. 2003. Statistik für Wirtschaftswissenschaftler. Pearson Studium, München.
 
Zöfel, Peter. 2003. Statistik für Wirtschaftswissenschaftler. Pearson Studium, München.
  
=== '''Weblinks:''' ===
+
==== '''Weblinks:''' ====
  
'''Basis-Statistik (FAES)[1]''', 05.02.2007.
+
'''Basis-Statistik (FAES)[http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html &#91;1&#93;]''', 05.02.2007.
  
'''HyperStat Online[2]''', 05.02.2007.
+
'''HyperStat Online[http://davidmlane.com/hyperstat/ &#91;2&#93;]''', 05.02.2007.
  
'''Help with Statistics (University of Leicester)[3]''', 21.11.2019.
+
'''Help with Statistics (University of Leicester)[https://www2.le.ac.uk/offices/ld/help-with/stats &#91;3&#93;]''', 21.11.2019.
  
Kromrey, Helmut. 1994. '''Empirische Sozialforschung[4]''', 21.11.2019.
+
Kromrey, Helmut. 1994. '''Empirische Sozialforschung[https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330 &#91;4&#93;]''', 21.11.2019.
  
Lohninger, H. '''Grundlagen der Statistik[5]''', 05.02.2007.
+
Lohninger, H. '''Grundlagen der Statistik[http://www.statistics4u.info/fundstat_germ/index_a.html &#91;5&#93;]''', 05.02.2007.
  
Neuwirth, Erich. 1997. '''Statistik für StatistikerInnen,[6]''' 05.02.2007.
+
Neuwirth, Erich. 1997. '''Statistik für StatistikerInnen,[http://tud.at/uni/stat1.htm &#91;6&#93;]''' 05.02.2007.
  
Rost, Jürgen. 2003. '''Zeitgeist und Moden empirischer Sozialforschung[7]'''. In Forum Qualitative Sozialforschung 4/2, 05.02.2007.
+
Rost, Jürgen. 2003. '''Zeitgeist und Moden empirischer Sozialforschung[http://www.qualitative-research.net/index.php/fqs/article/view/723 &#91;7&#93;]'''. In Forum Qualitative Sozialforschung 4/2, 05.02.2007.
  
'''Wahrscheinlichkeitstheorie und Statistik (Uni Osnabrück)[8]''', 21.11.2019.
+
'''Wahrscheinlichkeitstheorie und Statistik (Uni Osnabrück)[https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf &#91;8&#93;]''', 21.11.2019.
  
'''TU-Graz Statistik-Grundkurs[9]''', 05.02.2007.
+
'''TU-Graz Statistik-Grundkurs[http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm &#91;9&#93;]''', 05.02.2007.
  
<!-- https://de.serlo.org/mathe -->
+
--><!-- https://de.serlo.org/mathe --><!--
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html<br />
+
[http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html &#91;1&#93; http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html]<br />
[2] http://davidmlane.com/hyperstat/<br />
+
[http://davidmlane.com/hyperstat/ &#91;2&#93; http://davidmlane.com/hyperstat/]<br />
[3] https://www2.le.ac.uk/offices/ld/help-with/stats<br />
+
[https://www2.le.ac.uk/offices/ld/help-with/stats &#91;3&#93; https://www2.le.ac.uk/offices/ld/help-with/stats]<br />
[4] https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330<br />
+
[https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330 &#91;4&#93; https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330]<br />
[5] http://www.statistics4u.info/fundstat_germ/index_a.html<br />
+
[http://www.statistics4u.info/fundstat_germ/index_a.html &#91;5&#93; http://www.statistics4u.info/fundstat_germ/index_a.html]<br />
[6] http://tud.at/uni/stat1.htm<br />
+
[http://tud.at/uni/stat1.htm &#91;6&#93; http://tud.at/uni/stat1.htm]<br />
[7] http://www.qualitative-research.net/index.php/fqs/article/view/723<br />
+
[http://www.qualitative-research.net/index.php/fqs/article/view/723 &#91;7&#93; http://www.qualitative-research.net/index.php/fqs/article/view/723]<br />
[8] https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf<br />
+
[https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf &#91;8&#93; https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf]<br />
[9] http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm<br />
+
[http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm &#91;9&#93; http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm]<br />
 +
 
  
  
 
= 6.2 Fragebogen-Abfrage =
 
= 6.2 Fragebogen-Abfrage =
  
=== '''Bücher:''' ===
+
==== '''Bücher:''' ====
  
 
Allerbeck, K. & W. Hoag. 1985. Zur Methodik der Umfragen. Frankfurt am Main, Johann Wolfgang von Goethe- Universität.
 
Allerbeck, K. & W. Hoag. 1985. Zur Methodik der Umfragen. Frankfurt am Main, Johann Wolfgang von Goethe- Universität.
Line 3,861: Line 4,359:
 
Sudman, S. & N.M. Bradburn 1983. Asking Questions. San Francisco, Jossey-Bass.
 
Sudman, S. & N.M. Bradburn 1983. Asking Questions. San Francisco, Jossey-Bass.
  
=== '''Weblinks:''' ===
+
==== '''Weblinks:''' ====
  
Michael Vonrüden. 2002. '''Internetbasierte Umfragen[1]'''. (PDF-Dokument), 05.02.2007.
+
Michael Vonrüden. 2002. '''Internetbasierte Umfragen[http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf &#91;1&#93;]'''. (PDF-Dokument), 05.02.2007.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf<br />
+
[http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf &#91;1&#93; http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf]<br />
 +
 
  
  
 
= 6.3 Methoden =
 
= 6.3 Methoden =
  
=== '''Korrelation und Regression''' ===
+
==== '''Korrelation und Regression''' ====
  
Die '''Korrelation[1]''' von Merkmalen. (PDF-Dokument), 05.02.2007.
+
Die '''Korrelation[http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf &#91;1&#93;]''' von Merkmalen. (PDF-Dokument), 05.02.2007.
  
Jörg '''Kovarianz und Korrelation[2]'''. In Psychologie-Seiten.de, 21.11.2019
+
Jörg '''Kovarianz und Korrelation[https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html &#91;2&#93;]'''. In Psychologie-Seiten.de, 21.11.2019
  
=== '''Verschiedene Methoden''' ===
+
==== '''Verschiedene Methoden''' ====
  
Berger, Klaus. Materialen für '''Mathe-Online[3]''', 05.02.2007.
+
Berger, Klaus. Materialen für '''Mathe-Online[http://www.mathe-online.at/materialien/klaus.berger/ &#91;3&#93;]''', 05.02.2007.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf<br />
+
[http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf &#91;1&#93; http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf]<br />
[2] https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html<br />
+
[https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html &#91;2&#93; https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html]<br />
[3] http://www.mathe-online.at/materialien/klaus.berger/<br />
+
[http://www.mathe-online.at/materialien/klaus.berger/ &#91;3&#93; http://www.mathe-online.at/materialien/klaus.berger/]<br />
 +
 
  
  
 
= 6.4 Repräsentativität =
 
= 6.4 Repräsentativität =
  
Höpflinger, François. 2011. '''Standardisierte Erhebungen - methodische Hinweise zu Umfragen[1]''', 21.11.2019.
+
Höpflinger, François. 2011. '''Standardisierte Erhebungen - methodische Hinweise zu Umfragen[http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf &#91;1&#93;]''', 21.11.2019.
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1]http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf<br />
+
[http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf &#91;1&#93; http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf]<br />
 +
 
  
  
 
= 6.5 Statistik-Software =
 
= 6.5 Statistik-Software =
  
=== '''Bücher:''' ===
+
==== '''Bücher:''' ====
  
 
Bühl, Achim. 2006. SPSS 14. Einführung in die moderne Datenanalyse. Pearson Studium, München.
 
Bühl, Achim. 2006. SPSS 14. Einführung in die moderne Datenanalyse. Pearson Studium, München.
Line 3,908: Line 4,409:
 
Wittenberg R. & Cramer Hans. 2003. Datenanalyse mit SPSS für Windows. UTB, Stuttgart.
 
Wittenberg R. & Cramer Hans. 2003. Datenanalyse mit SPSS für Windows. UTB, Stuttgart.
  
=== '''Links:''' ===
+
==== '''Links:''' ====
  
Ludwig-Mayerhofer, Wolfgang. '''Internet Guide to SPSS for Windows[1]''', 21.11.2019
+
Ludwig-Mayerhofer, Wolfgang. '''Internet Guide to SPSS for Windows[http://wlm.userweb.mwn.de/SPSS/ &#91;1&#93;]''', 21.11.2019
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://wlm.userweb.mwn.de/SPSS/<br />
+
[http://wlm.userweb.mwn.de/SPSS/ &#91;1&#93; http://wlm.userweb.mwn.de/SPSS/]<br />
 +
 
  
 
= 6.6 Terminologie =
 
= 6.6 Terminologie =
  
=== '''Links zur Terminologie quantitativer Forschungsmethoden''' ===
+
==== '''Links zur Terminologie quantitativer Forschungsmethoden''' ====
  
FAES.DE. '''Basislexikon[1]''', 05.02.2007.
+
FAES.DE. '''Basislexikon[http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html &#91;1&#93;]''', 05.02.2007.
  
Lernstats. '''Glossar[2]''', 05.02.2007.
+
Lernstats. '''Glossar[http://www.lernstats.de/php/glossar.php?lang=de& &#91;2&#93;]''', 05.02.2007.
  
Ludwig-Mayerhofer, Wolfgang. '''Internet Lexikon der Empirischen Sozialforschung[3]''', 21.11.2019
+
Ludwig-Mayerhofer, Wolfgang. '''Internet Lexikon der Empirischen Sozialforschung[http://wlm.userweb.mwn.de/Ilmes/ &#91;3&#93;]''', 21.11.2019
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html<br />
+
[http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html &#91;1&#93; http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html]<br />
[2] http://www.lernstats.de/php/glossar.php?lang=de&<br />
+
[http://www.lernstats.de/php/glossar.php?lang=de& &#91;2&#93; http://www.lernstats.de/php/glossar.php?lang=de&]<br />
[3] http://wlm.userweb.mwn.de/Ilmes/<br />
+
[http://wlm.userweb.mwn.de/Ilmes/ &#91;3&#93; http://wlm.userweb.mwn.de/Ilmes/]<br />
 +
 
  
  
Line 3,938: Line 4,441:
 
Hier finden Sie die Webseiten verschiedener Institutionen, die laufend Statistiken erstellen:
 
Hier finden Sie die Webseiten verschiedener Institutionen, die laufend Statistiken erstellen:
  
'''Statistik-Austria[1]''', 05.02.2007.
+
'''Statistik-Austria[http://www.statistik.at/ &#91;1&#93;]''', 05.02.2007.
  
'''Eurostat - Statistikamt der Europäischen Union[2]''', 16.11.2009.
+
'''Eurostat - Statistikamt der Europäischen Union[https://ec.europa.eu/eurostat &#91;2&#93;]''', 16.11.2009.
  
'''Statistiken der Stadt Wien[3]''', 05.02.2007.
+
'''Statistiken der Stadt Wien[http://www.wien.gv.at/statistik/ &#91;3&#93;]''', 05.02.2007.
  
'''United Nations Statistics Division[4]''', 05.02.2007.
+
'''United Nations Statistics Division[https://unstats.un.org/home/ &#91;4&#93;]''', 05.02.2007.
  
'''World Bank Data[5]''', 05.02.2007.
+
'''World Bank Data[https://data.worldbank.org/ &#91;5&#93;]''', 05.02.2007.
  
'''FAO Statistics[6]''', 19.01.2010.
+
'''FAO Statistics[http://www.fao.org/faostat/en/ &#91;6&#93;]''', 19.01.2010.
  
'''UNDP - Human Development Report[7]''', 16.11.2009.
+
'''UNDP - Human Development Report[http://hdr.undp.org/en/data &#91;7&#93;]''', 16.11.2009.
  
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[1] http://www.statistik.at/<br />
+
[http://www.statistik.at/ &#91;1&#93; http://www.statistik.at/]<br />
[2] https://ec.europa.eu/eurostat<br />
+
[https://ec.europa.eu/eurostat &#91;2&#93; https://ec.europa.eu/eurostat]<br />
[3] http://www.wien.gv.at/statistik/<br />
+
[http://www.wien.gv.at/statistik/ &#91;3&#93; http://www.wien.gv.at/statistik/]<br />
[4] https://unstats.un.org/home/<br />
+
[https://unstats.un.org/home/ &#91;4&#93; https://unstats.un.org/home/]<br />
[5] https://data.worldbank.org/<br />
+
[https://data.worldbank.org/ &#91;5&#93; https://data.worldbank.org/]<br />
[6] www.fao.org/faostat/en/#home<br />
+
[http://www.fao.org/faostat/en/ &#91;6&#93; http://www.fao.org/faostat/en/]<br />
[7] http://hdr.undp.org/en/data<br />
+
[http://hdr.undp.org/en/data &#91;7&#93; http://hdr.undp.org/en/data]<br />
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|&uarr; Nach oben]]
 +
-->

Latest revision as of 14:30, 24 September 2020

↵ Zurück zur Hauptseite

Grundlagen statistischer Auswertungsverfahren

verfasst von Erwin Ebermann
Quanti Logo.gif

Kapitel dieser Lernunterlage

1. Funktion und Sinn von Statistik
2. Von der Fragestellung zur statistischen Analyse
3. Ausgewählte statistische Grundlagen und Analysemethoden
4. Software für quantitative Forschungsprojekte
5. Lexikon statistischer Grundbegriffe
6. Literatur, Ressourcen und Links

Kapitelübersicht

1. Funktion und Sinn von Statistik

1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?
1.2 Formen der Statistik
1.2.1 Deskriptive Statistik
1.2.2 Analytische Statistik
1.3 Wahrscheinlichkeiten, nicht Gewissheit
1.3.1 Schwankungsbreiten und Konfidenzintervalle
1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau

2. Von der Fragestellung zur statistischen Analyse

2.1 Die Grundpopulation: worüber wir Aussagen machen
2.1.1 Die Stichprobe (Sample)
2.1.2 Teil- oder Vollerhebung?
2.1.3 Die Ziehung (Auswahl) der Stichprobe
2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)
2.1.3.1.1 Proportional geschichtete Stichproben
2.1.3.1.2 Disproportional geschichtete Stichproben
2.1.3.1.3 Laufende Kontrolle der Schichtung
2.1.3.2 Zufallsstichproben
2.1.3.2.1 Einfache Zufallsstichprobe
2.1.3.2.2 Systematische Zufallsstichprobe
2.1.3.2.3 Geschichtete Zufallsstichprobe
2.1.3.3 Willkürliches Auswahlverfahren
2.1.3.4 Klumpenstichproben
2.1.4 Repräsentativität
2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?
2.2 Die Operationalisierung
2.2.1 Die Suche nach Indikatoren
2.2.2 Das Messen
2.2.2.1 Messfehler
2.2.3 Vom Fragebogen zum Codeplan
2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix
2.2.3.2 Umcodierung mit SPSS
2.2.3.3 Automatische Rückcodierung mit SPSS
2.3 Gütekriterien quantitativer Untersuchungen
2.4 Fehlerquellen bei statistischer Arbeit
2.4.1 Fehler erster und zweiter Art
2.4.2 Fehlerhafte oder mangelnde Daten
2.4.2.1 Eingabefehler
2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS
2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel
2.4.2.2 Doppelte Datensätze
2.4.2.3 Fehlende Einträge
2.4.2.3.1 Behandlung fehlender Daten mit SPSS

3. Ausgewählte statistische Grundlagen und Analysemethoden

3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden
3.1.1 Arten von Messwerten (Daten)
3.1.1.1 Metrische und nichtmetrische Variablen
3.1.1.2 Stetige und diskrete Variablen
3.1.2 Skalenniveaus
3.1.2.1 Skalierungsniveaus bildlich erklärt
3.1.2.2 Nominalskalierung
3.1.2.3 Ordinalskalierung
3.1.2.4 Intervallskalierung
3.1.2.5 Proportionalskalierung
3.1.2.6 Skalierungstypen, Aussagen und Methoden
3.1.3 Verteilungen
3.1.3.1 Normalverteilung
3.1.3.2 Andere Verteilungsformen
3.1.3.3 Test auf Normalverteilung
3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm
3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test
3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS
3.2 Die Ermittlung von Häufigkeiten
3.2.1 Liste und Tafeln
3.2.2 Häufigkeitstabelle
3.2.2.1 Häufigkeitsberechnung mit SPSS
3.2.2.2 Grafische Darstellung mit SPSS
3.2.3 Klassenbildung (Gruppierung) von Daten
3.2.3.1 Gruppierung mit SPSS
3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS
3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz
3.3.1 Modalwert
3.3.2 Arithmetisches Mittel
3.3.3 Median
3.3.3.1 Median bei gruppierten Daten
3.3.4 Geometrisches Mittel
3.3.5 Harmonisches Mittel
3.3.5.1 Harmonisches Mittel mit SPSS
3.3.6 Wann welche Lagemaße?
3.3.7 Berechnung von Lagemaßen mit SPSS
3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’
3.4.1 Varianz
3.4.2 Standardabweichung
3.4.3 Perzentile
3.4.3.1 Quartile
3.4.3.1.1 Die Ermittlung von Quartilen
3.4.4 Berechnung von Streuungsmaßen mit SPSS
3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots
3.4.5.1 Erstellung von Boxplots mit SPSS
3.5 Der Zusammenhang zwischen Variablen
3.5.1 Optische Erkennung von Zusammenhängen
3.5.2 Kreuztabellen-Analyse
3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS
3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test
3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS
3.5.3 Die Korrelation
3.5.3.1 Maßkorrelation
3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS
3.5.3.2 Rangkorrelation R (Krueger-Spearman)
3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS
3.5.3.3 Rangkorrelation Tau (Kendall)
3.5.3.3.1 Berechnung von TAU mit SPSS
3.5.3.4 Aussagekraft einer Korrelation
3.5.3.4.1 Wann sind Korrelationen bemerkenswert?
3.5.3.4.2 Verdeckte Korrelation
3.5.3.4.3 Scheinkorrelationen und Störvariable
3.5.3.4.3.1 Partielle Korrelation mit SPSS
3.5.3.4.4 Signifikanz der Korrelation
3.5.3.4.4.1 Signifikanz mit SPSS
3.5.3.5 Kovarianz
3.5.4 Regression
3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression
3.5.4.2 Grafische Darstellung der Regression
3.6 Die grafische Darstellung statistischer Ergebnisse
3.6.1 Arten von Diagrammen
3.6.1.1 Kreisdiagramme
3.6.1.2 Liniendiagramme
3.6.1.3 Balkendiagramme
3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS
3.6.1.4 Kartogramme
3.6.1.5 Histogramme
3.6.1.6 Streudiagramme
3.6.2 Welches Diagramm für welche Daten?
3.6.3 Notwendige Begleitinformationen von Diagrammen

4. Software für quantitative Forschungsprojekte

4.1 Was kann Excel?
4.1.1 Statistische Analysen mit Excel
4.1.2 Grafische Aufbereitung von Daten mit Excel
4.2 Was kann MS Access?
4.3 Profi-Programme: SPSS und Statistica
4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS
4.5 Umcodierung

5. Lexikon statistischer Grundbegriffe

5.1 A-C
5.2 D-F
5.3 G-I
5.4 J-M
5.5 N-P
5.6 Q-R
5.7 S-T
5.8 U-Z

6. Literatur, Ressourcen und Links

6.1 Quantitative Forschungsmethoden
6.2 Fragebogen-Abfrage
6.3 Diagramme und Grafiken
6.3 Methoden
6.4 Repräsentativität
6.5 Statistik-Software
6.6 Terminologie
6.7 Statistik-Quellen