Difference between revisions of "Grundlagen Statistischer Auswertungsverfahren"

From Eksa
Jump to: navigation, search
(Created page with "<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="...")
 
m (Protected "Grundlagen Statistischer Auswertungsverfahren" ([Edit=Allow only administrators] (indefinite) [Move=Allow only administrators] (indefinite)) [cascading])
 
(60 intermediate revisions by the same user not shown)
Line 1: Line 1:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+
[[Main_Page|'''&crarr; Zurück zur Hauptseite''']]
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de">
+
= Grundlagen statistischer Auswertungsverfahren =
<head>
+
<sup>verfasst von Erwin Ebermann</sup>[[File:Quanti_Logo.gif|right]]
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />
+
 
<title>quantitative - Grundlagen statistischer Auswertungsverfahren</title>
+
=== Kapitel dieser Lernunterlage ===
<script type="text/javascript">
+
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
==Kapitelübersicht==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
:[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]<br />
 +
:[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
::[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
:[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|2.3 Gütekriterien quantitativer Untersuchungen]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
:[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
::::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
:::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
::[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
:[[Software_für_quantitative_Forschungsprojekte#4.1 Was kann Excel?|4.1 Was kann Excel?]]<br />
 +
::[[Software_für_quantitative_Forschungsprojekte#4.1.1 Statistische Analysen mit Excel|4.1.1 Statistische Analysen mit Excel]]<br />
 +
::[[Software_für_quantitative_Forschungsprojekte#4.1.2 Grafische Aufbereitung von Daten mit Excel|4.1.2 Grafische Aufbereitung von Daten mit Excel]]<br />
 +
:[[Software_für_quantitative_Forschungsprojekte#4.2 Was kann MS Access?|4.2 Was kann MS Access?]]<br />
 +
:[[Software_für_quantitative_Forschungsprojekte#4.3 Profi-Programme: SPSS und Statistica|4.3 Profi-Programme: SPSS und Statistica]]<br />
 +
:[[Software_für_quantitative_Forschungsprojekte#4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS|4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS]]<br />
 +
:[[Software_für_quantitative_Forschungsprojekte#4.5 Umcodierung|4.5 Umcodierung]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.1 A-C|5.1 A-C]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.2 D-F|5.2 D-F]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.3 G-I|5.3 G-I]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.4 J-M|5.4 J-M]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.5 N-P|5.5 N-P]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.6 Q-R|5.6 Q-R]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.7 S-T|5.7 S-T]]<br />
 +
:[[Lexikon_statistischer_Grundbegriffe#5.8 U-Z|5.8 U-Z]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.1 Quantitative Forschungsmethoden|6.1 Quantitative Forschungsmethoden]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.2 Fragebogen-Abfrage|6.2 Fragebogen-Abfrage]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.3 Diagramme und Grafiken|6.3 Diagramme und Grafiken]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.3 Methoden|6.3 Methoden]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.4 Repräsentativität|6.4 Repräsentativität]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.5 Statistik-Software|6.5 Statistik-Software]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.6 Terminologie|6.6 Terminologie]]<br />
 +
:[[Literatur_Ressourcen_und_Links#6.7 Statistik-Quellen|6.7 Statistik-Quellen]]<br />
 +
</div>
 +
 
 +
 
 
<!--
 
<!--
if (document.layers)
+
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
document.write('\<link rel="stylesheet" type="text/css" href="style/quantitative-simple.css" />');
+
 
//fuer Netscape 4
+
= 1. Funktion und Sinn von Statistik =
//-->
+
<sup>verfasst von Erwin Ebermann</sup>
</script>
+
 
<style type="text/css">
+
==== Weitverbreitete Scheu vor statistischen Methoden ====
<!--
+
 
@import url("style/quantitative.css");
+
Was bringt Statistik, was bringen quantitative Forschungsmethoden? Viele Menschen stehen ihnen skeptisch gegenüber und dies teilweise leider zurecht. Allzuleicht kann mit Statistiken Unfug getrieben werden und nicht immer sind die BetrachterInnen statistisch aufbereiteter Daten genügend geschult, um bewusste Verzerrungen zu erkennen. Richtig verwendet jedoch, ist die Statistik ein unverzichtbares Hilfsmittel, um - losgelöst von der subjektiven Wahrnehmung - die Systematik von Tendenzen und Zusammenhängen in verschiedensten Lebensbereichen aufzeigen zu können.
@import url("style/erweitert.css");
+
 
@import url("style/druck.css") print, embossed;
+
==== Statistik in der Alltagserfahrung ====
@import url("style/pocketcomputer.css") handheld;
+
 
-->
+
Ob wir wollen oder nicht, auch wenn wir niemals etwas von Statistik gehört haben, so wenden wir dennoch meist unreflektiert und unsystematisch Methoden an, welche statistischen Verfahren ähneln. D.h. wir versuchen, von einem begrenzten Erfahrungsschatz auf allgemeine Sachverhalte zu schließen. Jede Erfahrung, die wir machen, beeinflusst mit einer gewissen Wahrscheinlichkeit unsere zukünftigen Handlungs- und Denkweisen. Wir vermeiden vielleicht den Kontakt mit bestimmten Gruppen der Gesellschaft, weil sie uns wenig kooperativ erscheinen; wir fällen aufgrund einzelner Geschehnisse verallgemeinernde Urteile über Bekannte, dass sie diese oder jene Eigenschaft aufweisen, über Menschen, welche in der Öffentlichkeit stehen, über den öffentlichen Verkehr:
</style>
+
 
</head>
+
Ilse ist äußerst hilfsbereit!<br />
<body>
+
Mit Georg kann man darüber nicht sprechen!<br />
<a name="top"></a>  
+
Die 5er-Linie kommt immer verspätet!<br />
<center>
+
Immer wenn das Wochenende kommt, regnet es!
<div id="wrapper">
+
 
<a name="top"></a>
+
Alle diese Aussagen basieren auf dem in der Statistik gängigen Vorgang, von einer begrenzten Erfahrung bzw. von einem begrenzten Datenschatz auf alle möglichen Erfahrungen bzw. Daten hochzurechnen, wobei wir bei diesen Aussagen jedoch wichtige Grundprinzipien der Statistik nicht berücksichtigen. Diese ’unbewussten’ Anwendungen statistischer Prinzipien ähneln den Versuchen von Couchpotatoes, die Fussballkünste eines Ronaldinho in der Praxis nachzuvollziehen.
<div id="content">
+
 
<table border="0" width="800" cellpadding="10">
+
==== Häufige Fehler bei der ’unbewussten’ Verwendung statistischer Methoden ====
<tr><td align="left" valign="top"><img src="style/logo.gif" width="100" height="100" alt="Logo" /></td>
+
 
<td valign="top"><h1>Grundlagen statistischer Auswertungsverfahren</h1>
+
Wir möchten mit diesen Aussagen ausdrücken, dass bestimmte Grundtendenzen vorkommen, dass diese systematisch sind. Aber sind sie das? Haben wir die Rahmbendingungen genügend beachtet? Ist Georg vielleicht nur mir gegenüber nicht gesprächsbereit? Gilt Ilse vielleicht allen anderen gegenüber als schroff und unkooperativ? Kommt die 5er-Linie nur zu bestimmten Tageszeiten, an welchen gerade ich sie immer benutze, zu spät und zu anderen Zeitpunkten pünktlich? Nehme ich schlechtes Wetter unter der Woche gar nicht wahr, weil ich mich im Büro befinde? Stimmt mein eigener Eindruck oder beharre ich auf meinem allerersten und möchte neue Erfahrungen nicht wahrnehmen?
<h2></h2>
+
 
Quelle: http://www.univie.ac.at/ksa/elearning/cp/quantitative/quantitative-titel.html<br />
+
==== Statistik muss mit Sorgfalt eingesetzt werden ====
Erwin Ebermann<br />
+
 
Institut für Kultur- und Sozialanthropologie<br />
+
Die Statistik gibt uns Methoden in die Hand, Vorurteile kritischer zu beleuchten und die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1]]]''' scheinbaren Wissens zu beurteilen, falls sie mit Verantwortungsbewusstsein und Sorgfalt verwendet werden. Sie ist besonders dann von großer Bedeutung, wenn wir - losgelöst von singulären Ereignissen oder Elementen - allgemeine Aussagen machen möchten. Sie ist dementsprechend kein Gegensatz zu '''qualitativen Forschungsmethoden''', sondern eine unverzichtbare '''Ergänzung[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[2]]]''' zu diesen.
</td></tr>
+
 
</table>
+
'''Verweise:'''<br />
<p />
+
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1] Siehe Kapitel 1.3]]<br />
<hr />
+
[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[2] Siehe Kapitel 5.1.3 der Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br/>
<h1>Kapitelübersicht</h1>
+
 
 +
==Inhaltsverzeichnisübersicht==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
</div>
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|Nächstes Kapitel: 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]'''
 +
----
 +
[[#1. Funktion und Sinn von Statistik|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|Vorheriges Kapitel: 1. Funktion und Sinn von Statistik]]'''
 +
= 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung? =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
'''Quantitative''' und '''qualitative Forschungsmethoden''' haben unterschiedliche Potentiale und Möglichkeiten und sind dementsprechend kein Gegensatz, sondern ergänzen sich gegenseitig.
 +
 
 +
==== Häufig Misstrauen gegenüber Statistik in Geistes- und Kulturwissenschaften ====
 +
 
 +
In den Wissenschaften vom Menschen, wie z.B. der Sozial- und Kulturanthropologie, sind '''qualitative Forschungsmethoden[[Qualitative_Methoden_der_Kultur-_und_Sozialanthropologie|[1]]]''' meist deutlich populärer als quantitative. Es mutet zu nüchtern an, zu festschreibend, zu klischeehaft, Menschen durch eine Reihe von meist kurzen Indikatoren '''beschreiben[[Grundlagen des wissenschaftlichen Schreibens/Wissenschaftlicher Text|[2]]]''' zu wollen. GestaltpsychologInnen würden formulieren: "Das Ganze ist mehr als die Summe seiner Einzelteile."
 +
 
 +
==== Zur Tiefe benötigt man qualitative Ansätze ====
 +
 
 +
Und sie haben in Vielem zweifellos recht. Wir benötigen in der Regel '''qualitative Methoden''', um feingewobene Motivforschung zu betreiben, um versteckte Aspirationen, Einstellungen, Eigenheiten zum Vorschein zu bringen. Wie könnte ein kurzer Fragebogen von einer halben Stunde Dauer das gleiche Wissen über die gleiche Person zum Vorschein bringen wie eine Befragung über mehrere Tage, die noch dazu weitgehend dem Rythmus des/der Befragten folgt? Das geht nicht. Und ginge es nur um die Befragung und Eigenheiten einzelner Individuen, etwa um eine Biographie, benötigen wir die '''Quantitativen Forschungsmethoden''' eigentlich gar nicht.
 +
 
 +
==== Von der Tiefe zur Breite ====
 +
 
 +
Nehmen wir nun aber an, jemand hätte mit großer Sensiblität und Mühe aus zehn Personen sehr viel zum Vorschein gebracht, an Ängsten, Erwarungshaltungen, biographischen Daten, an Erfahrungen, Einstellungen usw. Nehmen wir an, alle zehn Befragten wären AfrikanerInnen gewesen. Könnten wir ihm/ihr nun die Frage stellen, uns zu sagen, wo AfrikanerInnen Elemente des Lebens anders wahrnehmen, anders reagieren, anders geprägt sind? Er/Sie könnte mit einem rein qualitativen Ansatz darauf keine Antwort geben. Er/Sie könnte nur antworten: "Die meisten der befragten zehn Personen sind wegen der Suche nach Arbeit nach Österreich gekommen. Die Hälfte von ihnen empfindet ein größeres Maß von Einsamkeit etc." Jede Aussage über Tendenzen der größeren Gruppe, zu der die Befragten gehören, wäre vermessen. Wie soll man wissen, ob die zehn Befragten nicht vielleicht die einzigen in der afrikanischen Community sind, die bestimmte Eigenschaften aufweisen, vielleicht auch die einzigen, welche überhaupt bereit sind, mit den weißen ForscherInnen darüber zu sprechen?
 +
 
 +
==== Qualitative und quantitative Methoden ergänzen und erfordern einander ====
 +
 
 +
An dieser Stelle werden quantitative Forschungsmethoden als '''Ergänzung[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[3]]]''' zu den qualitativen unverzichtbar. Beim quantitativen Untersuchungsansatz würde man mit geeigneten Methoden versuchen, die '''Befragten[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4]]]''' bereits so auszuwählen, dass sie in den wesentlichen Bereichen ein realistisches Abbild der hier lebenden afrikanischen Community bilden.
 +
 
 +
==== Tiefe durch qualitative, Breite durch quantitative Methoden ====
 +
 
 +
Quantitative Forschungsmethoden folgen oft qualitativen. Qualitative Untersuchungen liefern hochinteressante Informationen über Menschen, die zu einer bestimmten Berufsgruppe, Region oder Kultur gehören. In von Oralliteratur geprägten Regionen werden z.B. viele Bereiche einer häufigeren Neuinterpretation unterliegen, da mit der schriftlichen Fixierung oft auch eine erhöhte Stabilisierung eines Sachverhalts einhergeht. Zu Randbereichen mag es daher eine Fülle von Interpretationen geben. So mag ein Informant Gedanken äußern, welche erstaunliche Ähnlichkeit mit Reinkarnationsphilosophien anderer Weltgegenden aufweisen. Nun wird es - falls es ums Weltbild der betreffenden Kultur geht - wichtig sein, zu klären, ob nur diese Person oder die ganze Gesellschaft an das Phänomen der Reinkarnation glaubt. Nun könnte man mit einer kleinen quantitativen Erhebung, bei der die verschiedenen Gruppen der Gesellschaft befragt werden, schnell herausfinden, ob für diese Vorstellung die Biographie des Individuums (wie z.B. auf Reisen durch Kontakt mit anderen Völkern erworben), die Prägung einer Kaste innerhalb des Volkes oder die Prägung der ganzen Bevölkerung verantwortlich ist. Und dann könnte man eine allgemeinere Aussage über diesen Sachverhalt machen: "In diesem Volk glauben nur die Älteren an die Reinkarnation, die Jüngeren haben vorwiegend das christliche oder islamische Modell übernommen etc.".
 +
 
 +
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Qualitative_Methoden_der_Kultur-_und_Sozialanthropologie|[1] Siehe die Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br />
 +
[[Grundlagen des wissenschaftlichen Schreibens/Wissenschaftlicher Text|[2] Siehe Kapitel 1.1 der Lernunterlage ''Das Verfassen Wissenschaftlicher Arbeiten'']]<br/>
 +
[[Der_Prozess_der_Datenerhebung/Strategien#5.1.3 Methodentriangulation|[3] Siehe Kapitel 5.1.3 der Lernunterlage ''Qualitative Methoden der Kultur- und Sozialanthropologie'']]<br/>
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[4] Siehe Kapitel 2.1]]<br />
 +
 
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Nächstes Kapitel: 1.2 Formen der Statistik]]'''
 +
----
 +
[[#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Funktion_und_Sinn_von_Statistik/Methodenvielfalt#1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?|Vorheriges Kapitel: 1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?]]'''
 +
= 1.2 Formen der Statistik =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Man unterscheidet im wesentlichen zwei verschiedene Formen der Statistik:
 +
 
 +
* die '''deskriptive Statistik''', bei der mit einfachen Maßzahlen und Grafiken Wesentliches über einen Untersuchungsgegenstand ausgedrückt werden soll, sowie
 +
* die '''schließende oder analystische Statistik''', die sich im wesentlichen die Frage stellt, inwieweit das Gemessene als Abbild der Realität geeignet ist.
 +
 
 +
==== Vergleich anhand der Einkommenssituation in Bangladesh ====
 +
 
 +
Nehmen wir an, wir untersuchen die Einkommensituation in zwei benachbarten Dörfern in Bangladesh. Wir stellen in den beiden Dörfern ein bestimmtes Durchschnittseinkommen fest und drücken dies in einer Maßzahl aus, z.B. dem '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''' oder dem '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]'''. Mittels eines '''Balkendiagramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3]]]''' zeigen wir auch optisch, dass das Durchschnitseinkommen von Dorf A höher ist als das von Dorf B. Bisher sind wir immer noch im Bereich der '''deskriptiven Statistik''' geblieben.
 +
 
 +
Wenn wir uns nun allerdings die Frage stellen, ob der von uns festgestellte Einkommensunterschied zwischen den beiden Dörfern zufälliger Natur oder '''hoch signifikant[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4]]]''' ist, dann geraten wir mit den entsprechenden Methoden (z.B. dem '''T-Test (Wikipedia)[http://de.wikipedia.org/wiki/T-Test &#91;5&#93;]''') in den Bereich der '''schließenden Statistik'''.
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1] Siehe Kapitel 3.3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3] Siehe Kapitel 3.6.1.3]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[4] Siehe Kapitel 1.3.2]]<br />
 +
[http://de.wikipedia.org/wiki/T-Test &#91;5&#93; http://de.wikipedia.org/wiki/T-Test]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|1.2 Formen der Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|1.2.1 Deskriptive Statistik]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|1.2.2 Analytische Statistik]]<br />
 +
</div>
 +
 
 +
== 1.2.1 Deskriptive Statistik ==
 +
 
 +
Die '''deskriptive Statistik''' hat zum Ziel, die wesentlichen Eigenheiten eines Untersuchungsgegenstandes zusammenzufassen und in wenigen Maßzahlen bzw. Diagrammen klar und verständlich zu beschreiben.
 +
 
 +
Die Aussagen der '''deskriptiven Statistik''' beziehen sich dabei immer nur auf die untersuchte Stichprobe. Die Darstellungsformen liegen in Maßzahlen, in '''Grafiken[1]''' und Tabellen. Häufige Maßzahlen der deskriptiven Statistik sind z.B. '''Mittelwerte[2]''' oder die '''Streuung einer Stichprobe[3]''' oder deren grafische Entsprechungen in Form z.B. von '''Kreis- oder Stabdiagrammen[4]'''.
 +
 
 +
==== '''Beispiel: Vergleichende Dorfstudien in Mali''' ====
 +
 
 +
Wir untersuchen zwei Siedlungen in Mali in Westafrika. Wir befragen jeweils 50 Personen aus den beiden Siedlungen zu Einschätzungen eines in der Gegend lebenden Volkes. Wir halten nüchtern fest, wie diese Einschätzungen ausfallen. Wir können dann z.B. angeben, dass das rinderzüchtende Volk der Fulbe in Nkorongoji relativ negativ betrachtet wird, in der Stadt Kita hingegen eher positiv. Das sind nüchterne Beschreibungen = Deskriptionen.
 +
 
 +
Bei der '''deskriptiven Statistik''' untersuchen wir nicht, ob diese Unterschiede der Einschätzungen der Fulbe möglicherweise zufälliger Natur sein könnten (weil die '''Stichproben[5]''' zu klein waren; die Einschätzungsabstände zu klein; weil wir durch viel Pech trotz sorgfältiger Auswahl der Befragten im Ort Nkorongoji gerade an die Personengruppen geraten sind, welche aus historischen Gründen Fulbe negativ gegenüber stehen, während die Mehrheit eher positiv denkt usw.). Die Untersuchung der '''Wahrscheinlichkeit[6]''' der Unterschiede gehört zur Analytischen Statistik.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3] Siehe Kapitel 3.4]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|[4] Siehe Kapitel 3.6.1]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[5] Siehe Kapitel 2.1.1]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[6] Siehe Kapitel 1.3]]<br />
 +
 
 +
 
 +
== 1.2.2 Analytische Statistik ==
 +
 
 +
Die '''analytische''' (auch '''schließende''' oder '''deduktive[[Arten_des_Schlussfolgerns#2.2 Deduktives Schlussfolgern|[1]]]''' genannt) '''Statistik''' beschäftigt sich im Wesentlichen mit der Frage der Zufälligkeit statistisch gemessener Phänomene. So stellt man sich die Frage, inwieweit ein in einer Stichprobe gemessener '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2]]]''' vom Mittelwert der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3]]]''' '''abweichen[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|[4]]]''' könnte; man stellt sich bei verschiedenen '''Stichproben''' die Frage, ob sie angesichts ihrer gemessenen Unterschiede noch zur gleichen '''Grundgesamtheit''' gehören können u.a. Hier wird also versucht, die untersuchte Stichprobe in einem größeren Ganzen einzuordnen, wobei auch der Untersuchung der '''Wahrscheinlichkeit''' von '''Zusammenhängen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|[5]]]''' bzw. Differenzen breiter Raum eingeräumt wird.
 +
 
 +
==== '''Beispiel 1: Sind Unterschiede (über-)zufällig?''' ====
 +
 
 +
In einem Ort A findet man bei 50 Befragten ein Durchschnittseinkommen von € 1300 ermittelt, im Ort B bei einer gleich großen '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[6]]]''' ein Durchschnittseinkommen von € 1765. Mit Methoden der '''analytischen Statistik''' könnten wir herausfinden, ob der Einkommensunterschied zwischen diesen beiden Stichproben die Verallgemeinerung erlaubt, dass die Bevölkerungen der beiden Orte tatsächlich unterschiedlich gut verdienen oder ob der gemessene Unterschied '''rein zufälliger Natur[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7]]]''' sein könnte (weil die Befragten sich trotz aller Sorgfalt bei ihrer Auswahl gerade an diesem Punkt von ihren MitbewohnerInnen unterscheiden).
 +
 
 +
==== '''Beispiel 2: Ist ein gemessenes Ergebnis noch ’normal’?''' ====
 +
 
 +
Normalerweise sollten beim Roulette-Spiel in einem längeren Untersuchungszeitraum alle 37 Zahlen etwa gleich häufig auftreten. In einem Spielcasino kamen im Untersuchungszeitraum am Roulette-Tisch verschiedene Zahlen deutlich häufiger als andere vor. Mit den geeigneten (analytischen) Methoden der '''Wahrscheinlichkeitsrechnung''' ermittelt man, ob der Roulette-Tisch möglicherweise einseitig so beschaffen oder abgenützt ist, dass man wahrscheinlich auf Dauer mit unterschiedlichen Häufigkeiten rechnen muss oder ob die gemessenen Ergebnisse rein zufälliger Natur waren.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Arten_des_Schlussfolgerns#2.2 Deduktives Schlussfolgern|[1] Siehe Kapitel 2.2 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[3] Siehe Kapitel 2.1]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|[4] Siehe Kapitel 1.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|[5] Siehe Kapitel 3.5]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[6] Siehe Kapitel 2.1.1]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[7] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
<br />
 +
'''[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|Nächstes Kapitel: 1.3 Wahrscheinlichkeiten, nicht Gewissheit]]'''
 +
----
 +
[[#1.2 Formen der Statistik|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Vorheriges Kapitel: 1.2 Formen der Statistik]]'''
 +
= 1.3 Wahrscheinlichkeiten, nicht Gewissheit =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
==== '''(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.''' ====
 +
 
 +
In der Statistik beschreiben und analysieren wir meist '''Stichproben[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''', also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgfältig zusammengesetzte Stichprobe in wesentlichen Parametern von der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' unterscheidet, sie also nicht wiederspiegelt.
 +
 
 +
Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpräferenzen befragen, dann kann es sein, dass die Beliebtheit der SPÖ bei ihnen deutlich anders ausfällt als bei der Grundgesamtheit, auch wenn aus der Schichtung der '''Stichprobe''' keinerlei tendenziöse Verteilung der Personen ersichtlich war.
 +
 
 +
==== '''Konfidenzintervalle''' ====
 +
 
 +
Besonders in der analytischen Statistik gibt man daher '''Konfidenzintervalle''' bzw. '''Schwankungsbreiten''' an, innerhalb derer sich ein wahrer Wert bewegen soll, d.h. der vermutete Wert in der '''Grundpopulation'''. '''Die Breite der Konfidenzintervalle hängt von der Größe der Stichprobe, deren relativer Größe im Verhältnis zur Grundpopulation sowie von der gewählten Irrtumswahrscheinlichkeit ab.'''
 +
 
 +
==== '''Beispiel Hochrechnung am Wahlsonntag:''' ====
 +
 
 +
Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1] Siehe Kapitel 2.1.1]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
 +
</div>
 +
 
 +
== 1.3.1 Schwankungsbreiten und Konfidenzintervalle ==
 +
 
 +
Unter '''Schwankungsbreite''' bzw. '''Konfidenzintervall''' versteht man einen Bereich, innerhalb dessen eine Merkmalsausprägung für die Grundpopulation bei einer festgesetzten Irrtumswahrscheinlichkeit angenommen wird, wobei der für die Schätzung verwendete Ausgangswert aus einer Stichprobe ermittelt wurde.
 +
 
 +
Die '''Schwankungsbreite''' oder das '''Konfidenzintervall''' hängen von folgenden Faktoren ab:<br />
 +
a. dem gewählten Signifikanzniveau (je signifikanter, dester größer die Schwankungsbreite);<br />
 +
b. dem größenmäßigen Verhältnis zwischen '''Stichprobe''' und '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' (je größer der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
 +
c. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' (je kleiner, desto größer ist die Schwankungsbreite)
 +
 
 +
'''Beispiel zu Punkt b am Wahlabend:'''<br />
 +
Während die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgezählten Stimmen die Schwankungsbreite der Stimmen für Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgezählt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).
 +
 
 +
Siehe auch '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93;]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
 +
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
 +
 
 +
 
 +
== 1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau ==
 +
 
 +
Unter der Irrtumswahrscheinlichkeit p versteht man die zahlenmäßig ausgedrückte Wahrscheinlichkeit, dass sich ein Ergebnis einer statistischen Analyse substantiell vom tatsächlichen Ergebnis der Grundpopulation unterscheidet.
 +
 
 +
In der Statistik arbeitet man meist mit den drei folgenden '''Signifikanzniveaus''' oder -grenzen:
 +
 
 +
p ≤ 0,05: '''signifikant''' (Irrtumswahrscheinlichkeit kleiner als 5 %)
 +
 
 +
p ≤ 0,01: '''sehr signifikant''' (Irrrtumswahrscheinlichkeit kleiner als 1 %)
 +
 
 +
p ≤ 0,001: '''höchst signifikant''' (Irrtumswahrscheinlichkeit kleiner als 1 ‰)
 +
 
 +
Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer '''Irrtumswahrscheinlichkeit''' von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller Fälle das tatsächliche Endergebnis außerhalb dieses Bereiches liegen wird.
 +
 
 +
Siehe auch '''Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93;]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#1.3 Wahrscheinlichkeiten, nicht Gewissheit|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
= 2. Von der Fragestellung zur statistischen Analyse =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
==== '''Wesentliche Elemente bei quantitativen Forschungsansätzen''' ====
 +
 
 +
Bei quantitativen Forschungsansätzen sind die folgenden Teilbereiche von besonderer Bedeutung:
 +
 
 +
* die '''Untersuchungsobjekte''', über welche wir eine Aussage machen möchten (z.B. LateinamerikanerInnen in Wien);
 +
* die '''Forschungsfrage''', die wir mit den Untersuchungsobjekten verbinden (z.B. ihre Erfahrungen in Wien)
 +
* die '''Operationalisierung''', d.h. die Art und Weise, wie wir Einstellungen und Sachverhalte messen
 +
 
 +
Interessiert uns z.B. die Einstellung der lokalen Bevölkerung zur Entwicklungszusammenarbeit, dann ist das zu untersuchende Objekt die Bevölkerung (die Grundpopulation), während die thematischen Fragen die Einstellungen der Bevölkerung zur EZA darstellen.
 +
 
 +
==== '''Befragung der richtigen Personen mit den richtigen/relevanten Fragen''' ====
 +
 
 +
Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[1]]]'''), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2]]]''' und '''Messen[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3]]]''').
 +
 
 +
Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[1] Siehe Kapitel 2.1.4]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2] Siehe Kapitel 2.2]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3] Siehe Kapitel 2.2.2]]<br />
 +
 
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|2.3 Gütekriterien quantitativer Untersuchungen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
</div>
 +
 
 +
 
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Nächstes Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
 +
----
 +
[[#2. Von der Fragestellung zur statistischen Analyse|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|Vorheriges Kapitel: 2. Von der Fragestellung zur statistischen Analyse]]'''
 +
= 2.1 Die Grundpopulation: worüber wir Aussagen machen =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Die '''empirische Grundgesamtheit''' ('''Grundpopulation''') ist jene abgegrenzte Menge von Personen (z.B. die Wiener Bevölkerung) oder Objekten (z.B. die Regenfälle in einer tropischen Region, die Autos im 7. Bezirk), über die man Aussagen machen möchte.
 +
 
 +
Anders ausgedrückt: Wenn wir eine Studie zu AfrikanerInnen in Österreich durchführen, dann möchten wir als Ergebnis zu Aussagen kommen, welche Tendenzen sich in dieser Bevölkerungsgruppe zeigen. Alle Mitglieder der Gruppe AfrikanerInnen in Österreich bilden gemeinsam die '''Grundgesamtheit'''.
 +
 
 +
==== '''Elemente, Variable und Ausprägungen''' ====
 +
 
 +
Ein Einzelobjekt aus dieser Grundgesamtheit bezeichnet man als '''statistische Einheit''' oder '''Element''' (z.B. Herr Moussa Bamba aus Bamako, der jetzt in Wien lebt). Die Einzelobjekte weisen jeweils '''Merkmale''' auf (auch '''Variablen''' genannt, z.B. Geschlecht, Einkommen, Autofarbe etc.), die uns interessieren und über deren Ausprägung in der Grundgesamtheit wir mehr erfahren möchten (die sogenannte '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]'''). Die möglichen Werte dieser Merkmale bezeichnet man als '''Merkmalsausprägungen''.''''' So gibt es für das Merkmal Geschlecht die Ausprägungen männlich oder weiblich, für die Variable Körpergröße Zahlen zwischen theoretisch Null und deutlich über zwei Meter.
 +
 
 +
==== '''Befragung der gesamten Grundpopulation nur selten möglich''' ====
 +
 
 +
Meist ist die '''Grundpopulation''' so groß, dass wir nur einen Teil der Grundpopulation befragen können, eine sogenannte '''Stichprobe'''.
 +
 
 +
==== '''Öffentliche Quellen für Daten über Grundpopulationen''' ====
 +
 
 +
Grundinformationen über die Verteilung der '''Grundpopulationen''' kann man u.a. suchen bei '''Statistik Austria[http://www.statistik.at/ &#91;2&#93;]''' und anderen Informationsstellen, in einschlägigen Publikationen etc.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 +
[http://www.statistik.at/ &#91;2&#93; http://www.statistik.at/]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
</div>
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
== 2.1.1 Die Stichprobe (Sample) ==
 +
 
 +
Eine '''Stichprobe''' ist eine Auswahl von Elementen der Grundgesamtheit, anhand derer die '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' nachgebildet werden soll.
 +
 
 +
==== '''Auswahl fast immer notwendig''' ====
 +
 
 +
Auf Grund der Größe der '''Grundpopulationen''' ist es kaum jemals möglich, alle Mitglieder derselben zu befragen. Daher greift man in der Regel zu '''Stichproben''', also einer Auswahl von Mitgliedern der Grundgesamtheit. Die Mitglieder der Stichproben sollten in der Regel so ausgewählt sein, dass sie ein '''unverzerrtes Abbild''' der '''Grundgesamtheit''' darstellen (siehe '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[2]]]''').
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[2] Siehe Kapitel 2.1.4]]<br />
 +
 
 +
 
 +
== 2.1.2 Teil- oder Vollerhebung? ==
 +
 
 +
==== '''Teil- oder Vollerhebung?''' ====
 +
 
 +
Je nach Größe der '''Grundpopulation''', der Zahl der BefragerInnen und der finanziellen Ressourcen eines Forschungsprojekts kann eine Stichprobe unterschiedlich groß gewählt werden. Quantitativ sinnvolle Stichprobengrößen beginnen bei einer Befragtenanzahl von 100 und sind auch dann noch von großen Fehlermöglichkeiten gekennzeichnet. Sinnvoller wären auch hier deutlich höhere Stichprobengrößen. Wenn z.B. ein Meinungsforschungsinstitut die Wahlpräferenzen erhebt, befragt es in der Regel 300- 1000 Personen.
 +
 
 +
Falls die '''Grundpopulation''' relativ klein ist, wie z.B. ausländische HändlerInnen am Brunnenmarkt, lässt sich auch eine '''Vollerhebung''' durchführen. Dabei werden alle in Frage kommenden Personen befragt.
 +
 
 +
 +
 
 +
 
 +
== 2.1.3 Die Ziehung (Auswahl) der Stichprobe ==
 +
 
 +
Unter '''Ziehung der Stichprobe''' versteht man die Selektion der Elemente der Stichprobe.
 +
 
 +
Die Formen der Ziehung der Stichprobe lassen sich prinzipiell unterteilen in
 +
 
 +
* '''Geschichtete Stichprobenauswahl'''
 +
* '''Willkürliches Auswahlverfahren'''
 +
* '''Zufallsstichproben'''
 +
* '''Klumpenstichproben'''
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)  ===
 +
 
 +
Unter einer '''geschichteten Stichprobenauswahl''' versteht man ein Auswahlverfahren, bei dem wesentliche '''Verteilungscharakteristiken[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' nachgebildet werden.
 +
 
 +
Einzelne für die Untersuchung als relevant erachtete Merkmale der Zielgruppe werden annähernd im gleichen Verhältnis auf die '''Stichprobe''' übertragen, wie sie in der Grundgesamtheit vorkommen.
 +
 
 +
Relevant sind besonders die Merkmale, welche bei der spezifischen Fragestellung zu besonderer Differenzierung führen können. Bei den Wahlpräferenzen sind das z.B. das Bundesland (Wien ist z.B. traditionell ein ’rotes’ Bundesland, NÖ ein ’schwarzes’); Geschlecht (Frauen haben oft ein ganz anderes Wahlverhalten als Männer); Alter (die Älteren haben eine stärkere Tendenz zur SPÖ, die Jüngeren zu den Grünen) etc.
 +
 
 +
'''Beispiel:'''<br />
 +
Man versucht die aktuellen Wahlpräferenzen der Österreicher mit insgesamt 500 Befragten zu erheben. Da etwa 1/5 der ÖsterreicherInnen in Wien lebt, sollte dementsprechend auch 1/5 der Befragten der Stichprobe, also ca. 100 Personen, aus Wien kommen, aber wesentlich weniger aus dem Burgenland. In gleicher Weise sollte auch die altersmäßige Verteilung der ÖsterreicherInnen wiedergegeben werden, also etwa 1/4 der Befragten über 60 Jahre etc.
 +
 
 +
Je nachdem, ob die wesentliichen Verteilungsparameter berücksichtigt werden oder einzelne teilweise bewusst verzerrt werden, spricht man von '''proportional geschichteten Stichproben''' oder von '''disproportional geschichteten Stichproben.'''
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.1.1 Proportional geschichtete Stichproben  ===
 +
 
 +
Bei der '''proportional geschichteten Stichprobe''' werden die '''Schichten''' entsprechend ihrer Verteilung in der Grundgesamtheit ausgewählt. Es wird ein durchgehend treues und '''unverzerrtes Abbild der Grundgesamtheit''' angestrebt.
 +
 
 +
Besonders häufig werden für die '''Schichtung''' Geschlecht, Alter und Wohnart verwendet.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.1.2 Disproportional geschichtete Stichproben  ===
 +
 
 +
Unter einer '''disproportional geschichteten Stichprobe''' versteht man die bewusste Verzerrung einzelner '''Verteilungsparameter''', um signifikante Aussagen über Randbereiche erhalten zu können. Dabei wird eine Bevölkerungsgruppe '''überproportional''' wiedergegeben, um genügend Interviews für sie zu erhalten.
 +
 
 +
Diese Methode wird v.a. angewandt, um bei beschränkten Stichprobengrößen '''signifikante[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' Aussagen über kleinere Bevölkerungsgruppen erhalten zu können, die für die Fragestellung besonders interessant sind.
 +
 
 +
==== '''Beispiel: Umfrage zu Reformen im Bildungsbereich''' ====
 +
 
 +
Problemstellung: Man möchte herausfinden, wie die österreichische Bevölkerung eine große Bildungsreform einschließlich des Hochschulwesens einschätzt. Man kann dabei insgesamt 1000 Personen befragen. Befragt man die österreichische Bevölkerung proportional geschichtet, würde man etwa 27 Studierende zu diesem Thema befragen, da mit etwa 220.000 Studierenden an öffentlichen Hochschulen ihr Anteil an der Bevölkerung bei ca. 2,7 % liegt. Man könnte somit bei bloß 27 befragten Studierenden keine verlässliche Aussage über sie bekommen, da ihre spezifische Anzahl zu klein ist. Da sie als Betroffene jedoch für die Fragestellung von besonderer Relevanz sind, könnte man sie übergewichten und 100 oder mehr von ihnen befragen.
 +
 
 +
==== '''Vorteil Kenntnis von Randbereichen, Nachteil Verzerrung des Meinungsbildes''' ====
 +
 
 +
Der Vorteil liegt in einer besseren Kenntnis des Meinungsbilds dieser thematisch wichtigen Subgruppe, '''der Nachteil dieser Methode in einem Verlust an Repräsentativität.''' Die Stichprobe ist verzerrt. Wollte man nun allgemeine Aussagen über das Meinungsbild bezüglich dieser Bildungsreform in der österreichischen Öffentlichkeit treffen, müsste man das Meinungsbild der Studierenden auf ihren tatsächlichen Anteil in der Bevölkerung hinuntergewichten.
 +
 
 +
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.1.3 Laufende Kontrolle der Schichtung  ===
 +
 
 +
==== Während der Befragungsphase laufende Kontrolle der Schichtung erforderlich ====
 +
 
 +
Bei einem quantitativen Forschungsprojekt führt man laufend Erhebungen, meist mit Fragebögen, durch. Dabei muss man stets einen Überblick über die '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' der bereits Interviewten haben, um Abweichungen von der Verteilung in der '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' korrigieren zu können. Wie? Indem man die nächsten Interviewten aus Personengruppen wählt, die bisher '''unterrepräsentiert''' waren, deren bisheriger Anteil in der Stichprobe also deutlich geringer als ihr Anteil in der Grundpopulation ist.
 +
 
 +
==== Berechnung ====
 +
 
 +
Bei ganz kleinen Umfragen kann man die '''Aufteilungsverhältnisse''' mit einer Matrix kontrollieren, in die man laufend mit ‚Stricherln’ einträgt, wen man interviewt hat. Nehmen wir an, in der Grundpopulation hätten wir eine Verteilung von 55 % Männern und 45 % Frauen bzw. von 25 % AkademikerInnen und 75 % NichtakademikerInnen. Mit den '''Schichtungsfragen''' stellen wir fest, ob die Verteilung der Interviewten mit der der Grundpopulation übereinstimmt. Daher müssen Schichtungsfragen auch fester Bestandteil der Fragebögen sein. Bisher haben wir folgende Interviews geführt:
 +
 
 +
[[File:quantitative-17_1.jpg|frame|center|Kontrolle der Aufteilungsverhältnisse in einer Matrix]]
 +
 
 +
In unserer '''Stichprobe''' findet sich bisher ein Männeranteil von 70 % (gegenüber 55 % in der Grundpopulation) sowie ein AkademikerInnen-Anteil von 43 % (gegenüber 25 % in der Grundpopulation). Daher müssen wir in Zukunft mehr Frauen und mehr NichtakademikerInnen befragen, solange, bis dieses Ungleichgewicht behoben ist. Zusätzlich gilt es zu bedenken, dass in unserer Stichprobe der Akademikeranteil bei den Männern bisher bei ca. 38 % liegt, der Akademikerinnen-Anteil bei den Frauen jedoch bei ca. 55 %. Sofern beide in der Grundpopulation den gleichen AkademikerInnen-Anteil aufweisen, müssten wir bei den folgenden Interviews darauf achten, dass bei Frauen noch stärker als bei den Männern besonders NichtakademikerInnen interviewt werden.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.2 Zufallsstichproben  ===
 +
 
 +
Unter '''Zufallsstichproben''' versteht man Auswahlverfahren einer '''Stichprobe''', bei welchen bei einem theoretisch vorliegenden Register aller Elemente der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' die Elemente der '''Stichprobe''' zufällig gezogen werden.
 +
 
 +
Man vergleiche dies mit einer Lottoziehung. Man hat ein Register von 45 Lotto-Zahlen, welche die gleiche Ziehungwahrscheinlichkeit aufweisen. Aus diesen werden beim Lotto insgesamt sechs Zahlen gezogen.
 +
 
 +
Man unterscheidet zwischen '''einfachen''' und '''systematischen Zufallsstichproben.''' Eine Sonderform der '''Zufallsstichproben''' sind die '''geschichteten Zuallsstichproben.'''
 +
 
 +
==== '''Allgemeines Problem von Zufallsstichproben:''' ====
 +
 
 +
Es ist äußerst schwierig, Register aufzutreiben oder zu erstellen, welche tatsächlich jedem Element der Grundgesamtheit die gleiche Chance des Gezogenwerdens erlauben. Im Telefonregister scheinen viele Nummern nicht auf, da sie als Geheimnummern unterdrückt werden. Geheimnummern werden wiederum häufiger von besser etablierten Personen verwendet, weshalb sie über das Telefonregister eine geringere Chance haben, erreicht zu werden.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.2.1 Einfache Zufallsstichprobe  ===
 +
 
 +
Bei der '''einfachen Zufallsstichprobe''' gibt es keinerlei Systematik der Ziehung.
 +
 
 +
Will man z.B. die Wiener Bevölkerung zum Thema Stadtautobahn befragen, könnte man alle Telefonnummern in einen PC einspeisen (das Register) und sich von einem Programm mit Zufallsgenerator 100 dieser Telefonnummern ’auswerfen’ lassen.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.2.2 Systematische Zufallsstichprobe  ===
 +
 
 +
Bei der '''systematischen Zufallsstichprobe''' erfolgt die Ziehung mit System, mit einem bestimmten Ziehungsschlüssel, und damit nicht mehr ganz zufällig.
 +
 
 +
'''Beispiel:''' <br />
 +
Man möchte die Einstellung der Wiener Bevölkerung zur Fristenlösung befragen. Man nimmt das Telefonbuch der Stadt Wien und wählt jede 100. Telefonnummer an.
 +
 
 +
==== '''Potentielle Probleme der systematischen Zufallsstichproben:''' ====
 +
 
 +
Ein Problem dieses Verfahrens kann in einer nicht erkannten Systematik der Verteilung liegen. Wenn man alle Personen befragt, welche jeweils die Türnummer 1 in den Häusern aufweisen, dann wäre die Wahrscheinlichkeit groß, dass Hausmeister deutlich überrrepräsentiert sind.
 +
 
 +
==== '''Systematik darf nicht zu starr sein:''' ====
 +
 
 +
Daher sollte die Systematik nicht zu starr sein. Man könnte z.B. bei der ersten Befragung im 1. Haus das Alter der Person abfragen und aus dem Alter die Türnummer des nächsten abzufragenden Hauses ermitteln, z.B. aus der Ziffernsumme. Nehmen wir an, ein Alter von 32 wird angegeben, dann ist die Ziffernsumme 3+2 = 5, beim nächsten Haus wird also die BewohnerIn der Türnummer 5 befragt usw.
 +
 
 +
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.2.3 Geschichtete Zufallsstichprobe  ===
 +
 
 +
Eine Sonderform der '''Zufallsstichprobe''' ist die '''geschichtete Zufallsstichprobe''.''''' Bei dieser findet zuerst eine Einteilung der Stichprobe in sich nicht überlappende Schichten statt. Aus diesen werden wiederum '''einfache''' oder '''systematische Zufallsstichproben''' entnommen.
 +
 
 +
==== '''Beispiel: Befragung von WienerInnen''' ====
 +
 
 +
Man entscheidet sich zuerst für eine Berücksichtigung der Größenverhältnisse der einzelnen Bezirke, danach realisiert man mit der festgelegten Anzahl von Personen aus diesen Bezirken '''einfache''' oder '''systematische Zufallsstichproben.'''
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.3 Willkürliches Auswahlverfahren  ===
 +
 
 +
Unter einem '''willkürlichen Auswahlverfahren''' versteht man eine '''unkontrollierte Form der Ziehung''', bei welcher die Elemente der Grundgesamtheit eine '''deutlich unterschiedliche Wahrscheinlichkeit der Selektion''' aufweisen, weshalb von der Stichprobe nicht mehr auf die Grundgesamtheit geschlossen werden kann.
 +
 
 +
'''Beispiel:'''<br />
 +
Eine LehrerIn fragt in der Schule, welche SchülerInnen sich bereit erklären, bei einem sportlichen Ausdauertraining mit Vor- und Nachtest mitzumachen. Eine kleine Zahl von SchülerInnen meldet sich, die wahrscheinlich um einiges fitter als die anderen sind.
 +
 
 +
==== '''Sinnvoll für Rückschlüsse auf Methoden''' ====
 +
 
 +
Auch eine derartige Auswahl kann sinnvoll sein, wenn man z.B. messen möchte, ob sich die Fitness der ausgewählten TeilnehmerInnen durch das Training verbesserte. In der Medizin verwendet man oft dieses Auswahlverfahren, um die Wirksamkeit von Medikamenten zu testen.
 +
 
 +
==== '''Kein Rückschluss auf die Grundgesamtheit''' ====
 +
 
 +
Ein Rückschluss auf die Grundgesamtheit ist jedoch mit dem '''willkürlichen Auswahlverfahren''' nicht erlaubt.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.1.3.4 Klumpenstichproben  ===
 +
 
 +
Unter einer '''Klumpenstichprobe''' versteht man die Auswahl von '''Klumpen''' (Bündel von Erhebungselementen wie Schulklassen oder Unternehmen) nach dem Zufallsverfahren.
 +
 
 +
Dieses Auswahlverfahren erfolgt meist aus Gründen der Ökonomie. Statt einzelne SchülerInnen aus Schulen in 1000 Orten zu befragen, befragt man z.B. alle SchülerInnen aus 30 ausgewählten Orten, von denen man annimmt, dass diese bezüglich ihrer Eigenheiten die Grundgesamtheit der Orte abbilden.
 +
 
 +
 
 +
== 2.1.4 Repräsentativität ==
 +
 
 +
Unter '''Repräsentativität''' versteht man die angestrebte Eigenschaft von statistischen Erhebungen, die Grundgesamtheit in der ausgewählten Stichprobe möglichst unverzerrt nachzubilden. Eine statistische Erhebung ist '''repräsentativ''', wenn sie auf einer '''Zufallsstichprobe''' basiert und Aussagen über die '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' zulässt.
 +
 
 +
Damit von der Stichprobe auf die Grundgesamtheit geschlossen werden kann, müssen bei den verschiedenen '''Formen der Ziehungen''' folgende Bedingungen erfüllt sein:
 +
 
 +
* '''Die Grundgesamtheit muss exakt definiert sein'''. Es muss somit klar festgelegt werden, welche Elemente zur Stichprobe gehören. Gehören z.B. bei einer Untersuchung über AfrikanerInnen in Österreich auch hier geborene Kinder von ZuwanderInnen zur Grundgesamtheit oder ausschließlich in Afrika Geborene?
 +
* '''Die Grundgesamtheit muss physisch oder symbolisch präsent und manipulierbar sein''' (sie muss sich durchmischen lassen, jedes Element muss entnehmbar sein). Einfaches Beispiel: Bei einer Lottoziehung wären 45 Kugeln vorhanden, aus denen nach dem Zufallsprinzip jeweils eine gezogen wird.
 +
* '''Jedes Element darf nur einmal in der Grundgesamtheit vertreten sein.''' Man darf also nicht z.B. die gleiche Person zweimal mit dem gleichen Fragebogen befragen.
 +
* '''Die Auswahl muss so erfolgen, dass jedes Element die gleiche berechenbare Auswahlchance (größer 0) hat, in die Stichprobe zu gelangen.''' Wenn die Befragung ausschließlich an Orten oder zu Zeitpunkten stattfindet, an welchen ein Teil der Grundpopulation nicht oder nur selten erreichbar ist (z.B. ältere Menschen in Discos oder Arbeitende untertags im Park), dann ist die Repräsentativität ebenfalls nicht gewährleistet.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
== 2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist? ==
 +
 
 +
Sollte es unmöglich sein, statistische Daten über die Schichtung der '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' zu erhalten, kann man entweder
 +
 
 +
* '''aufgrund vermutlich vergleichbarer Grundpopulationen verallgemeinern.''' Nehmen wir an, wir kennen den Frauenanteil von SudanesInnen in Wien nicht, Die ZuwanderInnen aus verschiedenen anderen vergleichbaren afrikanischen Ländern (islamisch, arabisch - englisch) weisen einen Frauenanteil von etwa 40 % auf, dann könnte man auch bei Sudanesinnen diesen Wert als Arbeitshypothese ansetzen. Man sollte jedoch unbedingt in der Publikation auf dieses Problem und die daraus folgende Annahme einer bestimmten Schichtung hinweisen.
 +
* '''ExpertInnen zum Thema befragen''', am besten gleich mehrere. Z.B. könnte man das Magistrat befragen, in welchem Ausmaß verschiedene Nationalitäten am Brunnenmarkt vertreten sind; IntegrationsforscherInnen, auch erfahrene Mitglieder der Grundpopulation etc.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|Nächstes Kapitel: 2.2 Die Operationalisierung]]'''
 +
----
 +
[[#2.1 Die Grundpopulation: worüber wir Aussagen machen|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Vorheriges Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
 +
= 2.2 Die Operationalisierung =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Unter '''Operationalisierung''' versteht man die präzise Angabe der Vorgangsweise, mit der ein theoretisches Konstrukt gemessen werden soll (wie z.B. die Akzeptanz von Zuwanderergruppen). Dazu gehört die Auswahl der '''Indikatoren''', die genaue Formulierung der Fragen im '''Fragebogen''', dazu gehören die '''Antwortkategorien''', die Bestimmung der '''Messinstrumente''', die '''Bestimmung der Genauigkeit der Messung''', die '''Anweisungen an die InterviewerInnen''', wie sie die Fragen stellen und welche Zusatzinformationen sie geben dürfen etc. '''Operationalisierung[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.1.1 Operationale Definition: Operationalisierung|[1]]]''' versucht also bis ins kleinste Detail sicherzustellen, dass die '''wissenschaftlichen Qualitätserfordernisse[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2]]]''' für vergleichbare Forschungsarbeiten eingehalten werden können und tatsächlich brauchbare Antworten zu den Themen gefunden werden können, die man zu untersuchen vorgibt.
 +
 
 +
==== '''Was man untersucht bzw. ’misst’, muss in seinen Ausprägungen in sinnvolle und voneinander abgrenzbare Untereinheiten unterteilt werden können.''' ====
 +
 
 +
Untersucht man z.B. die mathematischen Fähigkeiten von Schulkindern, kann man zur Notenskala greifen. Das Geschlecht kann in männlich und weiblich unterteilt werden. Bei der Untersuchung der Körpergröße wird man in Maßeinheiten wie cm oder mm messen. Die Einstellung gegenüber Zuwanderergruppen können wir z.B. in einer fünfteiligen Abstufung wiedergeben, wie z.B. ’sehr positiv’, ’eher positiv’, ’neutral’, ’eher ablehnend’ oder ’absolut ablehnend’. Den Erfolg bei den Bewerbungen von Zuwanderern am Arbeitsmarkt könnte man unterteilen in ’sofort abgelehnt’, ’zu Bewerbungsgespräch eingeladen, aber dann abgelehnt’ und ’aufgenommen’ unterteilen. Den Familienstand kann man in ’ledig’, ’geschieden’, ’verheiratet’, ’verwitwet’ unterteilen.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.1.1 Operationale Definition: Operationalisierung|[1] Siehe Kapitel 2.7.1.1 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|[2] Siehe Kapitel 2.3]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
</div>
 +
 
 +
== 2.2.1 Die Suche nach Indikatoren ==
 +
 
 +
Im Forschungsentwurf werden verschiedene '''Hypothesen''' formuliert. Nun benötigt man eine Reihe von '''Indikatoren''', um die '''Hypothesen[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.4 Hypothesen|[1]]]''' beibehalten bzw. verwerfen zu können.
 +
 
 +
In vielen Fällen ist die Suche nach den '''Indikatoren''' einfach. Möchte man z.B. ermitteln, wie warm zur gleichen Jahreszeit verschiedene Orte sind, dann genügt eine Messung mit dem Thermometer. Meist jedoch sind die Forschungsfragen komplexer und nicht mit einer einzigen konkreten Messungsart zu beantworten.
 +
 
 +
'''Beispiel 1:'''<br />
 +
Nehmen wir an, Sie postulieren, dass die Gesellschaft in Nepal sehr ungleich und damit nicht egalitär ist. Nun bräuchten wir eine Reihe von sehr viel spezifischeren Fragestellungen, eigentlich '''Subhypothesen''', deren Synthese zur Beantwortung der allgemeinen Hypothese führen kann. Wir könnten zwischen materieller, rechtlicher und politischer (Un-)Gleichheit unterscheiden. Wir könnten Vermögensverhältnisse in verschiedenen Schichten betrachten; den Zugang zu staatlichen und privaten Ressourcen; wir könnten die Vertretung verschiedener Gruppen der Gesellschaft (Frauen, Adelige, Bauern etc.) im Parlament und anderen öffentlichen Gremien betrachten. Wir könnten die Schulbesuchsquote kontrastiv untersuchen etc.
 +
 
 +
In all diesen Punkten müssen wir äußerst konkret und präzise werden. Bezüglich des Schulbesuchs könnte man die Zahl der Jahre in der Schule, den maximalen Ausbildungsgrad etc. abfragen. Bezüglich des Vermögens Grundstücke, Häuser, Kapital, Vieh, andere Besitztümer, Leibeigene etc. Wir könnten Einschätzungen abfragen, ob Heiraten zwischen Adeligen und Nichtadeligen als akzeptabel empfunden werden, ob die Befragten annehmen, dass Arme und Reiche vor Gericht die gleichen Chancen haben usw.
 +
 
 +
'''Beispiel 2:'''<br />
 +
Sie nehmen an, dass viele Menschen in Wien AraberInnen ablehnen und oft sogar rassistisch gegenüberstehen. Sie könnten nun in einem Fragebogen an die Wiener Bevölkerung die Wertschätzung des Islams, der arabischen Kultur abfragen. Sie könnten fragen, in welchem Maße man annimmt, dass AraberInnen besonders leicht zu Terrorismus neigen. Sie könnten fragen, ob man sich vorstellen könnte, AraberInnen als angeheiratete Familienmitglieder zu akzeptieren. Sie könnten die Bereitschaft abfragen, AraberInnen Wohnungen zu vermieten. Sie könnten die Befragten ersuchen, die ersten Assoziationen zu nennen, die ihnen beim Begriff AraberInnen einfallen. Sie könnten die Befragten ersuchen, Ihnen das dominante Gefühl zu nennen, welches sie in Gegenwart von AraberInnen spüren usw.
 +
 
 +
Letztendlich könnte man sich auf einen Schlüssel einigen, mit welchem Anteil die mit den verschiedenen Detailfragen erhaltenen Informationen in einen Sammelparameter (Beispiel 1: Ungleichheit/Gleichheit; Beispiel 2: Rassismus gegenüber AraberInnen) einfließen.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Einige_wissenschaftstheoretische_Grundlagen_der_empirischen_Sozialforschung/Begriffe#2.7.4 Hypothesen|[1] Siehe Kapitel 2.7.4 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 +
 
 +
== 2.2.2 Das Messen ==
 +
 
 +
Unter '''Messung''' versteht man die '''quantitative Bestimmung von Sachverhalten in Form einer Messgröße'''''.'' d.h. wir ordnen diesen Zahlen zu.
 +
 
 +
Misst man die Temperatur eines Körpers, wird man in unseren Regionen in der Messgröße Celsius messen, in anderen in Fahrenheit etc. Messen wir die Körpergröße, dann messen wir bei größeren Körpern in Metern und Zentimetern, bei Kleinstlebewesen aber auch in Millionstel Metern und darunter. Messen wir das Haushaltseinkommen, werden wir in Euro messen. Bei der Messung von Einstellungen und sozialen Sachverhalten kann man selbst die Messgrößen bestimmen. So könnte man bei der Einschätzung der Sympathie für eine bestimmte Kultur fünf verschiedene Messgrößen festlegen, wie z.B. ’sehr sympathisch’, ’sympathisch’, ’neutral’, ’weniger sympathisch’ und ’unsympathisch’.
 +
 
 +
==== '''Die Antwortkategorien müssen fair und ausgewogen sein''' ====
 +
 
 +
Es wäre tendenziös und unseriös, in der obigen Sympathie-Skala im positiven Bereich nur ’sehr sympathisch’ anzugeben, im negativen jedoch die zwei vorhandenen Unterscheidungen. Dies könnte dazu führen, dass Antwortende, die nur eine leichte Sympathie für die andere Kultur empfinden, zum neutralen Wert ausweichen. Daher gilt als Grundregel, dass die Zahl der möglichen Antwortvarianten bei derartigen Fragen im negativen Bereich genauso hoch wie im positiven Bereich sein soll.
 +
 
 +
Messungen beinhalten immer das Problem von '''Messfehlern'''.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.2.2.1 Messfehler  ===
 +
 
 +
Unter '''Messfehler''' versteht man die Abweichung des Ergebnisses von Messungen von den realen Gegebenheiten. Wo eine Messung erfolgt, sollte man immer die Möglichkeit von Messfehlern berücksichtigen. Man kann zwischen '''zufälligen''', '''systematischen und fahrlässigen Messfehlern''' unterscheiden.
 +
 
 +
==== '''A. Zufällige Messfehler:''' ====
 +
 
 +
Zufällige Messfehler sind von den Messenden nicht zu kontrollieren. Wenn man zum Beispiel eine bestimmte Personengruppe zu einem sensiblen Thema befragen möchte und gerade am Tag vorher ein (den InterviewerInnen unbekanntes) Ereignis eintritt, welches ihre Neigung zu ehrlichen Antworten temporär verändert, während bei Vergleichsgruppen im gleichen Zeitraum nichts Vergleichbares auftritt, können verfälschte Ergebnisse auftreten. Misst man die Regenfälle in der Sahelgegend, kann es sein, dass ein Ort deutlich besser und gleichmäßiger beregnet wird, als die nicht gemessenen Nachbarorte, im nächsten Jahr kann es umgekehrt sein. Es gibt jedoch einen sogenannten '''Zentralen Grenzwertsatz der Statistik (Wikibooks)[https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz &#91;1&#93;]''', nach welchem zufällige Fehler sich im Laufe der Zeit ausgleichen und einer Normalverteilung zustreben. Man kann daher postulieren, dass die zufälligen Messfehler bei häufigen Messungen zum Ausgleich tendieren.
 +
 
 +
==== '''B. Systematische Messfehler:''' ====
 +
 
 +
Systematische Messfehler können durch '''fehlerhafte Messgeräte''' entstehen, wie z.B. die Gewichtsmessung durch eine verstellte Waage; die Zeitmessung durch eine ungenaue Uhr; aber auch z.B. eine Kommunikationsform, welche den Zugang zu manchen Informationen kaum erlaubt. So ist es möglich, dass besonders hoch emotionale Angelegenheiten in einer Fremdsprache zu anderen Antworten als in seiner Muttersprache führen. Man überlege sich, ob es einem in einer Fremdsprache ähnlich schwer wie in seiner Muttersprache fällt, z.B. ''Ich liebe Dich'' zu sagen, wo beim Aussprechen ähnlicher Sätze auch Assoziationen mit Enttäuschungen u.a. verbunden sein können und damit auch die Angst vor Zurückweisung.
 +
 
 +
Ein Teil der systematischen Messfehler kann durch '''stetige Kontrolle''' und '''kritische Hinterfragung''' der Messinstrumente behoben werden.
 +
 
 +
==== '''C. Fahrlässige Messfehler:''' ====
 +
 
 +
'''Grobe Messfehler''' '''beruhen auf menschlichen Fehlern'''. Man trägt z.B. beim Alter 15 statt 51 ein, schreibt eine Antwort in die falsche Spalte; vergisst eine Frage zu stellen oder zu beantworten. Man vermittelt beim Interview eigene Einstellungen, welche mit großer Wahrscheinlichkeit zu einer veränderten Reaktion des Befragten führen (wenn man z.B. einem Befragten deutlich zeigt, dass man seine Einstellungen und Meinungen geringschätzt).
 +
 
 +
Weiterführendes zu Messfehlern:
 +
 
 +
'''Messfehler (Wikipedia)[http://de.wikipedia.org/wiki/Messfehler &#91;2&#93;]'''
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz &#91;1&#93; https://de.wikibooks.org/wiki/Statistik:_Zentraler_Grenzwertsatz]<br />
 +
[http://de.wikipedia.org/wiki/Messfehler &#91;2&#93; http://de.wikipedia.org/wiki/Messfehler]<br />
 +
 
 +
 
 +
== 2.2.3 Vom Fragebogen zum Codeplan ==
 +
 
 +
Unter einem '''Codeplan''' verstehen wir die '''Auflistung aller verwendeten Variablen''' mit einer eindeutigen Information zur inhaltlichen Bedeutung der numerischen Codes, eventuell noch von weiteren Informationen begleitet, welche sich auf den Messvorgang beziehen.
 +
 
 +
In einem Codeplan halten wir eindeutig fest, '''welchen Variablennamen Fragen des Fragebogens entsprechen''', '''wie verschiedene Ausprägungen von Variablen gemessen werden''' (z.B. in cm für die Körpergröße oder in Ja/Nein für bestimmte Erfahrungen) und '''wie diese Ausprägungen in eine numerische Form übersetzt werden''', was überhaupt erst eine maschinelle quantitative Analyse erlaubt.
 +
 
 +
==== '''Statistikprogramme benötigen automatisch interpretierbare Datentypen''' ====
 +
 
 +
Statistikprogramme benötigen für Berechnungen bestimmte Datentypen, die in der Regel '''numerisch''' sind. Kein Statistikprogramm kann in den Antwortkategorien ’sehr’, ’eher schon’, ’durchschnittlich’, ’eher weniger’, ’überhaupt nicht’ eine logische Reihe erkennen, dass also diese Bezeichnungen für verschiedene logische Abstufungen stehen, nämlich für eine '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1]]]'''.
 +
 
 +
Damit ein Statistikprogramm wie '''SPSS''' die logische Reihenfolge erkennen und danach Analysen über diese bilden kann, müssen die Textwerte in numerische umcodiert werden. Im '''Codeplan''', d.h. der Dokumentation über die ursprünglichen Text- Begriffe und ihrer numerischen Entsprechungen, werden diese Umcodierungen festgehalten. Im obigen Beispiel könnte man ’sehr’ immer durch 1, ’eher schon’ durch 2, ’durchschnittlich’ durch 3, ’eher weniger’ durch 4 und ’überhaupt nicht’ durch 5 ersetzen. Nun ist eine für die Software durchgehende Reihe von 1-5 entstanden, die vom kleinsten zum größten Wert gereiht ist.
 +
 
 +
Aktuelle Statistikprogramme wie '''SPSS''' rechnen intern mit diesen numerischen Daten, können mit einfachen Befehlen jedoch bei der Ausgabe der Ergebnisse automatisch die urspünglichen Textinformationen verwenden.
 +
 
 +
Beispiel eines Codeplans: 
 +
 
 +
 +
 
 +
[[File:quantitative-30_1.jpg|frame|center|Beispiel eines Codeplans]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1] Siehe Kapitel 3.1.2.3]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix  ===
 +
 
 +
Unter einer '''Datenmatrix''' versteht man eine '''Tabelle, in welcher alle Messungen an den Versuchsobjekten zusammengefasst werden'''. Die Daten sind normalerweise so angeordnet, dass jede Zeile der Datenmatrix alle '''Messungen''' an einem einzelnen Datenobjekt enthält. In den Zeilen stehen somit von links nach rechts die Angaben zu einer Person (bzw. zu den Untersuchungsobjekten), während in den Spalten die Variablen eingetragen werden.
 +
 
 +
Siehe z.B. die ersten Spalten und Zeilen der SPSS-Datei zur weltweiten Entwicklung world95.sav:
 +
 
 +
[[File:quantitative-31_1.jpg|frame|center|Beispiel einer SPSS-Datenmatrix]]
 +
Die Untersuchungsobjekte sind hier eindeutig durch ihre in der ersten Spalte stehenden (Länder-)Namen identifiziert. Von links nach rechts werden danach in den einzelnen Zeilen durch Variable Informationen zu den jeweiligen Ländern angegeben: Bevölkerungsgröße, Bevölkerungsdichte, Prozentsatz der städtischen Bevölkerung, Religion etc.
 +
 
 +
Es ist äußerst empfehlenswert, die Datenmatrix in der hier beschriebenen Weise zu verwalten, da alle führenden und gängigen Analyse- und Darstellungsprogramme (Excel, SPSS etc.) die gleiche Anordnung verwenden.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.2.3.2 Umcodierung mit SPSS  ===
 +
 
 +
SPSS benötigt gleichzeitig für viele Funktionen numerische Daten, wo Daten in ''String'' (oder Text-)Format vorliegen. So kann SPSS bei reinen Textdaten, wie z.B. ’Sehr Gut’ oder ’Gut’ nicht erkennen, dass ’Sehr Gut’ eine höhere Intensität bzw. Qualität als ’Gut’ wiederspiegelt. SPSS würde eine sinnvolle Rangfolge jedoch in numerischer Form erkennen.
 +
 
 +
SPSS erlaubt es, '''Stringvariable''' automatisch in '''numerische''' zu codieren.
 +
 
 +
Dazu benützen Sie die Funktion TRANSFORMIEREN - UMCODIEREN in der Menüleiste. Nun können Sie sich entscheiden, ob die Umcodierung in die gleiche oder in eine andere Variable erfolgen soll. Es ist besser, sich für ''eine andere Variable'' zu entscheiden, da durch die Umcodierung (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch Umcodierung in eine neue Variable ausgeschlossen.
 +
 
 +
Sie wählen nun die Variable aus, welche umcodiert werden soll und geben im Feld Ausgabevariable einen neuen Namen dafür ein (der aus Gründen verschiedenster Kompatibilität) acht Zeichen nicht überschreiten darf. Im Feld darunter können Sie jedoch einen beliebig langen und expressiveren Namen wählen.
 +
 
 +
[[File:quantitative-32_1.jpg|frame|center|Umkodieren in andere Variablen mit SPSS]]
 +
Klicken Sie nun auf ''Alte und neue Werte''. Wenn Sie einzelne Werte umcodieren möchten, geben Sie im Feld ''Wert'' denselben ein (z.B. Matura). Nun benötigen Sie einen neuen Wert dafür. Dafür könnten Sie z.B. die Zahl 3 im Feld ''Neuer Wert'' eingeben. Im oben angeführten Beispiel wären verschiedene abgeschlossene Ausbildungsstufen in eine logische Reihenfolge gebracht.
 +
 
 +
Falls Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen möchten, können Sie einen Bereich angeben (z.B. ''Bereich'' 20 ''bis'' 29), wenn Sie alle zwischen 20-29jährigen in eine einzige Altersklasse ’zwischen 20 und 30' einbringen möchten). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf ''Hinzufügen.''
 +
 
 +
Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert. Erst jetzt wäre es Ihnen möglich, dass SPSS die Ausbildung nach Jahren und Qualität sinnvoll reihen kann und natürlich auch viele weitere (damit zusammenhängenden) Analysen rechnen kann. So wäre erst jetzt die Berechnung einer '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' zwischen dem Ausbildungsgrad und dem Einkommen möglich.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1] Siehe Kapitel 3.5.3]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.2.3.3 Automatische Rückcodierung mit SPSS  ===
 +
 
 +
Damit SPSS mit Daten rechnen kann, wurden diese in numerischer Form eingegeben oder in eine neue numerische Variable umcodiert. Wenn Sie nun eine auf diesen neuen Variablen basierende Analyse starten, wirken die Ergebnisse ohne zusätzliche Information wenig informativ.
 +
 
 +
[[File:quantitative-33_1.gif|frame|center|Numerische Variablen]]
 +
 
 +
Niemand könnte ohne Zusatzinformation wissen, dass ''0'' für ''Nein'' und ''1'' für ''Ja'' steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben (Diagramme, Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die ''Variablenansicht.'' Im neuen Fenster finden wir in der Zeile der neuen Variable den Punkt ''Variablenlabel.'' Nach Doppelklick darauf erscheint folgendes Fenster:
 +
 
 +
[[File:quantitative-33_2.jpg|frame|center|Definition der Wertelabels mit SPSS]]
 +
 
 +
Wir geben nun für den Wert das gewünschte Label ein. Wir möchten, dass statt ''0'' der aussagekräftige Text ''Nein'' erscheint, statt ''1'' der aussagekräftige Wert ''Ja.'' Nach Eingabe aller automatisch durchzuführenden Änderungen klicken wir auf OK.
 +
 
 +
Wenn wir nun die gleiche Häufigkeitsberechnung wie oben durchführen, erhalten wir nun folgende leichter verständliche Tabelle:
 +
 
 +
[[File:quantitative-33_3.gif|frame|center|Tabelle mit Wertelabels]]
 +
 
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|Nächstes Kapitel: 2.3 Gütekriterien quantitativer Untersuchungen]]'''
 +
----
 +
[[#2.2 Die Operationalisierung|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|Vorheriges Kapitel: 2.2 Die Operationalisierung]]'''
 +
= 2.3 Gütekriterien quantitativer Untersuchungen =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Statistische Untersuchungen müssen wie jede andere Form wissenschaftlicher Betätigung den '''Kernansprüchen[[Forschungsablauf/Qualitaet#4.3.1 Quantitative Qualitätskriterien|[1]]]''' der '''Reliabilität''', der '''Validität''' und der '''Objektivität''' genügen:
 +
 
 +
==== '''Reliabilität:''' ====
 +
 
 +
Unter Reliabilität oder '''Zuverlässigkeit''' versteht man die '''formale Genauigkeit wissenschaftlicher Untersuchungen'''. Darunter versteht man, dass die Untersuchungen mit einem Höchstmaß an Anstrengungen verbunden werden, Messfehler jeder Art auszuschließen. Reliabilität ist somit ein '''Indikator''' für die '''Replizierbarkeit''' (Wiederholbarkeit) der Ergebnisse. Fragen müssen z.B. so eindeutig formuliert sein, dass sie nicht höchst unterschiedlich verstanden werden können.
 +
 
 +
==== '''Validität:''' ====
 +
 
 +
'''Validität''' liegt vor, wenn wenn die gewählten Indikatoren, Fragen und Antwortmöglichkieten wirklich und präzise das messen, was gemessen werden soll.
 +
 
 +
Wenn man die Frage stellt, ob der Proband Schweinefleisch isst, so ist die Verneinung noch keineswegs ein Beweis dafür, dass er Vegetarier ist, sondern nur, dass er eben Schweinefleisch aus verschiedenen Gründen nicht mag. Wäre die Frage nach dem Essen von Schweinefleisch die einzige auf Fleisch bezogene Frage im Fragebogen, so wäre der Fragebogen nicht valide, um auf Vegetarismus zu schließen.
 +
 
 +
==== '''Objektivität:''' ====
 +
 
 +
Die Objektivität von '''Messverfahren''' und '''Fragen''' ist weitgehend gewährleistet, '''wenn die Wahl der Messenden, InterviewerInnen, PrüferInnen keinen Einfluss auf die Ergebnisse hat'''.
 +
 
 +
Objektivität wäre z.B. zweifelhaft, wenn man verunsicherte Männer mit einem persönlich überreichten Fragebogen zu ihrem Sexualleben einmal von ebenfalls verunsicherten Männern und das andere Mal von jungen, attraktiven und selbstbewussten Frauen befragen lassen würde, wobei die Fragen von den InterviewerInnen persönlich gestellt und auch die Antworten von ihnen niedergeschrieben werden. Man würde mit hoher Wahrscheinlichkeit äußerst unterschiedliche Antworten erhalten. Genauso müßte man mit Verfälschungen rechnen, wenn Firmenchefs oder -chefinnen ihre Angestellten zur Zufriedenheit mit ihrer Arbeitssituation befragen.
 +
 
 +
'''Gütekriterien und andere Fehlerquellen''' erfordern, dass statistische Untersuchungen stets mit äußerster Sorgfalt durchgeführt werden: von der Erhebung der Daten bis zu deren Analyse, dass also die richtigen Methoden angewandt werden, deren Wahl auf der Eigenart der Daten und ihrer Verteilungen beruht und dass die Interpretation keineswegs über die Aussagekraft der Daten hinausgeht.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Forschungsablauf/Qualitaet#4.3.1 Quantitative Qualitätskriterien|[1] Siehe Kapitel 4.3.1 der Lernunterlage ''Einführung in die Empirischen Methoden der Kultur- und Sozialanthropologie'']]<br/>
 +
 
 +
<br />
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|Nächstes Kapitel: 2.4 Fehlerquellen bei statistischer Arbeit]]'''
 +
----
 +
[[#2.3 Gütekriterien quantitativer Untersuchungen|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|Vorheriges Kapitel: 2.3 Gütekriterien quantitativer Untersuchungen]]'''
 +
= 2.4 Fehlerquellen bei statistischer Arbeit =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Statistik ist der Versuch, aus einem Ausschnitt der Realität auf die Gesamtheit zu schließen. Dies bedeutet, dass unsere Aussagen über die (gesamte) Realität immer, ohne Ausnahme, mit einem Irrtumsrisiko behaftet sind, da wir nicht über vollständige Daten zur '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' verfügen. Statistisch sprechen wir dabei von '''Fehlern der ersten und der zweiten Art.'''
 +
 
 +
Während '''Fehler der ersten und der zweiten Art''' zu nicht eliminarbaren Risiken der statistischen Arbeit gehören und auch bei sorgfältiger Herangehensweise nicht ausgeschlossen, sondern nur berücksichtigt werden können (siehe '''Irrtumswahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]'''), hängen '''individuell bedingte Fehler''' mit Mängeln bei der Datenaufnahme, -übertragung oder Analyse zusammen. Wir könnten diese unter '''fehler-''' ''bzw.'' '''mangelhafte Daten''' zusammenfassen.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 +
</div>
 +
 
 +
== 2.4.1 Fehler erster und zweiter Art ==
 +
 
 +
Unter '''Fehler der ersten bzw. zweiten Art''' verstehen wir das systembedingte Problem, dass Hypothesen auch bei sorgfältigem Vorgehen fälschlich bestätigt oder verworfen werden.
 +
 
 +
==== '''Hypothesen am Beginn der Untersuchung''' ====
 +
 
 +
Bei Forschungsprojekten formulieren wir Hypothesen, deren Richtigkeit wir mit geeigneten Forschungs- und Analysemethoden untersuchen wollen. Eine derartige '''Ausgangshypothese''' oder '''Nullhypothese''' (in Kurzform oft auch '''H0''' bezeichnet) könnte lauten: ’AfrikanerInnen werden am Arbeitsplatz weniger geschätzt als ChinesInnen.’.
 +
 
 +
Das Vorliegen einer Hypothese bedingt auch, dass es als Kontrast eine '''alternative Hypothese''' gibt (die wir bei der Erstellung des Konzepts als meist weniger wahrscheinlich einschätzen), die '''Alternativhypothese''' (in Kurzform oft auch '''H1''' genannt). In unserem Fall könnte diese lauten: ’AfrikanerInnen werden am Arbeitsmarkt nicht weniger geschätzt als ChinesInnen.’.
 +
 
 +
==== '''Annahme oder Verwerfung von Hypothesen ist immer an Wahrscheinlichkeiten gebunden''' ====
 +
 
 +
Bei statistischen Analysen versuchen wir, Ergebnisse auf hohem '''Signifikanzniveau[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' zu erreichen. Wir sprechen davon, dass die gefundene Aussage mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, weniger als 1 %, weniger als 1 ‰ zutrifft. Das bedeutet, dass unser Ergebnis, auf das wir so stolz sind, dennoch in 5 % aller Fälle, in 1 % aller Fälle etc. rein zufällig entstehen kann und, bei einer genügend häufigen Wiederholung, sogar muss.
 +
 
 +
Andererseits ist genauso denkbar, dass unser Ergebnis rein zufällig nicht den starken Zusammenhang zeigt, der normalerweise erscheint. Wir könnten auch bei großer Sorgfalt bei der Auswahl der Stichprobe überdurchschnittlich häufig auf Personen treffen, welche AfrikanerInnen besonders positiv gegenüber stehen.
 +
 
 +
==== '''Fehlerhafte Verwerfung bzw. Annahme von Hypothesen möglich''' ====
 +
 
 +
Es können also zwei verschiedene Fehler auftreten:
 +
 
 +
A. die Nullhypothese wird verworfen, obwohl sie richtig ist. Dies nennt man auch '''Fehler der ersten Art''' oder '''Alpha-Fehler''''';''
 +
 
 +
B. die Nullhypothese wird angenommen, obwohl sie falsch ist. Dies bezeichnet man auch als '''Fehler der zweiten Art''' oder '''Beta-Fehler'''''.''
 +
 
 +
==== '''Mit der Zahl der statistischen Berechnungen steigt die Wahrscheinlichkeit von Fehlern der 1. oder 2. Art''' ====
 +
 
 +
Das Risiko, einem der beiden Fehler aufzusitzen, steigt natürlich mit der Höhe der '''Irrtumswahrscheinlichkeit''' sowie mit der Zahl der durchgeführten Analysen. Moderne PCs und Statistik-Software laden geradezu dazu ein, in kurzer Zeit tausende von Hypothesen zu überprüfen. Wenn wir 100 Variable miteinander kreuzen, erhalten wir (100x99)/2 Vergleiche, d.s. 4950 einzelne Untersuchungen auf signifikante Zusammenhänge. Wenn wir diese mit Chi-Quadrat-Tests auf dem 5 %-Irrtumsniveau untersuchen, erhalten wir im Normalfall 247,5 falsche Zusammenhänge (4950*0,05). Wir würden also in 247 Fällen einen Zusammenhang annehmen, obwohl er nicht vorhanden ist (Alpha-Fehler).
 +
 
 +
==== '''Kontrolle durch qualitative Überlegungen erforderlich''' ====
 +
 
 +
Derartige Massenvergleiche zeigen auch deutlich, dass '''statistische Berechnungen nicht losgelöst von qualitativen Überlegungen stattfinden dürfen'''. Bei statistischen Untersuchungen überraschend aufgetauchte Zusammenhänge müssen auch eine gewisse Stabilität und Systemkohärenz aufweisen, um akzeptiert werden zu können. D.h. sie müssen in einem gewissen Rahmen reproduzierbar sein und sie sollten nicht im Widerspruch zu offensichtlichen Fakten sein.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
 
 +
== 2.4.2 Fehlerhafte oder mangelnde Daten ==
 +
 
 +
Fehler und Mängel können bei einer Reihe von Vorgängen bei statistisch unterstützten Forschungsprojekten erfolgen bzw. auftreten, wie z.B.:
 +
 
 +
A. '''Operationalisierungsfehler:''' bei der '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|[1]]]''' wurden verzerrende Messmethoden festgelegt;
 +
 
 +
B. '''Codierfehler:''' bei der '''Codierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[2]]]''' wurden, z.B. bei der Übertragung von Text-Daten in numerische Daten für interne Berechnungen von SPSS, Fehler begangen (z.B. die Vergabe des Zahlenwerts ''4'' in der Notenskala für ’Befriedigend’);
 +
 
 +
C. '''Interviewerfehler:''' bei der Datenaufnahme wurden fehlerhafte Werte eingetragen (z.B. eine Kinderzahl von 71 statt 7);
 +
 
 +
D. '''Widersprüchliche Datenlage:''' die Versuchspersonen oder die Datenquellen lieferten widersprüchliche Informationen, die sich in den Datenblättern wiederfinden;
 +
 
 +
E. '''Antwortverweigerung:''' verschiedene Fragen wurden von Versuchspersonen nicht beantwortet oder waren durch die Datenlage nicht erhebbar;
 +
 
 +
F. '''Eingabefehler:''' Datensätze wurden doppelt eingegeben;
 +
 
 +
G. '''Analysefehler:''' für die Analyse der Daten wurden die '''falschen Methoden[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|[3]]]''' verwendet;
 +
 
 +
H. '''Interpretationsfehler:''' die Ergebnisse wurden richtig gerechnet, aber falsch interpretiert;
 +
 
 +
I. '''Grafiken[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|[4]]]''' und Tabellen werden falsch oder ungenügend mit Zusatzinformationen versehen, was sowohl zu mangelndem Verständnis wie auch zu Nichtüberprüfbarkeit der Ergebnisse führen kann.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|[1] Siehe Kapitel 2.2.1]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[2] Siehe Kapitel 2.2.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|[3] Siehe Kapitel 3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|[4] Siehe Kapitel 3.6.3]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.4.2.1 Eingabefehler  ===
 +
 
 +
Meist werden Umfrageergebnisse zuerst handschriftlich aufgezeichnet. Danach werden die Daten in den PC übertragen, was mehrere potentielle Fehlerquellen berührt. Eine wenig leserliche Schrift kann zu Irrtümern bei der Eintragung in die Datenmatrix führen, genauso ’hängengebliebene Finger’ auf einer kleinen Tastatur, aber natürlich auch bewusste Falschangaben.
 +
 
 +
SPSS und Excel bieten verschiedene Möglichkeiten, die Eingabe von falschen Daten zu erschweren:
 +
 
 +
A. durch die '''Wahl geeigneter Datentypen'''
 +
 
 +
B. durch die Überprüfung, ob sich der eingetragene Wert innerhalb vorgegebener Grenzen befindet = '''Gültigkeitsprüfung'''.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS  ===
 +
 
 +
'''Verringerung des Risikos durch Wahl geeigneter Datentypen'''
 +
 
 +
Besonders wichtig ist die richtige Definition des Datentyps (-> ''VARIABLENANSICHT - DATENTYP''). In einem '''Stringfeld''' (oder Textfeld) können beliebige Zeichen stehen, in einem numerischen Feld nur Zahlen. Das bedeutet, dass durch Verschreiben keinerlei Buchstaben in ein numerisches Feld ’rutschen’ können. Der Datentyp kann jedoch noch wesentlich enger gefasst werden. Wenn ich im Feld ''Breite'' die Zahl 4 eintrage, kann ich z.B. bei numerischen Daten ausschließen, dass Jahreszahlen fehlerhaft durch Vertippen mit fünf Ziffern eingegeben werden. Gibt man bei Dezimalstellen ''0'' ein, sind nur ganze Zahlen möglich.
 +
 
 +
[[File:quantitative-39_1.jpg|frame|center|Definition des Datentyps um Fehleingaben zu verringern]]
 +
 
 +
-----
 +
 
 +
=== 2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel  ===
 +
 
 +
Unter '''Gültigkeitsprüfung''' von Daten versteht man die automatische Prüfung, ob aufgenommene Ausprägungen sich innerhalb eines vorgegebenen Bereichs befinden. Jeder außerhalb dieses Bereichs liegende Wert wird bei der Eingabe mit einer '''Fehlermeldung''' abgewiesen.
 +
 
 +
Für die meisten Variablen lassen sich mit geringer Sachkenntnis '''Ober- und Untergrenzen definieren''', welche alle real auftretenden Ausprägungen umschließen. So könnte man bei der Aufnahme der Körpergröße von Erwachsenen eine Untergrenze von 80 cm und eine Obergrenze von 3 m annehmen; beim Lebensalter bei Erwachsenen eine Untergrenze von 18 und eine Obergrenze von 130; bei Schulnoten eine Untergrenze von 1 und eine Obergrenze von 5; beim Einkommen von Studierenden eine Untergrenze von 0 und eine Obergrenze von 4000 Euro.
 +
 
 +
Mit Excel geschieht dies folgendermaßen:
 +
 
 +
A. Man markiert die Spalte der Ausprägungen
 +
 
 +
B. In der Menüleiste auf ''Daten'' und danach auf ''Gültigkeit'' klicken
 +
 
 +
[[File:quantitative-40_1.jpg|frame|center|Definition des Gültigkeitsbereiches mit SPSS]]
 +
C. Nun unter ''Zulassen'' Angabe des Datentyps machen. Wenn z.B. die Zahl der Kinder eingetragen werden sollte, würden wir hier ''Ganze Zahl'' wählen. Wählt man ''Liste'' aus, gelten alle Werte als gültig, welche sich in einer spezifischen Datei befinden (der ''Liste'').
 +
 
 +
D. Unter ''Daten'' gibt man die Richtung der Ausprägungen an, also z.B. ''größer als, zwischen'', ''ungleich'' etc. In unserem Fall der Kinderzahl wählen wir ''zwischen'' (auch ''größer oder gleich'' wäre denkbar).
 +
 
 +
E. Nun geben wir als Minimum-Wert '''' die untere Begrenzung ein, in unserem Falle ''0'', da weniger Kinder nicht möglich sind und als Maximum in unserem Falle die Zahl 20 (kaum denkbar, dass jemand in Industrieländern eine höhere Kinderzahl aufweist).
 +
 
 +
F. Unter ''Eingabemeldung'' könnte man eine Meldung ausgeben lassen, welche bei Einträgen im Feld automatisch auf die Grenzen hinweist
 +
 
 +
G. Wichtiger ist es, unter ''Fehlermeldung'' anzugeben, warum ein eingetragener Wert als ungültig abgelehnt wird. Dazu wählen wir unter ''Typ'' eine bestimmte Signalform, in unserem Falle ''Warnung;'' danach geben wir unter ''Titel'' eine aussagekräftige Kurzmeldung und unter ''Fehlermeldung'' ausführlichere Erklärungen dazu ein.
 +
 
 +
Falls wir nun in Excel in der betreffenden Spalte für Kinderzahlen die Ausprägung ''22'' eingeben, erhalten wir folgende Warnmeldung:
 +
 
 +
[[File:quantitative-40_2.jpg|frame|center|Fehlermeldung bei Eingabe eines ungültigen Wertes]]
 +
 
 +
-----
 +
 
 +
=== 2.4.2.2 Doppelte Datensätze  ===
 +
 
 +
Mitunter kann es geschehen, dass der gleiche Datensatz fehlerhafterweise doppelt eingegeben wird.
 +
 
 +
Doppelt eingegebene Datensätze kann man in SPSS mit folgender Funktion finden:
 +
 
 +
Klicken Sie auf DATEN - DOPPELTE FÄLLE ERMITTELN. Sie sehen folgendes Fenster: 
 +
 
 +
[[File:quantitative-41_1.jpg|frame|center|Doppelt eingegebene Datensätze finden mit SPSS]]
 +
 
 +
Die wesentlichen Einträge hier sind:
 +
 
 +
A. Geben Sie unter ''Übereinstimmende Fälle definieren durch'' die Variablen an, welche zur Identifikation von Doppelgängern dienen. Das können normalerweise nur Variable sein, bei welchen Einträge eindeutig sein sollen (natürlich ist Eindeutigkeit auch durch eine Kombination mehrerer Variable erreichbar).
 +
 
 +
B. Sie können unter ''Innerhalb der übereinstimmenden Gruppen sortieren nach:'' noch eine Variable angeben, nach der sortiert werden soll.
 +
 
 +
Haben Sie somit doppelte Einträge gefunden, können Sie Fall für Fall entscheiden, wie Sie damit umgehen.
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.4.2.3 Fehlende Einträge  ===
 +
 
 +
==== '''Was tun, wenn Einträge fehlen?''' ====
 +
 
 +
Nur bei den wenigsten Umfragen werden alle Fragen von allen Befragten beantwortet. Besonders tabuisierte Fragen wie vielleicht nach Bereichen der Sexualität, dem Einkommen, den politischen Neigungen werden oft nicht oder nur neutral beantwortet. Es stellt sich daher die Frage, ob und wie man die fehlenden Einträge interpretieren kann. Ein weiser Spruch der Kommunikationsforschung lautet: ’'''Man kann nicht nicht kommunizieren’''' (Paul Watzlawick)'''.''' Das bedeutet, dass vor allem bei tabusierten Fragen auch die Nichtbeantwortung von Fragen eine Information darstellt. Es könnte dementsprechend sein, dass bei manchen Fragen eine Nichtbeantwortung bedeutet: "Ich möchte nicht, dass man weiß, wie ich über diesen Bereich denke."
 +
 
 +
==== '''Beispiel: geringe Bekenntnisquote von FPÖ- WählerInnen''' ====
 +
 
 +
Viele Jahre lang hatten besonders FPÖ-WählerInnen während der Haider-Jahre große Angst, sich in Umfragen vor Wahlen zu ihrer Partei zu bekennen. Die Wahlergebnisse fielen daher für die FPÖ durch 1,5 Jahrzehnte stets wesentlich besser aus als die Umfrageergebnisse, was u.a. dazu führte, dass ihre Bekennerzahlen in Umfragen von den Meinungsforschungsinstituten einen substantiellen Zuschlag bekamen, um sich der tatsächlichen Unterstützung dieser Partei anzunähern.
 +
 
 +
==== '''Nichtbeantwortung auch durch Fehler möglich''' ====
 +
 
 +
In anderen, neutralen, Bereichen wird eine Nichtbeantwortung wieder eher als Übersehen oder als Ratlosigkeit (die Frage ist vielleicht unverständlich formuliert) gedeutet werden. Es gäbe kaum einen denkbaren Grund, die Frage nach seinem Lieblingsobst nicht zu beantworten.
 +
 
 +
==== '''Je nach Tabuisierungsgrad der Frage sind fehlende Einträge unterschiedlich aussagekräftig''' ====
 +
 
 +
Je nach Sachlage kann daher eine Nichtbeantwortung eine Art von Information oder einen Mangel darstellen. Im ersten Fall könnte es sein, dass z.B. besonders Personen, welche eine extrem abwehrende Haltung gegenüber MigrantInnen aufweisen (wie aus einer anderen Fragestellung erkennbar), besonders zur Nichtbeantwortung der Frage ’Welche Partei würden Sie wählen, wenn morgen Wahltag wäre?". Das heißt, dass wir uns bei auffallend häufiger Nichtbeantwortung von bestimmten Fragen die Frage stellen sollten, ob es bei den Nichtbeantwortenden gewisse Gemeinsamkeiten gibt und damit auch spezifische Motive der Nichtbeantwortung.
 +
 
 +
Wir müssen also bei der Behandlung der beiden Arten der Nichtbeantwortung differenzieren: im Falle der informationstragenden Nichtbeantwortung sollte der Antwort dennoch ein gewisser Wert beigemessen werden. Im Falle der informationsleeren Nichtbeantwortung sollten wir die Nichtantwort einfach aus der Gesamtzahl der möglichen Antworten ausschließen und dadurch die Stichprobengröße für diese Frage verkleinern.
 +
 
 +
 +
 
 +
 
 +
-----
 +
 
 +
=== 2.4.2.3.1 Behandlung fehlender Daten mit SPSS  ===
 +
 
 +
SPSS erlaubt, leere Felder automatisch mit bestimmten Einträgen auszufüllen oder dieselben in keinerlei Berechnungen einfließen zu lassen.
 +
 
 +
SPSS unterscheidet zwischen ''Systembedingt fehlenden Werten'' und ''Benutzerdefinierten fehlenden Werten.'' Werden z.B. Variable als numerisch definiert, werden leere Felder automatisch mit einem Komma in der '''Datenmatrix[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1]]]''' markiert (''Systembedingt''). Bei Textfeldern muss ein fehlender Wert spezifisch deklariert werden (''Benutzerdefinierter fehlender Wert):''
 +
 
 +
[[File:quantitative-43_1.jpg|frame|center|Definition von fehlenden Werten]]
 +
 
 +
Man kann hier genau definieren, was als ''fehlender Wert'' gelten soll. Soll ein leeres Feld als solcher gelten, drückt man im ersten Feld von ''Einzelne fehlende Werte'' einmal auf die Leertaste. Man erhält hier in einem Beispiel die folgende Ausgabe:
 +
 
 +
[[File:quantitative-43_2.jpg|frame|center|Eintragung von definierten fehlenden Werten]]
 +
 
 +
Man erkennt, dass in der vorletzten Zeile 2 fehlende Werte eingetragen wurden. Auch die Größe der tatsächlich berücksichtigten Stichprobe hat sich um 2 verringert (siehe drittletzte Zeile).
 +
 
 +
Falls man jedoch im Fenster ''Fehlende Werte definieren'' die Alternative ''Keine fehlenden Werte'' auswählt, erhalten Sie folgendes Ergebnis:
 +
 
 +
[[File:quantitative-43_3.jpg|frame|center|Option "Keine fehlenden Werte" gewählt]]
 +
 
 +
Die fehlenden Einträge in der vorletzten Zeile sind verschwunden, stattdessen findet sich in der ersten Zeile der ersten Spalte eine fehlende Beschreibung, neben der die Häufigkeit 2 steht. Die fehlenden Werte fließen hier voll in die Berechnung ein. Eine derartige leere Bezeichnung ist natürlich wenig anschaulich. Man muss sie daher für Bildschirm- und Printausgabe mit einer informativeren Beschreibung versehen. Dazu gehen wir wieder zur ''Variablenansicht'' und wählen in dieser ''(Variablen-)Labels'' aus.
 +
 
 +
[[File:quantitative-43_4.jpg|frame|center|Definition von Wert und Wertelabel]]
 +
 
 +
In ''Wert'' fügen wir wieder eine Betätigung der Pausetaste ein, unter ''Wertelabel'' z.B. ’nicht beantwortet’. Leerfelder werden dadurch deutlich informativer dargestellt, s.u.:
 +
 
 +
[[File:quantitative-43_5.jpg|frame|center|Ausgabe des definierten Wertelabels]]
 +
 
 +
Nun tauchen in der ersten Zeile die leeren Antworten mit einer klaren und verständlichen Beschreibung auf.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[1] Siehe Kapitel 2.2.3]]<br />
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#2.4 Fehlerquellen bei statistischer Arbeit|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
= 3. Ausgewählte statistische Grundlagen und Analysemethoden =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
In den folgenden Abschnitten werden eine Reihe von Methoden der '''deskriptiven[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|[1]]]''', teilweise auch der einfachen '''analytischen[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|[2]]]''' Statistik sowie auch deren Anwendungsvoraussetzungen und Rahmenbedingungen vorgestellt.
 +
 
 +
Wir benötigen ausreichendes Wissen über die Art, '''Skalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[3]]]''' und '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4]]]''' der Daten, um die dafür geeigneten statistischen Beschreibungs- und Analysemethoden wählen zu können. Dementsprechend wird dieses notwendige Hintergrundwissen intensiver diskutiert. Danach werden '''grundlegende deskriptive und analytische statistische Methoden''' dargestellt, wobei der Schwerpunkt auf ersteren liegt. Abschließend wird auf die grafische Darbietung der Ergebnisse in Form von '''Diagrammen''' eingegangen.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.1 Deskriptive Statistik|[1] Siehe Kapitel 1.2.1]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Formen#1.2.2 Analytische Statistik|[2] Siehe Kapitel 1.2.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[3] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[4] Siehe Kapitel 3.1.3]]<br />
 +
 
 +
 
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
</div>
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|Nächstes Kapitel: 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]'''
 +
----
 +
[[#3. Ausgewählte statistische Grundlagen und Analysemethoden|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|Vorheriges Kapitel: 3. Ausgewählte statistische Grundlagen und Analysemethoden]]'''
 +
= 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
==== '''Analysemethoden''' sind '''abhängig von Datenart, -ausprägung, -anzahl und -verteilung:''' ====
 +
 
 +
Die Statistik bietet eine Vielzahl von Verfahren, mit deren Hilfe man Aufschlüsse über Sachverhalte gewinnen kann. Die meisten Verfahren können jedoch nur verwendet werden, wenn bestimmte Bedingungen erfüllt sind. Die Auswahl der möglichen Verfahren hängt besonders ab von
 +
 
 +
* der Art der Daten und den damit zusammenhängenden '''Skalenniveaus[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]'''
 +
* der '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' '''der Ausprägungen''' einer Variable
 +
* der '''Größe''' der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3]]]'''
 +
* dem (Nicht-)Auftreten von sogenannten ’'''Ausreißern'''’ oder '''Extremdaten'''
 +
 
 +
Falls Verfahren außerhalb ihrer Anwendungsbedingungen verwendet werden, ist die Wahrscheinlichkeit groß, dass sinnleere oder falsche Aussagen erhalten werden.
 +
 
 +
==== '''Körpergrößen und Lieblingsobst''' ====
 +
 
 +
Wenn wir in einer Schulklasse die durchschnittliche Körpergröße der SchülerInnen ermitteln wollen, wäre das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4]]]''' eine durchaus vernünftige Kennzahl. Wir zählen dazu alle Körpergrößen zusammen und dividieren die Summe durch die Anzahl der KlassenschülerInnen. Wenn wir hingegen ermitteln möchten, was diese Schulklasse als Lieblingsobst bevorzugt, wäre das '''arithmetische Mittel''' Schwachsinn. Wir kämen dann zu wenig sinnvollen Aussagen, dass die Klasse 0,17 Äpfel, 0,12 Orangen, 0,11 Bananen etc. als Lieblingsobst aufweist.
 +
 
 +
Dass im ersten Fall das '''arithmetische Mittel''' verwendet werden konnte, im zweiten Falle jedoch nicht, hängt mit den unterschiedlichen Skalenniveaus zusammen. So gehört die Körpergröße zur '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[5]]]''', während das Lieblingsobst in eine '''Nominalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6]]]''' eingeordnet wird.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2] Siehe Kapitel 3.1.3]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3] Siehe Kapitel 2.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[5] Siehe Kapitel 3.1.2.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[6] Siehe Kapitel 3.1.2.2]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten (Daten)|3.1.1 Arten von Messwerten (Daten)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|3.1.1.1 Metrische und nichtmetrische Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|3.1.1.2 Stetige und diskrete Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|3.1.2 Skalenniveaus]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.1 Skalierungsniveaus bildlich erklärt|3.1.2.1 Skalierungsniveaus bildlich erklärt]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|3.1.2.2 Nominalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|3.1.2.3 Ordinalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|3.1.2.4 Intervallskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|3.1.2.5 Proportionalskalierung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.6 Skalierungstypen, Aussagen und Methoden|3.1.2.6 Skalierungstypen, Aussagen und Methoden]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|3.1.3 Verteilungen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|3.1.3.1 Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|3.1.3.2 Andere Verteilungsformen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3 Test auf Normalverteilung|3.1.3.3 Test auf Normalverteilung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS|3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS]]<br />
 +
</div>
 +
 
 +
== 3.1.1 Arten von Messwerten (Daten) ==
 +
 
 +
Statistisch unterscheidet man Daten
 +
 
 +
* in welcher Weise die Umsetzung in numerische Werte zur sinnvollen Ordnung und weiteren möglichen Erkenntnissen führt: '''metrische und nichtmetrische Variable''';
 +
* über die Abstufungen ihrer Ausprägungen: '''stetige und diskrete Variable'''
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.1.1 Metrische und nichtmetrische Variablen  ===
 +
 
 +
==== '''Metrische und nichtmetrische Variablen''' ====
 +
 
 +
Prinzipiell können wir zwischen '''metrischen''' und '''nichtmetrischen''' '''Variablen''' unterscheiden. Als '''metrische''' Merkmale (auch '''quantitative''' genannt) bezeichnet man '''Merkmale''', deren '''Ausprägungen''' sich mittels Zahlen darstellen lassen, wobei auch '''Rangunterschiede und Abstand sinnvoll interpretiert''' werden können. Als '''nichtmetrische Variablen''' werden dementsprechend alle anderen bezeichnet.
 +
 
 +
'''Beispiele:'''<br />
 +
Wir können somit z.B. Körpergrößen sinnvoll reihen (von klein nach groß mit beliebig feinen Abstufungen) und auch Größenunterschiede vernünftig interpretieren. Fragen wir hingegen nach dem Lieblingsobst, wird die Reihung der Ergebnisse willkürlich sein und meist alphabetisch erfolgen. Theoretisch könnte man jedem Obst einen Zahlenwert zuweisen, dieser wird jedoch nichts über den dahinterliegenden Wert aussagen, also zufällig mit diesem verbunden sein. Ränge, wie z.B. der Beliebteste, der Zweitbeliebteste, der Drittbeliebteste usw. lassen sich zwar sinnvoll reihen, ihre Abstände lassen sich aber nicht interpretieren. D.h. wir können nicht sagen, dass der Drittbeliebteste gegenüber dem Viertbeliebtesten den gleichen Abstand hat wie der Beliebteste gegenüber dem Zweitbeliebtesten. '''Daher sind sowohl Nominaldaten (wie das erwähnte Obst) wie auch Ordinaldaten nichtmetrisch.'''
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.1.2 Stetige und diskrete Variablen  ===
 +
 
 +
'''Stetige und diskrete Variablen'''
 +
 
 +
Metrische Daten können ebenfalls wieder unterschieden werden, nämlich in
 +
 
 +
* '''stetige oder kontinuierliche, wenn sie jeden beliebigen Wert eines bestimmten Intervalls annehmen können''' (z.B. Körpergröße 175,33 cm, Temperatur); und
 +
* '''diskrete, wenn sie nur endlich viele Werte annehmen können''' (z.B. Augenzahl beim Würfeln, Anzahl der Kinder)
 +
 
 +
 
 +
== 3.1.2 Skalenniveaus ==
 +
 
 +
'''Skalenniveaus''' (von ''scala'' ital. ’Treppe’) sind eindimensionale Folgen von Positionen, die unterschiedliche Ausprägungen eines Merkmals anzeigen.
 +
 
 +
Jede Variable kann einer bestimmten Form von '''Skalierung''' zugeordnet werden. Nach der Möglichkeit, die Ausprägungen sinnvoll zu reihen und bestimmte mathematische Operationen durchzuführen, unterscheidet man zwischen vier verschiedenen Skalierungsniveaus: '''Nominalskalierung, Ordinalskalierung, Intervallskalierung''' und '''Proportionalskalierung'''.
 +
 
 +
Je nach Skalierungsniveau können sehr viele Analyseverfahren (wie bei der '''Proportionalskalierung''') oder sehr wenige Verfahren (wie bei der '''Nominalskalierung''') zur Auswertung eingesetzt werden. Daher ist die Wahl der Art der Daten und '''Skalenniveaus''' bereits bei der Forschungskonzeption zu berücksichtigen.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.2.1 Skalierungsniveaus bildlich erklärt  ===
 +
 
 +
Die technische Definition der '''Skalierungsniveaus''' hat den Nachteil, dass viele Menschen sich unter ihnen nichts vorstellen können. Machen wir es etwas anschaulicher und auch mit Treppen.
 +
 
 +
Stellen Sie sich vor, Tischler sehr unterschiedlicher Begabung und Erfahrung würden Stufen für eine Treppe bauen.
 +
 
 +
==== '''Nominalskala:''' ====
 +
 
 +
Wir hätten zuerst den Amateurtischler, welcher extrem ungleichförmige Stufen baut. Die eine Stufe ist links viel höher als rechts, die andere hinten höher als vorne. Keine einzige ist so gleichförmig, dass sie überall höher ist als alle anderen, keine einzige ist so gleichförmig, dass sie überall niedriger ist als alle anderen. Mit anderen Worten: wir können die Stufen beliebig hintereinander reihen. Wir finden keinen eindeutigen logischen und zwingenden Ansatz zur Reihung. Nehmen wir die Höhe links, würden wir die Stufe A vor der Stufe B vor der Stufe C reihen; nehmen wir die Höhe rechts, die Stufe B vor der Stufe C vor der Stufe A; nehmen wir die Höhe vorne etc.
 +
 
 +
'''Eine derartige Treppe, die sich beliebig zusammensetzen lässt und eigentlich gar keine Treppe ist''', weil man auf ihr nicht höher steigen kann, würde der '''Nominalskala''' entsprechen: Was besitzt man: Äpfel, Birnen, ein Auto, einen Hund etc.
 +
 
 +
==== '''Ordinalskala:''' ====
 +
 
 +
Der Tischler wird nun etwas geschickter. Er schafft es, die Stufen jeweils unterschiedlich hoch zu machen und zwar überall. Die Stufe B ist 1,2x so hoch wie die Stufe A, die Stufe C doppelt so hoch wie die Stufe B, die Stufe D 3x so hoch wie die Stufe C, die Stufe E 1,3x so hoch wie die Stufe D. '''Es ist nicht vorauszusagen, um wieviel die nächsthöhere Stufe höher sein wird, aber man weiß, sie ist höher'''. Es ist ein beschwerlicher Aufstieg, aber es ist ein Aufstieg. Das würde einer '''Ordinalskala''' entsprechen. Ein Beispiel dafür wäre eine Notenskala. Man weiß zwar nicht, um wieviel besser ein Schüler mit einem Sehr Gut als ein Schüler mit einem Gut war, aber dass es einen Unterschied gegeben hat, erscheint klar zu sein (außer der Lehrer war bekannt subjektiv, was vorkommen soll).
 +
 
 +
==== '''Intervallskala:''' ====
 +
 
 +
Der Tischler wird noch geschickter. er schafft es sogar alle Stufen jeweils um 30 cm höher zu machen als die jeweils vorausgegangene. Man kann nun blind die Stufen hinaufgehen, weil man die Abstände kennt. Das Problem: Die Stiege steht auf einem Schiff, welches im Mittelmeer herumfährt. Ich weiss nun zwar, dass ich 30 cm höher steige, wenn ich eine Stufe hinaufschreite und 90, wenn ich drei Stufen hinaufschreite, aber ich kann nicht angeben, in welcher Höhe über dem Meeresboden ich mich befinde. Sind es 150 m, sind es 300? Dadurch kann ich auch nicht angeben, ob ich mich auf der übernächsten Stufe doppelt so hoch befinde wie jetzt. '''Ich kann zwar mit fixen Abständen rechnen, aber ich habe keinen absoluten Nullpunkt''' (wo es nicht mehr tiefer geht, wie zum Meeresboden) zum Vergleich und daher kann ich nicht angeben, um wieviel höher ich sein werde, wenn ich x Stufen höhersteige. Dies nennt man eine '''Intervallskala''', die Stufen werden in gleichen Intervallen höher.
 +
 
 +
Ein Beispiel dafür wäre unsere Temperaturskala in Celsius, wo wir nicht vom absoluten Nullpunkt ausgehen (das wäre der Meeresboden oder - 273 Grad Celsius), sondern von einem willkürlichen (nämlich vom Schiffsboden aus oder 0 Grad). Daher ist die Aussage, 10 Grad ist 5 Grad wärmer als 5 Grad richtig, aber die Aussage falsch, dass es damit doppelt so warm ist, denn tatsächlich hätte ich ein Verhältnis von 283 Grad: 278 Grad (vom absoluten Nullpunkt aus gemessen).
 +
 
 +
==== '''Proportionalskala:''' ====
 +
 
 +
Wenn wir die gleiche Stiege wie bei der Intervallskala nun an Land bringen und sie auf festen Boden stellen, dann können wir von einer '''Proportionalskala''' sprechen. Endlich können wir, wenn wir uns auf der dritten Stufe befinden, nicht nur sagen, wir sind jetzt 60 cm höher als auf der ersten. Wir können auch endlich die '''Verhältni'''ss'''e richtig interpretieren'''. Wir können nun auch korrekt angeben, dass wir uns jetzt auf der dritten Stufe dreimal so hoch wie auf der ersten Stufe befinden (mit dem festen Boden als absolutem Nullpunkt, unter den kein Abstieg möglich ist). Dies ist nun eine Proportionalskala. Ein Beispiel dafür wären Körpergrößen. Jemand, der 1,80 m groß ist, ist doppelt so groß wie jemand, der 90 cm groß ist.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.2.2 Nominalskalierung  ===
 +
 
 +
Bei der '''Nominalskalierung''' handelt es sich um eine Klassifizierung von Objekten, bei welcher '''keinerlei sinnvolle Rangreihung möglich''' ist, weshalb meist zur alphabetischen Reihung gegriffen wird. Größer und kleiner, mehr oder weniger wichtig, mehr oder weniger ausgeprägt kann nicht unterschieden werden. Jede Reihung ist gleich sinnvoll.
 +
 
 +
Beispiele für '''Nominalskalierungen''' wären Zeitungen, die man liest; das Obst, das man isst; das Geschlecht von ProbandInnen; die Farben von Kleidungsstücken etc.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.2.3 Ordinalskalierung  ===
 +
 
 +
Bei der '''Ordinal- oder Rangskalierung''' werden Gegenstände oder Sachverhalte miteinander verglichen und '''nur der Größe oder Intensität entsprechend gereiht'''. Eine Rangreihung ist möglich und sinnvoll, '''jedoch können die Abstände nicht interpretiert werden''', d.h. der Abstand vom Zweit- zum Drittgrößten kann anders sein als vom Dritt- zum Viertgrößten.
 +
 
 +
Beispiele wären die Beliebtheit von SchülerInnen (hier kann ich diese eindeutig danach reihen), die Sympathie für Zuwanderer etc.
 +
 
 +
==== '''Schulnoten ordinal- oder intervallskaliert?''' ====
 +
 
 +
Schulnoten werden von vielen behandelt, wie wenn sie zur '''Intervallskalierung''' gehören würden, in welcher Abstände interpretiert werden können. Daher errechnen viele zur Beurteilung der Qualität einer Klasse das arithmetische Mittel von Noten, was man jedoch nur bei zumindest intervallskalierten Variablen machen sollte. Überlegen wir: Falls Schulnoten intervallskaliert wären, müsste der Abstand von einer Schulnote zur nächstbesseren/- schlechteren einem präzisen und stabilen Leistungsunterschied zwischen SchülerInnen entsprechen. Oft ’steht’ man jedoch zwischen zwei Noten, die PrüferIn muss sich dennoch für eine entscheiden. Auch wenn alle SchülerInnen einer extrem begabten Klasse eine sehr gute Arbeit abgeben, wird die PrüferIn dennoch meistens versuchen, zwischen ihnen durch unterschiedliche Noten zu differenzieren, um die Motivation und den anspornenden Wettbewerb hochzuhalten. Daher gibt es trotz des offiziellen objektiven Anspruchs von Schulnoten einen zu hohen subjektiven Einfluss, um sie als '''intervallskalierte''' Variablen behandeln zu können.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.2.4 Intervallskalierung  ===
 +
 
 +
Bei der '''Intervallskalierung''' nimmt man '''gleiche Abstände (Intervalle)''' zwischen benachbarten '''Ausprägungen''' an, aber einen nur relativen und keinen absoluten '''Nullpunkt'''. Es kann zwar der Abstand zwischen den Werten interpretiert werden, nicht aber das Verhältnis der Werte zueinander.
 +
 
 +
Ein Beispiel für eine Intervallskala ist z.B. die Temperatur in Celsius. Es wäre falsch, anzunehmen, dass 10 Grad doppelt so warm sind wie 5 Grad. Bezogen auf den '''absoluten Nullpunkt''' (- 273 Grad) wäre das Verhältnis zwischen 10 Grad und 5 Grad genau 268:263.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.2.5 Proportionalskalierung  ===
 +
 
 +
Bei der '''Verhältnis- oder Proportionalskalierung''' gibt ''es'' einen '''absoluten Nullpunkt'''. '''Sowohl der Abstand zweier Werte wie auch ihr Verhältnis zueinander können interpretiert werden'''. Ein Baum mit einer Höhe von 3,6 Metern ist doppelt so hoch wie ein Baum mit einer Höhe von 1,8 Metern.
 +
 
 +
'''Beispiele''' für diese Form der Skalierung wären z.B. Körpergrößen, der Vitamingehalt von Früchten; der Wassergehalt von Körpern oder die Entfernung von Orten.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.2.6 Skalierungstypen, Aussagen und Methoden  ===
 +
 
 +
Die unterschiedlichen Skalierungsformen lassen unterschiedliche Analysemethoden zu:
 +
 
 +
[[File:quantitative-55_1.jpg|frame|center|Unterschiedliche Skalierungsformen, mögliche Aussagen und Analysemethoden mit Beispielen]]
 +
 
 +
'''Metrische Merkmale[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1]]]''' finden sich bei '''Intervall'''- und '''Proportionalskalierung''', '''nichtmetrische''' bei '''Nominal- und Ordinalskalierung'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1] Siehe Kapitel 3.1.1.1]]<br />
 +
 
 +
== 3.1.3 Verteilungen ==
 +
 
 +
'''(Häufigkeits-)Verteilungen''' geben Aufschluss über die Häufung aller Ausprägungen von Variablen. Man kann prinzipiell zwischen '''monovariablen''' und '''bivariablen Verteilungen''' unterscheiden.
 +
 
 +
'''Monovariable Verteilungen''' zeigen die '''Verteilung''' einer einzigen Variable, bei '''bivariablen Verteilungen''' werden die Häufigkeiten der einander entsprechenden Ausprägungen zweier Variablen aufgezählt, also z.B. 16 Personen sind sowohl weiblich wie auch Raucherinnen, 13 Personen männnlich und Nichtraucher.
 +
 
 +
Verteilungen können sowohl '''tabellarisch''' wie auch grafisch in Form von '''Diagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1]]]''' dargestellt werden.
 +
 
 +
Zur tabellarischen Darstellung gelangt man, indem man die Werte (nach Möglichkeit sinnvoll) reiht und daneben die jeweilige Häufigkeit der Werte einträgt.
 +
 
 +
[[File:quantitative-56_1.jpg|frame|center|Darstellung von Verteilungen]]
 +
 
 +
Zur grafischen Form gelangt man, wenn man in einem '''Diagramm''' auf der x- Achse die Ausprägung von Werten einträgt (z.B. die Körpergröße einer Person x) und auf der y- Achse deren Häufigkeit (= Zahl der Personen, welche genau diese Körpergröße aufweisen), dann können wir die Schnittpunkte mit Linien verbinden, wodurch sich eine Verteilungskurve ergibt. Die Standard- Darstellungsform dafür ist das '''Streudiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[2]]]'''.
 +
 
 +
Verschiedene Verfahren erforden eine vorliegende Normalverteilung, die mit verschiedenen Prozeduren abschätzbar ist.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[2] Siehe Kapitel 3.6.1.6]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.3.1 Normalverteilung  ===
 +
 
 +
Von einer Normalverteilung sprechen wir, wenn
 +
 
 +
* die größte Häufigkeit in der Nähe des '''arithmetischen Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' auftritt und somit das arithmetische Mittel annähernd mit dem '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2]]]''' und mit dem '''Modalwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3]]]''' zusammenfällt;
 +
* die '''Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4]]]''' der Werte umso mehr abnehmen, je weiter sie sich vom Mittelwert entfernen;
 +
* wenn sowohl links wie rechts des Mittelwerts eine '''prinzipielle Symmetrie''' vorliegt;
 +
* wenn die '''Verteilungskurve glockenförmig''' ist.
 +
 
 +
Eine Normalverteilung sieht wie in der folgenden Grafik aus:
 +
 
 +
[[File:quantitative-57_1.gif|frame|center|Grafische Darstellung einer Normalverteilungskurve]]
 +
 
 +
Die im Diagramm verlaufende Kurve gibt die Häufigkeit der jeweiligen Werte an. Man sieht, dass die größten Häufigkeiten beim Mittelwert auftreten (0), die geringsten Häufigkeiten an den Extremen, wobei die Kurve glockenförmig verläuft (so genannte Gauß’sche Glockenkurve).
 +
 
 +
Dies wäre eine optimale Normalverteilung.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2] Siehe Kapitel 3.3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|[3] Siehe Kapitel 3.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.3.2 Andere Verteilungsformen  ===
 +
 
 +
Neben der Normalverteilung können viele andere Verteilungsformen auftreten.
 +
 
 +
Oft sind die Verteilungen '''schief''', man unterscheidet dann zwischen '''linksschiefen''' oder '''rechtsschiefen Verteilungen.'''
 +
 
 +
Bei der '''linksschiefen''' Verteilung ('''negative skew''') liegt der höchste Punkt der Verteilung rechts (d.h. hier befindet sich der Großteil der Einträge), während nach links ein langgezogener Abfall eintritt (d.h. es treten dort selten verwendete Extremwerte auf). In '''linksschiefen''' Verteilungen ist der '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''' größer als das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]'''.
 +
 
 +
[[File:quantitative-58_1.jpg|frame|center|Grafische Darstellung einer linkschiefen Verteilung]]
 +
 
 +
Bei der '''rechtsschiefen Verteilung''' ('''positive skew''') finden wir die überwiegende Mehrzahl der Einträge auf der linken Seite und damit auch den höchsten Punkt der Kurve, während nach rechts wenige Einträge auftauchen. Typisch für eine derartige '''Verteilung''' ist die Einkommensverteilung sozial ungerechter Länder, in welchen wenigen MultimilliardärInneen viele KleinverdienerInnen gegenüberstehen. In '''rechtsschiefen''' Verteilungen ist der '''Median''' kleiner als das '''arithmetische Mittel'''.
 +
 
 +
[[File:quantitative-58_2.jpg|frame|center|Grafische Darstellung einer rechstschiefen Verteilung]]
 +
 
 +
Verteilungen können auch mehrere Gipfel aufweisen:
 +
 
 +
[[File:quantitative-58_3.jpg|frame|center|Bimodale Verteilung]]
 +
 
 +
Diese Verteilung weist insgesamt zwei Gipfel auf. Sie wird als bimodal (zweigipfelig) bezeichnet.
 +
 
 +
[[File:quantitative-58_4.jpg|frame|center|Rechteckige Verteilung]]
 +
 
 +
Diese Verteilung ist rechteckig. Sie könnte bei einer kleinen '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3]]]''' auftreten, wenn fast alle Werte die gleiche '''Häufigkeit[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4]]]''' aufweisen.
 +
 
 +
[[File:quantitative-58_5.jpg|frame|center|U-förmige, bimodale Verteilung]]
 +
 
 +
Diese Verteilungsform ist '''u-förmig'''. Die Extremwerte kommen sehr häufig vor, während mittlere Ausprägungen fast nicht auftreten. Auch diese Verteilung ist '''bimodal''.'''''
 +
 
 +
 
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1] Siehe Kapitel 3.3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[3] Siehe Kapitel 2.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[4] Siehe Kapitel 3.1.3.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.3.3 Test auf Normalverteilung  ===
 +
 
 +
Verschiedene Verfahren sind nur sinnvoll anwendbar, falls annähernd eine '''Normalverteilung''' der Daten vorliegt. Dazu gehört z.B. die '''Maßkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1]]]''', aber auch das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' ist nur wenig aussagekräftig, wenn die '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3]]]''' der Daten durch '''Ausreißer''' und '''extreme Schiefe''' geprägt sind.
 +
 
 +
Für den Nachweis einer '''Normalverteilung''' kann auf drei wesentliche Methoden zurückgegriffen werden:
 +
 
 +
* '''optisch''': Für die optische Abschätzung der '''Normalverteilung''' kann auf die grafische Wiedergabe (siehe oben, mit Statistik- Programmen z.B. mit der grafischen Darstellung des '''Histogramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4]]]''') zurückgegriffen werden
 +
* '''statistisch-mathematisch''' auf den '''Kolmogorov-Smirnov-Test''' (falls die Werte nicht in Klassen eingeteilt sind, besonders auch bei kleinen Stichproben)
 +
* oder auf den '''Chi-Quadrat-Test (Wikipedia)[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;5&#93;]''' (bei in Klassen eingeteilten Daten)
 +
 
 +
==== '''Erkennung mit SPSS''' ====
 +
 
 +
Diese verschiedenen und als eigene Unterpunkte angeführten Untersuchungen können unter '''SPSS''' auch gleichzeitig getätigt werden. Klicken Sie dazu auf ANALYSIEREN -> DESKRIPTIVE STATISTIKEN -> EXPLORATIVE DATENANALYSE. Wählen Sie dort unter ’Anzeige’ die Alternative ’Beide’ und unter ’Diagramm’ die Alternative ’Normalverteilungsdiagramm mit Tests’. Dann wird in der Bildschirmausgabe der Resultate ein eigener Punkt aufgeführt: ’Tests auf Normalverteilung’, von denen uns besonders der erste der beiden Tests interessiert '''’Kolmogorov-Smirnov’''' (eigentlich eine verschärfte Variante dieses Tests). Liegt der Wert, welcher unter ’Signifikanz steht’, unter 0,05, so ist mit 95 % Sicherheit eine Normalverteilung zu verwerfen, liegt er unter 0,01, sogar mit 99 % Sicherheit.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1] Siehe Kapitel 3.5.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[3] Siehe Kapitel 3.1.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[4] Siehe Kapitel 3.6.1.5]]<br />
 +
[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;5&#93; http://de.wikipedia.org/wiki/Chi-Quadrat-Test]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm  ===
 +
 
 +
Das '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''' liefert uns einen ersten und recht brauchbaren Eindruck, ob die von uns analysierten Daten weitgehend normalverteilt sind. Mit SPSS ist die Herstellung eines derartigen Diagramms ein Kinderspiel:
 +
 
 +
A. Klicken Sie in der Menüleiste auf GRAFIKEN
 +
 
 +
B. Wählen Sie Histogramm
 +
 
 +
C. Wählen Sie die zu untersuchende Variable aus
 +
 
 +
D. Lassen Sie sich am besten auch die Normalverteilungskurve zu Vergleichszwecken hinzeichnen (mit Häkchen markieren).
 +
 
 +
E. Klicken Sie auf OK
 +
 
 +
Dann erhalten Sie z.B. das folgende '''Histogramm''' (alle folgenden Histogramme und Analysen wurden von der SPSS-Datei world95.sav abgeleitet):
 +
 
 +
[[File:quantitative-60_1.jpg|frame|center|Optischer Nachweis einer Normalverteilung mittels Histogramm]]
 +
 
 +
Hier ist z.B. eine stärkere Abweichung von der '''Normalverteilung''' gegeben. Man beachte den großen Zwischenraum zwischen der Normalverteilungskurve und den tatsächlichen Werten bei einem Kalorien-Input von etwa 3000. Dennoch wäre auf dem 5-%-Signifikanz-Niveau die Annahme einer Normalverteilung mit dem '''Kolmogorov-Smirnov-Test[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2]]]''' noch nicht widerlegt (wohl aber auf dem 10-%-Niveau).
 +
 
 +
Das folgende Diagramm zeigt eine noch deutlich stärkere Abweichung von der '''Normalverteilung''':
 +
 
 +
[[File:quantitative-60_2.jpg|frame|center|Grafische Darstellung einer stärkeren Abweichung von der Normalverteilung]]
 +
 
 +
In diesem Fall ist auch der '''Kolmogorov-Smirnov-Tes'''t hochgradig signifikant (sowohl auf dem 5-% wie auch auf dem 1-%-Niveau), weshalb die Annahme einer Normalverteilung verworfen werden muss.
 +
 
 +
Deutlich '''normalverteilt''', sowohl grafisch erkennbar wie auch mit dem '''Kolmogorov-Smirnov-Test''' nicht verwerfbar, ist die folgende Verteilung. Es finden sich kaum Zwischenräume zwischen der '''Normalverteilungskurve''' und der tatsächlichen Verteilung:
 +
 
 +
[[File:quantitative-60_3.jpg|frame|center|Grafische Darstellung einer deutlichen Normalverteilung]]
 +
 
 +
Man sieht, dass das Histogramm meist eine sehr gute Abschätzmöglichkeit erlaubt, ob Variable '''normalverteilt''' sind.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[2] Siehe Kapitel 3.1.3.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test  ===
 +
 
 +
Der Kolmogorov-Smirnov-Test kann auch bei kleineren Stichproben eingesetzt werden, um zu überprüfen, ob eine gegebene Verteilung mit hoher Wahrscheinlichkeit von der Normalverteilung abweicht.
 +
 
 +
Die Berechnung basiert auf dem Vergleich mit einer hypothetischen Normalverteilungskurve (Bild von Internet-Enzyklopädie Wikipedia: '''http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test[http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test &#91;1&#93;]'''):
 +
 
 +
[[File:quantitative-61_1.jpg|frame|center|Kolmogorov-Smirnov-Test - Vergleich einer vorliegenden Verteilung mit einer hypothetischen Normalverteilungskurve. Quelle: Wikipedia - http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test.]]
 +
 
 +
Die Logik der Berechnung geht davon aus, dass die tatsächliche Verteilung von einer hypothetischen Normalverteilung an einem beliebigen Punkt eine bestimmte flächenmäßige Abweichung nicht überschreiten darf, andernfalls müsste die Annahme einer Normalverteilung verworfen werden. Daher wird in einer Reihe von Rechenschritten die jeweilige konkrete Abweichung errechnet. Die größte auftretende Abweichung wird mit einer Tafel des Kolmogorov- Smirnov-Tests verglichen.
 +
 
 +
Ein Beispiel einer manuellen Berechnung kann hier eingesehen werden. Natürlich werden die Werte heute wesentlich komfortabler, z.B. mit '''SPSS''', ermittelt.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test &#91;1&#93; http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS  ===
 +
 
 +
A. Sie wählen in SPSS den Menüpunkt ANALYSIEREN
 +
 
 +
B. Aus den heruntergeklappten Alternativen wählen Sie NICHTPARAMETRISCHE TESTS
 +
 
 +
C. Aus den nächsten Auswahlpunkten, die sich rechts öffnen, wählen Sie K-S BEI EINER STICHPROBE....
 +
 
 +
D. Nun wählen Sie die Testvariable aus, welche Sie auf Normalverteilung prüfen möchten. Achten Sie darauf, dass links unten unter Testverteilung der Punkt ''Normal'' angewählt ist.
 +
 
 +
E. Klicken Sie auf OK
 +
 
 +
F. Sie erhalten nun eine Bildschirmausgabe wie folgende:
 +
 
 +
[[File:quantitative-62_1.jpg|frame|center|Kolmogorov-Smirnov-Anpassungstest mit SPSS]]
 +
 
 +
G. Hier sind für uns die folgenden Werte von Belang: 1. ''N'' (in diesem Falle 8), Extremste Differenzen 0,320) und ''Asymptotische Signifikanz''.
 +
 
 +
H. Nun vergleichen wir diese beiden ersten Werte mit einer Tabelle für den Kolmogorov-Smirnov-Test. Die nachfolgende Tabelle gibt bei einer 5 % Irrtumswahrscheinlichkeit Grenzwerte für Stichproben an, bei denen ''n'' zwischen 1-35 liegt.
 +
 
 +
[[File:quantitative-62_2.jpg|frame|center|Tabelle für den Kolmogorov-Smirnov-Test]]
 +
 
 +
Wir suchen nun den Wert für N = 8 und sehen dort die Zahl ''0,454''. Falls die ''Extremste Differenz'' in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine '''Normalverteilung''' vor. In unserem Fall haben wir jedoch eine ''Extremste Differenz'' von nur ''0,32''. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer '''Standardverteilung''' nicht verworfen werden muss. Ein wirklicher Beweis für eine Standard- Verteilung liegt allerdings dadurch nicht vor.
 +
 
 +
Auch unser Wert für die ''Asymptotische Signifikanz'' ist weit größer als der Grenzwert 0,05. Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % '''Signifikanzniveau[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]'''). Da unser Wert jedoch deutlich darüber liegt, kann die Arbeitshypothese einer Normalverteilung auf diesem '''Signifikanzniveau''' nicht verworfen werden.
 +
 
 +
'''Achtung:''' Der '''Kolmogorov-Smirnov-Test''' benötigt, v.a. bei kleinen '''Stichproben''', extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. Daher ist eine Nichtverwerfung der Annahme einer Normalverteilung durch diese Berechnungsform noch kein Beweis für das Vorliegen einer Normalverteilung. Sollte sich im '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2]]]''' eine extreme Abweichung von der fakultativ gezogenen Normalverteilungskurve zeigen, dann sollte man, auch wenn der Kolmogorov-Smirnov-Test diese nicht verwirft, dennoch eher zu nicht parametrischen Tests greifen (wie z.B. dem '''T-Test''' etc.)
 +
 
 +
Hier ein Link zu weiterführenden Tabellen, in welchen noch weitere Irrtumswahrscheinlichkeiten für die Berechnung der Abweichung von einer Standardverteilung herangezogen werden: '''https://www.erieri.com/dlc[https://www.erieri.com/dlc/onlinetextbook/table7 &#91;3&#93;]'''
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2] Siehe Kapitel 3.6.1.5]]<br />
 +
[https://www.erieri.com/dlc/onlinetextbook/table7 &#91;3&#93; https://www.erieri.com/dlc/onlinetextbook/table7]<br />
 +
 
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|Nächstes Kapitel: 3.2 Die Ermittlung von Häufigkeiten]]'''
 +
----
 +
[[#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden|Vorheriges Kapitel: 3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden]]'''
 +
= 3.2 Die Ermittlung von Häufigkeiten =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Bei der '''Ermittlung von Häufigkeiten''' stellen wir fest, '''wie oft die verschiedenen Messwerte auftreten'''.
 +
 
 +
Die Ermittlung von '''Häufigkeiten''' ist das einfachste statistische Verfahren und kann für jede Art von '''Skala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' angewandt werden. Die Häufigkeiten der Messwerte geben uns Hinweise auf ihre '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' d.h. wie oft die einzelnen Ausprägungen vorkamen. Die Kenntnis dieser Verteilung gibt uns somit Auskunft darüber, was in einer untersuchten Stichprobe der Normalfall, und was die Ausnahme ist.
 +
 
 +
Dabei wird das Auftreten von Werten gezählt. Prinzipiell unterscheiden wir zwischen
 +
 
 +
* '''Monovariablen Verteilungen:''' eine einzige Variable wird gezählt. So kommen wir z.B. zu Häufigkeiten von Schulnoten (22 SchülerInnen hatten eine 1, 37 eine 2 usw.)
 +
* '''Bi- bzw. multivariablen Verteilungen:''' Es wird gezählt, wie häufig Kombinationen von zwei oder mehr Variablen auftreten (z.B. Schulnoten und soziale Schicht; 17 SchülerInnen gehörten zur Oberschicht und hatten eine 1, 22 SchülerInnen zur Oberschicht und hatten eine 2 etc.). Mit '''Bi- oder multivariablen Verteilungen''' möchte man Zusammenhänge zwischen zwei Variablen feststellen.
 +
 
 +
Die tabellarische Darstellung der Häufigkeiten in bi- bzw. multivariablen Verteilungen wird auch als '''Kreuztabelle[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3]]]''' oder '''Kontingenztafel''' bezeichnet.
 +
 
 +
Nach der Systematik der Darstellung unterscheidet man zwischen der '''Urliste''', der '''primären Tafel''' bzw. der '''Häufigkeitstabelle.'''
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2] Siehe Kapitel 3.1.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[3] Siehe Kapitel 3.5.2]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|3.2 Die Ermittlung von Häufigkeiten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|3.2.1 Liste und Tafeln]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|3.2.2 Häufigkeitstabelle]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.1 Häufigkeitsberechnung mit SPSS|3.2.2.1 Häufigkeitsberechnung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2.2 Grafische Darstellung mit SPSS|3.2.2.2 Grafische Darstellung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung (Gruppierung) von Daten|3.2.3 Klassenbildung (Gruppierung) von Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3.1 Gruppierung mit SPSS|3.2.3.1 Gruppierung mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS|3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS]]<br />
 +
</div>
 +
 
 +
== 3.2.1 Liste und Tafeln ==
 +
 
 +
==== '''Urliste''' ====
 +
 
 +
Aufgenommene '''Messwerte''' sind anfangs ungeordnet. Denken Sie z.B. an 30 Personen, deren Alter Sie abgefragt haben, ohne die Einträge größenmäßig zu ordnen. Diese '''ungeordnete Liste''' wird als so genannte '''Urliste''' bezeichnet. Eine '''Urliste''' ist die ungeordnete Aufzählung der Werte in der gleichen Reihenfolge, in der sie während der Abfrage aufgenommen wurden.
 +
 
 +
'''Beispiel: Kinderzahl von Befragten'''
 +
 
 +
[[File:quantitative-64_1.jpg|frame|center|Beispiel für eine Urliste - Kinderanzahl der Befragten]]
 +
 
 +
==== '''Primäre Tafel''' ====
 +
 
 +
Wesentlich übersichtlicher ist bereits die '''primäre Tafel, in welcher die Ausprägungen sortiert werden.''' Sie gibt deutlich mehr Aufschluss über die Charakteristiken der Daten. Hier ist auf einen Blick erkennbar, dass die Messwerte 1 und 2 am häufigsten vorkommen:
 +
 
 +
[[File:quantitative-64_2.jpg|frame|center|Beispiel für eine Primäre Tafel - Kinderanzahl der Befragten]]
 +
 
 +
Dennoch ist auch eine '''Primäre Tafel''' im Vergleich mit einer Häufigkeitstabelle wenig übersichtlich.
 +
 
 +
 
 +
== 3.2.2 Häufigkeitstabelle ==
 +
 
 +
'''Häufigkeitstabellen''' zeigen in tabellarischer Form die '''Ausprägungen einer Variablen verbunden mit deren Häufigkeit.''' Sie sind weit übersichtlicher als '''Listen''' und '''Tafeln'''.
 +
 
 +
Dabei trägt man in der 1. Spalte die Messwerte ein (wie z.B. Kinderzahl oder hier Ländernamen), in der 2. Spalte die absolute Häufigkeit der Messwerte (durchzählen, wie oft z.B. Frankreich genannt wird) und in Spalte 3 berechnet man die ''relative Häufigkeit''. Die relative Häufigkeit errechnet man folgendermaßen: man nimmt die absolute Häufigkeit eines Messwertes (z.B. waren 16 FranzösInnen beim Kongress), dividiert diesen durch die Summe der Messwerte (hier insgesamt 50 anwesende WissenschaftlerInnen) und multipliziert das Ergebnis mit 10 (um auf Prozentwerte zu kommen). Für FranzösInnen daher 16/50*100=32 %. [[File:quantitative-65_1.jpg|frame|center|Häufigkeitstabelle - Herkunft der WissenschaftlerInnen eines Kongreß]]
 +
 
 +
==== '''Akkumulierte Häufigkeit''' ====
 +
 
 +
Wenn keine '''Nominalskalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1]]]''' vorliegt, ist auch die Darstellung der '''akkumulierten Häufigkeit''' sinnvoll. Sie gibt Auskunft über die '''Häufigkeit''' aller Messwerte, die bis zu einem bestimmten Niveau auftreten.
 +
 
 +
Man errechnet sie folgendermaßen: Man zählt alle relativen Häufigkeiten zusammen, die einschließlich dieser Zeile auftraten: Die akkumulierte Häufigkeit für die Note 3 (= alle EthnologInnen, die zumindest die Note 3 erhielten) wäre daher: 19,2 % + 21,8 % + 28,2 % = 69,2 %.
 +
 
 +
[[File:quantitative-65_2.jpg|frame|center|Häufigkeitstabelle - Noten von EthnologInnen]]
 +
 
 +
Eine derartige '''Häufigkeitstabelle''' kann, wie vorhin beschrieben, auch mehrdimensional sein ('''multivariabel'''): [[File:quantitative-65_3.jpg|frame|center|mehrdimensionale Häufigkeitstabelle Integrationserfolge und Nationalsprache von AfrikanerInnen]]
 +
 
 +
Eine Häufigkeitstabelle hat folgende Vorzüge:
 +
 
 +
* Sie ist übersichtlicher als eine Urliste
 +
* Sie ist kürzer als eine primäre Tafel
 +
* Sie ist ökonomisch
 +
* Sie erlaubt eine leichte Beurteilung der Verteilung
 +
* Trotz dieser Vorteile tritt kein Informationsverlust auf.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1] Siehe Kapitel 3.1.2.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.2.2.1 Häufigkeitsberechnung mit SPSS  ===
 +
 
 +
Die Berechnung von Häufigkeiten mit '''SPSS''' erfolgt folgendermaßen:
 +
 
 +
A. Klicken Sie in der Menüleiste auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - HÄUFIGKEITEN.
 +
 
 +
B. Fügen Sie im Feld ''Variablen'' die Variable ein, von der Sie eine Häufigkeitstabelle erstellen möchten.
 +
 
 +
C. Klicken Sie auf OK.
 +
 
 +
Sie erhalten dann z.B. folgende Ausgabe:
 +
 
 +
[[File:quantitative-66_1.gif|frame|center|Häufigkeitsberechnung mit SPSS - Beispiel Wohnbezirk]]
 +
 
 +
Sie sehen, dass '''SPSS''' in der ersten Spalte die Ausprägungen der Variable anbietet, in der Spalte '''Häufigkeit''' die '''absolute Häufigkeit''', mit welcher diese Ausprägung auftritt. Unter '''Prozent''' finden Sie die prozentuellen Anteile der absoluten Häufigkeiten der Ausprägungen an der Stichprobengröße (N ist hier 154).
 +
 
 +
Links unten sehen Sie das Label ''Fehlend''. Hier wird die Zahl der bei dieser Frage nicht vorhandenen Antworten vermerkt (Im Fall dieser Stichprobe haben 23 Personen diese Frage nicht beantwortet). Da daher die eigentliche Größe der Stichprobe bei 131 liegt (154 weniger 23 Nichtbeantwortende), verändern sich auch die realen Prozentwerte, wie in der Spalte ''Gültige Prozente'' ersichtlich. Die Spalte '''Kumulierte Prozente''' gibt die in Prozenten ausgedrückte akkumulierte Häufigkeit an und basiert ebenfalls auf den bereinigten Werten (also minus die Null- Einträge).
 +
 
 +
Bereits in der Standard-Vorgabe rechnet SPSS daher alle für eine '''Häufigkeitstabelle''' notwendigen Analysen. Werfen Sie auch einen Blick auf die fakultativen Auswahlmöglichkeiten unter '''Statistik und Diagramme'''. SPSS kann mit wenigen Arbeitsgängen äußerst umfangreiche Berechnungen durchführen.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.2.2.2 Grafische Darstellung mit SPSS  ===
 +
 
 +
Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIK - HÄUFIGKEITEN und wählen Sie dort die Variable aus, deren Häufigkeitsverteilung Sie grafisch darstellen möchten.
 +
 
 +
Klicken Sie dann auf Diagramme. Sie haben nun die Auswahlmöglichkeit zwischen '''Balkendiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1]]]''', '''Kreisdiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[2]]]''' und '''Histogrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3]]]'''. Je nach Datenlage sollten Sie unterschiedliche Diagrammtypen heranziehen. Siehe dazu den Punkt '''Diagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|[4]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1] Siehe Kapitel 3.6.1.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[2] Siehe Kapitel 3.6.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3] Siehe Kapitel 3.6.1.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|[4] Siehe Kapitel 3.6.2]]<br />
 +
 
 +
 
 +
== 3.2.3 Klassenbildung (Gruppierung) von Daten ==
 +
 
 +
Unter der '''Gruppierung von Daten''' verstehen wir die '''Zusammenfassung von verschiedenen Ausprägungen zu Klassen'''. Eine Klasse ist die '''Menge sämtlicher Messwerte''', die '''innerhalb festgelegter Grenzen''' liegen. Dadurch kann die '''Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''' einer Variablen mit einer Vielzahl unterschiedlicher Ausprägungen übersichtlicher dargestellt werden.
 +
 
 +
'''Beispiel: Gemessene Körpergrößen und Umwandlung in Klassen'''<br />
 +
Ein Beispiel wären Größenangaben in cm. Wollte man statistische Aussagen über die Körpergrößen von ÖsterreicherInnen machen, müsste man wahrscheinlich (bei einem Alter ab 14) etwa 90 verschiedene Werte angeben (von 1,20 bis 2,19). Eine derartige Tabelle wäre unübersichtlich und würde über mehrere Seiten führen:
 +
 
 +
[[File:quantitative-68_1.jpg|frame|center|Gemessene Körpergrößen]]
 +
 
 +
Viel übersichtlicher wäre es aber, diese 100 verschiedenen Ausprägungen zu '''Klassen''' von benachbarten Messwerten zusammenzufassen. Treten extrem viele unterschiedliche Ausprägungen auf, sind 10-19 Klassen sinnvoll. Wählt man bei diesem Beispiel 10 Klassen, fallen jeweils 10 Messwerte in eine Klasse (100:10=10): [[File:quantitative-68_2.jpg|frame|center|In Klassen eingeteilte Körpergrößen]]
 +
 
 +
Die '''Klassenbreite''' ist bei '''diskreten Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[2]]]''' die Anzahl der in der Klasse zusammengefassten Messwerte. Berechnet wird sie mit: ''Höchster Wert der Klasse'' minus ''höchstem Wert der vorausgegangenen Klasse'' (hier also mit z.B. 1,89 m- 1,79 m= 0,10 m).
 +
 
 +
Die ''(exakten)'' '''Klassengrenzen (Intervallgrenzen)''' sind die kleinsten bzw. größten Messwerte einer Klasse (hier also z.B. 1,70 m und 1,79999 =1,8 m).
 +
 
 +
Bei richtiger '''Klassenbreite''' sollten keine leeren Klassen (Häufigkeit = 0) auftreten. Um Ausreißer mitbehandeln zu können, könnte man die untersten und obersten Klassen offen machen: z.B. „kleiner als 1,30 m“ statt „1,20-1,29 m“ bzw. „größer als 2,09 m“ statt „2,10-2,19 cm“.
 +
 
 +
Die '''Klassenmitte''' ist der Durchschnitt des kleinsten und des größten Wertes einer Klasse. Die Klassenmitte von 1,50-1,5999 periodisch wäre daher 1,55 m. Die Klassenmitte wird für spätere Berechnungen von Bedeutung sein (z.B. für Durchschnittsberechnungen).
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[2] Siehe Kapitel 3.1.1.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.2.3.1 Gruppierung mit SPSS  ===
 +
 
 +
In vielen Fällen, besonders bei '''stetigen Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[1]]]''', wird die Zahl der Ausprägungen einer Variablen so groß sein, dass '''Häufigkeitsverteilungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2]]]''' unübersichtlich werden. Im folgenden Beispiel wurde die Altersverteilung der Antwortenden abgefragt:
 +
 
 +
[[File:quantitative-69_1.gif|frame|center|Häufigkeitsverteilung des Alters der Befragten]]
 +
 
 +
Es wäre deutlich übersichtlicher, diese Werte in eine kleine Zahl von Klassen umzukodieren. Dazu benützen Sie die Funktion TRANSFORMIEREN - '''UMCODIEREN[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[3]]]''' in der Menüleiste. Nun können Sie sich entscheiden zwischen einer Umcodierung in die ''gleiche'' oder in ''eine andere Variable''. Es ist besser, sich für ''eine andere Variable'' zu entscheiden, da durch die '''Umcodierung''' (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch ''Umcodierung in eine neue Variable'' ausgeschlossen.
 +
 
 +
Sie wählen nun die Variable aus, welche umcodiert werden soll und geben im Feld ''Ausgabevariable'' einen neuen Namen dafür ein, der aus Gründen der Kompatibilität mit älteren Programmen acht Zeichen nicht überschreiten darf. Im Feld darunter können Sie jedoch einen beliebig langen und expressiveren Namen wählen.
 +
 
 +
Klicken Sie nun auf ''Alte und neue Werte''. Da Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen möchten, können Sie jeweils einen Bereich angeben (z.B. ''Bereich'' 20 ''bis'' 29), wenn Sie alle zwischen 20- 29jährigen in eine einzige Altersklasse ’zwischen 20 und 30 einbringen möchten’). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf ''Hinzufügen.'' Für die unterste Klasse (alle unter 20jährigen wählen Sie ''Bereich, KLEINSTER bis Wert:'' (hier würden Sie 19 eingeben). Für die über 70jährigen bilden Sie eine offene Klasse, dazu wählen Sie ''Bereich, Wert bis GRÖSSTER:'' und geben hier 70 ein.
 +
 
 +
[[File:quantitative-69_2.jpg|frame|center|Umkodieren in andere Variablen mit SPSS]]
 +
 
 +
Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert.
 +
 
 +
Die neue Häufigkeitstabelle sieht jetzt folgendermaßen aus:
 +
 
 +
[[File:quantitative-69_3.gif|frame|center|Häufigkeitstabelle der umkodierten Altersverteilung]]
 +
 
 +
Nun müssen wir die neuen Werte, ausschließlich für die Ausgabe von '''SPSS''', '''rückcodieren''', um die Tabelle informativer zu machen, da wir nicht sofort erkennen können, dass ''0'' für ’unter 20’ steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben ('''Diagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[4]]]''', Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die ''Variablenansicht.'' Im neuen Fenster finden wir bei der neuen Variable das Attribut ''Variablenlabel.'' Nach Doppelklick darauf erscheint folgendes Fenster:
 +
 
 +
[[File:quantitative-69_4.jpg|frame|center|Wertelabels definieren mit SPSS]]
 +
 
 +
Wir geben nun die gewünschten Labels für die numerischen Daten ein, also z.B. ''20-29'' für die Zahl 1 usw. Nach Eingabe aller automatisch durchzuführenden Änderungen klicken wir auf OK.
 +
 
 +
Wenn wir nun die gleiche '''Häufigkeitsberechnung''' wie oben durchführen, erhalten wir nun folgende leichter verständliche Tabelle:
 +
 
 +
[[File:quantitative-69_5.gif|frame|center|Häufigkeitstabelle mit Klassenlabels]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.2 Stetige und diskrete Variablen|[1] Siehe Kapitel 3.1.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[2] Siehe Kapitel 3.1.3]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[3] Siehe Kapitel 2.2.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[4] Siehe Kapitel 3.6]]<br />
 +
 
 +
== 3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS ==
 +
 
 +
Falls Sie bei einer Frage explizit Mehrfachantworten zugelassen haben, können Sie deren '''Häufigkeiten''' mit '''SPSS''' komfortabel tabellarisch darstellen.
 +
 
 +
==== '''1. Definition eines Mehrfachantwortensets''' ====
 +
 
 +
Sie müssen dazu zuerst ein ''(Mehrfachantworten-)Set'' definieren:
 +
 
 +
Klicken Sie in der Menüleiste auf ANALYSIEREN - MEHRFACHANTWORT - SET DEFINIEREN. Dann öffnet sich folgendes Fenster:
 +
 
 +
[[File:quantitative-70_1.jpg|frame|center|Definieren eines Mehrfachantwortensets mit SPSS]]
 +
 
 +
Führen Sie bitte folgende Schritte durch:
 +
 
 +
A. Sie wählen verschiedene dichotome Variable aus, die Sie in ''Variablen im Set'' einfügen;
 +
 
 +
B. Tragen Sie unter ''Gezählter Wert'' die Zahl 1 ein (d.h. dass jede Ja-Stimme einen Punkt zählt);
 +
 
 +
C. Sie lassen die Standardauswahl ''Dichotomien'' bei ''Variablen kodiert als'';
 +
 
 +
D. Sie wählen einen Kurznamen (max. acht Zeichen für das Set) und tragen ihn unter ''Name'' ein;
 +
 
 +
E. Sie tragen unter ''Beschriftung'' einen längeren Namen ein, welcher die Tabelle anschaulich beschriften soll.
 +
 
 +
F. Klicken Sie nun auf Hinzufügen und letztendlich auf ''Schließen.''
 +
 
 +
Das Set ist nun definiert, Sie können zur Analyse gehen:
 +
 
 +
==== '''2. Analyse''' ====
 +
 
 +
A. Klicken Sie auf ANALYSIEREN - MEHRFACHANTWORT - HÄUFIGKEITEN. Das folgende Fenster öffnet sich:
 +
 
 +
[[File:quantitative-70_2.jpg|frame|center|Häufigkeitsanalyse von Mehrfachantwortensets mit SPSS]]
 +
 
 +
B. Wählen Sie das '''Mehrfachantworten-Set''', welches Sie angelegt haben und ziehen Sie es in das Feld ''Tabelle(n) für:''
 +
 
 +
C. Klicken Sie auf OK. Die Analyse wird durchgeführt:
 +
 
 +
[[File:quantitative-70_3.jpg|frame|center|Häufigkeitstabelle eines Mehrfachantwortensets]]
 +
 
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|Nächstes Kapitel: 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]'''
 +
----
 +
[[#3.2 Die Ermittlung von Häufigkeiten|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2 Die Ermittlung von Häufigkeiten|Vorheriges Kapitel: 3.2 Die Ermittlung von Häufigkeiten]]'''
 +
= 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
'''Lagemaße''' beschreiben das '''Zentrum einer Verteilung''' durch eine Kennzahl.
 +
 
 +
Wenn wir von einem Land wissen, dass seine EinwohnerInnen durchschnittlich 2000 € monatlich verdienen, dann liefern uns Lagemaße eine erste ungenaue Idee, wo sich die EinwohnerInnen des Landes einkommensmäßig im Weltmaßstab einordnen lassen, sie ’liegen’ in der Gruppe der reicheren Länder.
 +
 
 +
Lagemaße werden oft auch als '''Maßzahlen der zentralen Tendenz''' bezeichnet. Die am häufigsten benutzten Lagemaße sind das '''arithmetische Mittel''', das '''geometrische Mittel''', der '''Median''' und der '''Modalwert'''.
 +
 
 +
* Das '''arithmetische Mittel''' bezeichnet den Durchschnittswert aller Einträge,
 +
* das '''geometrische Mittel''' bezieht sich auf den Durchschnittswert voneinander abhängiger Werte (die sich also gegenseitig beeinflussen),
 +
* der '''Median''' kennzeichnet die Normalität (welcher Wert befindet sich größenmäßig wirklich in der Mitte der Einträge und entspricht somit am ehesten dem ’Normalfall’),
 +
* der '''Modalwert''' bezeichnet ausschließlich den am häufigsten vorkommenden Wert, der keinerlei Hinweis über die Eigenheiten der anderen Werte gibt.
 +
 
 +
Je nach '''Verteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1]]]''', '''Skalenniveau[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[2]]]''' und '''Art der Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten Daten|[3]]]''' sind unterschiedliche '''Lagemaße''' sinnvoll. Bei gegebener '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4]9]''' stimmen sowohl '''Median''' wie auch der '''Modalwert''' mit dem '''Arithmetischen Mittel''' überein. In schiefen Verteilungen hingegen nehmen sie sehr unterschiedliche Positionen ein. In rechtsschiefen Verteilungen (der Abfall erfolgt nach rechts) ist der Modalwert am kleinsten, danach kommt der Median, am größten ist der Mittelwert. In '''linksschiefen Verteilungen''' ist es umgekehrt.
 +
 
 +
[[File:quantitative-71_1.jpg|frame|center|Unterschiedliche Lage von Median, Mittelwert und Modalwert in rechtsschiefer Verteilung]]
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3 Verteilungen|[1] Siehe Kapitel 3.1.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[2] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1 Arten von Messwerten Daten|[3] Siehe Kapitel 3.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[4] Siehe Kapitel 3.1.3.1]]<br />
 +
 
 +
==Inhaltsverzeichnis==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.1 Modalwert|3.3.1 Modalwert]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|3.3.2 Arithmetisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|3.3.3 Median]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3.1 Median bei gruppierten Daten|3.3.3.1 Median bei gruppierten Daten]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|3.3.4 Geometrisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|3.3.5 Harmonisches Mittel]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5.1 Harmonisches Mittel mit SPSS|3.3.5.1 Harmonisches Mittel mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.6 Wann welche Lagemaße?|3.3.6 Wann welche Lagemaße?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.7 Berechnung von Lagemaßen mit SPSS|3.3.7 Berechnung von Lagemaßen mit SPSS]]<br />
 +
</div>
 +
 
 +
== 3.3.1 Modalwert ==
 +
 
 +
Unter einem '''Modalwert''' versteht man '''die am häufigsten vorkommende Ausprägung''' einer Variable.
 +
 
 +
'''Beispiel:'''<br />
 +
In der folgenden geordneten Zahlenreihe 2, 3, 3, 3, 4, 4, 5, 6, 7 wäre ''3'' der Modalwert (weil diese Zahl dreimal auftritt, häufiger als jede andere Zahl).
 +
 
 +
==== '''Mittelung bei benachbarten gleichgroßen Werten''' ====
 +
 
 +
Falls mehrere benachbarte Werte die größte Häufigkeit aufweisen, so wird ihr '''arithmetisches Mittel''' berechnet. Haben z.B. die Werte 5 und 6 gleichermaßen die größte Häufigkeit, so ist der Modalwert der Durchschnitt dieser beiden Werte.
 +
 
 +
'''Beispiel:'''<br />
 +
In der Zahlenreihe 2, 3, 3, 3, 4, 4, 4, 5, 6, 7 liegt der Modalwert bei 3,5. Sowohl ''3'' wie auch ''4'' kommen mit jeweilig dreimaligem Auftreten häufiger als die anderen Werte vor. Das arithmetische Mittel von ''3'' und ''4'' liegt bei 3,5.
 +
 
 +
==== '''Modalklasse: Klasse mit größter Zahl an Einträgen''' ====
 +
 
 +
Bei '''klassierten Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]''' ist die '''Modalklasse''' diejenige Klasse mit der größten Zahl an Einträgen
 +
 
 +
==== '''Nur selten praktische Relevanz des Modalwerts''' ====
 +
 
 +
Der '''Modalwert''' ist aussagekräftig, wenn ein einzelner Wert sehr häufig vorkommt (z.B. 27 '''Frauen''' und drei Männer) und unsinnig, wenn der häufigste Wert nur relativ selten vorkommt. Der '''Modalwert''' kann im Gegensatz zum '''arithmetischen Mittelwert''' oder zum '''Median''' auch sinnvoll in '''Nominalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[2]]]''' verwendet werden.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[2] Siehe Kapitel 3.1.2.2]]<br />
 +
 
 +
 
 +
== 3.3.2 Arithmetisches Mittel ==
 +
 
 +
Das '''arithmetische Mittel''' ist die Summe aller Messwerte geteilt durch deren Anzahl:
 +
 
 +
[[File:quantitative-73_1.jpg|frame|center|Formel für das arithmetische Mittel]]
 +
 
 +
Z.B. die durchschnittliche Zahl von Schafen der Bauern im Dorf Nkorongoji in Mali: Die Messwerte sind: 5, 12, 3, 4, 7, 6. Die Summe ist 37, die Zahl der Messwerte ist 6, also ist das arithmetische Mittel 37/6= 6,17.
 +
 
 +
==== '''Arithmetisches Mittel bei Einteilung der Messwerte in Klassen:''' ====
 +
 
 +
Wenn die Daten zahlreicher sind bzw. bereits in '''Klassen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]''' eingeteilt wurden, kann man das '''arithmetische Mittel''' einfacher berechnen: man multipliziert in jeder Klasse die '''Klassenmitte''' (Durchschnitt aus dem theoretisch kleinstem und größten Wert einer Klasse) mit der Zahl der Einträge in der jeweiligen Klasse:
 +
 
 +
[[File:quantitative-73_2.jpg|frame|center|Arithmetisches Mittel bei Einteilung der Messwerte in Klassen]]
 +
 
 +
[[File:quantitative-73_3.jpg|frame|center|Beispiel für die Klassenmitte von Messwertklassen]]
 +
 
 +
 +
 
 +
Der Durchschnitt, in diesem Fall das durchschnittliche Gehalt, wäre somit 14500/17= 852,94.
 +
 
 +
Das '''arithmetische Mittel''' stößt bei bestimmten Datenlagen jedoch auch auf einige Probleme.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
 +
 
 +
 
 +
== 3.3.3 Median ==
 +
 
 +
Der '''Median''' ist jener Wert, welcher in einer größenmäßig geordneten Reihe '''genau in der Mitte''' liegt. D.h. oberhalb wie unterhalb von ihm befindet sich eine gleichgroße Anzahl von Einträgen.
 +
 
 +
Warum benötigen wir ihn, da es doch auch das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' gibt? Das '''arithmetische Mittel''' ist der Mittelwert, der sich ergibt, wenn wir eine Summe durch die Anzahl der gezählten Elemente dividieren.
 +
 
 +
==== '''Beispiel: Verzerrung durch Mittel, nicht aber durch Median''' ====
 +
 
 +
Die folgende Grafik zeigt das individuelle Einkommen der EinwohnerInnen des fiktiven Ortes Largebread im Jahr 2002:
 +
 
 +
[[File:quantitative-74_1.jpg|frame|center|Durchschnittseinkommen in Largebread]]
 +
 
 +
Das durchschnittliche Einkommen von etwa 26000 $ scheint die Einkommenssituation der EinwohnerInnen von Largebread gut zu beschreiben. Die '''Normalverteilungskurve[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2]]]''' zeigt uns an, dass das Einkommen relativ gut normalverteilt ist.
 +
 
 +
Was würde aber jetzt passieren, wenn der reichste Mann der Welt, Bill Gates, sich plötzlich entschließen würde, nach Largebread zu ziehen? Bill Gates verfügt über ein Jahreseinkommen von 5 Milliarden $. Das Diagramm verändert sich extrem:
 +
 
 +
[[File:quantitative-74_2.jpg|frame|center|Durchschnittseinkommen von Largebread mit Bill Gates]]
 +
 
 +
Haben ohne Bill Gates die 1100 EinwohnerInnen von Largebread durchschnittlich 26064 $ im Jahr verdient, so sind sie nun scheinbar über Nacht reich geworden und verdienen mit Bill Gate nun durchschnittlich fast 5 Millionen Dollar im Jahr. Man sieht deutlich, dass einzelne "Ausreißer" wie Bill Gates einen derartigen Durchschnittswert unsinnig machen können. Zur Beschreibung der Realität von Largebread ist daher ein Indikator für das durchschnittliche Einkommen deutlich besser geeignet, welcher Ausreißer nicht berücksichtigt, nämlich der Median: Das Durchschnittseinkommen in Largebread, berechnet nach dem Median, liegt ohne Bill Gates bei 26.000 und auch mit ihm nur bei 26.000 $.
 +
 
 +
'''Probleme des Arithetischen Mittel:'''
 +
 
 +
Das arithmetische Mittel stößt somit an seine Grenzen:
 +
 
 +
* wo '''extreme Grenzwerte''' auftreten (wie in Largebread),
 +
* '''bei sehr kleiner Beobachtungszahl''' (einzelne Werte können besonders leicht den Durchschnittswert verzerren),
 +
* '''bei Verteilungen mit offenen Klassen''' (Schwierigkeit der Bestimmung der Klassenmitte der offenen Klassen),
 +
* bei '''Ordinalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3]]]''' (hier sollte er nicht verwendet werden).
 +
 
 +
In all diesen Fällen ist es genauer, zum Median zu greifen. '''Der Median ist der Wert, der in einer geordneten Liste (oder primären Tafel) genau in der Mitte liegt, d.h. dass sich genauso viele Werte oberhalb wie unterhalb des Wertes befinden. Dieser Wert liegt an (n+1)/2ter Position.''' Hat man 3 Werte, dann ist der Medien der 2. Wert ([3+1]/2).
 +
 
 +
'''Berechnung des Median bei Urliste:'''
 +
 
 +
* Werte nach Größe rangreihen,
 +
* mittleren Wert nehmen,
 +
* liegt der Median zwischen 2 Werten (wenn Median nicht ganze Zahl ist), dann wird der Durchschnitt der ihn umgebenden 2 Werte genommen.
 +
 
 +
z.B. Schulnoten 3,2,2,5,1,1,2,5 -> Rangreihung: 1,1,2,2,2,3,5,5 -> Der 4,5. Wert (Durchschnitt aus 2+2) ist der Median, also 2.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[3] Siehe Kapitel 3.1.2.3]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.3.3.1 Median bei gruppierten Daten  ===
 +
 
 +
Bei '''gruppierten Daten''' ist die Berechnung des '''Medians''' ein wenig komplizierter. Hier ist die rechnerische Abfolge:
 +
 
 +
* Bildung der '''Häufigkeitstabelle''' (inklusive kumulierter Häufigkeiten)
 +
* Ermittlung der Klasse ''m'', in welcher der '''Median''' steckt: wo liegt der Wert (n+1)/2. Diese wird nun als '''Medianklasse''' bezeichnet (n= Gesamtanzahl der Einträge)
 +
* Ermittlung der unteren (=x<sup>mu</sup>) und oberen '''Klassengrenze''' (x) von ''m''
 +
* Ermittlung der '''Klassenbreite''' ''h'' (ergibt sich aus obere Klassengrenze - untere Kl.Grenze) .
 +
* Subtraktion der akkumulierten Häufigkeit aller Klassen bis zur Klasse ''m'' (d.h. die Klassen 1 bis m-1) von n/2 -> Position des Medians in der Medianklasse
 +
* Division der Position durch die Zahl der Werte der Klasse = relative Größenordnung des Medians (Anteile vom Ganzen der Klasse)
 +
* Multiplikation des relativen Klassenanteils mit der Klassenbreite = absolute Größenordnung des Medians '''innerhalb''' der Klasse
 +
* Addition der unteren Klassengrenze (in welcher der Median liegt) zur absoluten Größe des Medians (in der Klasse) = Endergebnis = Median ''Z''
 +
 
 +
 +
 
 +
[[File:quantitative-75_1.jpg|frame|center|Formel für den Median bei gruppierten Daten]]
 +
 
 +
 +
 
 +
'''Beispiel:''' Zeitverbrauch bei Lösung einer Aufgabe
 +
 
 +
[[File:quantitative-75_2.jpg|frame|center|Beispiel - Tabelle für den Zeitverbrauch bei der Lösung einer Aufgabe]]
 +
 
 +
n=37, Median ist also der 18. Wert, dieser liegt in der Klasse 5 (4,5-5,5 Minuten Dauer), daher:
 +
 
 +
[[File:quantitative-75_3.jpg|frame|center|Berechnung des Medians für das Beispiel "Zeitverbrauch"]]
 +
 
 +
Der Median liegt somit bei 5.
 +
 
 +
== 3.3.4 Geometrisches Mittel ==
 +
 
 +
Das '''geometrische Mittel''' ist der '''Mittelwert bei mathematischen Produkten''', wie z.B. bei Wachstums- oder Zinsfaktoren. Das geometrische Mittel kann nur bei '''Proportionalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[1]]]''' verwendet werden. Dieses wird als n- te Wurzel aus der relativen Veränderung (Endwert dividiert durch Anfangswert) berechnet, wobei n der Zahl der Zeiteinheiten entspricht.
 +
 
 +
'''Beispiel: durchschnittliche Inflationsrate'''<br />
 +
Nehmen wir an, die jährliche Inflationsrate hätte durch 10 Jahre hindurch jeweils 2 % pro Jahr betragen. Hier wäre es falsch anzunehmen, dass die Inflation nach den 10 Jahren um 20 % höher als davor liegt, da sich die Werte gegenseitig beeinflussen. Im ersten Jahr sind es 2 % Inflation von 100 %; im 2. Jahr 2 % von 102 % (also 2,04 % Preissteigerung verglichen mit dem Ausgangsjahr), im 3. Jahr 2 von 104,04 (= 2,0808 % vergleichen mit dem Ausgangsjahr).
 +
 
 +
Ähnlich müssen wir zurückrechnen, wenn wir von einem bestimmten Preisniveau nach 10 Jahren auf die durchschnittliche Inflationsrate dieser 10 Jahre schließen wollen.
 +
 
 +
==== '''Errechnung der durchschnittlichen Inflationsrate''' ====
 +
 
 +
Der Lebenshaltungskostenindex liegt 2006 bei 136,5, vor 10 Jahren lag dieser bei 100. Somit erfolgte eine Preissteigerung von 36,5 % im Laufe der letzten 10 Jahre. Es wäre hier falsch, als durchschnittliche Preissteigerung/Jahr den Wert 3,65 % anzunehmen (36,5 % durch die Zahl der Jahre, also 10, dividiert), da sich die Werte gegenseitig beeinflussten (multiplizierten).
 +
 
 +
Den richtigen Wert erhält man, wenn man die 10. Wurzel (da 10 Jahre) aus dem Gesamtveränderungsfaktor zieht. Diesen erhält man, indem man den Endwert durch den Ausgangswert dividiert: 136,5 dividiert durch 100 ist 1,365. Die 10.Wurzel daraus ist 1,0304. 100 multipliziert mit 1,024*1,0304*1,0304 etc. (insgesamt 10x damit multipliziert) ergibt nach 10 Jahren 136,5.
 +
 
 +
Die Differenz zu 1 multipliziert mit 100 (es handelt sich ja um Prozente, bisher sind es nur Teile vom Ganzen) ist 0,0304*100 = 3,04 % jährliche Preissteigerung (und nicht 3,65, wenn wir das rein arithmetische Mittel genommen hätten).
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[1] Siehe Kapitel 3.1.2.5]]<br />
 +
 
 +
 
 +
== 3.3.5 Harmonisches Mittel ==
 +
 
 +
Das '''harmonische Mittel''' ist ein geeignetes Lagemaß für Größen, die durch einen '''(relativen) Bezug auf eine Einheit''' definiert sind: z.B. Geschwindigkeiten (Strecke pro Zeiteinheit) oder Ernteerträge (Gewicht oder Volumen pro Flächeneinheit).
 +
 
 +
Die zur Berechnung benötigte Formel ist:
 +
 
 +
[[File:quantitative-77_1.jpg|frame|center|Formel für die Berechnung des harmonischen Mittels]]
 +
 
 +
'''Beispiel: Durchschnittsreisegeschwindigkeit'''<br />
 +
Elke fährt von Wien nach Melk (etwa 100 km) mit einer Durchschnittsgeschwindigkeit von 80 km/h. Anschließend fährt sie mit durchschnittlich 120 km/h von Melk nach Linz und legt dabei ebenfalls 100 km zurück. Wie schnell fuhr sie im Schnitt?
 +
 
 +
Die meisten Befragten würden nach kurzer Überlegung 100 km/h als Durchschnittsgeschwindigkeit angeben. Doch ist dies falsch, da Elke unterschiedlich lange mit diesen beiden Geschwindigkeiten unterwegs war. Elke braucht für die ersten 100 km, die sie mit 80 km/h zurücklegt, insgesamt 100/80 Stunden, also 1,25 Stunden oder 1 Stunde und 15 Minuten. Für die zweiten Hundert Kilometer, die sie mit 120 km/h zurücklegt, benötigt sie 100/120 Stunden, also 5/6 Stunden oder 50 Minuten. Insgesamt legte sie somit 200 km in einer Zeit von 2,083 Stunden zurück (2 Stunden und 5 Minuten). 200 km dividiert durch die Zeit, die sie dafür benötigte, ergibt nun eine Durchschnittsgeschwindigkeit von 96,02 km/h.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.3.5.1 Harmonisches Mittel mit SPSS  ===
 +
 
 +
Legen Sie zwei Variable an.Variable 1 für die Distanz, Variable 2 für die Geschwindigkeit. Nach Eingabe der Werte klicken Sie auf ANALYSIEREN - MITTELWERTE VERGLEICHEN - MITTELWERTE und geben dort unter ''Abhängige Variable'' die Geschwindigkeit ein, unter ''Unabhängige Variable'' die Distanz.
 +
 
 +
[[File:quantitative-78_1.jpg|frame|center|Berechnung des harmonischen Mittels mit SPSS]]
 +
 
 +
Klicken Sie dann auf ''Optionen'' und wählen Sie im nächsten Fenster das '''Harmonische Mittel''' aus. Fertig.
 +
 
 +
== 3.3.6 Wann welche Lagemaße? ==
 +
 
 +
[[File:quantitative-79_1.jpg|frame|center|Geeignetes Lagemaß bei verschiedenen Skalen]]
 +
 
 +
Die Zahl in Klammern gibt die Priorität an. X(1) wird daher als wichtiger als X(2) eingestuft. Fett markiertes X bezeichnet Kennzahlen, welche bei der gegebenen Datenart absolut sinnvoll sind, nicht fettes X liefert mögliche, aber nicht besonders sinnvolle oder teilweise sogar in die Irre führende Werte.
 +
 
 +
Während Lagemaße bei '''eingipfeligen symmetrischen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1]]]''' '''Daten''' weitgehend übereinstimmen und typisch für die Daten sind, sind sie bei '''anderen Verteilungsformen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|[2]]]''' ('''U-förmige''', sehr '''schiefe''', '''mehrgipfelige''', '''gleichverteilte''') nicht aussagekräftig für die Verteilung.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1] Siehe Kapitel 3.1.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.2 Andere Verteilungsformen|[2] Siehe Kapitel 3.1.3.2]]<br />
 +
 
 +
 
 +
== 3.3.7 Berechnung von Lagemaßen mit SPSS ==
 +
 
 +
Während das '''geometrische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[1]]]''' mit jedem mathematischen Taschenrechner leicht berechnet werden kann (einfach n-te Wurzel aus der Endzahl), sind die '''Lagemaße''' mit SPSS sehr einfach zu berechnen.
 +
 
 +
Klicken Sie in der Menüleiste auf ANALYSIEREN - HÄUFIGKEITEN und wählen Sie dann ''Statistik'' aus:
 +
 
 +
[[File:quantitative-80_1.jpg|frame|center|Berechnung von Lagemaßen mit SPSS]]
 +
 
 +
Nun können Sie alle '''Lagemaße''' auswählen, den '''Mittelwert''', den '''Median''' und den '''Modalwert'''. Das folgende Resultat stammt aus der Berechnung der Lagemaße des Bruttonationalprodukts der Länder dieser Welt im Jahr 1995 (world95.sav).
 +
 
 +
[[File:quantitative-80_2.gif|frame|center|Lagemaße des BNE aller Länder der Welt]]
 +
 
 +
Wir sehen, dass die '''Lagemaße''' extrem auseinanderliegen. Warum, macht das '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2]]]''' mit '''Normalverteilungskurve[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[3]]]''' (anklicken unter ''Diagramme'') sofort sichtbar: Eine kleine Zahl von reichen Ländern hebt das '''arithmetische Mittel''' auf ein Niveau, welches außerhalb der Reichweite der meisten Länder dieser Welt liegt:
 +
 
 +
[[File:quantitative-80_3.jpg|frame|center|Histogramm des BNE aller Länder der Welt]]
 +
 
 +
Wäre es eine '''Normalverteilung''', würden im Bereich (Artithm. Mittel +/s s) 68 % aller Werte liegen. Zieht man jedoch die Standardabweichung s (= 6479) vom Mittelwert ab, gelangt man am linken Rand bereits in den negativen Einkommensbereich. Auch dies zeigt die Sinnlosigkeit der Verwendung des '''arithmetischen Mittels''' bei diesen Daten. Der '''Median''' hingegen bildet hier die Realität mit knapp 3000 $ wesentlich besser ab.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[1] Siehe Kapitel 3.3.4]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[2] Siehe Kapitel 3.6.1.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[3] Siehe Kapitel 3.1.3.1]]<br />
 +
 
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|Nächstes Kapitel: 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]'''
 +
----
 +
[[#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|Vorheriges Kapitel: 3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz]]'''
 +
= 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’ =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
'''Streuungsmaße''' informieren über die Verteilung von Ausprägungen außerhalb des Zentrums. Sie liefern dadurch wertvolle Informationen über die (Un-)Ausgeglichenheit einer Verteilung.
 +
 
 +
==== '''Grafische Darstellung der Streuung durch Histogramme''' ====
 +
 
 +
'''Histogramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''' zeigen die relative "Gerechtigkeit" einer Verteilung in graphischer Form, wie z.B. das folgende über das Bruttonationalprodukt der Länder dieser Welt im Jahr 1991.
 +
 
 +
[[File:quantitative-81_1.jpg|frame|center|Histogramm Bruttonationalprodukt 1991]]
 +
 
 +
Dieses '''Histogramm''' zeigt optisch deutlich, dass im Jahr 1991 das durchschnittliche Bruttonationalprodukt von 5860 $ für die meisten Länder unerreichbar fern lag und damit keinerlei Aussagekraft für ihre Realität hatte. Der '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2]]]''' lag damals bei der Hälfte des '''Mittelwerts[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[3]]]''', nämlich bei 2995 $. Ein Viertel der Länder wies ein Bruttonationalprodukt auf, welches unter 996 $ lag, ein Fünftel unter 681 $, ein Zehntel der Länder dieser Welt sogar unter 323 Dollar.
 +
 
 +
==== '''Lagemaße zeigen oft nur verzerrtes Bild der Realität bzw. Normalität''' ====
 +
 
 +
Man ersieht daraus, dass Kennzahlen wie das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4]]]''' oft nur wenig geeignet sind, die Normalität darzustellen, d.h. dass der Wert des arithmetischen Mittel erheblich von der '''Realität''' der meisten Ausprägungen verschieden sein kann.
 +
 
 +
Wir benötigen daher weitere Kennzahlen, sogenannte '''Streuungsmaße''', um Auskunft über die Randbereiche der Ausprägungen zu erhalten. Dazu zählen besonders die '''Standardabweichung''' und '''Perzentile''' bzw. '''Quartile[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[2] Siehe Kapitel 3.3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[3] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[4] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[5] Siehe Kapitel 3.4.3.1]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.1 Varianz|3.4.1 Varianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|3.4.2 Standardabweichung]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3 Perzentile|3.4.3 Perzentile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|3.4.3.1 Quartile]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1.1 Die Ermittlung von Quartilen|3.4.3.1.1 Die Ermittlung von Quartilen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.4 Berechnung von Streuungsmaßen mit SPSS|3.4.4 Berechnung von Streuungsmaßen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|3.4.5.1 Erstellung von Boxplots mit SPSS]]<br />
 +
</div>
 +
 
 +
== 3.4.1 Varianz ==
 +
 
 +
'''Die Varianz ist eine Kennzahl, welche die Streuung aller Daten berücksichtigt.''' Sie wird berechnet, indem man den Durchschnitt der quadrierten Abweichung vom '''Arithmetischen Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1]]]''' berechnet.
 +
 
 +
[[File:quantitative-82_1.jpg|frame|center|Formel zu Bereichnung der Varianz]]
 +
 
 +
'''Je größer die Varianz verglichen mit dem Arithmetischen Mittel, desto stärker sind die Abweichungen der einzelnen Messwerte von diesem.'''
 +
 
 +
Ein Beispiel: Ein '''Arithmetisches Mittel''' von 100 kann sich ergeben, wenn alle Einträge der Zahl 100 entsprechen. Alle Einträge hätten dann eine Abweichung von ''0'' vom '''Arithmetischen Mittel''', damit natürlich dann auch deren Quadrate sowie der Summen der Quadrate. Die Varianz wäre dann ''0'' und würde eine komplette Übereinstimmung aller Werte mit dem '''Arithmetischen Mittel''' anzeigen.
 +
 
 +
Ein '''Arithmetisches Mittel''' von 100 kann sich auch ergeben, wenn die Hälfte der Werte bei 0 und die andere Hälfte bei 200 liegt. In diesem Falle hätten wir eine extrem große Varianz (jeweils eine Abweichung von 100 vom '''Arithmetischen Mittel''', diese wird quadriert, die Ergebnisse zusammengezählt und durch ''N'' dividiert. In diesem Falle erhielten wir eine Varianz von 10.000, Ausdruck der maximalen individuellen Abweichung der Meßwerte vom '''Arithmetischen Mittel'''''.''
 +
 
 +
In der Praxis verwendet man vor allem die Wurzel aus der Varianz, die sogenannte '''Standardabweichung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|[2]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[1] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.2 Standardabweichung|[2] Siehe Kapitel 3.4.2]]<br />
 +
 
 +
== 3.4.2 Standardabweichung ==
 +
 
 +
Die '''Standardabweichung''' '''''s''''' gibt in einer '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1]]]''' einen Bereich um den '''Mittelwert[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' an, innerhalb dessen sich 68,2 % aller Einträge befinden. Innerhalb des Bereichs Mittelwert +/-2s befinden sich in einer Normalverteilung 95,44 % aller Einträge. Berechnet wird die Standardabweichung als Wurzel aus folgender Formel:
 +
 
 +
[[File:quantitative-83_1.jpg|frame|center|Formel zur Berechnung der Standardabweichung]]
 +
 
 +
'''Beispiel:''' Intelligenzquotient (Durchschnitt = 100, ''s''= 15).
 +
 
 +
[[File:quantitative-83_2.jpg|frame|center|Intelligenzquotient]]
 +
 
 +
==== '''Kenntnis der Standardabweichung = Kenntnis des Verlaufs der Verteilung''' ====
 +
 
 +
Auch wenn man die grafische Darstellung der '''Häufigkeitsverteilung,''' wie z.B. mit einem '''Histogramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3]]]''', nicht kennt, kann man sie aufgrund der Kenntnis des '''Mittelwerts''' und der Standardabweichung weitgehend vorhersagen. Hat man einen '''Mittelwert''' von 100 und eine Standardabweichung von 10, wird die Verteilungskurve deutlich steiler sein, als wenn die '''Standardabweichung''' bei 30 liegt.
 +
 
 +
==== '''Kenntnis der Standardverteilung = Abschätzung der Häufigkeit von Ausprägungen''' ====
 +
 
 +
Die Kenntnis der '''Standardverteilung''' erlaubt uns, die Häufigkeit von Ausprägungen sofort einschätzen zu können. Wenn z.B. wie oben bekannt ist, dass der durchschnittliche Intelligenzquotient bei 100, die Standardabweichung bei 15 liegt, dann kann man sofort abschätzen, wie ein bestimmter Intelligenzquotient einzustufen ist. Wenn eine Person X einen IQ von 130 aufweist, dann liegt dieser beim Mittelwert +2 Standardabweichungen. Daher kann man sofort abschätzen, dass der betreffende IQ höher ist als 98 % aller Einträge.
 +
 
 +
'''Erklärung:'''<br />
 +
95,44 % aller Einträge befinden sich im Bereich Mittelwert ±2s, d.h. 4,56 % liegen außerhalb dieses Bereichs. In unserem Beispiel würden 95,44% aller Werte zwischen 70 und 130 liegen, Die restlichen 4,56 % teilen sich zu gleichen Teilen auf die darunter und darüber liegenden Bereiche auf. Somit bleiben für den Bereich ab 130 insgesamt 2,28 % aller Einträge übrig.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[1] Siehe Kapitel 3.1.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[3] Siehe Kapitel 3.6.1.5]]<br />
 +
 
 +
== 3.4.3 Perzentile ==
 +
 
 +
'''Perzentile''' teilen die Ausprägungen der Variablen in gleich große Gruppen, sodass sich in jeder Gruppe der gleiche Prozentsatz an Einträgen befindet.
 +
 
 +
Besonders beliebt dabei sind die '''Quartile''' (= Viertel, jeweils 25 %). Bei '''Dezilen''' handelt es sich hingegen um Gruppen von jeweils 10 % der Werte.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.4.3.1 Quartile  ===
 +
 
 +
'''Quartile''' teilen die Verteilung in vier gleich große Viertel: 25 % der Werte sind kleiner oder gleich groß mit dem 1. Quartil, 50 % sind kleiner oder gleich groß wie das 2. Quartil (daher ist das 2. Quartil gleichzusetzen mit dem Median), 75 % sind kleiner oder gleich groß mit dem 3. Quartil. '''Quartile''' sollten erst ab einer '''Stichprobengröße[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''' von zumindest 20 eingesetzt werden.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1] Siehe Kapitel 2.1.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.4.3.1.1 Die Ermittlung von Quartilen  ===
 +
 
 +
==== '''Die Ermittlung von Quartilen (gewichtet):''' ====
 +
 
 +
* man reiht die Werte nach ihrer Größe (unser Beispiel: Besitz von Büchern zur Ethnologie)
 +
 
 +
z.B. 1, 2, 3, 3, 5, 7, 11, 16, 17, 17, 20, 22, 25, 48, 52, 56, 76, 89, 96, 115
 +
 
 +
20 verschiedene Einträge liegen vor, daher ist n=20.
 +
 
 +
* Berechung des 1. Quartils, d.h. der Wert, welcher größer als 25 % und kleiner als 75 % aller Werte ist. Q1 liegt an der (n+1)/4. Stelle
 +
 
 +
''Dieser Wert liegt in unserem Beispiel an der (n+1)/4 Stelle = 5.25, also zwischen dem 5. Wert (=5) und dem 6. Wert (=7). Der Bruchteil (0,25) gibt an, dass zum Wert von 5 noch ¼ des Abstands zwischen 5 und 6 hinzukommt. Q1 ist daher 5 + 0,25*2 = 5,5.''
 +
 
 +
* Berechnung des 2. Quartils (wird berechnet wie der Median). Dieser liegt zwischen der 10. und 11. Stelle, daher ist der Wert zu mitteln (17+20)/2 = 18,5
 +
* Berechnung des 3. Quartils, d.h. der Wert, welcher größer als 75 % und kleiner als 25 % der sortierten Werte ist. Q3 = 3*(n+1)/4
 +
 
 +
''In unserem Beispiel: Q3 = 3*21/5 = 15,75. Stelle. Q3 liegt zwischen dem 15. Wert (= 52) und dem 16. Wert (= 56). Der Bruchteil (0,75) gibt an, dass zum 15. Wert noch ¾ des Abstands zwischen dem 15. und dem 16. Wert hinzukommen, daher: Q3 = 52 + 0,75*4 = 55.''
 +
 
 +
Wir können nun die Aussage machen, dass Personen aus dem ersten oder untersten Quartil (Viertel) weniger als 5,5 Bücher, aus dem obersten Quartil hingegen mindestens 55 Bücher besitzen.
 +
 
 +
 
 +
== 3.4.4 Berechnung von Streuungsmaßen mit SPSS ==
 +
 
 +
'''SPSS''' ermöglicht es, alle Arten von Streuungsmaßen mit wenigen Tastenklicks gleichzeitig zu berechnen.
 +
 
 +
Dazu genügt es, auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - HÄUFIGKEITEN zu klicken, dann links unten nochmals auf ''Statistik'' zu klicken und im neuen Fenster alle nur denkbaren Kennzahlen für Lage- und Streuungsmaße anzuwählen:
 +
 
 +
[[File:quantitative-87_1.jpg|frame|center|Berechnung von Streuungsmaßen mit SPSS]]
 +
 
 +
Für die Berechnung von '''Quartilen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1]]]''' genügt das Setzen eines Häkchens in ''Quartile'', möchte man ''Dezile'' (also in 10%-Gruppen) berechnen, gibt man im Feld ''Trennwerte für'' die Zahl 10 ein (dadurch werden 100 % auf 10 gleiche Gruppen aufgeteilt, also besteht jede Gruppe aus 10 %). Gibt man einen Wert X im Feld neben ''Perzentile'' ein und klickt auf ''Hinzufügen'' (wie z.B. die Zahl 37), so wird ermittelt, unterhalb welchen Kennwerts X % der Einträge liegen (in diesem Fall 37 %). Man kann beliebig viele dieser '''Perzentile''' setzen.
 +
 
 +
[[File:quantitative-87_2.gif|frame|center|mit SPSS berechnete Streuungsmaße]]
 +
 
 +
SPSS bietet die Berechnung und Darstellung von '''Streuungsmaßen''' in einer Vielzahl statistischer Verfahren an, meist unter einem Auswahlpunkt ''Statistik''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1] Siehe Kapitel 3.4.3.1]]<br />
 +
 
 +
 
 +
== 3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots ==
 +
 
 +
'''Boxplots''' sind '''konzentrierte grafische Darstellungen von Lage und Streuung. Boxplots''' geben einen exzellenten optischen Überblick über wesentliche Parameter von Lage und Streuung, wie das '''Arithmetisches Mittel''', die '''Quartile''' sowie über die '''Grenzwerte''' nach unten wie nach oben, wobei '''Ausreißer''' spezifisch markiert werden.
 +
 
 +
[[File:quantitative-88_1.jpg|frame|center|Beispiel Boxplots]]
 +
 
 +
==== '''Informationen der Boxplots:''' ====
 +
 
 +
Boxplots enthalten eine Fülle von Hinweisen, wie im obigen Diagramm:
 +
 
 +
A. ein Kästchen, welches den Abstand zwischen dem 1. und dem 3. '''Quartil[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1]]]''' markiert ('''Streuung''')
 +
 
 +
B. eine langgezogene Linie, die von Extremwert zu Extremwert führt: '''Range''' ('''Streuung''');
 +
 
 +
C. Einen Querstrich im Kästchen, welcher das '''Arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''' markiert;
 +
 
 +
D. Mit * bezeichnete Einträge, welche mehr als 3 Kästchenlängen entfernt liegen ('''Ausreißer''').
 +
 
 +
E. Mit Kreis gekennzeichnete Einträge liegen 1,5-3 Kästchenlängen entfernt.
 +
 
 +
F. Neben diesen '''Ausreißern''' steht auch jeweils die Nummer des Datensatzes, in welchem diese '''Ausreißer''' gefunden werden können.
 +
 
 +
==== '''Extreme Informationsdichte durch Boxplots:''' ====
 +
 
 +
Durch diese konzentrierten Informationen erlauben '''Boxplots''' eine sehr schnelle Abschätzung sowohl der '''Lage''' wie auch der '''Streuung.''' Im obigen Boxplot, welches auf der y-Achse die Zahl der in Österreich verbrachten Jahre, auf der x-Achse das Migrationsmotiv widerspiegelt, kann man auf den ersten Blick ersehen, dass das Gros der AsylwerberInnen erst in den letzten Jahren kam, hingegen das Motiv Schulbesuch ein länger zurückliegender Migrationsgrund war. Die große '''Streuung''' (ausgedrückt durch die Länge des Kästchens) bei der Arbeitsuche gibt einen Hinweis darauf, dass viele Menschen über längere Zeit hinweg aus diesem Grund zuwanderten, während der Asylgrund einen wesentlich kürzeren Zeitraum betraf.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.3.1 Quartile|[1] Siehe Kapitel 3.4.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.4.5.1 Erstellung von Boxplots mit SPSS  ===
 +
 
 +
Klicken Sie in SPSS in der Menüleiste auf ''ANALYSIEREN - DESKRIPTIVE STATISTIKEN - EXPLORATIVE DATENANALYSE.'' Das folgende Fenster erscheint:
 +
 
 +
[[File:quantitative-89_1.jpg|frame|center|Erstellung von Boxplots mit SPSS]]
 +
 
 +
Sie finden links die Liste der '''Variablen'''. Übertragen Sie ins Feld ''Abhängige Variablen'' die Variable, deren Lage und Streuung Sie mittels eines Boxplots darstellen möchten. Beachten Sie bitte, dass es sich dabei zwingend um eine '''metrische Variable[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1]]]''' handeln muss. Falls Sie die '''Lage[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2]]]''' und '''Streuung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3]]]''' der gesamten Einträge dieser Variablen wiederspiegeln möchten, können Sie auf ''OK'' klicken. Das '''Boxplot''' erscheint in der Ausgabe nach einer Reihe statistischer Berechnungen.
 +
 
 +
Möchten Sie den Einfluss einer anderen '''Variable''' auf die gewählte Variable untersuchen, dann fügen Sie diese Variable in das Feld ''Faktorenliste'' ein. Sie erhalten dann verschiedene Boxplots, die jeweils Subgruppen der '''abhängigen Variablen''' bezeichnen:
 +
 
 +
[[File:quantitative-88_1.jpg|frame|center|Beispiel für Boxplots]]
 +
 
 +
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[1] Siehe Kapitel 3.1.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[2] Siehe Kapitel 3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|[3] Siehe Kapitel 3.4]]<br />
 +
 
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|Nächstes Kapitel: 3.5 Der Zusammenhang zwischen Variablen]]'''
 +
----
 +
[[#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’|Vorheriges Kapitel: 3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’]]'''
 +
= 3.5 Der Zusammenhang zwischen Variablen =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Zu den spannendsten Fragen gehört die Untersuchung von '''Zusammenhängen''' zwischen '''Variablen'''. Es ist naheliegend, sich die Frage zu stellen, ob es z.B. einen Zusammenhang zwischen Rassismus und Bildung bzw. Sozialisation, Einkommen, Erfahrungen gibt. Es ist denkbar, dass die Religion einer Person Auswirkungen auf ihre Kinderzahl hat; es ist denkbar, dass Menschen eher zu biologischen und meist auch teureren Lebensmittel greifen, wenn auch ihr Einkommen höher ist usw.
 +
 
 +
Um derartige Zusammenhänge aufzudecken, verfügen wir über verschiedene Methoden, wie z.B. die '''Kreuztabellen-Analyse''' oder die '''Korrelation'''(en).
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|3.5 Der Zusammenhang zwischen Variablen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|3.5.1 Optische Erkennung von Zusammenhängen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|3.5.2 Kreuztabellen-Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS|3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS|3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|3.5.3 Die Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|3.5.3.1 Maßkorrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS|3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R (Krueger-Spearman)|3.5.3.2 Rangkorrelation R (Krueger-Spearman)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS|3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau (Kendall)|3.5.3.3 Rangkorrelation Tau (Kendall)]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3.1 Berechnung von TAU mit SPSS|3.5.3.3.1 Berechnung von TAU mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4 Aussagekraft einer Korrelation|3.5.3.4 Aussagekraft einer Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.1 Wann sind Korrelationen bemerkenswert?|3.5.3.4.1 Wann sind Korrelationen bemerkenswert?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|3.5.3.4.2 Verdeckte Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|3.5.3.4.3 Scheinkorrelationen und Störvariable]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3.1 Partielle Korrelation mit SPSS|3.5.3.4.3.1 Partielle Korrelation mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|3.5.3.4.4 Signifikanz der Korrelation]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4.1 Signifikanz mit SPSS|3.5.3.4.4.1 Signifikanz mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.5 Kovarianz|3.5.3.5 Kovarianz]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|3.5.4 Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression|3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|3.5.4.2 Grafische Darstellung der Regression]]<br />
 +
</div>
 +
 
 +
== 3.5.1 Optische Erkennung von Zusammenhängen ==
 +
 
 +
==== '''Optische Darstellung von Zusammenhängen: das Streudiagramm''' ====
 +
 
 +
Trägt man auf einer Matrix von links nach rechts die Ausprägungen für die Variable A ein und die Ausprägungen für die Variable B auf der Y- Achse, so erhält man eine Reihe von Schnittpunkten. Das sich aus den Schnittpunkten ergebende '''Diagramm''' wird auch '''Verteilungsgrafik''' (auch '''Streuungsdiagramm''', '''Streudiagramm''' oder '''Scatterplot''' genannt).
 +
 
 +
==== '''Herstellung eines Streudiagramms''' ====
 +
 
 +
'''Streudiagramme''' eignen sich zur grafischen Darstellung '''bivariater Daten''', also zur Darstellung von Wertepaaren in einem Koordinatensystem. An Lage und Dichte des Punkteschwarms lässt sich anschaulich ablesen, ob ein Zusammenhang zwischen den Variablen besteht. Sie werden folgendermaßen erstellt: Man trägt in einem Diagramm jeweils die Schnittpunkte der beiden Variablen ein, wobei der Wert der 1. Variablen auf der X- Achse, der Wert der 2. Variable auf der Y- Achse liegt. Im Beispiel unten trägt man auf der X- Achse den Alphabetisierungsgrad des Landes ein, auf der Y-Achse das Bruttonationalprodukt des gleichen Landes. Wo beide Einträge aufeinander treffen, wird eine Markierung (ein Punkt) eingefügt.
 +
 
 +
[[File:quantitative-91_1.gif|frame|center|Streudiagramm Zusammenhang zwischen weiblicher Bildung und Kindersterblichkeit]]
 +
 
 +
==== '''Zusammenhänge bereits visuell erkennbar''' ====
 +
 
 +
Hier erkennen wir bereits optisch einen gewissen Zusammenhang. Die meisten Schnittpunkte befinden sich links oben und gehen in einer Linie nach rechts unten. Man könnte durch die Schnittpunkte annäherungsweise eine '''Gerade[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1]]]''' ziehen, die von rechts oben nach links unten geht. Man spricht hier von einem '''linearen Zusammenhang'''''.''
 +
 
 +
Die Aussage der Grafik ist: je höher der Alphabetisierungsgrad der Frauen, desto niedriger die Kindersterblichkeit.
 +
 
 +
[[File:quantitative-91_2.jpg|frame|center|Streudiagramm Zusammenhang zwischen Alphabetisierungsrate und BNP]]
 +
 
 +
Aus diesem '''Diagramm''' ist ersichtlich, dass ein gewisser Zusammenhang zwischen Alphabetisierungsrate und BNP besteht. Länder mit nur geringer Alphabetisierungsrate haben ausnahmslos ein sehr niedriges BNP, mit hoher Alphabetisierungsrate steigt die Wahrscheinlichkeit, auch ein sehr hohes BNP aufzuweisen, doch liegen die Werte bei hoher Alphabetisierungsrate extrem auseinander. Hier lässt sich wesentlich schwerer eine Gerade ziehen, es liegt nur mehr bedingt ein '''linearer Zusammenhang''' vor.
 +
 
 +
Nachfolgend verschiedene weitere Diagramme, welche teilweise deutliche Zusammenhänge zeigen (wie oben links) oder keinerlei Zusammenhang (wie unten links). Diskutieren Sie in der Gruppe die Art der Zusammenhänge in den restlichen Diagrammen.
 +
 
 +
[[File:quantitative-91_3.jpg|frame|center|Mehrere Streudiagramme (1)]]
 +
 
 +
[[File:quantitative-91_4.jpg|frame|center|Mehrere Streudiagramme (2)]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1] Siehe Kapitel 3.5.4.2]]<br />
 +
 
 +
 
 +
== 3.5.2 Kreuztabellen-Analyse ==
 +
 
 +
Unter '''Kreuztabellen''' (auch '''Kontingenztafeln''' genannt) versteht man die tabellarische Darstellung der '''Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''', welche bei der Kombination der Ausprägungen von zwei oder mehr '''Variablen''' auftreten.
 +
 
 +
Wenn z.B. zwei '''Variablen''' vorliegen, werden die Ausprägungen der Variablen A in Spalten von links nach rechts und die Ausprägungen der Variablen B in Zeilen von oben nach unten eingetragen. In jeder einzelnen Zelle wird sodann die spezifische Häufigkeit der jeweiligen Kombination Ausprägung der Variablen A mit Ausprägung der Variablen B vermerkt.
 +
 
 +
[[File:quantitative-92_1.gif|frame|center|Kreuztabelle Deutschkenntnisse  und Muttersprache]]
 +
 
 +
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS  ===
 +
 
 +
Wir möchten mit einer '''Kreuztabelle''' zeigen, wie gut in Wien lebende AfrikanerInnen nach (überprüften) Eigenangaben Deutsch beherrschen und überprüfen, ob ihre Sprachkompetenz im Deutschen mit ihrer Nationalsprache zusammenhängt.
 +
 
 +
Dazu klicken wir in SPSS auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN. In den Zeilen klicken wir die Herkunftssprache an, unter Spalten die Sprachkompetenz im Deutschen. Nach Klicken auf OK erhalten wir bereits folgende Tabelle:
 +
 
 +
[[File:quantitative-93_1.gif|frame|center|Kreuztabelle Zusammenhang Muttersprache - Deutschkenntnisse]]
 +
 
 +
Man kann die Ergebnisse leichter interpretieren, wenn auch die '''relativen Häufigkeiten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''' ermittelt werden. Dazu klicken wir unter ''Zellen'' auf ''zeilenweise Prozentwerte'':
 +
 
 +
[[File:quantitative-93_2.gif|frame|center|Kreuztabelle mit Zeilenprozentwerten zum Zusammenhang Muttersprache - Deutschkenntnisse]]
 +
 
 +
Nun können wir sofort erkennen, dass in unserer Stichprobe die durchschnittlichen Deutschkenntnisse der Zuwanderer aus Ländern mit französischer Nationalsprache besser als die aus Ländern mit englischer Nationalsprache sind. 70,7 % der Frankophonen sprechen besser Deutsch, aber nur 49,0 % der Anglophonen.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test  ===
 +
 
 +
Der '''Chi-Quadrat-Test''', angewandt auf '''Kreuztabellen''', ermittelt die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1]]]''', ob Zusammenhänge mehr als nur zufälliger Natur sind.
 +
 
 +
Im vorigen Beispiel (Kreuztabelle) sahen wir, dass offensichtlich ein deutlich höherer Prozentsatz von frankophonen AfrikanerInnen besser Deutsch spricht als Anglophone. Wir wissen jedoch noch nicht, ob diese Unterschiede auch signifikant sind.
 +
 
 +
==== '''Berechnung des Chi-Quadrat-Tests mit SPSS''' ====
 +
 
 +
Dazu wählen wir unter ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN den Punkt ''Statistik,'' setzen dort bei ''Chi-Quadrat'' ein Häkchen und erhalten als zusätzliche Ausgabe:
 +
 
 +
[[File:quantitative-94_1.gif|frame|center|Chi-Quadrat-Test]]
 +
 
 +
Für uns interessant ist hier der Wert für ''Asymptotische Signifikanz''. Dort wird 0,023 aufgeführt, also ein Wert kleiner als 0,05. Damit ist mit einer '''Wahrscheinlichkeit''' von mehr als 95 % anzunehmen (oder mit einer '''Irrtumswahrscheinlichkeit''' von weniger als 5 %), dass tatsächlich ein Zusammenhang zwischen Nationalsprache und Sprachkompetenz im Deutschen besteht. Bei einem Wert > 0,01 wäre die '''Wahrscheinlichkeit''' eines Zusammenhangs sogar größer als 99 %, also wäre das Ergebnis hoch '''signifikant[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|[1] Siehe Kapitel 1.3]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS  ===
 +
 
 +
Die Ergebnisse von '''Kreuztabellen''' können mit '''Gruppierten Balkendiagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1]]]''' besonders anschaulich dargestellt werden.
 +
 
 +
Mit '''SPSS''' ist deren Erstellung sehr einfach.
 +
 
 +
Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN und machen Sie ein Häkchen beim Punkt ''Gruppierte Balkendiagramme anzeigen.''
 +
 
 +
Spielen Sie mit den einzelnen Elementen dieser Grafik herum. Beim Doppelklick auf Details dieses Diagramms werden sich viele Einstellmöglichkeiten öffnen.
 +
 
 +
[[File:quantitative-95_1.jpg|frame|center|Gruppiertes Balkendiagramm]]
 +
 
 +
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[1] Siehe Kapitel 3.6.1.3]]<br />
 +
 
 +
 
 +
== 3.5.3 Die Korrelation ==
 +
 
 +
Unter einer '''Korrelation''' versteht man eine Kennzahl '''für den Zusammenhang zwischen Variablen'''. Prinzipiell können folgende Zusammenhänge bestehen:
 +
 
 +
* '''Übereinstimmung''': je höher der Wert der Variablen A, desto höher ist meist auch der Wert der Variablen B: '''positive Korrelation'''
 +
* '''Gegensatz''': je höher Variable A, desto niedriger ist meist die Variable B: '''negative Korrelation'''
 +
* '''Unabhängigkeit''': Hohe Werte von A können relativ beliebigen Werten von B entsprechen und umgekehrt: '''keine Korrelation'''
 +
 
 +
Korrelationskoeffizienten können '''Werte zwischen -1,00 und +1,00''' annehmen'''.''' Ein Wert von -1,0 bedeutet eine perfekte '''negative Korrelation''': Hohe Werte der Variablen A gehen ausnahmslos mit niedrigen Werten der Variablen B einher und umgekehrt. Ein Wert von (+)1,0 bezeichnet eine perfekte '''positive Korrelation''': hohe Werte von A entsprechen praktisch immer hohen Werten von B und umgekehrt.
 +
 
 +
Je nach Art der '''Grundskalierung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' muss man zu '''unterschiedlichen Korrelationskoeffizienten''' greifen:
 +
 
 +
[[File:quantitative-96_1.jpg|frame|center|Geeigneter Korrelationskoeffizient für unterschiedliche Skalenniveaus]]
 +
 
 +
==== '''Vorsicht bei vorschneller Herstellung von Zusammenhängen''' ====
 +
 
 +
Gefundene Korrelationen müssen dennoch nochmals kritisch hinterfragt werden. Es gibt z.B. '''Scheinkorrelationen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2]]]''', die nur deshalb auftreten, weil beide Variablen hoch mit einer dritten Variable korrelieren, und '''verdeckte Korrelationen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3]]]''', bei welchen sich Subgruppen der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4]]]''' gegenseitig neutralisieren, selbst aber eine hohe '''Korrelation''' bei den beiden Variablen aufweisen. Erst die '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]''' gibt einer '''Korrelation''' die nötige Aussagekraft.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[2] Siehe Kapitel 3.5.3.4.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.2 Verdeckte Korrelation|[3] Siehe Kapitel 3.5.3.4.2]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[4] Siehe Kapitel 2.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.1 Maßkorrelation  ===
 +
 
 +
Der am häufigsten verwendete Korrelationskoeffizient ist der die Maßkorrelation beschreibende '''Pearsonsche Korrelationskoeffizient''' (Pearsons r). Er wird auch '''linearer Korrelationskoeffizient''' genannt.
 +
 
 +
Voraussetzungen zu seiner Anwendung:
 +
 
 +
• der Zusammenhang zwischen X und Y ist (annähernd) '''linear[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1]]]''',
 +
 
 +
• beide Variablen sind '''normalverteilt[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2]]]'''.
 +
 
 +
Die Berechnung der '''Maßkorrelation''' ''r'' erfolgt durch folgende Formel:
 +
 
 +
[[File:quantitative-97_1.jpg|frame|center|Formel zur Berechnung der Maßkorrelation]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[1] Siehe Kapitel 3.5.4.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2] Siehe Kapitel 3.1.3.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS  ===
 +
 
 +
'''Beispiel:'''<br />
 +
Wir möchten bei Fahrzeugen den Zusammenhang zwischen Gewicht und Beschleunigung feststellen. Wir kontrollieren mithilfe eines '''Histogramms[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]''', ob die beiden Variablen annähernd '''normalverteilt[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2]]]''' sind:
 +
 
 +
==== '''Kontrolle der ersten Bedingung (Normalverteilung)''' ====
 +
 
 +
[[File:quantitative-98_1.jpg|frame|center|Kontrolle der ersten Bedingung (Normalverteilung)]]
 +
 
 +
==== '''Kontrolle der 2. Bedingung (linearer Zusammenhang)''' ====
 +
 
 +
Dann erstellen wir ein '''Streudiagramm''', welches uns einen Einblick gibt, ob die beiden Variablen systematische Entsprechungen zeigen und versuchen, in diese '''eine Regressionsgerade zu legen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3]]]'''. Falls dies möglich ist, ist auch die zweite Bedingung zur Anwendung der Maßkorrelation erfüllt.
 +
 
 +
[[File:quantitative-98_2.jpg|frame|center|Kontrolle der zweiten Bedingung (Linearer Zusammenhang)]]
 +
 
 +
Wir sehen einen merkbaren, wenn auch nicht extrem eindeutigen '''linearen Zusammenhang'''. Nun haben wir die Voraussetzungen geprüft, um diese Korrelationsberechnung anwenden zu können.
 +
 
 +
==== '''Berechnung der Maßkorrelation mit SPSS:''' ====
 +
 
 +
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach Pearson. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Klicken Sie auf OK:
 +
 
 +
[[File:quantitative-98_3.jpg|frame|center|Mit SPSS berechnte Maßkorrelation]]
 +
 
 +
'''Ergebnis des Beispiels:'''<br />
 +
Es gibt einen nachweisbaren Zusammenhang zwischen der Beschleunigung von Fahrzeugen und ihrem Gewicht. Dieser Zusammenhang ist mit einer Irrtumswahrscheinlichkeit von 1 % '''signifikant[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4]]]'''. Da es '''eine negative Korrelation''' ist, kann man sagen, dass mit steigendem Gewicht des Fahrzeugs seine Beschleunigung abnimmt, was nicht weiter überraschend ist.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.1 Normalverteilung|[2] Siehe Kapitel 3.1.3.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[3] Siehe Kapitel 3.5.4.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[4] Siehe Kapitel 3.5.3.4.4]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.2 Rangkorrelation R (Krueger-Spearman)  ===
 +
 
 +
Die '''Rangkorrelation''' R (nach Krueger- Spearman) wird v.a. bei der Auswertung psychologischer, pädagogischer und soziologischer Untersuchungen verwendet, wenn also keine wissenschaftlichen Maßeinheiten vorhanden sind, dennoch aber z.B. eine Reihung nach Größe und Intensität sinnvoll sein kann.
 +
 
 +
Z.B. kann man Kameradschaftlichkeit oder Egoismus kaum sinnvoll in Zahlenwerten messen, aber dennoch Menschen ersuchen, Mitmenschen bezüglich dieser Eigenschaften rangzureihen.
 +
 
 +
==== '''Auch verwendet für Zusammenhänge zwischen metrischen und ordinalskalierten Daten''' ====
 +
 
 +
Man setzt die '''Rangkorrelation''' häufig auch ein, wenn man den Zusammenhang von '''ordinalskalierten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1]]]''' und '''metrischen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[2]]]''' Variablen berechnen möchte. Dabei wandelt man die Messwerte zuerst in Rangplätze um (nachdem man diese größenmäßig gereiht hat) um danach R berechnen zu können. Fallen mehrere umgewandelte Messwerte auf den gleichen Rangplatz, teilen sie sich diese Plätze (arithmetisches Mittel), also 6., 7., 8. und 9. Platz = 30 (6+7+8+9). 30 dividiert durch 4 (Anzahl der Rangplätze) =7,5. Jeder dieser 4 gleichen Messwerte erhält somit den Rangplatz 7,5.
 +
 
 +
==== '''Berechnung der Rangkorrelation:''' ====
 +
 
 +
[[File:quantitative-99_1.jpg|frame|center|Formel zur Berechnung der Rangkorrelation R]]
 +
 
 +
R= 1-, d<sub>i</sub>= Differenz des Rangplatzpaares (x<sub>i</sub>-y<sub>i</sub>); n= Anzahl der Rangplätze
 +
 
 +
Beispiel:
 +
 
 +
[[File:quantitative-99_2.jpg|frame|center|Beispiel zur Berechnung der Rangkorrelation R]]
 +
 
 +
Berechnung R= 1-(6*38)/(9*(81-1) = 0,68
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[1] Siehe Kapitel 3.1.2.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.1.1 Metrische und nichtmetrische Variablen|[2] Siehe Kapitel 3.1.1.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS  ===
 +
 
 +
Klicken Sie in der Menüleiste auf ANALYSIEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich die nach '''Spearman'''. Im Feld ''Variablen'' fügen Sie die beiden '''Variablen''' ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' als die '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''' verfügen ('''Intervall-[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3]]]''' oder '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4]]]'''), werden sie automatisch von '''SPSS''' in die entspechenden Rangplätze umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der Korrelation gemeinsam mit der Beurteilung ihrer '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2] Siehe Kapitel 3.1.2.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.3 Rangkorrelation Tau (Kendall)  ===
 +
 
 +
Die '''Rangkorrelation TAU''' (nach '''Kendall''') wird häufig verwendet, '''wenn N''', also die Gesamtanzahl an Fällen, '''sehr niedrig ist''' (< 20).
 +
 
 +
'''Berechnung: '''Zuerst werden alle Ausprägungen der beiden Variablen in Ränge umgewandelt.
 +
 
 +
[[File:quantitative-101_1.jpg|frame|center|Schritt 1 zur Berechnung der Rangkorrelation Tau (Kendall)]]
 +
 
 +
Danach wird eine Variable größenmäßig sortiert (nach Rangplätzen), die zum gleichen Fall gehörenden Rangplätze der anderen Variablen werden darunter geschrieben:
 +
 
 +
[[File:quantitative-101_2.jpg|frame|center|Schritt 2 zur Berechnung der Rangkorrelation Tau (Kendall)]]
 +
 
 +
Die 1. Rangreihe ist bereits größenmäßig sortiert. In der 2. Rangreihe wird nun verglichen, ob die Rangordnung der 1. Rangreihe (Schulbildung) eingehalten wird. D.h. bei einer maximalen positiven Korrelation von Schulbildung und Schichtzugehörigkeit müsste bei Schichtzubehörigkeit ebenfalls B den 1. Platz haben, E den 2., D den 3. usw., bei einer negativen Korrelation selbstverständlich umgekehrt.
 +
 
 +
Für jede Person der 2. Rangreihe (Schichtzugehörigkeit) wird nun verglichen, ob auf sie folgenden Rangzahlen größer oder kleiner sind. ’Richtig’ wäre eine größere nach einer kleineren Rangzahl; ’falsch’ eine kleinere nach einer größeren Rangzahl:
 +
 
 +
[[File:quantitative-101_3.jpg|frame|center|Schritt 3 zur Berechnung der Rangkorrelation Tau (Kendall)]]
 +
 
 +
Insgesamt überprüfen wir 10 Zahlenpaare. Für jede 'richtige' Zahlenfolge zählen wir ein "Plus", für jede 'falsche' Reihenfolge ein "Minus".
 +
 
 +
[[File:quantitative-101_4.jpg|frame|center|Schritt 4 zur Berechnung der Rangkorrelation Tau (Kendall)]]
 +
 
 +
Wir zählen 6-Plus und 4-Minuszeichen, zieht man die Minus von den Plus ab, ergibt sich die Summe S = 2. Diese Summe S wird bei der Berechnung von Tau mit der höchstmöglichen Summe dieser Art S<sub>max</sub> verglichen.
 +
 
 +
S<sub>max</sub> errechnet sich aus N(N-1)/2, denn die Gesamtzahl von Paarvergleichen hängt nur von N (also der Länge der Rangreihe ab). Ist die zweite Rangreihe identisch mit der ersten (geordneten), so ergeben sich beim Paarvergleich nur ’richtige’ Reihenfolgen und die Gesamtsumme des "Plus- Zeichen" ist gleich der Summe der insgesamt möglichen Paarvergleiche S<sub>max</sub>.
 +
 
 +
Tau ergibt sich als TAU = S/S<sub>max.</sub>
 +
 
 +
In unserem Beispiel ist S<sub>max</sub> = 5*4/2 = 10. TAU ist also gleich 2/10 = 0,2
 +
 
 +
[[File:quantitative-101_5.jpg|frame|center|Formel zur Berechnung der Rangkorrelation Tau (Kendall)]]
 +
 
 +
'''Diese Berechnungsart sollte nur dann angewendet werden, wenn innerhalb einer Rangreihe keine geteilten Rangplätze auftreten.'''
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.3.1 Berechnung von TAU mit SPSS  ===
 +
 
 +
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - BIVARIAT und wählen Sie dort die entsprechende Korrelationsform, nämlich '''Kendall-Tau'''. Im Feld Variablen fügen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen möchten. Falls die Variablen über höherwertige '''Skalierungen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1]]]''' als die '''Ordinalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''' verfügen ('''Intervall[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3]]]''' - oder '''Proportionalskala[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4]]]'''), werden sie automatisch umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der '''Korrelation''' gemeinsam mit der Beurteilung ihrer '''Signifikanz[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2 Skalenniveaus|[1] Siehe Kapitel 3.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2] Siehe Kapitel 3.1.2.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.4 Intervallskalierung|[3] Siehe Kapitel 3.1.2.4]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.5 Proportionalskalierung|[4] Siehe Kapitel 3.1.2.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.4 Signifikanz der Korrelation|[5] Siehe Kapitel 3.5.3.4.4]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4 Aussagekraft einer Korrelation  ===
 +
 
 +
Die Aussagekraft einer '''Korrelation''' hängt von mehreren Faktoren ab:
 +
 
 +
A. der Höhe der '''Korrelation'''
 +
 
 +
B. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]'''(n)
 +
 
 +
C. der Sorgfalt beim Ausschluss einer möglichen Scheinkorrelation bzw. des Erkennens verdeckter Korrelationen.
 +
 
 +
Die statistische Kennzahl der '''Signifikanz''' berücksichtigt sowohl die Höhe der '''Korrelation''' wie auch die Größe der Stichprobe und gibt Auskunft über die '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2]]]''', dass die erhaltene '''Korrelation''' rein zufällig auftrat. Sie ist statistisch von äußerst großer Bedeutung.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1] Siehe Kapitel 2.1.1]]<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[2] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4.1 Wann sind Korrelationen bemerkenswert?  ===
 +
 
 +
Die Größe einer Korrelation sagt alleine noch nichts über ihre Aussagekraft aus. Prinzipiell gilt, dass '''eine hohe Korrelation umso leichter zu erzielen ist, je kleiner die Stichprobe ausfällt.''' Bei einer Stichprobengröße von 1 liegt jede Korrelation beim Maximalwert r=1.
 +
 
 +
Bei kleineren Stichproben (etwa n=20) sind folgende Einschätzungen von ''r'' bzw. ''R'' weitverbreitet:
 +
 
 +
[[File:quantitative-104_1.jpg|frame|center|Einstufungen von Korrelationskoeffizienten]]
 +
 
 +
'''Ob eine Korrelation bedeutend oder unbedeutend ist, hängt auch von der Art des (überraschenden) Zusammenhangs ab'''. Eine hohe Korrelation der Schuhgröße mit der Körpergröße von r=0,8 ist deutlich weniger bedeutend als eine gesicherte Korrelation von r=0,4 bei einer großen Stichprobe über den Zusammenhang zwischen dem Konsum eines bestimmten Nahrungsmittels und der Entwicklung einer bestimmten Krankheit.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4.2 Verdeckte Korrelation  ===
 +
 
 +
Von einer '''verdeckten Korrelation''' spricht man, wenn '''statistisch keinerlei Korrelation''' errechnet wurde, obwohl '''sachlich eindeutig Zusammenhänge''' vorliegen.
 +
 
 +
Dies ist z.B. möglich, wenn Subgruppen der untersuchten Population in hohem Maße Tendenzen aufweisen, welche durch andere Subgruppen neutralisiert werden, weil diese sich gegenläufig verhalten.
 +
 
 +
==== '''Fiktives Beispiel: Zusammenhang von Zigarettenkonsum und -werbung''' ====
 +
 
 +
Wir untersuchen, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabak-Werbung auf das Rauchverhalten von Jugendlichen ausübt. Wir stellen fest, dass es keinen messbaren Zusammenhang zwischen dem Konsum der Werbung und dem Zigarettenkonsum gibt. Der Zigarettenkonsum hat sich durch die Wahrnehmung der Werbung nicht verändert.
 +
 
 +
[[File:quantitative-105_1.gif|frame|center|Korrelation zwischen Zigarettenkonsum und Zigarettenwerbung]]
 +
 
 +
Ein Blick auf die zugrundeliegenden Daten zeigt jedoch, dass es sehr wohl einen substantiellen Zusammenhang geben muss. Wir betrachten dazu ein Histogramm (In SPSS -> GRAFIKEN - HISTOGRAMM), bei welchem wir die Werbung als Variable eintragen, die Veränderung des Zigarettenkonsums in ''Felder anordnen als'' und unter ''Variable verspachteln'' das Geschlecht eintragen.
 +
 
 +
[[File:quantitative-105_2.jpg|frame|center|Befehlsschaltfläche Histogramm in SPSS]]
 +
 
 +
Wir erhalten dann folgende zwei nach Geschlechtern getrennte Histogramme:
 +
 
 +
[[File:quantitative-105_3.jpg|frame|center|Nach Geschlechern getrennte Histogramme zum Zigarettenkonsum]]
 +
 
 +
Wir sehen, dass bei den Jungen eine '''perfekte negative Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' vorliegt (r=-1), bei den Mädchen hingegen eine perfekte '''positive Korrelation''' (r=1). Die Jungen haben die Werbung eher als erschreckend für den Tabakkonsum aufgefasst, die Mädchen hingegen als ermutigend. Am Ende des Untersuchungszeitraums rauchten die Mädchen im gleichen Maße mehr als die Jungen weniger rauchten. Dadurch ergab sich eine '''Null-Korrelation''' auf der Ebene der gesamten '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1] Siehe Kapitel 3.5.3]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4.3 Scheinkorrelationen und Störvariable  ===
 +
 
 +
Eine '''Scheinkorrelation''' ist ein '''statistisch gemessener Zusammenhang zwischen zwei Variablen''', welcher nur deshalb auftritt, weil beide Variablen '''systematisch von einer dritten Variablen beeinflusst''' werden.
 +
 
 +
==== '''Zusammenhang kann auf Störfaktoren zurückgehen''' ====
 +
 
 +
Die '''Korrelation''' ist eine interessante Methode zur Berechnung von Zusammenhängen. Jedoch sollte man sich vergewissern, dass der gemessene Zusammenhang tatsächlich prioritär und somit kausal ist.
 +
 
 +
Es ist immer auch möglich, dass andere Erklärungen ('''Störfaktoren''') für den Zusammenhang übersehen wurden, was zu '''Scheinkorrelationen''' führen kann.
 +
 
 +
'''Beispiel 1: Bringen Störche Kinder?'''<br />
 +
So zeigt sich in Untersuchungen verschiedener Länder ein hoher Zusammenhang zwischen der Storchenpopulation und der Geburtenrate (teilweise bis r=0,7) im Laufe der Jahrzehnte. Die Erklärung dieses verblüffenden Zusammenhanges ist einfach: Durch bessere Bildungs- und Berufschancen der Frauen ging die Geburtenrate zurück, durch zunehmende Umweltbelastung die Storchenpopulation. Daher ist der Zusammenhang von Storchenpopulation und Geburtenrate rein zufällig. Er ergibt sich statistisch einfach dadurch, dass sowohl Storchenpopulation wie auch Geburtenrate hoch mit der Wirtschaftsentwicklung korrelieren. Diese führte zu besseren Jobchancen für Frauen und dadurch auch zu geringeren Kinderzahlen wie auch zu einer zunehmenden Umweltbelastung und damit zu sinkenden Storchenpopulationen.
 +
 
 +
'''Beispiel 2: Haben reichere Männer weniger Haare?'''<br />
 +
Es lässt sich ein hoher Zusammenhang zwischen Männern mit schütterem Haar und hohem Einkommen nachweisen. Tatsächlich besteht aber eher ein Zusammenhang zwischen dem Alter der Männer und ihrem Einkommen und mit zunehmendem Alter nimmt auch die Zahl der Haare ab.
 +
 
 +
Ist man unsicher, ob eine errechnete '''Korrelation''' haltbar ist, kann man kann mögliche '''Störfaktoren''' mit der '''Partiellen Korrelation''' herausfiltern.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4.3.1 Partielle Korrelation mit SPSS  ===
 +
 
 +
==== '''Beispiel: Korrelation von Fertiliät und weiblicher Lebenserwartung''' ====
 +
 
 +
Wir untersuchen den Zusammenhang zwischen Fertilität und weiblicher Lebenserwartung (basierend auf den Daten in world95.sav der UNO). Eine Rangkorrelation zwischen beiden liefert folgendes Resultat:
 +
 
 +
[[File:quantitative-107_1.jpg|frame|center|Korrelation zwischen weiblicher Fertilität und Lebenserwartung]]
 +
 
 +
==== '''Überlegung:''' ====
 +
 
 +
Wir sehen einen hohen und signifikanten Zusammenhang zwischen beiden '''Variablen'''. Offensichtlich führt eine große Kinderzahl zu stark abnehmender weiblicher Lebenserwartung und umgekehrt. Doch warum sollte dies so sein? Wir kennen doch Personen in unserer Gesellschaft, welche viele Kinder haben und dennoch in voller Gesundheit sehr alt wurden, während wir auch viele kränkliche einzelstehende Personen kennen. Wir suchen daher nach Variablen, welche die beiden vorhandenen beeinflusst haben könnten und dadurch indirekt deren hohen Zusammenhang begründen. Eine derartige mögliche (Stör-)variable ist die weibliche Alphabetisierungsrate. Sie verbessert den Zugang zu Informationen über verbesserte Gesundheitsvorsorge. Damit erhöht sie die Lebenserwartung. Gleichzeitig bietet sie durch verbesserte Berufschancen in qualifizierteren Bereichen auch häufig bessere Einkommensschancen. Bleibt eine gut verdienende Frau wegen zahlreicher Kinder zuhause, stellt dies gleichzeitig für die Familie einen größeren finanziellen Verlust dar, wie wenn eine schlecht verdienende Frau zuhause bleiben würde. Daher entscheiden sich gebildete Frauen häufig gegen höhere Kinderzahlen. Auch wird die Geburt der ersten Kinder oft hinter den abgeschlossenen Bildungsweg zurückgeschoben, was ebenfalls die Fertilität verringert.
 +
 
 +
Das waren sachliche Argumente. Die Korrelationen stützen diese Annahme:
 +
 
 +
[[File:quantitative-107_2.jpg|frame|center|Korrelation zwischen weiblicher Fertilität, Lebenserwartung und Alphabetisierungsrate]]
 +
 
 +
==== '''Herausrechnung der Störvariable mit SPSS:''' ====
 +
 
 +
Um nun den Einfluss der ''Störvariable'' aus der Beziehung ''weibliche Lebenserwartung/Geburtenrate'' herauszurechnen, gehen wir in SPSS folgendermaßen vor:
 +
 
 +
Klicken Sie in der Menüleiste auf ANAYLISEREN - KORRELATION - PARTIELLE KORRELATIONEN.
 +
 
 +
[[File:quantitative-107_3.jpg|frame|center|Partielle Korrelation mit SPSS - Herausrechnen der Störvariable]]
 +
 
 +
Im Feld ''Variablen'' fügen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen möchten. Unter ''Kontrollvariablen'' fügen Sie die ''Störvariable'' ein. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der '''Korrelation''' gemeinsam mit der Beurteilung ihrer Signifikanz.
 +
 
 +
[[File:quantitative-107_4.jpg|frame|center|Korrelation Fertilität und Lebenserwartung ohne Störvariable Alphabetisierungsrate]]
 +
 
 +
Sie sehen, dass durch den Ausschluss dieser '''Störvariable''' die Korrelation zwischen der weiblichen Lebenserwartung und der Fertilität auf die Hälfte gesunken ist.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4.4 Signifikanz der Korrelation  ===
 +
 
 +
Die '''Signifikanz''' ist eine Kennzahl, welche die Wahrscheinlichkeit eines systematischen Zusammenhangs zwischen den Variablen bezeichnet. Sie drückt aus, ob ein scheinbarer Zusammenhang rein zufälliger Natur sein könnte oder mit hoher '''Wahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' tatsächlich vorliegt. Man spricht bei der '''Signikanz''' von '''Irrtumswahrscheinlichkeiten''' oder '''Signifikanzniveaus'''. Gängige Formulierungen lauten etwa, dass zwischen den Variablen A und B eine Korrelation von r=0,5 auf dem '''Signifikanzniveau''' oder der '''Irrtumswahrscheinlichkeit''' von p ≤ 1 % besteht. Dies bedeutet, dass die zwischen den Variablen A und B gefundene Korrelation in dieser Höhe und bei dieser Stichprobengröße nur in weniger als 1 % aller Fälle rein zufällig auftritt.
 +
 
 +
Die Kennzahl ''p'' der '''Irrtumswahrscheinlichkeit''', auf deren komplexe Berechnung hier nicht eingegangen wird, berücksichtigt somit sowohl die '''Höhe der Korrelation''' wie auch die '''Größe der Stichprobe'''. Ist die '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' sehr klein, muss die Korrelation extrem groß ausfallen, um '''signifikant''' sein zu können. Hingegen kann auch eine Korrelation von r=0,2 bei sehr großen Stichproben '''signifikant''' werden.
 +
 
 +
==== '''Grenzwerte der Signifikanz bei n=20''' ====
 +
 
 +
Für eine Stichprobe der Größe n = 20 finden wir für einseitige Irrtumswahrscheinlichkeit (Signifikanz) folgende Grenzwerte:
 +
 
 +
Irrtumswahrscheinlichkeit p ≤ 5 %: r/R/TAU muss größer sein als 0,377
 +
 
 +
Irrtumswahrscheinlichkeit p ≤ 1 %: r/R/TAU muss größer sein als 0,534
 +
 
 +
D.h. wenn man eine Korrelation von 0,6 bei einer Stichprobe von n=20 ermittelt, dann ist die Wahrscheinlichkeit geringer als 1 %, dass dieser Zusammenhang rein zufälliger Natur ist.
 +
 
 +
==== '''Bestimmtheitsmaß: Anteil der Korrelation an Veränderung''' ====
 +
 
 +
Wenn der Korrelationskoeffizient quadriert wird, erhält man das '''Bestimmtheitsmaß''' (R<sup>2</sup>), den Anteil der durch eine Variable erklärten Streuung an der Streuung der anderen. R/r=0,8 bedeutet nicht, dass 80 % der Stichprobe einander entsprechen. R<sup>2</sup> gibt Aufschluss darüber, dass 0,8*0,8=0,64 = 64 % der Variabilität der Werte beider Variablen durch den Zusammenhang bestimmt sind.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.4.4.1 Signifikanz mit SPSS  ===
 +
 
 +
==== '''Signifkanz von Korrelationen wird von SPSS automatisch ermittelt''' ====
 +
 
 +
Statistikprogramme wie '''SPSS''' ermitteln selbstständig bei der Berechnung der Korrelation die dazugehörige '''Irrtumswahrscheinlichkeit'''. Bei SPSS wird '''mit Sternen ausgedrückt''' (1, 2 oder 3 Sterne), ob die Korrelation '''signifikant''' ist, d.h. ob der Zusammenhang weitgehend gesichert scheint oder nicht.
 +
 
 +
Drei wesentliche Schwellen der '''Irrtumswahrscheinlichkeit[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1]]]''' haben breite Akzeptanz gefunden:
 +
 
 +
* p <=  0,05 (die Wahrscheinlichkeit einer rein zufälligen Korrelation liegt bei unter 5 %, SPSS vergibt einen Stern = *);
 +
* p <= 0,01 (die Irrtumswahrscheinlichkeit ist kleiner als 1 %, SPSS vergibt 2 Sterne **) oder
 +
* p <= 0,001 (die Irrtumswahrscheinlichkeit ist kleiner als 1 ‰, SPSS vergibt 3 Sterne ***).
 +
 
 +
[[File:quantitative-109_1.gif|frame|center|Korrelation zwischen Kalorienaufnahme und BNP]]
 +
 
 +
 +
 
 +
Diese Korrelation zeigt, basierend auf UNO- Statistiken aus dem Jahr 1995, den Zusammenhang zwischen der täglichen Kalorienaufnahme und dem Bruttonationalprodukt von Ländern. Defaultmäßig berechnet SPSS zur Korrelation auch die '''Signifikanz''' der Korrelation und markiert signifikante Korrelationen wie in diesem Beispiel mit Sternchen. Diese Korrelation ist signifikant auf dem 1%-Niveau (2 Sternchen). Damit signifikante Korrelationen automatisch mit Sternchen markiert werden, muss im Fenster der Korrelationsberechnung der Punkt ''signifikante Korrelationen markieren'' mit einem Häkchen markiert sein.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|[1] Siehe Kapitel 1.3.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.3.5 Kovarianz  ===
 +
 
 +
'''Die Kovarianz ist eine Kennzahl für den Zusammenhang von zwei Variablen.''' Sie entspricht der Summe der gemittelten Abweichungsprodukte der Variablen. Sie wird nach folgender Formel berechnet:
 +
 
 +
[[File:quantitative-110_1.jpg|frame|center|Formel zur Berechnung der Kovarianz]]
 +
 
 +
Die '''Kovarianz''' ist '''positiv''', wenn X und Y tendenziell einen linearen Zusammenhang besitzen, d. h. hohe Werte von X entsprechen hohen Werten von Y und niedrige Werte von X niedrigen Werten von Y.
 +
 
 +
Die '''Kovarianz''' ist '''negativ''', wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte von X gehen einher mit niedrigen Werten von Y und umgekehrt.
 +
 
 +
Da die Kovarianz in ihrer Rohform von der Größe der zugrundeliegenden Daten abhängt, ist die Einschätzung ihres Wertes ohne die Kenntnis der zugrundeliegenden Daten nicht einschätzbar. Dazu muss sie erst standardisiert werden, was zur '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' führt.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1] Siehe Kapitel 3.5.3]]<br />
 +
 
 +
 
 +
== 3.5.4 Regression ==
 +
 
 +
'''Die Regression(sanalyse) ist ein Verfahren zur Analyse von Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen.''' Während die '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]''' die Stärke eines Zusammenhangs zeigt, erlaubt es die '''Regression''', von einer bekannten Größe einer Variable auf die vermutliche Größe der abhängigen Variablen zu schließen, falls ein systematischer Zusammenhang zwischen zwei Variablen A und B vorliegt.
 +
 
 +
Prinzipiell unterscheidet man zwischen '''linearer''' und '''nicht-linearer Regression'''.
 +
 
 +
Bei der '''linearen Regression''' kann eine Art '''Regressionsgerade''' ins Histogramm gelegt werden, welche die Möglichkeit der annähernden '''Voraussage von Ausprägungen''' bietet.
 +
 
 +
Der Verlauf der Regressionsgerade wird über die Formel
 +
 
 +
y = b*x + a
 +
 
 +
ermittelt, wobei ''b'' den '''Regressionskoeffizienten''' darstellt, welcher den Tangens des Steigungswinkels der Regressionsgeraden angibt. Der '''Regressionskoeffizient''' wird über die nachfolgende Formel ermittelt:
 +
 
 +
[[File:quantitative-111_1.jpg|frame|center|Formel zu Berechnung des Regressionskoeffizients]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1] Siehe Kapitel 3.5.3]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression  ===
 +
 
 +
Die '''lineare Regression''' kann mit SPSS auf folgende Weise ermittelt werden:
 +
 
 +
A. Klicken Sie auf ''ANALYSIEREN - REGRESSION - LINEAR.'' Es erscheint folgendes Fenster:
 +
 
 +
[[File:quantitative-112_1.jpg|frame|center|Berechnung der linearen Regression mit SPSS]]
 +
 
 +
B. Tragen Sie in ''Abhängige Variable'' die von Ihnen gewünschte metrische Variable ein; in ''unabhängige Variable'' diejenige Variable, deren Einfluss auf die erste Variable Sie ergründen möchten.
 +
 
 +
C. Klicken Sie auf OK. Sie erhalten nun folgende Ausgaben:
 +
 
 +
[[File:quantitative-112_2.jpg|frame|center|Ausgabe Modellzusammenfassung mit SPSS, Beispiel Kindersterblichkeit und weibliche Alphabetisierungsrate]]
 +
 
 +
'''Erklärungen:'''
 +
 
 +
Was in der ersten Tabelle ''R'' genannt wird, ist die Quadratwurzel aus dem '''Bestimmtheitsmaß''' und deckt sich bei der einfachen Regressionsanalyse mit dem '''Korrelationskoeffizienten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1]]]''' von '''Pearson'''. Die Korrelation von 0,711 ist durchaus ansehnlich.
 +
 
 +
Unter ''Koeffizienten'' stehen die zwei wesentlichen Werte für die Berechnung der '''Regressionsgerade''': Die ''Konstante'' (hier 127,203) ist der Ausgangswert, der darunter stehende Wert -1,129 der Multiplikationsfaktor.
 +
 
 +
Die hier vorliegende Gleichung, die wir errechnen wollten, ist also:
 +
 
 +
A = -1,129*B + 127,203 oder in konkreten Begriffen formuliert:
 +
 
 +
Kindersterblichkeit (pro Tausend) = (weibliche Alphabetisierungsrate)*(-1,129) + 127,203
 +
 
 +
Bei einer weiblichen Alphabetisierungsrate von 50 % könnte man somit eine Kindersterblichratsrate von -1,129*50 + 127,203 voraussagen, also 70,753.
 +
 
 +
Es sei hinzugefügt, dass es sich hier nur um eine Einführung in die '''Regressionsanalyse''' handelt und deshalb auf wichtige damit zusammen hängende Begriffe wie '''Standardfehler der Schätzung''' nicht eingegangen werden kann.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[1] Siehe Kapitel 3.5.3.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.5.4.2 Grafische Darstellung der Regression  ===
 +
 
 +
Grafisch kann man eine '''Regressionsgerade''' mit SPSS auf folgende Weise erstellen: Klicken Sie in der Menüleiste auf GRAFIKEN - STREU- /PUNKTDIAGRAMM - EINFACHES STREUDIAGRAMM. Dort geben Sie nach Klick auf ''Definieren'' in der Y- Achse eine metrische Variable ein, in der X-Achse genauso. Dann klicken Sie auf OK. Sie erhalten zuerst ein Streudiagramm, vorerst noch ohne Regressionsgerade:
 +
 
 +
[[File:quantitative-113_1.jpg|frame|center|Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate]]
 +
 
 +
Nun machen Sie einen Doppelklick auf das Diagramm in der SPSS- Ausgabe. Sie landen im Diagramm-Editor. Unter ''Elemente'' können Sie ''Anpassungslinie bei Gesamtwert'' anklicken. Daraufhin wird defaultmäßig eine Regressionsgerade in das Streudiagramm eingefügt, gleichzeitig öffnet sich das folgende Fenster:
 +
 
 +
[[File:quantitative-113_2.jpg|frame|center|Schaltfläche Diagramm-Eigenschaften in SPSS]]
 +
 
 +
Kontrollieren Sie nochmals, ob hier ''Linear'' angeklickt ist. Nur ''linear'' realisiert eine '''Regressionsgerade'''. Nach ''Zuweisen'' erhalten Sie nun das '''Streudiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[1]]]''' mit der entsprechenden Regressionsgerade:
 +
 
 +
[[File:quantitative-113_3.jpg|frame|center|Streudiagramm mit Regressionsgerade]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|[1] Siehe Kapitel 3.6.1.6]]<br />
 +
 
 +
 
 +
<br />
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|Nächstes Kapitel: 3.6 Die grafische Darstellung statistischer Ergebnisse]]'''
 +
----
 +
[[#3.5 Der Zusammenhang zwischen Variablen|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5 Der Zusammenhang zwischen Variablen|Vorheriges Kapitel: 3.5 Der Zusammenhang zwischen Variablen]]'''
 +
= 3.6 Die grafische Darstellung statistischer Ergebnisse =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
==== '''Ein Bild sagt mehr als 1000 Worte''' ====
 +
 
 +
Dies trifft auch für die Statistik zu. Wer es versteht, mit einfachen, klaren und aussagekräftigen '''Diagrammen''' zu punkten, wird für eine leichten und einprägsamen Zugang zu seinen Analysen Anerkennung finden.
 +
 
 +
==== '''Vorteil von Diagrammen liegt in Einfachheit der Darstellung''' ====
 +
 
 +
Allzuleicht lässt man sich von der Vielfalt an grafischen Darstellungsmöglichkeiten beeinflussen und meint, Diagramme noch ein wenig optisch ausgefaller, dreidimensional, vermeintlich attraktiver mit zahlreichen Schmankerln machen zu müssen, bis irgendwann einmal der Vorteil eines '''Diagramms''' gegenüber einer komplexen '''Tabelle''' verloren geht und die BetrachterInnen ratlos vor einem schwierig zu deutenden Kunstwerk sitzen. Niemand ist bereit, einige Minuten vor einem komplexen '''Diagramm''' zu sitzen, um zu versuchen, es zu verstehen. Mit Diagrammen gewinnt man die BetrachterIn in wenigen Sekunden oder man verliert sie/ihn. '''Die Notwendigkeit der inhaltlichen Klarheit und dadurch Schlichtheit eines Diagramms hat klare Priorität vor der künstlerischen Gestaltung.'''
 +
 
 +
==== '''Nicht jedes Diagramm ist für jede Datenlage geeignet.''' ====
 +
 
 +
Man sollte bedenken, dass nicht jedes '''Diagramm''' für jede Art von Information geeignet ist. Manche '''Diagramme''', wie '''Kreisdiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[1]]]''', werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und würden bei der Wiedergabe von '''Mehrfachantworten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2]]]''' zu falschen Schlüssen führen.
 +
 
 +
==== '''Begleitinformationen sind wichtig''' ====
 +
 
 +
Auch '''Diagramme''' benötigen '''Begleitinformationen''', um sie voll verständlich zu machen und wissenschaftliche Seriösität nachzuweisen.
 +
 
 +
==== '''Was in Diagrammen, was im Text?''' ====
 +
 
 +
Zeigen Sie mit Diagrammen besondere Eigenheiten der Daten und packen Sie die Analysen und anderen notwendigen Begleitinformationen in den Text.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|[1] Siehe Kapitel 3.6.1.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[2] Siehe Kapitel 3.2.2]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|3.6 Die grafische Darstellung statistischer Ergebnisse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1 Arten von Diagrammen|3.6.1 Arten von Diagrammen]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.1 Kreisdiagramme|3.6.1.1 Kreisdiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|3.6.1.2 Liniendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|3.6.1.3 Balkendiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS|3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.4 Kartogramme|3.6.1.4 Kartogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|3.6.1.5 Histogramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.6 Streudiagramme|3.6.1.6 Streudiagramme]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.2 Welches Diagramm für welche Daten?|3.6.2 Welches Diagramm für welche Daten?]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.3 Notwendige Begleitinformationen von Diagrammen|3.6.3 Notwendige Begleitinformationen von Diagrammen]]<br />
 +
</div>
 +
 
 +
== 3.6.1 Arten von Diagrammen ==
 +
 
 +
Wesentliche Diagrammformen sind:
 +
 
 +
* '''Balkendiagramme''', inklusive gruppierten '''Diagrammen''' und '''Stapelbalkendiagrammen'''
 +
* '''Liniendiagramme'''
 +
* '''Flächendiagramme'''
 +
* '''Kreisdiagramme'''
 +
* '''Boxplots[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|[1]]]'''
 +
* '''Streudiagramme'''
 +
* '''Histogramme'''
 +
* '''Kartogramme'''
 +
 
 +
==== '''Viele Programme ermöglichen die Erstellung von Diagrammen''' ====
 +
 
 +
Mit Ausnahme von '''Boxplots''' und '''Kartogrammen''' können alle Diagrammformen von den gängigen Programmen erstellt werden, wie sogar von '''WinWord''' (EINFÜGEN - GRAFIK - DIAGRAMM) oder '''Excel'''. In SPSS geht man in der Menüleiste zu ''GRAFIKEN'' und findet dort alle hier angeführten Diagrammformen und viele mehr zur Auswahl.
 +
 
 +
Auch hier gilt, dass professionelle statistische Programme wie z.B. '''SPSS''' oder '''Statistica''' Vorteile aufweisen, da sie eine Fülle feiner Einstellungen erlauben, welche mit Bordmitteln nicht zu erreichen sind. Auch verbinden sie in effizienter Form im gleichen Menüpunkt die gleichzeitige Berechnung und Erstellung komplexer Statistiken wie auch von '''Diagrammen'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5.1 Erstellung von Boxplots mit SPSS|[1] Siehe Kapitel 3.4.5.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.1 Kreisdiagramme  ===
 +
 
 +
'''Kreisdiagramme''' (auch '''Tortendiagramme''') genannt, sind eine beliebte grafische Darstellungsform, um die '''Aufteilung eines Ganzen''' aufzuzeigen.
 +
 
 +
Für die grafische Darstellung '''kategorieller''' Daten ('''Nominal[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1]]]'''- oder '''Ordinalskalen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2]]]''') verwendet man Diagrammformen, die eine möglichst klare Darstellung der relativen Anteile erlauben. Alle Anteile müssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick größenmäßig eingeordnet werden können, dürfen '''nicht zu viele Kategorien''' verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach Möglichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.
 +
 
 +
'''Besonders gut geeignet für die Darstellung relativer Anteile''' sind '''Torten'''- oder '''Kreisdiagramme''':
 +
 
 +
[[File:quantitative-116_1.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Nkorongoji (Mali)]]
 +
 
 +
==== '''Optimal große Teile, aber nicht zu viele.''' ====
 +
 
 +
'''Für das menschliche Auge sind Winkel von mehr als 90 Grad besonders gut zu erkennen.''' Deshalb eignen sich Tortendiagramme besonders zur Darstellung von Mehrheiten oder von Anteilen von mindestens einem Viertel.
 +
 
 +
Wird die Anzahl der Anteile und damit der Tortenstücke zu zahlreich, wird ein Tortendiagramm schnell unübersichtlich, besonders wenn gleichzeitig seine größten Stücke kleiner als ein Viertel werden:
 +
 
 +
[[File:quantitative-116_2.gif|frame|center|Kreisdiagramm Religionszugehörigkeit in Matmatar]]
 +
 
 +
Hier ist es nur mehr mit Mühe möglich, die Tortenstücke nach ihrer Größe zu reihen, da die Rundung die Abschätzung der relativen Größe erschwert. Daher wären für die Darstellung vieler Subeinheiten eines Ganzen '''Stapelbalkendiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3]]]''' besser geeignet.
 +
 
 +
==== '''Keinesfalls für Mehrfachantworten''' ====
 +
 
 +
Gänzlich ungeeignet sind '''Kreisdiagramme''', um die Ergebnisse von Fragen mit '''Mehrfachantworten''' darzustellen:
 +
 
 +
[[File:quantitative-116_3.gif|frame|center|Kreisdiagramm Mehrfachantworten]]
 +
 
 +
Bei '''Kreisdiagrammen''' neigen BetrachterInnen dazu, die gesamte Torte als etwas Ganzes, also als 100 % aufzufasssen.Da bei Mehrfachantworten jedoch mehr als 100 % auftreten können (auch weniger als 100 %), kann dies zu einer falschen Interpretation führen. Deutlich besser wären für diesen Zweck horizontale Balkendiagramme geeignet''.''
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[1] Siehe Kapitel 3.1.2.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.3 Ordinalskalierung|[2] Siehe Kapitel 3.1.2.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[3] Siehe Kapitel 3.6.1.3]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.2 Liniendiagramme  ===
 +
 
 +
'''Liniendiagramme''' eignen sich besonders für die '''Darstellung von Entwicklungen''', ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr '''Populationen[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen Ländern die Akzeptanz der Aufnahme eines weiteren Landes in die Europäische Union veränderte.
 +
 
 +
[[File:quantitative-117_1.jpg|frame|center|Liniendiagramm]]
 +
 
 +
Man sieht auf einem Blick, dass in Schweden die Akzeptanz von einem hohen Niveau ausgehend stark zurückging, in Irland eher gering blieb, sich in Polen hingegen von einem sehr geringem zu einem relativ hohen Niveau entwickelte.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.3 Balkendiagramme  ===
 +
 
 +
Einfache '''Balkendiagramme''' sind, da sie vom gleichen Nullpunkt ausgehen, sehr gut geeignet, um komparativ auch '''kleinste Unterschiede zwischen Subbereichen''' erkennbar zu machen.
 +
 
 +
Sie sind die beste Darstellungsform, um z.B. die Ergebnisse von Fragen mit '''Mehrfachantworten''' zu präsentieren.
 +
 
 +
[[File:quantitative-118_1.gif|frame|center|Balkendiagramm Mehrfachantwort]]
 +
 
 +
Balkendiagramme können sowohl '''horizontal''' (wie das obige Beispiel) wie auch vertikal orientiert sein.
 +
 
 +
==== '''Das gruppierte Balkendiagramm''' ====
 +
 
 +
Dieses ist besonders geeignet für die '''kontrastive Darstellung der Ausprägungen einer Variable''' (z.B. männlich-weiblich für Geschlecht, Hinduismus-Islam etc. für Religionen). So kann man z.B. vergleichend zeigen, wie Männer und Frauen in verschiedenen Bereichen abschneiden. Siehe ein Beispiel dazu bei der Berechnung mit SPSS.
 +
 
 +
==== '''Stapelbalkendiagramme: Anteile vom Ganzen''' ====
 +
 
 +
'''Stapelbalkendiagramme''' werden - neben '''Kreisdiagrammen''' - oft verwendet, um Anteile am Ganzen darzustellen. Zur Darstellung von relativen Mehrheiten sind sie etwas weniger übersichtlich als '''Kreisdiagramme'''.
 +
 
 +
[[File:quantitative-118_2.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Nkorongoji (Mali)]]
 +
 
 +
Auch sie werden sehr '''schnell unübersichtlich, wenn die Kategorien zu zahlreich werden,''' bleiben bei einer größeren Zahl von Subeinheiten aber noch übersichtlicher als Kreisdiagramme:
 +
 
 +
[[File:quantitative-118_3.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Matmatar]]
 +
 
 +
==== '''Vergleich der Aufteilung: Stapelbalkendiagramme''' ====
 +
 
 +
'''Gestapelte Balkendiagramme''' sind besonders wertvoll beim Vergleich der Aufteilung der gleichen '''Variable''' in verschiedenen '''Stichproben/Populationen[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]'''.
 +
 
 +
[[File:quantitative-118_4.gif|frame|center|Stapelbalkendiagramm Religionszugehörigkeit in Matmatar]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS  ===
 +
 
 +
Im folgenden '''Diagramm''' interessiert uns, inwieweit sich die männliche und die weibliche Lebenserwartung in den Ländern dieser Welt nach deren religiöser Ausrichtung unterscheiden. Wir greifen dabei auf Daten in world95.sav bei der Berechnung mit SPSS zurück. Der Vorgang mit SPSS erfolgt folgendermaßen:
 +
 
 +
A. Klicken Sie auf ''GRAFIKEN - BALKEN''
 +
 
 +
B. Wählen Sie das Symbol für ''Gruppiert'' und dann ''Auswertung über verschiedene Variablen''.
 +
 
 +
C. Nun wählen wir zumindest zwei '''numerische''' Variablen aus (welche wir vergleichend zu den Religionen betrachten wollen, in unserem Falle die männliche und die weibliche Lebenserwartung). Diese schieben wir in das Feld ''Bedeutung der Balken:''
 +
 
 +
[[File:quantitative-119_1.jpg|frame|center|Definition von gruppierten Balkendiagrammen mit SPSS]]
 +
 
 +
D. Im Feld ''Kategorienachse'' fügen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.
 +
 
 +
E. Bei Klick auf ''Auswertungsfunktion'' können wir uns für bestimmte Kennzahlen entscheiden, wie den '''Median[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1]]]''', das '''arithmetische Mittel[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2]]]''', die '''Häufigkeit[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3]]]''', '''Summe''', welche für die numerischen Variablen berechnet werden..
 +
 
 +
Nach Klick auf OK erhalten wir das folgende '''Diagramm''':
 +
 
 +
[[File:quantitative-119_2.gif|frame|center|Gruppiertes Balkendiagramm Religion und Lebenserwartung aufgeteilt nach Geschlechtern]]
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.3 Median|[1] Siehe Kapitel 3.3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.2 Arithmetisches Mittel|[2] Siehe Kapitel 3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3] Siehe Kapitel 3.2.2]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.4 Kartogramme  ===
 +
 
 +
'''Kartogramme''' sind eine Sonderform von '''Diagrammen''' und zeigen die '''Ausprägungen einer Variable auf Landkarten'''.
 +
 
 +
'''Kartogramme''' sind meist nur mit relativ teuren Programmen möglich, wie z.B. '''Arcview'''. Zu '''Excel''' gibt es eine billigere Zusatzsoftware wie '''Mapland''' (99-999 $). '''MS Office 2000 Professional''' enthielt noch eine vereinfachte Excel-Komponente namens '''Microsoft Map.'''
 +
 
 +
[[File:quantitative-120_1.gif|frame|center|Kartogramm Bevölkerungsdichte 1991]]
 +
 
 +
==== '''Kartogramme in Wahlanalysen häufig''' ====
 +
 
 +
Mittels '''Kartogrammen''' können v.a. regional unterschiedliche Ausprägungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpräferenzen in den verschiedenen Bundesländern und Regionen aufzuzeigen.
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.5 Histogramme  ===
 +
 
 +
Unter einem '''Histogramm''' versteht man die grafische Darstellung der '''Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1]]]''' von Messwerten.
 +
 
 +
Die Daten sind dabei größenmäßig auf der X-Achse geordnet, während auf der Y- Achse ihre Häufigkeiten stehen. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist.
 +
 
 +
[[File:quantitative-121_1.jpg|frame|center|Histogramm Kindersterblichkeit]]
 +
 
 +
'''Histogramme''' werden '''besonders zur Darstellung von Verteilungen''' verwendet, wie auch zur Demonstration der '''Normalverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test|[1] Siehe Kapitel 3.1.3.3.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm|[2] Siehe Kapitel 3.1.3.3.1]]<br />
 +
 
 +
 
 +
-----
 +
 
 +
=== 3.6.1.6 Streudiagramme  ===
 +
 
 +
'''Streudiagramme''' (oder '''Punktdiagramme''') ermöglichen die grafische '''Darstellung des Zusammenhangs von zwei Variablen.'''
 +
 
 +
Die Ausprägung der Variable A wird auf der X- Achse eingetragen, die Ausprägung der Variable B auf der Y-Achse.
 +
 
 +
[[File:quantitative-122_1.jpg|frame|center|Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate]]
 +
 
 +
Basierend auf UN-Daten über die Entwicklung der Länder dieser Welt (siehe world95.sav) zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zurückgeht. '''Streudiagramme''' eignen sich vorzüglich zum '''Aufzeigen des Zusammenhangs zwischen Variablen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[1]]]''' und somit auch zur '''Darstellung der Regression und der Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[2]]]'''.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[1] Siehe Kapitel 3.5.1]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4.2 Grafische Darstellung der Regression|[2] Siehe Kapitel 3.5.4.2]]<br />
 +
 
 +
 
 +
== 3.6.2 Welches Diagramm für welche Daten? ==
 +
 
 +
[[File:quantitative-123_1.jpg|frame|center|Tabelle Eignung von Diagrammarten für verschiedene Daten]]
 +
 
 +
 +
 
 +
 
 +
== 3.6.3 Notwendige Begleitinformationen von Diagrammen ==
 +
 
 +
==== '''Diagramme brauchen Begleitinformationen''' ====
 +
 
 +
Diagramme sollten genauso wie die tabellarische Darstellung statistischer Daten alle notwendigen Begleitinformationen aufweisen, die zum Verständnis des Diagramms sowie zum Nachweis der Seriösität der Arbeit wichtig sind. Dazu zählen:
 +
 
 +
A. '''Name des Erstellers''', v.a. wenn es sich um Fremddiagramme handelt;
 +
 
 +
B. Falls es sich nicht um eigene Daten handelt, auf deren Grundlage das Diagramm erstellt wurde, sollte die '''Quelle der Daten''' angegeben werden (z.B. Statistikamt der Stadt Ulm 1997) (am besten unterhalb des Diagramms)
 +
 
 +
C. '''Jahr der Erhebung der Daten''';
 +
 
 +
D. '''Größe der Stichprobe''' (am Besten die bereinigte Größe, welche Null-Eingaben und fehlerhafte Eingaben nicht berücksichtigt), v.a. wenn es sich um eigene Daten handelt. Bei gut bekannten Fremddatenquellen wird darauf meist verzichtet (z.B. bei Erhebungen statistischer Zentralämter etc.)
 +
 
 +
E. '''Angabe der Messeinheiten''' (cm, Zähleinheiten, Prozent etc.)
 +
 
 +
F. '''Aussagekräftiger Titel des Diagramms''' (ganz oben)
 +
 
 +
G. Aussagekräftige '''Bezeichnungen für die Bestandteile des Diagramms''' (z.B. für Daten auf der x- bzw. y-Achse.
 +
 
 +
H. Eventuell Hinweis auf Art der Erhebung der Daten
 +
 
 +
I. '''Bei Mehrfachantworten unbedingt Hinweis darauf'''
 +
 
 +
Das folgende Diagramm (Quelle: '''http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf &#91;1&#93;]''') berücksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden müssen, bleibt der Erkenntnisgrad hoch.
 +
 
 +
[[File:quantitative-124_1.jpg|frame|center|Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbstätigen an der Gesamtheit der erwerbstätigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.]]
 +
 
 +
 +
 
 +
 +
 
 +
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf &#91;1&#93; http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf]<br />
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#3.6 Die grafische Darstellung statistischer Ergebnisse|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
= 4. Software für quantitative Forschungsprojekte =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
==== '''Für zuhause Excel, an der Universität SPSS''' ====
 +
 
 +
Nur wenige Menschen verfügen auf dem eigenen PC über spezifische Statistiksoftware. Viele Berechnungen und grafische Darstellungen lassen sich jedoch auch mit gängigen Software-Programmen erstellen.
 +
 
 +
Besonders die Tabellenkalkulation '''Microsoft Excel''' (aber praktisch auch jede andere Tabellenkalkulation vergleichbarer Qualität) verfügt über eine Fülle statistischer Funktionen, mit welchen auch recht ausgefeilte statistische Analysen erledigt werden können und auch über zahlreiche Möglichkeiten, die Ergebnisse mit anschaulichen '''Diagrammen[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1]]]''' darzustellen.
 +
 
 +
Wer jedoch sehr viel mit Statistiken zu tun hat und leichten Zugang zu Software wie '''SPSS''' hat, welches auch auf den PCs im PC-Raum des Instituts für Kultur- und Sozialanthropologie zu finden ist, wird den leichten Wechsel zu diesem Programm nicht bereuen (zu finden unter Start - Programme - SPSS für Windwows). Daten von Standard-Programmen wie '''Excel''' können leicht übernommen werden, statistische Berechnungen können sehr komfortabel in jeder beliebigen Tiefe getätigt werden. Wer ein wenig eingearbeitet ist, kann mit Programmen wie '''SPSS''' viele Analysen um ein Vielfaches schneller als mit '''Excel''' abschließen.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6 Die grafische Darstellung statistischer Ergebnisse|[1] Siehe Kapitel 3.6]]<br />
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1 Was kann Excel?|4.1 Was kann Excel?]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1.1 Statistische Analysen mit Excel|4.1.1 Statistische Analysen mit Excel]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.1.2 Grafische Aufbereitung von Daten mit Excel|4.1.2 Grafische Aufbereitung von Daten mit Excel]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.2 Was kann MS Access?|4.2 Was kann MS Access?]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.3 Profi-Programme: SPSS und Statistica|4.3 Profi-Programme: SPSS und Statistica]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS|4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4.5 Umcodierung|4.5 Umcodierung]]<br />
 +
</div>
 +
 
 +
 
 +
= 4.1 Was kann Excel? =
 +
 
 +
==== '''Excel gut geeignet für einfache Berechnungen und schöne Diagramme''' ====
 +
 
 +
Excel ist als Teil des Programms '''Microsoft Office''' fast auf jedem PC vorhanden. Bereits mit Excel kann man, wenn auch nicht so komfortabel wie mit '''SPSS''', viele statistische Verfahren durchrechnen und auch grafisch darstellen.
 +
 
 +
==== '''Übernahme von Excel in SPSS problemlos möglich''' ====
 +
 
 +
Da Excel auf fast jedem PC vorhanden ist, eignet es sich sehr gut dazu, Daten zu sammeln und erste Voranalysen mit einfachen statistischen Methoden zu machen. Da sowohl Excel wie auch SPSS ein Datenblatt (Tabelle) zur Verwaltung der Daten verwenden, ist die Übernahme von Daten aus Excel ins SPSS ausgesprochen einfach.
 +
 
 +
 
 +
 
 +
== 4.1.1 Statistische Analysen mit Excel ==
 +
 
 +
Excel bietet u.a. folgende statistische Analyse-Methoden an:
 +
 
 +
* Chi-Quadrat-Test
 +
* Häufigkeit
 +
* Korrelation
 +
* Kovarianz
 +
* Median
 +
* Mittelwert
 +
* Modalwert
 +
* Quartile
 +
* Rangkorrelation
 +
* Maßkorrelation
 +
* Standardabweichung
 +
* Varianz
 +
* T-Test usw.
 +
 
 +
Der Ablauf von Berechnungen mit Excel:
 +
 
 +
A. Setzen Sie den Cursor in eine freie Zelle, in welcher das Berechnungsergebnis landen soll
 +
 
 +
B. Klicken Sie in der Menüleiste zuerst auf EINFÜGEN und dann auf das Untermenü FUNKTION.
 +
 
 +
C. Wählen Sie in KATEGORIE AUSWÄHLEN den Subbereich STATISTIK aus.
 +
 
 +
D. Wählen Sie nun die gewünschte statistische Funktion.
 +
 
 +
E. Machen Sie einen Doppelklick auf die Funktion, Sie werden nun nach den Funktionsargumenten gefragt (d.h. nach den Zahlenwerten, die Sie analysieren möchten).
 +
 
 +
F. Markieren Sie nun mit der Maus (linke Maustaste dabei festhalten) den von Ihnen gewünschten Zahlenblock (also z.B. B2 bis B75).
 +
 
 +
G. Drücken Sie die Returntaste und das Ergebnis sollte im vorher freien Feld landen.
 +
 
 +
Sollten Sie, wie z.B. bei der Korrelation zwei Argumente eingeben müssen, dann müssen Sie den Punkt F zweimal wiederholen. Beim ersten Mal geben Sie den Cursor in die erste Zeile des Fensters (bei der Korrelation Matrix1 genannt) und markieren mit der Maus die erste Datenspalte (z.B. Körpergröße); dann setzen Sie den Cursor in das Feld Matrix2 und markieren mit der Maus die zweite von Ihnen gewünschte Datenspalte (z.B. Schuhgröße). Wenn Sie nun auf OK klicken, wird die Korrelation zwischen Körper- und Schuhgröße berechnet und in das freie Feld eingetragen.
 +
 
 +
 
 +
== 4.1.2 Grafische Aufbereitung von Daten mit Excel ==
 +
 
 +
==== '''Viele statistische Funktionen''' ====
 +
 
 +
Excel hat eine sehr leistungsfähige und einfache Funktion für die Herstellung ansehnlicher statistischer Grafiken.
 +
 
 +
Excel bietet u.a. folgende statistische Grafiken (Diagramme) an:
 +
 
 +
* Säulen
 +
* Balken
 +
* Linien
 +
* Kreis
 +
* Fläche
 +
* Ring
 +
* Histogramm (bei Installation eines mitgelieferten Add-Ins, siehe Online-Hilfe bei Microsoft Office 2003)
 +
* Netz usw.
 +
 
 +
==== '''Die Erstellung von Diagrammen mit Excel:''' ====
 +
 
 +
Sie ist extrem einfach:
 +
 
 +
A. Markieren Sie die Zahlenreihen, welche Sie grafisch darstellen möchten.
 +
 
 +
B. Klicken Sie in der Menüleiste auf EINFÜGEN und danach auf DIAGRAMM.
 +
 
 +
C. Ihre Zahlenreihen wurden damit schon automatisch übernommen und Sie können jetzt das Diagramm feinjustieren (Titel, Diagrammart, Größe, Farben etc.)
 +
 
 +
 
 +
 
 +
= 4.2 Was kann MS Access? =
 +
 
 +
==== '''Gut zum Sammeln von Daten, wenige Analysemöglichkeiten''' ====
 +
 
 +
Microsoft Access kann, da seine Daten ebenfalls in Form einer Tabelle verwaltet werden, sehr gut zum Sammeln der Daten verwendet werden. Seine Analysemöglichkeiten sind jedoch, abgesehen von einer sehr guten Kreuztabellenfunktion (zu finden unter Abfragen) eher beschränkt.
 +
 
 +
 
 +
 
 +
= 4.3 Profi-Programme: SPSS und Statistica =
 +
 
 +
==== '''Komfort, Schnelligkeit und großer Funktionsumfang: die Profiprogramme''' ====
 +
 
 +
Profiprogramme wie '''SPSS''' oder '''Statistica''' weisen eine enorme Vielfalt statistischer Funktionen auf, deutlich mehr als '''Excel''' oder '''MS Access'''. Da '''SPSS''' auf allen PCs an der KSA installiert ist, wird in diesem Online-Kurs die Umsetzung statistischer Analysen und Darstellungen mit '''SPSS''' in vielen Bereichen angeboten. '''Statistica''' ist ebenfall eine exzellente Software, deren Bedienung auf der vorliegenden Homepage jedoch nicht demonstriert werden kann.
 +
 
 +
 
 +
 
 +
= 4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS =
 +
 
 +
==== '''Leichter Datentransfer zwischen Excel bzw. Access und SPSS''' ====
 +
 
 +
Der Datentransfer zwischen diesen Programmen ist ausgesprochen einfach:
 +
 
 +
A. Speichern Sie die gewünschten Daten, ob in Excel oder in Access, jeweils als Excel- Dokument ab: Gehen Sie zu DATEI - SPEICHERN UNTER und klicken Sie nun MICROSOFT OFFICE EXCEL- ARBEITSMAPPE (*.xls) an.
 +
 
 +
B. Schließen Sie Excel oder Access
 +
 
 +
C. Öffnen Sie das Programm SPSS
 +
 
 +
D. Gehen Sie zu DATEI - DATEI ÖFFNEN
 +
 
 +
E. Standardmäßig wird als Dateityp natürlich der SPSS- Dateityp *.SAV angezeigt, daher können Sie vorerst die abgespeicherte Excel-Datei noch nicht sehen. Wählen Sie daher im Auswahlfenster unter Dateityp Excel (Endung *.xls) und bestätigen Sie mit einem Häkchen, dass die Variablennamen eingelesen werden sollen (andernfalls werden diese nicht in gewünschter Weise übernommen).
 +
 
 +
F. Klicken Sie auf OK, die Datei wird nun eingefügt. Falls Sie Variablennamen verwendeten, welche länger als acht Zeichen waren, werde diese auf acht Zeichen verkürzt und Sie erhalten eine Information von SPSS darüber.
 +
 
 +
G. Speichern Sie nun die Datei unter einem beliebigen Namen in SPSS (die Endung *.SAV wird automatisch angenommen).
 +
 
 +
 
 +
 
 +
= 4.5 Umcodierung =
 +
 
 +
==== '''Einfache Transformation von Daten mit SPSS''' ====
 +
 
 +
'''SPSS''' benötigt zur internen Berechnung mitunter andere Datenarten (v.a. numerische), als sie von anderen Programmen, auch WinWord überliefert werden. SPSS bietet sehr komfortable Möglichkeiten der automatischen '''Umwandlung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[1]]]''' von Daten, sowie auch ihrer automatischen '''Rückwandlung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2]]]''' für die Bildschirm- und Druckausgabe.
 +
 
 +
 
 +
 
 +
'''Verweise:'''<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|[1] Siehe Kapitel 2.2.3.2]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|[2] Siehe Kapitel 2.2.3.3]]<br />
 +
 
 +
=== Weitere Kapitel dieser Lernunterlage ===
 +
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
----
 +
[[#4. Software für quantitative Forschungsprojekte|&uarr; Nach oben]]
 +
 
 +
 
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
= 5. Lexikon statistischer Grundbegriffe =
 +
<sup>verfasst von Erwin Ebermann</sup>
 +
 
 +
Hier finden Sie die wichtigsten statistischen Grundbegriffe alphabetisch geordnet.
 +
 
 +
==Inhalt==
 +
<div class="eksa_toc">
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.1 A-C|5.1 A-C]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.2 D-F|5.2 D-F]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.3 G-I|5.3 G-I]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.4 J-M|5.4 J-M]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.5 N-P|5.5 N-P]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.6 Q-R|5.6 Q-R]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.7 S-T|5.7 S-T]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5.8 U-Z|5.8 U-Z]]<br />
 +
</div>
 +
 
 +
 
 +
= 5.1 A-C =
 +
 
 +
==== '''Abhängige Variable''' ====
 +
 
 +
Darunter versteht man '''Variable''', deren Ausprägung durch eine oder mehrere andere Variablen systematisch beeinflusst werden. So wäre z.B. in der Landwirtschaft der Ernteertrag abhängig z.B. von der Bodenqualität wie auch vom Einsatz von Düngemitteln.
 +
 
 +
==== '''Alpha-Fehler''' ====
 +
 
 +
Siehe ''Fehler der 1. Art''
 +
 
 +
==== '''Alternativhypothese''' ====
 +
 
 +
Unter einer Alternativhypothese versteht man bei statistischen Tests die Gegenhypothese H1 zur Nullhypothese H0. Vor Durchführung von Tests legt man Annahmen über die Grundgesamtheit fest, welche mit Tests überprüft werden.
 +
 
 +
==== '''Analytische Statistik''' (auch Schließende Statistik oder Inferenzstatistik) ====
 +
 
 +
Mithilfe von Verfahren der analytischen Statistik versucht man, von Stichproben auf die Grundpopulation bei Berücksichtigung unterschiedlicher Wahrscheinlichkeiten zu schließen. Dazu kommen eine Vielzahl weiterer weiterführender Verfahren wie Clusteranalyse, Faktorenanlyse multivariate Verfahren,... Siehe auch: '''Induktive Statistik (Wikipedia)[http://de.wikipedia.org/wiki/Induktive_Statistik &#91;1&#93;]'''.
 +
 
 +
==== '''Arbeitshypothese''' ====
 +
 
 +
Darunter versteht man eine genau festzulegende Annahme, von der man zu Beginn eines Forschungsprojektes ausgeht. Siehe auch ''Nullhypothese''.
 +
 
 +
==== '''Arithmetisches Mittel''' (oder Durchschnitt/-swert) ====
 +
 
 +
Das am häufigsten verwendete Lagemaß, welches den Durchschnittswert (Summe aller Werte dividiert durch ihre Anzahl) einer Variablen zeigt. Es sollte nur bei ''metrischen'' Variablen eingesetzt werden.
 +
 
 +
==== '''Ausprägungen''' ====
 +
 
 +
Unter Ausprägungen versteht man die Gesamtheit der möglichen Werte eines Merkmals.So kann z.B. die Variable Geschlecht die Ausprägungen ''männlich'' und ''weiblich'' annehmen.
 +
 
 +
==== '''Ausreißer''' ====
 +
 
 +
Darunter versteht man einen extrem großen oder extrem kleinen Wert, welcher weit von den restlichen Einträgen entfernt ist. Dies könnte z.B. der Fall beim Einkommen eines Millionärs sein, welcher in einem sehr armen Dorf lebt.
 +
 
 +
==== '''Balkendiagramm''' (auch Säulen- oder Blockdiagramm) ====
 +
 
 +
Dabei handelt es sich um Diagramme, bei welchen die Größe der Werte mit der Länge von Balken bzw. Säulen ausgedrückt werden. Werden die Werte (oft Häufigkeiten) senkrecht aufgetragen, spricht man in engerer Terminologie von Säulendiagrammen, werden sie waagrecht aufgetragen, von Balkendiagrammen.
  
<table border="0" cellpadding="0" cellspacing="0">
+
==== '''Bestimmtheitsmaß''' (auch Determinationskoeffizient) ====
  
<tr><td valign="top">1&nbsp;</td><td valign="top">Funktion und Sinn von Statistik</td></tr>
+
Das Bestimmtheitsmaß ist ein Maß für den Zusammenhang zwischen zwei Variablen und entspricht dem Quadrat des Korrelationskoeffizienten ''r.'' Es gibt an, in welchem Ausmaß die Varianz der einen Variablen durch die Varianz der anderen Variablen bestimmt wird. Siehe auch: '''Bestimmtheitsmaß (Wikipedia)[http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F &#91;2&#93;]'''.
  
<tr><td valign="top">1.1&nbsp;</td><td valign="top">Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?</td></tr>
+
==== '''Beta-Fehler''' ====
  
<tr><td valign="top">1.2&nbsp;</td><td valign="top">Formen der Statistik</td></tr>
+
Siehe ''Fehler der 1. und 2. Art.''
  
<tr><td valign="top">1.2.1&nbsp;</td><td valign="top">Deskriptive Statistik</td></tr>
+
==== '''bimodal''' ====
  
<tr><td valign="top">1.2.2&nbsp;</td><td valign="top">Analytische Statistik</td></tr>
+
Darunter versteht man das Auftreten von zwei Gipfeln in einer Häufigkeitsverteilung, d.h. von zwei ''Modalwerten''.
  
<tr><td valign="top">1.3&nbsp;</td><td valign="top">Wahrscheinlichkeiten, nicht Gewissheit</td></tr>
+
==== '''Biseriale Korrelation''' ====
  
<tr><td valign="top">1.3.1&nbsp;</td><td valign="top">Schwankungsbreiten und Konfidenzintervalle</td></tr>
+
Die biseriale Korrelation ''rbis'' zeigt den Zusammenhang von zwei ''metrischen'' und ''normalverteilten''Variablen, von denen eine künstlich dichotomisiert wurde (in zwei Gruppen unterteilt).
  
<tr><td valign="top">1.3.2&nbsp;</td><td valign="top">Irrtumswahrscheinlichkeit und Signifikanzniveau</td></tr>
+
==== '''bivariat''' ====
  
<tr><td valign="top">2&nbsp;</td><td valign="top">Von der Fragestellung zur statistischen Analyse</td></tr>
+
Bivariat bezeichnet, dass von den Betrachtungen gleichzeitig zwei Variablen betroffen sind. Siehe z.B. die '''bivariate Häufigkeitsverteilung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3]]]'''.
  
<tr><td valign="top">2.1&nbsp;</td><td valign="top">Die Grundpopulation: worüber wir Aussagen machen</td></tr>
+
==== '''Blockbildung''' ====
  
<tr><td valign="top">2.1.1&nbsp;</td><td valign="top">Die Stichprobe (Sample)</td></tr>
+
Unter Blockbildung, auch ''Clusterbildung'' genannt, versteht man die Zusammenfassung von Elementen der Untersuchung, welche wesentliche für die Untersuchung relevante Eigenschaften gemeinsam haben, zu Blöcken oder Clustern. SPSS ermöglicht es, derartige Cluster mithilfe der Clusteranalyse zu ermitteln. Der Vorteil der Clusterbildung liegt darin, dass durch die Schaffung größerer Einheiten sinkt auch die Fehlerwahrscheinlichkeit von Aussagen. Siehe zur Clusteranalyse: '''Clusteranalyse (Wikipedia)[http://de.wikipedia.org/wiki/Clusteranalyse &#91;4&#93;]'''.
  
<tr><td valign="top">2.1.2&nbsp;</td><td valign="top">Teil- oder Vollerhebung?</td></tr>
+
==== '''Blockdiagramm''' ====
  
<tr><td valign="top">2.1.3&nbsp;</td><td valign="top">Die Ziehung (Auswahl) der Stichprobe</td></tr>
+
Siehe '''Balkendiagramm[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5]]]'''.
  
<tr><td valign="top">2.1.3.1&nbsp;</td><td valign="top">Geschichtete Stichprobenauswahl (Quotenstichprobe)</td></tr>
+
==== '''Boxplot''' ====
  
<tr><td valign="top">2.1.3.1.1&nbsp;</td><td valign="top">Proportional geschichtete Stichproben</td></tr>
+
Unter Boxplots versteht man eine graphische Darstellung der Lage und der Verteilung stetiger Merkmale beruhend auf den empirischen Quartilen. Der Abstand zwischen dem 1. und dem 3. Quartil wird als ein Rechteck dargestellt, in welchem durch einen waagrechten Strich auch der Median verzeichnet ist. Siehe wegen weiterer Eigenheiten dazu auch: '''Vergleichende grafische Darstellung[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6]]]''' von Streuung und Lage mit Box-Plots.
  
<tr><td valign="top">2.1.3.1.2&nbsp;</td><td valign="top">Disproportional geschichtete Stichproben</td></tr>
+
==== '''Chi-Quadrat-Test''' ====
  
<tr><td valign="top">2.1.3.1.3&nbsp;</td><td valign="top">Laufende Kontrolle der Schichtung</td></tr>
+
Der Chi-Quadrat-Test ist ein statistisches Verfahren, um die Unabhängigkeit von zwei Merkmalen zu überprüfen. Er wird besonders gerne bei der '''Kreuztabellen-Analyse[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7]]]''' eingesetzt. Siehe dazu auch: '''Chi-Quadrat-Test (Wikipedia)[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;8&#93;]'''.
  
<tr><td valign="top">2.1.3.2&nbsp;</td><td valign="top">Zufallsstichproben</td></tr>
+
==== '''Clusterbildung''' ====
  
<tr><td valign="top">2.1.3.2.1&nbsp;</td><td valign="top">Einfache Zufallsstichprobe</td></tr>
+
siehe ''Blockbildung''
  
<tr><td valign="top">2.1.3.2.2&nbsp;</td><td valign="top">Systematische Zufallsstichprobe</td></tr>
+
==== '''Codeplan''' ====
  
<tr><td valign="top">2.1.3.2.3&nbsp;</td><td valign="top">Geschichtete Zufallsstichprobe</td></tr>
+
Darunter versteht man die schriftliche Zusammenfassung der Umsetzung der erhobenen Daten in numerische Werte, welche von den Statistik- Programmen zur Analyse benötigt werden. Siehe auch: '''vom Fragebogen zum Codeplan[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9]]]'''.
  
<tr><td valign="top">2.1.3.3&nbsp;</td><td valign="top">Willkürliches Auswahlverfahren</td></tr>
+
==== '''Codieren''' ====
  
<tr><td valign="top">2.1.3.4&nbsp;</td><td valign="top">Klumpenstichproben</td></tr>
+
C. bezeichnet die Zuordnung von festgelegten Schlüsseln (Zahlen oder Buchstaben) zu Merkmalsausprägungen für die Datenerfassung (z.B. bei Noten ’Sehr gut’ als 1, ’Gut’ als 2 etc.; oder bei Altersgruppen 1 für Kleinkinder, 2 für Jugendliche, 3 für Erwachsene, 4 für PensionistInnen).
  
<tr><td valign="top">2.1.4&nbsp;</td><td valign="top">Repräsentativität</td></tr>
 
  
<tr><td valign="top">2.1.5&nbsp;</td><td valign="top">Was tun, wenn die Grundpopulation nicht bekannt ist?</td></tr>
 
  
<tr><td valign="top">2.2&nbsp;</td><td valign="top">Die Operationalisierung</td></tr>
+
'''Verweise:'''<br />
 +
[http://de.wikipedia.org/wiki/Induktive_Statistik &#91;1&#93; http://de.wikipedia.org/wiki/Induktive_Statistik]<br />
 +
[http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F &#91;2&#93; http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.1 Optische Erkennung von Zusammenhängen|[3] Siehe Kapitel 3.5.1]]<br />
 +
[http://de.wikipedia.org/wiki/Clusteranalyse &#91;4&#93; http://de.wikipedia.org/wiki/Clusteranalyse]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.3 Balkendiagramme|[5] Siehe Kapitel 3.6.1.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Streuung#3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots|[6] Siehe Kapitel 3.4.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test|[7] Siehe Kapitel 3.5.2.1.1]]<br />
 +
[http://de.wikipedia.org/wiki/Chi-Quadrat-Test &#91;8&#93; http://de.wikipedia.org/wiki/Chi-Quadrat-Test]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|[9] Siehe Kapitel 2.2.3]]<br />
  
<tr><td valign="top">2.2.1&nbsp;</td><td valign="top">Die Suche nach Indikatoren</td></tr>
 
  
<tr><td valign="top">2.2.2&nbsp;</td><td valign="top">Das Messen</td></tr>
 
  
<tr><td valign="top">2.2.2.1&nbsp;</td><td valign="top">Messfehler</td></tr>
+
= 5.2 D-F =
  
<tr><td valign="top">2.2.3&nbsp;</td><td valign="top">Vom Fragebogen zum Codeplan</td></tr>
+
==== '''Datenmatrix''' ====
  
<tr><td valign="top">2.2.3.1&nbsp;</td><td valign="top">Dateneingabe und Erstellung einer Datenmatrix</td></tr>
+
Eine D. ist eine Anordnung der Daten, bei der die Untersuchungseinheiten in den Zeilen und die zu ihnen untersuchten Variablen in den Spalten eingetragen werden. Von oben nach unten könnten also z.B. die Versuchspersonen eingetragen werden, von links nach rechts ihre Körpergröße, ihre Leistungen, ihre Matrikelnummer etc. Eine Datenmatrix wird von jedem für statistische Zwecke verwendeten Programm zur Verwaltung der Daten verwendet.
  
<tr><td valign="top">2.2.3.2&nbsp;</td><td valign="top">Umcodierung mit SPSS</td></tr>
+
==== '''Deskriptive Statistik''' ====
  
<tr><td valign="top">2.2.3.3&nbsp;</td><td valign="top">Autom. Rückcodierung mit SPSS</td></tr>
+
In der deskriptiven Statistik erstellt man Maßzahlen zur Charakterisierung von Daten, wie ''Lagemaße'' (z.B. Durchschnitt), ''Streuungsmaße'' (z.B. Quartile) oder Maße für den Zusammenhang von Variablen (z.B. ''Korrelation''). Dazu gehört auch die grafische Aufbereitung der Daten und Ergebnisse in Form von Diagrammen. Im Gegensatz zur ''Analytischen Statistik'' beschäftigt sie sich nicht damit, von der ''Stichprobe'' unter Berücksichtigung verschiedener Wahrscheinlichkeiten auf die ''Grundgesamtheit'' zu schließen.
  
<tr><td valign="top">2.3&nbsp;</td><td valign="top">Gütekriterien quantitativer Untersuchungen</td></tr>
+
==== '''Dichotome Variable''' ====
  
<tr><td valign="top">2.4&nbsp;</td><td valign="top">Fehlerquellen bei statistischer Arbeit</td></tr>
+
Eine d.V. ist eine Variable, bei welcher nur zwei Ausprägungen möglich sind, wie z.B. lebendig/nicht lebendig; männlich/weiblich; bestanden/nicht bestanden. Jede ''stetige Variable'' kann zu dichotomen umgewandelt werden, wie z.B. differenziertes Einkommen zu ’unter 1000 €’ und ’über 1000 €).
  
<tr><td valign="top">2.4.1&nbsp;</td><td valign="top">Fehler erster und zweiter Art</td></tr>
+
==== '''Diskrete Variable''' ====
  
<tr><td valign="top">2.4.2&nbsp;</td><td valign="top">Fehlerhafte oder mangelnde Daten</td></tr>
+
Eine d.V. ist eine Variable, bei welcher nur abzählbar viele Ausprägungen möglich sind, also eine unendliche feine Differenzierung nicht möglich ist (das wäre eine ''stetige Variable''). Beispiele für eine d.V. sind die Punktzahlen eines Würfels, die Kinderzahlen von Familien, die Noten bei Prüfungen etc.
  
<tr><td valign="top">2.4.2.1&nbsp;</td><td valign="top">Eingabefehler</td></tr>
+
==== '''Dispersionsmaße''' ====
  
<tr><td valign="top">2.4.2.1.1&nbsp;</td><td valign="top">Wahl geeigneter Datentypen mit SPSS</td></tr>
+
Siehe ''Streuungsmaße''
  
<tr><td valign="top">2.4.2.1.2&nbsp;</td><td valign="top">Gültigkeitsprüfung der Daten mit Excel</td></tr>
+
==== '''Einseitige Hypothese''' (auch gerichtete Hypothese) ====
  
<tr><td valign="top">2.4.2.2&nbsp;</td><td valign="top">Doppelte Datensätze</td></tr>
+
E. H. sind Hypothesen, welche eine bestimmte Richtung eines Zusammenhangs annehmen. Man nimmt also nicht nur an, dass z.B. die Körpergröße mit der Schuhgröße korreliert, sondern genauer, dass mit steigender Körpergröße eine größere Schuhgröße einhergeht. (siehe auch ''zweiseitige Hypothese'').
  
<tr><td valign="top">2.4.2.3&nbsp;</td><td valign="top">Fehlende Einträge</td></tr>
+
==== '''Fehler 1. und 2. Art''' (auch Alpha- und Beta-Fehler) ====
  
<tr><td valign="top">2.4.2.3.1&nbsp;</td><td valign="top">Behandlung fehlender Daten mit SPSS</td></tr>
+
In der Statistik arbeitet man mit Wahrscheinlichkeiten. Wir drücken dabei z.B. aus, dass unsere Nullhypothese bei einem ''Signifikanzniveau'' von 0,01 richtig ist, anders formuliert, bei einer ''Irrtumswahrscheinlichkeit'' von 1 %. Das bedeutet, dass in 1 % aller Fälle die Nullhypothese falsch sein wird, obwohl unsere Daten auf das gemessene Phänomen hindeuten. Das bezeichnet man als den ''Fehler der 1. Art ='' Die Nullhypothese stimmt nicht, obwohl unsere Daten die Nullhypothese bestätigen.
  
<tr><td valign="top">3&nbsp;</td><td valign="top">Ausgewählte statistische Grundlagen und Analysemethoden</td></tr>
+
Der ''Fehler der 2. Art'' ist das Gegenteil. Die Nullhypothese wird zu Unrecht verworfen, weil die Daten (z.B. durch schlechte Auswahl der Mitglieder der Stichprobe) dazu anleiten.
  
<tr><td valign="top">3.1&nbsp;</td><td valign="top">Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden</td></tr>
+
==== '''Flächendiagramm''' ====
  
<tr><td valign="top">3.1.1&nbsp;</td><td valign="top">Arten von Messwerten (Daten)</td></tr>
+
Das F. ist eine Diagrammform, bei welchem die Fläche zwischen Kurve und X- Achse durch Schraffierung oder Muster markiert wird.
  
<tr><td valign="top">3.1.1.1&nbsp;</td><td valign="top">Metrische und nichtmetrische Variablen</td></tr>
 
  
<tr><td valign="top">3.1.1.2&nbsp;</td><td valign="top">Stetige und diskrete Variablen</td></tr>
 
  
<tr><td valign="top">3.1.2&nbsp;</td><td valign="top">Skalenniveaus</td></tr>
+
= 5.3 G-I =
  
<tr><td valign="top">3.1.2.1&nbsp;</td><td valign="top">Skalierungsniveaus bildlich erklärt</td></tr>
+
==== '''Gaußsche Glockenkurve''' ''(auch Gaußverteilung'') ====
  
<tr><td valign="top">3.1.2.2&nbsp;</td><td valign="top">Nominalskalierung</td></tr>
+
siehe ''Normalverteilung''
  
<tr><td valign="top">3.1.2.3&nbsp;</td><td valign="top">Ordinalskalierung</td></tr>
+
==== '''Geometrisches Mittel''' ====
  
<tr><td valign="top">3.1.2.4&nbsp;</td><td valign="top">Intervallskalierung</td></tr>
+
siehe ''Mittel''
  
<tr><td valign="top">3.1.2.5&nbsp;</td><td valign="top">Proportionalskalierung</td></tr>
+
==== '''Geschlossene Frage''' ====
  
<tr><td valign="top">3.1.2.6&nbsp;</td><td valign="top">Skalierungstypen, Aussagen und Methoden</td></tr>
+
Eine g. Fr. ist eine Frage mit vorgegebenen Antwortkategorien, z.B. ’Verdienen Sie ... A. unter 1000 €, B. über 1000 €’.
  
<tr><td valign="top">3.1.3&nbsp;</td><td valign="top">Verteilungen</td></tr>
+
==== '''Geschichtete Stichprobe''' ====
  
<tr><td valign="top">3.1.3.1&nbsp;</td><td valign="top">Normalverteilung</td></tr>
+
Bei einer g. St. wird die Grundgesamtheit in Gruppen oder Schichten eingeteilt (z.B. FleischesserInnen und VegetarierInnen oder Männer und Frauen; Kinder, Jugendliche, Erwachsene, ältere Menschen). Man wird in der Regel versuchen (s. ''Repräsentativität''), das in der Grundpopulation vorhandene Verhältnis der Gruppen in der Stichprobe nachzubilden. Man spricht dann von einer proportionalen Schichtung.
  
<tr><td valign="top">3.1.3.2&nbsp;</td><td valign="top">Andere Verteilungsformen</td></tr>
+
==== '''Grundgesamtheit''' (auch ''Grundpopulation'') ====
  
<tr><td valign="top">3.1.3.3&nbsp;</td><td valign="top">Test auf Normalverteilung</td></tr>
+
Unter G. versteht man die Gesamtheit der Elemente, für welche die Aussagen der Untersuchung gelten sollen. Sie muss genau festgelegt werden. Erhebt man die Einstellungen von WienerInnen gegenüber ZuwandererInnen, so muss festgelegt werden, wer mit WienerInnen gemeint ist (ab welchem Alter; bei welchem rechtlichen Status, bei welcher Aufenthaltsdauer in der Stadt etc.). Da eine ''Vollerhebung'' nur selten möglich ist, wählt man in der Regel eine ''Stichprobe'' aus.
  
<tr><td valign="top">3.1.3.3.1&nbsp;</td><td valign="top">Optischer Nachweis einer Normalverteilung: das Histogramm</td></tr>
+
==== '''Gütekriterium''' ====
  
<tr><td valign="top">3.1.3.3.2&nbsp;</td><td valign="top">Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test</td></tr>
+
Unter G. versteht man Kriterien zur Abschätzung der Qualität und Seriösität wissenschaftlicher Forschung (Datenerhebung, Analyse etc.). Die wesentlichen G. sind ''Validität'', ''Reliabilität'' und ''Objektivität''.
  
<tr><td valign="top">3.1.3.3.2.1&nbsp;</td><td valign="top">Kolmogorov-Smirnov-Test mit SPSS</td></tr>
+
==== '''Harmonisches Mittel''' ====
  
<tr><td valign="top">3.2&nbsp;</td><td valign="top">Die Ermittlung von Häufigkeiten</td></tr>
+
siehe ''Mittel.''
  
<tr><td valign="top">3.2.1&nbsp;</td><td valign="top">Liste und Tafeln</td></tr>
+
==== '''Häufigkeit''' ====
  
<tr><td valign="top">3.2.2&nbsp;</td><td valign="top">Häufigkeitstabelle</td></tr>
+
Die Häufigkeit informiert, wie oft ein bestimmter Messwert auftritt. Man unterscheidet zwischen ''absoluter Häufigkeit'' (die gezählte Häufigkeit eines Messwerts, z.B. 18 Männer), die ''kumulierte Häufigkeit'' (die aufsummierte Häufigkeit bis zu einem bestimmten Niveau, z.B. 23 SchülerInnen hatten ein Gut oder Sehr Gut auf die Schularbeit), ''die prozentuelle Häufigkeit'' (in Prozent gemessen) bzw. ''die relative Häufigkeit'' (in Teilen von 1 gemessen).
  
<tr><td valign="top">3.2.2.1&nbsp;</td><td valign="top">Häufigkeitsberechnung mit SPSS</td></tr>
+
==== '''Häufigkeitsverteilung''' ====
  
<tr><td valign="top">3.2.2.2&nbsp;</td><td valign="top">Grafische Darstellung mit SPSS</td></tr>
+
Unter einer H. versteht man eine tabellarische oder grafische Anordnung von Werten, bei der die jeweiligen Ausprägungen mit der dazugehörigen Häufigkeit vermerkt werden.
  
<tr><td valign="top">3.2.3&nbsp;</td><td valign="top">Klassenbildung (Gruppierung) von Daten</td></tr>
+
==== '''Histogramm''' ====
  
<tr><td valign="top">3.2.3.1&nbsp;</td><td valign="top">Gruppierung mit SPSS</td></tr>
+
Ein H. ermöglicht die graphische Darstellung der Häufigkeitsverteilung quantitativer Merkmale. Die Daten werden in Klassen eingeteilt und auf einer Grundlinie aufgetragen. Über jeder Klasse wird ein Rechteck gezeichnet. Die Höhe des Rechtecks wird durch seine Häufigkeit bestimmt. Siehe auch: '''Histogramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1]]]'''.
  
<tr><td valign="top">3.2.4&nbsp;</td><td valign="top">Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS</td></tr>
+
==== '''Hypothese''' ====
  
<tr><td valign="top">3.3&nbsp;</td><td valign="top">&quot;Mittelwerte&quot;: Lagemaße und Maßzahlen der zentralen Tendenz</td></tr>
+
Eine H. ist eine Annahme über die Beziehung zwischen zwei oder mehr Variablen, die mithilfe eines Untersuchungsverfahrens verifiziert oder falsifiziert werden kann. Siehe auch ''Nullhypothese''.
  
<tr><td valign="top">3.3.1&nbsp;</td><td valign="top">Modalwert</td></tr>
+
==== '''Inferenzstatistik''' ====
  
<tr><td valign="top">3.3.2&nbsp;</td><td valign="top">Arithmetisches Mittel</td></tr>
+
Siehe ''Analytische Statistik''
  
<tr><td valign="top">3.3.3&nbsp;</td><td valign="top">Median</td></tr>
+
==== '''Interquartilsabstand''' ====
  
<tr><td valign="top">3.3.3.1&nbsp;</td><td valign="top">Median bei gruppierten Daten</td></tr>
+
Als I. bezeichnet man die Differenz zwischen dem ersten und dem dritten Quartil. Grafisch wird er z.B. mit dem ''Boxplot'' dargestellt.
  
<tr><td valign="top">3.3.4&nbsp;</td><td valign="top">Geometrisches Mittel</td></tr>
+
==== '''Intervallskalierung''' ====
  
<tr><td valign="top">3.3.5&nbsp;</td><td valign="top">Harmonisches Mittel</td></tr>
+
Bei der I. können die Abstände zwischen den Ausprägungen ''metrischer Werte'' richtig interpretiert werden, jedoch gibt es keinen natürlichen Nullpunkt, sodass das Verhältnis der Werte nicht interpretiert werden kann. Der Abstand zwischen 12 und 13 Grad ist genauso groß wie der zwischen 34 und 35 Grad. Man kann jedoch nicht sagen, dass 10 Grad doppelt so heiß wie 5 Grad ist (es gibt einen absoluten Nullpunkt bei - 273 Grad, unsere gewohnte Null-Gradgrenze ist willkürlich und lässt sich nach unten unterschreiten).
  
<tr><td valign="top">3.3.5.1&nbsp;</td><td valign="top">Harmonisches Mittel mit SPSS</td></tr>
+
==== '''Irrtumswahrscheinlichkeit''' ====
  
<tr><td valign="top">3.3.6&nbsp;</td><td valign="top">Wann welche Lagemaße?</td></tr>
+
Unter I. versteht man die Wahrscheinlichkeit für das Auftreten des ''Fehlers 1. Art.'' Die I. ist somit die präzisierte Wahrscheinlichkeit, dass - obwohl die Daten einen bestimmten Schluss zulassen - dieser Schluss falsch ist. Als gängige Niveaus der Irrtumswahrscheinlichkeit nimmt man 5 %, 1 % und 1 ‰.
  
<tr><td valign="top">3.3.7&nbsp;</td><td valign="top">Berechnung von Lagemaßen mit SPSS</td></tr>
 
  
<tr><td valign="top">3.4&nbsp;</td><td valign="top">Streuungsmaße oder &rsquo;Wie allgemeingültig ist der Mittelwert&rsquo;</td></tr>
 
  
<tr><td valign="top">3.4.1&nbsp;</td><td valign="top">Varianz</td></tr>
+
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.5 Histogramme|[1] Siehe Kapitel 3.6.1.5]]<br />
  
<tr><td valign="top">3.4.2&nbsp;</td><td valign="top">Standardabweichung</td></tr>
 
  
<tr><td valign="top">3.4.3&nbsp;</td><td valign="top">Perzentile</td></tr>
 
  
<tr><td valign="top">3.4.3.1&nbsp;</td><td valign="top">Quartile</td></tr>
+
= 5.4 J-M =
  
<tr><td valign="top">3.4.3.1.1&nbsp;</td><td valign="top">Die Ermittlung von Quartilen</td></tr>
+
==== '''Klasse''' ====
  
<tr><td valign="top">3.4.4&nbsp;</td><td valign="top">Berechnung  von Streuungsmaßen  mit SPSS</td></tr>
+
Unter einer K. versteht man eine Gruppe von Ausprägungen stetiger und diskreter Variablen, welche durch die Zusammenfassung benachbarter Werte entstehen. Eine Klasse wird von festgelegten Klassengrenzen begrenzt. Den Vorgang der Klassenbildung nennt man ''Klassierung oder Klassifikation''. Eine Klassierung wird in der Regel verwendet, um die Darstellung enorm differenzierter Ausprägungen übersichtlicher zu gestalten (z.B. Zusammenfassung aller Einkommen in 0-500 €; eine zweite Klasse Einkommen bis 1000 €; eine dritte Klasse zwischen 1001-1500 € usw.). Siehe auch: '''Klassenbildung von Daten[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1]]]'''.
  
<tr><td valign="top">3.4.5&nbsp;</td><td valign="top">Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots</td></tr>
+
==== '''Klassifizerung''' (auch ''Klassierung''). ====
  
<tr><td valign="top">3.4.5.1&nbsp;</td><td valign="top">Erstellung von Boxplots mit SPSS</td></tr>
+
Siehe ''Klasse.''
  
<tr><td valign="top">3.5&nbsp;</td><td valign="top">Der Zusammenhang zwischen Variablen</td></tr>
+
==== '''Konfidenzinterall''' (auch ''Vertrauensintervall'') ====
  
<tr><td valign="top">3.5.1&nbsp;</td><td valign="top">Optische Erkennung von Zusammenhängen</td></tr>
+
Aus Stichproben erhaltene Maßzahlen sind immer nur Annäherungen an die zugrundeliegenden, aber meist unbekannten Werte in der Grundpopulation. Man ermittelt daher ''Konfidenzintervalle,'' innerhalb welchen Bereichs sich der ’richtige’ Wert befindet. Diese Konfidenzintervalle hängen vom gewählten ''Signifikanzniveau'' ab. Wir erleben die Angabe derartiger Konfidenzintervalle an jedem Wahlsonntag, wenn bei den ersten Analysen des wahrscheinlichen Wahlergebnisses der/die Statistikexperte/in sagt, dass die Partei A mit zwischen 34,8 und 36,2 % der Stimmen rechnen kann. Mit wachsender Stichprobengröße (Auszählungsgrad) wird das Konfidenzintervall kleiner, weil immer mehr mit der Grundpopulation übereinstimmend, bis es bei Vollauszählung verschwindet. Siehe auch: '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;2&#93;]'''.
  
<tr><td valign="top">3.5.2&nbsp;</td><td valign="top">Kreuztabellen-Analyse</td></tr>
+
==== '''Kontingenztafel''' ====
  
<tr><td valign="top">3.5.2.1&nbsp;</td><td valign="top">Berechnung von Kreuztabellen-Analysen mit SPSS</td></tr>
+
Eine K. ist die tabellarische Darstellung der Häufigkeitsverteilung von zumindest zwei Merkmalen. Siehe ''Kreuztabelle.''
  
<tr><td valign="top">3.5.2.1.1&nbsp;</td><td valign="top">Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test</td></tr>
+
==== '''Kontingenzkoeffizient''' ====
  
<tr><td valign="top">3.5.2.2&nbsp;</td><td valign="top">Grafische Darstellung von Kreuztabellen mit SPSS</td></tr>
+
Ein K. ist eine Kennzahl für die Stärke des Zusammenhangs zwischen nominalskalierten Daten. Siehe auch: '''Kontingenzkoeffizient (Wikipedia)[http://de.wikipedia.org/wiki/Kontingenzkoeffizient &#91;3&#93;]'''.
  
<tr><td valign="top">3.5.3&nbsp;</td><td valign="top">Die Korrelation</td></tr>
+
==== '''Korrelation''' ====
  
<tr><td valign="top">3.5.3.1&nbsp;</td><td valign="top">Maßkorrelation</td></tr>
+
Unter K. versteht man den Zusammenhang zwischen zwei quantitativen Merkmalen. Die Stärke des Zusammenhangs wird durch den ''Korrelationskoeffizient'' ausgedrückt. Siehe auch: die '''Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4]]]'''.
  
<tr><td valign="top">3.5.3.1.1&nbsp;</td><td valign="top">Berechnung der Maßkorrelation mit SPSS</td></tr>
+
==== '''Korrelationskoeffizient''' ====
  
<tr><td valign="top">3.5.3.2&nbsp;</td><td valign="top">Rangkorrelation R (Krueger-Spearman)</td></tr>
+
Der K. ist eine Kennzahl für den linearen Zusammenhang zwischen zwei quantitativen Merkmalen. Er liegt zwischen den Extremen -1 und +1. Wenn er positiv ist, bedeutet dies, dass ein hoher Wert der Variablen A mit einem hohen Wert der Variablen B einhergeht, genauso verhält es sich mit den niedrigen Werten. Ist der K. negativ, bedeutet dies, dass hohe Werte von Variable A mit niedrigen der Variable B einhergehen und umgekehrt.
  
<tr><td valign="top">3.5.3.2.1&nbsp;</td><td valign="top">Berechnung der Rangkorrelation mit SPSS</td></tr>
+
==== '''Kovarianz''' ====
  
<tr><td valign="top">3.5.3.3&nbsp;</td><td valign="top">Rangkorrelation Tau (Kendall)</td></tr>
+
Die Kovarianz beschreibt den Zusammenhang zwischen zwei metrischen Merkmalen. Da sie nicht standardisiert ist, wird in der Regel statt ihr auf die von ihr abgeleitete ''Korrelation'' zurückgegriffen. Siehe auch: '''Kovarianz (Wikipedia)[http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29 &#91;5&#93;]'''.
  
<tr><td valign="top">3.5.3.3.1&nbsp;</td><td valign="top">Berechnung von TAU mit SPSS</td></tr>
+
==== '''Kreisdiagramm''' (oder Tortendiagramm) ====
  
<tr><td valign="top">3.5.3.4&nbsp;</td><td valign="top">Aussagekraft einer Korrelation</td></tr>
+
Das K. ist eine Diagrammform, welche sich besonders gut zur Darstellung von Anteilen vom Ganzen eignet. Häufigkeiten werden durch Kreissektoren wiedergegeben. Die Größe eines Tortenstücks entspricht dem relativen Anteil am Ganzen oder an 100 %.
  
<tr><td valign="top">3.5.3.4.1&nbsp;</td><td valign="top">Wann sind Korrelationen bemerkenswert?</td></tr>
+
==== '''Kreuztabelle''' (auch Kontingenztabelle, -tafel) ====
  
<tr><td valign="top">3.5.3.4.2&nbsp;</td><td valign="top">Verdeckte Korrelation</td></tr>
+
In einer K. stellt man die gemeinsame Häufigkeitsverteilung von zumindest zwei Variablen (nominal- oder ordinalskaliert) dar. Man versucht dabei, auffällige Unterschiede zwischen beobachteter Häufigkeit und der zu erwarteder Häufigkeit festzustellen und mittels des ''Chi-Quadrat-Tests'' wahrscheinliche Zusammenhänge zu überprüfen. Siehe auch: '''Kreuztabellen-Analyse[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6]]]'''.
  
<tr><td valign="top">3.5.3.4.3&nbsp;</td><td valign="top">Scheinkorrelationen und Störvariable</td></tr>
+
==== '''Kumulative Häufigkeit''' (auch ''kumulierte H.'') ====
  
<tr><td valign="top">3.5.3.4.3.1&nbsp;</td><td valign="top">Partielle Korrelation mit SPSS</td></tr>
+
siehe ''Häufigkeit''
  
<tr><td valign="top">3.5.3.4.4&nbsp;</td><td valign="top">Signifikanz der Korrelation</td></tr>
+
==== '''Lagemaße''' (auch ''Zentralwerte'' oder ''Maße der zentralen Tendenz)'' ====
  
<tr><td valign="top">3.5.3.4.4.1&nbsp;</td><td valign="top">Signifikanz mit SPSS</td></tr>
+
Mit L. kann man den Schwerpunkt der Ausprägungen quantitativer Variabler zeigen.Die gebräuchlichsten Lagemaße sind das ''arithmetische Mittelt'', der Median und der Modalwert. Siehe auch: '''Mittelwerte[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7]]]'''.
  
<tr><td valign="top">3.5.3.5&nbsp;</td><td valign="top">Kovarianz</td></tr>
+
==== '''Liniendiagramm''' (auch ''Kurvendiagramm'') ====
  
<tr><td valign="top">3.5.4&nbsp;</td><td valign="top">Regression</td></tr>
+
Man verwendet L., um den zeitlichen Verlauf von Entwicklungen zu zeigen. Siehe auch: '''Liniendiagramme[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|[8]]]'''.
  
<tr><td valign="top">3.5.4.1&nbsp;</td><td valign="top">Statistisch-mathematische Berechnung der linearen Regression</td></tr>
+
==== '''Maßzahlen''' ====
  
<tr><td valign="top">3.5.4.2&nbsp;</td><td valign="top">Grafische Darstellung der Regression</td></tr>
+
M. zeigen charakteristische Eigenheiten quantitativer Variabler. Man unterscheidet ''Lagemaße'' und ''Streuungsmaße''.
  
<tr><td valign="top">3.6&nbsp;</td><td valign="top">Die grafische  Darstellung statistischer Ergebnisse</td></tr>
+
==== '''Median''' (auch ''Zentralwert'') ====
  
<tr><td valign="top">3.6.1&nbsp;</td><td valign="top">Arten von Diagrammen</td></tr>
+
Der Median kann bei mindestens ordinalskalierten Daten eingesetzt werden und bezeichnet jenes Element, welches in einer geordneten Reihe genau in der Mitte liegt. D.h. dass es oberhalb von ihm genauso viele (größere) Einträge wie unterhalb von ihm gibt.
  
<tr><td valign="top">3.6.1.1&nbsp;</td><td valign="top">Kreisdiagramme</td></tr>
+
Der Median eignet sich besonders gut, wenn ''Ausreißer'' das ''arithmetische Mittel'' verzerren.
  
<tr><td valign="top">3.6.1.2&nbsp;</td><td valign="top">Liniendiagramme</td></tr>
+
==== '''Merkmal''' (auch Variable) ====
  
<tr><td valign="top">3.6.1.3&nbsp;</td><td valign="top">Balkendiagramme</td></tr>
+
Unter einem M. versteht man Eigenheiten des Untersuchungsobjekts, deren Ausprägungen variieren können (im Gegensatz zu ''Konstanten'').
  
<tr><td valign="top">3.6.1.3.1&nbsp;</td><td valign="top">Gruppierte Balkendiagramme mit SPSS</td></tr>
+
==== '''Messniveau''' (auch ''Skalenniveau'') ====
  
<tr><td valign="top">3.6.1.4&nbsp;</td><td valign="top">Kartogramme</td></tr>
+
Unter ''Messen'' versteht man im weitesten Sinne die Zuordnung von Zahlen zu Beobachtung. Anhand des Messniveaus legt man fest, welche Interpretationen unterschiedlicher Ausprägungen sinnvoll sind, welche Verfahren angewendet werden dürfen. Es gibt vier Messniveaus: Nominal-, Ordinal-, Intervall- und Ratioskala. Die beiden ersten beziehen sich auf ''nicht metrische Variablen'', die beiden letzten auf ''metrische Variablen.''
  
<tr><td valign="top">3.6.1.5&nbsp;</td><td valign="top">Histogramme</td></tr>
+
==== '''Metrik''' ====
  
<tr><td valign="top">3.6.1.6&nbsp;</td><td valign="top">Streudiagramme</td></tr>
+
Unter M. versteht man ein definiertes System von Kennzahlen/Maßeinheiten (z.B. Liter, Kilometer, Minuten).
  
<tr><td valign="top">3.6.2&nbsp;</td><td valign="top">Welches Diagramm für welche Daten?</td></tr>
+
==== '''metrisch''' ====
  
<tr><td valign="top">3.6.3&nbsp;</td><td valign="top">Notwendige Begleitinformationen von Diagrammen</td></tr>
+
Als ''metrisch'' werden Variable bezeichnet, wenn der Abstand zwischen zwei Ausprägungen der Variablen interpretiert werden kann, wenn also der Abstand zwischen 12 und 15 genauso großist wie der Abstand zwischen 23 und 26. Metrische Variable sind daher entweder ''intervall''- oder ''proportionalskaliert''. ''Nichtmetrische Variablen'' sind ''nominal-'' oder ''ordinalskaliert.''
  
<tr><td valign="top">4&nbsp;</td><td valign="top">Software für quantitative Forschungsprojekte</td></tr>
+
==== '''Mittel''' ====
  
<tr><td valign="top">4.1&nbsp;</td><td valign="top">Was kann Excel?</td></tr>
+
Sammelbegriff für verschiedene Lagemaße, wie z.B. das ''arithmetische Mittel'', das '''''harmonische Mittel''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9]]]''', das '''''geometrische Mittel''[10]'''.
  
<tr><td valign="top">4.1.1&nbsp;</td><td valign="top">Statistische Analysen mit Excel</td></tr>
+
==== '''Mittelwert''' (auch ''Arithmetisches Mittel'') ====
  
<tr><td valign="top">4.1.2&nbsp;</td><td valign="top">Grafische Aufbereitung von Daten mit Excel</td></tr>
+
Der M. eines metrischen Merkmals ist ein ''Lagemaß'' und entspricht der Summe aller Werte geteilt durch deren Anzahl.
  
<tr><td valign="top">4.2&nbsp;</td><td valign="top">Was kann MS Access?</td></tr>
+
==== '''Modalwert''' (auch Modus) ====
  
<tr><td valign="top">4.3&nbsp;</td><td valign="top">Profi-Programme: SPSS und Statistica</td></tr>
+
Der M. ist ein ''Lagemaß''. Er bezeichnet den am häufigsten vorkommenden Wert.
  
<tr><td valign="top">4.4&nbsp;</td><td valign="top">Datentransfer zwischen Programmen: Von Excel und Access zu SPSS</td></tr>
+
==== '''Modus''' (siehe ''Modalwert'') ====
  
<tr><td valign="top">4.5&nbsp;</td><td valign="top">Umcodierung</td></tr>
+
==== '''Multivariate Verfahren''' (oder ''m. Analyse'') ====
  
<tr><td valign="top">5&nbsp;</td><td valign="top">Lexikon statistischer Grundbegriffe</td></tr>
+
Unter M. V. versteht man Verfahren, bei welchen mindestens drei Variablen und deren Wechselbeziehungen analysiert werden. Siehe auch: '''Multivariate Analyse (Wikipedia)[http://de.wikipedia.org/wiki/Multivariate_Analyse &#91;11&#93;]'''.
  
<tr><td valign="top">5.1&nbsp;</td><td valign="top">A-C</td></tr>
 
  
<tr><td valign="top">5.2&nbsp;</td><td valign="top">D-F</td></tr>
 
  
<tr><td valign="top">5.3&nbsp;</td><td valign="top">G-I</td></tr>
+
'''Verweise:'''<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.3 Klassenbildung Gruppierung von Daten|[1] Siehe Kapitel 3.2.3]]<br />
 +
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;2&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
 +
[http://de.wikipedia.org/wiki/Kontingenzkoeffizient &#91;3&#93; http://de.wikipedia.org/wiki/Kontingenzkoeffizient]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[4] Siehe Kapitel 3.5.3]]<br />
 +
[http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29 &#91;5&#93; http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.2 Kreuztabellen-Analyse|[6] Siehe Kapitel 3.5.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz|[7] Siehe Kapitel 3.3]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Darstellung#3.6.1.2 Liniendiagramme|[8] Siehe Kapitel 3.6.1.2]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.5 Harmonisches Mittel|[9] Siehe Kapitel 3.3.5]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Mittelwerte#3.3.4 Geometrisches Mittel|[10] Siehe Kapitel 3.3.4]]<br />
 +
[http://de.wikipedia.org/wiki/Multivariate_Analyse &#91;11&#93; http://de.wikipedia.org/wiki/Multivariate_Analyse]<br />
  
<tr><td valign="top">5.4&nbsp;</td><td valign="top">J-M</td></tr>
 
  
<tr><td valign="top">5.5&nbsp;</td><td valign="top">N-P</td></tr>
 
  
<tr><td valign="top">5.6&nbsp;</td><td valign="top">Q-R</td></tr>
+
= 5.5 N-P =
  
<tr><td valign="top">5.7&nbsp;</td><td valign="top">S-T</td></tr>
+
==== '''Nichtparametrische Verfahren''' (auch ''parameterfreie Verfahren'') ====
  
<tr><td valign="top">5.8&nbsp;</td><td valign="top">U-Z</td></tr>
+
Als N.T. werden alle statistischen Verfahren bezeichnet, welche nicht an bestimmte Verteilungsformen (wie der Normalverteilung) gebunden sind. Solche Tests sind z.B. der ''Chi-Quadrat-Test,'' der '''Wilcoxon-Test (Wikipedia)[http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest &#91;1&#93;]''' und der '''Mann-Whitney (Wikipedia)[http://de.wikipedia.org/wiki/Mann-Whitney-Test &#91;2&#93;]'''-Test.
  
<tr><td valign="top">6&nbsp;</td><td valign="top">Literatur, Ressourcen und Links</td></tr>
+
==== '''nominal''' ====
  
<tr><td valign="top">6.1&nbsp;</td><td valign="top">Quantitative Forschungsmethoden</td></tr>
+
Merkmale werden als ''nominal'' bezeichnet, wenn ihre Ausprägungen nicht sinnvoll oder ’natürlich’ gereiht werden können (wie z.B. Farben, Hobbies, Namen). Sie sind '''''nominalskaliert''[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3]]]'''. Siehe ''Messniveau.''
  
<tr><td valign="top">6.2&nbsp;</td><td valign="top">Fragebogen-Abfrage</td></tr>
+
==== '''Normalverteilung''' (auch Gaußverteilung) ====
  
<tr><td valign="top">6.3&nbsp;</td><td valign="top">Diagramme und Grafiken</td></tr>
+
Die N. in Form der ''Gaußschen Glockenkurve'' ist eine Verteilungsform mit folgenden Merkmalen: sie ist unimodal (hat nur einen Gipfel); der Gipfel befindet sich in der Mitte (d.h. die in der Mitte des Messspektrums auftretenden Ausprägungen kommen auch am häufigsten vor); sie sind symmetrisch (links wie rechts vom Mittelwert fallen die Häufigkeiten gleichmäßig ab); die Lagemaße wie ''Modalwert, Mittelwert'' und ''Median'' stimmen (fast) annähernd überein. Innerhalb des Bereichs Mittelwert ± der ''Standardabweichung s'' liegen ca. 68 % aller Messwerte. Siehe auch: '''Normalverteilung (Wikipedia)[http://de.wikipedia.org/wiki/Normalverteilung &#91;4&#93;]'''.
  
<tr><td valign="top">6.4&nbsp;</td><td valign="top">Methoden</td></tr>
+
==== '''Nullhypothese''' ====
  
<tr><td valign="top">6.5&nbsp;</td><td valign="top">Repräsentativität</td></tr>
+
Unter einer N. versteht man die Annahme bei statistischen Tests, dass ein postulierter Zusammenhang oder Unterschied nicht besteht. Mit geeigneten Verfahren wird untersucht, ob die Unterschiede oder Zusammenhänge bei einem gewählten Signifikanzniveau noch als zufällig erklärt werden können. Wird das Signifikanzniveau erreicht, wird die Nullhypothese verworfen und die ''Alternativhypothese'' angenommen.
  
<tr><td valign="top">6.6&nbsp;</td><td valign="top">Statistik-Software</td></tr>
+
==== '''Offene Frage''' ====
  
<tr><td valign="top">6.7&nbsp;</td><td valign="top">Terminologie</td></tr>
+
Bei o. Fr. werden im Gegensatz zu geschlossenen Frage keine Antwortkategorien vorgegeben. Daher ist die Auswertung o. Fr. deutlich aufwendiger, weil sie erst interpretiert und eingeordnet werden müssen.
  
<tr><td valign="top">6.8&nbsp;</td><td valign="top">Statistik-Quellen</td></tr>
+
==== '''Objektivität''' ====
  
</table>
+
Unter O. versteht man eine Grundanforderung an Methoden der Datenerhebung. Die Untersuchenden müssen versuchen sicherzustellen, dass andere ForscherInnen bei gleichen Erhebungsmethoden zum gleichen Ergebnis kommen. Dadurch soll eine Unabhängigkeit der Ergebnisse von den Erhebenden angestrebt werden. Im weiteren Sinne bezieht sich O. auch auf die Auswertung der Daten und deren Interpretation. Siehe auch andere ''Gütekriterien'' von Datenerhebungen, wie die ''Variablität'' und ''Validität''.
  
<hr />
+
==== '''Operationalisierung''' ====
<h2>1&nbsp;Funktion und Sinn von Statistik</h2>
 
  
<h3>Weitverbreitete Scheu vor statistischen Methoden</h3>
+
Unter O. versteht man eine möglichst exakte Festlegung der Vorgangsweise bei der Datenerhebung, wie z.B. Frageformulierungen, Anwortvorgaben, Anweisungen an InterviewerInnen usw. Die O. gibt genau an, wie ein bestimmtes Phänomen gemessen werden soll (wie z.B. die angenommene Ablehnung bestimmter Zuwanderergruppen). Die O. inkludiert alle Vorgänge von der Formulierung einer Hypothese, ihrer Umsetzung in konkrete Fragen und die Aufnahme der Daten.
<p>Was bringt Statistik, was bringen quantitative Forschungsmethoden? Viele Menschen stehen ihnen skeptisch gegen&uuml;ber und dies teilweise leider zurecht. Allzuleicht kann mit Statistiken Unfug getrieben werden und nicht immer sind die BetrachterInnen statistisch aufbereiteter Daten gen&uuml;gend geschult, um bewusste Verzerrungen zu erkennen. Richtig verwendet jedoch, ist die Statistik ein unverzichtbares Hilfsmittel, um - losgel&ouml;st von der subjektiven Wahrnehmung -  die Systematik von Tendenzen und Zusammenh&auml;ngen in verschiedensten Lebensbereichen aufzeigen zu k&ouml;nnen.</p>
 
<h3>Statistik in der Alltagserfahrung</h3>
 
<p>Ob wir wollen oder nicht, auch wenn wir niemals etwas von Statistik geh&ouml;rt haben, so wenden wir dennoch meist unreflektiert und unsystematisch Methoden an, welche statistischen Verfahren &auml;hneln. D.h. wir versuchen, von einem begrenzten Erfahrungsschatz auf allgemeine Sachverhalte zu schlie&szlig;en. Jede Erfahrung, die wir machen, beeinflusst mit einer gewissen Wahrscheinlichkeit unsere zuk&uuml;nftigen Handlungs- und Denkweisen. Wir vermeiden vielleicht den Kontakt mit bestimmten Gruppen der Gesellschaft, weil sie uns wenig kooperativ erscheinen; wir f&auml;llen aufgrund einzelner Geschehnisse verallgemeinernde Urteile &uuml;ber Bekannte, dass sie diese oder jene Eigenschaft aufweisen, &uuml;ber Menschen, welche in der &Ouml;ffentlichkeit stehen, &uuml;ber den &ouml;ffentlichen Verkehr:</p>
 
<p>Ilse ist &auml;u&szlig;erst hilfsbereit!<br />
 
Mit Georg kann man dar&uuml;ber nicht sprechen!<br />
 
Die 5er-Linie kommt immer versp&auml;tet!<br />
 
Immer wenn das Wochenende kommt, regnet es!</p>
 
<p>Alle diese Aussagen basieren auf dem in der Statistik g&auml;ngigen Vorgang, von einer begrenzten Erfahrung bzw. von einem begrenzten Datenschatz auf alle m&ouml;glichen Erfahrungen bzw. Daten hochzurechnen, wobei wir bei diesen Aussagen jedoch wichtige Grundprinzipien der Statistik nicht ber&uuml;cksichtigen. Diese &rsquo;unbewussten&rsquo; Anwendungen statistischer Prinzipien &auml;hneln den Versuchen von Couchpotatoes, die Fussballk&uuml;nste eines Ronaldinho in der Praxis nachzuvollziehen.</p>
 
<h3>H&auml;ufige Fehler bei der &rsquo;unbewussten&rsquo; Verwendung statistischer Methoden</h3>
 
<p>Wir m&ouml;chten mit diesen Aussagen ausdr&uuml;cken, dass bestimmte Grundtendenzen vorkommen, dass diese systematisch sind. Aber sind sie das? Haben wir die Rahmbendingungen gen&uuml;gend beachtet? Ist Georg vielleicht nur mir gegen&uuml;ber nicht gespr&auml;chsbereit? Gilt Ilse vielleicht allen anderen gegen&uuml;ber als schroff und unkooperativ? Kommt die 5er-Linie nur zu bestimmten Tageszeiten, an welchen gerade ich sie immer benutze, zu sp&auml;t und zu anderen Zeitpunkten p&uuml;nktlich? Nehme ich schlechtes Wetter unter der Woche gar nicht wahr, weil ich mich im B&uuml;ro befinde? Stimmt mein eigener Eindruck oder beharre ich auf meinem allerersten und m&ouml;chte neue Erfahrungen nicht wahrnehmen?</p>
 
<h3>Statistik muss mit Sorgfalt eingesetzt werden</h3>
 
<p>Die Statistik gibt uns Methoden in die Hand, Vorurteile kritischer zu beleuchten und die <b>Wahrscheinlichkeit[1]</b>  scheinbaren Wissens zu beurteilen, falls sie mit Verantwortungsbewusstsein und Sorgfalt verwendet werden. Sie ist besonders dann von gro&szlig;er Bedeutung, wenn wir - losgel&ouml;st von singul&auml;ren Ereignissen oder Elementen - allgemeine Aussagen machen m&ouml;chten. Sie ist dementsprechend kein Gegensatz zu <b>qualitativen Forschungsmethoden</b>, sondern eine unverzichtbare <b>Erg&auml;nzung[2]</b> zu diesen.</p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3<br />
 
[2] http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-50.html<br />
 
  
<hr />
+
==== '''ordinal''' ====
<h2>1.1&nbsp;Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?</h2>
 
  
<p><b>Quantitative</b> und <b>qualitative Forschungsmethoden</b> haben unterschiedliche Potentiale und M&ouml;glichkeiten und sind dementsprechend kein Gegensatz, sondern erg&auml;nzen sich gegenseitig.</p>
+
Eine Variable gilt als ''ordinal'', wenn ihre Ausprägungen natürlich geordnet werden können, nicht aber die Unterschiede zwischen den Ausprägungen. So weiß man, dass eine Schulnote 1 besser als die Schulnote 2 ist, aber es ist nicht gesichert, dass der Schüler mit der Note 1 den Schüler mit der Note 2 im gleichen Maße übertrifft wie ein Schüler mit der Note 4 einen Schüler mit der Note 5.
<h3>H&auml;ufig Misstrauen gegen&uuml;ber Statistik in Geistes- und Kulturwissenschaften</h3>
 
<p>In den Wissenschaften vom Menschen, wie z.B. der Sozial- und Kulturanthropologie, sind <b>qualitative Forschungsmethoden[1]</b> meist deutlich popul&auml;rer als quantitative. Es mutet zu n&uuml;chtern an, zu festschreibend, zu klischeehaft, Menschen durch eine Reihe von meist kurzen Indikatoren <b>beschreiben[2]</b> zu wollen. GestaltpsychologInnen w&uuml;rden formulieren: &quot;Das Ganze ist mehr als die Summe seiner Einzelteile.&quot;</p>
 
<h3>Zur Tiefe ben&ouml;tigt man qualitative Ans&auml;tze</h3>
 
<p>Und sie haben in Vielem zweifellos recht. Wir ben&ouml;tigen in der Regel <b>qualitative Methoden</b>, um feingewobene Motivforschung zu betreiben, um versteckte Aspirationen, Einstellungen, Eigenheiten zum Vorschein zu bringen. Wie k&ouml;nnte ein kurzer Fragebogen von einer halben Stunde Dauer das gleiche Wissen &uuml;ber die gleiche Person zum Vorschein bringen wie eine Befragung &uuml;ber mehrere Tage, die noch dazu weitgehend dem Rythmus des/der Befragten folgt? Das geht nicht. Und ginge es nur um die Befragung und Eigenheiten einzelner Individuen, etwa um eine Biographie, ben&ouml;tigen wir die <b>Quantitativen Forschungsmethoden</b> eigentlich gar nicht.</p>
 
<h3>Von der Tiefe zur Breite</h3>
 
<p>Nehmen wir nun aber an, jemand h&auml;tte mit gro&szlig;er Sensiblit&auml;t und M&uuml;he aus zehn Personen sehr viel zum Vorschein gebracht, an &Auml;ngsten, Erwarungshaltungen, biographischen Daten, an Erfahrungen, Einstellungen usw. Nehmen wir an, alle zehn Befragten w&auml;ren AfrikanerInnen gewesen. K&ouml;nnten wir ihm/ihr nun die Frage stellen, uns zu sagen, wo AfrikanerInnen Elemente des Lebens anders wahrnehmen, anders reagieren, anders gepr&auml;gt sind? Er/Sie k&ouml;nnte mit einem rein qualitativen Ansatz darauf keine Antwort geben. Er/Sie k&ouml;nnte nur antworten: &quot;Die meisten der befragten zehn Personen sind wegen der Suche nach Arbeit nach &Ouml;sterreich gekommen. Die H&auml;lfte von ihnen empfindet ein gr&ouml;&szlig;eres Ma&szlig; von Einsamkeit etc.&quot; Jede Aussage &uuml;ber Tendenzen der gr&ouml;&szlig;eren Gruppe, zu der die Befragten geh&ouml;ren, w&auml;re vermessen. Wie soll man wissen, ob die zehn Befragten nicht vielleicht die einzigen in der afrikanischen Community sind, die bestimmte Eigenschaften aufweisen, vielleicht auch die einzigen, welche &uuml;berhaupt bereit sind, mit den wei&szlig;en ForscherInnen dar&uuml;ber zu sprechen?</p>
 
<h3>Qualitative und quantitative Methoden erg&auml;nzen und erfordern einander</h3>
 
<p>An dieser Stelle werden quantitative Forschungsmethoden als  <b>Erg&auml;nzung[3]</b> zu den qualitativen unverzichtbar. Beim quantitativen Untersuchungsansatz w&uuml;rde man mit geeigneten Methoden versuchen, die <b>Befragten[4]</b>  bereits so auszuw&auml;hlen, dass sie in den wesentlichen Bereichen ein realistisches Abbild der hier lebenden afrikanischen Community bilden.</p>
 
<h3>Tiefe durch qualitative, Breite durch quantitative Methoden</h3>
 
<p>Quantitative Forschungsmethoden folgen oft qualitativen. Qualitative Untersuchungen liefern hochinteressante Informationen &uuml;ber Menschen, die zu einer bestimmten Berufsgruppe, Region oder Kultur geh&ouml;ren. In von Oralliteratur gepr&auml;gten Regionen werden z.B. viele Bereiche einer h&auml;ufigeren Neuinterpretation unterliegen, da mit der schriftlichen Fixierung oft auch eine erh&ouml;hte Stabilisierung eines Sachverhalts einhergeht. Zu Randbereichen mag es daher eine F&uuml;lle von Interpretationen geben. So mag ein Informant Gedanken &auml;u&szlig;ern, welche erstaunliche &Auml;hnlichkeit mit Reinkarnationsphilosophien anderer Weltgegenden aufweisen. Nun wird es - falls es ums Weltbild der betreffenden Kultur geht - wichtig sein, zu kl&auml;ren, ob nur diese Person oder die ganze Gesellschaft an das Ph&auml;nomen der Reinkarnation glaubt. Nun k&ouml;nnte man mit einer kleinen quantitativen Erhebung, bei der die  verschiedenen Gruppen der Gesellschaft befragt werden, schnell herausfinden, ob  f&uuml;r diese Vorstellung die Biographie des Individuums (wie z.B. auf Reisen durch  Kontakt mit anderen V&ouml;lkern erworben), die Pr&auml;gung einer Kaste innerhalb des  Volkes oder die Pr&auml;gung der ganzen Bev&ouml;lkerung verantwortlich ist. Und dann  k&ouml;nnte man eine allgemeinere Aussage &uuml;ber diesen Sachverhalt machen: &quot;In diesem  Volk glauben nur die &Auml;lteren an die Reinkarnation, die J&uuml;ngeren haben vorwiegend  das christliche oder islamische Modell &uuml;bernommen etc.&quot;.</p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-titel.html<br />
 
[2] http://www.univie.ac.at/ksa/elearning/cp/schreiben/schreiben-2.html<br />
 
[3] http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-50.html<br />
 
[4] Siehe Kapitel 2.1<br />
 
  
<hr />
+
==== '''Ordinalskalierung''' ====
<h2>1.2&nbsp;Formen der Statistik</h2>
 
  
<p>Man unterscheidet im wesentlichen zwei verschiedene Formen der Statistik:</p>
+
Messniveau ordinaler Daten (siehe ''ordinal'').
<ul>
 
    <li>die <b>deskriptive Statistik</b>, bei der mit einfachen Ma&szlig;zahlen und Grafiken Wesentliches &uuml;ber einen Untersuchungsgegenstand ausgedr&uuml;ckt werden soll, sowie</li>
 
    <li>die <b>schlie&szlig;ende oder analystische Statistik</b>, die sich im wesentlichen die Frage stellt, inwieweit das Gemessene als Abbild der Realit&auml;t geeignet ist.</li>
 
</ul>
 
<h3>Vergleich anhand der Einkommenssituation in Bangladesh</h3><p>Nehmen wir an, wir untersuchen die Einkommensituation in zwei benachbarten D&ouml;rfern in Bangladesh. Wir stellen in den beiden D&ouml;rfern ein bestimmtes Durchschnittseinkommen fest und dr&uuml;cken dies in einer Ma&szlig;zahl aus, z.B. dem <b>Median[1]</b>  oder dem <b>Mittelwert[2]</b>. Mittels eines <b>Balkendiagramms[3]</b>  zeigen wir auch optisch, dass das Durchschnitseinkommen von Dorf A h&ouml;her ist als das von Dorf B. Bisher sind wir immer noch im Bereich der <b>deskriptiven Statistik</b> geblieben.</p>
 
<p>Wenn wir uns nun allerdings die Frage stellen, ob der von uns festgestellte Einkommensunterschied zwischen den beiden D&ouml;rfern zuf&auml;lliger Natur oder <b>hoch signifikant[4]</b>  ist, dann geraten wir mit den entsprechenden Methoden (z.B. dem <b>T-Test (Wikipedia)[5]</b>) in den Bereich der <b>schlie&szlig;enden Statistik</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.3<br />
 
[2] Siehe Kapitel 3.3.2<br />
 
[3] Siehe Kapitel 3.6.1.3<br />
 
[4] Siehe Kapitel 1.3.2<br />
 
[5] http://de.wikipedia.org/wiki/T-Test<br />
 
  
<hr />
+
==== '''Population''' ====
<h2>1.2.1&nbsp;Deskriptive Statistik</h2>
 
  
<p>Die <b>deskriptive Statistik</b> hat zum Ziel, die wesentlichen Eigenheiten eines Untersuchungsgegenstandes zusammenzufassen und in wenigen Ma&szlig;zahlen bzw. Diagrammen klar und verst&auml;ndlich zu beschreiben.</p>
+
Gesamtmenge aller Beobachtungseinheiten
<p>Die Aussagen der <b>deskriptiven Statistik</b> beziehen sich dabei immer nur auf die untersuchte Stichprobe. Die Darstellungsformen liegen in Ma&szlig;zahlen, in <b>Grafiken[1]</b>  und Tabellen. H&auml;ufige Ma&szlig;zahlen der deskriptiven Statistik sind z.B. <b>Mittelwerte[2]</b>  oder die <b>Streuung einer Stichprobe[3]</b>  oder deren grafische Entsprechungen in Form z.B. von <b>Kreis- oder Stabdiagrammen[4]</b>.</p>
 
<h3><b>Beispiel: Vergleichende Dorfstudien in Mali</b></h3>
 
<p>Wir untersuchen zwei Siedlungen in Mali in Westafrika. Wir befragen jeweils 50 Personen aus den beiden Siedlungen zu Einsch&auml;tzungen eines in der Gegend lebenden Volkes. Wir halten n&uuml;chtern fest, wie diese Einsch&auml;tzungen ausfallen. Wir k&ouml;nnen dann z.B. angeben, dass das rinderz&uuml;chtende Volk der Fulbe in Nkorongoji relativ negativ betrachtet wird, in der Stadt Kita hingegen eher positiv. Das sind n&uuml;chterne Beschreibungen = Deskriptionen.</p>
 
<p>Bei der <b>deskriptiven Statistik</b> untersuchen wir nicht, ob diese Unterschiede der Einsch&auml;tzungen der Fulbe m&ouml;glicherweise zuf&auml;lliger Natur sein k&ouml;nnten (weil die <b>Stichproben[5]</b>  zu klein waren; die Einsch&auml;tzungsabst&auml;nde zu klein; weil wir durch viel Pech trotz sorgf&auml;ltiger Auswahl der Befragten im Ort Nkorongoji gerade an die Personengruppen geraten sind, welche aus historischen Gr&uuml;nden Fulbe negativ gegen&uuml;ber stehen, w&auml;hrend die Mehrheit eher positiv denkt usw.). Die Untersuchung der <b>Wahrscheinlichkeit[6]</b>  der Unterschiede geh&ouml;rt zur Analytischen Statistik.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6<br />
 
[2] Siehe Kapitel 3.3<br />
 
[3] Siehe Kapitel 3.4<br />
 
[4] Siehe Kapitel 3.6.1<br />
 
[5] Siehe Kapitel 2.1.1<br />
 
[6] Siehe Kapitel 1.3<br />
 
  
<hr />
+
==== '''p-Wert''' (auch Überschreitungswahrscheinlichkeit) ====
<h2>1.2.2&nbsp;Analytische Statistik</h2>
 
  
<p>Die <b>analytische</b> (auch <b>schlie&szlig;ende</b> oder <b>deduktive[1]</b> genannt) <b>Statistik</b> besch&auml;ftigt sich im Wesentlichen mit der Frage der Zuf&auml;lligkeit statistisch gemessener Ph&auml;nomene. So stellt man sich die Frage, inwieweit ein in einer Stichprobe gemessener <b>Mittelwert[2]</b>  vom Mittelwert der <b>Grundgesamtheit[3]</b>  <b>abweichen[4]</b>  k&ouml;nnte; man stellt sich bei verschiedenen <b>Stichproben</b> die Frage, ob sie angesichts ihrer gemessenen Unterschiede noch zur gleichen <b>Grundgesamtheit</b> geh&ouml;ren k&ouml;nnen u.a. Hier wird also versucht, die untersuchte Stichprobe in einem gr&ouml;&szlig;eren Ganzen einzuordnen, wobei auch der Untersuchung der <b>Wahrscheinlichkeit</b> von <b>Zusammenh&auml;ngen[5]</b>  bzw. Differenzen breiter Raum einger&auml;umt wird.</p>
+
Der p. Wert (Kurzform von ''probability'') gibt bei statistischen Tests die Wahrscheinlichkeit an, mit welcher eine gefundene Kennzahl rein zufällig auftreten könnte. Man legt vor der Durchführung eines Tests ein Signifikanzniveau fest, z.B. p= 0,05. Ergibt sich ein p-Wert von kleiner als 0,05, dann ist die Nullhypothese mit einer ''Irrtumswahrscheinlichkeit'' von kleiner als 5 % zu verwerfen.
<h3><b>Beispiel 1: Sind Unterschiede (&uuml;ber-)zuf&auml;llig?</b></h3>
 
<p>In einem Ort A findet man bei 50 Befragten ein Durchschnittseinkommen von &euro; 1300 ermittelt, im Ort B bei einer gleich gro&szlig;en <b>Stichprobe[6]</b>  ein Durchschnittseinkommen von &euro; 1765. Mit Methoden der <b>analytischen Statistik</b> k&ouml;nnten wir herausfinden, ob der Einkommensunterschied zwischen diesen beiden Stichproben die Verallgemeinerung erlaubt, dass die Bev&ouml;lkerungen der beiden Orte tats&auml;chlich unterschiedlich gut verdienen oder ob der gemessene Unterschied <b>rein zuf&auml;lliger Natur[7]</b>  sein k&ouml;nnte (weil die Befragten sich trotz aller Sorgfalt bei ihrer Auswahl gerade an diesem Punkt von ihren MitbewohnerInnen unterscheiden).</p>
 
<h3><b>Beispiel 2: Ist ein gemessenes Ergebnis noch &rsquo;normal&rsquo;?</b></h3>
 
<p>Normalerweise sollten beim Roulette-Spiel in einem l&auml;ngeren Untersuchungszeitraum alle 37 Zahlen etwa gleich h&auml;ufig auftreten. In einem Spielcasino kamen im Untersuchungszeitraum am Roulette-Tisch verschiedene Zahlen deutlich h&auml;ufiger als andere vor. Mit den geeigneten (analytischen) Methoden der <b>Wahrscheinlichkeitsrechnung</b> ermittelt man, ob der Roulette-Tisch m&ouml;glicherweise einseitig so beschaffen oder abgen&uuml;tzt ist, dass man wahrscheinlich auf Dauer mit unterschiedlichen H&auml;ufigkeiten rechnen muss oder ob die gemessenen Ergebnisse rein zuf&auml;lliger Natur waren.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.univie.ac.at/ksa/elearning/cp/qualitative/qualitative-6.html<br />
 
[2] Siehe Kapitel 3.3<br />
 
[3] Siehe Kapitel 2.1<br />
 
[4] Siehe Kapitel 1.3.1<br />
 
[5] Siehe Kapitel 3.5<br />
 
[6] Siehe Kapitel 2.1.1<br />
 
[7] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
==== '''Parameter''' ====
<h2>1.3&nbsp;Wahrscheinlichkeiten, nicht Gewissheit</h2>
 
  
<h3><b>(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.</b></h3>
+
P. sind Kennzahlenn, welche eine Grundpopulation charakterisieren. Dazu zählen insbesonders die ''Lagemaße'' und die ''Streuungsmaße''. Da sie in der Regel für die Grundpopulation nicht bekannt sind, müssen sie auf der Basis von Stichproben hochgerechnet werden.
<p>In der Statistik beschreiben und analysieren wir meist <b>Stichproben[1]</b>, also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgf&auml;ltig zusammengesetzte Stichprobe in wesentlichen Parametern von der <b>Grundgesamtheit[2]</b>  unterscheidet, sie also nicht wiederspiegelt.</p>
 
<p>Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpr&auml;ferenzen befragen, dann kann es sein, dass die Beliebtheit der SP&Ouml; bei ihnen deutlich anders ausf&auml;llt als bei der Grundgesamtheit, auch wenn aus der Schichtung der <b>Stichprobe</b> keinerlei tendenzi&ouml;se Verteilung der Personen ersichtlich war.</p>
 
<h3><b>Konfidenzintervalle</b></h3>
 
<p>Besonders in der analytischen Statistik gibt man daher <b>Konfidenzintervalle</b> bzw. <b>Schwankungsbreiten</b> an, innerhalb derer sich ein wahrer Wert bewegen soll, d.h. der vermutete Wert in der <b>Grundpopulation</b>. <b>Die Breite der Konfidenzintervalle h&auml;ngt von der Gr&ouml;&szlig;e der Stichprobe, deren relativer Gr&ouml;&szlig;e im Verh&auml;ltnis zur Grundpopulation sowie von der gew&auml;hlten Irrtumswahrscheinlichkeit ab.</b></p>
 
<h3><b>Beispiel Hochrechnung am Wahlsonntag:</b></h3>
 
<p>Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1.1<br />
 
[2] Siehe Kapitel 2.1<br />
 
  
<hr />
+
==== '''Parametrische Verfahren''' ====
<h2>1.3.1&nbsp;Schwankungsbreiten und Konfidenzintervalle</h2>
 
  
<p>Unter <b>Schwankungsbreite</b> bzw. <b>Konfidenzintervall</b> versteht man einen Bereich, innerhalb dessen eine Merkmalsauspr&auml;gung f&uuml;r die Grundpopulation  bei einer festgesetzten Irrtumswahrscheinlichkeit angenommen wird, wobei der f&uuml;r die Sch&auml;tzung verwendete Ausgangswert aus einer Stichprobe ermittelt wurde.</p>
+
Unter p. V. versteht man statistische Tests, welche das Vorliegen einer bestimmten Verteilungsform mit den dafür typischen Parametern erfordern. Besonders häufig wird die Normalverteilung als Grundbedingung gesehen.
<p>Die <b>Schwankungsbreite</b> oder das <b>Konfidenzintervall</b> h&auml;ngen von folgenden Faktoren ab:<br />
 
a. dem gew&auml;hlten Signifikanzniveau (je signifikanter, dester gr&ouml;&szlig;er die Schwankungsbreite);<br />
 
b. dem gr&ouml;&szlig;enm&auml;&szlig;igen Verh&auml;ltnis zwischen <b>Stichprobe</b> und <b>Grundpopulation[1]</b>  (je gr&ouml;&szlig;er der Unterschied, desto gr&ouml;&szlig;er die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
 
c. der Gr&ouml;&szlig;e der <b>Stichprobe[2]</b>  (je kleiner, desto gr&ouml;&szlig;er ist die Schwankungsbreite)</p>
 
<p><b>Beispiel zu Punkt b am Wahlabend:</b><br />
 
W&auml;hrend die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgez&auml;hlten Stimmen die Schwankungsbreite der Stimmen f&uuml;r Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgez&auml;hlt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).</p>
 
<p>&nbsp;Siehe auch <b>Konfidenzintervall (Wikipedia)[3]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
[2] Siehe Kapitel 2.1.1<br />
 
[3] http://de.wikipedia.org/wiki/Konfidenzintervall<br />
 
  
<hr />
+
==== '''Partielle Korrelation''' (auch Partialkorrelation) ====
<h2>1.3.2&nbsp;Irrtumswahrscheinlichkeit und Signifikanzniveau</h2>
 
  
<p>Unter der Irrtumswahrscheinlichkeit p versteht man die zahlenm&auml;&szlig;ig ausgedr&uuml;ckte Wahrscheinlichkeit, dass sich ein Ergebnis einer statistischen Analyse substantiell vom tats&auml;chlichen Ergebnis der Grundpopulation unterscheidet.</p>
+
Eine P.K. ist das Ausmaß des Zusammenhangs (''Korrelation'') zwischen zwei Variablen, wobei gleichzeitig versucht wird, den Einfluss einer dritten Variablen auf diesen Zusammenhang herauszurechnen. Siehe auch: '''Scheinkorrelation und Störvariable[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5]]]'''.
<p>In der Statistik arbeitet man meist mit den drei folgenden <b>Signifikanzniveaus</b> oder -grenzen:</p>
 
<p>p &le; 0,05: <b>signifikant</b> (Irrtumswahrscheinlichkeit kleiner als 5 %)</p>
 
<p>p &le; 0,01: <b>sehr signifikant</b> (Irrrtumswahrscheinlichkeit kleiner als 1 %)</p>
 
<p>p &le;  0,001: <b>h&ouml;chst signifikant</b> (Irrtumswahrscheinlichkeit kleiner als 1 &permil;)</p>
 
<p>Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer <b>Irrtumswahrscheinlichkeit</b> von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller F&auml;lle das tats&auml;chliche Endergebnis au&szlig;erhalb dieses Bereiches liegen wird.</p>
 
<p>Siehe auch <b>Signifikanz (Wikipedia)[1]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://de.wikipedia.org/wiki/Statistische_Signifikanz<br />
 
  
<hr />
+
==== '''Pearson’scher Korrelationskoeffizient''' ====
<h2>2&nbsp;Von der Fragestellung zur statistischen Analyse</h2>
 
  
<h3><b>Wesentliche Elemente bei quantitativen Forschungsans&auml;tzen</b></h3>
+
Siehe ''Produkt-Moment-Korrelation''
<p>Bei quantitativen Forschungsans&auml;tzen  sind die folgenden Teilbereiche von besonderer Bedeutung:</p>
 
<ul>
 
    <li>die <b>Untersuchungsobjekte</b>, &uuml;ber welche wir eine Aussage machen m&ouml;chten (z.B. LateinamerikanerInnen in Wien);</li>
 
    <li>die <b>Forschungsfrage</b>, die wir mit den Untersuchungsobjekten verbinden (z.B. ihre Erfahrungen in Wien)</li>
 
    <li>die <b>Operationalisierung</b>, d.h. die Art und Weise, wie wir Einstellungen und Sachverhalte messen</li>
 
</ul>
 
<p>Interessiert uns z.B. die Einstellung der lokalen Bev&ouml;lkerung zur Entwicklungszusammenarbeit, dann ist das zu untersuchende Objekt die Bev&ouml;lkerung (die Grundpopulation), w&auml;hrend die thematischen Fragen die Einstellungen der Bev&ouml;lkerung zur EZA darstellen.</p>
 
<h3><b>Befragung der richtigen Personen mit den richtigen/relevanten Fragen</b></h3>
 
<p>Wir m&uuml;ssen sowohl sicherstellen, dass wir uns tats&auml;chlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und <b>Repr&auml;sentativit&auml;t[1]</b>), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden k&ouml;nnen, die eine statistische Interpretation erm&ouml;glichen (siehe <b>Operationalisierung[2]</b>  und <b>Messen[3]</b>).</p>
 
<p>Im oben genannten Beispiel m&uuml;ssen wir also genau abkl&auml;ren, wer oder was die lokale Bev&ouml;lkerung ist, wie sie sich differenziert (Objekt) und zus&auml;tzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzusch&auml;tzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivit&auml;ten f&uuml;r diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gew&uuml;nschten H&ouml;he der EZA-Leistungen; Fragen nach L&auml;ndern und Regionen, die als f&ouml;rderungsw&uuml;rdig gelten usw.).</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1.4<br />
 
[2] Siehe Kapitel 2.2<br />
 
[3] Siehe Kapitel 2.2.2<br />
 
  
<hr />
+
==== '''Perzentil''' ====
<h2>2.1&nbsp;Die Grundpopulation: worüber wir Aussagen machen</h2>
 
  
<p>Die <b>empirische Grundgesamtheit</b> (<b>Grundpopulation</b>) ist jene abgegrenzte Menge von Personen (z.B. die Wiener Bev&ouml;lkerung) oder Objekten (z.B. die Regenf&auml;lle in einer tropischen Region, die Autos im 7. Bezirk), &uuml;ber die man Aussagen machen m&ouml;chte.</p>
+
Siehe ''Quantil''
<p>Anders ausgedr&uuml;ckt: Wenn wir eine Studie zu AfrikanerInnen in &Ouml;sterreich durchf&uuml;hren, dann m&ouml;chten wir als Ergebnis zu Aussagen kommen, welche Tendenzen sich in dieser Bev&ouml;lkerungsgruppe zeigen. Alle Mitglieder der Gruppe AfrikanerInnen in &Ouml;sterreich bilden gemeinsam die <b>Grundgesamtheit</b>.</p>
 
<h3><b>Elemente, Variable und Auspr&auml;gungen</b></h3>
 
<p>Ein Einzelobjekt aus dieser Grundgesamtheit bezeichnet man als <b>statistische Einheit</b> oder <b>Element</b> (z.B. Herr Moussa Bamba aus Bamako, der jetzt in Wien lebt). Die Einzelobjekte weisen jeweils <b>Merkmale</b> auf (auch <b>Variablen</b> genannt, z.B. Geschlecht, Einkommen, Autofarbe etc.), die uns interessieren und &uuml;ber deren Auspr&auml;gung in der Grundgesamtheit wir mehr erfahren m&ouml;chten (die sogenannte <b>Verteilung[1]</b>). Die m&ouml;glichen Werte dieser Merkmale bezeichnet man als <b>Merkmalsauspr&auml;gungen</b><b><i>.</i></b> So gibt es f&uuml;r das Merkmal Geschlecht die Auspr&auml;gungen m&auml;nnlich oder weiblich, f&uuml;r die Variable K&ouml;rpergr&ouml;&szlig;e Zahlen zwischen theoretisch Null und deutlich &uuml;ber zwei Meter.</p>
 
<h3><b>Befragung der gesamten Grundpopulation nur selten m&ouml;glich</b></h3>
 
<p>Meist ist die <b>Grundpopulation</b> so gro&szlig;, dass wir nur einen Teil der Grundpopulation befragen k&ouml;nnen, eine sogenannte <b>Stichprobe</b>.</p>
 
<h3><b>&Ouml;ffentliche Quellen f&uuml;r Daten &uuml;ber Grundpopulationen</b></h3>
 
<p>Grundinformationen &uuml;ber die Verteilung der <b>Grundpopulationen</b> kann man u.a. suchen bei <b>Statistik Austria[2]</b> und anderen  Informationsstellen, in einschl&auml;gigen Publikationen etc.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3<br />
 
[2] http://www.statistik.at/<br />
 
  
<hr />
+
==== '''Proportionalskala''' (auch Verhältnisskala) ====
<h2>2.1.1&nbsp;Die Stichprobe (Sample)</h2>
 
  
<p>Eine <b>Stichprobe</b> ist eine Auswahl von Elementen der Grundgesamtheit, anhand derer die <b>Grundgesamtheit[1]</b>  nachgebildet werden soll.</p>
+
Eine P. gehört zu den vier wesentlichen ''Messniveaus'' (''Messskalen'') und liegt dann vor, wenn bei numerischen Daten ein absoluter Nullpunkt vorliegt. Bei einer P. können nicht nur die Abstände zwischen Ausprägungen interpretiert werden, sondern auch ihr Verhältnis. So ist z.B. ein Baum von 3 Metern Höhe doppelt so hoch wie ein Baum von 1,5 Meter Höhe.
<h3><b>Auswahl fast immer notwendig</b></h3>
 
<p>Auf Grund der Gr&ouml;&szlig;e der <b>Grundpopulationen</b> ist es kaum jemals m&ouml;glich, alle Mitglieder derselben zu befragen. Daher greift man in der Regel zu <b>Stichproben</b>, also einer Auswahl von Mitgliedern der Grundgesamtheit. Die Mitglieder der Stichproben sollten in der Regel so ausgew&auml;hlt sein, dass sie ein <b>unverzerrtes Abbild</b> der <b>Grundgesamtheit</b> darstellen (siehe <b>Repr&auml;sentativit&auml;t[2]</b>).</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
[2] Siehe Kapitel 2.1.4<br />
 
  
<hr />
+
==== '''Population''' ====
<h2>2.1.2&nbsp;Teil- oder Vollerhebung?</h2>
 
  
<h3><b>Teil- oder Vollerhebung?</b></h3>
+
Siehe ''Grundpopulation''
<p>Je nach Gr&ouml;&szlig;e der <b>Grundpopulation</b>, der Zahl der BefragerInnen und der finanziellen Ressourcen eines Forschungsprojekts kann eine Stichprobe unterschiedlich gro&szlig; gew&auml;hlt werden. Quantitativ sinnvolle Stichprobengr&ouml;&szlig;en beginnen bei einer Befragtenanzahl von 100 und sind auch dann noch von gro&szlig;en Fehlerm&ouml;glichkeiten gekennzeichnet. Sinnvoller w&auml;ren auch hier deutlich h&ouml;here Stichprobengr&ouml;&szlig;en. Wenn z.B. ein Meinungsforschungsinstitut die Wahlpr&auml;ferenzen erhebt, befragt es in der Regel 300- 1000 Personen.</p>
 
<p>Falls die <b>Grundpopulation</b> relativ klein ist, wie z.B. ausl&auml;ndische H&auml;ndlerInnen am Brunnenmarkt, l&auml;sst sich auch eine <b>Vollerhebung</b> durchf&uuml;hren. Dabei werden alle in Frage kommenden Personen befragt.</p>
 
<p>&nbsp;</p>
 
<hr />
 
<h2>2.1.3&nbsp;Die Ziehung (Auswahl) der Stichprobe</h2>
 
  
<p>Unter <b>Ziehung der Stichprobe</b> versteht man die Selektion der Elemente der Stichprobe.</p>
+
==== '''Pretest''' ====
<p>Die Formen der Ziehung der Stichprobe lassen sich prinzipiell unterteilen in</p>
 
<ul>
 
    <li><b>Geschichtete Stichprobenauswahl</b></li>
 
    <li><b>Willk&uuml;rliches Auswahlverfahren</b></li>
 
    <li><b>Zufallsstichproben</b></li>
 
    <li><b>Klumpenstichproben</b></li>
 
</ul>
 
<hr />
 
<h2>2.1.3.1&nbsp;Geschichtete Stichprobenauswahl (Quotenstichprobe)</h2>
 
  
<p>Unter einer <b>geschichteten Stichprobenauswahl</b> versteht man ein Auswahlverfahren, bei dem wesentliche <b>Verteilungscharakteristiken[1]</b>  der <b>Grundgesamtheit[2]</b>  nachgebildet werden.</p>
+
Unter einem P. versteht man eine der Befragung der Stichprobe per Fragebogen vorausgehende Abtestung desselben durch Probeinterviews, um Schwächen im Vorfeld zu eliminieren. Man untersucht dabei z.B., ob die Fragen verständlich sind, wie sie interpretiert werden, ob alle Fragen zufriedenstellende Antworten bringen, ob die Befragten bereit sind, alle Fragen zu beantworten, ob die Befragten den Zeitaufwand für die Ausfüllung des Fragebogens akzeptieren etc.
<p>Einzelne f&uuml;r die Untersuchung als relevant erachtete Merkmale der Zielgruppe werden ann&auml;hernd im gleichen Verh&auml;ltnis auf die <b>Stichprobe</b> &uuml;bertragen, wie sie in der Grundgesamtheit vorkommen.</p>
 
<p>Relevant sind besonders die Merkmale, welche bei der spezifischen Fragestellung zu besonderer Differenzierung f&uuml;hren k&ouml;nnen. Bei den Wahlpr&auml;ferenzen sind das z.B. das Bundesland (Wien ist z.B. traditionell ein &rsquo;rotes&rsquo; Bundesland, N&Ouml; ein &rsquo;schwarzes&rsquo;); Geschlecht (Frauen haben oft ein ganz anderes Wahlverhalten als M&auml;nner); Alter (die &Auml;lteren haben eine st&auml;rkere Tendenz zur SP&Ouml;, die J&uuml;ngeren zu den Gr&uuml;nen) etc.</p>
 
<p><b>Beispiel:</b><br />
 
Man versucht die aktuellen Wahlpr&auml;ferenzen der &Ouml;sterreicher mit insgesamt 500 Befragten zu erheben. Da etwa 1/5 der &Ouml;sterreicherInnen in Wien lebt, sollte dementsprechend auch 1/5 der Befragten der Stichprobe, also ca. 100 Personen, aus Wien kommen, aber wesentlich weniger aus dem Burgenland. In gleicher Weise sollte auch die altersm&auml;&szlig;ige Verteilung der &Ouml;sterreicherInnen wiedergegeben werden, also etwa 1/4 der Befragten &uuml;ber 60 Jahre etc.</p>
 
<p>Je nachdem, ob die wesentliichen Verteilungsparameter ber&uuml;cksichtigt werden oder einzelne teilweise bewusst verzerrt werden, spricht man von <b>proportional geschichteten Stichproben</b> oder von <b>disproportional geschichteten Stichproben.</b></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3<br />
 
[2] Siehe Kapitel 2.1<br />
 
  
<hr />
+
==== '''Produkt-Moment-Korrelation''' (auch ''Pearson’scher Korrelationskoeffizient'') ====
<h2>2.1.3.1.1&nbsp;Proportional geschichtete Stichproben</h2>
 
  
<p>Bei der <b>proportional geschichteten Stichprobe</b> werden die <b>Schichten</b> entsprechend ihrer Verteilung in der Grundgesamtheit ausgew&auml;hlt. Es wird ein durchgehend treues und <b>unverzerrtes Abbild der Grundgesamtheit</b> angestrebt.</p>
+
Die ''P.M.''-''Korrelation'' ist eine Form der ''Korrelation'' und zeigt den Zusammenhang zwischen zwei standardisierten Variablen, die beide metrisch und normalverteilt sein müssen. Siehe auch: '''Maßkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6]]]'''.
<p>Besonders h&auml;ufig werden f&uuml;r die <b>Schichtung</b> Geschlecht, Alter und Wohnart verwendet.</p>
 
<hr />
 
<h2>2.1.3.1.2&nbsp;Disproportional geschichtete Stichproben</h2>
 
  
<p>Unter einer <b>disproportional geschichteten Stichprobe</b> versteht man die bewusste Verzerrung einzelner <b>Verteilungsparameter</b>, um signifikante Aussagen &uuml;ber Randbereiche erhalten zu k&ouml;nnen. Dabei wird eine Bev&ouml;lkerungsgruppe <b>&uuml;berproportional</b> wiedergegeben, um gen&uuml;gend Interviews f&uuml;r sie zu erhalten.</p>
+
==== '''Punktwolke''' ====
<p>Diese Methode wird v.a. angewandt, um bei beschr&auml;nkten Stichprobengr&ouml;&szlig;en <b>signifikante[1]</b>  Aussagen &uuml;ber kleinere Bev&ouml;lkerungsgruppen erhalten zu k&ouml;nnen, die f&uuml;r die Fragestellung besonders interessant sind.</p>
 
<h3><b>Beispiel: Umfrage zu Reformen im Bildungsbereich</b></h3>
 
<p>Problemstellung: Man m&ouml;chte herausfinden, wie die &ouml;sterreichische Bev&ouml;lkerung eine gro&szlig;e Bildungsreform einschlie&szlig;lich des Hochschulwesens einsch&auml;tzt. Man kann dabei insgesamt 1000 Personen befragen. Befragt man die &ouml;sterreichische Bev&ouml;lkerung proportional geschichtet, w&uuml;rde man etwa 27 Studierende zu diesem Thema befragen, da mit etwa 220.000 Studierenden an &ouml;ffentlichen Hochschulen ihr Anteil an der Bev&ouml;lkerung bei ca. 2,7 % liegt. Man k&ouml;nnte somit bei blo&szlig; 27 befragten Studierenden keine verl&auml;ssliche Aussage &uuml;ber sie bekommen, da ihre spezifische Anzahl zu klein ist. Da sie als Betroffene jedoch f&uuml;r die Fragestellung von besonderer Relevanz sind, k&ouml;nnte man sie &uuml;bergewichten und 100 oder mehr von ihnen befragen.</p>
 
<h3><b>Vorteil Kenntnis von Randbereichen, Nachteil Verzerrung des Meinungsbildes</b></h3>
 
<p>Der Vorteil liegt in einer besseren Kenntnis des Meinungsbilds dieser thematisch wichtigen Subgruppe, <b>der Nachteil dieser Methode in einem Verlust an Repr&auml;sentativit&auml;t.</b> Die Stichprobe ist verzerrt. Wollte man nun allgemeine Aussagen &uuml;ber das Meinungsbild bez&uuml;glich dieser Bildungsreform in der &ouml;sterreichischen &Ouml;ffentlichkeit treffen, m&uuml;sste man das Meinungsbild der Studierenden auf ihren tats&auml;chlichen Anteil in der Bev&ouml;lkerung hinuntergewichten.</p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
siehe ''Streudiagramm''
<h2>2.1.3.1.3&nbsp;Laufende Kontrolle der Schichtung</h2>
 
  
<h3>W&auml;hrend der Befragungsphase laufende Kontrolle der Schichtung erforderlich</h3>
 
<p>Bei einem quantitativen Forschungsprojekt f&uuml;hrt man laufend Erhebungen, meist mit Frageb&ouml;gen, durch. Dabei muss man stets einen &Uuml;berblick &uuml;ber die <b>Verteilung[1]</b>  der bereits Interviewten haben, um Abweichungen von der Verteilung in der <b>Grundpopulation[2]</b>  korrigieren zu k&ouml;nnen. Wie? Indem man die n&auml;chsten Interviewten aus Personengruppen w&auml;hlt, die bisher <b>unterrepr&auml;sentiert</b> waren, deren bisheriger Anteil in der Stichprobe also deutlich geringer als ihr Anteil in der Grundpopulation ist.</p>
 
<h3>Berechnung</h3>
 
<p>Bei ganz kleinen Umfragen kann man die <b>Aufteilungsverh&auml;ltnisse</b> mit einer Matrix kontrollieren, in die man laufend mit &sbquo;Stricherln&rsquo; eintr&auml;gt, wen man interviewt hat. Nehmen wir an, in der Grundpopulation h&auml;tten wir eine Verteilung von 55 % M&auml;nnern und 45 % Frauen bzw. von 25 % AkademikerInnen und 75 % NichtakademikerInnen. Mit den <b>Schichtungsfragen</b> stellen wir fest, ob die Verteilung der Interviewten mit der der Grundpopulation &uuml;bereinstimmt. Daher m&uuml;ssen Schichtungsfragen auch fester Bestandteil der Frageb&ouml;gen sein. Bisher haben wir folgende Interviews gef&uuml;hrt:&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:351px; .word-wrap:break-word; "><img height="109" border="0" align="bottom" width="351" alt="Tabelle: Aufteilungsverhältnisse" title="Tabelle: Aufteilungsverhältnisse"  src="images/quantitative-17_1.jpg" /><span class="imgcaption">Tabelle: Kontrolle der Aufteilungsverh&auml;ltnisse in einer Matrix</span>
 
</span></p>
 
<p>In unserer <b>Stichprobe</b> findet sich bisher ein M&auml;nneranteil von 70 % (gegen&uuml;ber 55 % in der Grundpopulation) sowie ein AkademikerInnen-Anteil von 43 % (gegen&uuml;ber 25 % in der Grundpopulation). Daher m&uuml;ssen wir in Zukunft mehr Frauen und mehr NichtakademikerInnen befragen, solange, bis dieses Ungleichgewicht behoben ist. Zus&auml;tzlich gilt es zu bedenken, dass in unserer Stichprobe der Akademikeranteil bei den M&auml;nnern bisher bei ca. 38 % liegt, der Akademikerinnen-Anteil bei den Frauen jedoch bei ca. 55 %. Sofern beide in der Grundpopulation den gleichen AkademikerInnen-Anteil aufweisen, m&uuml;ssten wir bei den folgenden Interviews darauf achten, dass bei Frauen noch st&auml;rker als bei den M&auml;nnern besonders NichtakademikerInnen interviewt werden.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3<br />
 
[2] Siehe Kapitel 2.1<br />
 
  
<hr />
 
<h2>2.1.3.2&nbsp;Zufallsstichproben</h2>
 
  
<p>Unter <b>Zufallsstichproben</b> versteht man Auswahlverfahren einer <b>Stichprobe</b>, bei welchen bei einem theoretisch vorliegenden Register aller Elemente der <b>Grundgesamtheit[1]</b>  die Elemente der <b>Stichprobe</b> zuf&auml;llig gezogen werden.</p>
+
'''Verweise:'''<br />
<p>Man vergleiche dies mit einer Lottoziehung. Man hat ein Register von 45 Lotto-Zahlen, welche die gleiche Ziehungwahrscheinlichkeit aufweisen. Aus diesen werden beim Lotto insgesamt sechs Zahlen gezogen.</p>
+
[http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest &#91;1&#93; http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest]<br />
<p>Man unterscheidet zwischen <b>einfachen</b> und <b>systematischen Zufallsstichproben.</b> Eine Sonderform der <b>Zufallsstichproben</b> sind die <b>geschichteten Zuallsstichproben.</b></p>
+
[http://de.wikipedia.org/wiki/Mann-Whitney-Test &#91;2&#93; http://de.wikipedia.org/wiki/Mann-Whitney-Test]<br />
<h3><b>Allgemeines Problem von Zufallsstichproben:</b></h3>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Eignung#3.1.2.2 Nominalskalierung|[3] Siehe Kapitel 3.1.2.2]]<br />
<p>Es ist &auml;u&szlig;erst schwierig, Register aufzutreiben oder zu erstellen, welche tats&auml;chlich jedem Element der Grundgesamtheit die gleiche Chance des Gezogenwerdens erlauben. Im Telefonregister scheinen viele Nummern nicht auf, da sie als Geheimnummern unterdr&uuml;ckt werden. Geheimnummern werden wiederum h&auml;ufiger von besser etablierten Personen verwendet, weshalb sie &uuml;ber das Telefonregister eine geringere Chance haben, erreicht zu werden.</p>
+
[http://de.wikipedia.org/wiki/Normalverteilung &#91;4&#93; http://de.wikipedia.org/wiki/Normalverteilung]<br />
<p />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.4.3 Scheinkorrelationen und Störvariable|[5] Siehe Kapitel 3.5.3.4.3]]<br />
<b>Verweise in diesem Kapitel:</b><br />
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.1 Maßkorrelation|[6] Siehe Kapitel 3.5.3.1]]<br />
[1] Siehe Kapitel 2.1<br />
 
  
<hr />
 
<h2>2.1.3.2.1&nbsp;Einfache Zufallsstichprobe</h2>
 
  
<p>Bei der <b>einfachen Zufallsstichprobe</b> gibt es keinerlei Systematik der Ziehung.</p>
 
<p>Will man z.B. die Wiener Bev&ouml;lkerung zum Thema Stadtautobahn befragen, k&ouml;nnte man alle Telefonnummern in einen PC einspeisen (das Register) und sich von einem Programm mit Zufallsgenerator 100 dieser Telefonnummern &rsquo;auswerfen&rsquo; lassen.</p>
 
<hr />
 
<h2>2.1.3.2.2&nbsp;Systematische Zufallsstichprobe</h2>
 
  
<p>Bei der <b>systematischen Zufallsstichprobe</b> erfolgt die Ziehung mit System, mit einem bestimmten Ziehungsschl&uuml;ssel, und damit nicht mehr ganz zuf&auml;llig.</p>
+
= 5.6 Q-R =
<p><b>Beispiel:</b>&nbsp; <br />
 
Man m&ouml;chte die Einstellung der Wiener Bev&ouml;lkerung zur Fristenl&ouml;sung befragen. Man nimmt das Telefonbuch der Stadt Wien und w&auml;hlt jede 100. Telefonnummer an.</p>
 
<h3><b>Potentielle Probleme der systematischen Zufallsstichproben:</b></h3>
 
<p>Ein Problem dieses Verfahrens kann in einer nicht erkannten Systematik der Verteilung liegen. Wenn man alle Personen befragt, welche jeweils die T&uuml;rnummer 1 in den H&auml;usern aufweisen, dann w&auml;re die Wahrscheinlichkeit gro&szlig;, dass Hausmeister deutlich &uuml;berrrepr&auml;sentiert sind.</p>
 
<h3><b>Systematik darf nicht zu starr sein:</b></h3>
 
<p>Daher sollte die Systematik nicht zu starr sein. Man k&ouml;nnte z.B. bei der ersten Befragung im 1. Haus das Alter der Person abfragen und aus dem Alter die T&uuml;rnummer des n&auml;chsten abzufragenden Hauses ermitteln, z.B. aus der Ziffernsumme. Nehmen wir an, ein Alter von 32 wird angegeben, dann ist die Ziffernsumme 3+2 = 5, beim n&auml;chsten Haus wird also die BewohnerIn der T&uuml;rnummer 5 befragt usw.</p>
 
<p>&nbsp;</p>
 
<hr />
 
<h2>2.1.3.2.3&nbsp;Geschichtete Zufallsstichprobe</h2>
 
  
<p>Eine Sonderform der <b>Zufallsstichprobe</b> ist die <b>geschichtete Zufallsstichprobe</b><b><i>.</i></b> Bei dieser findet zuerst eine Einteilung der Stichprobe in sich nicht &uuml;berlappende Schichten statt. Aus diesen werden wiederum <b>einfache</b> oder <b>systematische Zufallsstichproben</b> entnommen.</p>
+
==== '''Quantitativ''' ====
<h3><b>Beispiel: Befragung von WienerInnen</b></h3>
 
<p>Man entscheidet sich zuerst f&uuml;r eine Ber&uuml;cksichtigung der Gr&ouml;&szlig;enverh&auml;ltnisse der einzelnen Bezirke, danach realisiert man mit der festgelegten Anzahl von Personen aus diesen Bezirken <b>einfache</b> oder <b>systematische Zufallsstichproben.</b></p>
 
<hr />
 
<h2>2.1.3.3&nbsp;Willkürliches Auswahlverfahren</h2>
 
  
<p>Unter einem <b>willk&uuml;rlichen Auswahlverfahren</b> versteht man eine <b>unkontrollierte Form der Ziehung</b>, bei welcher die Elemente der Grundgesamtheit eine <b>deutlich unterschiedliche Wahrscheinlichkeit der Selektion</b> aufweisen, weshalb von der Stichprobe nicht mehr auf die Grundgesamtheit geschlossen werden kann.</p>
+
Eigenschaft, dass die Ausprägung von Elementen in Zahlen wiedergegeben werden kann, wobei eine größere Zahl auch eine größere Ausprägung impliziert.
<p><b>Beispiel: </b><br />
 
Eine LehrerIn fragt in der Schule, welche Sch&uuml;lerInnen sich bereit erkl&auml;ren, bei einem sportlichen Ausdauertraining mit Vor- und Nachtest mitzumachen. Eine kleine Zahl von Sch&uuml;lerInnen meldet sich, die wahrscheinlich um einiges fitter als die anderen sind.</p>
 
<h3><b>Sinnvoll f&uuml;r R&uuml;ckschl&uuml;sse auf Methoden</b></h3>
 
<p>Auch eine derartige Auswahl kann sinnvoll sein, wenn man z.B. messen m&ouml;chte, ob sich die Fitness der ausgew&auml;hlten TeilnehmerInnen durch das Training verbesserte. In der Medizin verwendet man oft dieses Auswahlverfahren, um die Wirksamkeit von Medikamenten zu testen.</p>
 
<h3><b>Kein R&uuml;ckschluss auf die Grundgesamtheit</b></h3>
 
<p>Ein R&uuml;ckschluss auf die Grundgesamtheit ist jedoch mit dem <b>willk&uuml;rlichen Auswahlverfahren</b> nicht erlaubt.</p>
 
<hr />
 
<h2>2.1.3.4&nbsp;Klumpenstichproben</h2>
 
  
<p>Unter einer <b>Klumpenstichprobe</b> versteht man die Auswahl von <b>Klumpen</b> (B&uuml;ndel von Erhebungselementen wie Schulklassen oder Unternehmen) nach dem Zufallsverfahren.</p>
+
==== '''Quantil''' ====
<p>Dieses Auswahlverfahren erfolgt meist aus Gr&uuml;nden der &Ouml;konomie. Statt einzelne Sch&uuml;lerInnen aus Schulen in 1000 Orten zu befragen, befragt man z.B. alle Sch&uuml;lerInnen aus 30 ausgew&auml;hlten Orten, von denen man annimmt, dass diese bez&uuml;glich ihrer Eigenheiten die Grundgesamtheit der Orte abbilden.</p>
 
<hr />
 
<h2>2.1.4&nbsp;Repräsentativität</h2>
 
  
<p>Unter <b>Repr&auml;sentativit&auml;t</b> versteht man die angestrebte Eigenschaft von statistischen Erhebungen, die Grundgesamtheit in der ausgew&auml;hlten Stichprobe m&ouml;glichst unverzerrt nachzubilden. Eine statistische Erhebung ist <b>repr&auml;sentativ</b>, wenn sie auf einer <b>Zufallsstichprobe</b> basiert und Aussagen &uuml;ber die <b>Grundgesamtheit[1]</b>  zul&auml;sst.</p>
+
Unter Q. versteht man Orientierungspunkte einer statistischen Verteilung; sie dienen als ''Streuungsmaße'' zur Beschreibung der Verteilung. Dabei wird die Verteilung stets in gleich große Teile aufgeteilt. Bei vier gleichen Teilen spricht man von ''Quartilen'', bei fünf von ''Quintilen'', bei zehn von ''Dezilen'' und bei 100 von ''Perzentilen.'' Besonders gerne verwendet werden die ''Quartile''. Das erste Quartil gibt den Wert an, unterhalb desselben sich 25 % der Einträge befinden. Das zweite Quartil oder ''Median'' gibt den Wert an, unterhalb desselben sich 50 % der Einträge befinden usw.
<p>Damit von der Stichprobe auf die Grundgesamtheit geschlossen werden kann, m&uuml;ssen bei den verschiedenen <b>Formen der Ziehungen</b> folgende Bedingungen erf&uuml;llt sein:</p>
 
<ul>
 
    <li><b>Die Grundgesamtheit muss exakt definiert sein</b>. Es muss somit klar festgelegt werden, welche Elemente zur Stichprobe geh&ouml;ren. Geh&ouml;ren z.B. bei einer Untersuchung &uuml;ber AfrikanerInnen in &Ouml;sterreich auch hier geborene Kinder von ZuwanderInnen zur Grundgesamtheit oder ausschlie&szlig;lich in Afrika Geborene?</li>
 
    <li><b>Die Grundgesamtheit muss physisch oder symbolisch pr&auml;sent und manipulierbar sein</b> (sie muss sich durchmischen lassen, jedes Element muss entnehmbar sein). Einfaches Beispiel: Bei einer Lottoziehung w&auml;ren 45 Kugeln vorhanden, aus denen nach dem Zufallsprinzip jeweils eine gezogen wird.</li>
 
    <li><b>Jedes Element darf nur einmal in der Grundgesamtheit vertreten sein.</b> Man darf also nicht z.B. die gleiche Person zweimal mit dem gleichen Fragebogen befragen.</li>
 
    <li><b>Die Auswahl muss so erfolgen, dass jedes Element die gleiche berechenbare Auswahlchance (gr&ouml;&szlig;er 0) hat, in die Stichprobe zu gelangen.</b> Wenn die Befragung ausschlie&szlig;lich an Orten oder zu Zeitpunkten stattfindet, an welchen ein Teil der Grundpopulation nicht oder nur selten erreichbar ist (z.B. &auml;ltere Menschen in Discos oder Arbeitende untertags im Park), dann ist die Repr&auml;sentativit&auml;t ebenfalls nicht gew&auml;hrleistet.</li>
 
</ul>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
  
<hr />
+
==== '''Quantifizierung''' ====
<h2>2.1.5&nbsp;Was tun, wenn die Grundpopulation nicht bekannt ist?</h2>
 
  
<p>Sollte es unm&ouml;glich sein, statistische Daten &uuml;ber die Schichtung der <b>Grundpopulation[1]</b>  zu erhalten, kann man entweder</p>
+
Unter Qu. versteht man die numerische Beschreibung von Merkmalsausprägungen einer Variablen auf Basis von Messungen oder Zählungen.
<ul>
 
    <li><b>aufgrund vermutlich vergleichbarer Grundpopulationen verallgemeinern.</b>  Nehmen wir an, wir kennen den Frauenanteil von SudanesInnen in Wien nicht, Die ZuwanderInnen aus verschiedenen anderen vergleichbaren afrikanischen L&auml;ndern (islamisch, arabisch - englisch) weisen einen Frauenanteil von etwa 40 % auf, dann k&ouml;nnte man auch bei Sudanesinnen diesen Wert als Arbeitshypothese ansetzen. Man sollte jedoch unbedingt in der Publikation auf dieses Problem und die daraus folgende Annahme einer bestimmten Schichtung hinweisen.</li>
 
    <li><b>ExpertInnen zum Thema befragen</b>, am besten gleich mehrere. Z.B. k&ouml;nnte man das Magistrat befragen, in welchem Ausma&szlig; verschiedene Nationalit&auml;ten am Brunnenmarkt vertreten sind; IntegrationsforscherInnen, auch erfahrene Mitglieder der Grundpopulation etc.</li>
 
</ul>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
  
<hr />
+
==== '''quantitativ''' ====
<h2>2.2&nbsp;Die Operationalisierung</h2>
 
  
<p>Unter <b>Operationalisierung</b> versteht man die pr&auml;zise Angabe der Vorgangsweise, mit der ein theoretisches Konstrukt gemessen werden soll (wie z.B. die Akzeptanz von Zuwanderergruppen). Dazu geh&ouml;rt die Auswahl der <b>Indikatoren</b>, die genaue Formulierung der Fragen im <b>Fragebogen</b>, dazu geh&ouml;ren die <b>Antwortkategorien</b>, die Bestimmung der <b>Messinstrumente</b>, die <b>Bestimmung der Genauigkeit der Messung</b>, die <b>Anweisungen an die InterviewerInnen</b>, wie sie die Fragen stellen und welche Zusatzinformationen sie geben d&uuml;rfen etc. <b>Operationalisierung[1]</b> versucht also bis ins kleinste Detail sicherzustellen, dass die <b>wissenschaftlichen Qualit&auml;tserfordernisse[2]</b>  f&uuml;r vergleichbare Forschungsarbeiten eingehalten werden k&ouml;nnen und tats&auml;chlich brauchbare Antworten zu den Themen gefunden werden k&ouml;nnen, die man zu untersuchen vorgibt.</p>
+
Ein Merkmal wird quantitativ genannt, wenn es sich (z.B. durch Messen), zahlenmäßig erfassen lässt. Quantitative Merkmale werden in ''diskrete'' und ''stetige'' Merkmale unterteilt.
<h3><b>Was man untersucht bzw. &rsquo;misst&rsquo;, muss in seinen Auspr&auml;gungen in sinnvolle und voneinander abgrenzbare Untereinheiten unterteilt werden k&ouml;nnen.</b></h3>
 
<p>Untersucht man z.B. die mathematischen F&auml;higkeiten von Schulkindern, kann man zur Notenskala greifen. Das Geschlecht kann in m&auml;nnlich und weiblich unterteilt werden. Bei der Untersuchung der K&ouml;rpergr&ouml;&szlig;e wird man in Ma&szlig;einheiten wie cm oder mm messen. Die Einstellung gegen&uuml;ber Zuwanderergruppen k&ouml;nnen wir z.B. in einer f&uuml;nfteiligen Abstufung wiedergeben, wie z.B. &rsquo;sehr positiv&rsquo;, &rsquo;eher positiv&rsquo;, &rsquo;neutral&rsquo;, &rsquo;eher ablehnend&rsquo; oder &rsquo;absolut ablehnend&rsquo;. Den Erfolg bei den Bewerbungen von Zuwanderern am Arbeitsmarkt k&ouml;nnte man unterteilen in &rsquo;sofort abgelehnt&rsquo;, &rsquo;zu Bewerbungsgespr&auml;ch eingeladen, aber dann abgelehnt&rsquo; und &rsquo;aufgenommen&rsquo; unterteilen. Den Familienstand kann man in &rsquo;ledig&rsquo;, &rsquo;geschieden&rsquo;, &rsquo;verheiratet&rsquo;, &rsquo;verwitwet&rsquo; unterteilen.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-43.html<br />
 
[2] Siehe Kapitel 2.3<br />
 
  
<hr />
+
==== '''Quartil''' ====
<h2>2.2.1&nbsp;Die Suche nach Indikatoren</h2>
 
  
<p>Im Forschungsentwurf werden verschiedene <b>Hypothesen</b> formuliert. Nun ben&ouml;tigt man eine Reihe von <b>Indikatoren</b>, um die <b>Hypothesen[1]</b> beibehalten bzw. verwerfen zu k&ouml;nnen.</p>
+
Siehe ''Quantil''
<p>In vielen F&auml;llen ist die Suche nach den <b>Indikatoren</b> einfach. M&ouml;chte man z.B. ermitteln, wie warm zur gleichen Jahreszeit verschiedene Orte sind, dann gen&uuml;gt eine Messung mit dem Thermometer. Meist jedoch sind die Forschungsfragen komplexer und nicht mit einer einzigen konkreten Messungsart zu beantworten.</p>
 
<p><b>Beispiel 1:</b><br />
 
Nehmen wir an, Sie postulieren, dass die Gesellschaft in Nepal sehr ungleich und damit nicht egalit&auml;r ist. Nun br&auml;uchten wir eine Reihe von sehr viel spezifischeren Fragestellungen, eigentlich <b>Subhypothesen</b>, deren Synthese zur Beantwortung der allgemeinen Hypothese f&uuml;hren kann. Wir k&ouml;nnten zwischen materieller, rechtlicher und politischer (Un-)Gleichheit unterscheiden. Wir k&ouml;nnten Verm&ouml;gensverh&auml;ltnisse in verschiedenen Schichten betrachten; den Zugang zu staatlichen und privaten Ressourcen; wir k&ouml;nnten die Vertretung verschiedener Gruppen der Gesellschaft (Frauen, Adelige, Bauern etc.) im Parlament und anderen &ouml;ffentlichen Gremien betrachten. Wir k&ouml;nnten die Schulbesuchsquote kontrastiv untersuchen etc.</p>
 
<p>In all diesen Punkten m&uuml;ssen wir &auml;u&szlig;erst konkret und pr&auml;zise werden. Bez&uuml;glich des Schulbesuchs k&ouml;nnte man die Zahl der Jahre in der Schule, den maximalen Ausbildungsgrad etc. abfragen. Bez&uuml;glich des Verm&ouml;gens Grundst&uuml;cke, H&auml;user, Kapital, Vieh, andere Besitzt&uuml;mer, Leibeigene etc. Wir k&ouml;nnten Einsch&auml;tzungen abfragen, ob Heiraten zwischen Adeligen und Nichtadeligen als akzeptabel empfunden werden, ob die Befragten annehmen, dass Arme und Reiche vor Gericht die gleichen Chancen haben usw.</p>
 
<p><b>Beispiel 2:</b><br />
 
Sie nehmen an, dass viele Menschen in Wien AraberInnen ablehnen und oft sogar rassistisch gegen&uuml;berstehen. Sie k&ouml;nnten nun in einem Fragebogen an die Wiener Bev&ouml;lkerung die Wertsch&auml;tzung des Islams, der arabischen Kultur abfragen. Sie k&ouml;nnten fragen, in welchem Ma&szlig;e man annimmt, dass AraberInnen besonders leicht zu Terrorismus neigen. Sie k&ouml;nnten fragen, ob man sich vorstellen k&ouml;nnte, AraberInnen als angeheiratete Familienmitglieder zu akzeptieren. Sie k&ouml;nnten die Bereitschaft abfragen, AraberInnen Wohnungen zu vermieten. Sie k&ouml;nnten die Befragten ersuchen, die ersten Assoziationen zu nennen, die ihnen beim Begriff AraberInnen einfallen. Sie k&ouml;nnten die Befragten ersuchen, Ihnen das dominante Gef&uuml;hl zu nennen, welches sie in Gegenwart von AraberInnen sp&uuml;ren usw.</p>
 
<p>Letztendlich k&ouml;nnte man sich auf einen Schl&uuml;ssel einigen, mit welchem Anteil die mit den verschiedenen Detailfragen erhaltenen Informationen in einen Sammelparameter (Beispiel 1: Ungleichheit/Gleichheit; Beispiel 2: Rassismus gegen&uuml;ber AraberInnen) einflie&szlig;en.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-49.html<br />
 
  
<hr />
+
==== '''Quartilabstand''' ====
<h2>2.2.2&nbsp;Das Messen</h2>
 
  
<p>Unter <b>Messung</b> versteht man die <b>quantitative Bestimmung von Sachverhalten in Form einer Messgr&ouml;&szlig;e</b><i>.</i> d.h. wir ordnen diesen Zahlen zu.</p>
+
Siehe ''Interquartilabstand''
<p>Misst man die Temperatur eines K&ouml;rpers, wird man in unseren Regionen in der Messgr&ouml;&szlig;e Celsius messen, in anderen in Fahrenheit etc. Messen wir die K&ouml;rpergr&ouml;&szlig;e, dann messen wir bei gr&ouml;&szlig;eren K&ouml;rpern in Metern und Zentimetern, bei Kleinstlebewesen aber auch in Millionstel Metern und darunter. Messen wir das Haushaltseinkommen, werden wir in Euro messen. Bei der Messung von Einstellungen und sozialen Sachverhalten kann man selbst die Messgr&ouml;&szlig;en bestimmen. So k&ouml;nnte man bei der Einsch&auml;tzung der Sympathie f&uuml;r eine bestimmte Kultur f&uuml;nf verschiedene Messgr&ouml;&szlig;en festlegen, wie z.B. &rsquo;sehr sympathisch&rsquo;, &rsquo;sympathisch&rsquo;, &rsquo;neutral&rsquo;, &rsquo;weniger sympathisch&rsquo; und &rsquo;unsympathisch&rsquo;.&nbsp;</p>
 
<h3><b>Die Antwortkategorien m&uuml;ssen fair und ausgewogen sein</b></h3>
 
<p>Es w&auml;re tendenzi&ouml;s und unseri&ouml;s, in der obigen Sympathie-Skala im positiven Bereich nur &rsquo;sehr sympathisch&rsquo; anzugeben, im negativen jedoch die zwei vorhandenen Unterscheidungen. Dies k&ouml;nnte dazu f&uuml;hren, dass Antwortende, die nur eine leichte Sympathie f&uuml;r die andere Kultur empfinden, zum neutralen Wert ausweichen. Daher gilt als Grundregel, dass die Zahl der m&ouml;glichen Antwortvarianten bei derartigen Fragen im negativen Bereich genauso hoch wie im positiven Bereich sein soll.</p>
 
<p>&nbsp;Messungen beinhalten immer das Problem von <b>Messfehlern</b>.</p>
 
<hr />
 
<h2>2.2.2.1&nbsp;Messfehler</h2>
 
  
<p>Unter <b>Messfehler</b> versteht man die Abweichung des Ergebnisses von Messungen von den realen Gegebenheiten. Wo eine Messung erfolgt, sollte man immer die M&ouml;glichkeit von Messfehlern ber&uuml;cksichtigen. Man kann zwischen <b>zuf&auml;lligen</b>, <b>systematischen und fahrl&auml;ssigen Messfehlern</b> unterscheiden.</p>
+
==== '''Range''' (auch Variationsweite, Spannweite) ====
<h3><b>A. Zuf&auml;llige Messfehler:</b></h3>
 
<p>Zuf&auml;llige Messfehler sind von den Messenden nicht zu kontrollieren. Wenn man zum Beispiel eine bestimmte Personengruppe zu einem sensiblen Thema befragen m&ouml;chte und gerade am Tag vorher ein (den InterviewerInnen unbekanntes) Ereignis eintritt, welches ihre Neigung zu ehrlichen Antworten tempor&auml;r ver&auml;ndert, w&auml;hrend bei Vergleichsgruppen im gleichen Zeitraum nichts Vergleichbares auftritt, k&ouml;nnen verf&auml;lschte Ergebnisse auftreten. Misst man die Regenf&auml;lle in der Sahelgegend, kann es sein, dass ein Ort deutlich besser und gleichm&auml;&szlig;iger beregnet wird, als die nicht gemessenen Nachbarorte, im n&auml;chsten Jahr kann es umgekehrt sein. Es gibt jedoch einen sogenannten <b> Zentralen Grenzwertsatz der Statistik (Wikibooks)[1]</b>, nach welchem zuf&auml;llige Fehler sich im Laufe der Zeit ausgleichen und einer Normalverteilung zustreben. Man kann daher postulieren, dass die zuf&auml;lligen Messfehler bei h&auml;ufigen Messungen zum Ausgleich tendieren.</p>
 
<h3><b>B. Systematische Messfehler:</b></h3>
 
<p>Systematische Messfehler k&ouml;nnen durch <b>fehlerhafte Messger&auml;te</b> entstehen, wie z.B. die Gewichtsmessung durch eine verstellte Waage; die Zeitmessung durch eine ungenaue Uhr; aber auch z.B. eine Kommunikationsform, welche den Zugang zu manchen Informationen kaum erlaubt. So ist es m&ouml;glich, dass besonders hoch emotionale Angelegenheiten in einer Fremdsprache zu anderen Antworten als in seiner Muttersprache f&uuml;hren. Man &uuml;berlege sich, ob es einem in einer Fremdsprache &auml;hnlich schwer wie in seiner Muttersprache f&auml;llt, z.B. <i>Ich liebe Dich </i> zu sagen, wo beim Aussprechen &auml;hnlicher S&auml;tze auch Assoziationen mit Entt&auml;uschungen u.a. verbunden sein k&ouml;nnen und damit auch die Angst vor Zur&uuml;ckweisung.</p>
 
<p>Ein Teil der systematischen Messfehler kann durch <b>stetige Kontrolle</b> und <b>kritische Hinterfragung</b> der Messinstrumente behoben werden.</p>
 
<h3><b>C. Fahrl&auml;ssige Messfehler:</b></h3>
 
<p><b>Grobe Messfehler</b> <b>beruhen auf menschlichen Fehlern</b>. Man tr&auml;gt z.B. beim Alter 15 statt 51 ein, schreibt eine Antwort in die falsche Spalte; vergisst eine Frage zu stellen oder zu beantworten. Man vermittelt beim Interview eigene Einstellungen, welche mit gro&szlig;er Wahrscheinlichkeit zu einer ver&auml;nderten Reaktion des Befragten f&uuml;hren (wenn man z.B. einem Befragten deutlich zeigt, dass man seine Einstellungen und Meinungen geringsch&auml;tzt).</p>
 
<p>Weiterf&uuml;hrende Links zu Messfehlern:</p>
 
<p><a class="x&quot;" href="http://users.physik.tu-muenchen.de/cucke/medprakt/Fehler.PDF#search=%22systematische%20me%C3%9Ffehler%20statistik%22"> Hinweise zur Fehlerbetrachtung</a></p>
 
<p><b>Messfehler (Wikipedia)[2]</b></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://de.wikibooks.org/wiki/Mathematik:_Statistik:_Zentraler_Grenzwertsatz<br />
 
[2] http://de.wikipedia.org/wiki/Messfehler<br />
 
  
<hr />
+
Unter R. versteht man den Abstand zwischen dem kleinsten und dem größten aufgetretenen Wert bei mindestens ordinalskalierten Daten. Die Range bei gemessenen Körpergrößen wäre demnach z.B. 2,18 m(größter Wert) - 1,54 m(kleinster Wert), also 64 cm.
<h2>2.2.3&nbsp;Vom Fragebogen zum Codeplan</h2>
 
  
<p>Unter einem <b>Codeplan</b> verstehen wir die <b>Auflistung aller verwendeten Variablen</b> mit einer eindeutigen Information zur inhaltlichen Bedeutung der numerischen Codes, eventuell noch von weiteren Informationen begleitet, welche sich auf den Messvorgang beziehen.</p>
+
==== '''Rangkorrelation''' ====
<p>In einem Codeplan halten wir eindeutig fest, <b>welchen Variablennamen Fragen des Fragebogens entsprechen</b>,  <b>wie verschiedene Auspr&auml;gungen von Variablen gemessen werden</b> (z.B. in cm f&uuml;r die K&ouml;rpergr&ouml;&szlig;e oder in Ja/Nein f&uuml;r bestimmte Erfahrungen) und <b>wie diese Auspr&auml;gungen in eine numerische Form &uuml;bersetzt werden</b>, was &uuml;berhaupt erst eine maschinelle quantitative Analyse erlaubt.</p>
 
<h3><b>Statistikprogramme ben&ouml;tigen automatisch interpretierbare Datentypen</b></h3>
 
<p>Statistikprogramme ben&ouml;tigen f&uuml;r Berechnungen bestimmte Datentypen, die in der Regel <b>numerisch</b> sind. Kein Statistikprogramm kann in den Antwortkategorien &rsquo;sehr&rsquo;, &rsquo;eher schon&rsquo;, &rsquo;durchschnittlich&rsquo;, &rsquo;eher weniger&rsquo;, &rsquo;&uuml;berhaupt nicht&rsquo; eine logische Reihe erkennen, dass also diese Bezeichnungen f&uuml;r verschiedene logische Abstufungen stehen, n&auml;mlich f&uuml;r eine <b>Ordinalskala[1]</b>.</p>
 
<p>Damit ein Statistikprogramm wie <b>SPSS</b> die logische Reihenfolge erkennen und danach Analysen &uuml;ber diese bilden kann, m&uuml;ssen die Textwerte in numerische umcodiert werden. Im <b>Codeplan</b>, d.h. der Dokumentation &uuml;ber die urspr&uuml;nglichen Text- Begriffe und ihrer numerischen Entsprechungen, werden diese Umcodierungen festgehalten. Im obigen Beispiel k&ouml;nnte man  &rsquo;sehr&rsquo; immer durch 1, &rsquo;eher schon&rsquo; durch 2, &rsquo;durchschnittlich&rsquo; durch 3, &rsquo;eher weniger&rsquo; durch 4 und &rsquo;&uuml;berhaupt nicht&rsquo; durch 5 ersetzen. Nun ist eine f&uuml;r die Software durchgehende Reihe von 1-5 entstanden, die vom kleinsten zum gr&ouml;&szlig;ten Wert gereiht ist.</p>
 
<p>Aktuelle Statistikprogramme wie <b>SPSS</b> rechnen intern mit diesen numerischen Daten, k&ouml;nnen mit einfachen Befehlen jedoch bei der Ausgabe der Ergebnisse automatisch die ursp&uuml;nglichen Textinformationen verwenden.</p>
 
<p>&nbsp;Beispiel eines Codeplans:&nbsp;&nbsp;</p>
 
<p>&nbsp;</p>
 
<p style="text-align: left;"><span class="imgbox imgcenter" style="width:507px; .word-wrap:break-word; "><img height="510" border="0" align="bottom" width="507" src="images/quantitative-30_1.jpg" alt="Tabelle: Beispiel eines Codeplans" title="Tabelle: Beispiel eines Codeplans"  /><span class="imgcaption">Tabelle: Beispiel eines Codeplans</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2.3<br />
 
  
<hr />
+
Form der Korrelation, bei welcher nicht die Merkmalsausprägungen, sondern deren ''Rangzahlen'' verwendet werden. Dabei werden im wesentlichen zwei Verfahren verwendet, ''Spearman´s Rho'' und ''Kendall’s Tau''. Siehe auch: '''die Korrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1]]]'''.
<h2>2.2.3.1&nbsp;Dateneingabe und Erstellung einer Datenmatrix</h2>
 
  
<p>Unter einer <b>Datenmatrix</b> versteht man eine <b>Tabelle, in welcher alle Messungen an den Versuchsobjekten zusammengefasst werden</b>. Die Daten sind normalerweise so angeordnet, dass jede Zeile der Datenmatrix alle <b>Messungen</b> an einem einzelnen Datenobjekt enth&auml;lt. In den Zeilen stehen somit von links nach rechts die Angaben zu einer Person (bzw. zu den Untersuchungsobjekten), w&auml;hrend in den Spalten die Variablen eingetragen werden.</p>
+
==== '''Rangzahlen''' ====
<p>Siehe z.B. die ersten Spalten und Zeilen der SPSS-Datei zur weltweiten Entwicklung world95.sav:&nbsp;</p>
 
<span class="imgbox imgcenter" style="width:469px; .word-wrap:break-word; "><img height="337" border="0" align="bottom" width="469" alt="Abbildung: Beispiel SPSS-Datenmatrix" title="Abbildung: Beispiel SPSS-Datenmatrix"  src="images/quantitative-31_1.jpg" /><span class="imgcaption">Abbildung: Beispiel einer SPSS-Datenmatrix</span>
 
</span>
 
<p>Die Untersuchungsobjekte sind hier eindeutig durch ihre in der ersten Spalte stehenden (L&auml;nder-)Namen identifiziert. Von links nach rechts werden danach in den einzelnen Zeilen durch Variable Informationen zu den jeweiligen L&auml;ndern angegeben: Bev&ouml;lkerungsgr&ouml;&szlig;e, Bev&ouml;lkerungsdichte, Prozentsatz der st&auml;dtischen Bev&ouml;lkerung, Religion etc.&nbsp;</p>
 
<p>Es ist &auml;u&szlig;erst empfehlenswert, die Datenmatrix in der hier beschriebenen Weise zu verwalten, da alle f&uuml;hrenden und g&auml;ngigen Analyse- und Darstellungsprogramme (Excel, SPSS etc.) die gleiche Anordnung verwenden.</p>
 
<hr />
 
<h2>2.2.3.2&nbsp;Umcodierung mit SPSS</h2>
 
  
<p>SPSS ben&ouml;tigt gleichzeitig f&uuml;r viele Funktionen numerische Daten, wo Daten in <i>String</i> (oder Text-)Format vorliegen. So kann SPSS bei reinen Textdaten, wie z.B. &rsquo;Sehr Gut&rsquo; oder &rsquo;Gut&rsquo; nicht erkennen, dass &rsquo;Sehr Gut&rsquo; eine h&ouml;here Intensit&auml;t bzw. Qualit&auml;t als &rsquo;Gut&rsquo; wiederspiegelt. SPSS w&uuml;rde eine sinnvolle Rangfolge jedoch in numerischer Form erkennen.</p>
+
Man erhält sie, wenn quantitative Daten größenmäßig geordnet werden und die geordneten Werte, mit 1 beginnend, fortlaufend nummeriert. Im Falle gleicher Ursprungsgröße müssen die Rangplätze gemittelt werden. Ein Beispiel: Die Punktezahl 12 tritt sowohl auf den Rangplätzen 13 wie 14 auf. Beide Rangplätze erhalten daher die gemittelte Rangzahl 13,5 (beide Zahlen addiert und durch die Anzahl der Werte, also 2, dividiert).
<p>SPSS erlaubt es, <b>Stringvariable</b> automatisch in <b>numerische</b> zu codieren.</p>
 
<p>Dazu ben&uuml;tzen Sie die Funktion TRANSFORMIEREN - UMCODIEREN in der Men&uuml;leiste. Nun k&ouml;nnen Sie sich entscheiden, ob die Umcodierung in die gleiche oder in eine andere Variable erfolgen soll. Es ist besser, sich f&uuml;r <i>eine andere Variable</i> zu entscheiden, da durch die Umcodierung (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch Umcodierung in eine neue Variable ausgeschlossen.</p>
 
<p>Sie w&auml;hlen nun die Variable aus, welche umcodiert werden soll und geben im Feld Ausgabevariable einen neuen Namen daf&uuml;r ein (der aus Gr&uuml;nden verschiedenster Kompatibilit&auml;t) acht Zeichen nicht &uuml;berschreiten darf. Im Feld darunter k&ouml;nnen Sie jedoch einen beliebig langen und expressiveren Namen w&auml;hlen.</p>
 
<span class="imgbox imgcenter" style="width:607px; .word-wrap:break-word; "><img height="379" border="0" align="bottom" width="607" alt="Abbildung: Umkodieren mit SPSS" title="Abbildung: Umkodieren mit SPSS"  src="images/quantitative-32_1.jpg" /><span class="imgcaption">Abbildung: Umkodieren in andere Variablen mit SPSS</span>
 
</span>
 
<p>Klicken Sie nun auf <i>Alte und neue Werte</i>. Wenn Sie einzelne Werte umcodieren m&ouml;chten, geben Sie im Feld <i>Wert</i> denselben ein (z.B. Matura). Nun ben&ouml;tigen Sie einen neuen Wert daf&uuml;r. Daf&uuml;r k&ouml;nnten Sie z.B. die Zahl 3 im Feld <i>Neuer Wert</i> eingeben. Im oben angef&uuml;hrten Beispiel w&auml;ren verschiedene abgeschlossene Ausbildungsstufen in eine logische Reihenfolge gebracht.</p>
 
<p>Falls Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen m&ouml;chten, k&ouml;nnen Sie einen Bereich angeben (z.B. <i>Bereich</i> 20 <i>bis</i> 29), wenn Sie alle zwischen 20-29j&auml;hrigen in eine einzige Altersklasse &rsquo;zwischen 20 und 30' einbringen m&ouml;chten). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf <i>Hinzuf&uuml;gen.</i></p>
 
<p>Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert. Erst jetzt w&auml;re es Ihnen m&ouml;glich, dass SPSS die Ausbildung nach Jahren und Qualit&auml;t sinnvoll reihen kann und nat&uuml;rlich auch viele weitere (damit zusammenh&auml;ngenden) Analysen rechnen kann. So w&auml;re erst jetzt die Berechnung einer <b>Korrelation[1]</b> zwischen dem Ausbildungsgrad und dem Einkommen m&ouml;glich.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3<br />
 
  
<hr />
+
==== '''Regression''' ====
<h2>2.2.3.3&nbsp;Autom. Rückcodierung mit SPSS</h2>
 
  
<p>Damit SPSS mit Daten rechnen kann, wurden diese in numerischer Form eingegeben oder in eine neue numerische Variable umcodiert. Wenn Sie nun eine auf diesen neuen Variablen basierende Analyse starten, wirken die Ergebnisse ohne zus&auml;tzliche Information wenig informativ.</p>
+
Unter R. versteht man Verfahren, welche es erlauben, Werte einer anderen Variablen vorherzusagen, wenn der Wert einer bestimmten Variablen bekannt ist. Siehe auch: die '''Regression[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2]]]'''.
<p><span class="imgbox imgcenter" style="width:438px; .word-wrap:break-word; "><img height="132" border="0" align="bottom" width="438" alt="Tabelle: Numerische Variablen" title="Tabelle: Numerische Variablen"  src="images/quantitative-33_1.gif" /><span class="imgcaption">Tabelle: Numerische Variablen</span>
 
</span></p>
 
<p>Niemand k&ouml;nnte ohne Zusatzinformation wissen, dass <em>0</em> f&uuml;r <i>Nein </i>  und <i>1</i> f&uuml;r <i>Ja</i>  steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben (Diagramme, Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die <i>Variablenansicht. </i> Im neuen Fenster finden wir in der Zeile der neuen Variable den Punkt <i>Variablenlabel. </i> Nach Doppelklick darauf erscheint folgendes Fenster:</p>
 
<p style="text-align: left;"><span class="imgbox imgcenter" style="width:530px; .word-wrap:break-word; "><img height="314" border="0" align="bottom" width="530" alt="Abbildung: Wertelabels definieren" title="Abbildung: Wertelabels definieren"  src="images/quantitative-33_2.jpg" /><span class="imgcaption">Abbildung: Definition der Wertelabels mit SPSS</span>
 
</span></p>
 
<p>Wir geben nun f&uuml;r den Wert das gew&uuml;nschte Label ein. Wir m&ouml;chten, dass statt <i>0 </i>  der aussagekr&auml;ftige Text <i>Nein </i> erscheint, statt <i>1 </i> der aussagekr&auml;ftige Wert  <i>Ja. </i> Nach Eingabe aller automatisch durchzuf&uuml;hrenden &Auml;nderungen klicken wir auf OK.</p>
 
<p>Wenn wir nun die gleiche H&auml;ufigkeitsberechnung wie oben durchf&uuml;hren, erhalten wir nun folgende leichter verst&auml;ndliche Tabelle:</p>
 
<p><span class="imgbox imgcenter" style="width:438px; .word-wrap:break-word; "><img height="132" border="0" align="bottom" width="438" alt="Abbidung: Tabelle mit Wertelabels" title="Abbidung: Tabelle mit Wertelabels"  src="images/quantitative-33_3.gif" /><span class="imgcaption">Abbildung: Tabelle mit Wertelabels</span>
 
</span></p>
 
<hr />
 
<h2>2.3&nbsp;Gütekriterien quantitativer Untersuchungen</h2>
 
  
<p>Statistische Untersuchungen m&uuml;ssen wie jede andere Form wissenschaftlicher Bet&auml;tigung den <b>Kernanspr&uuml;chen[1]</b> der <b>Reliabilit&auml;t</b>, der <b>Validit&auml;t</b> und der <b>Objektivit&auml;t</b> gen&uuml;gen:</p>
+
==== '''Relative Häufigkeit''' ====
<h3><b>Reliabilit&auml;t:</b></h3>
 
<p>Unter  Reliabilit&auml;t oder  <b>Zuverl&auml;ssigkeit </b> versteht man die <b>formale Genauigkeit wissenschaftlicher Untersuchungen</b>. Darunter versteht man, dass die Untersuchungen mit einem H&ouml;chstma&szlig; an Anstrengungen verbunden werden, Messfehler jeder Art auszuschlie&szlig;en. Reliabilit&auml;t ist somit ein <b>Indikator</b> f&uuml;r die <b>Replizierbarkeit</b> (Wiederholbarkeit) der Ergebnisse. Fragen m&uuml;ssen z.B. so eindeutig formuliert sein, dass sie nicht h&ouml;chst unterschiedlich verstanden werden k&ouml;nnen.</p>
 
<h3><b>Validit&auml;t:</b></h3>
 
<p><b>Validit&auml;t</b> liegt vor, wenn wenn die gew&auml;hlten Indikatoren, Fragen und Antwortm&ouml;glichkieten wirklich und pr&auml;zise das messen, was gemessen werden soll.</p>
 
<p>Wenn man die Frage stellt, ob der Proband Schweinefleisch isst, so ist die Verneinung noch keineswegs ein Beweis daf&uuml;r, dass er Vegetarier ist, sondern nur, dass er eben Schweinefleisch aus verschiedenen Gr&uuml;nden nicht mag. W&auml;re die Frage nach dem Essen von Schweinefleisch die einzige auf Fleisch bezogene Frage im Fragebogen, so w&auml;re der Fragebogen nicht valide, um auf Vegetarismus zu schlie&szlig;en.</p>
 
<h3><b>Objektivit&auml;t:</b></h3>
 
<p>Die Objektivit&auml;t von <b>Messverfahren</b> und <b>Fragen</b> ist weitgehend gew&auml;hrleistet, <b>wenn die Wahl der Messenden, InterviewerInnen, Pr&uuml;ferInnen keinen Einfluss auf die Ergebnisse hat</b>.</p>
 
<p>Objektivit&auml;t w&auml;re z.B. zweifelhaft, wenn man verunsicherte M&auml;nner mit einem pers&ouml;nlich &uuml;berreichten Fragebogen zu ihrem Sexualleben einmal von ebenfalls verunsicherten M&auml;nnern und das andere Mal von jungen, attraktiven und selbstbewussten Frauen befragen lassen w&uuml;rde, wobei die Fragen von den InterviewerInnen pers&ouml;nlich gestellt und auch die Antworten von ihnen niedergeschrieben werden. Man w&uuml;rde mit hoher Wahrscheinlichkeit &auml;u&szlig;erst unterschiedliche Antworten erhalten. Genauso m&uuml;&szlig;te man mit Verf&auml;lschungen rechnen, wenn Firmenchefs oder -chefinnen ihre Angestellten zur Zufriedenheit mit ihrer Arbeitssituation befragen.</p>
 
<p>&nbsp;<b>G&uuml;tekriterien und andere Fehlerquellen</b> erfordern, dass statistische Untersuchungen stets mit &auml;u&szlig;erster Sorgfalt durchgef&uuml;hrt werden: von der Erhebung der Daten bis zu deren Analyse, dass also die richtigen Methoden angewandt werden, deren Wahl auf der Eigenart der Daten und ihrer Verteilungen beruht und dass die Interpretation keineswegs &uuml;ber die Aussagekraft der Daten hinausgeht.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.univie.ac.at/ksa/elearning/cp/ksamethoden/ksamethoden-76.html<br />
 
  
<hr />
+
Während die ''absolute Häufigkeit'' einer Ausprägung anzeigt, wie oft dieser Wert insgesamt im Datensatz erscheint, gibt die r. H. an, wie hoch sein Anteil verglichen mit der Gesamtzahl der gültigen Einträge ist. Siehe auch: '''Häufigkeitstabelle[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3]]]'''.
<h2>2.4&nbsp;Fehlerquellen bei statistischer Arbeit</h2>
 
  
<p>Statistik ist der Versuch, aus einem Ausschnitt der Realit&auml;t auf die Gesamtheit zu schlie&szlig;en. Dies bedeutet, dass unsere Aussagen &uuml;ber die (gesamte) Realit&auml;t immer, ohne Ausnahme, mit einem Irrtumsrisiko behaftet sind, da wir nicht &uuml;ber vollst&auml;ndige Daten zur <b>Grundgesamtheit[1]</b>  verf&uuml;gen. Statistisch sprechen wir dabei von <b>Fehlern der ersten und der zweiten Art.</b></p>
+
==== '''Reliabiltität''' (auch Zuverlässigkeit) ====
<p>W&auml;hrend <b>Fehler der ersten und der zweiten Art</b> zu nicht eliminarbaren Risiken der statistischen Arbeit geh&ouml;ren und auch bei sorgf&auml;ltiger Herangehensweise nicht ausgeschlossen, sondern nur ber&uuml;cksichtigt werden k&ouml;nnen (siehe <b>Irrtumswahrscheinlichkeit[2]</b>), h&auml;ngen <b>individuell bedingte Fehler</b> mit M&auml;ngeln bei der Datenaufnahme, -&uuml;bertragung oder Analyse zusammen. Wir k&ouml;nnten diese unter <b>fehler-</b> <i>bzw.</i> <b>mangelhafte Daten</b> zusammenfassen.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
[2] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
R. ist eines der drei ''Gütekriterien'' bei ''Messungen.'' Dieses fordert, dass die Messinstrumente bei einer Wiederholung der Messung bei gleichbleibenden Bedingungen das gleiche Ergebnis erbringen sollten.
<h2>2.4.1&nbsp;Fehler erster und zweiter Art</h2>
 
  
<p>Unter <b>Fehler der ersten bzw. zweiten Art</b> verstehen wir das systembedingte Problem, dass Hypothesen auch bei sorgf&auml;ltigem Vorgehen f&auml;lschlich best&auml;tigt oder verworfen werden.</p>
+
Neben der Validität (Gültigkeit) das zweite zentrale Qualitätskriterium bei Messungen. Meint, dass Messinstrumente bei wiederholter Messung unter gleichen Bedingungen auch das gleiche Ergebnis produzieren müssen. Siehe auch: '''Reliabilität (Wikipedia)[http://de.wikipedia.org/wiki/Reliabilit%C3%A4t &#91;4&#93;]'''.
<h3><b>Hypothesen am Beginn der Untersuchung</b></h3>
 
<p>Bei Forschungsprojekten formulieren wir Hypothesen, deren Richtigkeit wir mit geeigneten Forschungs- und Analysemethoden untersuchen wollen. Eine derartige <b>Ausgangshypothese</b> oder <b>Nullhypothese</b> (in Kurzform oft auch <b>H0</b> bezeichnet) k&ouml;nnte lauten: &rsquo;AfrikanerInnen werden am Arbeitsplatz weniger gesch&auml;tzt als ChinesInnen.&rsquo;.</p>
 
<p>Das Vorliegen einer Hypothese bedingt auch, dass es als Kontrast eine <b>alternative Hypothese</b> gibt (die wir bei der Erstellung des Konzepts als meist weniger wahrscheinlich einsch&auml;tzen), die <b>Alternativhypothese</b> (in Kurzform oft auch <b>H1 </b> genannt). In unserem Fall k&ouml;nnte diese lauten: &rsquo;AfrikanerInnen werden am Arbeitsmarkt nicht weniger gesch&auml;tzt als ChinesInnen.&rsquo;.</p>
 
<h3><b>Annahme oder Verwerfung von Hypothesen ist immer an Wahrscheinlichkeiten gebunden</b></h3>
 
<p>Bei statistischen Analysen versuchen wir, Ergebnisse auf hohem <b>Signifikanzniveau[1]</b>  zu erreichen. Wir sprechen davon, dass die gefundene Aussage mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, weniger als 1 %, weniger als 1 &permil;  zutrifft. Das bedeutet, dass unser Ergebnis, auf das wir so stolz sind, dennoch in 5 % aller F&auml;lle, in 1 % aller F&auml;lle etc. rein zuf&auml;llig entstehen kann und, bei einer gen&uuml;gend h&auml;ufigen Wiederholung, sogar muss.</p>
 
<p>Andererseits ist genauso denkbar, dass unser Ergebnis rein zuf&auml;llig nicht den starken Zusammenhang zeigt, der normalerweise erscheint. Wir k&ouml;nnten auch bei gro&szlig;er Sorgfalt bei der Auswahl der Stichprobe &uuml;berdurchschnittlich h&auml;ufig auf Personen treffen, welche AfrikanerInnen besonders positiv gegen&uuml;ber stehen.</p>
 
<h3><b>Fehlerhafte Verwerfung bzw. Annahme von Hypothesen m&ouml;glich</b></h3>
 
<p>Es k&ouml;nnen also zwei verschiedene Fehler auftreten:</p>
 
<p>A. die Nullhypothese wird verworfen, obwohl sie richtig ist. Dies nennt man auch <b>Fehler der ersten Art</b> oder <b>Alpha-Fehler</b><i>;</i></p>
 
<p>B. die Nullhypothese wird angenommen, obwohl sie falsch ist. Dies bezeichnet man auch als <b>Fehler der zweiten Art</b> oder <b>Beta-Fehler</b><i>.</i></p>
 
<h3><b>Mit der Zahl der statistischen Berechnungen steigt die Wahrscheinlichkeit von Fehlern der 1. oder 2. Art</b></h3>
 
<p>Das Risiko, einem der beiden Fehler aufzusitzen, steigt nat&uuml;rlich mit der H&ouml;he der <b>Irrtumswahrscheinlichkeit</b> sowie mit der Zahl der durchgef&uuml;hrten Analysen. Moderne PCs und Statistik-Software laden geradezu dazu ein, in kurzer Zeit tausende von Hypothesen zu &uuml;berpr&uuml;fen. Wenn wir 100 Variable miteinander kreuzen, erhalten wir (100x99)/2 Vergleiche, d.s. 4950 einzelne Untersuchungen auf signifikante Zusammenh&auml;nge. Wenn wir diese mit Chi-Quadrat-Tests auf dem 5 %-Irrtumsniveau untersuchen, erhalten wir im Normalfall 247,5 falsche Zusammenh&auml;nge (4950*0,05). Wir w&uuml;rden also in 247 F&auml;llen einen Zusammenhang annehmen, obwohl er nicht vorhanden ist (Alpha-Fehler).</p>
 
<h3><b>Kontrolle durch qualitative &Uuml;berlegungen erforderlich</b></h3>
 
<p>Derartige Massenvergleiche zeigen auch deutlich, dass <b>statistische Berechnungen nicht losgel&ouml;st von qualitativen &Uuml;berlegungen stattfinden d&uuml;rfen</b>. Bei statistischen Untersuchungen &uuml;berraschend aufgetauchte Zusammenh&auml;nge m&uuml;ssen auch eine gewisse Stabilit&auml;t und Systemkoh&auml;renz aufweisen, um akzeptiert werden zu k&ouml;nnen. D.h. sie m&uuml;ssen in einem gewissen Rahmen reproduzierbar sein und sie sollten nicht im Widerspruch zu offensichtlichen Fakten sein.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
==== '''Repräsentativität''' ====
<h2>2.4.2&nbsp;Fehlerhafte oder mangelnde Daten</h2>
 
  
<p>Fehler und M&auml;ngel k&ouml;nnen bei einer Reihe von Vorg&auml;ngen bei statistisch unterst&uuml;tzten Forschungsprojekten erfolgen bzw. auftreten, wie z.B.:</p>
+
Unter R. versteht man, dass bei der Auswahl der Elemente der Stichprobe die Zusammensetzung der Grundpopulation nachgebildet wird. Wenn z.B. 2/3 der Zuwanderer aus Afrika in Österreich männlich sind, sollten dementsprechend auch 2/3 der Befragten in der Stichprobe männlich sein, will man den Bedingungen der Repräsentativität genügen.
<p>A. <b>Operationalisierungsfehler:</b> bei der <b>Operationalisierung[1]</b>  wurden verzerrende Messmethoden festgelegt;</p>
 
<p>B. <b>Codierfehler:</b> bei der <b>Codierung[2]</b>  wurden, z.B. bei der &Uuml;bertragung von Text-Daten in numerische Daten f&uuml;r interne Berechnungen von SPSS, Fehler begangen (z.B. die Vergabe des Zahlenwerts <i>4</i> in der Notenskala f&uuml;r &rsquo;Befriedigend&rsquo;);</p>
 
<p>C. <b>Interviewerfehler:</b> bei der Datenaufnahme wurden fehlerhafte Werte eingetragen (z.B. eine Kinderzahl von 71 statt 7);</p>
 
<p>D. <b>Widerspr&uuml;chliche Datenlage:</b> die Versuchspersonen oder die Datenquellen lieferten widerspr&uuml;chliche Informationen, die sich in den Datenbl&auml;ttern wiederfinden;</p>
 
<p>E. <b>Antwortverweigerung:</b> verschiedene Fragen wurden von Versuchspersonen nicht beantwortet oder waren durch die Datenlage nicht erhebbar;</p>
 
<p>F. <b>Eingabefehler:</b> Datens&auml;tze wurden doppelt eingegeben;</p>
 
<p>G. <b>Analysefehler:</b> f&uuml;r die Analyse der Daten wurden die <b>falschen Methoden[3]</b>  verwendet;</p>
 
<p>H. <b>Interpretationsfehler:</b> die Ergebnisse wurden richtig gerechnet, aber falsch interpretiert;</p>
 
<p>I. <b>Grafiken[4]</b>  und Tabellen werden falsch oder ungen&uuml;gend mit Zusatzinformationen versehen, was sowohl zu mangelndem Verst&auml;ndnis wie auch zu Nicht&uuml;berpr&uuml;fbarkeit der Ergebnisse f&uuml;hren kann.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.2.1<br />
 
[2] Siehe Kapitel 2.2.3.2<br />
 
[3] Siehe Kapitel 3.1<br />
 
[4] Siehe Kapitel 3.6.3<br />
 
  
<hr />
+
==== '''Robust''' ====
<h2>2.4.2.1&nbsp;Eingabefehler</h2>
 
  
<p>Meist werden Umfrageergebnisse zuerst handschriftlich aufgezeichnet. Danach werden die Daten in den PC &uuml;bertragen, was mehrere potentielle Fehlerquellen ber&uuml;hrt. Eine wenig leserliche Schrift kann zu Irrt&uuml;mern bei der Eintragung in die Datenmatrix f&uuml;hren, genauso &rsquo;h&auml;ngengebliebene Finger&rsquo; auf einer kleinen Tastatur, aber nat&uuml;rlich auch bewusste Falschangaben.</p>
+
Bezeichnung für Verfahren, welche bezüglich vorhandener Ausreißer kaum empfindlich sind, wie z.B. der ''Median.''
<p>SPSS und Excel bieten verschiedene M&ouml;glichkeiten, die Eingabe von falschen Daten zu erschweren:</p>
 
<p>A. durch die <b>Wahl geeigneter Datentypen</b></p>
 
<p>B. durch die &Uuml;berpr&uuml;fung, ob sich der eingetragene Wert innerhalb vorgegebener Grenzen befindet = <b>G&uuml;ltigkeitspr&uuml;fung</b>.</p>
 
<hr />
 
<h2>2.4.2.1.1&nbsp;Wahl geeigneter Datentypen mit SPSS</h2>
 
  
<p><b>Verringerung des Risikos durch Wahl geeigneter Datentypen</b></p>
+
==== '''Rohdaten''' ====
<p>Besonders wichtig ist die richtige Definition des Datentyps (-&gt; <i>VARIABLENANSICHT - DATENTYP</i>). In einem <b>Stringfeld</b> (oder Textfeld) k&ouml;nnen beliebige Zeichen stehen, in einem numerischen Feld nur Zahlen. Das bedeutet, dass durch Verschreiben keinerlei Buchstaben in ein numerisches Feld &rsquo;rutschen&rsquo; k&ouml;nnen. Der Datentyp kann jedoch noch wesentlich enger gefasst werden. Wenn ich im Feld <i>Breite</i> die Zahl 4 eintrage, kann ich z.B. bei numerischen Daten ausschlie&szlig;en, dass Jahreszahlen fehlerhaft durch Vertippen mit f&uuml;nf Ziffern eingegeben werden. Gibt man bei Dezimalstellen <i>0 </i> ein, sind nur ganze Zahlen m&ouml;glich.&nbsp;</p>
 
<span class="imgbox imgcenter" style="width:426px; .word-wrap:break-word; "><img height="229" border="0" align="bottom" width="426" alt="Abbildung: Definition des Datentyps" title="Abbildung: Definition des Datentyps"  src="images/quantitative-39_1.jpg" /><span class="imgcaption">Abbildung: Definition des Datentyps um Fehleingaben zu verringern</span>
 
</span>
 
<hr />
 
<h2>2.4.2.1.2&nbsp;Gültigkeitsprüfung der Daten mit Excel</h2>
 
  
<p>Unter <b>G&uuml;ltigkeitspr&uuml;fung</b> von Daten versteht man die automatische Pr&uuml;fung, ob aufgenommene Auspr&auml;gungen sich innerhalb eines vorgegebenen Bereichs befinden. Jeder au&szlig;erhalb dieses Bereichs liegende Wert wird bei der Eingabe mit einer <b>Fehlermeldung</b> abgewiesen.&nbsp;</p>
+
statistisch nicht veränderte Untersuchungsergebnisse, welche die ursprüngliche Merkmalsausprägung anzeigen (z.B. die Zahl der Punkte bei einem Eignungstest statt deren Umsetzung in Noten).
<p>F&uuml;r die meisten Variablen lassen sich mit geringer Sachkenntnis <b>Ober- und Untergrenzen definieren</b>, welche alle real auftretenden Auspr&auml;gungen umschlie&szlig;en. So k&ouml;nnte man bei der Aufnahme der K&ouml;rpergr&ouml;&szlig;e von Erwachsenen eine Untergrenze von 80 cm und eine Obergrenze von 3 m annehmen; beim Lebensalter bei Erwachsenen eine Untergrenze von 18 und eine Obergrenze von 130; bei Schulnoten eine Untergrenze von 1 und eine Obergrenze von 5; beim Einkommen von Studierenden eine Untergrenze von 0 und eine Obergrenze von 4000 Euro.</p>
 
<p>Mit Excel geschieht dies folgenderma&szlig;en:</p>
 
<p>A. Man markiert die Spalte der Auspr&auml;gungen</p>
 
<p>B. In der Men&uuml;leiste auf <i>Daten</i> und danach auf <i>G&uuml;ltigkeit</i> klicken&nbsp;</p>
 
<span class="imgbox imgcenter" style="width:405px; .word-wrap:break-word; "><img height="342" border="0" align="bottom" width="405" alt="Abbildung: Gültigkeitsprüfung mit SPSS" title="Abbildung: Gültigkeitsprüfung mit SPSS"  src="images/quantitative-40_1.jpg" /><span class="imgcaption">Abbildung: Definition des G&uuml;ltigkeitsbereiches mit SPSS</span>
 
</span>
 
<p>&nbsp;C. Nun unter <i>Zulassen</i> Angabe des Datentyps machen. Wenn z.B. die Zahl der Kinder eingetragen werden sollte, w&uuml;rden wir hier <i>Ganze Zahl</i> w&auml;hlen. W&auml;hlt man <i>Liste</i> aus, gelten alle Werte als g&uuml;ltig, welche sich in einer spezifischen Datei befinden (der <i>Liste</i>).</p>
 
<p>D. Unter <i>Daten</i> gibt man die Richtung der Auspr&auml;gungen an, also z.B. <i>gr&ouml;&szlig;er als, zwischen</i>, <i>ungleich</i> etc. In unserem Fall der Kinderzahl w&auml;hlen wir <i>zwischen</i> (auch <i>gr&ouml;&szlig;er oder gleich</i> w&auml;re denkbar).</p>
 
<p>E. Nun geben wir als Minimum-Wert<i> </i> die untere Begrenzung ein, in unserem Falle <i>0</i>, da weniger Kinder nicht m&ouml;glich sind und als Maximum in unserem Falle die Zahl 20 (kaum denkbar, dass jemand in Industriel&auml;ndern eine h&ouml;here Kinderzahl aufweist).</p>
 
<p>F. Unter <i>Eingabemeldung</i> k&ouml;nnte man eine Meldung ausgeben lassen, welche bei Eintr&auml;gen im Feld automatisch auf die Grenzen hinweist</p>
 
<p>G. Wichtiger ist es, unter <i>Fehlermeldung</i> anzugeben, warum ein eingetragener Wert als ung&uuml;ltig abgelehnt wird. Dazu w&auml;hlen wir unter <i>Typ</i> eine bestimmte Signalform, in unserem Falle <i>Warnung;</i> danach geben wir unter <i>Titel</i> eine aussagekr&auml;ftige Kurzmeldung und unter <i>Fehlermeldung</i> ausf&uuml;hrlichere Erkl&auml;rungen dazu ein.</p>
 
<p>Falls wir nun in Excel in der betreffenden Spalte f&uuml;r Kinderzahlen die Auspr&auml;gung <i>22</i> eingeben, erhalten wir folgende Warnmeldung:&nbsp;</p>
 
<span class="imgbox imgcenter" style="width:387px; .word-wrap:break-word; "><img height="122" border="0" align="bottom" width="387" alt="Abbildung: Ungültiger Wert" title="Abbildung: Ungültiger Wert"  src="images/quantitative-40_2.jpg" /><span class="imgcaption">Abbildung: Fehlermeldung bei Eingabe eines ung&uuml;ltigen Wertes</span>
 
</span>
 
<hr />
 
<h2>2.4.2.2&nbsp;Doppelte Datensätze</h2>
 
  
<p>Mitunter kann es geschehen, dass der gleiche Datensatz fehlerhafterweise doppelt eingegeben wird.</p>
 
<p>Doppelt eingegebene Datens&auml;tze kann man in SPSS mit folgender Funktion finden:</p>
 
<p>Klicken Sie auf DATEN - DOPPELTE F&Auml;LLE ERMITTELN. Sie sehen folgendes Fenster:&nbsp;&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="505" border="0" align="bottom" width="500" alt="Abbildung: Doppelte Datensäzte" title="Abbildung: Doppelte Datensäzte"  src="images/quantitative-41_1.jpg" /><span class="imgcaption">Abbildung: Doppelt eingegebene Datens&auml;tze finden mit SPSS</span>
 
</span></p>
 
<p>Die wesentlichen Eintr&auml;ge hier sind:</p>
 
<p>A. Geben Sie unter <i>&Uuml;bereinstimmende F&auml;lle definieren durch </i> die Variablen an, welche zur Identifikation von Doppelg&auml;ngern dienen. Das k&ouml;nnen normalerweise nur Variable sein, bei welchen Eintr&auml;ge eindeutig sein sollen (nat&uuml;rlich ist Eindeutigkeit auch durch eine Kombination mehrerer Variable erreichbar).</p>
 
<p>B. Sie k&ouml;nnen unter <i>Innerhalb der &uuml;bereinstimmenden Gruppen sortieren nach:</i> noch eine Variable angeben, nach der sortiert werden soll.</p>
 
<p>Haben Sie somit doppelte Eintr&auml;ge gefunden, k&ouml;nnen Sie Fall f&uuml;r Fall entscheiden, wie Sie damit umgehen.</p>
 
<hr />
 
<h2>2.4.2.3&nbsp;Fehlende Einträge</h2>
 
  
<h3><b>Was tun, wenn Eintr&auml;ge fehlen?</b></h3>
 
<p>Nur bei den wenigsten Umfragen werden alle Fragen von allen Befragten beantwortet. Besonders tabuisierte Fragen wie vielleicht nach Bereichen der Sexualit&auml;t, dem Einkommen, den politischen Neigungen werden oft nicht oder nur neutral beantwortet. Es stellt sich daher die Frage, ob und wie man die fehlenden Eintr&auml;ge interpretieren kann. Ein weiser Spruch der Kommunikationsforschung lautet: &rsquo;<b>Man kann nicht nicht kommunizieren&rsquo;</b> (Paul Watzlawick)<b>.</b> Das bedeutet, dass vor allem bei tabusierten Fragen auch die Nichtbeantwortung von Fragen eine Information darstellt. Es k&ouml;nnte dementsprechend sein, dass  bei manchen Fragen eine Nichtbeantwortung bedeutet: &quot;Ich m&ouml;chte nicht, dass man wei&szlig;, wie ich &uuml;ber diesen Bereich denke.&quot;</p>
 
<h3><b>Beispiel: geringe Bekenntnisquote von FP&Ouml;- W&auml;hlerInnen</b></h3>
 
<p>Viele Jahre lang hatten besonders FP&Ouml;-W&auml;hlerInnen w&auml;hrend der Haider-Jahre gro&szlig;e Angst, sich in Umfragen vor Wahlen zu ihrer Partei zu bekennen. Die Wahlergebnisse fielen daher f&uuml;r die FP&Ouml; durch 1,5 Jahrzehnte stets wesentlich besser aus als die Umfrageergebnisse, was u.a. dazu f&uuml;hrte, dass ihre Bekennerzahlen in Umfragen von den Meinungsforschungsinstituten einen substantiellen Zuschlag bekamen, um sich der tats&auml;chlichen Unterst&uuml;tzung dieser Partei anzun&auml;hern.</p>
 
<h3><b>Nichtbeantwortung auch durch Fehler m&ouml;glich</b></h3>
 
<p>In anderen, neutralen, Bereichen wird eine Nichtbeantwortung wieder eher als &Uuml;bersehen oder als Ratlosigkeit (die Frage ist vielleicht unverst&auml;ndlich formuliert) gedeutet werden. Es g&auml;be kaum einen denkbaren Grund, die Frage nach seinem Lieblingsobst nicht zu beantworten.</p>
 
<h3><b>Je nach Tabuisierungsgrad der Frage sind fehlende Eintr&auml;ge unterschiedlich aussagekr&auml;ftig</b></h3>
 
<p>Je nach Sachlage kann daher eine Nichtbeantwortung eine Art von Information oder einen Mangel darstellen. Im ersten Fall k&ouml;nnte es sein, dass z.B. besonders Personen, welche eine extrem abwehrende Haltung gegen&uuml;ber MigrantInnen aufweisen (wie aus einer anderen Fragestellung erkennbar), besonders zur Nichtbeantwortung der Frage &rsquo;Welche Partei w&uuml;rden Sie w&auml;hlen, wenn morgen Wahltag w&auml;re?&quot;. Das hei&szlig;t, dass wir uns bei auffallend h&auml;ufiger Nichtbeantwortung von bestimmten Fragen die Frage stellen sollten, ob es bei den Nichtbeantwortenden gewisse Gemeinsamkeiten gibt und damit auch spezifische Motive der Nichtbeantwortung.</p>
 
<p>Wir m&uuml;ssen also bei der Behandlung der beiden Arten der Nichtbeantwortung differenzieren: im Falle der informationstragenden Nichtbeantwortung sollte der Antwort dennoch ein gewisser Wert beigemessen werden. Im Falle der informationsleeren Nichtbeantwortung sollten wir die Nichtantwort einfach aus der Gesamtzahl der m&ouml;glichen Antworten ausschlie&szlig;en und dadurch die Stichprobengr&ouml;&szlig;e f&uuml;r diese Frage verkleinern.</p>
 
<p>&nbsp;</p>
 
<hr />
 
<h2>2.4.2.3.1&nbsp;Behandlung fehlender Daten mit SPSS</h2>
 
  
<p>SPSS erlaubt, leere Felder automatisch mit bestimmten Eintr&auml;gen auszuf&uuml;llen oder dieselben in keinerlei Berechnungen einflie&szlig;en zu lassen.</p>
+
'''Verweise:'''<br />
<p>SPSS unterscheidet zwischen <i>Systembedingt fehlenden Werten</i> und <i>Benutzerdefinierten fehlenden Werten.</i> Werden z.B. Variable als numerisch definiert, werden leere Felder automatisch mit einem Komma in der <b>Datenmatrix[1]</b>  markiert (<i>Systembedingt</i>). Bei Textfeldern muss ein fehlender Wert spezifisch deklariert werden (<i>Benutzerdefinierter fehlender Wert):</i></p>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3 Die Korrelation|[1] Siehe Kapitel 3.5.3]]<br />
<p><span class="imgbox imgcenter" style="width:359px; .word-wrap:break-word; "><img height="334" border="0" align="bottom" width="359" src="images/quantitative-43_1.jpg" alt="Abbildung: Fehlende Werte" title="Abbildung: Fehlende Werte"  /><span class="imgcaption">Abbildung: Definition von fehlenden Werten</span>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.4 Regression|[2] Siehe Kapitel 3.5.4]]<br />
</span></p>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.2 Häufigkeitstabelle|[3] Siehe Kapitel 3.2.2]]<br />
<p>&nbsp;Man kann hier genau definieren, was als <i>fehlender Wert</i> gelten soll. Soll ein leeres Feld als solcher gelten, dr&uuml;ckt man im ersten Feld von <i>Einzelne fehlende Werte</i> einmal auf die Leertaste. Man erh&auml;lt hier in einem Beispiel die folgende Ausgabe:&nbsp;</p>
+
[http://de.wikipedia.org/wiki/Reliabilit%C3%A4t &#91;4&#93; http://de.wikipedia.org/wiki/Reliabilit%C3%A4t]<br />
<p><span class="imgbox imgcenter" style="width:456px; .word-wrap:break-word; "><img height="313" border="0" align="bottom" width="456" src="images/quantitative-43_2.jpg" alt="Tabelle: Eintragung fehlender Werte" title="Tabelle: Eintragung fehlender Werte"  /><span class="imgcaption">Tabelle: Eintragung von definierten fehlenden Werten</span>
 
</span></p>
 
<p>&nbsp;Man erkennt, dass in der vorletzten Zeile 2 fehlende Werte eingetragen wurden. Auch die Gr&ouml;&szlig;e der tats&auml;chlich ber&uuml;cksichtigten Stichprobe hat sich um 2 verringert (siehe drittletzte Zeile).&nbsp;</p>
 
<p>Falls man jedoch im Fenster <i>Fehlende Werte definieren</i> die Alternative <i>Keine fehlenden Werte </i> ausw&auml;hlt, erhalten Sie folgendes Ergebnis:</p>
 
<p><span class="imgbox imgcenter" style="width:446px; .word-wrap:break-word; "><img height="298" border="0" align="bottom" width="446" src="images/quantitative-43_3.jpg" alt="Tabelle: Keine fehlenden Werte" title="Tabelle: Keine fehlenden Werte"  /><span class="imgcaption">Tabelle: Option &quot;Keine fehlenden Werte&quot; gew&auml;hlt</span>
 
</span></p>
 
<p>&nbsp;Die fehlenden Eintr&auml;ge in der vorletzten Zeile sind verschwunden, stattdessen findet sich in der ersten Zeile der ersten Spalte eine fehlende Beschreibung, neben der die H&auml;ufigkeit 2 steht. Die fehlenden Werte flie&szlig;en hier voll in die Berechnung ein. Eine derartige leere Bezeichnung ist nat&uuml;rlich wenig anschaulich. Man muss sie daher f&uuml;r Bildschirm- und Printausgabe mit einer informativeren Beschreibung versehen. Dazu gehen wir wieder zur <i>Variablenansicht</i> und w&auml;hlen in dieser <i>(Variablen-)Labels</i> aus.</p>
 
<p><span class="imgbox imgcenter" style="width:404px; .word-wrap:break-word; "><img height="214" border="0" align="bottom" width="404" src="images/quantitative-43_4.jpg" alt="Abbildung: Wertelabel definieren" title="Abbildung: Wertelabel definieren"  /><span class="imgcaption">Abbildung: Definition von Wert und Wertelabel</span>
 
</span></p>
 
<p>&nbsp;In <i>Wert</i> f&uuml;gen wir wieder eine Bet&auml;tigung der Pausetaste ein, unter <i>Wertelabel </i> z.B. &rsquo;nicht beantwortet&rsquo;. Leerfelder werden dadurch deutlich informativer dargestellt, s.u.:</p>
 
<p><span class="imgbox imgcenter" style="width:499px; .word-wrap:break-word; "><img height="315" border="0" align="bottom" width="499" src="images/quantitative-43_5.jpg" alt="Tabelle: Ausgabe des definierten Wertelabels" title="Tabelle: Ausgabe des definierten Wertelabels"  /><span class="imgcaption">Tabelle: Ausgabe des definierten Wertelabels</span>
 
</span></p>
 
<p>&nbsp;Nun tauchen in der ersten Zeile die leeren Antworten mit einer klaren und verst&auml;ndlichen Beschreibung auf.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.2.3.1<br />
 
  
<hr />
 
<h2>3&nbsp;Ausgewählte statistische Grundlagen und Analysemethoden</h2>
 
  
<p>In den folgenden Abschnitten werden eine Reihe von Methoden der <b>deskriptiven[1]</b>, teilweise auch der einfachen <b>analytischen[2]</b>  Statistik sowie auch deren Anwendungsvoraussetzungen und Rahmenbedingungen vorgestellt.</p>
 
<p>Wir ben&ouml;tigen ausreichendes Wissen &uuml;ber die Art, <b>Skalierung[3]</b>  und <b>Verteilung[4]</b>  der Daten, um die daf&uuml;r geeigneten statistischen Beschreibungs- und Analysemethoden w&auml;hlen zu k&ouml;nnen. Dementsprechend wird dieses notwendige Hintergrundwissen intensiver diskutiert. Danach werden <b>grundlegende deskriptive und analytische statistische Methoden</b> dargestellt, wobei der Schwerpunkt auf ersteren liegt. Abschlie&szlig;end wird auf die grafische Darbietung der Ergebnisse in Form von <b>Diagrammen</b> eingegangen.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.2.1<br />
 
[2] Siehe Kapitel 1.2.2<br />
 
[3] Siehe Kapitel 3.1.2<br />
 
[4] Siehe Kapitel 3.1.3<br />
 
  
<hr />
+
= 5.7 S-T =
<h2>3.1&nbsp;Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden</h2>
 
  
<h3><b>Analysemethoden</b> sind <b>abh&auml;ngig von Datenart, -auspr&auml;gung, -anzahl und -verteilung:</b></h3>
+
==== '''Säulendiagramm''' ====
<p>Die Statistik bietet eine Vielzahl von Verfahren, mit deren Hilfe man Aufschl&uuml;sse &uuml;ber Sachverhalte gewinnen kann. Die meisten Verfahren k&ouml;nnen jedoch nur verwendet werden, wenn bestimmte Bedingungen erf&uuml;llt sind. Die Auswahl der m&ouml;glichen Verfahren h&auml;ngt besonders ab von</p>
 
<ul>
 
    <li>der Art der Daten und den damit zusammenh&auml;ngenden <b>Skalenniveaus[1]</b></li>
 
    <li>der <b>Verteilung[2]</b>  <b>der Auspr&auml;gungen</b> einer Variable</li>
 
    <li>der <b>Gr&ouml;&szlig;e</b> der <b>Stichprobe[3]</b></li>
 
    <li>dem (Nicht-)Auftreten von sogenannten &rsquo;<b>Ausrei&szlig;ern</b>&rsquo; oder <b>Extremdaten</b></li>
 
</ul>
 
<p>Falls Verfahren au&szlig;erhalb ihrer Anwendungsbedingungen verwendet werden, ist die Wahrscheinlichkeit gro&szlig;, dass sinnleere oder falsche Aussagen erhalten werden.</p>
 
<h3><b>K&ouml;rpergr&ouml;&szlig;en und Lieblingsobst</b></h3>
 
<p>Wenn wir in einer Schulklasse die durchschnittliche K&ouml;rpergr&ouml;&szlig;e der Sch&uuml;lerInnen ermitteln wollen, w&auml;re das <b>arithmetische Mittel[4]</b>  eine durchaus vern&uuml;nftige Kennzahl. Wir z&auml;hlen dazu alle K&ouml;rpergr&ouml;&szlig;en zusammen und dividieren die Summe durch die Anzahl der Klassensch&uuml;lerInnen. Wenn wir hingegen ermitteln m&ouml;chten, was diese Schulklasse als Lieblingsobst bevorzugt, w&auml;re das <b>arithmetische Mittel</b> Schwachsinn. Wir k&auml;men dann zu wenig sinnvollen Aussagen, dass die Klasse 0,17 &Auml;pfel, 0,12 Orangen, 0,11 Bananen etc. als Lieblingsobst aufweist.</p>
 
<p>Dass im ersten Fall das <b>arithmetische Mittel</b> verwendet werden konnte, im zweiten Falle jedoch nicht, h&auml;ngt mit den unterschiedlichen Skalenniveaus zusammen. So geh&ouml;rt die K&ouml;rpergr&ouml;&szlig;e zur <b>Proportionalskala[5]</b>, w&auml;hrend das Lieblingsobst in eine <b>Nominalskala[6]</b>  eingeordnet wird.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2<br />
 
[2] Siehe Kapitel 3.1.3<br />
 
[3] Siehe Kapitel 2.1.1<br />
 
[4] Siehe Kapitel 3.3.2<br />
 
[5] Siehe Kapitel 3.1.2.5<br />
 
[6] Siehe Kapitel 3.1.2.2<br />
 
  
<hr />
+
Siehe ''Balkendiagramm''.
<h2>3.1.1&nbsp;Arten von Messwerten (Daten)</h2>
 
  
<p>Statistisch unterscheidet man Daten</p>
+
==== '''Schichtung''' ====
<ul>
 
    <li>in welcher Weise die Umsetzung in numerische Werte zur sinnvollen Ordnung und weiteren m&ouml;glichen Erkenntnissen f&uuml;hrt: <b>metrische und nichtmetrische Variable</b>;</li>
 
    <li>&uuml;ber die Abstufungen ihrer Auspr&auml;gungen: <b>stetige und diskrete Variable</b></li>
 
</ul>
 
<hr />
 
<h2>3.1.1.1&nbsp;Metrische und nichtmetrische Variablen</h2>
 
  
<h3><b>Metrische und nichtmetrische Variablen</b></h3>
+
Unter Sch. versteht man eine Methode bei der Auswahl der Stichprobe. Die Grundpopulation wird in '''Schichten (Wikipedia)[http://de.wikipedia.org/wiki/Soziale_Schichtung &#91;1&#93;]''' zerlegt (in dieser gibt es z.B. 40 % Männer und 60 % Frauen; in dieser gibt es 26 % unter 25, 38 % zwischen 26- 50 und 36 % darüber). In der Stichprobe versucht man das Verhältnis dieser Schichten der Grundpopulation nachzubilden.
<p>Prinzipiell k&ouml;nnen wir zwischen <b>metrischen</b> und <b>nichtmetrischen </b><b>Variablen</b> unterscheiden. Als <b>metrische</b> Merkmale (auch <b>quantitative</b> genannt) bezeichnet man <b>Merkmale</b>, deren <b>Auspr&auml;gungen</b> sich mittels Zahlen darstellen lassen, wobei auch <b>Rangunterschiede und Abstand sinnvoll interpretiert</b> werden k&ouml;nnen. Als <b>nichtmetrische Variablen</b> werden dementsprechend alle anderen bezeichnet.</p>
 
<p><b>Beispiele:</b><br />
 
Wir k&ouml;nnen somit z.B. K&ouml;rpergr&ouml;&szlig;en sinnvoll reihen (von klein nach gro&szlig; mit beliebig feinen Abstufungen) und auch Gr&ouml;&szlig;enunterschiede vern&uuml;nftig interpretieren. Fragen wir hingegen nach dem Lieblingsobst, wird die Reihung der Ergebnisse willk&uuml;rlich sein und meist alphabetisch erfolgen. Theoretisch k&ouml;nnte man jedem Obst einen Zahlenwert zuweisen, dieser wird jedoch nichts &uuml;ber den dahinterliegenden Wert aussagen, also zuf&auml;llig mit diesem verbunden sein. R&auml;nge, wie z.B. der Beliebteste, der Zweitbeliebteste, der Drittbeliebteste usw. lassen sich zwar sinnvoll reihen, ihre Abst&auml;nde lassen sich aber nicht interpretieren. D.h. wir k&ouml;nnen nicht sagen, dass der Drittbeliebteste gegen&uuml;ber dem Viertbeliebtesten den gleichen Abstand hat wie der Beliebteste gegen&uuml;ber dem Zweitbeliebtesten. <b>Daher sind sowohl Nominaldaten (wie das erw&auml;hnte Obst) wie auch Ordinaldaten nichtmetrisch.</b></p>
 
<hr />
 
<h2>3.1.1.2&nbsp;Stetige und diskrete Variablen</h2>
 
  
<p><b>Stetige und diskrete Variablen</b></p>
+
==== '''Schließende Statistik''' ====
<p>Metrische Daten k&ouml;nnen ebenfalls wieder unterschieden werden, n&auml;mlich in</p>
 
<ul>
 
    <li><b>stetige oder kontinuierliche, wenn sie jeden beliebigen Wert eines bestimmten Intervalls annehmen k&ouml;nnen</b> (z.B. K&ouml;rpergr&ouml;&szlig;e 175,33 cm, Temperatur); und</li>
 
    <li><b>diskrete, wenn sie nur endlich viele Werte annehmen k&ouml;nnen</b> (z.B. Augenzahl beim W&uuml;rfeln, Anzahl der Kinder)</li>
 
</ul>
 
<hr />
 
<h2>3.1.2&nbsp;Skalenniveaus</h2>
 
  
<p><b>Skalenniveaus</b> (von <i>scala</i> ital. &rsquo;Treppe&rsquo;) sind eindimensionale Folgen von Positionen, die unterschiedliche Auspr&auml;gungen eines Merkmals anzeigen.</p>
+
s. ''Analytische Statistik''
<p>Jede Variable kann einer bestimmten Form von <b>Skalierung</b> zugeordnet werden. Nach der M&ouml;glichkeit, die Auspr&auml;gungen sinnvoll zu reihen und bestimmte mathematische Operationen durchzuf&uuml;hren, unterscheidet man zwischen vier verschiedenen Skalierungsniveaus: <b>Nominalskalierung, Ordinalskalierung, Intervallskalierung</b> und <b>Proportionalskalierung</b>.</p>
 
<p>Je nach Skalierungsniveau k&ouml;nnen sehr viele Analyseverfahren (wie bei der <b>Proportionalskalierung</b>) oder sehr wenige Verfahren (wie bei der <b>Nominalskalierung</b>) zur Auswertung eingesetzt werden. Daher ist die Wahl der Art der Daten und <b>Skalenniveaus</b> bereits bei der Forschungskonzeption zu ber&uuml;cksichtigen.</p>
 
<hr />
 
<h2>3.1.2.1&nbsp;Skalierungsniveaus bildlich erklärt</h2>
 
  
<p>Die technische Definition der <b>Skalierungsniveaus</b> hat den Nachteil, dass viele Menschen sich unter ihnen nichts vorstellen k&ouml;nnen. Machen wir es etwas anschaulicher und auch mit Treppen.</p>
+
==== '''Selektion''' ====
<p>Stellen Sie sich vor, Tischler sehr unterschiedlicher Begabung und Erfahrung w&uuml;rden Stufen f&uuml;r eine Treppe bauen.</p>
 
<h3><b>Nominalskala:</b></h3>
 
<p>Wir h&auml;tten zuerst den Amateurtischler, welcher extrem ungleichf&ouml;rmige Stufen baut. Die eine Stufe ist links viel h&ouml;her als rechts, die andere hinten h&ouml;her als vorne. Keine einzige ist so gleichf&ouml;rmig, dass sie &uuml;berall h&ouml;her ist als alle anderen, keine einzige ist so gleichf&ouml;rmig, dass sie &uuml;berall niedriger ist als alle anderen. Mit anderen Worten: wir k&ouml;nnen die Stufen beliebig hintereinander reihen. Wir finden keinen eindeutigen logischen und zwingenden Ansatz zur Reihung. Nehmen wir die H&ouml;he links, w&uuml;rden wir die Stufe A vor der Stufe B vor der Stufe C reihen; nehmen wir die H&ouml;he rechts, die Stufe B vor der Stufe C vor der Stufe A; nehmen wir die H&ouml;he vorne etc.</p>
 
<p><b>Eine derartige Treppe, die sich beliebig zusammensetzen l&auml;sst und eigentlich gar keine Treppe ist</b>, weil man auf ihr nicht h&ouml;her steigen kann, w&uuml;rde der <b>Nominalskala</b> entsprechen: Was besitzt man: &Auml;pfel, Birnen, ein Auto, einen Hund etc.</p>
 
<h3><b>Ordinalskala:</b></h3>
 
<p>Der Tischler wird nun etwas geschickter. Er schafft es, die Stufen jeweils unterschiedlich hoch zu machen und zwar &uuml;berall. Die Stufe B ist 1,2x so hoch wie die Stufe A, die Stufe C doppelt so hoch wie die Stufe B, die Stufe D 3x so hoch wie die Stufe C, die Stufe E 1,3x so hoch wie die Stufe D. <b>Es ist nicht vorauszusagen, um wieviel die n&auml;chsth&ouml;here Stufe h&ouml;her sein wird, aber man wei&szlig;, sie ist h&ouml;her</b>. Es ist ein beschwerlicher Aufstieg, aber es ist ein Aufstieg. Das w&uuml;rde einer <b>Ordinalskala</b> entsprechen. Ein Beispiel daf&uuml;r w&auml;re eine Notenskala. Man wei&szlig; zwar nicht, um wieviel besser ein Sch&uuml;ler mit einem Sehr Gut als ein Sch&uuml;ler mit einem Gut war, aber dass es einen Unterschied gegeben hat, erscheint klar zu sein (au&szlig;er der Lehrer war bekannt subjektiv, was vorkommen soll).</p>
 
<h3><b>Intervallskala:</b></h3>
 
<p>Der Tischler wird noch geschickter. er schafft es sogar alle Stufen jeweils um 30 cm h&ouml;her zu machen als die jeweils vorausgegangene. Man kann nun blind die Stufen hinaufgehen, weil man die Abst&auml;nde kennt. Das Problem: Die Stiege steht auf einem Schiff, welches im Mittelmeer herumf&auml;hrt. Ich weiss nun zwar, dass ich 30 cm h&ouml;her steige, wenn ich eine Stufe hinaufschreite und 90, wenn ich drei Stufen hinaufschreite, aber ich kann nicht angeben, in welcher H&ouml;he &uuml;ber dem Meeresboden ich mich befinde. Sind es 150 m, sind es 300? Dadurch kann ich auch nicht angeben, ob ich mich auf der &uuml;bern&auml;chsten Stufe doppelt so hoch befinde wie jetzt. <b>Ich kann zwar mit fixen Abst&auml;nden rechnen, aber ich habe keinen absoluten Nullpunkt</b> (wo es nicht mehr tiefer geht, wie zum Meeresboden) zum Vergleich und daher kann ich nicht angeben, um wieviel h&ouml;her ich sein werde, wenn ich x Stufen h&ouml;hersteige. Dies nennt man eine <b>Intervallskala</b>, die Stufen werden in gleichen Intervallen h&ouml;her.</p>
 
<p>Ein Beispiel daf&uuml;r w&auml;re unsere Temperaturskala in Celsius, wo wir nicht vom absoluten Nullpunkt ausgehen (das w&auml;re der Meeresboden oder - 273 Grad Celsius), sondern von einem willk&uuml;rlichen (n&auml;mlich vom Schiffsboden aus oder 0 Grad). Daher ist die Aussage, 10 Grad ist 5 Grad w&auml;rmer als 5 Grad richtig, aber die Aussage falsch, dass es damit doppelt so warm ist, denn tats&auml;chlich h&auml;tte ich ein Verh&auml;ltnis von 283 Grad: 278 Grad (vom absoluten Nullpunkt aus gemessen).</p>
 
<h3><b>Proportionalskala:</b></h3>
 
<p>Wenn wir die gleiche Stiege wie bei der Intervallskala nun an Land bringen und sie  auf festen Boden stellen, dann k&ouml;nnen wir von einer <b>Proportionalskala</b> sprechen. Endlich k&ouml;nnen wir, wenn wir uns auf der dritten Stufe befinden, nicht nur sagen, wir sind jetzt 60 cm h&ouml;her als auf der ersten. Wir k&ouml;nnen auch endlich die <strong>Verh&auml;ltni<b>ss</b></strong><b>e richtig interpretieren</b>. Wir k&ouml;nnen nun auch korrekt angeben, dass wir uns jetzt auf der dritten Stufe dreimal so hoch wie auf der ersten Stufe befinden (mit dem festen Boden als absolutem Nullpunkt, unter den kein Abstieg m&ouml;glich ist). Dies ist nun eine Proportionalskala. Ein Beispiel daf&uuml;r w&auml;ren K&ouml;rpergr&ouml;&szlig;en. Jemand, der 1,80 m gro&szlig; ist, ist doppelt so gro&szlig; wie jemand, der 90 cm gro&szlig; ist.</p>
 
<hr />
 
<h2>3.1.2.2&nbsp;Nominalskalierung</h2>
 
  
<p>Bei der <b>Nominalskalierung</b> handelt es sich um eine Klassifizierung von Objekten, bei welcher <b>keinerlei sinnvolle Rangreihung m&ouml;glich</b> ist, weshalb meist zur alphabetischen Reihung gegriffen wird. Gr&ouml;&szlig;er und kleiner, mehr oder weniger wichtig, mehr oder weniger ausgepr&auml;gt kann nicht unterschieden werden. Jede Reihung ist gleich sinnvoll.</p>
+
Bei der Selektion schränkt man die Grundgesamtheit, für die eine bestimmte Hypothese geprüft werden soll, auf eine Teilgesamtheit von Beobachtungseinheiten ein.
<p>Beispiele f&uuml;r <b>Nominalskalierungen</b> w&auml;ren Zeitungen, die man liest; das Obst, das man isst; das Geschlecht von ProbandInnen; die Farben von Kleidungsst&uuml;cken etc.</p>
 
<hr />
 
<h2>3.1.2.3&nbsp;Ordinalskalierung</h2>
 
  
<p>Bei der <b>Ordinal- oder Rangskalierung</b> werden Gegenst&auml;nde oder Sachverhalte miteinander verglichen und <b>nur der Gr&ouml;&szlig;e oder Intensit&auml;t entsprechend gereiht</b>. Eine Rangreihung ist m&ouml;glich und sinnvoll, <b>jedoch k&ouml;nnen die Abst&auml;nde nicht interpretiert werden</b>, d.h. der Abstand vom Zweit- zum Drittgr&ouml;&szlig;ten kann anders sein als vom Dritt- zum Viertgr&ouml;&szlig;ten.</p>
+
==== '''Signifikanz''' ====
<p>Beispiele w&auml;ren die Beliebtheit von Sch&uuml;lerInnen (hier kann ich diese eindeutig danach reihen), die Sympathie f&uuml;r Zuwanderer etc.</p>
 
<h3><b>Schulnoten ordinal- oder intervallskaliert?</b></h3>
 
<p>Schulnoten werden von vielen behandelt, wie wenn sie zur <b>Intervallskalierung</b> geh&ouml;ren w&uuml;rden, in welcher Abst&auml;nde interpretiert werden k&ouml;nnen. Daher errechnen viele zur Beurteilung der Qualit&auml;t einer Klasse das arithmetische Mittel von Noten, was man jedoch nur bei zumindest intervallskalierten Variablen machen sollte. &Uuml;berlegen wir: Falls Schulnoten intervallskaliert w&auml;ren, m&uuml;sste der Abstand von einer Schulnote zur n&auml;chstbesseren/- schlechteren einem pr&auml;zisen und stabilen Leistungsunterschied zwischen Sch&uuml;lerInnen entsprechen. Oft &rsquo;steht&rsquo; man jedoch zwischen zwei Noten, die Pr&uuml;ferIn muss sich dennoch f&uuml;r eine entscheiden. Auch wenn alle Sch&uuml;lerInnen einer extrem begabten Klasse eine sehr gute Arbeit abgeben, wird die Pr&uuml;ferIn dennoch meistens versuchen, zwischen ihnen durch unterschiedliche Noten zu differenzieren, um die Motivation und den anspornenden Wettbewerb hochzuhalten. Daher gibt es trotz des offiziellen objektiven Anspruchs von Schulnoten einen zu hohen subjektiven Einfluss, um sie als <b>intervallskalierte</b> Variablen behandeln zu k&ouml;nnen.</p>
 
<hr />
 
<h2>3.1.2.4&nbsp;Intervallskalierung</h2>
 
  
<p>Bei der <b>Intervallskalierung</b> nimmt man <b>gleiche Abst&auml;nde (Intervalle)</b> zwischen benachbarten <b>Auspr&auml;gungen</b> an, aber einen nur relativen und keinen absoluten <b>Nullpunkt</b>. Es kann zwar der Abstand zwischen den Werten interpretiert werden, nicht aber das Verh&auml;ltnis der Werte zueinander.</p>
+
Unter S. versteht man ein statistisch überprüftes Urteil über die Haltbarkeit einer ''Hypothese''. Da man nur selten eine ''Vollerhebung'' machen kann, ist ein Ergebnis einer Stichprobe stets vom Risiko begleitet, dass es vom Ergebnis der Grundpopulation abweichen könnte. Man überprüft daher die Wahrscheinlichkeit, dass ein gefundenes Ergebnis rein zufällig entstanden sein könnte. Als Maßstäbe nimmt man sogenannte ''Signifikanzniveaus,'' meist von 5 % oder p=0,05 oder 1 % oder p=0,01. Unterschreitet die erhaltene Wahrscheinlichkeit den letzten Wert, so könnte eine statische Aussage lauten: "Der Zusammenhang zwischen den Variablen A und B ist statistisch signifkant auf dem 1%-Niveau." Ein wichtiger Test zur Abschätzung der Signifikanz der Zusammenhänge in Kreuztabellen ist z.B. der ''Chi- Quadrat- Test.'' Siehe auch: '''Statistische Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;2&#93;]'''.
<p>Ein Beispiel f&uuml;r eine Intervallskala ist z.B. die Temperatur in Celsius. Es w&auml;re falsch, anzunehmen, dass 10 Grad doppelt so warm sind wie 5 Grad. Bezogen auf den <b>absoluten Nullpunkt</b> (- 273 Grad) w&auml;re das  Verh&auml;ltnis zwischen 10 Grad und 5 Grad genau 268:263.</p>
 
<hr />
 
<h2>3.1.2.5&nbsp;Proportionalskalierung</h2>
 
  
<p>Bei der <b>Verh&auml;ltnis- oder Proportionalskalierung</b> gibt <i>es</i> einen <b>absoluten Nullpunkt</b>. <b>Sowohl der Abstand zweier Werte wie auch ihr Verh&auml;ltnis zueinander k&ouml;nnen interpretiert werden</b>. Ein Baum mit einer H&ouml;he von 3,6 Metern ist doppelt so hoch wie ein Baum mit einer H&ouml;he von 1,8 Metern.</p>
+
==== '''Signifianzniveau''' ====
<p><b>Beispiele</b> f&uuml;r diese Form der Skalierung w&auml;ren z.B. K&ouml;rpergr&ouml;&szlig;en, der Vitamingehalt von Fr&uuml;chten; der Wassergehalt von K&ouml;rpern oder die Entfernung von Orten.</p>
 
<hr />
 
<h2>3.1.2.6&nbsp;Skalierungstypen, Aussagen und Methoden</h2>
 
  
<p>Die unterschiedlichen Skalierungsformen lassen unterschiedliche Analysemethoden zu:&nbsp;</p>
+
Das Signifikanzniveau ist synonym für die obere Grenze der Irrtumswahrscheinlichkeit eines statistischen Tests.
<p><span class="imgbox imgcenter" style="width:694px; .word-wrap:break-word; "><img height="404" border="0" align="bottom" width="694" src="images/quantitative-55_1.jpg" alt="Tabelle: Skalierungstypen, Aussagen und Methoden" title="Tabelle: Skalierungstypen, Aussagen und Methoden"  /><span class="imgcaption">Tabelle: Unterschiedliche Skalierungsformen, m&ouml;gliche Aussagen und Analysemethoden mit Beispielen</span>
 
</span></p>
 
<p>&nbsp;<b>Metrische Merkmale[1]</b>  finden sich bei <b>Intervall</b>- und <b>Proportionalskalierung</b>, <b>nichtmetrische</b> bei <b>Nominal- und Ordinalskalierung</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.1.1<br />
 
  
<hr />
+
Siehe auch ''Signifikanz''
<h2>3.1.3&nbsp;Verteilungen</h2>
 
  
<p><b>(H&auml;ufigkeits-)Verteilungen</b> geben Aufschluss &uuml;ber die H&auml;ufung aller Auspr&auml;gungen von Variablen. Man kann prinzipiell zwischen <b>monovariablen</b> und <b>bivariablen Verteilungen</b> unterscheiden.</p>
+
==== '''Skala''' ====
<p><b>Monovariable Verteilungen</b> zeigen die <b>Verteilung</b> einer einzigen Variable, bei <b>bivariablen Verteilungen</b> werden die H&auml;ufigkeiten der einander entsprechenden Auspr&auml;gungen zweier Variablen aufgez&auml;hlt, also z.B. 16 Personen sind sowohl weiblich wie auch Raucherinnen, 13 Personen m&auml;nnnlich und Nichtraucher.</p>
 
<p>Verteilungen k&ouml;nnen sowohl <b>tabellarisch</b> wie auch grafisch in Form von <b>Diagrammen[1]</b>  dargestellt werden.</p>
 
<p>Zur tabellarischen Darstellung gelangt man, indem man die Werte (nach M&ouml;glichkeit sinnvoll) reiht und daneben die jeweilige H&auml;ufigkeit der Werte eintr&auml;gt.</p>
 
<p><span class="imgbox imgcenter" style="width:461px; .word-wrap:break-word; "><img height="167" border="0" align="bottom" width="461" src="images/quantitative-56_1.jpg" alt="Tabelle: Darstellung von Verteilungen" title="Tabelle: Darstellung von Verteilungen"  /><span class="imgcaption">Tabelle: Darstellung von Verteilungen</span>
 
</span></p>
 
<p>Zur grafischen Form gelangt man, wenn man in einem <b>Diagramm</b> auf der x- Achse die Auspr&auml;gung von Werten eintr&auml;gt (z.B. die K&ouml;rpergr&ouml;&szlig;e einer Person x) und auf der y- Achse deren H&auml;ufigkeit (= Zahl der Personen, welche genau diese K&ouml;rpergr&ouml;&szlig;e aufweisen), dann k&ouml;nnen wir die Schnittpunkte mit Linien verbinden, wodurch sich eine Verteilungskurve ergibt. Die Standard- Darstellungsform daf&uuml;r ist das <b>Streudiagramm[2]</b>.</p>
 
<p>Verschiedene Verfahren erforden eine vorliegende Normalverteilung, die mit verschiedenen Prozeduren absch&auml;tzbar ist.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6<br />
 
[2] Siehe Kapitel 3.6.1.6<br />
 
  
<hr />
+
S. (ital. Treppe) bezeichnet eine Folge von Positionen, die unterschiedliche Ausprägungsgrade eines Merkmals anzeigen (z.B. die Temperatur eines Körpers in Celsius, Lieblingszeitschriften durch die Angabe des jeweiligen Titels etc.). Siehe ''Messniveau''.
<h2>3.1.3.1&nbsp;Normalverteilung</h2>
 
  
<p>Von einer Normalverteilung sprechen wir, wenn</p>
+
==== '''Skalenniveau''' ====
<ul>
 
    <li>die gr&ouml;&szlig;te H&auml;ufigkeit in der N&auml;he des <b>arithmetischen Mittel[1]</b>  auftritt und somit das arithmetische Mittel ann&auml;hernd mit dem <b>Median[2]</b>  und mit dem <b>Modalwert[3]</b>  zusammenf&auml;llt;</li>
 
    <li>die <b>H&auml;ufigkeiten[4]</b>  der Werte umso mehr abnehmen, je weiter sie sich vom Mittelwert entfernen;</li>
 
    <li>wenn sowohl links wie rechts des Mittelwerts eine <b>prinzipielle Symmetrie</b> vorliegt;</li>
 
    <li>wenn die <b>Verteilungskurve glockenf&ouml;rmig</b> ist.</li>
 
</ul>
 
<p>Eine Normalverteilung sieht wie in der folgenden Grafik aus:</p>
 
<p><span class="imgbox imgcenter" style="width:522px; .word-wrap:break-word; "><img height="417" border="0" align="bottom" width="522" alt="Abbildung: Normalverteilungskurve" title="Abbildung: Normalverteilungskurve"  src="images/quantitative-57_1.gif" /><span class="imgcaption">Abbildung: Grafische Darstellung einer Normalverteilungskurve</span>
 
</span></p>
 
<p>Die im Diagramm verlaufende Kurve gibt die H&auml;ufigkeit der jeweiligen Werte an. Man sieht, dass die gr&ouml;&szlig;ten H&auml;ufigkeiten beim Mittelwert auftreten (0), die geringsten H&auml;ufigkeiten an den Extremen, wobei die Kurve glockenf&ouml;rmig verl&auml;uft (so genannte Gau&szlig;&rsquo;sche Glockenkurve).</p>
 
<p>Dies w&auml;re eine optimale Normalverteilung.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.2<br />
 
[2] Siehe Kapitel 3.3.3<br />
 
[3] Siehe Kapitel 3.3.1<br />
 
[4] Siehe Kapitel 3.2<br />
 
  
<hr />
+
siehe ''Messniveau''
<h2>3.1.3.2&nbsp;Andere Verteilungsformen</h2>
 
  
<p>Neben der Normalverteilung k&ouml;nnen viele andere Verteilungsformen auftreten.</p>
+
==== '''Spannweite''' ====
<p>Oft sind die Verteilungen <b>schief</b>, man unterscheidet dann zwischen <b>linksschiefen </b> oder <b>rechtsschiefen Verteilungen.</b></p>
 
<p>Bei der <b>linksschiefen</b> Verteilung (<b>negative skew</b>) liegt der h&ouml;chste Punkt der Verteilung rechts (d.h. hier befindet sich der Gro&szlig;teil der Eintr&auml;ge), w&auml;hrend nach links ein langgezogener Abfall eintritt (d.h. es treten dort selten verwendete Extremwerte auf). In <b>linksschiefen</b> Verteilungen ist der <b>Median[1]</b>  gr&ouml;&szlig;er als das <b>arithmetische Mittel[2]</b>.</p>
 
<p><span class="imgbox imgcenter" style="width:347px; .word-wrap:break-word; "><img height="248" border="0" align="bottom" width="347" src="images/quantitative-58_1.jpg" alt="Abbildung: Linkschiefe Verteilung" title="Abbildung: Linkschiefe Verteilung"  /><span class="imgcaption">Abbildung: Grafische Darstellung einer linkschiefen Verteilung</span>
 
</span></p>
 
<p>Bei der <b>rechtsschiefen Verteilung</b> (<b>positive skew</b>) finden wir die &uuml;berwiegende Mehrzahl der Eintr&auml;ge auf der linken Seite und damit auch den h&ouml;chsten Punkt der Kurve, w&auml;hrend nach rechts wenige Eintr&auml;ge auftauchen. Typisch f&uuml;r eine derartige <b>Verteilung</b> ist die Einkommensverteilung sozial ungerechter L&auml;nder, in welchen wenigen Multimilliard&auml;rInneen viele KleinverdienerInnen gegen&uuml;berstehen. In <b>rechtsschiefen</b> Verteilungen ist der <b>Median</b> kleiner als das <b>arithmetische Mittel</b>.</p>
 
<p><span class="imgbox imgcenter" style="width:410px; .word-wrap:break-word; "><img height="293" border="0" align="bottom" width="410" src="images/quantitative-58_2.jpg" alt="Abbildung: Rechstschiefe Verteilung" title="Abbildung: Rechstschiefe Verteilung"  /><span class="imgcaption">Abbildung: Grafische Darstellung einer rechstschiefen Verteilung</span>
 
</span></p>
 
<p>&nbsp;Verteilungen k&ouml;nnen auch mehrere Gipfel aufweisen:</p>
 
<p>&nbsp;&nbsp;<span class="imgbox imgcenter" style="width:152px; .word-wrap:break-word; "><img height="158" border="0" align="bottom" width="152" src="images/quantitative-58_3.jpg" alt="Abbildung: Bimodale Verteilung" title="Abbildung: Bimodale Verteilung"  /><span class="imgcaption">Abbildung: Bimodale Verteilung</span>
 
</span></p>
 
<p>&nbsp;Diese Verteilung weist insgesamt zwei Gipfel auf. Sie wird als bimodal (zweigipfelig) bezeichnet.</p>
 
<p>&nbsp;&nbsp;<span class="imgbox imgcenter" style="width:152px; .word-wrap:break-word; "><img height="129" border="0" align="bottom" width="152" src="images/quantitative-58_4.jpg" alt="Abbildung: Rechteckige Verteilung" title="Abbildung: Rechteckige Verteilung"  /><span class="imgcaption">Abbildung: Rechteckige Verteilung</span>
 
</span></p>
 
<p>&nbsp;Diese Verteilung ist rechteckig. Sie k&ouml;nnte bei einer kleinen <b>Stichprobe[3]</b>  auftreten, wenn fast alle Werte die gleiche <b>H&auml;ufigkeit[4]</b>  aufweisen.</p>
 
<p>&nbsp;&nbsp;<span class="imgbox imgcenter" style="width:152px; .word-wrap:break-word; "><img height="129" border="0" align="bottom" width="152" src="images/quantitative-58_5.jpg" alt="Abbildung: U-förmige Verteilung" title="Abbildung: U-förmige Verteilung"  /><span class="imgcaption">Abbildung: U-f&ouml;rmige, bimodale Verteilung</span>
 
</span></p>
 
<p>&nbsp;Diese Verteilungsform ist <b>u-f&ouml;rmig</b>. Die Extremwerte kommen sehr h&auml;ufig vor, w&auml;hrend mittlere Auspr&auml;gungen fast nicht auftreten. Auch diese Verteilung ist <b>bimodal</b><b><i>.</i></b></p>
 
<p>&nbsp;&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.3<br />
 
[2] Siehe Kapitel 3.3.2<br />
 
[3] Siehe Kapitel 2.1.1<br />
 
[4] Siehe Kapitel 3.2<br />
 
  
<hr />
+
Siehe ''Range''.
<h2>3.1.3.3&nbsp;Test auf Normalverteilung</h2>
 
  
<p>Verschiedene Verfahren sind nur sinnvoll anwendbar, falls ann&auml;hernd eine <b>Normalverteilung</b> der Daten vorliegt. Dazu geh&ouml;rt z.B. die <b>Ma&szlig;korrelation[1]</b>, aber auch das <b>arithmetische Mittel[2]</b>  ist nur wenig aussagekr&auml;ftig, wenn die <b>Verteilung[3]</b> der Daten durch <b>Ausrei&szlig;er</b> und <b>extreme Schiefe</b> gepr&auml;gt sind.</p>
+
==== '''Spearman’s Rho''' (oder ''Spearmans Korrelationskoeffizient'') ====
<p>F&uuml;r den Nachweis einer <b>Normalverteilung</b> kann auf drei wesentliche Methoden zur&uuml;ckgegriffen werden:</p>
 
<ul>
 
    <li><b>optisch</b>: F&uuml;r die optische Absch&auml;tzung der <b>Normalverteilung</b> kann auf die grafische Wiedergabe (siehe oben, mit Statistik- Programmen z.B. mit der grafischen Darstellung des <b>Histogramms[4]</b>) zur&uuml;ckgegriffen werden</li>
 
    <li><b>statistisch-mathematisch</b> auf den <b>Kolmogorov- Smirnov-Test </b>(falls die Werte nicht in Klassen eingeteilt sind, besonders auch bei kleinen Stichproben)</li>
 
    <li>oder auf den <b>Chi-Quadrat-Test (Wikipedia)[5]</b>  (bei in Klassen eingeteilten Daten)</li>
 
</ul>
 
<h3>&nbsp;<b>Erkennung mit SPSS</b></h3>
 
<p>Diese verschiedenen und als eigene Unterpunkte angef&uuml;hrten Untersuchungen k&ouml;nnen unter <b>SPSS</b> auch gleichzeitig get&auml;tigt werden. Klicken Sie dazu auf ANALYSIEREN -&gt; DESKRIPTIVE STATISTIKEN -&gt; EXPLORATIVE DATENANALYSE. W&auml;hlen Sie dort unter &rsquo;Anzeige&rsquo; die Alternative &rsquo;Beide&rsquo; und unter &rsquo;Diagramm&rsquo; die Alternative &rsquo;Normalverteilungsdiagramm mit Tests&rsquo;. Dann wird in der Bildschirmausgabe der Resultate ein eigener Punkt aufgef&uuml;hrt: &rsquo;Tests auf Normalverteilung&rsquo;, von denen uns besonders der erste der beiden Tests interessiert <b>&rsquo;Kolmogorov-Smirnov&rsquo;</b> (eigentlich eine versch&auml;rfte Variante dieses Tests). Liegt der Wert, welcher unter &rsquo;Signifikanz steht&rsquo;, unter 0,05, so ist mit 95 % Sicherheit eine Normalverteilung zu verwerfen, liegt er unter 0,01, sogar mit 99 % Sicherheit.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3.1<br />
 
[2] Siehe Kapitel 3.3.2<br />
 
[3] Siehe Kapitel 3.1.3<br />
 
[4] Siehe Kapitel 3.6.1.5<br />
 
[5] http://de.wikipedia.org/wiki/Chi-Quadrat-Test<br />
 
  
<hr />
+
Falls zwei Merkmale ordinal verteilt sind, kann man den Rangkorrelationskoeffizienten R (oder ''Spearmans Rho)'' mithilfe einer ''Produkt- Moment-Korrelation'' der Rangplätze berechnen. Siehe auch: '''Rangkorrelation[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3]]]''' .
<h2>3.1.3.3.1&nbsp;Optischer Nachweis einer Normalverteilung: das Histogramm</h2>
 
  
<p>Das <b>Histogramm[1]</b>  liefert uns einen ersten und recht brauchbaren Eindruck, ob die von uns analysierten Daten weitgehend normalverteilt sind. Mit SPSS ist die Herstellung eines derartigen Diagramms ein Kinderspiel:</p>
+
==== '''Stabdiagramm''' ====
<p>A. Klicken Sie in der Men&uuml;leiste auf GRAFIKEN</p>
 
<p>B. W&auml;hlen Sie Histogramm</p>
 
<p>C. W&auml;hlen Sie die zu untersuchende Variable aus</p>
 
<p>D. Lassen Sie sich am besten auch die Normalverteilungskurve zu Vergleichszwecken hinzeichnen (mit H&auml;kchen markieren).</p>
 
<p>E. Klicken Sie auf OK</p>
 
<p>Dann erhalten Sie z.B. das folgende <b>Histogramm</b> (alle folgenden Histogramme und Analysen wurden von der SPSS-Datei world95.sav abgeleitet):</p>
 
<p><span class="imgbox imgcenter" style="width:450px; .word-wrap:break-word; "><img height="360" border="0" align="bottom" width="450" src="images/quantitative-60_1.jpg" alt="Abbildung: Histogramm" title="Abbildung: Histogramm"  /><span class="imgcaption">Abbildung: Optischer Nachweis einer Normalverteilung mittels Histogramm</span>
 
</span></p>
 
<p>Hier ist z.B. eine st&auml;rkere Abweichung von der <b>Normalverteilung</b> gegeben. Man beachte den gro&szlig;en Zwischenraum zwischen der Normalverteilungskurve und den tats&auml;chlichen Werten bei einem Kalorien-Input von etwa 3000. Dennoch w&auml;re auf dem 5-%-Signifikanz-Niveau die Annahme einer Normalverteilung mit dem <b>Kolmogorov-Smirnov-Test[2]</b>  noch nicht widerlegt (wohl aber auf dem 10-%-Niveau).</p>
 
<p>Das folgende Diagramm zeigt eine noch deutlich st&auml;rkere Abweichung von der <b>Normalverteilung</b>:</p>
 
<p><span class="imgbox imgcenter" style="width:450px; .word-wrap:break-word; "><img height="360" border="0" align="bottom" width="450" src="images/quantitative-60_2.jpg" alt="Abbildung: Abweichung von der Normalverteilung" title="Abbildung: Abweichung von der Normalverteilung"  /><span class="imgcaption">Abbildung: Grafische Darstellung einer st&auml;rkeren Abweichung von der Normalverteilung</span>
 
</span></p>
 
<p>In diesem Fall ist auch der <b>Kolmogorov-Smirnov-Tes</b>t hochgradig signifikant (sowohl auf dem 5-% wie auch auf dem 1-%-Niveau), weshalb die Annahme einer Normalverteilung verworfen werden muss.</p>
 
<p>Deutlich <b>normalverteilt</b>, sowohl grafisch erkennbar wie auch mit dem <b>Kolmogorov-Smirnov-Test</b> nicht verwerfbar, ist die folgende Verteilung. Es finden sich kaum Zwischenr&auml;ume zwischen der <b>Normalverteilungskurve</b> und der tats&auml;chlichen Verteilung:&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:450px; .word-wrap:break-word; "><img height="360" border="0" align="bottom" width="450" src="images/quantitative-60_3.jpg" alt="Abbildung: Deutliche Normalverteilung" title="Abbildung: Deutliche Normalverteilung"  /><span class="imgcaption">Abbildung: Grafische Darstellung einer deutlichen Normalverteilung</span>
 
</span></p>
 
<p>Man sieht, dass das Histogramm meist eine sehr gute Absch&auml;tzm&ouml;glichkeit erlaubt, ob Variable <b>normalverteilt</b> sind.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.5<br />
 
[2] Siehe Kapitel 3.1.3.3.2<br />
 
  
<hr />
+
Siehe ''Balkendiagramm.''
<h2>3.1.3.3.2&nbsp;Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test</h2>
 
  
<p>Der Kolmogorov-Smirnov-Test kann auch bei kleineren Stichproben eingesetzt werden, um zu &uuml;berpr&uuml;fen, ob eine gegebene Verteilung mit hoher Wahrscheinlichkeit von der Normalverteilung abweicht.</p>
+
==== '''Standardabweichung''' ====
<p>Die Berechnung basiert auf dem Vergleich mit einer hypothetischen Normalverteilungskurve (Bild von Internet-Enzyklop&auml;die Wikipedia: <b>http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test[1]</b>):</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="320" border="0" align="bottom" width="500" alt="Abbildung: Kolmogorov-Smirnov-Test" title="Abbildung: Kolmogorov-Smirnov-Test"  src="images/quantitative-61_1.jpg" /><span class="imgcaption">Abbildung: Kolmogorov-Smirnov-Test - Vergleich einer vorliegenden Verteilung mit einer hypothetischen Normalverteilungskurve. Quelle: Wikipedia - http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test.</span>
 
</span></p>
 
<p>Die Logik der Berechnung geht davon aus, dass die tats&auml;chliche Verteilung von einer hypothetischen Normalverteilung an einem beliebigen Punkt eine bestimmte fl&auml;chenm&auml;&szlig;ige Abweichung nicht &uuml;berschreiten darf, andernfalls m&uuml;sste die Annahme einer Normalverteilung verworfen werden. Daher wird in einer Reihe von Rechenschritten die jeweilige konkrete Abweichung errechnet. Die gr&ouml;&szlig;te auftretende Abweichung wird mit einer Tafel des Kolmogorov- Smirnov-Tests verglichen.</p>
 
<p>Ein Beispiel einer manuellen Berechnung kann hier eingesehen werden. Nat&uuml;rlich werden die Werte heute wesentlich komfortabler, z.B. mit <b>SPSS</b>, ermittelt.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test<br />
 
  
<hr />
+
Die St. ''s'' ist ein Kennwert, um die Variabilität (Streuung) eines Merkmals zu kennzeichnen. Sie wird als Wurzel aus der ''Varianz'' erreichnet. In einer Normalverteilung liegen im Bereich des ''Arithmetischen Mittels'' ± ''s'' ungefähr 68 % aller Ergebnisse. Siehe auch: '''Standardabweichung (Wikipedia)[http://de.wikipedia.org/wiki/Standardabweichung &#91;4&#93;]'''.
<h2>3.1.3.3.2.1&nbsp;Kolmogorov-Smirnov-Test mit SPSS</h2>
 
  
<p>A. Sie w&auml;hlen in SPSS den Men&uuml;punkt ANALYSIEREN</p>
+
==== '''Standardisiertes Interview''' ====
<p>B. Aus den heruntergeklappten Alternativen w&auml;hlen Sie NICHTPARAMETRISCHE TESTS</p>
 
<p>C. Aus den n&auml;chsten Auswahlpunkten, die sich rechts &ouml;ffnen, w&auml;hlen Sie K-S BEI EINER STICHPROBE....</p>
 
<p>D. Nun w&auml;hlen Sie die Testvariable aus, welche Sie auf Normalverteilung pr&uuml;fen m&ouml;chten. Achten Sie darauf, dass links unten unter Testverteilung der Punkt <i>Normal</i> angew&auml;hlt ist.</p>
 
<p>E. Klicken Sie auf OK</p>
 
<p>F. Sie erhalten nun eine Bildschirmausgabe wie folgende:</p>
 
<p><span class="imgbox imgcenter" style="width:405px; .word-wrap:break-word; "><img height="277" border="0" align="bottom" width="405" src="images/quantitative-62_1.jpg" alt="Abbildung: Kolmogorov-Smirnov-Test mit SPSS" title="Abbildung: Kolmogorov-Smirnov-Test mit SPSS"  /><span class="imgcaption">Abbildung: Kolmogorov-Smirnov-Anpassungstest mit SPSS</span>
 
</span></p>
 
<p>G. Hier sind f&uuml;r uns die folgenden Werte von Belang: 1. <i>N</i> (in diesem Falle 8), Extremste Differenzen 0,320) und <i>Asymptotische Signifikanz</i>.</p>
 
<p>H. Nun vergleichen wir diese beiden ersten Werte mit einer Tabelle f&uuml;r den Kolmogorov-Smirnov-Test. Die nachfolgende Tabelle gibt bei einer 5 % Irrtumswahrscheinlichkeit Grenzwerte f&uuml;r Stichproben an, bei denen <i>n</i> zwischen 1-35 liegt.</p>
 
<p><span class="imgbox imgcenter" style="width:339px; .word-wrap:break-word; "><img height="460" border="0" align="bottom" width="339" src="images/quantitative-62_2.jpg" alt="Abbildung: Tabelle für den Kolmogorov-Smirnov-Test" title="Abbildung: Tabelle für den Kolmogorov-Smirnov-Test"  /><span class="imgcaption">Abbildung: Tabelle f&uuml;r den Kolmogorov-Smirnov-Test</span>
 
</span></p>
 
<p>Wir suchen nun den Wert f&uuml;r N = 8 und sehen dort die Zahl <i>0,454</i>. Falls die <i>Extremste Differenz</i> in unserem Rechenbeispiel diesen Wert &uuml;berschreitet, liegt mit 95 % Wahrscheinlichkeit keine <b>Normalverteilung</b> vor. In unserem Fall haben wir jedoch eine <i>Extremste Differenz</i> von nur <i>0,32</i>. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer <b>Standardverteilung</b> nicht verworfen werden muss. Ein wirklicher Beweis f&uuml;r eine Standard- Verteilung liegt allerdings dadurch nicht vor.</p>
 
<p>Auch unser Wert f&uuml;r die <i>Asymptotische Signifikanz</i> ist weit gr&ouml;&szlig;er als der Grenzwert 0,05. Dieser w&uuml;rde besagen, dass nur in 5 % aller F&auml;lle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 w&auml;re hingegen deutlich kleiner, daher w&uuml;rde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % <b>Signifikanzniveau[1]</b>). Da unser Wert jedoch deutlich dar&uuml;ber liegt, kann die Arbeitshypothese einer Normalverteilung auf diesem <b>Signifikanzniveau</b> nicht verworfen werden.</p>
 
<p><b>Achtung:</b> Der <b>Kolmogorov-Smirnov-Test</b> ben&ouml;tigt, v.a. bei kleinen <b>Stichproben</b>, extreme Abweichungen von einer Normalverteilung, um auf h&ouml;heren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. Daher ist eine Nichtverwerfung der Annahme einer Normalverteilung durch diese Berechnungsform noch kein Beweis f&uuml;r das Vorliegen einer Normalverteilung. Sollte sich im <b>Histogramm[2]</b> eine extreme Abweichung von der fakultativ gezogenen Normalverteilungskurve zeigen, dann sollte man, auch wenn der Kolmogorov-Smirnov-Test diese nicht verwirft, dennoch eher zu nicht parametrischen Tests greifen (wie z.B. dem <b>T-Test</b> etc.)</p>
 
<p>Hier ein Link zu weiterf&uuml;hrenden Tabellen, in welchen noch weitere Irrtumswahrscheinlichkeiten f&uuml;r die Berechnung der Abweichung von einer Standardverteilung herangezogen werden: <b>http://www.eridlc.com[3]</b></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3.2<br />
 
[2] Siehe Kapitel 3.6.1.5<br />
 
[3] http://www.eridlc.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&amp;FileName=Table7<br />
 
  
<hr />
+
Das st. I. ist eine Interviewform, bei welcher alle Details der Befragung (was soll man wie fragen, wie soll man reagieren, welche Zusatzinformationen darf man liefern etc.) genau festgelegt wurden, um den Einfluss der InterviewerInnen möglichst gering zu halten.
<h2>3.2&nbsp;Die Ermittlung von Häufigkeiten</h2>
 
  
<p>Bei der <b>Ermittlung von H&auml;ufigkeiten</b> stellen wir fest, <b>wie oft die verschiedenen Messwerte auftreten</b>.</p>
+
==== '''stetig''' ====
<p>Die Ermittlung von <b>H&auml;ufigkeiten</b> ist das einfachste statistische Verfahren und kann f&uuml;r jede Art von <b>Skala[1]</b>  angewandt werden. Die H&auml;ufigkeiten der Messwerte geben uns Hinweise auf ihre <b>Verteilung[2]</b>  d.h. wie oft die einzelnen Auspr&auml;gungen vorkamen. Die Kenntnis dieser Verteilung gibt uns somit Auskunft dar&uuml;ber, was in einer untersuchten Stichprobe der Normalfall, und was die Ausnahme ist.</p>
 
<p>Dabei wird das Auftreten von Werten gez&auml;hlt. Prinzipiell unterscheiden wir zwischen</p>
 
<ul>
 
    <li><b>Monovariablen Verteilungen:</b> eine einzige Variable wird gez&auml;hlt. So kommen wir z.B. zu H&auml;ufigkeiten von Schulnoten (22 Sch&uuml;lerInnen hatten eine 1, 37 eine 2 usw.)</li>
 
    <li><b>Bi- bzw. multivariablen Verteilungen:</b> Es wird gez&auml;hlt, wie h&auml;ufig Kombinationen von zwei oder mehr Variablen auftreten (z.B. Schulnoten und soziale Schicht; 17 Sch&uuml;lerInnen geh&ouml;rten zur Oberschicht und hatten eine 1, 22 Sch&uuml;lerInnen zur Oberschicht und hatten eine 2 etc.). Mit <b>Bi- oder multivariablen Verteilungen</b> m&ouml;chte man Zusammenh&auml;nge zwischen zwei Variablen feststellen.</li>
 
</ul>
 
<p>Die tabellarische Darstellung der H&auml;ufigkeiten in bi- bzw. multivariablen Verteilungen wird auch als <b>Kreuztabelle[3]</b>  oder <b>Kontingenztafel</b> bezeichnet.</p>
 
<p>Nach der Systematik der Darstellung unterscheidet man zwischen der <b>Urliste</b>, der <b>prim&auml;ren Tafel</b> bzw. der <b>H&auml;ufigkeitstabelle.</b></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2<br />
 
[2] Siehe Kapitel 3.1.3<br />
 
[3] Siehe Kapitel 3.5.2<br />
 
  
<hr />
+
Ein quantitatives Merkmal wird st. genannt, wenn es alle Werte innerhalb eines Intervalls annehmen kann. So kann z.B. eine Körpergröße beliebig fein gemessen werden, in cm, in mm und bei Kleinstlebewesen sogar noch deutlich darunter. ''Diskrete Variable'' hingegen können nur bestimmte und abzählbare Werte einnehmen (Beispiel Würfel).
<h2>3.2.1&nbsp;Liste und Tafeln</h2>
 
  
<h3><b>Urliste</b></h3>
+
==== '''Stichprobe''' ====
<p>Aufgenommene <b>Messwerte</b> sind anfangs ungeordnet. Denken Sie z.B. an 30 Personen, deren Alter Sie abgefragt haben, ohne die Eintr&auml;ge gr&ouml;&szlig;enm&auml;&szlig;ig zu ordnen. Diese <b>ungeordnete Liste</b> wird als so genannte <b>Urliste</b> bezeichnet. Eine <b>Urliste</b> ist die ungeordnete Aufz&auml;hlung der Werte in der gleichen Reihenfolge, in der sie w&auml;hrend der Abfrage aufgenommen wurden.</p>
 
<p><b>Beispiel: Kinderzahl von Befragten</b></p>
 
<p><span class="imgbox imgcenter" style="width:201px; .word-wrap:break-word; "><img height="90" border="0" align="bottom" width="201" src="images/quantitative-64_1.jpg" alt="Abbildung: Beispiel für eine Urliste" title="Abbildung: Beispiel für eine Urliste"  /><span class="imgcaption">Abbildung: Beispiel f&uuml;r eine Urliste - Kinderanzahl der Befragten</span>
 
</span></p>
 
<h3><b>Prim&auml;re Tafel</b></h3>
 
<p>Wesentlich &uuml;bersichtlicher ist bereits die <b>prim&auml;re Tafel, in welcher die Auspr&auml;gungen sortiert werden.</b> Sie gibt deutlich mehr Aufschluss &uuml;ber die Charakteristiken der Daten. Hier ist auf einen Blick erkennbar, dass die Messwerte 1 und 2 am h&auml;ufigsten vorkommen:</p>
 
<p><span class="imgbox imgcenter" style="width:136px; .word-wrap:break-word; "><img height="91" border="0" align="bottom" width="136" src="images/quantitative-64_2.jpg" alt="Abbildung: Beispiel für eine Primäre Tafel" title="Abbildung: Beispiel für eine Primäre Tafel"  /><span class="imgcaption">Abbildung: Beispiel f&uuml;r eine Prim&auml;re Tafel - Kinderanzahl der Befragten</span>
 
</span></p>
 
<p>Dennoch ist auch eine <b>Prim&auml;re Tafel</b> im Vergleich mit einer H&auml;ufigkeitstabelle wenig &uuml;bersichtlich.</p>
 
<hr />
 
<h2>3.2.2&nbsp;Häufigkeitstabelle</h2>
 
  
<p><b>H&auml;ufigkeitstabellen</b> zeigen in tabellarischer Form die <b>Auspr&auml;gungen einer Variablen verbunden mit deren H&auml;ufigkeit.</b> Sie sind weit &uuml;bersichtlicher als <b>Listen</b> und <b>Tafeln</b>.</p>
+
Unter einer St. versteht man die Auswahl an Beobachtungseinheiten aus einer definierten (''Grund)Population''. Eine Stichprobe sollte diese Grundpopulation unverzerrt wiederspiegeln, z.B. durch das Modell der ''Repräsentativität''.
<p>Dabei tr&auml;gt man in der 1. Spalte die Messwerte ein (wie z.B. Kinderzahl oder hier L&auml;ndernamen), in der 2. Spalte die absolute H&auml;ufigkeit der Messwerte (durchz&auml;hlen, wie oft z.B. Frankreich genannt wird) und in Spalte 3 berechnet man die <i>relative H&auml;ufigkeit</i>. Die relative H&auml;ufigkeit errechnet man folgenderma&szlig;en: man nimmt die absolute H&auml;ufigkeit eines Messwertes (z.B. waren 16 Franz&ouml;sInnen beim Kongress), dividiert diesen durch die Summe der Messwerte (hier insgesamt 50 anwesende WissenschaftlerInnen) und multipliziert das Ergebnis mit 10 (um auf Prozentwerte zu kommen). F&uuml;r Franz&ouml;sInnen daher 16/50*100=32 %.&nbsp;<span class="imgbox imgcenter" style="width:437px; .word-wrap:break-word; "><img height="176" border="0" align="bottom" width="437" alt="Abbildung: Häufigkeitstabelle Herkunft der WissenschaftlerInnen" title="Abbildung: Häufigkeitstabelle Herkunft der WissenschaftlerInnen"  src="images/quantitative-65_1.jpg" /><span class="imgcaption">Abbildung: H&auml;ufigkeitstabelle - Herkunft der WissenschaftlerInnen eines Kongre&szlig;</span>
 
</span></p>
 
<h3><b>Akkumulierte H&auml;ufigkeit</b></h3>
 
<p>Wenn keine <b>Nominalskalierung[1]</b>  vorliegt, ist auch die Darstellung der <b>akkumulierten H&auml;ufigkeit</b> sinnvoll. Sie gibt Auskunft &uuml;ber die <b>H&auml;ufigkeit</b> aller Messwerte, die bis zu einem bestimmten Niveau auftreten.</p>
 
<p>Man errechnet sie folgenderma&szlig;en: Man z&auml;hlt alle relativen H&auml;ufigkeiten zusammen, die einschlie&szlig;lich dieser Zeile auftraten: Die akkumulierte H&auml;ufigkeit f&uuml;r die Note 3 (= alle EthnologInnen, die zumindest die Note 3 erhielten) w&auml;re daher: 19,2 % + 21,8 % + 28,2 % = 69,2 %.</p>
 
<p><span class="imgbox imgcenter" style="width:599px; .word-wrap:break-word; "><img height="171" border="0" align="bottom" width="599" alt="Abbildung: Häufigkeitstabelle Noten" title="Abbildung: Häufigkeitstabelle Noten"  src="images/quantitative-65_2.jpg" /><span class="imgcaption">Abbildung: H&auml;ufigkeitstabelle - Noten von EthnologInnen</span>
 
</span></p>
 
<p>Eine derartige <b>H&auml;ufigkeitstabelle</b> kann, wie vorhin beschrieben, auch mehrdimensional sein (<b>multivariabel</b>):&nbsp;<span class="imgbox imgcenter" style="width:621px; .word-wrap:break-word; "><img height="180" border="0" align="bottom" width="621" alt="Abbildung: mehrdimensionale Häufigkeitstabelle" title="Abbildung: mehrdimensionale Häufigkeitstabelle"  src="images/quantitative-65_3.jpg" /><span class="imgcaption">Abbildung: mehrdimensionale H&auml;ufigkeitstabelle Integrationserfolge und Nationalsprache von AfrikanerInnen</span>
 
</span></p>
 
<p>Eine H&auml;ufigkeitstabelle hat folgende Vorz&uuml;ge:</p>
 
<ul>
 
    <li>Sie ist &uuml;bersichtlicher als eine Urliste</li>
 
    <li>Sie ist k&uuml;rzer als eine prim&auml;re Tafel</li>
 
    <li>Sie ist &ouml;konomisch</li>
 
    <li>Sie erlaubt eine leichte Beurteilung der Verteilung</li>
 
    <li>Trotz dieser Vorteile tritt kein Informationsverlust auf.</li>
 
</ul>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2.2<br />
 
  
<hr />
+
==== '''Störvariable''' (oder ''Störgrößen'') ====
<h2>3.2.2.1&nbsp;Häufigkeitsberechnung mit SPSS</h2>
 
  
<p>Die Berechnung von H&auml;ufigkeiten mit <b>SPSS</b> erfolgt folgenderma&szlig;en:</p>
+
Unter ''Störvariablen'' versteht man Variable, welche zusätzlich zu einer unabhängigen Variablen einen nicht einkalkulierten Einfluss auf eine abhängige Variable ausüben. Untersucht man z.B. den Zusammenhang zwischen Glatzenbildung und Einkommen, so wird man häufig auf eine höhere Korrelation kommen. Diese hängt mit einer nicht untersuchten Störvariable zusammen, nämlich dem Alter, mit dem sowohl Glatzenbildung wie auch Einkommen normalerweise hoch korrelieren.
<p>A. Klicken Sie in der Men&uuml;leiste auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - H&Auml;UFIGKEITEN.</p>
 
<p>B. F&uuml;gen Sie im Feld <i>Variablen</i> die Variable ein, von der Sie eine H&auml;ufigkeitstabelle erstellen m&ouml;chten.</p>
 
<p>C. Klicken Sie auf OK.</p>
 
<p>Sie erhalten dann z.B. folgende Ausgabe:</p>
 
<p><span class="imgbox imgcenter" style="width:451px; .word-wrap:break-word; "><img height="515" border="0" align="bottom" width="451" src="images/quantitative-66_1.gif" alt="Abbildung: Häufigkeitsberechnung Wohnbezirk" title="Abbildung: Häufigkeitsberechnung Wohnbezirk"  /><span class="imgcaption">Abbildung: H&auml;ufigkeitsberechnung mit SPSS - Beispiel Wohnbezirk</span>
 
</span></p>
 
<p>Sie sehen, dass <b>SPSS</b> in der ersten Spalte die Auspr&auml;gungen der Variable anbietet, in der Spalte <b>H&auml;ufigkeit </b> die <b>absolute H&auml;ufigkeit</b>, mit welcher diese Auspr&auml;gung auftritt. Unter <b>Prozent </b> finden Sie die prozentuellen Anteile der absoluten H&auml;ufigkeiten der Auspr&auml;gungen an der Stichprobengr&ouml;&szlig;e (N ist hier 154).</p>
 
<p>Links unten sehen Sie das Label <i>Fehlend</i>. Hier wird die Zahl der bei dieser Frage nicht vorhandenen Antworten vermerkt (Im Fall dieser Stichprobe haben 23 Personen diese Frage nicht beantwortet). Da daher die eigentliche Gr&ouml;&szlig;e der Stichprobe bei 131 liegt (154 weniger 23 Nichtbeantwortende), ver&auml;ndern sich auch die realen Prozentwerte, wie in der Spalte <i>G&uuml;ltige Prozente </i> ersichtlich. Die Spalte <b>Kumulierte Prozente </b> gibt die in Prozenten ausgedr&uuml;ckte akkumulierte H&auml;ufigkeit an und basiert ebenfalls auf den bereinigten Werten (also minus die Null-  Eintr&auml;ge).</p>
 
<p>Bereits in der Standard-Vorgabe rechnet SPSS daher alle f&uuml;r eine <b>H&auml;ufigkeitstabelle</b> notwendigen Analysen. Werfen Sie auch einen Blick auf die fakultativen Auswahlm&ouml;glichkeiten unter <b>Statistik  und  Diagramme</b>. SPSS kann mit wenigen Arbeitsg&auml;ngen &auml;u&szlig;erst umfangreiche Berechnungen durchf&uuml;hren.</p>
 
<hr />
 
<h2>3.2.2.2&nbsp;Grafische Darstellung mit SPSS</h2>
 
  
<p>Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIK - H&Auml;UFIGKEITEN und w&auml;hlen Sie dort die Variable aus, deren H&auml;ufigkeitsverteilung Sie grafisch darstellen m&ouml;chten.</p>
+
Die Existenz von Störvariablen ist besonders bei der Untersuchung von Korrelationen kritisch zu untersuchen.
<p>Klicken Sie dann auf Diagramme. Sie haben nun die Auswahlm&ouml;glichkeit zwischen <b>Balkendiagrammen[1]</b>, <b>Kreisdiagrammen[2]</b>  und <b>Histogrammen[3]</b>. Je nach Datenlage sollten Sie unterschiedliche Diagrammtypen heranziehen. Siehe dazu den Punkt <b>Diagramme[4]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.3<br />
 
[2] Siehe Kapitel 3.6.1.1<br />
 
[3] Siehe Kapitel 3.6.1.5<br />
 
[4] Siehe Kapitel 3.6.2<br />
 
  
<hr />
+
==== '''Streudiagramm''' (auch ''Scatterplot'') ====
<h2>3.2.3&nbsp;Klassenbildung (Gruppierung) von Daten</h2>
 
  
<p>Unter der <b>Gruppierung von Daten</b> verstehen wir die <b>Zusammenfassung von verschiedenen Auspr&auml;gungen zu Klassen</b>. Eine Klasse ist die <b>Menge s&auml;mtlicher Messwerte</b>, die <b>innerhalb festgelegter Grenzen</b> liegen. Dadurch kann die <b>H&auml;ufigkeitsverteilung[1]</b>  einer Variablen mit einer Vielzahl unterschiedlicher Auspr&auml;gungen &uuml;bersichtlicher dargestellt werden.</p>
+
Ein St. zeigt graphisch den Zusammenhang zwischen zwei stetigen Merkmalen, wobei eine ''Punktwolke'' aus den Schnittpunkten der jeweiligen Ausprägungen der Variablen X und Y gebildet wird. ''Streudiagramme'' bieten eine gute Abschätzmöglichkeit für mögliche ''Korrelationen''.
<p><b>Beispiel: Gemessene K&ouml;rpergr&ouml;&szlig;en und Umwandlung in Klassen</b><br />
 
Ein Beispiel w&auml;ren Gr&ouml;&szlig;enangaben in cm. Wollte man statistische Aussagen &uuml;ber die K&ouml;rpergr&ouml;&szlig;en von &Ouml;sterreicherInnen machen, m&uuml;sste man wahrscheinlich (bei einem Alter ab 14) etwa 90 verschiedene Werte angeben (von 1,20 bis 2,19). Eine derartige Tabelle w&auml;re un&uuml;bersichtlich und w&uuml;rde &uuml;ber mehrere Seiten f&uuml;hren:</p>
 
<p><span class="imgbox imgcenter" style="width:151px; .word-wrap:break-word; "><img height="256" border="0" align="bottom" width="151" src="images/quantitative-68_1.jpg" alt="Tabelle: Gemessene Körpergrößen" title="Tabelle: Gemessene Körpergrößen"  /><span class="imgcaption">Tabelle: Gemessene K&ouml;rpergr&ouml;&szlig;en</span>
 
</span></p>
 
<p>Viel &uuml;bersichtlicher w&auml;re es aber, diese 100 verschiedenen Auspr&auml;gungen zu <b>Klassen</b> von benachbarten Messwerten zusammenzufassen. Treten extrem viele unterschiedliche Auspr&auml;gungen auf, sind 10-19 Klassen sinnvoll. W&auml;hlt man bei diesem Beispiel 10 Klassen, fallen jeweils 10 Messwerte in eine Klasse (100:10=10):&nbsp;<span class="imgbox imgcenter" style="width:315px; .word-wrap:break-word; "><img height="278" border="0" align="bottom" width="315" src="images/quantitative-68_2.jpg" alt="Tabelle: Körpergrößen klassiert" title="Tabelle: Körpergrößen klassiert"  /><span class="imgcaption">Tabelle: In Klassen eingeteilte K&ouml;rpergr&ouml;&szlig;en</span>
 
</span></p>
 
<p>Die <b>Klassenbreite</b> ist bei <b>diskreten Variablen[2]</b>  die Anzahl der in der Klasse zusammengefassten Messwerte. Berechnet wird sie mit: <i>H&ouml;chster Wert der Klasse</i> minus <i>h&ouml;chstem Wert der vorausgegangenen Klasse</i> (hier also mit z.B. 1,89 m- 1,79 m=  0,10 m).</p>
 
<p>Die <i>(exakten)</i> <b>Klassengrenzen (Intervallgrenzen)</b> sind die kleinsten bzw. gr&ouml;&szlig;ten Messwerte einer Klasse (hier also z.B. 1,70 m und 1,79999 =1,8 m).</p>
 
<p>Bei richtiger <b>Klassenbreite</b> sollten keine leeren Klassen (H&auml;ufigkeit = 0) auftreten. Um Ausrei&szlig;er mitbehandeln zu k&ouml;nnen, k&ouml;nnte man die untersten und obersten Klassen offen machen: z.B. &bdquo;kleiner als 1,30 m&ldquo; statt &bdquo;1,20-1,29 m&ldquo; bzw. &bdquo;gr&ouml;&szlig;er als 2,09 m&ldquo; statt &bdquo;2,10-2,19 cm&ldquo;.</p>
 
<p>Die <b>Klassenmitte</b> ist der Durchschnitt des kleinsten und des gr&ouml;&szlig;ten Wertes einer Klasse. Die Klassenmitte von 1,50-1,5999 periodisch w&auml;re daher 1,55 m. Die Klassenmitte wird f&uuml;r sp&auml;tere Berechnungen von Bedeutung sein (z.B. f&uuml;r Durchschnittsberechnungen).</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3<br />
 
[2] Siehe Kapitel 3.1.1.2<br />
 
  
<hr />
+
==== '''Streuungsmaße''' (auch Dispersionsmaße) ====
<h2>3.2.3.1&nbsp;Gruppierung mit SPSS</h2>
 
  
<p>In vielen F&auml;llen, besonders bei <b>stetigen Variablen[1]</b>, wird die Zahl der Auspr&auml;gungen einer Variablen so gro&szlig; sein, dass <b>H&auml;ufigkeitsverteilungen[2]</b>  un&uuml;bersichtlich werden. Im folgenden Beispiel wurde die Altersverteilung der Antwortenden abgefragt:</p>
+
Streuungsmaße geben an, in welchen Bereichen die Daten liegen bzw. um die Lagemaße ''streuen''. Sie sind Kennwerte zur Charakterisierung einer Verteilung. Sie sind Indikatioren für die Variabilität von Merkmalen, wie z.B. von deren Abstand zum ''Arithmetischen Mittel''. Wichtige Streuungsmaße sind die ''Standardabweichung,'' die ''Varianz'' oder der ''Quartilabstand.''
<p><span class="imgbox imgcenter" style="width:139px; .word-wrap:break-word; "><img height="751" border="0" align="bottom" width="139" src="images/quantitative-69_1.gif" alt="Abbildung: Altersverteilung der Befragten" title="Abbildung: Altersverteilung der Befragten"  /><span class="imgcaption">Abbildung: H&auml;ufigkeitsverteilung des Alters der Befragten</span>
 
</span></p>
 
<p>Es w&auml;re deutlich &uuml;bersichtlicher, diese Werte in eine kleine Zahl von Klassen umzukodieren. Dazu ben&uuml;tzen Sie die Funktion TRANSFORMIEREN - <b>UMCODIEREN[3]</b>  in der Men&uuml;leiste. Nun k&ouml;nnen Sie sich entscheiden zwischen einer Umcodierung in die <i>gleiche</i> oder in <i>eine andere Variable</i>. Es ist besser, sich f&uuml;r <i>eine andere Variable</i> zu entscheiden, da durch die <b>Umcodierung</b> (man kann auch mehrere Werte zu einem einzigen neuen umcodieren) Informationsverlust auftreten kann (ob willentlich oder durch einen Bedienungsfehler). Dieses Problem wird durch <i>Umcodierung in eine neue Variable</i> ausgeschlossen.</p>
 
<p>Sie w&auml;hlen nun die Variable aus, welche umcodiert werden soll und geben im Feld <i>Ausgabevariable</i> einen neuen Namen daf&uuml;r ein, der aus Gr&uuml;nden der Kompatibilit&auml;t mit &auml;lteren Programmen acht Zeichen nicht &uuml;berschreiten darf. Im Feld darunter k&ouml;nnen Sie jedoch einen beliebig langen und expressiveren Namen w&auml;hlen.</p>
 
<p>Klicken Sie nun auf <i>Alte und neue Werte</i>. Da Sie mehrere (numerische) Werte zu einem einzigen neuen zusammenfassen m&ouml;chten, k&ouml;nnen Sie jeweils einen Bereich angeben (z.B. <i>Bereich</i> 20 <i>bis</i> 29), wenn Sie alle zwischen 20- 29j&auml;hrigen in eine einzige Altersklasse &rsquo;zwischen 20 und 30 einbringen m&ouml;chten&rsquo;). Klicken Sie nach jeder einzelnen Angabe zur Umcodierung auf <i>Hinzuf&uuml;gen.</i> F&uuml;r die unterste Klasse (alle unter 20j&auml;hrigen w&auml;hlen Sie <i>Bereich, KLEINSTER bis Wert:</i> (hier w&uuml;rden Sie 19 eingeben). F&uuml;r die &uuml;ber 70j&auml;hrigen bilden Sie eine offene Klasse, dazu w&auml;hlen Sie <i>Bereich, Wert bis GR&Ouml;SSTER:</i> und geben hier 70 ein.&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:603px; .word-wrap:break-word; "><img height="378" border="0" align="bottom" width="603" src="images/quantitative-69_2.jpg" alt="Abbildung: Umkodieren mit SPSS" title="Abbildung: Umkodieren mit SPSS"  /><span class="imgcaption">Abbildung: Umkodieren in andere Variablen mit SPSS</span>
 
</span></p>
 
<p>&nbsp;Klicken Sie am Ende auf Weiter und dann auf OK. Ihre Daten werden nun in die neue Variable umcodiert.</p>
 
<p>&nbsp;Die neue H&auml;ufigkeitstabelle sieht jetzt folgenderma&szlig;en aus:</p>
 
<p><span class="imgbox imgcenter" style="width:139px; .word-wrap:break-word; "><img height="165" border="0" align="bottom" width="139" src="images/quantitative-69_3.gif" alt="Abbildung: Häufigkeitabelle umkodierter Variable" title="Abbildung: Häufigkeitabelle umkodierter Variable"  /><span class="imgcaption">Abbildung: H&auml;ufigkeitstabelle der umkodierten Altersverteilung</span>
 
</span></p>
 
<p>Nun m&uuml;ssen wir die neuen Werte, ausschlie&szlig;lich f&uuml;r die Ausgabe von <b>SPSS</b>, <b>r&uuml;ckcodieren</b>, um die Tabelle informativer zu machen, da wir nicht sofort erkennen k&ouml;nnen, dass <i>0 </i> f&uuml;r &rsquo;unter 20&rsquo; steht. Damit SPSS intern mit den numerischen Daten rechnen kann, wir jedoch bei allen Ausgaben (<b>Diagramme[4]</b>, Analysen etc.) informative Bezeichnungen erhalten, klicken wir in SPSS unten links auf die <i>Variablenansicht. </i> Im neuen Fenster finden wir bei der neuen Variable das Attribut <i>Variablenlabel. </i> Nach Doppelklick darauf erscheint folgendes Fenster:</p>
 
<p><span class="imgbox imgcenter" style="width:530px; .word-wrap:break-word; "><img height="307" border="0" align="bottom" width="530" src="images/quantitative-69_4.jpg" alt="Abbildung: Wertelabels definieren" title="Abbildung: Wertelabels definieren"  /><span class="imgcaption">Abbildung: Wertelabels definieren mit SPSS</span>
 
</span></p>
 
<p>Wir geben nun die gew&uuml;nschten Labels f&uuml;r die numerischen Daten ein, also z.B. <i>20-29</i> f&uuml;r die Zahl 1 usw.  Nach Eingabe aller automatisch durchzuf&uuml;hrenden &Auml;nderungen klicken wir auf OK.</p>
 
<p>Wenn wir nun die gleiche <b>H&auml;ufigkeitsberechnung</b> wie oben durchf&uuml;hren, erhalten wir nun folgende leichter verst&auml;ndliche Tabelle:</p>
 
<p><span class="imgbox imgcenter" style="width:155px; .word-wrap:break-word; "><img height="165" border="0" align="bottom" width="155" src="images/quantitative-69_5.gif" alt="Abbildung: Häufigkeitstabelle mit Labels" title="Abbildung: Häufigkeitstabelle mit Labels"  /><span class="imgcaption">Abbildung: H&auml;ufigkeitstabelle mit Klassenlabels</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.1.2<br />
 
[2] Siehe Kapitel 3.1.3<br />
 
[3] Siehe Kapitel 2.2.3.2<br />
 
[4] Siehe Kapitel 3.6<br />
 
  
<hr />
+
==== '''Tau''' (auch Kendall’s Tau) ====
<h2>3.2.4&nbsp;Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS</h2>
 
  
<p>Falls Sie bei einer Frage explizit Mehrfachantworten zugelassen haben, k&ouml;nnen Sie deren <b>H&auml;ufigkeiten</b> mit <b>SPSS</b> komfortabel tabellarisch darstellen.</p>
+
Form der Korrelation. Maß für den Zusammenhang zwischen ordinalskalierten Daten, besonders bei kleinen Zahlen. Siehe auch: '''Rangkorrelation Tau[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5]]]'''.
<h3><b>1. Definition eines Mehrfachantwortensets</b></h3>
 
<p>Sie m&uuml;ssen dazu zuerst ein <i>(Mehrfachantworten-)Set</i> definieren:</p>
 
<p>Klicken Sie in der Men&uuml;leiste auf ANALYSIEREN - MEHRFACHANTWORT - SET DEFINIEREN. Dann &ouml;ffnet sich folgendes Fenster:</p>
 
<p><span class="imgbox imgcenter" style="width:572px; .word-wrap:break-word; "><img height="365" border="0" align="bottom" width="572" src="images/quantitative-70_1.jpg" alt="Abbildung: Mehrfachantwortenset definieren" title="Abbildung: Mehrfachantwortenset definieren"  /><span class="imgcaption">Abbildung: Definieren eines Mehrfachantwortensets mit SPSS</span>
 
</span></p>
 
<p>F&uuml;hren Sie bitte folgende Schritte durch:</p>
 
<p>A. Sie w&auml;hlen verschiedene dichotome Variable aus, die Sie in <i>Variablen im Set </i> einf&uuml;gen;</p>
 
<p>B. Tragen Sie unter <i>Gez&auml;hlter Wert</i> die Zahl 1 ein (d.h. dass jede Ja-Stimme einen Punkt z&auml;hlt);</p>
 
<p>C. Sie lassen die Standardauswahl <i>Dichotomien</i> bei <i>Variablen kodiert als</i>;</p>
 
<p>D. Sie w&auml;hlen einen Kurznamen (max. acht Zeichen f&uuml;r das Set) und tragen ihn unter <i>Name</i> ein;</p>
 
<p>E. Sie tragen unter <i>Beschriftung</i> einen l&auml;ngeren Namen ein, welcher die Tabelle anschaulich beschriften soll.</p>
 
<p>F. Klicken Sie nun auf Hinzuf&uuml;gen und letztendlich auf <i>Schlie&szlig;en.</i></p>
 
<p>Das Set ist nun definiert, Sie k&ouml;nnen zur Analyse gehen:</p>
 
<h3><b>2. Analyse</b></h3>
 
<p>A. Klicken Sie auf ANALYSIEREN - MEHRFACHANTWORT - H&Auml;UFIGKEITEN. Das folgende Fenster &ouml;ffnet sich:</p>
 
<p><span class="imgbox imgcenter" style="width:403px; .word-wrap:break-word; "><img height="256" border="0" align="bottom" width="403" src="images/quantitative-70_2.jpg" alt="Abbildung: Analyse von Mehrfachantworten" title="Abbildung: Analyse von Mehrfachantworten"  /><span class="imgcaption">Abbildung: H&auml;ufigkeitsanalyse von Mehrfachantwortensets mit SPSS</span>
 
</span></p>
 
<p>B. W&auml;hlen Sie das <b>Mehrfachantworten-Set</b>, welches Sie angelegt haben und ziehen Sie es in das Feld <i>Tabelle(n) f&uuml;r:</i></p>
 
<p>C. Klicken Sie auf OK. Die Analyse wird durchgef&uuml;hrt:</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="221" border="0" align="bottom" width="500" src="images/quantitative-70_3.jpg" alt="Abbildung: Häufigkeitstabelle eines Mehrfachantwortensets" title="Abbildung: Häufigkeitstabelle eines Mehrfachantwortensets"  /><span class="imgcaption">Abbildung: H&auml;ufigkeitstabelle eines Mehrfachantwortensets</span>
 
</span></p>
 
<hr />
 
<h2>3.3&nbsp;&quot;Mittelwerte&quot;: Lagemaße und Maßzahlen der zentralen Tendenz</h2>
 
  
<p><b>Lagema&szlig;e</b> beschreiben das <b>Zentrum einer Verteilung</b> durch eine Kennzahl.</p>
+
==== '''Tortendiagramm''' ====
<p>Wenn wir von einem Land wissen, dass seine EinwohnerInnen durchschnittlich 2000 &euro; monatlich verdienen, dann liefern uns Lagema&szlig;e eine erste ungenaue Idee, wo sich die EinwohnerInnen des Landes einkommensm&auml;&szlig;ig im Weltma&szlig;stab einordnen lassen, sie &rsquo;liegen&rsquo; in der Gruppe der reicheren L&auml;nder.</p>
 
<p>Lagema&szlig;e werden oft auch als <b>Ma&szlig;zahlen der zentralen Tendenz</b> bezeichnet. Die am h&auml;ufigsten benutzten Lagema&szlig;e sind das <b>arithmetische  Mittel</b>, das <b>geometrische Mittel</b>, der  <b>Median</b> und der  <b>Modalwert</b>.</p>
 
<ul>
 
    <li>Das <b>arithmetische Mittel</b> bezeichnet den Durchschnittswert aller Eintr&auml;ge,&nbsp;</li>
 
    <li>das <b>geometrische Mittel</b> bezieht sich auf den Durchschnittswert voneinander abh&auml;ngiger Werte (die sich also gegenseitig beeinflussen),</li>
 
    <li>der <b>Median</b> kennzeichnet die Normalit&auml;t (welcher Wert befindet sich gr&ouml;&szlig;enm&auml;&szlig;ig wirklich in der Mitte der Eintr&auml;ge und entspricht somit am ehesten dem &rsquo;Normalfall&rsquo;),</li>
 
    <li>der <b>Modalwert</b> bezeichnet ausschlie&szlig;lich den am h&auml;ufigsten vorkommenden Wert, der keinerlei Hinweis &uuml;ber die Eigenheiten der anderen Werte gibt.</li>
 
</ul>
 
<p>Je nach <b>Verteilung[1]</b>, <b>Skalenniveau[2]</b>  und <b>Art der Daten[3]</b>  sind unterschiedliche <b>Lagema&szlig;e</b> sinnvoll. Bei gegebener <b>Normalverteilung[4]</b>  stimmen sowohl <b>Median</b> wie auch der <b>Modalwert</b> mit dem <b>Arithmetischen Mittel</b> &uuml;berein. In schiefen Verteilungen hingegen nehmen sie sehr unterschiedliche Positionen ein. In rechtsschiefen Verteilungen (der Abfall erfolgt nach rechts) ist der Modalwert am kleinsten, danach kommt der Median, am gr&ouml;&szlig;ten ist der Mittelwert. In <b>linksschiefen Verteilungen</b> ist es umgekehrt.</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="400" border="0" align="bottom" width="500" alt="Abbildung: Lagemaße in rechtsschiefer Verteilung" title="Abbildung: Lagemaße in rechtsschiefer Verteilung"  src="images/quantitative-71_1.jpg" /><span class="imgcaption">Abbildung: Unterschiedliche Lage von Median, Mittelwert und Modalwert in rechtsschiefer Verteilung</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3<br />
 
[2] Siehe Kapitel 3.1.2<br />
 
[3] Siehe Kapitel 3.1.1<br />
 
[4] Siehe Kapitel 3.1.3.1<br />
 
  
<hr />
+
Siehe ''Kreisdiagramm''
<h2>3.3.1&nbsp;Modalwert</h2>
 
  
<p>Unter einem <b>Modalwert</b> versteht man <b>die am h&auml;ufigsten vorkommende Auspr&auml;gung</b> einer Variable.</p>
 
<p><b>Beispiel:</b><br />
 
In der folgenden geordneten Zahlenreihe 2, 3, 3, 3, 4, 4, 5, 6, 7 w&auml;re <i>3</i> der Modalwert (weil diese Zahl dreimal auftritt, h&auml;ufiger als jede andere Zahl).</p>
 
<h3><b>Mittelung bei benachbarten gleichgro&szlig;en Werten</b></h3>
 
<p>Falls mehrere benachbarte Werte die gr&ouml;&szlig;te H&auml;ufigkeit aufweisen, so wird ihr <b>arithmetisches Mittel</b> berechnet. Haben z.B. die Werte 5 und 6 gleicherma&szlig;en die gr&ouml;&szlig;te H&auml;ufigkeit, so ist der Modalwert der Durchschnitt dieser beiden Werte.</p>
 
<p><b>Beispiel:</b><br />
 
In der Zahlenreihe 2, 3, 3, 3, 4, 4, 4, 5, 6, 7 liegt der Modalwert bei 3,5. Sowohl <i>3</i> wie auch <i>4</i> kommen mit jeweilig dreimaligem Auftreten h&auml;ufiger als die anderen Werte vor. Das arithmetische Mittel von <i>3</i> und <i>4 </i> liegt bei 3,5.</p>
 
<h3><b>Modalklasse: Klasse mit gr&ouml;&szlig;ter Zahl an Eintr&auml;gen</b></h3>
 
<p>Bei <b>klassierten Daten[1]</b>  ist die <b>Modalklasse</b> diejenige Klasse mit der gr&ouml;&szlig;ten Zahl an Eintr&auml;gen</p>
 
<h3><b>Nur selten praktische Relevanz des Modalwerts</b></h3>
 
<p>Der <b>Modalwert</b> ist aussagekr&auml;ftig, wenn ein einzelner Wert sehr h&auml;ufig vorkommt (z.B. 27 <b>Frauen</b> und drei M&auml;nner) und unsinnig, wenn der h&auml;ufigste Wert nur relativ selten vorkommt. Der <b>Modalwert</b> kann im Gegensatz zum <b>arithmetischen Mittelwert</b> oder zum <b>Median</b> auch sinnvoll in <b>Nominalskalen[2]</b>  verwendet werden.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2.3<br />
 
[2] Siehe Kapitel 3.1.2.2<br />
 
  
<hr />
 
<h2>3.3.2&nbsp;Arithmetisches Mittel</h2>
 
  
<p>Das <b>arithmetische Mittel</b> ist die Summe aller Messwerte geteilt durch deren Anzahl:</p>
+
'''Verweise:'''<br />
<p><span class="imgbox imgcenter" style="width:468px; .word-wrap:break-word; "><img height="84" border="0" align="bottom" width="468" src="images/quantitative-73_1.jpg" alt="Abbildung: Formel arithmetisches Mittel" title="Abbildung: Formel arithmetisches Mittel"  /><span class="imgcaption">Abbildung: Formel f&uuml;r das arithmetische Mittel</span>
+
[http://de.wikipedia.org/wiki/Soziale_Schichtung &#91;1&#93; http://de.wikipedia.org/wiki/Soziale_Schichtung]<br />
</span></p>
+
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;2&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
<p>Z.B. die durchschnittliche Zahl von Schafen der Bauern im Dorf Nkorongoji in Mali: Die Messwerte sind: 5, 12, 3, 4, 7, 6. Die Summe ist 37, die Zahl der Messwerte ist 6, also ist das arithmetische Mittel 37/6= 6,17.&nbsp;</p>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.2 Rangkorrelation R Krueger-Spearman|[3] Siehe Kapitel 3.5.3.2]]<br />
<h3><b>Arithmetisches Mittel bei Einteilung der Messwerte in Klassen:</b></h3>
+
[http://de.wikipedia.org/wiki/Standardabweichung &#91;4&#93; http://de.wikipedia.org/wiki/Standardabweichung]<br />
<p>Wenn die Daten zahlreicher sind bzw. bereits in <b>Klassen[1]</b>  eingeteilt wurden, kann man das <b>arithmetische Mittel</b> einfacher berechnen: man multipliziert in jeder Klasse die <b>Klassenmitte</b> (Durchschnitt aus dem theoretisch kleinstem und gr&ouml;&szlig;ten Wert einer Klasse) mit der Zahl der Eintr&auml;ge in der jeweiligen Klasse:&nbsp;</p>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Korrelation#3.5.3.3 Rangkorrelation Tau Kendall|[5] Siehe Kapitel 3.5.3.3]]<br />
<p><span class="imgbox imgcenter" style="width:300px; .word-wrap:break-word; "><img height="80" border="0" align="bottom" width="300" src="images/quantitative-73_2.jpg" alt="Formel: Arithmetisches Mittel bei Messwertklassen" title="Formel: Arithmetisches Mittel bei Messwertklassen"  /><span class="imgcaption">Formel: Arithmetisches Mittel bei Einteilung der Messwerte in Klassen</span>
 
</span></p>
 
<p><span class="imgbox imgcenter" style="width:613px; .word-wrap:break-word; "><img height="182" border="0" align="bottom" width="613" src="images/quantitative-73_3.jpg" alt="Abbildung: Beispiel Klassenmitte" title="Abbildung: Beispiel Klassenmitte"  /><span class="imgcaption">Abbildung: Beispiel f&uuml;r die Klassenmitte von Messwertklassen</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p>Der Durchschnitt, in diesem Fall das durchschnittliche Gehalt, w&auml;re somit 14500/17=  852,94.</p>
 
<p>Das <b>arithmetische Mittel</b> st&ouml;&szlig;t bei bestimmten Datenlagen jedoch auch auf einige Probleme.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2.3<br />
 
  
<hr />
 
<h2>3.3.3&nbsp;Median</h2>
 
  
<p>Der <b>Median</b> ist jener Wert, welcher in einer gr&ouml;&szlig;enm&auml;&szlig;ig geordneten Reihe <b>genau in der Mitte</b> liegt. D.h. oberhalb wie unterhalb von ihm befindet sich eine gleichgro&szlig;e Anzahl von Eintr&auml;gen.</p>
 
<p>Warum ben&ouml;tigen wir ihn, da es doch auch das <b>arithmetische Mittel[1]</b>  gibt? Das <b>arithmetische Mittel</b> ist der Mittelwert, der sich ergibt, wenn wir eine Summe durch die Anzahl der gez&auml;hlten Elemente dividieren.</p>
 
<h3><b>Beispiel: Verzerrung durch Mittel, nicht aber durch Median</b></h3>
 
<p>Die folgende Grafik zeigt das individuelle Einkommen der EinwohnerInnen des fiktiven Ortes Largebread im Jahr 2002:</p>
 
<p><span class="imgbox imgcenter" style="width:480px; .word-wrap:break-word; "><img height="384" border="0" align="bottom" width="480" alt="Abbildung: Durchschnittseinkommen" title="Abbildung: Durchschnittseinkommen"  src="images/quantitative-74_1.jpg" /><span class="imgcaption">Abbildung: Durchschnittseinkommen in Largebread</span>
 
</span></p>
 
<p>Das durchschnittliche Einkommen von etwa 26000 $ scheint die Einkommenssituation der EinwohnerInnen von Largebread gut zu beschreiben. Die <b>Normalverteilungskurve[2]</b>  zeigt uns an, dass das Einkommen relativ gut normalverteilt ist.</p>
 
<p>Was w&uuml;rde aber jetzt passieren, wenn der reichste Mann der Welt, Bill Gates, sich pl&ouml;tzlich entschlie&szlig;en w&uuml;rde, nach Largebread zu ziehen? Bill Gates verf&uuml;gt &uuml;ber ein Jahreseinkommen von 5 Milliarden $. Das Diagramm ver&auml;ndert sich extrem:</p>
 
<p><span class="imgbox imgcenter" style="width:480px; .word-wrap:break-word; "><img height="384" border="0" align="bottom" width="480" alt="Abbildung: Durchschnittseinkommen mit Bill Gates" title="Abbildung: Durchschnittseinkommen mit Bill Gates"  src="images/quantitative-74_2.jpg" /><span class="imgcaption">Abbildung: Durchschnittseinkommen von Largebread mit Bill Gates</span>
 
</span></p>
 
<p>Haben ohne Bill Gates die 1100  EinwohnerInnen von Largebread durchschnittlich 26064 $ im Jahr verdient, so sind sie nun scheinbar &uuml;ber Nacht reich geworden und verdienen mit Bill Gate nun durchschnittlich fast 5 Millionen Dollar im Jahr. Man sieht deutlich, dass einzelne &quot;Ausrei&szlig;er&quot; wie Bill Gates einen derartigen Durchschnittswert unsinnig machen k&ouml;nnen. Zur Beschreibung der Realit&auml;t von Largebread ist daher ein Indikator f&uuml;r das durchschnittliche Einkommen deutlich besser geeignet, welcher Ausrei&szlig;er nicht ber&uuml;cksichtigt, n&auml;mlich der Median: Das Durchschnittseinkommen in Largebread, berechnet nach dem Median, liegt ohne Bill Gates bei 26.000 und auch mit ihm nur bei 26.000 $.</p>
 
<p><b>Probleme des Arithetischen Mittel:</b></p>
 
<p>Das arithmetische Mittel st&ouml;&szlig;t somit an seine Grenzen:</p>
 
<ul>
 
    <li>wo <b>extreme Grenzwerte</b> auftreten (wie in Largebread),</li>
 
    <li><b>bei sehr kleiner Beobachtungszahl</b> (einzelne Werte k&ouml;nnen besonders leicht den Durchschnittswert verzerren),</li>
 
    <li><b>bei Verteilungen mit offenen Klassen</b> (Schwierigkeit der Bestimmung der Klassenmitte der offenen Klassen),</li>
 
    <li>bei <b>Ordinalskalen[3]</b>  (hier sollte er nicht verwendet werden).</li>
 
</ul>
 
<p>In all diesen F&auml;llen ist es genauer,  zum Median zu greifen.  <b>Der Median ist der Wert, der in einer geordneten Liste (oder prim&auml;ren Tafel) genau in der Mitte liegt, d.h. dass sich genauso viele Werte oberhalb wie unterhalb des Wertes befinden. Dieser Wert liegt an (n+1)/2ter Position.</b> Hat man 3 Werte, dann ist der Medien der 2. Wert ([3+1]/2).</p>
 
<p><b>Berechnung des Median bei Urliste:</b></p>
 
<ul>
 
    <li>Werte nach Gr&ouml;&szlig;e rangreihen,</li>
 
    <li>mittleren Wert nehmen,</li>
 
    <li>liegt der Median zwischen 2 Werten (wenn Median nicht ganze Zahl ist), dann wird der Durchschnitt der ihn umgebenden 2 Werte genommen.</li>
 
</ul>
 
<p>z.B. Schulnoten 3,2,2,5,1,1,2,5 -&gt; Rangreihung: 1,1,2,2,2,3,5,5 -&gt; Der 4,5. Wert (Durchschnitt aus 2+2) ist der Median, also 2.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.2<br />
 
[2] Siehe Kapitel 3.1.3.3.1<br />
 
[3] Siehe Kapitel 3.1.2.3<br />
 
  
<hr />
+
= 5.8 U-Z =
<h2>3.3.3.1&nbsp;Median bei gruppierten Daten</h2>
 
  
<p>Bei <b>gruppierten Daten</b> ist die Berechnung des <b>Medians</b> ein wenig komplizierter. Hier ist die rechnerische Abfolge:</p>
+
==== '''unabhängig''' ====
<ul>
 
    <li>Bildung der <b>H&auml;ufigkeitstabelle</b> (inklusive kumulierter H&auml;ufigkeiten)</li>
 
    <li>Ermittlung der Klasse <i>m</i>, in welcher der <b>Median</b> steckt: wo liegt der Wert (n+1)/2. Diese wird nun als <b>Medianklasse</b> bezeichnet (n= Gesamtanzahl der Eintr&auml;ge)</li>
 
    <li>Ermittlung der unteren (=x<sup>mu</sup>) und oberen <b>Klassengrenze</b> (x) von  <i>m</i></li>
 
    <li>Ermittlung der <b>Klassenbreite</b> <i>h</i> (ergibt sich aus obere Klassengrenze - untere Kl.Grenze) .</li>
 
    <li>Subtraktion der akkumulierten H&auml;ufigkeit aller Klassen bis zur Klasse <i>m</i> (d.h. die Klassen 1 bis m-1) von n/2 -&gt; Position des Medians in der Medianklasse</li>
 
    <li>Division der Position durch die Zahl der Werte der Klasse = relative Gr&ouml;&szlig;enordnung des Medians (Anteile vom Ganzen der Klasse)</li>
 
    <li>Multiplikation des relativen Klassenanteils mit der Klassenbreite = absolute Gr&ouml;&szlig;enordnung des Medians <b>innerhalb</b> der Klasse</li>
 
    <li>Addition der unteren Klassengrenze (in welcher der Median liegt) zur absoluten Gr&ouml;&szlig;e des Medians (in der Klasse) = Endergebnis = Median <i>Z</i></li>
 
</ul>
 
<p>&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:243px; .word-wrap:break-word; "><img height="109" border="0" align="bottom" width="243" src="images/quantitative-75_1.jpg" alt="Abbildung: Formel Median bei gruppierten Daten" title="Abbildung: Formel Median bei gruppierten Daten"  /><span class="imgcaption">Abbildung: Formel f&uuml;r den Median bei gruppierten Daten</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p><b>Beispiel:</b> Zeitverbrauch bei L&ouml;sung einer Aufgabe</p>
 
<p><span class="imgbox imgcenter" style="width:539px; .word-wrap:break-word; "><img height="174" border="0" align="bottom" width="539" src="images/quantitative-75_2.jpg" alt="Abbildung: Beispiel Zeitverbrauch" title="Abbildung: Beispiel Zeitverbrauch"  /><span class="imgcaption">Abbildung: Beispiel - Tabelle f&uuml;r den Zeitverbrauch bei der L&ouml;sung einer Aufgabe</span>
 
</span></p>
 
<p>&nbsp;n=37, Median ist also der 18. Wert, dieser liegt in der Klasse 5 (4,5-5,5 Minuten Dauer), daher:</p>
 
<p><span class="imgbox imgcenter" style="width:242px; .word-wrap:break-word; "><img height="98" border="0" align="bottom" width="242" src="images/quantitative-75_3.jpg" alt="Abbildung: Beispiel Berechnung des Medians" title="Abbildung: Beispiel Berechnung des Medians"  /><span class="imgcaption">Abbildung: Berechnung des Medians f&uuml;r das Beispiel &quot;Zeitverbrauch&quot;</span>
 
</span></p>
 
<p>Der Median liegt somit bei 5.</p>
 
<hr />
 
<h2>3.3.4&nbsp;Geometrisches Mittel</h2>
 
  
<p>Das <b>geometrische Mittel</b> ist der <b>Mittelwert bei mathematischen Produkten</b>, wie z.B. bei Wachstums- oder Zinsfaktoren. Das geometrische Mittel kann nur bei <b>Proportionalskalen[1]</b>  verwendet werden. Dieses wird als n- te Wurzel aus der relativen Ver&auml;nderung (Endwert dividiert durch Anfangswert) berechnet, wobei n der Zahl der Zeiteinheiten entspricht.</p>
+
Eine Variable ist ''unabhängig'', wenn sie in einer Untersuchung variiert werden kann, um ihre Auswirkungen auf eine abhängige Variable zu erfassen (z.B. Menge von Düngemitteln: unabhängige Variable, Ernte-Ergebnis: abhängige Variable).
<p><b>Beispiel: durchschnittliche Inflationsrate</b><br />
 
Nehmen wir an, die j&auml;hrliche Inflationsrate h&auml;tte  durch 10 Jahre hindurch jeweils 2 % pro Jahr betragen. Hier w&auml;re es falsch anzunehmen, dass die Inflation nach den 10 Jahren um 20 % h&ouml;her als davor liegt, da sich die Werte gegenseitig beeinflussen. Im ersten Jahr sind es 2 % Inflation von 100 %; im 2. Jahr 2 % von 102 % (also 2,04 % Preissteigerung verglichen mit dem Ausgangsjahr), im 3. Jahr 2 von 104,04 (= 2,0808 % vergleichen mit dem Ausgangsjahr).</p>
 
<p>&Auml;hnlich m&uuml;ssen wir zur&uuml;ckrechnen, wenn wir von einem bestimmten Preisniveau nach 10 Jahren auf die durchschnittliche Inflationsrate dieser 10 Jahre schlie&szlig;en wollen.</p>
 
<h3><b>Errechnung der durchschnittlichen Inflationsrate</b></h3>
 
<p>Der Lebenshaltungskostenindex liegt 2006 bei 136,5, vor 10 Jahren lag dieser bei 100. Somit erfolgte eine Preissteigerung von 36,5 % im Laufe der letzten 10 Jahre. Es w&auml;re hier falsch, als durchschnittliche Preissteigerung/Jahr den Wert 3,65 % anzunehmen (36,5 % durch die Zahl der Jahre, also 10, dividiert), da sich die Werte gegenseitig beeinflussten (multiplizierten).</p>
 
<p>Den richtigen Wert erh&auml;lt man, wenn man die 10. Wurzel (da 10 Jahre) aus dem Gesamtver&auml;nderungsfaktor zieht. Diesen erh&auml;lt man, indem man den Endwert durch den Ausgangswert dividiert: 136,5 dividiert durch 100 ist 1,365. Die 10.Wurzel daraus ist 1,0304. 100 multipliziert mit 1,024*1,0304*1,0304 etc. (insgesamt 10x damit multipliziert) ergibt nach 10 Jahren 136,5.</p>
 
<p>Die Differenz zu 1 multipliziert mit 100 (es handelt sich ja um Prozente, bisher sind es nur Teile vom Ganzen) ist 0,0304*100 = 3,04 % j&auml;hrliche Preissteigerung (und nicht 3,65, wenn wir das rein arithmetische Mittel genommen h&auml;tten).</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2.5<br />
 
  
<hr />
+
==== '''univariat''' ====
<h2>3.3.5&nbsp;Harmonisches Mittel</h2>
 
  
<p>Das <b>harmonische Mittel</b> ist ein geeignetes Lagema&szlig; f&uuml;r Gr&ouml;&szlig;en, die durch einen <b>(relativen) Bezug auf eine Einheit</b> definiert sind: z.B. Geschwindigkeiten (Strecke pro Zeiteinheit) oder Ernteertr&auml;ge (Gewicht oder Volumen pro Fl&auml;cheneinheit).</p>
+
Als u. werden Methoden und Kennzahlen bezeichnet, die sich auf eine einzige Variable beziehen.
<p>Die zur Berechnung ben&ouml;tigte Formel ist:</p>
 
<p><span class="imgbox imgcenter" style="width:130px; .word-wrap:break-word; "><img height="86" border="0" align="bottom" width="89" src="images/quantitative-77_1.jpg" alt="Abbildung: Formel harmonisches Mittel" title="Abbildung: Formel harmonisches Mittel"  /><span class="imgcaption">Abbildung: Formel f&uuml;r die Berechnung des harmonischen Mittels</span>
 
</span></p>
 
<p><b>Beispiel: Durchschnittsreisegeschwindigkeit</b><br />
 
Elke f&auml;hrt von Wien nach Melk (etwa 100 km) mit einer Durchschnittsgeschwindigkeit von 80 km/h. Anschlie&szlig;end f&auml;hrt sie mit durchschnittlich 120 km/h von Melk nach Linz und legt dabei ebenfalls 100 km zur&uuml;ck. Wie schnell fuhr sie im Schnitt?</p>
 
<p>Die meisten Befragten w&uuml;rden nach kurzer &Uuml;berlegung 100 km/h als Durchschnittsgeschwindigkeit angeben. Doch ist dies falsch, da Elke unterschiedlich lange mit diesen beiden Geschwindigkeiten unterwegs war. Elke braucht f&uuml;r die ersten 100 km, die sie mit 80 km/h zur&uuml;cklegt, insgesamt 100/80 Stunden, also 1,25 Stunden oder 1 Stunde und 15 Minuten. F&uuml;r die zweiten Hundert Kilometer, die sie mit 120 km/h zur&uuml;cklegt, ben&ouml;tigt sie 100/120 Stunden, also 5/6 Stunden oder 50 Minuten. Insgesamt legte sie somit 200 km in einer Zeit von 2,083 Stunden zur&uuml;ck (2 Stunden und 5 Minuten). 200 km dividiert durch die Zeit, die sie daf&uuml;r ben&ouml;tigte, ergibt nun eine Durchschnittsgeschwindigkeit von 96,02 km/h.</p>
 
<hr />
 
<h2>3.3.5.1&nbsp;Harmonisches Mittel mit SPSS</h2>
 
  
<p>Legen Sie zwei Variable an.Variable 1 f&uuml;r die Distanz, Variable 2 f&uuml;r die Geschwindigkeit. Nach Eingabe der Werte klicken Sie auf ANALYSIEREN - MITTELWERTE VERGLEICHEN - MITTELWERTE und geben dort unter <i>Abh&auml;ngige Variable</i> die Geschwindigkeit ein, unter <i>Unabh&auml;ngige Variable</i> die Distanz.</p>
+
==== '''Urliste''' ====
<p><span class="imgbox imgcenter" style="width:485px; .word-wrap:break-word; "><img height="249" border="0" align="bottom" width="485" alt="Abbildung: Harmonisches Mittel mit SPSS" title="Abbildung: Harmonisches Mittel mit SPSS"  src="images/quantitative-78_1.jpg" /><span class="imgcaption">Abbildung: Berechnung des harmonischen Mittels mit SPSS</span>
 
</span></p>
 
<p>&nbsp;Klicken Sie dann auf <i>Optionen</i> und w&auml;hlen Sie im n&auml;chsten Fenster das <b>Harmonische Mittel</b> aus. Fertig.</p>
 
<hr />
 
<h2>3.3.6&nbsp;Wann welche Lagemaße?</h2>
 
  
<p style="text-align: left;">&nbsp;<span class="imgbox imgcenter" style="width:594px; .word-wrap:break-word; "><img height="250" border="0" align="bottom" width="594" alt="Abbildung: Geeignetes Lagemaß" title="Abbildung: Geeignetes Lagemaß"  src="images/quantitative-79_1.jpg" /><span class="imgcaption">Abbildung: Geeignetes Lagema&szlig; bei verschiedenen Skalen</span>
+
Die U. ist die ungeordnete Zusammenstellung des Datenmaterials. Siehe auch: '''Listen und Tafeln[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1]]]'''.
</span></p>
 
<p style="text-align: left;">Die Zahl in Klammern gibt die Priorit&auml;t an. X(1) wird daher als wichtiger als X(2) eingestuft. Fett markiertes X bezeichnet Kennzahlen, welche bei der gegebenen Datenart absolut sinnvoll sind, nicht fettes X liefert m&ouml;gliche, aber nicht besonders sinnvolle oder teilweise sogar in die Irre f&uuml;hrende Werte.</p>
 
<p style="text-align: left;">W&auml;hrend Lagema&szlig;e bei <b>eingipfeligen symmetrischen[1]</b> <b>Daten</b> weitgehend &uuml;bereinstimmen und typisch f&uuml;r die Daten sind, sind sie bei <b>anderen Verteilungsformen[2]</b>  (<b>U-f&ouml;rmige</b>, sehr <b>schiefe</b>, <b>mehrgipfelige</b>, <b>gleichverteilte</b>) nicht aussagekr&auml;ftig f&uuml;r die Verteilung.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3.1<br />
 
[2] Siehe Kapitel 3.1.3.2<br />
 
  
<hr />
+
==== '''Validität''' (auch Gültigkeit) ====
<h2>3.3.7&nbsp;Berechnung von Lagemaßen mit SPSS</h2>
 
  
<p>W&auml;hrend das <b>geometrische Mittel[1]</b>  mit jedem mathematischen Taschenrechner leicht berechnet werden kann (einfach n-te Wurzel aus der Endzahl), sind die <b>Lagema&szlig;e</b> mit SPSS sehr einfach zu berechnen.</p>
+
Die V. gehört zu den sogenannten ''Gütekriterien'' für die Qualität einer Datenerhebung. Sie bezeichnet die Eigenschaft, wirklich das zu messen, was bei der Untersuchung gemessen werden soll. Wenn z.B. die Fragen eines Fragebogens nur ungenügend geeignet sind, die Hypothesen zu überprüfen, dann ist die Validität in Frage gestellt. Siehe auch: '''Validität (Wikipedia)[http://de.wikipedia.org/wiki/Validit%C3%A4t &#91;2&#93;]'''.
<p>Klicken Sie in der Men&uuml;leiste auf ANALYSIEREN - H&Auml;UFIGKEITEN und w&auml;hlen Sie dann <i>Statistik</i> aus:</p>
 
<p><span class="imgbox imgcenter" style="width:550px; .word-wrap:break-word; "><img height="366" border="0" align="bottom" width="550" alt="Abbildung: Lagemaße mit SPSS" title="Abbildung: Lagemaße mit SPSS"  src="images/quantitative-80_1.jpg" /><span class="imgcaption">Abbildung: Berechnung von Lagema&szlig;en mit SPSS</span>
 
</span></p>
 
<p>Nun k&ouml;nnen Sie alle <b>Lagema&szlig;e</b> ausw&auml;hlen, den <b>Mittelwert</b>, den <b>Median</b> und den <b>Modalwert</b>. Das folgende Resultat stammt aus der Berechnung der Lagema&szlig;e des Bruttonationalprodukts der L&auml;nder dieser Welt im Jahr 1995 (world95.sav).</p>
 
<p><span class="imgbox imgcenter" style="width:229px; .word-wrap:break-word; "><img height="154" border="0" align="bottom" width="229" alt="Abbildung: Lagemaße des BNE" title="Abbildung: Lagemaße des BNE"  src="images/quantitative-80_2.gif" /><span class="imgcaption">Abbildung: Lagema&szlig;e des BNE aller L&auml;nder der Welt</span>
 
</span></p>
 
<p>Wir sehen, dass die <b>Lagema&szlig;e</b> extrem auseinanderliegen. Warum, macht das <b>Histogramm[2]</b>  mit <b>Normalverteilungskurve[3]</b>  (anklicken unter <i>Diagramme</i>) sofort sichtbar: Eine kleine Zahl von reichen L&auml;ndern hebt das <b>arithmetische Mittel</b> auf ein Niveau, welches au&szlig;erhalb der Reichweite der meisten L&auml;nder dieser Welt liegt:</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="400" border="0" align="bottom" width="500" alt="Abbildung: Histogramm BNE" title="Abbildung: Histogramm BNE"  src="images/quantitative-80_3.jpg" /><span class="imgcaption">Abbildung: Histogramm des BNE aller L&auml;nder der Welt</span>
 
</span></p>
 
<p>W&auml;re es eine <b>Normalverteilung</b>, w&uuml;rden im Bereich (Artithm. Mittel +/s s) 68 % aller Werte liegen. Zieht man jedoch die Standardabweichung s (= 6479) vom Mittelwert ab, gelangt man am linken Rand bereits in den negativen Einkommensbereich. Auch dies zeigt die Sinnlosigkeit der Verwendung des <b>arithmetischen Mittels</b> bei diesen Daten. Der <b>Median</b> hingegen bildet hier die Realit&auml;t mit knapp 3000 $ wesentlich besser ab.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.4<br />
 
[2] Siehe Kapitel 3.6.1.5<br />
 
[3] Siehe Kapitel 3.1.3.1<br />
 
  
<hr />
+
==== '''Variable''' ====
<h2>3.4&nbsp;Streuungsmaße oder &rsquo;Wie allgemeingültig ist der Mittelwert&rsquo;</h2>
 
  
<p><b>Streuungsma&szlig;e</b> informieren &uuml;ber die Verteilung von Auspr&auml;gungen au&szlig;erhalb des Zentrums. Sie liefern dadurch wertvolle Informationen &uuml;ber die (Un-)Ausgeglichenheit einer Verteilung.&nbsp;</p>
+
Eine Variable ist ein in verschiedenen Ausprägungen vorhandenes Merkmal eines Untersuchungsgegenstandes: z.B. Geschlecht: männlich/weiblich; Größe gemessen in cm.
<h3><b>Grafische Darstellung der Streuung durch Histogramme</b></h3>
 
<p><b>Histogramme[1]</b>  zeigen die relative &quot;Gerechtigkeit&quot; einer Verteilung in graphischer Form, wie z.B. das folgende &uuml;ber das Bruttonationalprodukt der L&auml;nder dieser Welt im Jahr 1991.</p>
 
<p><span class="imgbox imgcenter" style="width:480px; .word-wrap:break-word; "><img height="384" border="0" align="bottom" width="480" src="images/quantitative-81_1.jpg" alt="Abbildung: Bruttonationalprodukt" title="Abbildung: Bruttonationalprodukt"  /><span class="imgcaption">Abbildung: Histogramm Bruttonationalprodukt 1991</span>
 
</span></p>
 
<p>Dieses <b>Histogramm</b> zeigt optisch deutlich, dass im Jahr 1991  das durchschnittliche Bruttonationalprodukt von 5860 $ f&uuml;r die meisten L&auml;nder unerreichbar fern lag und damit keinerlei Aussagekraft f&uuml;r ihre Realit&auml;t hatte. Der <b>Median[2]</b>  lag damals bei der H&auml;lfte des <b>Mittelwerts[3]</b>, n&auml;mlich bei 2995 $. Ein Viertel der L&auml;nder wies ein Bruttonationalprodukt auf, welches unter 996 $ lag, ein F&uuml;nftel unter 681 $, ein Zehntel der L&auml;nder dieser Welt sogar unter 323 Dollar.</p>
 
<h3><b>Lagema&szlig;e zeigen oft nur verzerrtes Bild der Realit&auml;t bzw. Normalit&auml;t</b></h3>
 
<p>Man ersieht daraus, dass Kennzahlen wie das <b>arithmetische Mittel[4]</b>  oft nur wenig geeignet sind, die Normalit&auml;t darzustellen, d.h. dass der Wert des arithmetischen Mittel erheblich von der <b>Realit&auml;t</b> der meisten Auspr&auml;gungen verschieden sein kann.</p>
 
<p>Wir ben&ouml;tigen daher weitere Kennzahlen, sogenannte <b>Streuungsma&szlig;e</b>, um Auskunft &uuml;ber die Randbereiche der Auspr&auml;gungen zu erhalten. Dazu z&auml;hlen besonders die <b>Standardabweichung</b> und <b>Perzentile</b> bzw. <b>Quartile[5]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.5<br />
 
[2] Siehe Kapitel 3.3.3<br />
 
[3] Siehe Kapitel 3.3.2<br />
 
[4] Siehe Kapitel 3.3.2<br />
 
[5] Siehe Kapitel 3.4.3.1<br />
 
  
<hr />
+
==== '''Variationsweite''' (siehe Range). ====
<h2>3.4.1&nbsp;Varianz</h2>
 
  
<p><b>Die Varianz ist eine Kennzahl, welche die Streuung aller Daten ber&uuml;cksichtigt.</b> Sie wird berechnet, indem man den Durchschnitt der quadrierten Abweichung vom <b>Arithmetischen Mittel[1]</b>  berechnet.</p>
+
==== '''Varianz''' ====
<p><span class="imgbox imgcenter" style="width:207px; .word-wrap:break-word; "><img height="62" border="0" align="bottom" width="207" src="images/quantitative-82_1.jpg" alt="Abbildung: Formel Varianz" title="Abbildung: Formel Varianz"  /><span class="imgcaption">Abbildung: Formel zu Bereichnung der Varianz</span>
 
</span></p>
 
<p>&nbsp;<b>Je gr&ouml;&szlig;er die Varianz verglichen mit dem Arithmetischen Mittel, desto st&auml;rker sind die Abweichungen der einzelnen Messwerte von diesem.</b></p>
 
<p>Ein Beispiel: Ein <b>Arithmetisches Mittel</b> von 100 kann sich ergeben, wenn alle Eintr&auml;ge der Zahl 100 entsprechen. Alle Eintr&auml;ge h&auml;tten dann eine Abweichung von <i>0 </i> vom  <b>Arithmetischen Mittel</b>, damit nat&uuml;rlich dann auch deren Quadrate sowie der Summen der Quadrate. Die Varianz w&auml;re dann <i>0 </i> und w&uuml;rde eine komplette &Uuml;bereinstimmung aller Werte mit dem <b>Arithmetischen Mittel</b> anzeigen.</p>
 
<p>Ein <b>Arithmetisches Mittel</b> von 100 kann sich auch ergeben, wenn die H&auml;lfte der Werte bei 0 und die andere H&auml;lfte bei 200 liegt. In diesem Falle h&auml;tten wir eine extrem gro&szlig;e Varianz (jeweils eine Abweichung von 100 vom <b>Arithmetischen Mittel</b>, diese wird quadriert, die Ergebnisse zusammengez&auml;hlt und durch <i>N</i> dividiert. In diesem Falle erhielten wir eine Varianz von 10.000, Ausdruck der maximalen individuellen Abweichung der Me&szlig;werte vom <b>Arithmetischen Mittel</b><i>.</i></p>
 
<p>In der Praxis verwendet man vor allem die Wurzel aus der Varianz, die sogenannte <b>Standardabweichung[2]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.2<br />
 
[2] Siehe Kapitel 3.4.2<br />
 
  
<hr />
+
Die V. ist ein Maß für die Variabilität bzw. die Streuung der Ausprägungen von Variablen und Ausgangswert für die ''Standardabweichung''. Siehe auch: '''Varianz (Wikipedia)[http://de.wikipedia.org/wiki/Varianz &#91;3&#93;]'''.
<h2>3.4.2&nbsp;Standardabweichung</h2>
 
  
<p>Die <b>Standardabweichung</b> <b><i>s</i></b> gibt in einer <b>Normalverteilung[1]</b>  einen Bereich um den <b>Mittelwert[2]</b>  an, innerhalb dessen sich 68,2 % aller Eintr&auml;ge befinden. Innerhalb des Bereichs Mittelwert +/-2s befinden sich in einer Normalverteilung 95,44 % aller Eintr&auml;ge. Berechnet wird die Standardabweichung als Wurzel aus folgender Formel:</p>
+
==== '''Verhältnisskala''' ====
<p><span class="imgbox imgcenter" style="width:207px; .word-wrap:break-word; "><img height="62" border="0" align="bottom" width="207" src="images/quantitative-83_1.jpg" alt="Abbildung: Formel Standardabweichung" title="Abbildung: Formel Standardabweichung"  /><span class="imgcaption">Abbildung: Formel zur Berechnung der Standardabweichung</span>
 
</span></p>
 
<p>&nbsp;<b>Beispiel:</b> Intelligenzquotient (Durchschnitt = 100, <i>s</i>= 15).</p>
 
<p><span class="imgbox imgcenter" style="width:483px; .word-wrap:break-word; "><img height="164" border="0" align="bottom" width="483" src="images/quantitative-83_2.jpg" alt="Abbildung: Intelligenzquotient" title="Abbildung: Intelligenzquotient"  /><span class="imgcaption">Abbildung: Intelligenzquotient</span>
 
</span></p>
 
<h3><b>Kenntnis der Standardabweichung = Kenntnis des Verlaufs der Verteilung</b></h3>
 
<p>Auch wenn man die grafische Darstellung der <b>H&auml;ufigkeitsverteilung,</b> wie z.B. mit einem <b>Histogramm[3]</b>, nicht kennt, kann man sie aufgrund der Kenntnis des <b>Mittelwerts</b> und der Standardabweichung weitgehend vorhersagen. Hat man einen <b>Mittelwert</b> von 100 und eine Standardabweichung von 10, wird die Verteilungskurve deutlich steiler sein, als wenn die <b>Standardabweichung</b> bei 30 liegt.</p>
 
<h3><b>Kenntnis der Standardverteilung = Absch&auml;tzung der H&auml;ufigkeit von Auspr&auml;gungen</b></h3>
 
<p>Die Kenntnis der <b>Standardverteilung</b> erlaubt uns, die H&auml;ufigkeit von Auspr&auml;gungen sofort einsch&auml;tzen zu k&ouml;nnen. Wenn z.B. wie oben bekannt ist, dass der durchschnittliche Intelligenzquotient bei 100, die Standardabweichung bei 15 liegt, dann kann man sofort absch&auml;tzen, wie ein bestimmter Intelligenzquotient einzustufen ist. Wenn eine Person X einen IQ von 130 aufweist, dann liegt dieser beim Mittelwert +2 Standardabweichungen. Daher kann man sofort absch&auml;tzen, dass der betreffende IQ h&ouml;her ist als 98 % aller Eintr&auml;ge.</p>
 
<p><b>Erkl&auml;rung:</b><br />
 
95,44 % aller Eintr&auml;ge befinden sich im Bereich Mittelwert &plusmn;2s, d.h. 4,56 % liegen au&szlig;erhalb dieses Bereichs. In unserem Beispiel w&uuml;rden 95,44% aller Werte zwischen 70 und 130 liegen, Die restlichen 4,56 % teilen sich zu gleichen Teilen auf die darunter und dar&uuml;ber liegenden Bereiche auf. Somit bleiben f&uuml;r den Bereich ab 130 insgesamt 2,28 % aller Eintr&auml;ge &uuml;brig.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.3.1<br />
 
[2] Siehe Kapitel 3.3.2<br />
 
[3] Siehe Kapitel 3.6.1.5<br />
 
  
<hr />
+
Siehe ''Proportionalskala''
<h2>3.4.3&nbsp;Perzentile</h2>
 
  
<p><b>Perzentile</b> teilen die Auspr&auml;gungen der Variablen in gleich gro&szlig;e Gruppen, sodass sich in jeder Gruppe der gleiche Prozentsatz an Eintr&auml;gen befindet.</p>
+
==== '''Verteilung''' ====
<p>Besonders beliebt dabei sind die <b>Quartile</b> (= Viertel, jeweils 25 %). Bei <b>Dezilen</b> handelt es sich hingegen um Gruppen von jeweils 10 % der Werte.</p>
 
<hr />
 
<h2>3.4.3.1&nbsp;Quartile</h2>
 
  
<p><b>Quartile</b> teilen die Verteilung in vier gleich gro&szlig;e Viertel: 25 % der Werte sind kleiner oder gleich gro&szlig; mit dem 1. Quartil, 50 % sind kleiner oder gleich gro&szlig; wie das 2. Quartil (daher ist das 2. Quartil gleichzusetzen mit dem Median), 75 % sind kleiner oder gleich gro&szlig; mit dem 3. Quartil. <b>Quartile</b> sollten erst ab einer <b>Stichprobengr&ouml;&szlig;e[1]</b>  von zumindest 20 eingesetzt werden.</p>
+
Siehe ''Häufigkeitsverteilung''
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1.1<br />
 
  
<hr />
+
==== '''Vertrauensintervall''' (auch ''Konfidenzintervall'') ====
<h2>3.4.3.1.1&nbsp;Die Ermittlung von Quartilen</h2>
 
  
<h3><b>Die Ermittlung von Quartilen (gewichtet):</b></h3>
+
Siehe ''Konfidenzintervall''
<ul>
 
    <li>man reiht die Werte nach ihrer Gr&ouml;&szlig;e (unser Beispiel: Besitz von B&uuml;chern zur Ethnologie)</li>
 
</ul>
 
<p>z.B. 1, 2, 3, 3, 5, 7, 11, 16, 17, 17, 20, 22, 25, 48, 52, 56, 76, 89, 96, 115</p>
 
<p>20 verschiedene Eintr&auml;ge liegen vor, daher ist n=20.</p>
 
<ul>
 
    <li>Berechung des 1. Quartils, d.h. der Wert, welcher gr&ouml;&szlig;er als 25 % und kleiner als 75 % aller Werte ist. Q1 liegt an der (n+1)/4. Stelle</li>
 
</ul>
 
<p><i>Dieser Wert liegt in unserem Beispiel an der (n+1)/4 Stelle = 5.25, also zwischen dem 5. Wert (=5) und dem 6. Wert (=7). Der Bruchteil (0,25) gibt an, dass zum Wert von 5 noch &frac14; des Abstands zwischen 5 und 6 hinzukommt. Q1 ist daher 5 + 0,25*2 = 5,5.</i></p>
 
<ul>
 
    <li>Berechnung des 2. Quartils (wird berechnet wie der Median). Dieser liegt zwischen der 10. und 11. Stelle, daher ist der Wert zu mitteln (17+20)/2 = 18,5</li>
 
    <li>Berechnung des 3. Quartils, d.h. der Wert, welcher gr&ouml;&szlig;er als 75 % und kleiner als 25 % der sortierten Werte ist.  Q3 = 3*(n+1)/4</li>
 
</ul>
 
<p><i>In unserem Beispiel: Q3 = 3*21/5 = 15,75. Stelle. Q3 liegt zwischen dem 15. Wert (= 52) und dem 16. Wert (= 56). Der Bruchteil (0,75) gibt an, dass zum 15. Wert noch &frac34; des Abstands zwischen dem 15. und dem 16. Wert hinzukommen, daher: Q3 = 52 + 0,75*4 = 55.</i></p>
 
<p>Wir k&ouml;nnen nun die Aussage machen, dass Personen aus dem ersten oder untersten Quartil (Viertel) weniger als 5,5 B&uuml;cher, aus dem obersten Quartil hingegen mindestens 55 B&uuml;cher besitzen.</p>
 
<hr />
 
<h2>3.4.4&nbsp;Berechnung  von Streuungsmaßen  mit SPSS</h2>
 
  
<p><b>SPSS</b> erm&ouml;glicht es, alle Arten von Streuungsma&szlig;en mit wenigen Tastenklicks gleichzeitig zu berechnen.</p>
+
==== '''Vierfeldertafel''' (Form der ''Kreuztabelle'') ====
<p>Dazu gen&uuml;gt es, auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - H&Auml;UFIGKEITEN zu klicken, dann links unten nochmals auf <i>Statistik</i> zu klicken und im neuen Fenster alle nur denkbaren Kennzahlen f&uuml;r Lage- und Streuungsma&szlig;e anzuw&auml;hlen:</p>
 
<p><span class="imgbox imgcenter" style="width:476px; .word-wrap:break-word; "><img height="300" border="0" align="bottom" width="476" alt="Abbildung: Streuungsmaße mit SPSS" title="Abbildung: Streuungsmaße mit SPSS"  src="images/quantitative-87_1.jpg" /><span class="imgcaption">Abbildung: Berechnung von Streuungsma&szlig;en mit SPSS</span>
 
</span></p>
 
<p>F&uuml;r die Berechnung von <b>Quartilen[1]</b>  gen&uuml;gt das Setzen eines H&auml;kchens in <i>Quartile</i>, m&ouml;chte man <i>Dezile</i> (also in 10%-Gruppen) berechnen, gibt man im Feld <i>Trennwerte f&uuml;r</i> die Zahl 10 ein (dadurch werden 100 % auf 10 gleiche Gruppen aufgeteilt, also besteht jede Gruppe aus 10 %). Gibt man einen Wert X im Feld neben <i>Perzentile</i> ein und klickt auf <i>Hinzuf&uuml;gen</i> (wie z.B. die Zahl 37), so wird ermittelt, unterhalb welchen Kennwerts X % der Eintr&auml;ge liegen (in diesem Fall 37 %). Man kann beliebig viele dieser <b>Perzentile</b> setzen.</p>
 
<p><span class="imgbox imgcenter" style="width:362px; .word-wrap:break-word; "><img height="497" border="0" align="bottom" width="362" alt="Abbildung: Berechnte Streuungsmaße" title="Abbildung: Berechnte Streuungsmaße"  src="images/quantitative-87_2.gif" /><span class="imgcaption">Abbildung: mit SPSS berechnete Streuungsma&szlig;e</span>
 
</span></p>
 
<p>SPSS bietet die Berechnung und Darstellung von <b>Streuungsma&szlig;en</b> in einer Vielzahl statistischer Verfahren an, meist unter einem Auswahlpunkt <i>Statistik</i>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.4.3.1<br />
 
  
<hr />
+
Eine V. ist die Anordnung zweier dichotomer Variablen in einer Tabelle mit zwei Spalten und zwei Zeilen, sodass jede Ausprägung jeder Variablen mit jeder Ausprägung der anderen gekreuzt wird.
<h2>3.4.5&nbsp;Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots</h2>
 
  
<p><b>Boxplots</b> sind <b>konzentrierte grafische Darstellungen von Lage und Streuung. Boxplots</b> geben einen exzellenten optischen &Uuml;berblick &uuml;ber wesentliche Parameter von Lage und Streuung, wie das <b>Arithmetisches Mittel</b>, die <b>Quartile</b>  sowie &uuml;ber die <b>Grenzwerte</b> nach unten wie nach oben, wobei <b>Ausrei&szlig;er</b> spezifisch markiert werden.</p>
+
==== '''Vollerhebung''' ====
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="444" border="0" align="bottom" width="500" alt="Abbildung: Boxplots" title="Abbildung: Boxplots"  src="images/quantitative-88_1.jpg" /><span class="imgcaption">Abbildung: Beispiel Boxplots</span>
 
</span></p>
 
<h3><b>Informationen der Boxplots:</b></h3>
 
<p>Boxplots enthalten eine F&uuml;lle von Hinweisen, wie im obigen Diagramm:</p>
 
<p>A. ein K&auml;stchen, welches den Abstand zwischen dem 1. und dem 3. <b>Quartil[1]</b>  markiert (<b>Streuung</b>)</p>
 
<p>B. eine langgezogene Linie, die von Extremwert zu Extremwert f&uuml;hrt: <b>Range</b> (<b>Streuung</b>);</p>
 
<p>C. Einen Querstrich im K&auml;stchen, welcher das <b>Arithmetische Mittel[2]</b>  markiert;</p>
 
<p>D. Mit * bezeichnete Eintr&auml;ge, welche mehr als 3 K&auml;stchenl&auml;ngen entfernt liegen (<b>Ausrei&szlig;er</b>).</p>
 
<p>E. Mit Kreis gekennzeichnete Eintr&auml;ge liegen 1,5-3 K&auml;stchenl&auml;ngen entfernt.</p>
 
<p>F. Neben diesen <b>Ausrei&szlig;ern</b> steht auch jeweils die Nummer des Datensatzes, in welchem diese <b>Ausrei&szlig;er</b> gefunden werden k&ouml;nnen.</p>
 
<h3><b>Extreme Informationsdichte durch Boxplots:</b></h3>
 
<p>Durch diese konzentrierten Informationen erlauben <b>Boxplots</b> eine sehr schnelle Absch&auml;tzung sowohl der <b>Lage</b> wie auch der <b>Streuung.</b> Im obigen Boxplot, welches auf der y-Achse die Zahl der in &Ouml;sterreich verbrachten Jahre, auf der x-Achse das Migrationsmotiv widerspiegelt, kann man auf den ersten Blick ersehen, dass das Gros der AsylwerberInnen erst in den letzten Jahren kam, hingegen das Motiv Schulbesuch ein l&auml;nger zur&uuml;ckliegender Migrationsgrund war. Die gro&szlig;e <b>Streuung</b> (ausgedr&uuml;ckt durch die L&auml;nge des K&auml;stchens) bei der Arbeitsuche gibt einen Hinweis darauf, dass viele Menschen &uuml;ber l&auml;ngere Zeit hinweg aus diesem Grund zuwanderten, w&auml;hrend der Asylgrund einen wesentlich k&uuml;rzeren Zeitraum betraf.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.4.3.1<br />
 
[2] Siehe Kapitel 3.3.2<br />
 
  
<hr />
+
Eine V. liegt vor, wenn alle Elemente einer Grundpopulation befragt werden und nicht nur eine Auswahl (eine ''Stichprobe'') derselben. Eine V. ist dementsprechend nur bei einer kleineren Grundpopulation möglich.
<h2>3.4.5.1&nbsp;Erstellung von Boxplots mit SPSS</h2>
 
  
<p>Klicken Sie in SPSS in der Men&uuml;leiste auf <i>ANALYSIEREN - DESKRIPTIVE STATISTIKEN - EXPLORATIVE DATENANALYSE.</i> Das folgende Fenster erscheint:</p>
+
==== '''Wahrscheinlichkeit''' ====
<p><span class="imgbox imgcenter" style="width:501px; .word-wrap:break-word; "><img height="283" border="0" align="bottom" width="501" src="images/quantitative-89_1.jpg" alt="Abbildung: Boxplots mit SPSS" title="Abbildung: Boxplots mit SPSS"  /><span class="imgcaption">Abbildung: Erstellung von Boxplots mit SPSS</span>
 
</span></p>
 
<p>Sie finden links die Liste der <b>Variablen</b>. &Uuml;bertragen Sie ins Feld <i>Abh&auml;ngige Variablen </i> die Variable, deren Lage und Streuung Sie mittels eines Boxplots darstellen m&ouml;chten. Beachten Sie bitte, dass es sich dabei zwingend um eine <b>metrische Variable[1]</b>  handeln muss. Falls Sie die <b>Lage[2]</b>  und <b>Streuung[3]</b>  der gesamten Eintr&auml;ge dieser Variablen wiederspiegeln m&ouml;chten, k&ouml;nnen Sie auf <i>OK</i> klicken. Das <b>Boxplot</b> erscheint in der Ausgabe nach einer Reihe statistischer Berechnungen.</p>
 
<p>M&ouml;chten Sie den Einfluss einer anderen <b>Variable</b> auf die gew&auml;hlte Variable untersuchen, dann f&uuml;gen Sie diese Variable in das Feld <i>Faktorenliste</i> ein. Sie erhalten dann verschiedene Boxplots, die jeweils Subgruppen der <b>abh&auml;ngigen Variablen</b> bezeichnen:</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="444" border="0" align="bottom" width="500" src="images/quantitative-89_2.jpg" alt="Abbildung: Beispiel Boxplots" title="Abbildung: Beispiel Boxplots"  /><span class="imgcaption">Abbildung: Beispiel f&uuml;r Boxplots</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.1.1<br />
 
[2] Siehe Kapitel 3.3<br />
 
[3] Siehe Kapitel 3.4<br />
 
  
<hr />
+
Unter W. versteht man die Einstufung von Phänomenen nach dem Grade ihrer Gewissheit. Die W. ''p'' wird mit Werten zwischen ''0'' (Unmöglichkeit) und ''1'' (Sicherheit des Auftretens) wiedergegeben. Siehe auch: '''Wahrscheinlichkeit (Wikipedia)[http://de.wikipedia.org/wiki/Wahrscheinlichkeit &#91;4&#93;]'''.
<h2>3.5&nbsp;Der Zusammenhang zwischen Variablen</h2>
 
  
<p>Zu den spannendsten Fragen geh&ouml;rt die Untersuchung von <b>Zusammenh&auml;ngen</b> zwischen <b>Variablen</b>. Es ist naheliegend, sich die Frage zu stellen, ob es z.B. einen Zusammenhang zwischen Rassismus und Bildung bzw. Sozialisation, Einkommen, Erfahrungen gibt. Es ist denkbar, dass die Religion einer Person Auswirkungen auf ihre Kinderzahl hat; es ist denkbar, dass Menschen eher zu biologischen und meist auch teureren Lebensmittel greifen, wenn auch ihr Einkommen h&ouml;her ist usw.</p>
+
==== '''Zentralwert''' ====
<p>Um derartige Zusammenh&auml;nge aufzudecken, verf&uuml;gen wir &uuml;ber verschiedene Methoden, wie z.B. die <b>Kreuztabellen-Analyse</b> oder die <b>Korrelation</b>(en).</p>
 
<hr />
 
<h2>3.5.1&nbsp;Optische Erkennung von Zusammenhängen</h2>
 
  
<h3><b>Optische Darstellung von Zusammenh&auml;ngen: das Streudiagramm</b></h3>
+
Siehe ''Median''
<p>Tr&auml;gt man auf einer Matrix von links nach rechts die Auspr&auml;gungen f&uuml;r die Variable A ein und die Auspr&auml;gungen f&uuml;r die Variable B auf der Y- Achse, so erh&auml;lt man eine Reihe von Schnittpunkten. Das sich aus den Schnittpunkten ergebende <b>Diagramm</b> wird auch <b>Verteilungsgrafik</b> (auch <b>Streuungsdiagramm</b>, <b>Streudiagramm</b> oder <b>Scatterplot</b> genannt).</p>
 
<h3><b>Herstellung eines Streudiagramms</b></h3>
 
<p><b>Streudiagramme</b> eignen sich zur grafischen Darstellung <b>bivariater Daten</b>, also zur Darstellung von Wertepaaren in einem Koordinatensystem. An Lage und Dichte des Punkteschwarms l&auml;sst sich anschaulich ablesen, ob ein Zusammenhang zwischen den Variablen besteht. Sie werden folgenderma&szlig;en erstellt: Man tr&auml;gt in einem Diagramm jeweils die Schnittpunkte der beiden Variablen ein, wobei der Wert der 1. Variablen auf der X- Achse, der Wert der 2. Variable auf der Y- Achse liegt. Im Beispiel unten tr&auml;gt man auf der X- Achse den Alphabetisierungsgrad des Landes ein, auf der Y-Achse das Bruttonationalprodukt des gleichen Landes. Wo beide Eintr&auml;ge aufeinander treffen, wird eine Markierung (ein Punkt) eingef&uuml;gt.</p>
 
<p><span class="imgbox imgcenter" style="width:432px; .word-wrap:break-word; "><img height="264" border="0" align="bottom" width="432" src="images/quantitative-91_1.gif" alt="Abbildung: Streudiagramm Bildung - Kindersterblichkeit" title="Abbildung: Streudiagramm Bildung - Kindersterblichkeit"  /><span class="imgcaption">Abbildung: Streudiagramm Zusammenhang zwischen weiblicher Bildung und Kindersterblichkeit</span>
 
</span></p>
 
<h3><b>Zusammenh&auml;nge bereits visuell erkennbar</b></h3>
 
<p>Hier erkennen wir bereits optisch einen gewissen Zusammenhang. Die meisten Schnittpunkte befinden sich links oben und gehen in einer Linie nach rechts unten. Man k&ouml;nnte durch die Schnittpunkte ann&auml;herungsweise eine <b>Gerade[1]</b>  ziehen, die von rechts oben nach links unten geht. Man spricht hier von einem <b>linearen Zusammenhang</b><i>.</i></p>
 
<p>Die Aussage der Grafik ist: je h&ouml;her der Alphabetisierungsgrad der Frauen, desto niedriger die Kindersterblichkeit.</p>
 
<p><span class="imgbox imgcenter" style="width:314px; .word-wrap:break-word; "><img height="309" border="0" align="bottom" width="314" src="images/quantitative-91_2.jpg" alt="Abbildung: Streudiagramm Alphabetisierungsrate - BNP" title="Abbildung: Streudiagramm Alphabetisierungsrate - BNP"  /><span class="imgcaption">Abbildung: Streudiagramm Zusammenhang zwischen Alphabetisierungsrate und BNP</span>
 
</span></p>
 
<p>Aus diesem <b>Diagramm</b> ist ersichtlich, dass ein gewisser Zusammenhang zwischen Alphabetisierungsrate und BNP besteht. L&auml;nder mit nur geringer Alphabetisierungsrate haben ausnahmslos ein sehr niedriges BNP, mit hoher Alphabetisierungsrate steigt die Wahrscheinlichkeit, auch ein sehr hohes BNP aufzuweisen, doch liegen die Werte bei hoher Alphabetisierungsrate extrem auseinander. Hier l&auml;sst sich wesentlich schwerer eine Gerade ziehen, es liegt nur mehr bedingt ein <b>linearer Zusammenhang</b> vor.</p>
 
<p>Nachfolgend verschiedene weitere Diagramme, welche teilweise deutliche Zusammenh&auml;nge zeigen (wie oben links) oder keinerlei Zusammenhang (wie unten links). Diskutieren Sie in der Gruppe die Art der Zusammenh&auml;nge in den restlichen Diagrammen.&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:667px; .word-wrap:break-word; "><img height="95" border="0" align="bottom" width="667" src="images/quantitative-91_3.jpg" alt="Abbildung: Streudiagramme (1)" title="Abbildung: Streudiagramme (1)"  /><span class="imgcaption">Abbildung: Mehrere Streudiagramme (1)</span>
 
</span></p>
 
<p><span class="imgbox imgcenter" style="width:654px; .word-wrap:break-word; "><img height="95" border="0" align="bottom" width="654" src="images/quantitative-91_4.jpg" alt="Abbildung: Streudiagramme (2)" title="Abbildung: Streudiagramme (2)"  /><span class="imgcaption">Abbildung: Mehrere Streudiagramme (2)</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.4.2<br />
 
  
<hr />
+
==== '''Zusammenhang''' ====
<h2>3.5.2&nbsp;Kreuztabellen-Analyse</h2>
 
  
<p>Unter <b>Kreuztabellen</b> (auch <b>Kontingenztafeln</b> genannt) versteht man die tabellarische Darstellung der <b>H&auml;ufigkeiten[1]</b>, welche bei der Kombination der Auspr&auml;gungen von zwei oder mehr <b>Variablen</b> auftreten.</p>
+
Mit einem Z. bezeichnet man, dass zwischen den Ausprägungen zweier Variablen eine systematische Entsprechung besteht. Siehe ''Korrelation.''
<p>Wenn z.B. zwei <b>Variablen</b> vorliegen, werden die Auspr&auml;gungen der Variablen A in Spalten von links nach rechts und die Auspr&auml;gungen der Variablen B in Zeilen von oben nach unten eingetragen. In jeder einzelnen Zelle wird sodann die spezifische H&auml;ufigkeit der jeweiligen Kombination Auspr&auml;gung der Variablen A mit Auspr&auml;gung der Variablen B vermerkt.</p>
 
<p><span class="imgbox imgcenter" style="width:495px; .word-wrap:break-word; "><img height="147" border="0" align="bottom" width="495" alt="Abbildung: Kreuztabelle" title="Abbildung: Kreuztabelle"  src="images/quantitative-92_1.gif" /><span class="imgcaption">Abbildung: Kreuztabelle Deutschkenntnisse&nbsp; und Muttersprache</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2<br />
 
  
<hr />
+
==== '''Zweiseitige Hypothese''' ====
<h2>3.5.2.1&nbsp;Berechnung von Kreuztabellen-Analysen mit SPSS</h2>
 
  
<p>Wir m&ouml;chten mit einer <b>Kreuztabelle</b> zeigen, wie gut in Wien lebende AfrikanerInnen nach (&uuml;berpr&uuml;ften) Eigenangaben Deutsch beherrschen und &uuml;berpr&uuml;fen, ob ihre Sprachkompetenz im Deutschen mit ihrer Nationalsprache zusammenh&auml;ngt.</p>
+
Bei einer z. H. nimmt man an, dass zwischen zwei Variablen oder zwischen zwei Teilgruppen ein Zusammenhang besteht. Man nimmt jedoch nicht von vornherein an, dass dieser Zusammenhang nur in einer bestimmten Richtung besteht. Beispiel: Die Annahme ist, dass sich das Wetter auf die Arbeitslust auswirkt, wobei man nicht von vornherein einschränkt, ob ein schöneres Wetter zu einer größeren Arbeitslust oder zu einer geringeren führen wird. Bei der ''einseitigen H.'' würde nur eine Richtung untersucht werden: Sorgt schöneres Wetter für eine größere Arbeitslust?
<p>Dazu klicken wir in SPSS auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN. In den Zeilen klicken wir die Herkunftssprache an, unter Spalten die Sprachkompetenz im Deutschen. Nach Klicken auf OK erhalten wir bereits folgende Tabelle:</p>
 
<p><span class="imgbox imgcenter" style="width:495px; .word-wrap:break-word; "><img height="147" border="0" align="bottom" width="495" alt="Abbildung: Kreuztabelle Muttersprache - Deutschkenntnisse" title="Abbildung: Kreuztabelle Muttersprache - Deutschkenntnisse"  src="images/quantitative-93_1.gif" /><span class="imgcaption">Abbildung: Kreuztabelle Zusammenhang Muttersprache - Deutschkenntnisse</span>
 
</span></p>
 
<p>&nbsp;Man kann die Ergebnisse leichter interpretieren, wenn auch die <b>relativen H&auml;ufigkeiten[1]</b>  ermittelt werden. Dazu klicken wir unter <i>Zellen</i> auf <i>zeilenweise Prozentwerte</i>:</p>
 
<p><span class="imgbox imgcenter" style="width:605px; .word-wrap:break-word; "><img height="202" border="0" align="bottom" width="605" alt="Abbildung: Kreuztabelle mit Zeilenprozentwerten" title="Abbildung: Kreuztabelle mit Zeilenprozentwerten"  src="images/quantitative-93_2.gif" /><span class="imgcaption">Abbildung: Kreuztabelle mit Zeilenprozentwerten zum Zusammenhang Muttersprache - Deutschkenntnisse</span>
 
</span></p>
 
<p>Nun k&ouml;nnen wir sofort erkennen, dass in unserer Stichprobe die durchschnittlichen Deutschkenntnisse der Zuwanderer aus L&auml;ndern mit franz&ouml;sischer Nationalsprache besser als die aus L&auml;ndern mit englischer Nationalsprache sind. 70,7 % der Frankophonen sprechen besser Deutsch, aber nur 49,0 % der Anglophonen.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2<br />
 
  
<hr />
 
<h2>3.5.2.1.1&nbsp;Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test</h2>
 
  
<p>Der <b>Chi-Quadrat-Test</b>, angewandt auf <b>Kreuztabellen</b>, ermittelt die <b>Wahrscheinlichkeit[1]</b>, ob Zusammenh&auml;nge mehr als nur zuf&auml;lliger Natur sind.</p>
 
<p>Im vorigen Beispiel (Kreuztabelle) sahen wir, dass offensichtlich ein deutlich h&ouml;herer Prozentsatz von frankophonen AfrikanerInnen besser Deutsch spricht als Anglophone. Wir wissen jedoch noch nicht, ob diese Unterschiede auch signifikant sind.</p>
 
<h3><b>Berechnung des Chi-Quadrat-Tests mit SPSS</b></h3>
 
<p>Dazu w&auml;hlen wir unter ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN den Punkt <i>Statistik,</i> setzen dort bei <i>Chi-Quadrat</i> ein H&auml;kchen und erhalten als zus&auml;tzliche Ausgabe:</p>
 
<p><span class="imgbox imgcenter" style="width:426px; .word-wrap:break-word; "><img height="184" border="0" align="bottom" width="426" alt="Abbildung: Chi-Quadrat-Test" title="Abbildung: Chi-Quadrat-Test"  src="images/quantitative-94_1.gif" /><span class="imgcaption">Abbildung: Chi-Quadrat-Test</span>
 
</span></p>
 
<p>F&uuml;r uns interessant ist hier der Wert f&uuml;r <i>Asymptotische Signifikanz</i>. Dort wird 0,023 aufgef&uuml;hrt, also ein Wert kleiner als 0,05. Damit ist mit einer <b>Wahrscheinlichkeit</b> von mehr als 95 % anzunehmen (oder mit einer <b>Irrtumswahrscheinlichkeit</b> von weniger als 5 %), dass tats&auml;chlich ein Zusammenhang zwischen Nationalsprache und Sprachkompetenz im Deutschen besteht. Bei einem Wert &gt; 0,01 w&auml;re die <b>Wahrscheinlichkeit</b> eines Zusammenhangs sogar gr&ouml;&szlig;er als 99 %, also w&auml;re das Ergebnis hoch <b>signifikant[2]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3<br />
 
[2] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
'''Verweise:'''<br />
<h2>3.5.2.2&nbsp;Grafische Darstellung von Kreuztabellen mit SPSS</h2>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden/Ermittlung#3.2.1 Liste und Tafeln|[1] Siehe Kapitel 3.2.1]]<br />
 +
[http://de.wikipedia.org/wiki/Validit%C3%A4t &#91;2&#93; http://de.wikipedia.org/wiki/Validit%C3%A4t]<br />
 +
[http://de.wikipedia.org/wiki/Varianz &#91;3&#93; http://de.wikipedia.org/wiki/Varianz]<br />
 +
[http://de.wikipedia.org/wiki/Wahrscheinlichkeit &#91;4&#93; http://de.wikipedia.org/wiki/Wahrscheinlichkeit]<br />
  
<p>Die Ergebnisse von <b>Kreuztabellen</b> k&ouml;nnen mit <b>Gruppierten Balkendiagrammen[1]</b>  besonders anschaulich dargestellt werden.</p>
+
=== Weitere Kapitel dieser Lernunterlage ===
<p>Mit <b>SPSS</b> ist deren Erstellung sehr einfach.</p>
+
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
<p>Klicken Sie auf ANALYSIEREN - DESKRIPTIVE STATISTIKEN - KREUZTABELLEN und machen Sie ein H&auml;kchen beim Punkt <i>Gruppierte Balkendiagramme anzeigen.</i></p>
+
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
<p>Spielen Sie mit den einzelnen Elementen dieser Grafik herum. Beim Doppelklick auf Details dieses Diagramms werden sich viele Einstellm&ouml;glichkeiten &ouml;ffnen.</p>
+
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
<p><span class="imgbox imgcenter" style="width:624px; .word-wrap:break-word; "><img height="500" border="0" align="bottom" width="624" alt="Abbildung: Gruppiertes Balkendiagramm" title="Abbildung: Gruppiertes Balkendiagramm"  src="images/quantitative-95_1.jpg" /><span class="imgcaption">Abbildung: Gruppiertes Balkendiagramm</span>
+
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
</span></p>
+
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.3<br />
 
  
<hr />
 
<h2>3.5.3&nbsp;Die Korrelation</h2>
 
  
<p>Unter einer <b>Korrelation</b> versteht man eine Kennzahl <b>f&uuml;r den Zusammenhang zwischen Variablen</b>. Prinzipiell k&ouml;nnen folgende Zusammenh&auml;nge bestehen:</p>
+
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
<ul>
+
----
    <li><b>&Uuml;bereinstimmung</b>: je h&ouml;her der Wert der Variablen A, desto h&ouml;her ist meist auch der Wert der Variablen B: <b>positive Korrelation</b></li>
+
[[#5. Lexikon statistischer Grundbegriffe|&uarr; Nach oben]]
    <li><b>Gegensatz</b>: je h&ouml;her Variable A, desto niedriger ist meist die Variable B: <b>negative Korrelation</b></li>
 
    <li><b>Unabh&auml;ngigkeit</b>: Hohe Werte von A k&ouml;nnen relativ beliebigen Werten von B entsprechen und umgekehrt: <b>keine Korrelation</b></li>
 
</ul>
 
<p>Korrelationskoeffizienten k&ouml;nnen <b>Werte zwischen -1,00 und +1,00</b> annehmen<b>.</b> Ein Wert von -1,0 bedeutet eine perfekte <b>negative Korrelation</b>: Hohe Werte der Variablen A gehen ausnahmslos mit niedrigen Werten der Variablen B einher und umgekehrt. Ein Wert von (+)1,0 bezeichnet eine perfekte <b>positive Korrelation</b>: hohe Werte von A entsprechen praktisch immer hohen Werten von B und umgekehrt.</p>
 
<p>Je nach Art der <b>Grundskalierung[1]</b>  muss man zu <b>unterschiedlichen Korrelationskoeffizienten</b> greifen:</p>
 
<p><span class="imgbox imgcenter" style="width:624px; .word-wrap:break-word; "><img height="125" border="0" align="bottom" width="624" src="images/quantitative-96_1.jpg" alt="Abbildung: Geeigneter Korrelationskoeffizient" title="Abbildung: Geeigneter Korrelationskoeffizient"  /><span class="imgcaption">Abbildung: Geeigneter Korrelationskoeffizient f&uuml;r unterschiedliche Skalenniveaus</span>
 
</span></p>
 
<h3><b>Vorsicht bei vorschneller Herstellung von Zusammenh&auml;ngen</b></h3>
 
<p>Gefundene Korrelationen m&uuml;ssen dennoch nochmals kritisch hinterfragt werden. Es  gibt z.B. <b>Scheinkorrelationen[2]</b>, die nur deshalb auftreten, weil beide Variablen hoch mit einer dritten Variable korrelieren, und <b>verdeckte Korrelationen[3]</b>, bei welchen sich Subgruppen der <b>Stichprobe[4]</b>  gegenseitig neutralisieren, selbst aber eine hohe <b>Korrelation</b> bei den beiden Variablen aufweisen. Erst die <b>Signifikanz[5]</b>  gibt einer <b>Korrelation</b> die n&ouml;tige Aussagekraft.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2<br />
 
[2] Siehe Kapitel 3.5.3.4.3<br />
 
[3] Siehe Kapitel 3.5.3.4.2<br />
 
[4] Siehe Kapitel 2.1.1<br />
 
[5] Siehe Kapitel 3.5.3.4.4<br />
 
  
<hr />
 
<h2>3.5.3.1&nbsp;Maßkorrelation</h2>
 
  
<p>Der am h&auml;ufigsten verwendete Korrelationskoeffizient ist der die Ma&szlig;korrelation beschreibende <b>Pearsonsche Korrelationskoeffizient</b> (Pearsons r). Er wird auch <b>linearer Korrelationskoeffizient</b> genannt.</p>
+
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
<p>Voraussetzungen zu seiner Anwendung:</p>
+
= 6. Literatur, Ressourcen und Links =
<p>&bull;  der Zusammenhang zwischen X und Y ist (ann&auml;hernd) <b>linear[1]</b>,</p>
+
<sup>verfasst von Erwin Ebermann</sup>
<p>&bull;  beide Variablen sind <b>normalverteilt[2]</b>.</p>
 
<p>Die Berechnung der <b>Ma&szlig;korrelation </b> <i>r </i> erfolgt durch folgende Formel:</p>
 
<p><span class="imgbox imgcenter" style="width:186px; .word-wrap:break-word; "><img height="84" border="0" align="bottom" width="186" src="images/quantitative-97_1.jpg" alt="Abbildung: Formel Maßkorrelation" title="Abbildung: Formel Maßkorrelation"  /><span class="imgcaption">Abbildung: Formel zur Berechnung der Ma&szlig;korrelation</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.4.2<br />
 
[2] Siehe Kapitel 3.1.3.1<br />
 
  
<hr />
+
In diesem Bereich finden Sie Hinweise auf hochwertige Nachschlagswerke zu den angeschnittenen Bereichen sowie eine Selektion von Weblinks.
<h2>3.5.3.1.1&nbsp;Berechnung der Maßkorrelation mit SPSS</h2>
 
  
<p><b>Beispiel:</b><br />
+
==Inhalt==
Wir m&ouml;chten bei Fahrzeugen den Zusammenhang zwischen Gewicht und Beschleunigung feststellen. Wir kontrollieren mithilfe eines <b>Histogramms[1]</b>, ob die beiden Variablen ann&auml;hernd <b>normalverteilt[2]</b> sind:</p>
+
<div class="eksa_toc">
<h3><b>Kontrolle der ersten Bedingung (Normalverteilung)</b></h3>
+
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|6. Literatur, Ressourcen und Links]]<br />
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="400" border="0" align="bottom" width="500" alt="Abbildung: Kontrolle der ersten Bedingung" title="Abbildung: Kontrolle der ersten Bedingung"  src="images/quantitative-98_1.jpg" /><span class="imgcaption">Abbildung: Kontrolle der ersten Bedingung (Normalverteilung)</span>
+
[[Literatur_Ressourcen_und_Links#6.1 Quantitative Forschungsmethoden|6.1 Quantitative Forschungsmethoden]]<br />
</span></p>
+
[[Literatur_Ressourcen_und_Links#6.2 Fragebogen-Abfrage|6.2 Fragebogen-Abfrage]]<br />
<h3><b>Kontrolle der 2. Bedingung (linearer Zusammenhang)</b></h3>
+
[[Literatur_Ressourcen_und_Links#6.3 Diagramme und Grafiken|6.3 Diagramme und Grafiken]]<br />
<p>Dann erstellen wir ein <b>Streudiagramm</b>, welches uns einen Einblick gibt, ob die beiden Variablen systematische Entsprechungen zeigen und versuchen, in diese <b>eine Regressionsgerade zu legen[3]</b>. Falls dies m&ouml;glich ist, ist auch die zweite Bedingung zur Anwendung der Ma&szlig;korrelation erf&uuml;llt.</p>
+
[[Literatur_Ressourcen_und_Links#6.3 Methoden|6.3 Methoden]]<br />
<p><span class="imgbox imgcenter" style="width:624px; .word-wrap:break-word; "><img height="500" border="0" align="bottom" width="624" alt="Abbildung: Kontrolle der zweiten Bedingung" title="Abbildung: Kontrolle der zweiten Bedingung"  src="images/quantitative-98_2.jpg" /><span class="imgcaption">Abbildung: Kontrolle der zweiten Bedingung (Linearer Zusammenhang)</span>
+
[[Literatur_Ressourcen_und_Links#6.4 Repräsentativität|6.4 Repräsentativität]]<br />
</span></p>
+
[[Literatur_Ressourcen_und_Links#6.5 Statistik-Software|6.5 Statistik-Software]]<br />
<p>Wir sehen einen merkbaren, wenn auch nicht extrem eindeutigen <b>linearen Zusammenhang</b>. Nun haben wir die Voraussetzungen gepr&uuml;ft, um diese Korrelationsberechnung anwenden zu k&ouml;nnen.</p>
+
[[Literatur_Ressourcen_und_Links#6.6 Terminologie|6.6 Terminologie]]<br />
<h3><b>Berechnung der Ma&szlig;korrelation mit SPSS:</b></h3>
+
[[Literatur_Ressourcen_und_Links#6.7 Statistik-Quellen|6.7 Statistik-Quellen]]<br />
<p>Klicken Sie in der Men&uuml;leiste auf ANAYLISEREN - KORRELATION - BIVARIAT und w&auml;hlen Sie dort die entsprechende Korrelationsform, n&auml;mlich die nach Pearson. Im Feld <i>Variablen</i> f&uuml;gen Sie die beiden <b>Variablen</b> ein, deren Zusammenhang Sie berechnen m&ouml;chten. Klicken Sie auf OK:&nbsp;</p>
+
</div>
<p><span class="imgbox imgcenter" style="width:504px; .word-wrap:break-word; "><img height="235" border="0" align="bottom" width="504" alt="Abbildung: Berechnte Maßkorrelation" title="Abbildung: Berechnte Maßkorrelation"  src="images/quantitative-98_3.jpg" /><span class="imgcaption">Abbildung: Mit SPSS berechnte Ma&szlig;korrelation</span>
 
</span></p>
 
<p><b>Ergebnis des Beispiels:</b><br />
 
Es gibt einen nachweisbaren Zusammenhang zwischen der Beschleunigung von Fahrzeugen und ihrem Gewicht. Dieser Zusammenhang ist mit einer Irrtumswahrscheinlichkeit von 1 % <b>signifikant[4]</b>. Da es <b>eine negative Korrelation</b> ist, kann man sagen, dass mit steigendem Gewicht des Fahrzeugs seine Beschleunigung abnimmt, was nicht weiter &uuml;berraschend ist.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.5<br />
 
[2] Siehe Kapitel 3.1.3.1<br />
 
[3] Siehe Kapitel 3.5.4.2<br />
 
[4] Siehe Kapitel 3.5.3.4.4<br />
 
  
<hr />
 
<h2>3.5.3.2&nbsp;Rangkorrelation R (Krueger-Spearman)</h2>
 
  
<p>Die <strong>Rangkorrelation </strong>R (nach Krueger- Spearman) wird v.a. bei der Auswertung psychologischer, p&auml;dagogischer und soziologischer Untersuchungen verwendet, wenn also keine wissenschaftlichen Ma&szlig;einheiten vorhanden sind, dennoch aber z.B. eine Reihung nach Gr&ouml;&szlig;e und Intensit&auml;t sinnvoll sein kann.</p>
+
= 6.1 Quantitative Forschungsmethoden =
<p>Z.B. kann man Kameradschaftlichkeit oder Egoismus kaum sinnvoll in Zahlenwerten messen, aber dennoch Menschen ersuchen, Mitmenschen bez&uuml;glich dieser Eigenschaften rangzureihen.</p>
 
<h3><b>Auch verwendet f&uuml;r Zusammenh&auml;nge zwischen metrischen und ordinalskalierten Daten</b></h3>
 
<p>Man setzt die <b>Rangkorrelation</b> h&auml;ufig auch ein, wenn man den Zusammenhang von <b>ordinalskalierten[1]</b>  und <b>metrischen[2]</b>  Variablen berechnen m&ouml;chte. Dabei wandelt man die Messwerte zuerst in Rangpl&auml;tze um (nachdem man diese gr&ouml;&szlig;enm&auml;&szlig;ig gereiht hat) um danach R berechnen zu k&ouml;nnen. Fallen mehrere umgewandelte Messwerte auf den gleichen Rangplatz, teilen sie sich diese Pl&auml;tze (arithmetisches Mittel), also 6., 7., 8. und 9. Platz = 30 (6+7+8+9). 30 dividiert durch 4 (Anzahl der Rangpl&auml;tze) =7,5. Jeder dieser 4 gleichen Messwerte erh&auml;lt somit den Rangplatz 7,5.</p>
 
<h3><b>Berechnung der Rangkorrelation:</b></h3>
 
<p><span class="imgbox imgcenter" style="width:122px; .word-wrap:break-word; "><img height="58" border="0" align="bottom" width="122" alt="Abbildung: Formel Rangkorrelation R" title="Abbildung: Formel Rangkorrelation R"  src="images/quantitative-99_1.jpg" /><span class="imgcaption">Abbildung: Formel zur Berechnung der Rangkorrelation R</span>
 
</span></p>
 
<p>R= 1-,  d<sub>i</sub>= Differenz des Rangplatzpaares (x<sub>i</sub>-y<sub>i</sub>); n= Anzahl der Rangpl&auml;tze</p>
 
<p>Beispiel:</p>
 
<p><span class="imgbox imgcenter" style="width:531px; .word-wrap:break-word; "><img height="296" border="0" align="bottom" width="531" alt="Abbildung: Beispiel Rangkorrelation R" title="Abbildung: Beispiel Rangkorrelation R"  src="images/quantitative-99_2.jpg" /><span class="imgcaption">Abbildung: Beispiel zur Berechnung der Rangkorrelation R</span>
 
</span></p>
 
<p>Berechnung R= 1-(6*38)/(9*(81-1) = 0,68</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2.3<br />
 
[2] Siehe Kapitel 3.1.1.1<br />
 
  
<hr />
+
Atteslander P. 2000. Methoden der empirischen Sozialforschung, 9. edn. deGruyter.
<h2>3.5.3.2.1&nbsp;Berechnung der Rangkorrelation mit SPSS</h2>
 
  
<p>Klicken Sie in der Men&uuml;leiste auf ANALYSIEREN - KORRELATION - BIVARIAT und w&auml;hlen Sie dort die entsprechende Korrelationsform, n&auml;mlich die nach <b>Spearman</b>. Im Feld <i>Variablen</i> f&uuml;gen Sie die beiden <b>Variablen</b> ein, deren Zusammenhang Sie berechnen m&ouml;chten. Falls die Variablen &uuml;ber h&ouml;herwertige <b>Skalierungen[1]</b>  als die <b>Ordinalskala[2]</b>  verf&uuml;gen (<b>Intervall-[3]</b>  oder <b>Proportionalskala[4]</b>), werden sie automatisch von <b>SPSS</b> in die entspechenden Rangpl&auml;tze umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der Korrelation gemeinsam mit der Beurteilung ihrer <b>Signifikanz[5]</b>.</p>
+
Diekmann A. 2001. Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen, 7 edn. Rowohlt, Reinbeck bei Hamburg.
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2<br />
 
[2] Siehe Kapitel 3.1.2.3<br />
 
[3] Siehe Kapitel 3.1.2.4<br />
 
[4] Siehe Kapitel 3.1.2.5<br />
 
[5] Siehe Kapitel 3.5.3.4.4<br />
 
  
<hr />
+
Fahrmeir, Ludwig & Künstler, Rita & Pigeo, Iris & Tutz, Gerhard. 2004. Statistik. Springer, Berlin - Heidelberg.
<h2>3.5.3.3&nbsp;Rangkorrelation Tau (Kendall)</h2>
 
  
<p>Die <b>Rangkorrelation TAU</b> (nach <b>Kendall</b>) wird h&auml;ufig verwendet, <b>wenn N</b>, also die Gesamtanzahl an F&auml;llen, <b>sehr niedrig ist</b> (&lt; 20).</p>
+
Friedrichs J. 1990. Methoden empirischer Sozialforschung, 14. edn. Westdeutscher Verlag, Opladen.
<p><b>Berechnung:&nbsp;</b>Zuerst werden alle Auspr&auml;gungen der beiden Variablen in R&auml;nge umgewandelt.</p>
 
<p><span class="imgbox imgcenter" style="width:334px; .word-wrap:break-word; "><img height="89" border="0" align="bottom" width="334" src="images/quantitative-101_1.jpg" alt="Abbildung: Schritt 1 Berechnung Rangkorrelation Tau" title="Abbildung: Schritt 1 Berechnung Rangkorrelation Tau"  /><span class="imgcaption">Abbildung: Schritt 1 zur Berechnung der Rangkorrelation Tau (Kendall)</span>
 
</span></p>
 
<p>Danach wird eine Variable gr&ouml;&szlig;enm&auml;&szlig;ig sortiert (nach Rangpl&auml;tzen), die zum gleichen Fall geh&ouml;renden Rangpl&auml;tze der anderen Variablen werden darunter geschrieben:</p>
 
<p><span class="imgbox imgcenter" style="width:342px; .word-wrap:break-word; "><img height="98" border="0" align="bottom" width="342" src="images/quantitative-101_2.jpg" alt="Abbildung: Schritt 2 Berechnung Rangkorrelation Tau" title="Abbildung: Schritt 2 Berechnung Rangkorrelation Tau"  /><span class="imgcaption">Abbildung: Schritt 2 zur Berechnung der Rangkorrelation Tau (Kendall)</span>
 
</span></p>
 
<p>Die 1. Rangreihe ist bereits gr&ouml;&szlig;enm&auml;&szlig;ig sortiert. In der 2. Rangreihe wird nun verglichen, ob die Rangordnung der 1. Rangreihe (Schulbildung) eingehalten wird. D.h. bei einer maximalen positiven Korrelation von Schulbildung und Schichtzugeh&ouml;rigkeit m&uuml;sste bei Schichtzubeh&ouml;rigkeit ebenfalls B den 1. Platz haben, E den 2., D den 3. usw., bei einer negativen Korrelation selbstverst&auml;ndlich umgekehrt.</p>
 
<p>F&uuml;r jede Person der 2. Rangreihe (Schichtzugeh&ouml;rigkeit) wird nun verglichen, ob auf sie folgenden Rangzahlen gr&ouml;&szlig;er oder kleiner sind. &rsquo;Richtig&rsquo; w&auml;re eine gr&ouml;&szlig;ere nach einer kleineren Rangzahl; &rsquo;falsch&rsquo; eine kleinere nach einer gr&ouml;&szlig;eren Rangzahl:</p>
 
<p><span class="imgbox imgcenter" style="width:128px; .word-wrap:break-word; "><img height="68" border="0" align="bottom" width="128" src="images/quantitative-101_3.jpg" alt="Abbildung: Schritt 3 Berechnung Rangkorrelation Tau" title="Abbildung: Schritt 3 Berechnung Rangkorrelation Tau"  /><span class="imgcaption">Abbildung: Schritt 3 zur Berechnung der Rangkorrelation Tau (Kendall)</span>
 
</span></p>
 
<p>Insgesamt &uuml;berpr&uuml;fen wir 10 Zahlenpaare. F&uuml;r jede 'richtige' Zahlenfolge z&auml;hlen wir ein &quot;Plus&quot;, f&uuml;r jede 'falsche' Reihenfolge ein &quot;Minus&quot;.</p>
 
<p><span class="imgbox imgcenter" style="width:128px; .word-wrap:break-word; "><img height="148" border="0" align="bottom" width="128" src="images/quantitative-101_4.jpg" alt="Abbildung: Schritt 4 Berechnung Rangkorrelation Tau" title="Abbildung: Schritt 4 Berechnung Rangkorrelation Tau"  /><span class="imgcaption">Abbildung: Schritt 4 zur Berechnung der Rangkorrelation Tau (Kendall)</span>
 
</span></p>
 
<p>Wir z&auml;hlen 6-Plus und 4-Minuszeichen, zieht man die Minus von den Plus ab, ergibt sich die Summe S = 2. Diese Summe S wird bei der Berechnung von Tau mit der h&ouml;chstm&ouml;glichen Summe dieser Art S<sub>max</sub> verglichen.</p>
 
<p>S<sub>max</sub> errechnet sich aus N(N-1)/2, denn die Gesamtzahl von Paarvergleichen h&auml;ngt nur von N (also der L&auml;nge der Rangreihe ab). Ist die zweite Rangreihe identisch mit der ersten (geordneten), so ergeben sich beim Paarvergleich nur  &rsquo;richtige&rsquo; Reihenfolgen und die Gesamtsumme des &quot;Plus- Zeichen&quot; ist gleich der Summe der insgesamt m&ouml;glichen Paarvergleiche S<sub>max</sub>.</p>
 
<p>Tau ergibt sich als TAU = S/S<sub>max.</sub></p>
 
<p>In unserem Beispiel ist S<sub>max</sub> = 5*4/2 = 10.  TAU ist also gleich 2/10 = 0,2</p>
 
<p><span class="imgbox imgcenter" style="width:315px; .word-wrap:break-word; "><img height="72" border="0" align="bottom" width="315" src="images/quantitative-101_5.jpg" alt="Abbildung: Formel Rangkorrelation Tau" title="Abbildung: Formel Rangkorrelation Tau"  /><span class="imgcaption">Abbildung: Formel zur Berechnung der Rangkorrelation Tau (Kendall)</span>
 
</span></p>
 
<p><b>Diese Berechnungsart sollte nur dann angewendet werden, wenn innerhalb einer Rangreihe keine geteilten Rangpl&auml;tze auftreten.</b></p>
 
<hr />
 
<h2>3.5.3.3.1&nbsp;Berechnung von TAU mit SPSS</h2>
 
  
<p>Klicken Sie in der Men&uuml;leiste auf ANAYLISEREN - KORRELATION - BIVARIAT und w&auml;hlen Sie dort die entsprechende Korrelationsform, n&auml;mlich <b>Kendall-Tau</b>. Im Feld Variablen f&uuml;gen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen m&ouml;chten. Falls die Variablen &uuml;ber h&ouml;herwertige <b>Skalierungen[1]</b> als die <b>Ordinalskala[2]</b>  verf&uuml;gen (<b>Intervall[3]</b> - oder <b>Proportionalskala[4]</b>), werden sie automatisch umgewandelt. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der <b>Korrelation</b> gemeinsam mit der Beurteilung ihrer <b>Signifikanz[5]</b>.</p>
+
Götz R. & Pötter U. 2001. Grundzüge der sozialwissenschaftlichen Statistik. Juventa, Weinheim und München.
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2<br />
 
[2] Siehe Kapitel 3.1.2.3<br />
 
[3] Siehe Kapitel 3.1.2.4<br />
 
[4] Siehe Kapitel 3.1.2.5<br />
 
[5] Siehe Kapitel 3.5.3.4.4<br />
 
  
<hr />
+
Krämer, Walter. 2000. So lügt man mit Statistik. Piper- Verlag.
<h2>3.5.3.4&nbsp;Aussagekraft einer Korrelation</h2>
 
  
<p>Die Aussagekraft einer <b>Korrelation</b> h&auml;ngt von mehreren Faktoren ab:</p>
+
Kromrey, H. 2000. Empirische Sozialforschung''.'' Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung. Leske und Budrich, Opladen.
<p>A. der H&ouml;he der <b>Korrelation</b></p>
 
<p>B. der Gr&ouml;&szlig;e der <b>Stichprobe[1]</b>(n)</p>
 
<p>C. der Sorgfalt beim Ausschluss einer m&ouml;glichen Scheinkorrelation bzw. des Erkennens verdeckter Korrelationen.</p>
 
<p>Die statistische Kennzahl der <b>Signifikanz</b> ber&uuml;cksichtigt sowohl die H&ouml;he der <b>Korrelation</b> wie auch die Gr&ouml;&szlig;e der Stichprobe und gibt Auskunft &uuml;ber die <b>Wahrscheinlichkeit[2]</b>, dass die erhaltene <b>Korrelation</b> rein zuf&auml;llig auftrat. Sie ist statistisch von &auml;u&szlig;erst gro&szlig;er Bedeutung.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1.1<br />
 
[2] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
Müller-Bendedict V. 2001. Grundkurs Statistik in den Sozialwissenschaften. Westdeutscher Verlag, Opladen.
<h2>3.5.3.4.1&nbsp;Wann sind Korrelationen bemerkenswert?</h2>
 
  
<p>Die Gr&ouml;&szlig;e einer Korrelation sagt alleine noch nichts &uuml;ber ihre Aussagekraft aus. Prinzipiell gilt, dass <b>eine hohe Korrelation umso leichter zu erzielen ist, je kleiner die Stichprobe ausf&auml;llt.</b> Bei einer Stichprobengr&ouml;&szlig;e von 1 liegt jede Korrelation beim Maximalwert r=1.</p>
+
Schnell, Rainer & Hill, Paul B. & Esser, Elke. 1999. Methoden der empirischen Sozialforschung. Oldenbourg, München, Wien.
<p>Bei kleineren Stichproben (etwa n=20) sind folgende Einsch&auml;tzungen von <i>r </i> bzw. <i>R </i> weitverbreitet:</p>
 
<p><span class="imgbox imgcenter" style="width:338px; .word-wrap:break-word; "><img height="140" border="0" align="bottom" width="338" alt="Abbildung: Einstufungen von Korrelationskoeffizienten" title="Abbildung: Einstufungen von Korrelationskoeffizienten"  src="images/quantitative-104_1.jpg" /><span class="imgcaption">Abbildung: Einstufungen von Korrelationskoeffizienten</span>
 
</span></p>
 
<p><b>Ob eine Korrelation bedeutend oder unbedeutend ist, h&auml;ngt auch von der Art des (&uuml;berraschenden) Zusammenhangs ab</b>. Eine hohe Korrelation der Schuhgr&ouml;&szlig;e mit der K&ouml;rpergr&ouml;&szlig;e von r=0,8 ist deutlich weniger bedeutend als eine gesicherte Korrelation von r=0,4 bei einer gro&szlig;en Stichprobe &uuml;ber den Zusammenhang zwischen dem Konsum eines bestimmten Nahrungsmittels und der Entwicklung einer bestimmten Krankheit.</p>
 
<hr />
 
<h2>3.5.3.4.2&nbsp;Verdeckte Korrelation</h2>
 
  
<p>Von einer <b>verdeckten Korrelation</b> spricht man, wenn <b>statistisch keinerlei Korrelation</b> errechnet wurde, obwohl <b>sachlich eindeutig Zusammenh&auml;nge</b> vorliegen.</p>
+
Zöfel, Peter. 2003. Statistik für Wirtschaftswissenschaftler. Pearson Studium, München.
<p>Dies ist z.B. m&ouml;glich, wenn Subgruppen der untersuchten Population in hohem Ma&szlig;e Tendenzen aufweisen, welche durch andere Subgruppen neutralisiert werden, weil diese sich gegenl&auml;ufig verhalten.</p>
 
<h3><b>Fiktives Beispiel: Zusammenhang von Zigarettenkonsum und -werbung</b></h3>
 
<p>Wir untersuchen, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabak-Werbung auf das Rauchverhalten von Jugendlichen aus&uuml;bt. Wir stellen fest, dass es keinen messbaren Zusammenhang zwischen dem Konsum der Werbung und dem Zigarettenkonsum gibt. Der Zigarettenkonsum hat sich durch die Wahrnehmung der Werbung nicht ver&auml;ndert.&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:487px; .word-wrap:break-word; "><img height="247" border="0" align="bottom" width="487" src="images/quantitative-105_1.gif" alt="Abbildung: Korrelation Zigaretten" title="Abbildung: Korrelation Zigaretten"  /><span class="imgcaption">Abbildung: Korrelation zwischen Zigarettenkonsum und Zigarettenwerbung</span>
 
</span></p>
 
<p>Ein Blick auf die zugrundeliegenden Daten zeigt jedoch, dass es sehr wohl einen substantiellen Zusammenhang geben muss. Wir betrachten dazu ein Histogramm (In SPSS  -&gt; GRAFIKEN - HISTOGRAMM), bei welchem wir die Werbung als Variable eintragen, die Ver&auml;nderung des Zigarettenkonsums in <i>Felder anordnen als </i> und unter <i>Variable verspachteln </i> das Geschlecht eintragen.&nbsp;</p>
 
<p><span class="imgbox imgcenter" style="width:489px; .word-wrap:break-word; "><img height="376" border="0" align="bottom" width="489" src="images/quantitative-105_2.jpg" alt="Abbildung: Schaltfläche Histogramm SPSS" title="Abbildung: Schaltfläche Histogramm SPSS"  /><span class="imgcaption">Abbildung: Befehlsschaltfl&auml;che Histogramm in SPSS</span>
 
</span></p>
 
<p>Wir erhalten dann folgende zwei nach Geschlechtern getrennte Histogramme:</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="400" border="0" align="bottom" width="500" src="images/quantitative-105_3.jpg" alt="Abbildung: Histogramme Zigarettenkonsum" title="Abbildung: Histogramme Zigarettenkonsum"  /><span class="imgcaption">Abbildung: Nach Geschlechern getrennte Histogramme zum Zigarettenkonsum</span>
 
</span></p>
 
<p>Wir sehen, dass bei den Jungen eine <b>perfekte negative Korrelation[1]</b>  vorliegt (r=-1), bei den M&auml;dchen hingegen eine perfekte <b>positive Korrelation</b> (r=1). Die Jungen haben die Werbung eher als erschreckend f&uuml;r den Tabakkonsum aufgefasst, die M&auml;dchen hingegen als ermutigend. Am Ende des Untersuchungszeitraums rauchten die M&auml;dchen im gleichen Ma&szlig;e mehr als die Jungen weniger rauchten. Dadurch ergab sich eine <b>Null-Korrelation</b> auf der Ebene der gesamten <b>Stichprobe[2]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3<br />
 
[2] Siehe Kapitel 2.1.1<br />
 
  
<hr />
+
==== '''Weblinks:''' ====
<h2>3.5.3.4.3&nbsp;Scheinkorrelationen und Störvariable</h2>
 
  
<p>Eine <b>Scheinkorrelation</b> ist ein <b>statistisch gemessener Zusammenhang zwischen zwei Variablen</b>, welcher nur deshalb auftritt, weil beide Variablen <b>systematisch von einer dritten Variablen beeinflusst</b> werden.</p>
+
'''Basis-Statistik (FAES)[http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html &#91;1&#93;]''', 05.02.2007.
<h3><b>Zusammenhang kann auf St&ouml;rfaktoren zur&uuml;ckgehen</b></h3>
 
<p>Die <b>Korrelation</b> ist eine interessante Methode zur Berechnung von Zusammenh&auml;ngen. Jedoch sollte man sich vergewissern, dass der gemessene Zusammenhang tats&auml;chlich priorit&auml;r und somit kausal ist.</p>
 
<p>Es ist immer auch m&ouml;glich, dass andere Erkl&auml;rungen (<b>St&ouml;rfaktoren</b>) f&uuml;r den Zusammenhang &uuml;bersehen wurden, was zu <b>Scheinkorrelationen</b> f&uuml;hren kann.</p>
 
<p><b>Beispiel 1: Bringen St&ouml;rche Kinder?</b><br />
 
So zeigt sich in Untersuchungen verschiedener L&auml;nder ein hoher Zusammenhang zwischen der Storchenpopulation und der Geburtenrate (teilweise bis r=0,7) im Laufe der Jahrzehnte. Die Erkl&auml;rung dieses verbl&uuml;ffenden Zusammenhanges ist einfach: Durch bessere Bildungs- und Berufschancen der Frauen ging die Geburtenrate zur&uuml;ck, durch zunehmende Umweltbelastung die Storchenpopulation. Daher ist der Zusammenhang von Storchenpopulation und Geburtenrate rein zuf&auml;llig. Er ergibt sich statistisch einfach dadurch, dass sowohl Storchenpopulation wie auch Geburtenrate hoch mit der Wirtschaftsentwicklung korrelieren. Diese f&uuml;hrte zu besseren Jobchancen f&uuml;r Frauen und dadurch auch zu geringeren Kinderzahlen wie auch zu einer zunehmenden Umweltbelastung und damit zu sinkenden Storchenpopulationen.</p>
 
<p><b>Beispiel 2: Haben reichere M&auml;nner weniger Haare?</b><br />
 
Es l&auml;sst sich ein hoher Zusammenhang zwischen M&auml;nnern mit sch&uuml;tterem Haar und hohem Einkommen nachweisen. Tats&auml;chlich besteht aber eher ein Zusammenhang zwischen dem Alter der M&auml;nner und ihrem Einkommen und mit zunehmendem Alter nimmt auch die Zahl der Haare ab.</p>
 
<p>Ist man unsicher, ob eine errechnete <b>Korrelation</b> haltbar ist, kann man kann m&ouml;gliche <b>St&ouml;rfaktoren</b> mit der <b>Partiellen Korrelation</b> herausfiltern.</p>
 
<hr />
 
<h2>3.5.3.4.3.1&nbsp;Partielle Korrelation mit SPSS</h2>
 
  
<h3><b>Beispiel: Korrelation von Fertili&auml;t und weiblicher Lebenserwartung</b></h3>
+
'''HyperStat Online[http://davidmlane.com/hyperstat/ &#91;2&#93;]''', 05.02.2007.
<p>Wir untersuchen den Zusammenhang zwischen Fertilit&auml;t und weiblicher Lebenserwartung (basierend auf den Daten in world95.sav der UNO). Eine Rangkorrelation zwischen beiden liefert folgendes Resultat:</p>
 
<p><span class="imgbox imgcenter" style="width:547px; .word-wrap:break-word; "><img height="257" border="0" align="bottom" width="547" alt="Abbildung: Korrelation Fertilität und Lebenserwartung" title="Abbildung: Korrelation Fertilität und Lebenserwartung"  src="images/quantitative-107_1.jpg" /><span class="imgcaption">Abbildung: Korrelation zwischen weiblicher Fertilit&auml;t und Lebenserwartung</span>
 
</span></p>
 
<h3><b>&Uuml;berlegung:</b></h3>
 
<p>Wir sehen einen hohen und signifikanten Zusammenhang zwischen beiden <b>Variablen</b>. Offensichtlich f&uuml;hrt eine gro&szlig;e Kinderzahl zu stark abnehmender weiblicher Lebenserwartung und umgekehrt. Doch warum sollte dies so sein? Wir kennen doch Personen in unserer Gesellschaft, welche viele Kinder haben und dennoch in voller Gesundheit sehr alt wurden, w&auml;hrend wir auch viele kr&auml;nkliche einzelstehende Personen kennen. Wir suchen daher nach Variablen, welche die beiden vorhandenen beeinflusst haben k&ouml;nnten und dadurch indirekt deren hohen Zusammenhang begr&uuml;nden. Eine derartige m&ouml;gliche (St&ouml;r-)variable ist die weibliche Alphabetisierungsrate. Sie verbessert den Zugang zu Informationen &uuml;ber verbesserte Gesundheitsvorsorge. Damit erh&ouml;ht sie die Lebenserwartung. Gleichzeitig bietet sie durch verbesserte Berufschancen in qualifizierteren Bereichen auch h&auml;ufig bessere Einkommensschancen. Bleibt eine gut verdienende Frau wegen zahlreicher Kinder zuhause, stellt dies gleichzeitig f&uuml;r die Familie einen gr&ouml;&szlig;eren finanziellen Verlust dar, wie wenn eine schlecht verdienende Frau zuhause bleiben w&uuml;rde. Daher entscheiden sich gebildete Frauen h&auml;ufig gegen h&ouml;here Kinderzahlen. Auch wird die Geburt der ersten Kinder oft hinter den abgeschlossenen Bildungsweg zur&uuml;ckgeschoben, was ebenfalls die Fertilit&auml;t verringert.</p>
 
<p>Das waren sachliche Argumente. Die Korrelationen st&uuml;tzen diese Annahme:</p>
 
<p><span class="imgbox imgcenter" style="width:550px; .word-wrap:break-word; "><img height="244" border="0" align="bottom" width="550" alt="Abbildung: Korrelation Fertilität, Lebenserwartung und Alphabetisierungsrate" title="Abbildung: Korrelation Fertilität, Lebenserwartung und Alphabetisierungsrate"  src="images/quantitative-107_2.jpg" /><span class="imgcaption">Abbildung: Korrelation zwischen weiblicher Fertilit&auml;t, Lebenserwartung und Alphabetisierungsrate</span>
 
</span></p>
 
<h3><b><br />
 
Herausrechnung der St&ouml;rvariable mit SPSS:</b></h3>
 
<p>Um nun den Einfluss der <i>St&ouml;rvariable</i> aus der Beziehung <i>weibliche Lebenserwartung/Geburtenrate</i> herauszurechnen, gehen wir in SPSS folgenderma&szlig;en vor:</p>
 
<p>Klicken Sie in der Men&uuml;leiste auf ANAYLISEREN - KORRELATION - PARTIELLE KORRELATIONEN.</p>
 
<p><span class="imgbox imgcenter" style="width:433px; .word-wrap:break-word; "><img height="289" border="0" align="bottom" width="433" alt="Abbildung: Partielle Korrelation mit SPSS" title="Abbildung: Partielle Korrelation mit SPSS"  src="images/quantitative-107_3.jpg" /><span class="imgcaption">Abbildung: Partielle Korrelation mit SPSS - Herausrechnen der St&ouml;rvariable</span>
 
</span></p>
 
<p>Im Feld <i>Variablen</i> f&uuml;gen Sie die beiden Variablen ein, deren Zusammenhang Sie berechnen m&ouml;chten. Unter <i>Kontrollvariablen</i> f&uuml;gen Sie die <i>St&ouml;rvariable</i> ein. Klicken Sie dann auf OK. Sie erhalten die Ausgabe der <b>Korrelation</b> gemeinsam mit der Beurteilung ihrer Signifikanz.</p>
 
<p><span class="imgbox imgcenter" style="width:577px; .word-wrap:break-word; "><img height="216" border="0" align="bottom" width="577" alt="Abbildung: Korrelation Fertilität und Lebenserwartung ohne Störvariable" title="Abbildung: Korrelation Fertilität und Lebenserwartung ohne Störvariable"  src="images/quantitative-107_4.jpg" /><span class="imgcaption">Abbildung: Korrelation Fertilit&auml;t und Lebenserwartung ohne St&ouml;rvariable Alphabetisierungsrate</span>
 
</span></p>
 
<p>Sie sehen, dass durch den Ausschluss dieser <b>St&ouml;rvariable</b> die Korrelation zwischen der weiblichen Lebenserwartung und der Fertilit&auml;t auf die H&auml;lfte gesunken ist.</p>
 
<hr />
 
<h2>3.5.3.4.4&nbsp;Signifikanz der Korrelation</h2>
 
  
<p>Die <b>Signifikanz</b> ist eine Kennzahl, welche die Wahrscheinlichkeit eines systematischen Zusammenhangs zwischen den Variablen bezeichnet. Sie dr&uuml;ckt aus, ob ein scheinbarer Zusammenhang rein zuf&auml;lliger Natur sein k&ouml;nnte oder mit hoher <b>Wahrscheinlichkeit[1]</b>  tats&auml;chlich vorliegt. Man spricht bei der <b>Signikanz</b> von <b>Irrtumswahrscheinlichkeiten</b> oder <b>Signifikanzniveaus</b>. G&auml;ngige Formulierungen lauten etwa, dass zwischen den Variablen A und B eine Korrelation von r=0,5 auf dem <b>Signifikanzniveau</b> oder der <b>Irrtumswahrscheinlichkeit</b> von p &le; 1 % besteht. Dies bedeutet, dass die zwischen den Variablen A und B gefundene Korrelation in dieser H&ouml;he und bei dieser Stichprobengr&ouml;&szlig;e nur in weniger als 1 % aller F&auml;lle rein zuf&auml;llig auftritt.</p>
+
'''Help with Statistics (University of Leicester)[https://www2.le.ac.uk/offices/ld/help-with/stats &#91;3&#93;]''', 21.11.2019.
<p>Die Kennzahl <i>p </i> der <b>Irrtumswahrscheinlichkeit</b>, auf deren komplexe Berechnung hier nicht eingegangen wird, ber&uuml;cksichtigt somit sowohl die <b>H&ouml;he der Korrelation</b> wie auch die <b>Gr&ouml;&szlig;e der Stichprobe</b>. Ist die <b>Stichprobe[2]</b>  sehr klein, muss die Korrelation extrem gro&szlig; ausfallen, um <b>signifikant</b> sein zu k&ouml;nnen. Hingegen kann auch eine Korrelation von r=0,2 bei sehr gro&szlig;en Stichproben <b>signifikant</b> werden.</p>
 
<h3><b>Grenzwerte der Signifikanz bei n=20</b></h3>
 
<p>F&uuml;r eine Stichprobe der Gr&ouml;&szlig;e n = 20 finden wir f&uuml;r einseitige Irrtumswahrscheinlichkeit (Signifikanz) folgende Grenzwerte:</p>
 
<p>Irrtumswahrscheinlichkeit p &le; 5 %: r/R/TAU muss gr&ouml;&szlig;er sein als 0,377</p>
 
<p>Irrtumswahrscheinlichkeit p &le; 1 %: r/R/TAU muss gr&ouml;&szlig;er sein als 0,534</p>
 
<p>D.h. wenn man eine Korrelation von 0,6 bei einer Stichprobe von n=20 ermittelt, dann ist die Wahrscheinlichkeit geringer als 1 %, dass dieser Zusammenhang rein zuf&auml;lliger Natur ist.</p>
 
<h3><b>Bestimmtheitsma&szlig;: Anteil der Korrelation an Ver&auml;nderung</b></h3>
 
<p>Wenn der Korrelationskoeffizient quadriert wird, erh&auml;lt man das <b>Bestimmtheitsma&szlig;</b> (R<sup>2</sup>), den Anteil der durch eine Variable erkl&auml;rten Streuung an der Streuung der anderen. R/r=0,8 bedeutet nicht, dass 80 % der Stichprobe einander entsprechen. R<sup>2</sup> gibt Aufschluss dar&uuml;ber, dass 0,8*0,8=0,64 = 64 %  der Variabilit&auml;t der Werte beider Variablen durch den Zusammenhang bestimmt sind.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3.2<br />
 
[2] Siehe Kapitel 2.1.1<br />
 
  
<hr />
+
Kromrey, Helmut. 1994. '''Empirische Sozialforschung[https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330 &#91;4&#93;]''', 21.11.2019.
<h2>3.5.3.4.4.1&nbsp;Signifikanz mit SPSS</h2>
 
  
<h3><b>Signifkanz von Korrelationen wird von SPSS automatisch ermittelt</b></h3>
+
Lohninger, H. '''Grundlagen der Statistik[http://www.statistics4u.info/fundstat_germ/index_a.html &#91;5&#93;]''', 05.02.2007.
<p>Statistikprogramme wie <b>SPSS</b> ermitteln selbstst&auml;ndig bei der Berechnung der Korrelation die dazugeh&ouml;rige <b>Irrtumswahrscheinlichkeit</b>. Bei SPSS wird <b>mit Sternen ausgedr&uuml;ckt</b> (1, 2 oder 3 Sterne), ob die Korrelation <b>signifikant</b> ist, d.h. ob der Zusammenhang weitgehend gesichert scheint oder nicht.</p>
 
<p>Drei wesentliche Schwellen der <b>Irrtumswahrscheinlichkeit[1]</b> haben breite Akzeptanz gefunden:</p>
 
<ul>
 
    <li>p &lt;=&nbsp; 0,05 (die Wahrscheinlichkeit einer rein zuf&auml;lligen Korrelation liegt bei unter 5 %, SPSS vergibt einen Stern = *);</li>
 
    <li>p &lt;= 0,01 (die Irrtumswahrscheinlichkeit ist kleiner als 1 %, SPSS vergibt 2 Sterne **) oder</li>
 
    <li>p &lt;= 0,001 (die Irrtumswahrscheinlichkeit ist kleiner als 1 &permil;, SPSS vergibt 3 Sterne ***).</li>
 
</ul>
 
<p><span class="imgbox imgcenter" style="width:463px; .word-wrap:break-word; "><img height="254" border="0" align="bottom" width="463" src="images/quantitative-109_1.gif" alt="Abbildung: Korrelation Kalorienaufnahme und BNP" title="Abbildung: Korrelation Kalorienaufnahme und BNP"  /><span class="imgcaption">Abbildung: Korrelation zwischen Kalorienaufnahme und BNP</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p>Diese Korrelation zeigt, basierend auf UNO- Statistiken aus dem Jahr 1995, den Zusammenhang zwischen der t&auml;glichen Kalorienaufnahme und dem Bruttonationalprodukt von L&auml;ndern. Defaultm&auml;&szlig;ig berechnet SPSS zur Korrelation auch die <b>Signifikanz</b> der Korrelation und markiert signifikante Korrelationen wie in diesem Beispiel mit Sternchen. Diese Korrelation ist signifikant auf dem 1%-Niveau (2 Sternchen). Damit signifikante Korrelationen automatisch mit Sternchen markiert werden, muss im Fenster der Korrelationsberechnung der Punkt <i>signifikante Korrelationen markieren</i> mit einem H&auml;kchen markiert sein.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 1.3.2<br />
 
  
<hr />
+
Neuwirth, Erich. 1997. '''Statistik für StatistikerInnen,[http://tud.at/uni/stat1.htm &#91;6&#93;]''' 05.02.2007.
<h2>3.5.3.5&nbsp;Kovarianz</h2>
 
  
<p><b>Die Kovarianz ist eine Kennzahl f&uuml;r den Zusammenhang von zwei Variablen.</b> Sie entspricht der Summe der gemittelten Abweichungsprodukte der Variablen. Sie wird nach folgender Formel berechnet:</p>
+
Rost, Jürgen. 2003. '''Zeitgeist und Moden empirischer Sozialforschung[http://www.qualitative-research.net/index.php/fqs/article/view/723 &#91;7&#93;]'''. In Forum Qualitative Sozialforschung 4/2, 05.02.2007.
<p><span class="imgbox imgcenter" style="width:213px; .word-wrap:break-word; "><img height="62" border="0" align="bottom" width="213" alt="Abbildung: Formel Kovarianz" title="Abbildung: Formel Kovarianz"  src="images/quantitative-110_1.jpg" /><span class="imgcaption">Abbildung: Formel zur Berechnung der Kovarianz</span>
 
</span></p>
 
<p>Die <b>Kovarianz</b> ist <b>positiv</b>, wenn X und Y tendenziell einen linearen Zusammenhang besitzen, d. h. hohe Werte von X entsprechen hohen Werten von Y und niedrige Werte von X niedrigen Werten von Y.</p>
 
<p>Die <b>Kovarianz</b> ist <b>negativ</b>, wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte von X gehen einher mit niedrigen Werten von Y und umgekehrt.</p>
 
<p>Da die Kovarianz in ihrer Rohform von der Gr&ouml;&szlig;e der zugrundeliegenden Daten abh&auml;ngt, ist die Einsch&auml;tzung ihres Wertes ohne die Kenntnis der zugrundeliegenden Daten nicht einsch&auml;tzbar. Dazu muss sie erst standardisiert werden, was zur <b>Korrelation[1]</b>  f&uuml;hrt.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3<br />
 
  
<hr />
+
'''Wahrscheinlichkeitstheorie und Statistik (Uni Osnabrück)[https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf &#91;8&#93;]''', 21.11.2019.
<h2>3.5.4&nbsp;Regression</h2>
 
  
<p><b>Die Regression(sanalyse) ist ein Verfahren zur Analyse von Beziehungen zwischen einer abh&auml;ngigen und einer oder mehreren unabh&auml;ngigen Variablen.</b> W&auml;hrend die <b>Korrelation[1]</b>  die St&auml;rke eines Zusammenhangs zeigt, erlaubt es die <b>Regression</b>, von einer bekannten Gr&ouml;&szlig;e einer Variable auf die vermutliche Gr&ouml;&szlig;e der abh&auml;ngigen Variablen zu schlie&szlig;en, falls ein systematischer Zusammenhang zwischen zwei Variablen A und B vorliegt.</p>
+
'''TU-Graz Statistik-Grundkurs[http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm &#91;9&#93;]''', 05.02.2007.
<p>Prinzipiell unterscheidet man zwischen <b>linearer</b> und <b>nicht-linearer Regression</b>.</p>
 
<p>Bei der <b>linearen Regression</b> kann eine Art <b>Regressionsgerade</b> ins Histogramm gelegt werden, welche die M&ouml;glichkeit der ann&auml;hernden <b>Voraussage von Auspr&auml;gungen</b> bietet.</p>
 
<p>Der Verlauf der Regressionsgerade wird &uuml;ber die Formel</p>
 
<p>y = b*x + a</p>
 
<p>ermittelt, wobei <i>b </i> den <b>Regressionskoeffizienten</b> darstellt, welcher den Tangens des Steigungswinkels der Regressionsgeraden angibt. Der <b>Regressionskoeffizient</b> wird &uuml;ber die nachfolgende Formel ermittelt:</p>
 
<p><span class="imgbox imgcenter" style="width:259px; .word-wrap:break-word; "><img height="147" border="0" align="bottom" width="259" src="images/quantitative-111_1.jpg" alt="Abbildung: Formel Regressionskoeffizient" title="Abbildung: Formel Regressionskoeffizient"  /><span class="imgcaption">Abbildung: Formel zu Berechnung des Regressionskoeffizients</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3<br />
 
  
<hr />
+
--><!-- https://de.serlo.org/mathe --><!--
<h2>3.5.4.1&nbsp;Statistisch-mathematische Berechnung der linearen Regression</h2>
 
  
<p>Die <b>lineare Regression</b> kann mit SPSS auf folgende Weise ermittelt werden:</p>
+
'''Verweise:'''<br />
<p>A. Klicken Sie auf  <i>ANALYSIEREN - REGRESSION - LINEAR.</i> Es erscheint folgendes Fenster:</p>
+
[http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html &#91;1&#93; http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html]<br />
<p><span class="imgbox imgcenter" style="width:479px; .word-wrap:break-word; "><img height="420" border="0" align="bottom" width="479" src="images/quantitative-112_1.jpg" alt="Abbildung: Lineare Regression mit SPSS" title="Abbildung: Lineare Regression mit SPSS"  /><span class="imgcaption">Abbildung: Berechnung der linearen Regression mit SPSS</span>
+
[http://davidmlane.com/hyperstat/ &#91;2&#93; http://davidmlane.com/hyperstat/]<br />
</span></p>
+
[https://www2.le.ac.uk/offices/ld/help-with/stats &#91;3&#93; https://www2.le.ac.uk/offices/ld/help-with/stats]<br />
<p>B. Tragen Sie in <i>Abh&auml;ngige Variable</i> die von Ihnen gew&uuml;nschte metrische Variable ein; in <i>unabh&auml;ngige Variable</i> diejenige Variable, deren Einfluss auf die erste Variable Sie ergr&uuml;nden m&ouml;chten.</p>
+
[https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330 &#91;4&#93; https://obv-at-ubw.userservices.exlibrisgroup.com/view/action/uresolver.do?operation=resolveService&package_service_id=16033772210003332&institutionId=3332&customerId=3330]<br />
<p>C. Klicken Sie auf OK. Sie erhalten nun folgende Ausgaben:</p>
+
[http://www.statistics4u.info/fundstat_germ/index_a.html &#91;5&#93; http://www.statistics4u.info/fundstat_germ/index_a.html]<br />
<p><span class="imgbox imgcenter" style="width:621px; .word-wrap:break-word; "><img height="568" border="0" align="bottom" width="621" src="images/quantitative-112_2.jpg" alt="Abbildung: Modellzusammenfassung in SPSS" title="Abbildung: Modellzusammenfassung in SPSS"  /><span class="imgcaption">Abbildung: Ausgabe Modellzusammenfassung mit SPSS, Beispiel Kindersterblichkeit und weibliche Alphabetisierungsrate</span>
+
[http://tud.at/uni/stat1.htm &#91;6&#93; http://tud.at/uni/stat1.htm]<br />
</span></p>
+
[http://www.qualitative-research.net/index.php/fqs/article/view/723 &#91;7&#93; http://www.qualitative-research.net/index.php/fqs/article/view/723]<br />
<p><b>Erkl&auml;rungen:</b></p>
+
[https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf &#91;8&#93; https://www.mathematik.uni-osnabrueck.de/fileadmin/mathematik/downloads/2009_wust_meyer.pdf]<br />
<p>Was in der ersten Tabelle <i>R</i> genannt wird, ist die Quadratwurzel aus dem <b>Bestimmtheitsma&szlig;</b> und deckt sich bei der einfachen Regressionsanalyse mit dem <b>Korrelationskoeffizienten[1]</b>  von <b>Pearson</b>. Die Korrelation von 0,711 ist durchaus ansehnlich.</p>
+
[http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm &#91;9&#93; http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm]<br />
<p>Unter <i>Koeffizienten</i> stehen die zwei wesentlichen Werte f&uuml;r die Berechnung der <b>Regressionsgerade</b>: Die <i>Konstante</i> (hier 127,203) ist der Ausgangswert, der darunter stehende Wert  -1,129 der Multiplikationsfaktor.</p>
 
<p>Die hier vorliegende Gleichung, die wir errechnen wollten, ist also:</p>
 
<p>A = -1,129*B + 127,203  oder in konkreten Begriffen formuliert:</p>
 
<p>Kindersterblichkeit (pro Tausend) = (weibliche Alphabetisierungsrate)*(-1,129) + 127,203</p>
 
<p>Bei einer weiblichen Alphabetisierungsrate von 50 % k&ouml;nnte man somit eine Kindersterblichratsrate von  -1,129*50 + 127,203 voraussagen, also 70,753.</p>
 
<p>Es sei hinzugef&uuml;gt, dass es sich hier nur um eine Einf&uuml;hrung in die <b>Regressionsanalyse</b> handelt und deshalb auf wichtige damit zusammen h&auml;ngende Begriffe wie <b>Standardfehler der Sch&auml;tzung</b> nicht eingegangen werden kann.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3.1<br />
 
  
<hr />
 
<h2>3.5.4.2&nbsp;Grafische Darstellung der Regression</h2>
 
  
<p>Grafisch kann man eine <b>Regressionsgerade</b> mit SPSS auf folgende Weise erstellen: Klicken Sie in der Men&uuml;leiste auf GRAFIKEN - STREU- /PUNKTDIAGRAMM - EINFACHES STREUDIAGRAMM. Dort geben Sie nach Klick auf <i>Definieren</i> in der Y- Achse eine metrische Variable ein, in der X-Achse genauso. Dann klicken Sie auf OK. Sie erhalten zuerst ein Streudiagramm, vorerst noch ohne Regressionsgerade:</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="400" border="0" align="bottom" width="500" alt="Abbildung: Streudiagramm Alphabetisierungs- und Kindersterblichkeitsrate" title="Abbildung: Streudiagramm Alphabetisierungs- und Kindersterblichkeitsrate"  src="images/quantitative-113_1.jpg" /><span class="imgcaption">Abbildung: Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate</span>
 
</span></p>
 
<p>Nun machen Sie einen Doppelklick auf das Diagramm in der SPSS- Ausgabe. Sie landen im Diagramm-Editor. Unter <i>Elemente</i> k&ouml;nnen Sie <i>Anpassungslinie bei Gesamtwert</i> anklicken. Daraufhin wird defaultm&auml;&szlig;ig eine Regressionsgerade in das Streudiagramm eingef&uuml;gt, gleichzeitig &ouml;ffnet sich das folgende Fenster:</p>
 
<p><span class="imgbox imgcenter" style="width:383px; .word-wrap:break-word; "><img height="483" border="0" align="bottom" width="383" alt="Abbildung: Schaltfläche Diagramm-Eigenschaften SPSS" title="Abbildung: Schaltfläche Diagramm-Eigenschaften SPSS"  src="images/quantitative-113_2.jpg" /><span class="imgcaption">Abbildung: Schaltfl&auml;che Diagramm-Eigenschaften in SPSS</span>
 
</span></p>
 
<p>Kontrollieren Sie nochmals, ob hier <i>Linear</i> angeklickt ist. Nur <i>linear</i> realisiert eine <b>Regressionsgerade</b>. Nach <i>Zuweisen</i> erhalten Sie nun das <b>Streudiagramm[1]</b>  mit der entsprechenden Regressionsgerade:</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="400" border="0" align="bottom" width="500" alt="Abbildung: Streudiagramm mit Regressionsgerade" title="Abbildung: Streudiagramm mit Regressionsgerade"  src="images/quantitative-113_3.jpg" /><span class="imgcaption">Abbildung: Streudiagramm mit Regressionsgerade</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.6<br />
 
  
<hr />
+
= 6.2 Fragebogen-Abfrage =
<h2>3.6&nbsp;Die grafische  Darstellung statistischer Ergebnisse</h2>
 
  
<h3><b>Ein Bild sagt mehr als 1000 Worte</b></h3>
+
==== '''Bücher:''' ====
<p>Dies trifft auch f&uuml;r die Statistik zu. Wer es versteht, mit einfachen, klaren und aussagekr&auml;ftigen <b>Diagrammen</b> zu punkten, wird  f&uuml;r eine leichten und einpr&auml;gsamen Zugang zu seinen Analysen Anerkennung finden.</p>
 
<h3><b>Vorteil von Diagrammen liegt in Einfachheit der Darstellung</b></h3>
 
<p>Allzuleicht l&auml;sst man sich von der Vielfalt an grafischen Darstellungsm&ouml;glichkeiten beeinflussen und meint, Diagramme noch ein wenig optisch ausgefaller, dreidimensional, vermeintlich attraktiver mit zahlreichen Schmankerln machen zu m&uuml;ssen, bis irgendwann einmal der Vorteil eines <b>Diagramms</b> gegen&uuml;ber einer komplexen <b>Tabelle</b> verloren geht und die BetrachterInnen ratlos vor einem schwierig zu deutenden Kunstwerk sitzen. Niemand ist bereit, einige Minuten vor einem komplexen <b>Diagramm</b> zu sitzen, um zu versuchen, es zu verstehen. Mit Diagrammen gewinnt man die BetrachterIn in wenigen Sekunden oder man verliert sie/ihn. <b>Die Notwendigkeit der inhaltlichen Klarheit und dadurch Schlichtheit eines Diagramms hat klare Priorit&auml;t vor der k&uuml;nstlerischen Gestaltung.</b></p>
 
<h3><b>Nicht jedes Diagramm ist f&uuml;r jede Datenlage geeignet.</b></h3>
 
<p>Man sollte bedenken, dass nicht jedes <b>Diagramm</b> f&uuml;r jede Art von Information geeignet ist. Manche <b>Diagramme</b>, wie <b>Kreisdiagramme[1]</b>, werden von den BetrachterInnen mit einem Ganzen, also 100 % assoziiert, und w&uuml;rden bei der Wiedergabe von <b>Mehrfachantworten[2]</b>  zu falschen Schl&uuml;ssen f&uuml;hren.</p>
 
<h3><b>Begleitinformationen sind wichtig</b></h3>
 
<p>Auch <b>Diagramme</b> ben&ouml;tigen <b>Begleitinformationen</b>, um sie voll verst&auml;ndlich zu machen und wissenschaftliche Seri&ouml;sit&auml;t nachzuweisen.</p>
 
<h3><b>Was in Diagrammen, was im Text?</b></h3>
 
<p>Zeigen Sie mit Diagrammen besondere Eigenheiten der Daten und packen Sie die Analysen und anderen notwendigen Begleitinformationen in den Text.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.1<br />
 
[2] Siehe Kapitel 3.2.2<br />
 
  
<hr />
+
Allerbeck, K. & W. Hoag. 1985. Zur Methodik der Umfragen. Frankfurt am Main, Johann Wolfgang von Goethe- Universität.
<h2>3.6.1&nbsp;Arten von Diagrammen</h2>
 
  
<p>Wesentliche Diagrammformen sind:</p>
+
Converse, J.M. & S. Presser. 1986. Survey Questions. Handcrafting the Standardized Questionnaire. Beverly Hills, Sage.
<ul>
 
    <li><b>Balkendiagramme</b>, inklusive gruppierten <b>Diagrammen</b> und <b>Stapelbalkendiagrammen</b></li>
 
    <li><b>Liniendiagramme</b></li>
 
    <li><b>Fl&auml;chendiagramme</b></li>
 
    <li><b>Kreisdiagramme</b></li>
 
    <li><b>Boxplots[1]</b></li>
 
    <li><b>Streudiagramme</b></li>
 
    <li><b>Histogramme</b></li>
 
    <li><b>Kartogramme</b></li>
 
</ul>
 
<h3><b>Viele Programme erm&ouml;glichen die Erstellung von Diagrammen</b></h3>
 
<p>Mit Ausnahme von <b>Boxplots</b> und <b>Kartogrammen</b> k&ouml;nnen alle Diagrammformen von den g&auml;ngigen Programmen erstellt werden, wie sogar von  <b>WinWord</b> (EINF&Uuml;GEN - GRAFIK - DIAGRAMM) oder <b>Excel</b>. In SPSS geht man in der Men&uuml;leiste zu <i>GRAFIKEN</i> und findet dort alle hier angef&uuml;hrten Diagrammformen und viele mehr zur Auswahl.</p>
 
<p>Auch hier gilt, dass professionelle statistische Programme wie z.B. <b>SPSS</b> oder <b>Statistica</b> Vorteile aufweisen, da sie eine F&uuml;lle feiner Einstellungen erlauben, welche mit Bordmitteln nicht zu erreichen sind. Auch verbinden sie in effizienter Form im gleichen Men&uuml;punkt die gleichzeitige Berechnung und Erstellung komplexer Statistiken wie auch von <b>Diagrammen</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.4.5.1<br />
 
  
<hr />
+
Porst, Rolf. 1998. Im Vorfeld der Befragung: Planung, Fragebogenentwicklung, Pretesting. ZUMA- Arbeitsbericht 98/02, Mannheim.
<h2>3.6.1.1&nbsp;Kreisdiagramme</h2>
 
  
<p><b>Kreisdiagramme</b> (auch <b>Tortendiagramme</b>) genannt, sind eine beliebte grafische Darstellungsform, um die <b>Aufteilung eines Ganzen</b> aufzuzeigen.</p>
+
Sudman, S. & N.M. Bradburn 1983. Asking Questions. San Francisco, Jossey-Bass.
<p>F&uuml;r die grafische Darstellung  <b>kategorieller</b> Daten (<b>Nominal[1]</b>- oder <b>Ordinalskalen[2]</b>) verwendet man Diagrammformen, die eine m&ouml;glichst klare Darstellung der relativen Anteile erlauben. Alle Anteile m&uuml;ssen zusammen 100 % ergeben. Der relative Anteil der einzelnen Bestandteile soll sofort optisch erkennbar sein. Damit diese relativen Anteile auf einem Blick gr&ouml;&szlig;enm&auml;&szlig;ig eingeordnet werden k&ouml;nnen, d&uuml;rfen <b>nicht zu viele Kategorien</b> verwendet werden. Sind sie zu zahlreich, sollten kleinere Kategorien nach M&ouml;glichkeit zusammengefasst werden. Andernfalls ist die Darstellung in Form einer Tabelle besser geeignet.</p>
 
<h3><b>Besonders gut geeignet f&uuml;r die Darstellung relativer Anteile</b> sind <b>Torten</b>-  oder <b>Kreisdiagramme</b>:</h3>
 
<p><span class="imgbox imgcenter" style="width:340px; .word-wrap:break-word; "><img height="199" border="0" align="bottom" width="340" alt="Abbildung: Kreisdiagramm Religionszugehörigkeit Nkorongoji" title="Abbildung: Kreisdiagramm Religionszugehörigkeit Nkorongoji"  src="images/quantitative-116_1.gif" /><span class="imgcaption">Abbildung: Kreisdiagramm Religionszugeh&ouml;rigkeit in Nkorongoji (Mali)</span>
 
</span></p>
 
<h3><b>Optimal gro&szlig;e Teile, aber nicht zu viele.</b></h3>
 
<p><b>F&uuml;r das menschliche Auge sind Winkel von mehr als 90 Grad besonders gut zu erkennen.</b> Deshalb eignen sich Tortendiagramme besonders zur Darstellung von Mehrheiten oder von Anteilen von mindestens einem Viertel.</p>
 
<p>Wird die Anzahl der Anteile und damit der Tortenst&uuml;cke zu zahlreich, wird ein Tortendiagramm schnell  un&uuml;bersichtlich, besonders wenn gleichzeitig seine gr&ouml;&szlig;ten St&uuml;cke kleiner als ein Viertel werden:</p>
 
<p><span class="imgbox imgcenter" style="width:340px; .word-wrap:break-word; "><img height="199" border="0" align="bottom" width="340" alt="Abbildung: Kreisdiagramm Religionszugehörigkeit Matmatar" title="Abbildung: Kreisdiagramm Religionszugehörigkeit Matmatar"  src="images/quantitative-116_2.gif" /><span class="imgcaption">Abbildung: Kreisdiagramm Religionszugeh&ouml;rigkeit in Matmatar</span>
 
</span></p>
 
<p>Hier ist es nur mehr mit M&uuml;he m&ouml;glich, die Tortenst&uuml;cke nach ihrer Gr&ouml;&szlig;e zu reihen, da die Rundung die Absch&auml;tzung der relativen Gr&ouml;&szlig;e erschwert. Daher w&auml;ren f&uuml;r die Darstellung vieler Subeinheiten eines Ganzen <b>Stapelbalkendiagramme[3]</b> besser geeignet.</p>
 
<h3><b>Keinesfalls f&uuml;r Mehrfachantworten</b></h3>
 
<p>G&auml;nzlich ungeeignet sind <b>Kreisdiagramme</b>, um die Ergebnisse von Fragen mit <b>Mehrfachantworten</b> darzustellen:</p>
 
<p><span class="imgbox imgcenter" style="width:333px; .word-wrap:break-word; "><img height="221" border="0" align="bottom" width="333" alt="Abbildung: Kreisdiagramm Mehrfachantworten" title="Abbildung: Kreisdiagramm Mehrfachantworten"  src="images/quantitative-116_3.gif" /><span class="imgcaption">Abbildung: Kreisdiagramm Mehrfachantworten</span>
 
</span></p>
 
<p>Bei <b>Kreisdiagrammen</b> neigen BetrachterInnen dazu, die gesamte Torte als etwas Ganzes, also als 100 % aufzufasssen.Da bei Mehrfachantworten jedoch mehr als 100 % auftreten k&ouml;nnen (auch weniger als 100 %), kann dies zu einer falschen Interpretation f&uuml;hren. Deutlich besser w&auml;ren f&uuml;r diesen Zweck horizontale Balkendiagramme geeignet<i>.</i></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.1.2.2<br />
 
[2] Siehe Kapitel 3.1.2.3<br />
 
[3] Siehe Kapitel 3.6.1.3<br />
 
  
<hr />
+
==== '''Weblinks:''' ====
<h2>3.6.1.2&nbsp;Liniendiagramme</h2>
 
  
<p><b>Liniendiagramme</b> eignen sich besonders f&uuml;r die <b>Darstellung von Entwicklungen</b>, ganz besonders auch, wenn komparativ die Entwicklung von zwei oder mehr <b>Populationen[1]</b>  miteinander verglichen wird. Durch die feinen Striche kann man auf engstem Raum Informationen gleich zu mehreren Untersuchungsobjekten unterbringen, wie man im folgenden fiktiven Beispiel sieht, in welchem gezeigt wird, wie sich in verschiedenen L&auml;ndern die Akzeptanz der Aufnahme eines weiteren Landes in die Europ&auml;ische Union ver&auml;nderte.</p>
+
Michael Vonrüden. 2002. '''Internetbasierte Umfragen[http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf &#91;1&#93;]'''. (PDF-Dokument), 05.02.2007.
<p><span class="imgbox imgcenter" style="width:622px; .word-wrap:break-word; "><img height="275" border="0" align="bottom" width="622" alt="Abbildung: Liniendiagramm" title="Abbildung: Liniendiagramm"  src="images/quantitative-117_1.jpg" /><span class="imgcaption">Abbildung: Liniendiagramm</span>
 
</span></p>
 
<p>Man sieht auf einem Blick, dass in Schweden die Akzeptanz von einem hohen Niveau ausgehend stark zur&uuml;ckging, in Irland eher gering blieb, sich in Polen hingegen  von einem sehr geringem zu einem relativ hohen Niveau entwickelte.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
  
<hr />
 
<h2>3.6.1.3&nbsp;Balkendiagramme</h2>
 
  
<p>Einfache <b>Balkendiagramme</b> sind, da sie vom gleichen Nullpunkt ausgehen, sehr gut geeignet, um komparativ auch <b>kleinste Unterschiede zwischen Subbereichen</b> erkennbar zu machen.</p>
 
<p>Sie sind die beste Darstellungsform, um z.B. die Ergebnisse von Fragen mit <b>Mehrfachantworten</b> zu pr&auml;sentieren.</p>
 
<p><span class="imgbox imgcenter" style="width:481px; .word-wrap:break-word; "><img height="253" border="0" align="bottom" width="481" alt="Abbildung: Balkendiagramm Mehrfachantwort" title="Abbildung: Balkendiagramm Mehrfachantwort"  src="images/quantitative-118_1.gif" /><span class="imgcaption">Abbildung: Balkendiagramm Mehrfachantwort</span>
 
</span></p>
 
<p>Balkendiagramme k&ouml;nnen sowohl <b>horizontal</b> (wie das obige Beispiel) wie auch vertikal orientiert sein.</p>
 
<h3><b>Das gruppierte Balkendiagramm</b></h3>
 
<p>Dieses ist besonders geeignet f&uuml;r die <b>kontrastive Darstellung der Auspr&auml;gungen einer Variable</b> (z.B. m&auml;nnlich-weiblich f&uuml;r Geschlecht, Hinduismus-Islam etc. f&uuml;r Religionen). So kann man z.B. vergleichend zeigen, wie M&auml;nner und Frauen in verschiedenen Bereichen abschneiden. Siehe ein Beispiel dazu bei der Berechnung mit SPSS.</p>
 
<h3><b>Stapelbalkendiagramme: Anteile vom Ganzen</b></h3>
 
<p><b>Stapelbalkendiagramme</b> werden - neben <b>Kreisdiagrammen</b> - oft verwendet, um Anteile am Ganzen darzustellen. Zur Darstellung von relativen Mehrheiten sind sie etwas weniger &uuml;bersichtlich als <b>Kreisdiagramme</b>.</p>
 
<p><span class="imgbox imgcenter" style="width:340px; .word-wrap:break-word; "><img height="199" border="0" align="bottom" width="340" alt="Abbildung: Stapelbalkendiagramm Religionszugehörigkeit Nkorongoji" title="Abbildung: Stapelbalkendiagramm Religionszugehörigkeit Nkorongoji"  src="images/quantitative-118_2.gif" /><span class="imgcaption">Abbildung: Stapelbalkendiagramm Religionszugeh&ouml;rigkeit in Nkorongoji (Mali)</span>
 
</span></p>
 
<p>Auch sie werden sehr <b>schnell un&uuml;bersichtlich, wenn die Kategorien zu zahlreich werden,</b> bleiben bei einer gr&ouml;&szlig;eren Zahl von Subeinheiten aber noch &uuml;bersichtlicher als Kreisdiagramme:</p>
 
<p><span class="imgbox imgcenter" style="width:340px; .word-wrap:break-word; "><img height="199" border="0" align="bottom" width="340" alt="Abbildung: Stapelbalkendiagramm Religionszugehörigkeit Matmatar" title="Abbildung: Stapelbalkendiagramm Religionszugehörigkeit Matmatar"  src="images/quantitative-118_3.gif" /><span class="imgcaption">Abbildung: Stapelbalkendiagramm Religionszugeh&ouml;rigkeit in Matmatar</span>
 
</span></p>
 
<h3><b>Vergleich der Aufteilung: Stapelbalkendiagramme</b></h3>
 
<p><b>Gestapelte Balkendiagramme</b> sind besonders wertvoll beim Vergleich der Aufteilung der gleichen <b>Variable</b> in verschiedenen <b>Stichproben/Populationen[1]</b>.</p>
 
<p><span class="imgbox imgcenter" style="width:591px; .word-wrap:break-word; "><img height="222" border="0" align="bottom" width="591" alt="Abbildung: Stapelbalkendiagramm Religionszugehörigkeit Mali" title="Abbildung: Stapelbalkendiagramm Religionszugehörigkeit Mali"  src="images/quantitative-118_4.gif" /><span class="imgcaption">Abbildung: Stapelbalkendiagramm Religionszugeh&ouml;rigkeit in D&ouml;rfern Malis</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.1<br />
 
  
<hr />
+
'''Verweise:'''<br />
<h2>3.6.1.3.1&nbsp;Gruppierte Balkendiagramme mit SPSS</h2>
+
[http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf &#91;1&#93; http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf]<br />
  
<p>Im folgenden <b>Diagramm</b> interessiert uns, inwieweit sich die m&auml;nnliche und die weibliche Lebenserwartung  in den L&auml;ndern dieser Welt nach deren religi&ouml;ser Ausrichtung unterscheiden. Wir greifen dabei auf Daten in world95.sav bei der Berechnung mit SPSS zur&uuml;ck. Der Vorgang mit SPSS erfolgt folgenderma&szlig;en:</p>
 
<p>A. Klicken Sie auf <i>GRAFIKEN - BALKEN</i></p>
 
<p>B. W&auml;hlen Sie das Symbol f&uuml;r <i>Gruppiert</i> und dann <i>Auswertung &uuml;ber verschiedene Variablen</i>.</p>
 
<p>C. Nun w&auml;hlen wir zumindest zwei <b>numerische</b> Variablen aus (welche wir vergleichend zu den Religionen betrachten wollen, in unserem Falle die m&auml;nnliche und die weibliche Lebenserwartung). Diese schieben wir in das Feld <i>Bedeutung der Balken:</i></p>
 
<p><span class="imgbox imgcenter" style="width:551px; .word-wrap:break-word; "><img height="319" border="0" align="bottom" width="551" src="images/quantitative-119_1.jpg" alt="Abbildung: Gruppierte Balkendiagramme mit SPSS" title="Abbildung: Gruppierte Balkendiagramme mit SPSS"  /><span class="imgcaption">Abbildung: Definition von gruppierten Balkendiagrammen mit SPSS</span>
 
</span></p>
 
<p>D. Im Feld <i>Kategorienachse</i> f&uuml;gen wir die Kategorienvariable (in unserem Falle die dominierende Religion des Landes) ein.</p>
 
<p>E. Bei Klick auf <i>Auswertungsfunktion</i> k&ouml;nnen wir uns f&uuml;r bestimmte Kennzahlen entscheiden, wie den <b>Median[1]</b>, das <b>arithmetische Mittel[2]</b>, die <b>H&auml;ufigkeit[3]</b>, <b>Summe</b>, welche f&uuml;r die numerischen Variablen berechnet werden..</p>
 
<p>Nach Klick auf OK erhalten wir das folgende <b>Diagramm</b>:</p>
 
<p><span class="imgbox imgcenter" style="width:548px; .word-wrap:break-word; "><img height="339" border="0" align="bottom" width="548" src="images/quantitative-119_2.gif" alt="Abbildung: Beispiel Gruppiertes Balkendiagramm" title="Abbildung: Beispiel Gruppiertes Balkendiagramm"  /><span class="imgcaption">Abbildung: Gruppiertes Balkendiagramm Religion und Lebenserwartung aufgeteilt nach Geschlechtern</span>
 
</span></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.3.3<br />
 
[2] Siehe Kapitel 3.3.2<br />
 
[3] Siehe Kapitel 3.2.2<br />
 
  
<hr />
 
<h2>3.6.1.4&nbsp;Kartogramme</h2>
 
  
<p><b>Kartogramme</b> sind eine Sonderform von <b>Diagrammen</b> und zeigen die <b>Auspr&auml;gungen einer Variable auf Landkarten</b>.</p>
+
= 6.3 Methoden =
<p><b>Kartogramme</b> sind meist nur mit relativ teuren Programmen m&ouml;glich, wie z.B. <b>Arcview</b>. Zu <b>Excel</b> gibt es eine billigere Zusatzsoftware wie <b>Mapland</b> (99-999 $). <b>MS Office 2000 Professional</b> enthielt noch eine vereinfachte Excel-Komponente namens <b>Microsoft Map.</b></p>
 
<p><span class="imgbox imgcenter" style="width:550px; .word-wrap:break-word; "><img height="388" border="0" align="bottom" width="550" src="images/quantitative-120_1.gif" alt="Abbildung: Kartogramm Bevölkerungsdichte" title="Abbildung: Kartogramm Bevölkerungsdichte"  /><span class="imgcaption">Abbildung: Kartogramm Bev&ouml;lkerungsdichte 1991</span>
 
</span></p>
 
<h3>&nbsp;<b>Kartogramme in Wahlanalysen h&auml;ufig</b></h3>
 
<p>Mittels <b>Kartogrammen</b> k&ouml;nnen v.a. regional unterschiedliche Auspr&auml;gungen sehr gut wiedergegeben werden. Sie werden z.B. bei der TV-Berichterstattung an Wahlabenden eingesetzt, um unterschiedliche Wahlpr&auml;ferenzen in den verschiedenen Bundesl&auml;ndern und Regionen aufzuzeigen.</p>
 
<hr />
 
<h2>3.6.1.5&nbsp;Histogramme</h2>
 
  
<p>Unter einem <b>Histogramm</b> versteht man die grafische Darstellung der <b>H&auml;ufigkeitsverteilung[1]</b>  von Messwerten.</p>
+
==== '''Korrelation und Regression''' ====
<p>Die Daten sind dabei gr&ouml;&szlig;enm&auml;&szlig;ig auf der X-Achse geordnet, w&auml;hrend auf der Y- Achse ihre H&auml;ufigkeiten stehen. &Uuml;ber jeder Klasse wird ein Rechteck errichtet, dessen Fl&auml;che proportional zur klassenspezifischen H&auml;ufigkeit ist.</p>
 
<p><span class="imgbox imgcenter" style="width:500px; .word-wrap:break-word; "><img height="408" border="0" align="bottom" width="500" alt="Abbildung: Histogramm Kindersterblichkeit" title="Abbildung: Histogramm Kindersterblichkeit"  src="images/quantitative-121_1.jpg" /><span class="imgcaption">Abbildung: Histogramm Kindersterblichkeit</span>
 
</span></p>
 
<p><b>Histogramme</b> werden <b>besonders zur Darstellung von Verteilungen</b> verwendet, wie auch zur Demonstration der <b>Normalverteilung[2]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2<br />
 
[2] Siehe Kapitel 3.1.3.3.1<br />
 
  
<hr />
+
Die '''Korrelation[http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf &#91;1&#93;]''' von Merkmalen. (PDF-Dokument), 05.02.2007.
<h2>3.6.1.6&nbsp;Streudiagramme</h2>
 
  
<p><b>Streudiagramme</b> (oder <b>Punktdiagramme</b>) erm&ouml;glichen die grafische <b>Darstellung des Zusammenhangs von zwei Variablen.</b></p>
+
Jörg '''Kovarianz und Korrelation[https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html &#91;2&#93;]'''. In Psychologie-Seiten.de, 21.11.2019
<p>Die Auspr&auml;gung der Variable A wird auf der X- Achse eingetragen, die Auspr&auml;gung der Variable B auf der Y-Achse.</p>
 
<p><span class="imgbox imgcenter" style="width:456px; .word-wrap:break-word; "><img height="356" border="0" align="bottom" width="456" alt="Abbildung: Streudiagramm Alphabetisierungs- und Kindersterblichkeitsrate" title="Abbildung: Streudiagramm Alphabetisierungs- und Kindersterblichkeitsrate"  src="images/quantitative-122_1.jpg" /><span class="imgcaption">Abbildung: Streudiagramm zum Zusammenhang zwischen Alphabetisierung von Frauen und Kindersterblichkeitsrate</span>
 
</span></p>
 
<p>Basierend auf UN-Daten &uuml;ber die Entwicklung der L&auml;nder dieser Welt (siehe world95.sav)  zeigt dieses Diagramm den Zusammenhang zwischen Kindersterblichkeit und weiblicher Alphabetisierung. Man sieht deutlich, dass mit steigender Alphabetisierungsrate der Frauen die Kindersterblichkeit drastisch zur&uuml;ckgeht. <b>Streudiagramme</b> eignen sich vorz&uuml;glich zum <b>Aufzeigen des Zusammenhangs zwischen Variablen[1]</b>  und somit auch zur <b>Darstellung der Regression und der Korrelation[2]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.1<br />
 
[2] Siehe Kapitel 3.5.4.2<br />
 
  
<hr />
+
==== '''Verschiedene Methoden''' ====
<h2>3.6.2&nbsp;Welches Diagramm für welche Daten?</h2>
 
  
<p>&nbsp;<span class="imgbox imgcenter" style="width:615px; .word-wrap:break-word; "><img height="303" border="0" align="bottom" width="615" src="images/quantitative-123_1.jpg" alt="Abbildung: Tabelle Eignung vn Diagrammarten" title="Abbildung: Tabelle Eignung vn Diagrammarten"  /><span class="imgcaption">Abbildung: Tabelle Eignung von Diagrammarten f&uuml;r verschiedene Daten</span>
+
Berger, Klaus. Materialen für '''Mathe-Online[http://www.mathe-online.at/materialien/klaus.berger/ &#91;3&#93;]''', 05.02.2007.
</span></p>
 
<p>&nbsp;</p>
 
<hr />
 
<h2>3.6.3&nbsp;Notwendige Begleitinformationen von Diagrammen</h2>
 
  
<h3><b>Diagramme brauchen Begleitinformationen</b></h3>
 
<p>Diagramme sollten genauso wie die tabellarische Darstellung statistischer Daten alle notwendigen Begleitinformationen aufweisen, die zum Verst&auml;ndnis des Diagramms sowie zum Nachweis der Seri&ouml;sit&auml;t der Arbeit wichtig sind. Dazu z&auml;hlen:</p>
 
<p>A. <b>Name des Erstellers</b>, v.a. wenn es sich um Fremddiagramme handelt;</p>
 
<p>B. Falls es sich nicht um eigene Daten handelt, auf deren Grundlage das Diagramm erstellt wurde, sollte die <b>Quelle der Daten</b> angegeben werden (z.B. Statistikamt der Stadt Ulm 1997) (am besten unterhalb des Diagramms)</p>
 
<p>C. <b>Jahr der Erhebung der Daten</b>;</p>
 
<p>D. <b>Gr&ouml;&szlig;e der Stichprobe</b> (am Besten die bereinigte Gr&ouml;&szlig;e, welche Null-Eingaben und fehlerhafte Eingaben nicht ber&uuml;cksichtigt), v.a. wenn es sich um eigene Daten handelt. Bei gut bekannten Fremddatenquellen wird darauf meist verzichtet (z.B. bei Erhebungen statistischer Zentral&auml;mter etc.)</p>
 
<p>E. <b>Angabe der Messeinheiten</b> (cm, Z&auml;hleinheiten, Prozent etc.)</p>
 
<p>F. <b>Aussagekr&auml;ftiger Titel des Diagramms</b> (ganz oben)</p>
 
<p>G. Aussagekr&auml;ftige <b>Bezeichnungen f&uuml;r die Bestandteile des Diagramms</b> (z.B. f&uuml;r Daten auf der x- bzw. y-Achse.</p>
 
<p>H. Eventuell Hinweis auf Art der Erhebung der Daten</p>
 
<p>I. <b>Bei Mehrfachantworten unbedingt Hinweis darauf</b></p>
 
<p>Das folgende Diagramm (Quelle: <b>http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf[1]</b>) ber&uuml;cksichtigt diese Erfordernisse. Obwohl gleichzeitig viele Daten dargestellt werden m&uuml;ssen, bleibt der Erkenntnisgrad hoch.</p>
 
<p><span class="imgbox imgcenter" style="width:600px; .word-wrap:break-word; "><img height="415" border="0" align="bottom" width="600" alt="Abbildung: Gruppiertes Balkendiagramm teilzeiterwerbstätige Frauen" title="Abbildung: Gruppiertes Balkendiagramm teilzeiterwerbstätige Frauen"  src="images/quantitative-124_1.jpg" /><span class="imgcaption">Abbildung: Gruppiertes Balkendiagramm Anteil der Teilzeiterwerbst&auml;tigen an der Gesamtheit der erwerbst&auml;tigen Frauen im Jahr 2000. Quelle: OECD 2002: 78.</span>
 
</span></p>
 
<p>&nbsp;</p>
 
<p>&nbsp;</p>
 
<p>&nbsp;</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.mzes.uni-mannheim.de/publications/wp/wp-89.pdf<br />
 
  
<hr />
 
<h2>4&nbsp;Software für quantitative Forschungsprojekte</h2>
 
  
<h3><b>F&uuml;r zuhause Excel, an der Universit&auml;t SPSS</b></h3>
+
'''Verweise:'''<br />
<p>Nur wenige Menschen verf&uuml;gen auf dem eigenen PC &uuml;ber spezifische Statistiksoftware. Viele Berechnungen und grafische Darstellungen lassen sich jedoch auch mit g&auml;ngigen Software-Programmen erstellen.</p>
+
[http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf &#91;1&#93; http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf]<br />
<p>Besonders die Tabellenkalkulation <b>Microsoft Excel</b> (aber praktisch auch jede andere Tabellenkalkulation vergleichbarer Qualit&auml;t) verf&uuml;gt &uuml;ber eine F&uuml;lle statistischer Funktionen, mit welchen auch recht ausgefeilte statistische Analysen erledigt werden k&ouml;nnen und auch &uuml;ber zahlreiche M&ouml;glichkeiten, die Ergebnisse mit anschaulichen <b>Diagrammen[1]</b> darzustellen. Eine gute Einf&uuml;hrung in einfache <b>Statistik mit Excel[2]</b> findet sich auf der Homepage von G&uuml;nther Ossimitz.</p>
+
[https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html &#91;2&#93; https://www.psychologie-seiten.de/psychologische-methodenlehre/48-kovarianz-und-korrelation.html]<br />
<p>Wer jedoch sehr viel mit Statistiken zu tun hat und leichten Zugang zu Software wie <b>SPSS</b> hat, welches auch auf den PCs im PC-Raum des Instituts f&uuml;r Kultur- und Sozialanthropologie zu finden ist, wird den leichten Wechsel zu diesem Programm nicht bereuen (zu finden unter Start - Programme - SPSS f&uuml;r Windwows). Daten von Standard-Programmen wie <b>Excel </b> k&ouml;nnen leicht &uuml;bernommen werden, statistische Berechnungen k&ouml;nnen sehr komfortabel in jeder beliebigen Tiefe get&auml;tigt werden. Wer ein wenig eingearbeitet ist, kann mit Programmen wie <b>SPSS</b> viele Analysen um ein Vielfaches schneller als mit <b>Excel</b> abschlie&szlig;en.</p>
+
[http://www.mathe-online.at/materialien/klaus.berger/ &#91;3&#93; http://www.mathe-online.at/materialien/klaus.berger/]<br />
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6<br />
 
[2] http://wwwu.uni-klu.ac.at/gossimit/pap.php?uk=3<br />
 
  
<hr />
 
<h2>4.1&nbsp;Was kann Excel?</h2>
 
  
<h3><b>Excel gut geeignet f&uuml;r einfache Berechnungen und sch&ouml;ne Diagramme</b></h3>
 
<p>Excel ist als Teil des Programms <b>Microsoft Office</b> fast auf jedem PC vorhanden. Bereits mit Excel kann man, wenn auch nicht so komfortabel wie mit <b>SPSS</b>, viele statistische Verfahren durchrechnen und auch grafisch darstellen.</p>
 
<h3><b>&Uuml;bernahme von Excel in SPSS problemlos m&ouml;glich</b></h3>
 
<p>Da Excel auf fast jedem PC vorhanden ist, eignet es sich sehr gut dazu, Daten zu sammeln und erste Voranalysen mit einfachen statistischen Methoden zu machen. Da sowohl Excel wie auch SPSS ein Datenblatt (Tabelle) zur Verwaltung der Daten verwenden, ist die &Uuml;bernahme von Daten aus Excel ins SPSS ausgesprochen einfach.</p>
 
<hr />
 
<h2>4.1.1&nbsp;Statistische Analysen mit Excel</h2>
 
  
<p>Excel bietet u.a. folgende statistische Analyse-Methoden an:</p>
+
= 6.4 Repräsentativität =
<ul>
 
    <li>Chi-Quadrat-Test</li>
 
    <li>H&auml;ufigkeit</li>
 
    <li>Korrelation</li>
 
    <li>Kovarianz</li>
 
    <li>Median</li>
 
    <li>Mittelwert</li>
 
    <li>Modalwert</li>
 
    <li>Quartile</li>
 
    <li>Rangkorrelation</li>
 
    <li>Ma&szlig;korrelation</li>
 
    <li>Standardabweichung</li>
 
    <li>Varianz</li>
 
    <li>T-Test usw.</li>
 
</ul>
 
<p>Der Ablauf von Berechnungen mit Excel:</p>
 
<p>A. Setzen Sie den Cursor in eine freie Zelle, in welcher das Berechnungsergebnis landen soll</p>
 
<p>B. Klicken Sie in der Men&uuml;leiste zuerst auf EINF&Uuml;GEN und dann auf das Untermen&uuml; FUNKTION.</p>
 
<p>C. W&auml;hlen Sie in KATEGORIE AUSW&Auml;HLEN den Subbereich STATISTIK aus.</p>
 
<p>D. W&auml;hlen Sie nun die gew&uuml;nschte statistische Funktion.</p>
 
<p>E. Machen Sie einen Doppelklick auf die Funktion, Sie werden nun nach den Funktionsargumenten gefragt (d.h. nach den Zahlenwerten, die Sie analysieren m&ouml;chten).</p>
 
<p>F. Markieren Sie nun mit der Maus (linke Maustaste dabei festhalten) den von Ihnen gew&uuml;nschten Zahlenblock (also z.B. B2 bis B75).</p>
 
<p>G. Dr&uuml;cken Sie die Returntaste und das Ergebnis sollte im vorher freien Feld landen.</p>
 
<p>Sollten Sie, wie z.B. bei der Korrelation zwei Argumente eingeben m&uuml;ssen, dann m&uuml;ssen Sie den Punkt F zweimal wiederholen. Beim ersten Mal geben Sie den Cursor in die erste Zeile des Fensters (bei der Korrelation Matrix1 genannt) und markieren mit der Maus die erste Datenspalte (z.B. K&ouml;rpergr&ouml;&szlig;e); dann setzen Sie den Cursor in das Feld Matrix2 und markieren mit der Maus die zweite von Ihnen gew&uuml;nschte Datenspalte (z.B. Schuhgr&ouml;&szlig;e). Wenn Sie nun auf OK klicken, wird die Korrelation zwischen K&ouml;rper- und Schuhgr&ouml;&szlig;e berechnet und in das freie Feld eingetragen.</p>
 
<hr />
 
<h2>4.1.2&nbsp;Grafische Aufbereitung von Daten mit Excel</h2>
 
  
<h3><b>Viele statistische Funktionen</b></h3>
+
Höpflinger, François. 2011. '''Standardisierte Erhebungen - methodische Hinweise zu Umfragen[http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf &#91;1&#93;]''', 21.11.2019.
<p>Excel hat eine sehr leistungsf&auml;hige und einfache Funktion f&uuml;r die Herstellung ansehnlicher statistischer Grafiken.</p>
 
<p>Excel bietet u.a. folgende statistische Grafiken (Diagramme) an:</p>
 
<ul>
 
    <li>S&auml;ulen</li>
 
    <li>Balken</li>
 
    <li>Linien</li>
 
    <li>Kreis</li>
 
    <li>Fl&auml;che</li>
 
    <li>Ring</li>
 
    <li>Histogramm (bei Installation eines mitgelieferten Add-Ins, siehe Online-Hilfe bei Microsoft Office 2003)</li>
 
    <li>Netz usw.</li>
 
</ul>
 
<h3><b>Die Erstellung von Diagrammen mit Excel:</b></h3>
 
<p>Sie ist extrem einfach:</p>
 
<p>A. Markieren Sie die Zahlenreihen, welche Sie grafisch darstellen m&ouml;chten.</p>
 
<p>B. Klicken Sie in der Men&uuml;leiste auf EINF&Uuml;GEN und danach auf DIAGRAMM.</p>
 
<p>C. Ihre Zahlenreihen wurden damit schon automatisch &uuml;bernommen und Sie k&ouml;nnen jetzt das Diagramm feinjustieren (Titel, Diagrammart, Gr&ouml;&szlig;e, Farben etc.)</p>
 
<hr />
 
<h2>4.2&nbsp;Was kann MS Access?</h2>
 
  
<h3><b>Gut zum Sammeln von Daten, wenige Analysem&ouml;glichkeiten</b></h3>
 
<p>Microsoft Access kann, da seine Daten ebenfalls in Form einer Tabelle verwaltet werden, sehr gut zum Sammeln der Daten verwendet werden. Seine Analysem&ouml;glichkeiten sind jedoch, abgesehen von einer sehr guten Kreuztabellenfunktion (zu finden unter Abfragen) eher beschr&auml;nkt.</p>
 
<hr />
 
<h2>4.3&nbsp;Profi-Programme: SPSS und Statistica</h2>
 
  
<h3><b>Komfort, Schnelligkeit und gro&szlig;er Funktionsumfang: die Profiprogramme</b></h3>
+
'''Verweise:'''<br />
<p>Profiprogramme wie <b>SPSS</b> oder <b>Statistica</b> weisen eine enorme Vielfalt statistischer Funktionen auf, deutlich mehr als <b>Excel</b> oder <b>MS Access</b>. Da <b>SPSS</b> auf allen PCs an der KSA installiert ist, wird in diesem Online-Kurs die Umsetzung statistischer Analysen und Darstellungen mit <b>SPSS</b> in vielen Bereichen angeboten. <b>Statistica</b> ist ebenfall eine exzellente Software, deren Bedienung auf der vorliegenden Homepage jedoch nicht demonstriert werden kann.</p>
+
[http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf &#91;1&#93; http://www.hoepflinger.com/fhtop/Umfragemethodik.pdf]<br />
<hr />
 
<h2>4.4&nbsp;Datentransfer zwischen Programmen: Von Excel und Access zu SPSS</h2>
 
  
<h3><b>Leichter Datentransfer zwischen Excel bzw. Access und SPSS</b></h3>
 
<p>Der Datentransfer zwischen diesen Programmen ist ausgesprochen einfach:</p>
 
<p>A. Speichern Sie die gew&uuml;nschten Daten, ob in Excel oder in Access, jeweils als Excel- Dokument ab: Gehen Sie zu DATEI - SPEICHERN UNTER und klicken Sie nun MICROSOFT OFFICE EXCEL- ARBEITSMAPPE (*.xls) an.</p>
 
<p>B. Schlie&szlig;en Sie Excel oder Access</p>
 
<p>C. &Ouml;ffnen Sie das Programm SPSS</p>
 
<p>D. Gehen Sie zu DATEI - DATEI &Ouml;FFNEN</p>
 
<p>E. Standardm&auml;&szlig;ig wird als Dateityp nat&uuml;rlich der SPSS- Dateityp *.SAV angezeigt, daher k&ouml;nnen Sie vorerst die abgespeicherte Excel-Datei noch nicht sehen. W&auml;hlen Sie daher im Auswahlfenster unter Dateityp Excel (Endung *.xls) und best&auml;tigen Sie mit einem H&auml;kchen, dass die Variablennamen eingelesen werden sollen (andernfalls werden diese nicht in gew&uuml;nschter Weise &uuml;bernommen).</p>
 
<p>F. Klicken Sie auf OK, die Datei wird nun eingef&uuml;gt. Falls Sie Variablennamen verwendeten, welche l&auml;nger als acht Zeichen waren, werde diese auf acht Zeichen verk&uuml;rzt und Sie erhalten eine Information von SPSS dar&uuml;ber.</p>
 
<p>G. Speichern Sie nun die Datei unter einem beliebigen Namen in SPSS (die Endung *.SAV wird automatisch angenommen).</p>
 
<hr />
 
<h2>4.5&nbsp;Umcodierung</h2>
 
  
<h3><b>Einfache Transformation von Daten mit SPSS</b></h3>
 
<p><b>SPSS</b> ben&ouml;tigt zur internen Berechnung mitunter andere Datenarten (v.a. numerische), als sie von anderen Programmen, auch WinWord &uuml;berliefert werden. SPSS bietet sehr komfortable M&ouml;glichkeiten der automatischen <b>Umwandlung[1]</b>  von Daten, sowie auch ihrer automatischen <b>R&uuml;ckwandlung[2]</b>  f&uuml;r die Bildschirm- und Druckausgabe.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 2.2.3.2<br />
 
[2] Siehe Kapitel 2.2.3.3<br />
 
  
<hr />
+
= 6.5 Statistik-Software =
<h2>5&nbsp;Lexikon statistischer Grundbegriffe</h2>
 
  
<p>Hier finden Sie die wichtigsten statistischen Grundbegriffe alphabetisch geordnet.</p>
+
==== '''Bücher:''' ====
<hr />
 
<h2>5.1&nbsp;A-C</h2>
 
  
<h3><b>Abh&auml;ngige Variable</b></h3>
+
Bühl, Achim. 2006. SPSS 14. Einführung in die moderne Datenanalyse. Pearson Studium, München.
<p>Darunter versteht man <b>Variable</b>, deren Auspr&auml;gung durch eine oder mehrere andere Variablen systematisch beeinflusst werden. So w&auml;re z.B. in der Landwirtschaft der Ernteertrag abh&auml;ngig z.B. von der Bodenqualit&auml;t wie auch vom Einsatz von D&uuml;ngemitteln.</p>
 
<h3><b>Alpha-Fehler</b></h3>
 
<p>Siehe <i>Fehler der 1. Art</i></p>
 
<h3><b>Alternativhypothese</b></h3>
 
<p>Unter einer Alternativhypothese versteht man bei statistischen Tests die Gegenhypothese H1 zur Nullhypothese H0. Vor Durchf&uuml;hrung von Tests legt man Annahmen &uuml;ber die Grundgesamtheit fest, welche mit Tests &uuml;berpr&uuml;ft werden.</p>
 
<h3><b>Analytische Statistik </b> (auch Schlie&szlig;ende Statistik oder Inferenzstatistik)</h3>
 
<p>Mithilfe von Verfahren der analytischen Statistik versucht man, von Stichproben auf die Grundpopulation bei Ber&uuml;cksichtigung unterschiedlicher Wahrscheinlichkeiten zu schlie&szlig;en. Dazu kommen eine Vielzahl weiterer weiterf&uuml;hrender Verfahren wie Clusteranalyse, Faktorenanlyse multivariate Verfahren,... Siehe auch: <b>Induktive Statistik (Wikipedia)[1]</b>.</p>
 
<h3><b>Arbeitshypothese</b></h3>
 
<p>Darunter versteht man eine genau festzulegende Annahme, von der man zu Beginn eines Forschungsprojektes ausgeht. Siehe auch <i>Nullhypothese</i>.</p>
 
<h3><b>Arithmetisches Mittel</b> (oder Durchschnitt/-swert)</h3>
 
<p>Das am h&auml;ufigsten verwendete Lagema&szlig;, welches den Durchschnittswert (Summe aller Werte dividiert durch ihre Anzahl) einer Variablen zeigt. Es sollte nur bei <i>metrischen </i> Variablen eingesetzt werden.</p>
 
<h3><b>Auspr&auml;gungen</b></h3>
 
<p>Unter Auspr&auml;gungen versteht man die Gesamtheit der m&ouml;glichen Werte eines Merkmals.So kann z.B. die Variable Geschlecht die Auspr&auml;gungen <i>m&auml;nnlich</i> und <i>weiblich</i> annehmen.</p>
 
<h3><b>Ausrei&szlig;er</b></h3>
 
<p>Darunter versteht man einen extrem gro&szlig;en oder extrem kleinen Wert, welcher weit von den restlichen Eintr&auml;gen entfernt ist. Dies k&ouml;nnte z.B. der Fall beim Einkommen eines Million&auml;rs sein, welcher in einem sehr armen Dorf lebt.</p>
 
<h3><b>Balkendiagramm</b> (auch S&auml;ulen- oder Blockdiagramm)</h3>
 
<p>Dabei handelt es sich um Diagramme, bei welchen die Gr&ouml;&szlig;e der Werte mit der L&auml;nge von Balken bzw. S&auml;ulen ausgedr&uuml;ckt werden. Werden die Werte (oft H&auml;ufigkeiten) senkrecht aufgetragen, spricht man in engerer Terminologie von S&auml;ulendiagrammen, werden sie waagrecht aufgetragen, von Balkendiagrammen.</p>
 
<h3><b>Bestimmtheitsma&szlig;</b> (auch Determinationskoeffizient)</h3>
 
<p>Das Bestimmtheitsma&szlig; ist ein Ma&szlig; f&uuml;r den Zusammenhang zwischen zwei Variablen und entspricht dem Quadrat des Korrelationskoeffizienten <i>r.</i> Es gibt an, in welchem Ausma&szlig; die Varianz der einen Variablen durch die Varianz der anderen Variablen bestimmt wird. Siehe auch: <b>Bestimmtheitsma&szlig; (Wikipedia)[2]</b>.</p>
 
<h3><b>Beta-Fehler</b></h3>
 
<p>Siehe <i>Fehler der 1. und 2. Art.</i></p>
 
<h3><b>bimodal</b></h3>
 
<p>Darunter versteht man das Auftreten von zwei Gipfeln in einer H&auml;ufigkeitsverteilung, d.h. von zwei <i>Modalwerten</i>.</p>
 
<h3><b>Biseriale Korrelation</b></h3>
 
<p>Die biseriale Korrelation <i>rbis </i> zeigt den Zusammenhang von zwei <i>metrischen</i> und <i>normalverteilten</i>Variablen, von denen eine k&uuml;nstlich dichotomisiert wurde (in zwei Gruppen unterteilt).</p>
 
<h3><b>bivariat</b></h3>
 
<p>Bivariat bezeichnet, dass von den Betrachtungen gleichzeitig zwei Variablen betroffen sind. Siehe z.B. die <b>bivariate H&auml;ufigkeitsverteilung[3]</b>.</p>
 
<h3><b>Blockbildung</b></h3>
 
<p>Unter Blockbildung, auch <i>Clusterbildung</i> genannt, versteht man die Zusammenfassung von Elementen der Untersuchung, welche wesentliche f&uuml;r die Untersuchung relevante Eigenschaften gemeinsam haben, zu Bl&ouml;cken oder Clustern. SPSS erm&ouml;glicht es, derartige Cluster mithilfe der Clusteranalyse zu ermitteln. Der Vorteil der Clusterbildung liegt darin, dass durch die Schaffung gr&ouml;&szlig;erer Einheiten sinkt auch die Fehlerwahrscheinlichkeit von Aussagen. Siehe zur Clusteranalyse: <b>Clusteranalyse (Wikipedia)[4]</b>.</p>
 
<h3><b>Blockdiagramm</b></h3>
 
<p>Siehe <b>Balkendiagramm[5]</b>.</p>
 
<h3><b>Boxplot</b></h3>
 
<p>Unter Boxplots versteht man eine graphische Darstellung der Lage und der Verteilung stetiger Merkmale beruhend auf den empirischen Quartilen. Der Abstand zwischen dem 1. und dem 3. Quartil wird als ein Rechteck dargestellt, in welchem durch einen waagrechten Strich auch der Median verzeichnet ist. Siehe wegen weiterer Eigenheiten dazu auch: <b>Vergleichende grafische Darstellung[6]</b> von Streuung und Lage mit Box-Plots.</p>
 
<h3><b>Chi-Quadrat-Test</b></h3>
 
<p>Der Chi-Quadrat-Test ist ein statistisches Verfahren, um die Unabh&auml;ngigkeit von zwei Merkmalen zu &uuml;berpr&uuml;fen. Er wird besonders gerne bei der <b>Kreuztabellen-Analyse[7]</b>  eingesetzt. Siehe dazu auch: <b>Chi-Quadrat-Test (Wikipedia)[8]</b>.</p>
 
<h3><b>Clusterbildung</b></h3>
 
<p>siehe <i>Blockbildung</i></p>
 
<h3><b>Codeplan</b></h3>
 
<p>Darunter versteht man die schriftliche Zusammenfassung der Umsetzung der erhobenen Daten in numerische Werte, welche von den Statistik- Programmen zur Analyse ben&ouml;tigt werden. Siehe auch: <b>vom Fragebogen zum Codeplan[9]</b>.</p>
 
<h3><b>Codieren</b></h3>
 
<p>C. bezeichnet die Zuordnung von festgelegten Schl&uuml;sseln (Zahlen oder Buchstaben) zu Merkmalsauspr&auml;gungen f&uuml;r die Datenerfassung (z.B. bei Noten  &rsquo;Sehr gut&rsquo; als 1, &rsquo;Gut&rsquo; als 2 etc.; oder bei Altersgruppen 1 f&uuml;r Kleinkinder, 2 f&uuml;r Jugendliche, 3 f&uuml;r Erwachsene, 4 f&uuml;r PensionistInnen).</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://de.wikipedia.org/wiki/Induktive_Statistik<br />
 
[2] http://de.wikipedia.org/wiki/Bestimmtheitsma%C3%9F<br />
 
[3] Siehe Kapitel 3.5.1<br />
 
[4] http://de.wikipedia.org/wiki/Clusteranalyse<br />
 
[5] Siehe Kapitel 3.6.1.3<br />
 
[6] Siehe Kapitel 3.4.5<br />
 
[7] Siehe Kapitel 3.5.2.1.1<br />
 
[8] http://de.wikipedia.org/wiki/Chi-Quadrat-Test<br />
 
[9] Siehe Kapitel 2.2.3<br />
 
  
<hr />
+
Wittenberg R. & Cramer Hans. 2003. Datenanalyse mit SPSS für Windows. UTB, Stuttgart.
<h2>5.2&nbsp;D-F</h2>
 
  
<h3><b>Datenmatrix</b></h3>
+
==== '''Links:''' ====
<p>Eine D. ist eine Anordnung der Daten, bei der die Untersuchungseinheiten in den Zeilen und die zu ihnen untersuchten Variablen in den Spalten eingetragen werden. Von oben nach unten k&ouml;nnten also z.B. die Versuchspersonen eingetragen werden, von links nach rechts ihre K&ouml;rpergr&ouml;&szlig;e, ihre Leistungen, ihre Matrikelnummer etc. Eine Datenmatrix wird von jedem f&uuml;r statistische Zwecke verwendeten Programm zur Verwaltung der Daten verwendet.</p>
 
<h3><b>Deskriptive Statistik</b></h3>
 
<p>In der deskriptiven Statistik erstellt man Ma&szlig;zahlen zur Charakterisierung von Daten, wie <i>Lagema&szlig;e</i> (z.B. Durchschnitt), <i>Streuungsma&szlig;e</i> (z.B. Quartile) oder Ma&szlig;e f&uuml;r den Zusammenhang von Variablen (z.B. <i>Korrelation</i>). Dazu geh&ouml;rt auch die grafische Aufbereitung der Daten und Ergebnisse in Form von Diagrammen. Im Gegensatz zur <i>Analytischen Statistik</i> besch&auml;ftigt sie sich nicht damit, von der <i>Stichprobe</i> unter Ber&uuml;cksichtigung verschiedener Wahrscheinlichkeiten auf die <i>Grundgesamtheit</i> zu schlie&szlig;en.</p>
 
<h3><b>Dichotome Variable</b></h3>
 
<p>Eine d.V. ist eine Variable, bei welcher nur zwei Auspr&auml;gungen m&ouml;glich sind, wie z.B. lebendig/nicht lebendig; m&auml;nnlich/weiblich; bestanden/nicht bestanden. Jede <i>stetige Variable</i> kann zu dichotomen umgewandelt werden, wie z.B. differenziertes Einkommen zu &rsquo;unter 1000 &euro;&rsquo; und &rsquo;&uuml;ber 1000 &euro;).</p>
 
<h3><b>Diskrete Variable</b></h3>
 
<p>Eine d.V. ist eine Variable, bei welcher nur abz&auml;hlbar viele Auspr&auml;gungen m&ouml;glich sind, also eine unendliche feine Differenzierung nicht m&ouml;glich ist (das w&auml;re eine <i>stetige Variable</i>). Beispiele f&uuml;r eine d.V. sind die Punktzahlen eines W&uuml;rfels, die Kinderzahlen von Familien, die Noten bei Pr&uuml;fungen etc.</p>
 
<h3><b>Dispersionsma&szlig;e</b></h3>
 
<p>Siehe <i>Streuungsma&szlig;e</i></p>
 
<h3><b>Einseitige Hypothese</b> (auch gerichtete Hypothese)</h3>
 
<p>E. H. sind Hypothesen, welche eine bestimmte Richtung eines Zusammenhangs annehmen. Man nimmt also nicht nur an, dass z.B. die K&ouml;rpergr&ouml;&szlig;e mit der Schuhgr&ouml;&szlig;e korreliert, sondern genauer, dass mit steigender K&ouml;rpergr&ouml;&szlig;e eine  gr&ouml;&szlig;ere Schuhgr&ouml;&szlig;e einhergeht. (siehe auch <i>zweiseitige Hypothese</i>).</p>
 
<h3><b>Fehler 1. und 2. Art</b> (auch Alpha- und Beta-Fehler)</h3>
 
<p>In der Statistik arbeitet man mit Wahrscheinlichkeiten. Wir dr&uuml;cken dabei z.B. aus, dass unsere Nullhypothese bei einem <i>Signifikanzniveau</i> von 0,01 richtig ist, anders formuliert, bei einer <i>Irrtumswahrscheinlichkeit</i> von 1 %. Das bedeutet, dass in 1 % aller F&auml;lle die Nullhypothese falsch sein wird, obwohl unsere Daten auf das gemessene Ph&auml;nomen hindeuten. Das bezeichnet man als den <i>Fehler der 1. Art =</i> Die Nullhypothese stimmt nicht, obwohl unsere Daten die Nullhypothese best&auml;tigen.</p>
 
<p>Der <i>Fehler der 2. Art</i> ist das Gegenteil. Die Nullhypothese wird zu Unrecht verworfen, weil die Daten (z.B. durch schlechte Auswahl der Mitglieder der Stichprobe) dazu anleiten.</p>
 
<h3><b>Fl&auml;chendiagramm</b></h3>
 
<p>Das F. ist eine Diagrammform, bei welchem die Fl&auml;che zwischen Kurve und X- Achse durch Schraffierung oder Muster markiert wird.</p>
 
<hr />
 
<h2>5.3&nbsp;G-I</h2>
 
  
<h3><b>Gau&szlig;sche Glockenkurve</b> <i>(auch Gau&szlig;verteilung</i>)</h3>
+
Ludwig-Mayerhofer, Wolfgang. '''Internet Guide to SPSS for Windows[http://wlm.userweb.mwn.de/SPSS/ &#91;1&#93;]''', 21.11.2019
<p>siehe <i>Normalverteilung</i></p>
 
<h3><b>Geometrisches Mittel</b></h3>
 
<p>siehe <i>Mittel</i></p>
 
<h3><b>Geschlossene Frage</b></h3>
 
<p>Eine g. Fr. ist eine Frage mit vorgegebenen Antwortkategorien, z.B. &rsquo;Verdienen Sie ... A. unter 1000 &euro;, B. &uuml;ber 1000 &euro;&rsquo;.</p>
 
<h3><b>Geschichtete Stichprobe</b></h3>
 
<p>Bei einer g. St. wird die Grundgesamtheit in Gruppen oder Schichten eingeteilt (z.B. FleischesserInnen und VegetarierInnen oder M&auml;nner und Frauen; Kinder, Jugendliche, Erwachsene, &auml;ltere Menschen). Man wird in der Regel versuchen (s. <i>Repr&auml;sentativit&auml;t</i>), das in der Grundpopulation vorhandene Verh&auml;ltnis der Gruppen in der Stichprobe nachzubilden. Man spricht dann von einer proportionalen Schichtung.</p>
 
<h3><b>Grundgesamtheit</b> (auch <i>Grundpopulation</i>)</h3>
 
<p>Unter G. versteht man die Gesamtheit der Elemente, f&uuml;r welche die Aussagen der Untersuchung gelten sollen. Sie muss genau festgelegt werden. Erhebt man die Einstellungen von WienerInnen gegen&uuml;ber ZuwandererInnen, so muss festgelegt werden, wer mit WienerInnen gemeint ist (ab welchem Alter; bei welchem rechtlichen Status, bei welcher Aufenthaltsdauer in der Stadt etc.). Da eine <i>Vollerhebung</i> nur selten m&ouml;glich ist, w&auml;hlt man in der Regel eine <i>Stichprobe</i> aus.</p>
 
<h3><b>G&uuml;tekriterium</b></h3>
 
<p>Unter G. versteht man Kriterien zur Absch&auml;tzung der Qualit&auml;t und Seri&ouml;sit&auml;t wissenschaftlicher Forschung (Datenerhebung, Analyse etc.). Die wesentlichen G. sind <i>Validit&auml;t</i>, <i>Reliabilit&auml;t</i> und <i>Objektivit&auml;t</i>.</p>
 
<h3><b>Harmonisches Mittel</b></h3>
 
<p>siehe <i>Mittel.</i></p>
 
<h3><b>H&auml;ufigkeit</b></h3>
 
<p>Die H&auml;ufigkeit informiert, wie oft ein bestimmter Messwert auftritt. Man unterscheidet zwischen <i>absoluter H&auml;ufigkeit</i> (die gez&auml;hlte H&auml;ufigkeit eines Messwerts, z.B. 18 M&auml;nner), die <i>kumulierte H&auml;ufigkeit</i> (die aufsummierte H&auml;ufigkeit bis zu einem bestimmten Niveau, z.B. 23 Sch&uuml;lerInnen hatten ein Gut oder Sehr Gut auf die Schularbeit), <i>die prozentuelle H&auml;ufigkeit</i> (in Prozent gemessen) bzw. <i>die relative H&auml;ufigkeit</i> (in Teilen von 1 gemessen).</p>
 
<h3><b>H&auml;ufigkeitsverteilung</b></h3>
 
<p>Unter einer H. versteht man eine tabellarische oder grafische Anordnung von Werten, bei der die jeweiligen Auspr&auml;gungen mit der dazugeh&ouml;rigen H&auml;ufigkeit vermerkt werden.</p>
 
<h3><b>Histogramm</b></h3>
 
<p>Ein H. erm&ouml;glicht die graphische Darstellung der H&auml;ufigkeitsverteilung quantitativer Merkmale. Die Daten werden in Klassen eingeteilt und auf einer Grundlinie aufgetragen. &Uuml;ber jeder Klasse wird ein Rechteck gezeichnet. Die H&ouml;he des Rechtecks wird durch seine H&auml;ufigkeit bestimmt. Siehe auch: <b>Histogramme[1]</b>.</p>
 
<h3><b>Hypothese</b></h3>
 
<p>Eine H. ist eine Annahme &uuml;ber die Beziehung zwischen zwei oder mehr Variablen, die mithilfe eines Untersuchungsverfahrens verifiziert oder falsifiziert werden kann. Siehe auch <i>Nullhypothese</i>.</p>
 
<h3><b>Inferenzstatistik</b></h3>
 
<p>Siehe <i>Analytische Statistik</i></p>
 
<h3><b>Interquartilsabstand</b></h3>
 
<p>Als I. bezeichnet man die Differenz zwischen dem ersten und dem dritten Quartil. Grafisch wird er z.B. mit dem <i>Boxplot</i> dargestellt.</p>
 
<h3><b>Intervallskalierung</b></h3>
 
<p>Bei der I. k&ouml;nnen die Abst&auml;nde zwischen den Auspr&auml;gungen <i>metrischer Werte</i> richtig interpretiert werden, jedoch gibt es keinen nat&uuml;rlichen Nullpunkt, sodass das Verh&auml;ltnis der Werte nicht interpretiert werden kann. Der Abstand zwischen 12 und 13 Grad ist genauso gro&szlig; wie der zwischen 34 und 35 Grad. Man kann jedoch nicht sagen, dass 10 Grad doppelt so hei&szlig; wie 5 Grad ist (es gibt einen absoluten Nullpunkt bei - 273 Grad, unsere gewohnte Null-Gradgrenze ist willk&uuml;rlich und l&auml;sst sich nach unten unterschreiten).</p>
 
<h3><b>Irrtumswahrscheinlichkeit</b></h3>
 
<p>Unter I. versteht man die Wahrscheinlichkeit f&uuml;r das Auftreten des <i>Fehlers 1. Art. </i>Die I. ist somit die pr&auml;zisierte Wahrscheinlichkeit, dass - obwohl die Daten einen bestimmten Schluss zulassen - dieser Schluss falsch ist. Als g&auml;ngige Niveaus der Irrtumswahrscheinlichkeit nimmt man 5 %, 1 % und 1 &permil;.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.6.1.5<br />
 
  
<hr />
 
<h2>5.4&nbsp;J-M</h2>
 
  
<h3><b>Klasse</b></h3>
+
'''Verweise:'''<br />
<p>Unter einer K. versteht man eine Gruppe von Auspr&auml;gungen stetiger und diskreter Variablen, welche durch die Zusammenfassung benachbarter Werte entstehen. Eine Klasse wird von festgelegten Klassengrenzen begrenzt. Den Vorgang der Klassenbildung nennt man <i>Klassierung oder Klassifikation</i>. Eine Klassierung wird in der Regel verwendet, um die Darstellung enorm differenzierter Auspr&auml;gungen &uuml;bersichtlicher zu gestalten (z.B. Zusammenfassung aller Einkommen in 0-500 &euro;; eine zweite Klasse Einkommen bis 1000 &euro;; eine dritte Klasse zwischen 1001-1500 &euro; usw.). Siehe auch: <b>Klassenbildung von Daten[1]</b>.</p>
+
[http://wlm.userweb.mwn.de/SPSS/ &#91;1&#93; http://wlm.userweb.mwn.de/SPSS/]<br />
<h3><b>Klassifizerung</b> (auch <i>Klassierung</i>).</h3>
 
<p>Siehe <i>Klasse.</i></p>
 
<h3><b>Konfidenzinterall</b> (auch <i>Vertrauensintervall</i>)</h3>
 
<p>Aus Stichproben erhaltene Ma&szlig;zahlen sind immer nur Ann&auml;herungen an die zugrundeliegenden, aber meist unbekannten Werte in der Grundpopulation. Man ermittelt daher <i>Konfidenzintervalle,</i> innerhalb welchen Bereichs sich der &rsquo;richtige&rsquo; Wert befindet. Diese Konfidenzintervalle h&auml;ngen vom gew&auml;hlten <i>Signifikanzniveau</i> ab. Wir erleben die Angabe derartiger Konfidenzintervalle an jedem Wahlsonntag, wenn bei den ersten Analysen des wahrscheinlichen Wahlergebnisses der/die Statistikexperte/in sagt, dass die Partei A mit zwischen 34,8 und 36,2 % der Stimmen rechnen kann. Mit wachsender Stichprobengr&ouml;&szlig;e (Ausz&auml;hlungsgrad) wird das Konfidenzintervall kleiner, weil immer mehr mit der Grundpopulation &uuml;bereinstimmend, bis es bei Vollausz&auml;hlung verschwindet. Siehe auch: <b>Konfidenzintervall (Wikipedia)[2]</b>.</p>
 
<h3><b>Kontingenztafel</b></h3>
 
<p>Eine K. ist die tabellarische Darstellung der H&auml;ufigkeitsverteilung von zumindest zwei Merkmalen. Siehe <i>Kreuztabelle.</i></p>
 
<h3><b>Kontingenzkoeffizient</b></h3>
 
<p>Ein K. ist eine Kennzahl f&uuml;r die St&auml;rke des Zusammenhangs zwischen nominalskalierten Daten. Siehe auch: <b>Kontingenzkoeffizient (Wikipedia)[3]</b>.</p>
 
<h3><b>Korrelation</b></h3>
 
<p>Unter K. versteht man den Zusammenhang zwischen zwei quantitativen Merkmalen. Die St&auml;rke des Zusammenhangs wird durch den <i>Korrelationskoeffizient</i> ausgedr&uuml;ckt. Siehe auch: die <b>Korrelation[4]</b>.</p>
 
<h3><b>Korrelationskoeffizient</b></h3>
 
<p>Der K. ist eine Kennzahl f&uuml;r den linearen Zusammenhang zwischen zwei quantitativen Merkmalen. Er liegt zwischen den Extremen -1 und +1. Wenn er positiv ist, bedeutet dies, dass ein hoher Wert der Variablen A mit einem hohen Wert der Variablen B einhergeht, genauso verh&auml;lt es sich mit den niedrigen Werten. Ist der K. negativ, bedeutet dies, dass hohe Werte von Variable A mit niedrigen der Variable B einhergehen und umgekehrt.</p>
 
<h3><b>Kovarianz</b></h3>
 
<p>Die Kovarianz beschreibt den Zusammenhang zwischen zwei metrischen Merkmalen. Da sie nicht standardisiert ist, wird in der Regel statt ihr auf die von ihr abgeleitete <i>Korrelation</i> zur&uuml;ckgegriffen. Siehe auch: <b>Kovarianz (Wikipedia)[5]</b>.</p>
 
<h3><b>Kreisdiagramm</b> (oder Tortendiagramm)</h3>
 
<p>Das K. ist eine Diagrammform, welche sich besonders gut zur Darstellung von Anteilen vom Ganzen eignet. H&auml;ufigkeiten werden durch Kreissektoren wiedergegeben. Die Gr&ouml;&szlig;e eines Tortenst&uuml;cks entspricht dem relativen Anteil am Ganzen oder an 100 %.</p>
 
<h3><b>Kreuztabelle</b> (auch Kontingenztabelle, -tafel)</h3>
 
<p>In einer K. stellt man die gemeinsame H&auml;ufigkeitsverteilung von zumindest zwei Variablen (nominal-  oder ordinalskaliert) dar. Man versucht dabei, auff&auml;llige Unterschiede zwischen beobachteter H&auml;ufigkeit und der zu erwarteder H&auml;ufigkeit festzustellen und mittels des <i>Chi-Quadrat-Tests </i>wahrscheinliche Zusammenh&auml;nge zu &uuml;berpr&uuml;fen. Siehe auch: <b>Kreuztabellen-Analyse[6]</b>.</p>
 
<h3><b>Kumulative H&auml;ufigkeit</b> (auch <i>kumulierte H.</i>)</h3>
 
<p>siehe <i>H&auml;ufigkeit</i></p>
 
<h3><b>Lagema&szlig;e</b> (auch <i>Zentralwerte</i> oder <i>Ma&szlig;e der zentralen Tendenz)</i></h3>
 
<p>Mit L. kann man den Schwerpunkt der Auspr&auml;gungen quantitativer Variabler zeigen.Die gebr&auml;uchlichsten Lagema&szlig;e sind das <i>arithmetische Mittelt</i>, der Median und der Modalwert. Siehe auch: <b>Mittelwerte[7]</b>.</p>
 
<h3><b>Liniendiagramm</b> (auch <i>Kurvendiagramm</i>)</h3>
 
<p>Man verwendet L., um den zeitlichen Verlauf von Entwicklungen zu zeigen. Siehe auch: <b>Liniendiagramme[8]</b>.</p>
 
<h3><b>Ma&szlig;zahlen</b></h3>
 
<p>M. zeigen charakteristische Eigenheiten quantitativer Variabler. Man unterscheidet <i>Lagema&szlig;e</i> und <i>Streuungsma&szlig;e</i>.</p>
 
<h3><b>Median</b> (auch <i>Zentralwert</i>)</h3>
 
<p>Der Median kann bei mindestens ordinalskalierten Daten eingesetzt werden und bezeichnet jenes Element, welches in einer geordneten Reihe genau in der Mitte liegt. D.h. dass es oberhalb von ihm genauso viele (gr&ouml;&szlig;ere) Eintr&auml;ge wie unterhalb von ihm gibt.</p>
 
<p>Der Median eignet sich besonders gut, wenn <i>Ausrei&szlig;er</i> das <i>arithmetische Mittel</i> verzerren.</p>
 
<h3><b>Merkmal</b> (auch Variable)</h3>
 
<p>Unter einem M. versteht man Eigenheiten des Untersuchungsobjekts, deren Auspr&auml;gungen variieren k&ouml;nnen (im Gegensatz zu <i>Konstanten</i>).</p>
 
<h3><b>Messniveau</b> (auch <i>Skalenniveau</i>)</h3>
 
<p>Unter <i>Messen</i> versteht man im weitesten Sinne die Zuordnung von Zahlen zu Beobachtung. Anhand des Messniveaus legt man fest, welche Interpretationen unterschiedlicher Auspr&auml;gungen sinnvoll sind, welche Verfahren angewendet werden d&uuml;rfen. Es gibt vier Messniveaus: Nominal-, Ordinal-, Intervall- und Ratioskala. Die beiden ersten beziehen sich auf <i>nicht metrische Variablen</i>, die beiden letzten auf <i>metrische Variablen.</i></p>
 
<h3><b>Metrik</b></h3>
 
<p>Unter M. versteht man ein definiertes System von Kennzahlen/Ma&szlig;einheiten (z.B. Liter, Kilometer, Minuten).</p>
 
<h3><b>metrisch</b></h3>
 
<p>Als <i>metrisch</i> werden Variable bezeichnet, wenn der Abstand zwischen zwei Auspr&auml;gungen der Variablen interpretiert werden kann, wenn also der Abstand zwischen 12 und 15 genauso gro&szlig;ist wie der Abstand zwischen 23 und 26. Metrische Variable sind daher entweder <i>intervall</i>- oder <i>proportionalskaliert</i>. <i>Nichtmetrische Variablen</i> sind <i>nominal-</i> oder <i>ordinalskaliert.</i></p>
 
<h3><b>Mittel</b></h3>
 
<p>Sammelbegriff f&uuml;r verschiedene Lagema&szlig;e, wie z.B. das <i>arithmetische Mittel</i>, das <b><i>harmonische Mittel</i>[9]</b>, das <b><i>geometrische Mittel</i>[10]</b>.</p>
 
<h3><b>Mittelwert</b> (auch <i>Arithmetisches Mittel</i>)</h3>
 
<p>Der M. eines metrischen Merkmals ist ein <i>Lagema&szlig;</i> und entspricht der Summe aller Werte geteilt durch deren Anzahl.</p>
 
<h3><b>Modalwert</b> (auch Modus)</h3>
 
<p>Der M. ist ein <i>Lagema&szlig;</i>. Er bezeichnet den am h&auml;ufigsten vorkommenden Wert.</p>
 
<h3><b>Modus</b> (siehe <i>Modalwert</i>)</h3>
 
<h3><b>Multivariate Verfahren</b> (oder <i>m. Analyse</i>)</h3>
 
<p>Unter M. V. versteht man Verfahren, bei welchen mindestens drei Variablen und deren Wechselbeziehungen analysiert werden. Siehe auch: <b>Multivariate Analyse (Wikipedia)[11]</b>.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2.3<br />
 
[2] http://de.wikipedia.org/wiki/Konfidenzintervall<br />
 
[3] http://de.wikipedia.org/wiki/Kontingenzkoeffizient<br />
 
[4] Siehe Kapitel 3.5.3<br />
 
[5] http://de.wikipedia.org/wiki/Kovarianz_%28Stochastik%29<br />
 
[6] Siehe Kapitel 3.5.2<br />
 
[7] Siehe Kapitel 3.3<br />
 
[8] Siehe Kapitel 3.6.1.2<br />
 
[9] Siehe Kapitel 3.3.5<br />
 
[10] Siehe Kapitel 3.3.4<br />
 
[11] http://de.wikipedia.org/wiki/Multivariate_Analyse<br />
 
  
<hr />
 
<h2>5.5&nbsp;N-P</h2>
 
  
<h3><b>Nichtparametrische Verfahren</b> (auch <i>parameterfreie Verfahren</i>)</h3>
+
= 6.6 Terminologie =
<p>Als N.T. werden alle statistischen Verfahren bezeichnet, welche nicht an bestimmte Verteilungsformen (wie der Normalverteilung) gebunden sind. Solche Tests sind z.B. der <i>Chi-Quadrat-Test,</i> der <b>Wilcoxon-Test (Wikipedia)[1]</b>  und der <b>Mann-Whitney (Wikipedia)[2]</b>-Test.</p>
 
<h3><b>nominal</b></h3>
 
<p>Merkmale werden als <i>nominal</i> bezeichnet, wenn ihre Auspr&auml;gungen nicht sinnvoll oder &rsquo;nat&uuml;rlich&rsquo; gereiht werden k&ouml;nnen (wie z.B. Farben, Hobbies, Namen). Sie sind <b><i>nominalskaliert</i>[3]</b>. Siehe <i>Messniveau.</i></p>
 
<h3><b>Normalverteilung</b> (auch Gau&szlig;verteilung)</h3>
 
<p>Die N. in Form der <i>Gau&szlig;schen Glockenkurve</i> ist eine Verteilungsform mit folgenden Merkmalen: sie ist unimodal (hat nur einen Gipfel); der Gipfel befindet sich in der Mitte (d.h. die in der Mitte des Messspektrums auftretenden Auspr&auml;gungen kommen auch am h&auml;ufigsten vor); sie sind symmetrisch (links wie rechts vom Mittelwert fallen die H&auml;ufigkeiten gleichm&auml;&szlig;ig ab); die Lagema&szlig;e wie <i>Modalwert, Mittelwert</i> und <i>Median</i> stimmen (fast) ann&auml;hernd &uuml;berein. Innerhalb des Bereichs Mittelwert &plusmn; der <i>Standardabweichung s</i> liegen ca. 68 % aller Messwerte. Siehe auch: <b>Normalverteilung (Wikipedia)[4]</b>.</p>
 
<h3><b>Nullhypothese</b></h3>
 
<p>Unter einer N. versteht man die Annahme bei statistischen Tests, dass ein postulierter Zusammenhang oder Unterschied nicht besteht. Mit geeigneten Verfahren wird untersucht, ob die Unterschiede oder Zusammenh&auml;nge bei einem gew&auml;hlten Signifikanzniveau noch als zuf&auml;llig erkl&auml;rt werden k&ouml;nnen. Wird das Signifikanzniveau erreicht, wird die Nullhypothese verworfen und die <i>Alternativhypothese</i> angenommen.</p>
 
<h3><b>Offene Frage</b></h3>
 
<p>Bei o. Fr. werden im Gegensatz zu geschlossenen Frage keine Antwortkategorien vorgegeben. Daher ist die Auswertung o. Fr. deutlich aufwendiger, weil sie erst interpretiert und eingeordnet werden m&uuml;ssen.</p>
 
<h3><b>Objektivit&auml;t</b></h3>
 
<p>Unter O. versteht man eine Grundanforderung an Methoden der Datenerhebung. Die Untersuchenden m&uuml;ssen versuchen sicherzustellen, dass andere ForscherInnen bei gleichen Erhebungsmethoden zum gleichen Ergebnis kommen. Dadurch soll eine Unabh&auml;ngigkeit der Ergebnisse von den Erhebenden angestrebt werden. Im weiteren Sinne bezieht sich O. auch auf die Auswertung der Daten und deren Interpretation. Siehe auch andere <i>G&uuml;tekriterien</i> von Datenerhebungen, wie die <i>Variablit&auml;t</i> und <i>Validit&auml;t</i>.</p>
 
<h3><b>Operationalisierung</b></h3>
 
<p>Unter O. versteht man eine m&ouml;glichst exakte Festlegung der Vorgangsweise bei der Datenerhebung, wie z.B. Frageformulierungen, Anwortvorgaben, Anweisungen an InterviewerInnen usw. Die O. gibt genau an, wie ein bestimmtes Ph&auml;nomen gemessen werden soll (wie z.B. die angenommene Ablehnung bestimmter Zuwanderergruppen). Die O. inkludiert alle Vorg&auml;nge von der Formulierung einer Hypothese, ihrer Umsetzung in konkrete Fragen und die Aufnahme der Daten.</p>
 
<h3><b>ordinal</b></h3>
 
<p>Eine Variable gilt als <i>ordinal</i>, wenn ihre Auspr&auml;gungen nat&uuml;rlich geordnet werden k&ouml;nnen, nicht aber die Unterschiede zwischen den Auspr&auml;gungen. So wei&szlig; man, dass eine Schulnote 1 besser als die Schulnote 2 ist, aber es ist nicht gesichert, dass der Sch&uuml;ler mit der Note 1  den Sch&uuml;ler mit der Note 2 im gleichen Ma&szlig;e &uuml;bertrifft wie ein Sch&uuml;ler mit der Note 4 einen Sch&uuml;ler mit der Note 5.</p>
 
<h3><b>Ordinalskalierung</b></h3>
 
<p>Messniveau ordinaler Daten (siehe <i>ordinal</i>).</p>
 
<h3><b>Population</b></h3>
 
<p>Gesamtmenge aller Beobachtungseinheiten</p>
 
<h3><b>p-Wert</b> (auch &Uuml;berschreitungswahrscheinlichkeit)</h3>
 
<p>Der p. Wert (Kurzform von <i>probability</i>) gibt bei statistischen Tests die Wahrscheinlichkeit an, mit welcher eine gefundene Kennzahl rein zuf&auml;llig auftreten k&ouml;nnte. Man legt vor der Durchf&uuml;hrung eines Tests ein Signifikanzniveau fest, z.B. p= 0,05. Ergibt sich ein p-Wert von kleiner als 0,05, dann ist die Nullhypothese mit einer <i>Irrtumswahrscheinlichkeit</i> von kleiner als 5 % zu verwerfen.</p>
 
<h3><b>Parameter</b></h3>
 
<p>P. sind Kennzahlenn, welche eine Grundpopulation charakterisieren. Dazu z&auml;hlen insbesonders die <i>Lagema&szlig;e</i> und die <i>Streuungsma&szlig;e</i>. Da sie in der Regel f&uuml;r die Grundpopulation nicht bekannt sind, m&uuml;ssen sie auf der Basis von Stichproben hochgerechnet werden.</p>
 
<h3><b>Parametrische Verfahren</b></h3>
 
<p>Unter p. V. versteht man statistische Tests, welche das Vorliegen einer bestimmten Verteilungsform mit den daf&uuml;r typischen Parametern erfordern. Besonders h&auml;ufig wird die Normalverteilung als Grundbedingung gesehen.</p>
 
<h3><b>Partielle Korrelation</b> (auch Partialkorrelation)</h3>
 
<p>Eine P.K. ist das Ausma&szlig; des Zusammenhangs (<i>Korrelation</i>) zwischen zwei Variablen, wobei gleichzeitig versucht wird, den Einfluss einer dritten Variablen auf diesen Zusammenhang herauszurechnen. Siehe auch: <b>Scheinkorrelation und St&ouml;rvariable[5]</b>.</p>
 
<h3><b>Pearson&rsquo;scher Korrelationskoeffizient</b></h3>
 
<p>Siehe <i>Produkt-Moment-Korrelation</i></p>
 
<h3><b>Perzentil</b></h3>
 
<p>Siehe <i>Quantil</i></p>
 
<h3><b>Proportionalskala</b> (auch Verh&auml;ltnisskala)</h3>
 
<p>Eine P. geh&ouml;rt zu den vier wesentlichen <i>Messniveaus</i> (<i>Messskalen</i>) und liegt dann vor, wenn bei numerischen Daten ein absoluter Nullpunkt vorliegt. Bei einer P. k&ouml;nnen nicht nur die Abst&auml;nde zwischen Auspr&auml;gungen interpretiert werden, sondern auch ihr Verh&auml;ltnis. So ist z.B. ein Baum von 3 Metern H&ouml;he doppelt so hoch wie ein Baum von 1,5 Meter H&ouml;he.</p>
 
<h3><b>Population</b></h3>
 
<p>Siehe <i>Grundpopulation</i></p>
 
<h3><b>Pretest</b></h3>
 
<p>Unter einem P. versteht man eine der Befragung der Stichprobe per Fragebogen vorausgehende Abtestung desselben durch Probeinterviews, um Schw&auml;chen im Vorfeld zu eliminieren. Man untersucht dabei z.B., ob die Fragen verst&auml;ndlich sind, wie sie interpretiert werden, ob alle Fragen zufriedenstellende Antworten bringen, ob die Befragten bereit sind, alle Fragen zu beantworten, ob die Befragten den Zeitaufwand f&uuml;r die Ausf&uuml;llung des Fragebogens akzeptieren etc.</p>
 
<h3><b>Produkt-Moment-Korrelation</b> (auch <i>Pearson&rsquo;scher Korrelationskoeffizient</i>)</h3>
 
<p>Die <em>P.M.</em>-<i>Korrelation</i> ist eine Form der <i>Korrelation</i> und zeigt den Zusammenhang zwischen zwei standardisierten Variablen, die beide metrisch und normalverteilt sein m&uuml;ssen. Siehe auch: <b>Ma&szlig;korrelation[6]</b>.</p>
 
<h3><b>Punktwolke</b></h3>
 
<p>siehe <i>Streudiagramm</i></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://de.wikipedia.org/wiki/Wilcoxon-Rangsummentest<br />
 
[2] http://de.wikipedia.org/wiki/Mann-Whitney-Test<br />
 
[3] Siehe Kapitel 3.1.2.2<br />
 
[4] http://de.wikipedia.org/wiki/Normalverteilung<br />
 
[5] Siehe Kapitel 3.5.3.4.3<br />
 
[6] Siehe Kapitel 3.5.3.1<br />
 
  
<hr />
+
==== '''Links zur Terminologie quantitativer Forschungsmethoden''' ====
<h2>5.6&nbsp;Q-R</h2>
 
  
<h3><b>Quantitativ</b></h3>
+
FAES.DE. '''Basislexikon[http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html &#91;1&#93;]''', 05.02.2007.
<p>Eigenschaft, dass die Auspr&auml;gung von Elementen in Zahlen wiedergegeben werden kann, wobei eine gr&ouml;&szlig;ere Zahl auch eine gr&ouml;&szlig;ere Auspr&auml;gung impliziert.</p>
 
<h3><b>Quantil</b></h3>
 
<p>Unter Q. versteht man Orientierungspunkte einer statistischen Verteilung; sie dienen als <i>Streuungsma&szlig;e</i> zur Beschreibung der Verteilung. Dabei wird die Verteilung stets in gleich gro&szlig;e Teile aufgeteilt. Bei vier gleichen Teilen spricht man von <i>Quartilen</i>, bei f&uuml;nf von <i>Quintilen</i>, bei zehn von <i>Dezilen</i> und bei 100 von <i>Perzentilen.</i> Besonders gerne verwendet werden die <i>Quartile</i>. Das erste Quartil gibt den Wert an, unterhalb desselben sich 25 % der Eintr&auml;ge befinden. Das zweite Quartil oder <i>Median</i> gibt den Wert an, unterhalb desselben sich 50 % der Eintr&auml;ge befinden usw.</p>
 
<h3><b>Quantifizierung</b></h3>
 
<p>Unter Qu. versteht man die numerische Beschreibung von Merkmalsauspr&auml;gungen einer Variablen auf Basis von Messungen oder Z&auml;hlungen.</p>
 
<h3><b>quantitativ</b></h3>
 
<p>Ein Merkmal wird quantitativ genannt, wenn es sich (z.B. durch Messen), zahlenm&auml;&szlig;ig erfassen l&auml;sst.  Quantitative Merkmale werden in <i>diskrete</i> und <i>stetige</i> Merkmale unterteilt.</p>
 
<h3><b>Quartil</b></h3>
 
<p>Siehe <i>Quantil</i></p>
 
<h3><b>Quartilabstand</b></h3>
 
<p>Siehe <i>Interquartilabstand</i></p>
 
<h3><b>Range</b> (auch Variationsweite, Spannweite)</h3>
 
<p>Unter R. versteht man den Abstand zwischen dem kleinsten und dem gr&ouml;&szlig;ten aufgetretenen Wert bei mindestens ordinalskalierten Daten. Die Range bei gemessenen K&ouml;rpergr&ouml;&szlig;en w&auml;re demnach z.B. 2,18 m(gr&ouml;&szlig;ter Wert) - 1,54 m(kleinster Wert), also 64 cm.</p>
 
<h3><b>Rangkorrelation</b></h3>
 
<p>Form der Korrelation, bei welcher nicht die Merkmalsauspr&auml;gungen, sondern deren <i>Rangzahlen</i> verwendet werden. Dabei werden im wesentlichen zwei Verfahren verwendet, <i>Spearman&acute;s Rho</i> und <i>Kendall&rsquo;s Tau</i>. Siehe auch: <b>die Korrelation[1]</b>.</p>
 
<h3><b>Rangzahlen</b></h3>
 
<p>Man erh&auml;lt sie, wenn quantitative Daten gr&ouml;&szlig;enm&auml;&szlig;ig geordnet werden und die geordneten Werte, mit 1 beginnend, fortlaufend nummeriert. Im Falle gleicher Ursprungsgr&ouml;&szlig;e m&uuml;ssen die Rangpl&auml;tze gemittelt werden. Ein Beispiel: Die Punktezahl 12 tritt sowohl auf den Rangpl&auml;tzen 13 wie 14 auf. Beide Rangpl&auml;tze erhalten daher die gemittelte Rangzahl 13,5 (beide Zahlen addiert und durch die Anzahl der Werte, also 2, dividiert).</p>
 
<h3><b>Regression</b></h3>
 
<p>Unter R. versteht man Verfahren, welche es erlauben, Werte einer anderen Variablen vorherzusagen, wenn der Wert einer bestimmten Variablen bekannt ist. Siehe auch: die <b>Regression[2]</b>.</p>
 
<h3><b>Relative H&auml;ufigkeit</b></h3>
 
<p>W&auml;hrend die <i>absolute H&auml;ufigkeit</i> einer Auspr&auml;gung anzeigt, wie oft dieser Wert insgesamt im Datensatz erscheint, gibt die r. H. an, wie hoch sein Anteil verglichen mit der Gesamtzahl der g&uuml;ltigen Eintr&auml;ge ist. Siehe auch: <b>H&auml;ufigkeitstabelle[3]</b>.</p>
 
<h3><b>Reliabiltit&auml;t</b> (auch Zuverl&auml;ssigkeit)</h3>
 
<p>R. ist eines der drei <i>G&uuml;tekriterien</i> bei <i>Messungen.</i> Dieses fordert, dass die Messinstrumente bei einer Wiederholung der Messung bei gleichbleibenden Bedingungen das gleiche Ergebnis erbringen sollten.</p>
 
<p>Neben der Validit&auml;t (G&uuml;ltigkeit) das zweite zentrale Qualit&auml;tskriterium bei Messungen. Meint, dass Messinstrumente bei wiederholter Messung unter gleichen Bedingungen auch das gleiche Ergebnis produzieren m&uuml;ssen. Siehe auch: <b>Reliabilit&auml;t (Wikipedia)[4]</b>.</p>
 
<h3><b>Repr&auml;sentativit&auml;t</b></h3>
 
<p>Unter R. versteht man, dass bei der Auswahl der Elemente der Stichprobe die Zusammensetzung der Grundpopulation nachgebildet wird. Wenn z.B. 2/3 der Zuwanderer aus Afrika in &Ouml;sterreich m&auml;nnlich sind, sollten dementsprechend auch 2/3 der Befragten in der Stichprobe m&auml;nnlich sein, will man den Bedingungen der Repr&auml;sentativit&auml;t gen&uuml;gen.</p>
 
<h3><b>Robust</b></h3>
 
<p>Bezeichnung f&uuml;r Verfahren, welche bez&uuml;glich vorhandener Ausrei&szlig;er kaum empfindlich sind, wie z.B. der <i>Median.</i></p>
 
<h3><b>Rohdaten</b></h3>
 
<p>statistisch nicht ver&auml;nderte Untersuchungsergebnisse, welche die urspr&uuml;ngliche Merkmalsauspr&auml;gung anzeigen (z.B. die Zahl der Punkte bei einem Eignungstest statt deren Umsetzung in Noten).</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.5.3<br />
 
[2] Siehe Kapitel 3.5.4<br />
 
[3] Siehe Kapitel 3.2.2<br />
 
[4] http://de.wikipedia.org/wiki/Reliabilit%C3%A4t<br />
 
  
<hr />
+
Lernstats. '''Glossar[http://www.lernstats.de/php/glossar.php?lang=de& &#91;2&#93;]''', 05.02.2007.
<h2>5.7&nbsp;S-T</h2>
 
  
<h3><b>S&auml;ulendiagramm</b></h3>
+
Ludwig-Mayerhofer, Wolfgang. '''Internet Lexikon der Empirischen Sozialforschung[http://wlm.userweb.mwn.de/Ilmes/ &#91;3&#93;]''', 21.11.2019
<p>Siehe <i>Balkendiagramm</i>.</p>
 
<h3><b>Schichtung</b></h3>
 
<p>Unter Sch. versteht man eine Methode bei der Auswahl der Stichprobe. Die Grundpopulation wird in <b>Schichten (Wikipedia)[1]</b>  zerlegt (in dieser gibt es z.B. 40 % M&auml;nner und 60 % Frauen; in dieser gibt es 26 % unter 25, 38 % zwischen 26- 50 und 36 % dar&uuml;ber). In der Stichprobe versucht man das Verh&auml;ltnis dieser Schichten der Grundpopulation nachzubilden.</p>
 
<h3><b>Schlie&szlig;ende Statistik</b></h3>
 
<p>s. <i>Analytische Statistik</i></p>
 
<h3><b>Selektion</b></h3>
 
<p>Bei der Selektion schr&auml;nkt man die Grundgesamtheit, f&uuml;r die eine bestimmte Hypothese gepr&uuml;ft werden soll, auf eine Teilgesamtheit von Beobachtungseinheiten ein.</p>
 
<h3><b>Signifikanz</b></h3>
 
<p>Unter S. versteht man ein statistisch &uuml;berpr&uuml;ftes Urteil &uuml;ber die Haltbarkeit einer <i>Hypothese</i>. Da man nur selten eine <i>Vollerhebung</i> machen kann, ist ein Ergebnis einer Stichprobe stets vom Risiko begleitet, dass es vom Ergebnis der Grundpopulation abweichen k&ouml;nnte. Man &uuml;berpr&uuml;ft daher die Wahrscheinlichkeit, dass ein gefundenes Ergebnis rein zuf&auml;llig entstanden sein k&ouml;nnte. Als Ma&szlig;st&auml;be nimmt man sogenannte <i>Signifikanzniveaus,</i> meist von 5 % oder p=0,05 oder 1 % oder p=0,01. Unterschreitet die erhaltene Wahrscheinlichkeit den letzten Wert, so k&ouml;nnte eine statische Aussage lauten: &quot;Der Zusammenhang zwischen den Variablen A und B ist statistisch signifkant auf dem 1%-Niveau.&quot; Ein wichtiger Test zur Absch&auml;tzung der Signifikanz der Zusammenh&auml;nge in Kreuztabellen ist z.B. der <i>Chi- Quadrat- Test.</i> Siehe auch: <b>Statistische Signifikanz (Wikipedia)[2]</b>.</p>
 
<h3><b>Signifianzniveau</b></h3>
 
<p>Das Signifikanzniveau ist synonym f&uuml;r die obere Grenze der Irrtumswahrscheinlichkeit eines statistischen Tests.</p>
 
<p>Siehe auch <i>Signifikanz</i></p>
 
<h3><b>Skala</b></h3>
 
<p>S. (ital. Treppe) bezeichnet eine Folge von Positionen, die unterschiedliche Auspr&auml;gungsgrade eines Merkmals anzeigen (z.B. die Temperatur eines K&ouml;rpers in Celsius, Lieblingszeitschriften durch die Angabe des jeweiligen Titels etc.). Siehe <i>Messniveau</i>.</p>
 
<h3><b>Skalenniveau</b></h3>
 
<p>siehe <i>Messniveau</i></p>
 
<h3><b>Spannweite</b></h3>
 
<p>Siehe <i>Range</i>.</p>
 
<h3><b>Spearman&rsquo;s Rho</b> (oder <i>Spearmans Korrelationskoeffizient</i>)</h3>
 
<p>Falls zwei Merkmale ordinal verteilt sind, kann man den Rangkorrelationskoeffizienten R (oder <i>Spearmans Rho)</i> mithilfe einer <i>Produkt- Moment-Korrelation</i> der Rangpl&auml;tze berechnen. Siehe auch: <b>Rangkorrelation[3]</b> .</p>
 
<h3><b>Stabdiagramm</b></h3>
 
<p>Siehe <i>Balkendiagramm.</i></p>
 
<h3><b>Standardabweichung</b></h3>
 
<p>Die St. <i>s</i> ist ein Kennwert, um die Variabilit&auml;t (Streuung) eines Merkmals zu kennzeichnen. Sie wird als Wurzel aus der <i>Varianz</i> erreichnet. In einer Normalverteilung liegen im Bereich des <i>Arithmetischen Mittels</i> &plusmn; <i>s</i> ungef&auml;hr 68 % aller Ergebnisse. Siehe auch: <b>Standardabweichung (Wikipedia)[4]</b>.</p>
 
<h3><b>Standardisiertes Interview</b></h3>
 
<p>Das st. I. ist eine Interviewform, bei welcher alle Details der Befragung (was soll man wie fragen, wie soll man reagieren, welche Zusatzinformationen darf man liefern etc.) genau festgelegt wurden, um den Einfluss der InterviewerInnen m&ouml;glichst gering zu halten.</p>
 
<h3><b>stetig</b></h3>
 
<p>Ein quantitatives Merkmal wird st. genannt, wenn es alle Werte innerhalb eines Intervalls annehmen kann. So kann z.B. eine K&ouml;rpergr&ouml;&szlig;e beliebig fein gemessen werden, in cm, in mm und bei Kleinstlebewesen sogar noch deutlich darunter. <i>Diskrete Variable</i> hingegen k&ouml;nnen nur bestimmte und abz&auml;hlbare Werte einnehmen (Beispiel W&uuml;rfel).</p>
 
<h3><b>Stichprobe</b></h3>
 
<p>Unter einer St. versteht man die Auswahl an Beobachtungseinheiten aus einer definierten (<i>Grund)Population</i>. Eine Stichprobe sollte diese Grundpopulation unverzerrt wiederspiegeln, z.B. durch das Modell der <i>Repr&auml;sentativit&auml;t</i>.</p>
 
<h3><b>St&ouml;rvariable</b> (oder <i>St&ouml;rgr&ouml;&szlig;en</i>)</h3>
 
<p>Unter <i>St&ouml;rvariablen</i> versteht man Variable, welche zus&auml;tzlich zu einer unabh&auml;ngigen Variablen einen nicht einkalkulierten Einfluss auf eine abh&auml;ngige Variable aus&uuml;ben. Untersucht man z.B. den Zusammenhang zwischen Glatzenbildung und Einkommen, so wird man h&auml;ufig auf eine h&ouml;here Korrelation kommen. Diese h&auml;ngt mit einer nicht untersuchten St&ouml;rvariable zusammen, n&auml;mlich dem Alter, mit dem sowohl Glatzenbildung wie auch Einkommen normalerweise hoch korrelieren.</p>
 
<p>Die Existenz von St&ouml;rvariablen ist besonders bei der Untersuchung von Korrelationen kritisch zu untersuchen.</p>
 
<h3><b>Streudiagramm</b> (auch <i>Scatterplot</i>)</h3>
 
<p>Ein St. zeigt graphisch den Zusammenhang zwischen zwei stetigen Merkmalen, wobei eine <i>Punktwolke</i> aus den Schnittpunkten der jeweiligen Auspr&auml;gungen der Variablen X und Y gebildet wird. <i>Streudiagramme</i> bieten eine gute Absch&auml;tzm&ouml;glichkeit f&uuml;r m&ouml;gliche <i>Korrelationen</i>.</p>
 
<h3><b>Streuungsma&szlig;e</b> (auch Dispersionsma&szlig;e)</h3>
 
<p>Streuungsma&szlig;e geben an, in welchen Bereichen die Daten liegen bzw. um die Lagema&szlig;e <i>streuen</i>. Sie sind Kennwerte zur Charakterisierung einer Verteilung. Sie sind Indikatioren f&uuml;r die Variabilit&auml;t von Merkmalen, wie z.B. von deren Abstand zum <i>Arithmetischen Mittel</i>. Wichtige Streuungsma&szlig;e sind die <i>Standardabweichung,</i> die <i>Varianz</i> oder der <i>Quartilabstand.</i></p>
 
<h3><b>Tau</b> (auch Kendall&rsquo;s Tau)</h3>
 
<p>Form der Korrelation. Ma&szlig; f&uuml;r den Zusammenhang zwischen ordinalskalierten Daten, besonders bei kleinen Zahlen. Siehe auch: <b>Rangkorrelation Tau[5]</b>.</p>
 
<h3><b>Tortendiagramm</b></h3>
 
<p>Siehe <i>Kreisdiagramm</i></p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://de.wikipedia.org/wiki/Soziale_Schichtung<br />
 
[2] http://de.wikipedia.org/wiki/Statistische_Signifikanz<br />
 
[3] Siehe Kapitel 3.5.3.2<br />
 
[4] http://de.wikipedia.org/wiki/Standardabweichung<br />
 
[5] Siehe Kapitel 3.5.3.3<br />
 
  
<hr />
 
<h2>5.8&nbsp;U-Z</h2>
 
  
<h3><b>unabh&auml;ngig</b></h3>
 
<p>Eine Variable ist <i>unabh&auml;ngig</i>, wenn sie in einer Untersuchung variiert werden kann, um ihre Auswirkungen auf eine abh&auml;ngige Variable zu erfassen (z.B. Menge von D&uuml;ngemitteln: unabh&auml;ngige Variable, Ernte-Ergebnis: abh&auml;ngige Variable).</p>
 
<h3><b>univariat</b></h3>
 
<p>Als u. werden Methoden und Kennzahlen bezeichnet, die sich auf eine einzige Variable beziehen.</p>
 
<h3><b>Urliste</b></h3>
 
<p>Die U. ist die ungeordnete Zusammenstellung des Datenmaterials. Siehe auch: <b>Listen und Tafeln[1]</b>.</p>
 
<h3><b>Validit&auml;t</b> (auch G&uuml;ltigkeit)</h3>
 
<p>Die V. geh&ouml;rt zu den sogenannten <i>G&uuml;tekriterien</i> f&uuml;r die Qualit&auml;t einer Datenerhebung. Sie bezeichnet die Eigenschaft, wirklich das zu messen, was bei der Untersuchung gemessen werden soll. Wenn z.B. die Fragen eines Fragebogens nur ungen&uuml;gend geeignet sind, die Hypothesen zu &uuml;berpr&uuml;fen, dann ist die Validit&auml;t in Frage gestellt. Siehe auch: <b>Validit&auml;t (Wikipedia)[2]</b>.</p>
 
<h3><b>Variable</b></h3>
 
<p>Eine Variable ist ein in verschiedenen Auspr&auml;gungen vorhandenes Merkmal eines Untersuchungsgegenstandes: z.B. Geschlecht: m&auml;nnlich/weiblich; Gr&ouml;&szlig;e gemessen in cm.</p>
 
<h3><b>Variationsweite</b> (siehe Range).</h3>
 
<h3><b>Varianz</b></h3>
 
<p>Die V. ist ein Ma&szlig; f&uuml;r die Variabilit&auml;t bzw. die Streuung der Auspr&auml;gungen von Variablen und Ausgangswert f&uuml;r die <i>Standardabweichung</i>. Siehe auch: <b>Varianz (Wikipedia)[3]</b>.</p>
 
<h3><b>Verh&auml;ltnisskala</b></h3>
 
<p>Siehe <i>Proportionalskala</i></p>
 
<h3><b>Verteilung</b></h3>
 
<p>Siehe <i>H&auml;ufigkeitsverteilung</i></p>
 
<h3><b>Vertrauensintervall</b> (auch <i>Konfidenzintervall</i>)</h3>
 
<p>Siehe <i>Konfidenzintervall</i></p>
 
<h3><b>Vierfeldertafel</b> (Form der <i>Kreuztabelle</i>)</h3>
 
<p>Eine V. ist die Anordnung zweier dichotomer Variablen in einer Tabelle mit zwei Spalten und zwei Zeilen, sodass jede Auspr&auml;gung jeder Variablen mit jeder Auspr&auml;gung der anderen gekreuzt wird.</p>
 
<h3><b>Vollerhebung</b></h3>
 
<p>Eine V. liegt vor, wenn alle Elemente einer Grundpopulation befragt werden und nicht nur eine Auswahl (eine <i>Stichprobe</i>) derselben. Eine V. ist dementsprechend nur bei einer kleineren Grundpopulation m&ouml;glich.</p>
 
<h3><b>Wahrscheinlichkeit</b></h3>
 
<p>Unter W. versteht man die Einstufung von Ph&auml;nomenen nach dem Grade ihrer Gewissheit. Die W. <i>p</i> wird mit Werten zwischen <i>0</i> (Unm&ouml;glichkeit) und <i>1</i> (Sicherheit des Auftretens) wiedergegeben. Siehe auch: <b>Wahrscheinlichkeit (Wikipedia)[4]</b>.</p>
 
<h3><b>Zentralwert</b></h3>
 
<p>Siehe <i>Median</i></p>
 
<h3><b>Zusammenhang</b></h3>
 
<p>Mit einem Z. bezeichnet man, dass zwischen den Auspr&auml;gungen zweier Variablen eine systematische Entsprechung besteht. Siehe <i>Korrelation.</i></p>
 
<h3><b>Zweiseitige Hypothese</b></h3>
 
<p>Bei einer z. H. nimmt man an, dass zwischen zwei Variablen oder zwischen zwei Teilgruppen ein Zusammenhang besteht. Man nimmt jedoch nicht von vornherein an, dass dieser Zusammenhang nur in einer bestimmten Richtung besteht. Beispiel: Die Annahme ist, dass sich das Wetter auf die Arbeitslust auswirkt, wobei man nicht von vornherein einschr&auml;nkt, ob ein sch&ouml;neres Wetter zu einer gr&ouml;&szlig;eren Arbeitslust oder zu einer geringeren f&uuml;hren wird. Bei der <i>einseitigen H.</i> w&uuml;rde nur eine Richtung untersucht werden: Sorgt sch&ouml;neres Wetter f&uuml;r eine gr&ouml;&szlig;ere Arbeitslust?</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] Siehe Kapitel 3.2.1<br />
 
[2] http://de.wikipedia.org/wiki/Validit%C3%A4t<br />
 
[3] http://de.wikipedia.org/wiki/Varianz<br />
 
[4] http://de.wikipedia.org/wiki/Wahrscheinlichkeit<br />
 
  
<hr />
+
'''Verweise:'''<br />
<h2>6&nbsp;Literatur, Ressourcen und Links</h2>
+
[http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html &#91;1&#93; http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html]<br />
 +
[http://www.lernstats.de/php/glossar.php?lang=de& &#91;2&#93; http://www.lernstats.de/php/glossar.php?lang=de&]<br />
 +
[http://wlm.userweb.mwn.de/Ilmes/ &#91;3&#93; http://wlm.userweb.mwn.de/Ilmes/]<br />
  
<p>In diesem Bereich finden Sie Hinweise auf hochwertige Nachschlagswerke zu den angeschnittenen Bereichen sowie eine Selektion von Weblinks.</p>
 
<hr />
 
<h2>6.1&nbsp;Quantitative Forschungsmethoden</h2>
 
  
<p>Atteslander P. 2000. Methoden der empirischen Sozialforschung, 9. edn. deGruyter.</p>
 
<p>Diekmann A. 2001. Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen, 7 edn. Rowohlt, Reinbeck bei Hamburg.</p>
 
<p>Fahrmeir, Ludwig &amp; K&uuml;nstler, Rita &amp; Pigeo, Iris &amp; Tutz, Gerhard. 2004. Statistik. Springer, Berlin - Heidelberg.</p>
 
<p>Friedrichs J. 1990. Methoden empirischer Sozialforschung, 14. edn. Westdeutscher Verlag, Opladen.</p>
 
<p>G&ouml;tz R. &amp; P&ouml;tter U. 2001. Grundz&uuml;ge der sozialwissenschaftlichen Statistik. Juventa, Weinheim und M&uuml;nchen.</p>
 
<p>Kr&auml;mer, Walter. 2000. So l&uuml;gt man mit Statistik. Piper- Verlag.</p>
 
<p>Kromrey, H. 2000. Empirische Sozialforschung<i>.</i> Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung. Leske und Budrich, Opladen.</p>
 
<p>M&uuml;ller-Bendedict V. 2001. Grundkurs Statistik in den Sozialwissenschaften. Westdeutscher Verlag, Opladen.</p>
 
<p>Schnell, Rainer &amp; Hill, Paul B. &amp; Esser, Elke. 1999. Methoden der empirischen Sozialforschung. Oldenbourg, M&uuml;nchen, Wien.</p>
 
<p>Z&ouml;fel, Peter. 2003. Statistik f&uuml;r Wirtschaftswissenschaftler. Pearson Studium, M&uuml;nchen.</p>
 
<h3><b>Weblinks:</b></h3>
 
<p><b> Basis-Statistik (FAES)[1]</b>, 05.02.2007.</p>
 
<p>Bredner, Barbara. <b>Statistik-Tutorial[2]</b>, 12.11.2009.</p>
 
<p><b>HyperStat Online[3]</b>, 05.02.2007.</p>
 
<p><b>Introduction to Statistics (University of Leicester)[4]</b>, 12.11.2009.</p>
 
<p>Kromrey, Helmut. 1994. <b>Empirische Sozialforschung[5]</b>, 05.02.2007.</p>
 
<p>Lohninger, H. <b>Grundlagen der Statistik[6]</b>, 05.02.2007.</p>
 
<p>Neuwirth, Erich. 1997. <b>Statistik f&uuml;r StatistikerInnen,[7]</b> 05.02.2007.</p>
 
<p>Rost, J&uuml;rgen. 2003. <b> Zeitgeist und Moden empirischer Sozialforschung[8]</b>. In Forum Qualitative Sozialforschung 4/2, 05.02.2007.</p>
 
<p><b> Statistik TU-Wien[9]</b>, 05.02.2007.</p>
 
<p><b> Statistik I (Uni Osnabr&uuml;ck)[10]</b>, 05.02.2007.</p>
 
<p><b> TU-Graz Statistik-Grundkurs[11]</b>, 05.02.2007.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.faes.de/Basis/Basis-Statistik/basis-statistik.html<br />
 
[2] http://www.bb-sbl.de/tutorial.html<br />
 
[3] http://davidmlane.com/hyperstat/<br />
 
[4] http://www.le.ac.uk/bl/gat/virtualfc/Stats/start.html<br />
 
[5] http://www.luebbert.net/uni/methoden/kromrey/index.php<br />
 
[6] http://www.statistics4u.info/fundstat_germ/index_a.html<br />
 
[7] http://tud.at/uni/stat1.htm<br />
 
[8] http://www.qualitative-research.net/index.php/fqs/article/view/723<br />
 
[9] http://www.statistik.tuwien.ac.at/public/dutt/vorles/inf_bak/node1.html<br />
 
[10] http://www.psycho.uni-osnabrueck.de/fach/methoden/subpages/sec_level/downl_lehre.php#anchor2<br />
 
[11] http://hfi.uni-graz.at/hfi/lehre/archiv/gruku_2001_2002/ab09/frame09.htm<br />
 
  
<hr />
+
= 6.7 Statistik-Quellen =
<h2>6.2&nbsp;Fragebogen-Abfrage</h2>
 
  
<h3><b>B&uuml;cher:</b></h3>
+
Hier finden Sie die Webseiten verschiedener Institutionen, die laufend Statistiken erstellen:
<p>Allerbeck, K. &amp; W. Hoag. 1985. Zur Methodik der Umfragen. Frankfurt am Main, Johann Wolfgang von Goethe- Universit&auml;t.</p>
 
<p>Converse, J.M. &amp; S. Presser. 1986. Survey Questions. Handcrafting the Standardized Questionnaire. Beverly Hills, Sage.</p>
 
<p>Porst, Rolf. 1998. Im Vorfeld der Befragung: Planung, Fragebogenentwicklung, Pretesting. ZUMA- Arbeitsbericht 98/02, Mannheim.</p>
 
<p>Sudman, S. &amp; N.M. Bradburn 1983. Asking Questions. San Francisco, Jossey-Bass.</p>
 
<h3><b>Weblinks:</b></h3>
 
<p>Michael Vonr&uuml;den. 2002. <b> Internetbasierte Umfragen[1]</b>. (PDF-Dokument), 05.02.2007.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.michael-vonrueden.de/res/Internet-basierte-Umfrageformen.pdf<br />
 
  
<hr />
+
'''Statistik-Austria[http://www.statistik.at/ &#91;1&#93;]''', 05.02.2007.
<h2>6.3&nbsp;Diagramme und Grafiken</h2>
 
  
<p>Carter, Jackie. <b> Supporting visualization of cencus data[1]</b>. In Habitat. (PDF-Dokument), 05.02.2007.</p>
+
'''Eurostat - Statistikamt der Europäischen Union[https://ec.europa.eu/eurostat &#91;2&#93;]''', 16.11.2009.
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.cebe.heacademy.ac.uk/learning/habitat/HABITAT7/census.pdf<br />
 
  
<hr />
+
'''Statistiken der Stadt Wien[http://www.wien.gv.at/statistik/ &#91;3&#93;]''', 05.02.2007.
<h2>6.4&nbsp;Methoden</h2>
 
  
<h3><b>Korrelation und Regression</b></h3>
+
'''United Nations Statistics Division[https://unstats.un.org/home/ &#91;4&#93;]''', 05.02.2007.
<p>Die <b> Korrelation[1]</b>  von Merkmalen. (PDF-Dokument), 05.02.2007.</p>
 
<p>Bortz, S. <b> Kovarianz und Korrelation[2]</b>. In Psychologie-Seiten.de, 05.02.2007.</p>
 
<h3><b>Verschiedene Methoden</b></h3>
 
<p>Berger, Klaus. Materialen f&uuml;r <b>Mathe-Online[3]</b>, 05.02.2007.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf<br />
 
[2] http://www.psychologie-seiten.de/?Statistik_und_Methodik:Zusammenhangshypothesen<br />
 
[3] http://www.mathe-online.at/materialien/klaus.berger/<br />
 
  
<hr />
+
'''World Bank Data[https://data.worldbank.org/ &#91;5&#93;]''', 05.02.2007.
<h2>6.5&nbsp;Repräsentativität</h2>
 
  
<p>H&ouml;pflinger, Fran&ccedil;ois. 2005. <b>Stichprobenauswahl und Sampling-Verfahren[1]</b>, 19.01.2010.</p>
+
'''FAO Statistics[http://www.fao.org/faostat/en/ &#91;6&#93;]''', 19.01.2010.
<p><b> Repr&auml;sentativit&auml;t (Uni-Bielefeld)[2]</b>, 05.02.2007.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.hoepflinger.com/fhtop/fhmethod1F.html<br />
 
[2] http://wwwhomes.uni-bielefeld.de/wdrexler/htmldata/statistik/Lektionen/T07/Text07.htm<br />
 
  
<hr />
+
'''UNDP - Human Development Report[http://hdr.undp.org/en/data &#91;7&#93;]''', 16.11.2009.
<h2>6.6&nbsp;Statistik-Software</h2>
 
  
<h3><b>B&uuml;cher:</b></h3>
 
<p>B&uuml;hl, Achim. 2006. SPSS 14. Einf&uuml;hrung in die moderne Datenanalyse. Pearson Studium, M&uuml;nchen.</p>
 
<p>Wittenberg R. &amp; Cramer Hans. 2003. Datenanalyse mit SPSS f&uuml;r Windows. UTB, Stuttgart.</p>
 
<h3><b>Links:</b></h3>
 
<p>Ludwig-Mayerhofer, Wolfgang. <b>Internet Guide to SPSS for Windows[1]</b>, 05.02.2007.</p>
 
<p>Melicharek, Peter. 2003. <b>Methoden, die in SPSS zur Verf&uuml;gung stehen[2]</b>, 05.02.2007.</p>
 
<p>Universit&auml;t zu K&ouml;ln. <b>SPSS-Kurs[3]</b>, 05.02.2007.</p>
 
<p>Universit&auml;t Hamburg. <b> Deutsche Handb&uuml;cher des Herstellers zu SPSS Release 13[4]</b>, 19.01.2010.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.lrz-muenchen.de/%7Ewlm/wlmspss.htm<br />
 
[2] http://www.wu-wien.ac.at/usr/stat2/melichar/spsstext.htm<br />
 
[3] http://www.uni-koeln.de/rrzk/kurse/unterlagen/#stat<br />
 
[4] http://www1.uni-hamburg.de/RRZ/Software/SPSS/ManualsGer.130/<br />
 
  
<hr />
 
<h2>6.7&nbsp;Terminologie</h2>
 
  
<h3><b>Links zur Terminologie quantitativer Forschungsmethoden</b></h3>
+
'''Verweise:'''<br />
<p>FAES.DE. <b>Basislexikon[1]</b>, 05.02.2007.</p>
+
[http://www.statistik.at/ &#91;1&#93; http://www.statistik.at/]<br />
<p>Lernstats. <b> Glossar[2]</b>, 05.02.2007.</p>
+
[https://ec.europa.eu/eurostat &#91;2&#93; https://ec.europa.eu/eurostat]<br />
<p>Ludwig-Mayerhofer, Wolfgang. <b>Glossar[3]</b>, 05.02.2007.</p>
+
[http://www.wien.gv.at/statistik/ &#91;3&#93; http://www.wien.gv.at/statistik/]<br />
<p>Universit&auml;t Hannover. <b>Glossar[4]</b>, 05.02.2007.</p>
+
[https://unstats.un.org/home/ &#91;4&#93; https://unstats.un.org/home/]<br />
<p />
+
[https://data.worldbank.org/ &#91;5&#93; https://data.worldbank.org/]<br />
<b>Verweise in diesem Kapitel:</b><br />
+
[http://www.fao.org/faostat/en/ &#91;6&#93; http://www.fao.org/faostat/en/]<br />
[1] http://www.faes.de/Basis/Basis-Lexikon/basis-lexikon.html<br />
+
[http://hdr.undp.org/en/data &#91;7&#93; http://hdr.undp.org/en/data]<br />
[2] http://www.lernstats.de/web/php/glossar.php?sub=&amp;glossar=bivariate_verfahren<br />
 
[3] http://www.lrz-muenchen.de/%7Ewlm/ein_voll.htm<br />
 
[4] http://www.sozpsy.uni-hannover.de/marienthal/glossar/html/<br />
 
  
<hr />
+
=== Weitere Kapitel dieser Lernunterlage ===
<h2>6.8&nbsp;Statistik-Quellen</h2>
+
[[Funktion_und_Sinn_von_Statistik#1. Funktion und Sinn von Statistik|1. Funktion und Sinn von Statistik]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
 +
[[Ausgewählte_statistische_Grundlagen_und_Analysemethoden#3. Ausgewählte statistische Grundlagen und Analysemethoden|3. Ausgewählte statistische Grundlagen und Analysemethoden]]<br />
 +
[[Software_für_quantitative_Forschungsprojekte#4. Software für quantitative Forschungsprojekte|4. Software für quantitative Forschungsprojekte]]<br />
 +
[[Lexikon_statistischer_Grundbegriffe#5. Lexikon statistischer Grundbegriffe|5. Lexikon statistischer Grundbegriffe]]<br />
  
<p>Hier finden Sie die Webseiten verschiedener Institutionen, die laufend Statistiken erstellen:</p>
 
<p><b>Statistik-Austria[1]</b>, 05.02.2007.</p>
 
<p><b> Eurostat - Statistikamt der Europ&auml;ischen Union[2]</b>, 16.11.2009.</p>
 
<p><b>Statistiken der Stadt Wien[3]</b>, 05.02.2007.</p>
 
<p><b>United Nations Statistics Division[4]</b>, 05.02.2007.</p>
 
<p><b> World Bank Data[5]</b>, 05.02.2007.</p>
 
<p><b>FAO Statistics[6]</b>, 19.01.2010.</p>
 
<p><b>UNDP - Human Development Report[7]</b>, 16.11.2009.</p>
 
<p />
 
<b>Verweise in diesem Kapitel:</b><br />
 
[1] http://www.statistik.at/<br />
 
[2] http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/<br />
 
[3] http://www.wien.gv.at/statistik/<br />
 
[4] http://unstats.un.org/unsd/databases.htm<br />
 
[5] http://web.worldbank.org/WBSITE/EXTERNAL/DATASTATISTICS/0,,menuPK:232599~pagePK:64133170~piPK:64133498~theSitePK:239419,00.html<br />
 
[6] http://www.fao.org/corp/statistics/en/<br />
 
[7] http://hdr.undp.org/en/statistics/<br />
 
  
</div><!-- content -->
+
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
<div id="footer">
+
----
<p />
+
[[Literatur_Ressourcen_und_Links#6. Literatur, Ressourcen und Links|&uarr; Nach oben]]
<a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/at/"><img src="style/somerights20.png" width="88" height="31" alt="Creative Commons License" border="0" /></a><br />
+
-->
Wenn nicht anders angegeben, steht dieses Dokument<br />
 
unter einer <a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/at/">Creative Commons 2.0 Lizenz</a>
 
<br /><a href="http://www.univie.ac.at/ksa/elearning">http://www.univie.ac.at/ksa/elearning</a>
 
</div><!-- footer -->
 
</div><!-- wrapper -->
 
</center>
 
</body>
 
</html>
 

Latest revision as of 14:30, 24 September 2020

↵ Zurück zur Hauptseite

Grundlagen statistischer Auswertungsverfahren

verfasst von Erwin Ebermann
Quanti Logo.gif

Kapitel dieser Lernunterlage

1. Funktion und Sinn von Statistik
2. Von der Fragestellung zur statistischen Analyse
3. Ausgewählte statistische Grundlagen und Analysemethoden
4. Software für quantitative Forschungsprojekte
5. Lexikon statistischer Grundbegriffe
6. Literatur, Ressourcen und Links

Kapitelübersicht

1. Funktion und Sinn von Statistik

1.1 Qualitative und Quantitative Forschungsmethoden - Gegensatz oder Ergänzung?
1.2 Formen der Statistik
1.2.1 Deskriptive Statistik
1.2.2 Analytische Statistik
1.3 Wahrscheinlichkeiten, nicht Gewissheit
1.3.1 Schwankungsbreiten und Konfidenzintervalle
1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau

2. Von der Fragestellung zur statistischen Analyse

2.1 Die Grundpopulation: worüber wir Aussagen machen
2.1.1 Die Stichprobe (Sample)
2.1.2 Teil- oder Vollerhebung?
2.1.3 Die Ziehung (Auswahl) der Stichprobe
2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)
2.1.3.1.1 Proportional geschichtete Stichproben
2.1.3.1.2 Disproportional geschichtete Stichproben
2.1.3.1.3 Laufende Kontrolle der Schichtung
2.1.3.2 Zufallsstichproben
2.1.3.2.1 Einfache Zufallsstichprobe
2.1.3.2.2 Systematische Zufallsstichprobe
2.1.3.2.3 Geschichtete Zufallsstichprobe
2.1.3.3 Willkürliches Auswahlverfahren
2.1.3.4 Klumpenstichproben
2.1.4 Repräsentativität
2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?
2.2 Die Operationalisierung
2.2.1 Die Suche nach Indikatoren
2.2.2 Das Messen
2.2.2.1 Messfehler
2.2.3 Vom Fragebogen zum Codeplan
2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix
2.2.3.2 Umcodierung mit SPSS
2.2.3.3 Automatische Rückcodierung mit SPSS
2.3 Gütekriterien quantitativer Untersuchungen
2.4 Fehlerquellen bei statistischer Arbeit
2.4.1 Fehler erster und zweiter Art
2.4.2 Fehlerhafte oder mangelnde Daten
2.4.2.1 Eingabefehler
2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS
2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel
2.4.2.2 Doppelte Datensätze
2.4.2.3 Fehlende Einträge
2.4.2.3.1 Behandlung fehlender Daten mit SPSS

3. Ausgewählte statistische Grundlagen und Analysemethoden

3.1 Notwendiges Wissen für die Wahl geeigneter statistischer Analysemethoden
3.1.1 Arten von Messwerten (Daten)
3.1.1.1 Metrische und nichtmetrische Variablen
3.1.1.2 Stetige und diskrete Variablen
3.1.2 Skalenniveaus
3.1.2.1 Skalierungsniveaus bildlich erklärt
3.1.2.2 Nominalskalierung
3.1.2.3 Ordinalskalierung
3.1.2.4 Intervallskalierung
3.1.2.5 Proportionalskalierung
3.1.2.6 Skalierungstypen, Aussagen und Methoden
3.1.3 Verteilungen
3.1.3.1 Normalverteilung
3.1.3.2 Andere Verteilungsformen
3.1.3.3 Test auf Normalverteilung
3.1.3.3.1 Optischer Nachweis einer Normalverteilung: das Histogramm
3.1.3.3.2 Nachweis der Normalverteilung: Kolmogorov-Smirnov-Test
3.1.3.3.2.1 Kolmogorov-Smirnov-Test mit SPSS
3.2 Die Ermittlung von Häufigkeiten
3.2.1 Liste und Tafeln
3.2.2 Häufigkeitstabelle
3.2.2.1 Häufigkeitsberechnung mit SPSS
3.2.2.2 Grafische Darstellung mit SPSS
3.2.3 Klassenbildung (Gruppierung) von Daten
3.2.3.1 Gruppierung mit SPSS
3.2.4 Häufigkeitsdarstellung bei Mehrfachantworten mit SPSS
3.3 "Mittelwerte": Lagemaße und Maßzahlen der zentralen Tendenz
3.3.1 Modalwert
3.3.2 Arithmetisches Mittel
3.3.3 Median
3.3.3.1 Median bei gruppierten Daten
3.3.4 Geometrisches Mittel
3.3.5 Harmonisches Mittel
3.3.5.1 Harmonisches Mittel mit SPSS
3.3.6 Wann welche Lagemaße?
3.3.7 Berechnung von Lagemaßen mit SPSS
3.4 Streuungsmaße oder ’Wie allgemeingültig ist der Mittelwert’
3.4.1 Varianz
3.4.2 Standardabweichung
3.4.3 Perzentile
3.4.3.1 Quartile
3.4.3.1.1 Die Ermittlung von Quartilen
3.4.4 Berechnung von Streuungsmaßen mit SPSS
3.4.5 Vergleichende grafische Darstellung von Streuung und Lage mit Box-Plots
3.4.5.1 Erstellung von Boxplots mit SPSS
3.5 Der Zusammenhang zwischen Variablen
3.5.1 Optische Erkennung von Zusammenhängen
3.5.2 Kreuztabellen-Analyse
3.5.2.1 Berechnung von Kreuztabellen-Analysen mit SPSS
3.5.2.1.1 Überprüfung von Zusammenhängen mit dem Chi-Quadrat-Test
3.5.2.2 Grafische Darstellung von Kreuztabellen mit SPSS
3.5.3 Die Korrelation
3.5.3.1 Maßkorrelation
3.5.3.1.1 Berechnung der Maßkorrelation mit SPSS
3.5.3.2 Rangkorrelation R (Krueger-Spearman)
3.5.3.2.1 Berechnung der Rangkorrelation mit SPSS
3.5.3.3 Rangkorrelation Tau (Kendall)
3.5.3.3.1 Berechnung von TAU mit SPSS
3.5.3.4 Aussagekraft einer Korrelation
3.5.3.4.1 Wann sind Korrelationen bemerkenswert?
3.5.3.4.2 Verdeckte Korrelation
3.5.3.4.3 Scheinkorrelationen und Störvariable
3.5.3.4.3.1 Partielle Korrelation mit SPSS
3.5.3.4.4 Signifikanz der Korrelation
3.5.3.4.4.1 Signifikanz mit SPSS
3.5.3.5 Kovarianz
3.5.4 Regression
3.5.4.1 Statistisch-mathematische Berechnung der linearen Regression
3.5.4.2 Grafische Darstellung der Regression
3.6 Die grafische Darstellung statistischer Ergebnisse
3.6.1 Arten von Diagrammen
3.6.1.1 Kreisdiagramme
3.6.1.2 Liniendiagramme
3.6.1.3 Balkendiagramme
3.6.1.3.1 Gruppierte Balkendiagramme mit SPSS
3.6.1.4 Kartogramme
3.6.1.5 Histogramme
3.6.1.6 Streudiagramme
3.6.2 Welches Diagramm für welche Daten?
3.6.3 Notwendige Begleitinformationen von Diagrammen

4. Software für quantitative Forschungsprojekte

4.1 Was kann Excel?
4.1.1 Statistische Analysen mit Excel
4.1.2 Grafische Aufbereitung von Daten mit Excel
4.2 Was kann MS Access?
4.3 Profi-Programme: SPSS und Statistica
4.4 Datentransfer zwischen Programmen: Von Excel und Access zu SPSS
4.5 Umcodierung

5. Lexikon statistischer Grundbegriffe

5.1 A-C
5.2 D-F
5.3 G-I
5.4 J-M
5.5 N-P
5.6 Q-R
5.7 S-T
5.8 U-Z

6. Literatur, Ressourcen und Links

6.1 Quantitative Forschungsmethoden
6.2 Fragebogen-Abfrage
6.3 Diagramme und Grafiken
6.3 Methoden
6.4 Repräsentativität
6.5 Statistik-Software
6.6 Terminologie
6.7 Statistik-Quellen