Difference between revisions of "Von der Fragestellung zur statistischen Analyse"

From Eksa
Jump to: navigation, search
(Created page with " '''Vorheriges Kapitel: 1.2 Formen der Statistik''' = 1.3 Wahrscheinlichkeiten, nicht Gewissheit = <sup>ver...")
 
m (Protected "Von der Fragestellung zur statistischen Analyse" ([Edit=Allow only administrators] (indefinite) [Move=Allow only administrators] (indefinite)) [cascading])
 
(3 intermediate revisions by the same user not shown)
Line 1: Line 1:
 +
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 +
= 2. Von der Fragestellung zur statistischen Analyse =
 +
<sup>verfasst von Erwin Ebermann</sup>
  
'''[[Funktion_und_Sinn_von_Statistik/Formen#1.2 Formen der Statistik|Vorheriges Kapitel: 1.2 Formen der Statistik]]'''
+
==== '''Wesentliche Elemente bei quantitativen Forschungsansätzen''' ====
= 1.3 Wahrscheinlichkeiten, nicht Gewissheit =
 
<sup>verfasst von Erwin Ebermann</sup>
 
  
==== '''(Analytische) Statistik nimmt Wahrscheinlichkeiten an, nicht Gewissheiten.''' ====
+
Bei quantitativen Forschungsansätzen sind die folgenden Teilbereiche von besonderer Bedeutung:
  
In der Statistik beschreiben und analysieren wir meist '''Stichproben[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1]]]''', also eine Auswahl einer Grundgesamtheit. Dabei ist immer damit zu rechnen, dass sich auch eine sorgfältig zusammengesetzte Stichprobe in wesentlichen Parametern von der '''Grundgesamtheit[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2]]]''' unterscheidet, sie also nicht wiederspiegelt.
+
* die '''Untersuchungsobjekte''', über welche wir eine Aussage machen möchten (z.B. LateinamerikanerInnen in Wien);
 +
* die '''Forschungsfrage''', die wir mit den Untersuchungsobjekten verbinden (z.B. ihre Erfahrungen in Wien)
 +
* die '''Operationalisierung''', d.h. die Art und Weise, wie wir Einstellungen und Sachverhalte messen
  
Wenn wir z.B. 100 Mitmenschen zu ihren Wahlpräferenzen befragen, dann kann es sein, dass die Beliebtheit der SPÖ bei ihnen deutlich anders ausfällt als bei der Grundgesamtheit, auch wenn aus der Schichtung der '''Stichprobe''' keinerlei tendenziöse Verteilung der Personen ersichtlich war.
+
Interessiert uns z.B. die Einstellung der lokalen Bevölkerung zur Entwicklungszusammenarbeit, dann ist das zu untersuchende Objekt die Bevölkerung (die Grundpopulation), während die thematischen Fragen die Einstellungen der Bevölkerung zur EZA darstellen.
  
==== '''Konfidenzintervalle''' ====
+
==== '''Befragung der richtigen Personen mit den richtigen/relevanten Fragen''' ====
  
Besonders in der analytischen Statistik gibt man daher '''Konfidenzintervalle''' bzw. '''Schwankungsbreiten''' an, innerhalb derer sich ein wahrer Wert bewegen soll, d.h. der vermutete Wert in der '''Grundpopulation'''. '''Die Breite der Konfidenzintervalle hängt von der Größe der Stichprobe, deren relativer Größe im Verhältnis zur Grundpopulation sowie von der gewählten Irrtumswahrscheinlichkeit ab.'''
+
Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und '''Repräsentativität[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[1]]]'''), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe '''Operationalisierung[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2]]]''' und '''Messen[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3]]]''').
  
==== '''Beispiel Hochrechnung am Wahlsonntag:''' ====
+
Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).
  
Wir erleben dies immer am Wahlsonntag, wenn gegen 17h zum Zeitpunkt der 1. Hochrechnung die Statistikexperten angeben, dass die Partei A mit zwischen 35,3 und 36,8% der Stimmen zu rechnen hat, Partei B etc.
 
  
  
 
'''Verweise:'''<br />
 
'''Verweise:'''<br />
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[1] Siehe Kapitel 2.1.1]]<br />
+
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|[1] Siehe Kapitel 2.1.4]]<br />
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[2] Siehe Kapitel 2.1]]<br />
+
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|[2] Siehe Kapitel 2.2]]<br />
 +
[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|[3] Siehe Kapitel 2.2.2]]<br />
  
==Inhalt==
+
==Inhaltsverzeichnis==
 
<div class="eksa_toc">
 
<div class="eksa_toc">
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3 Wahrscheinlichkeiten, nicht Gewissheit|1.3 Wahrscheinlichkeiten, nicht Gewissheit]]<br />
+
[[Von_der_Fragestellung_zur_statistischen_Analyse#2. Von der Fragestellung zur statistischen Analyse|2. Von der Fragestellung zur statistischen Analyse]]<br />
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.1 Schwankungsbreiten und Konfidenzintervalle|1.3.1 Schwankungsbreiten und Konfidenzintervalle]]<br />
+
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|2.1 Die Grundpopulation: worüber wir Aussagen machen]]<br />
[[Funktion_und_Sinn_von_Statistik/Wahrscheinlichkeit#1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau|1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau]]<br />
+
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe (Sample)|2.1.1 Die Stichprobe (Sample)]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.2 Teil- oder Vollerhebung?|2.1.2 Teil- oder Vollerhebung?]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3 Die Ziehung (Auswahl) der Stichprobe|2.1.3 Die Ziehung (Auswahl) der Stichprobe]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)|2.1.3.1 Geschichtete Stichprobenauswahl (Quotenstichprobe)]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.1 Proportional geschichtete Stichproben|2.1.3.1.1 Proportional geschichtete Stichproben]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.2 Disproportional geschichtete Stichproben|2.1.3.1.2 Disproportional geschichtete Stichproben]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.1.3 Laufende Kontrolle der Schichtung|2.1.3.1.3 Laufende Kontrolle der Schichtung]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2 Zufallsstichproben|2.1.3.2 Zufallsstichproben]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.1 Einfache Zufallsstichprobe|2.1.3.2.1 Einfache Zufallsstichprobe]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.2 Systematische Zufallsstichprobe|2.1.3.2.2 Systematische Zufallsstichprobe]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.2.3 Geschichtete Zufallsstichprobe|2.1.3.2.3 Geschichtete Zufallsstichprobe]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.3 Willkürliches Auswahlverfahren|2.1.3.3 Willkürliches Auswahlverfahren]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.3.4 Klumpenstichproben|2.1.3.4 Klumpenstichproben]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.4 Repräsentativität|2.1.4 Repräsentativität]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?|2.1.5 Was tun, wenn die Grundpopulation nicht bekannt ist?]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2 Die Operationalisierung|2.2 Die Operationalisierung]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.1 Die Suche nach Indikatoren|2.2.1 Die Suche nach Indikatoren]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2 Das Messen|2.2.2 Das Messen]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.2.1 Messfehler|2.2.2.1 Messfehler]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3 Vom Fragebogen zum Codeplan|2.2.3 Vom Fragebogen zum Codeplan]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix|2.2.3.1 Dateneingabe und Erstellung einer Datenmatrix]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.2 Umcodierung mit SPSS|2.2.3.2 Umcodierung mit SPSS]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Operationalisierung#2.2.3.3 Automatische Rückcodierung mit SPSS|2.2.3.3 Automatische Rückcodierung mit SPSS]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Gütekriterien#2.3 Gütekriterien quantitativer Untersuchungen|2.3 Gütekriterien quantitativer Untersuchungen]]<br />
 +
:[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4 Fehlerquellen bei statistischer Arbeit|2.4 Fehlerquellen bei statistischer Arbeit]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.1 Fehler erster und zweiter Art|2.4.1 Fehler erster und zweiter Art]]<br />
 +
::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2 Fehlerhafte oder mangelnde Daten|2.4.2 Fehlerhafte oder mangelnde Daten]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1 Eingabefehler|2.4.2.1 Eingabefehler]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS|2.4.2.1.1 Wahl geeigneter Datentypen mit SPSS]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel|2.4.2.1.2 Gültigkeitsprüfung der Daten mit Excel]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.2 Doppelte Datensätze|2.4.2.2 Doppelte Datensätze]]<br />
 +
:::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3 Fehlende Einträge|2.4.2.3 Fehlende Einträge]]<br />
 +
::::[[Von_der_Fragestellung_zur_statistischen_Analyse/Fehlerquellen#2.4.2.3.1 Behandlung fehlender Daten mit SPSS|2.4.2.3.1 Behandlung fehlender Daten mit SPSS]]<br />
 
</div>
 
</div>
  
== 1.3.1 Schwankungsbreiten und Konfidenzintervalle ==
+
<br />
 
+
'''[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|Nächstes Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen]]'''
Unter '''Schwankungsbreite''' bzw. '''Konfidenzintervall''' versteht man einen Bereich, innerhalb dessen eine Merkmalsausprägung für die Grundpopulation bei einer festgesetzten Irrtumswahrscheinlichkeit angenommen wird, wobei der für die Schätzung verwendete Ausgangswert aus einer Stichprobe ermittelt wurde.
 
 
 
Die '''Schwankungsbreite''' oder das '''Konfidenzintervall''' hängen von folgenden Faktoren ab:<br />
 
a. dem gewählten Signifikanzniveau (je signifikanter, dester größer die Schwankungsbreite);<br />
 
b. dem größenmäßigen Verhältnis zwischen '''Stichprobe''' und '''Grundpopulation[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1]]]''' (je größer der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse voneinander abweichen und damit die Schwankungsbreite);<br />
 
c. der Größe der '''Stichprobe[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2]]]''' (je kleiner, desto größer ist die Schwankungsbreite)
 
 
 
'''Beispiel zu Punkt b am Wahlabend:'''<br />
 
Während die StatistikerInnen gegen 17 h bei vielleicht 10 % der ausgezählten Stimmen die Schwankungsbreite der Stimmen für Partei A mit zwischen 35,3 bis 36,8 angeben (also einer Spanne von 1,5 %), wird gegen 19 h, wenn etwa 90 % der Stimmen ausgezählt sind, eine Schwankungsbreite von vielleicht 0,2 oder 0,3 % angegeben werden, also 35,9-36,2 %).
 
 
 
Siehe auch '''Konfidenzintervall (Wikipedia)[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93;]'''.
 
 
 
 
 
 
 
'''Verweise:'''<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1 Die Grundpopulation: worüber wir Aussagen machen|[1] Siehe Kapitel 2.1]]<br />
 
[[Von_der_Fragestellung_zur_statistischen_Analyse/Grundpopulation#2.1.1 Die Stichprobe Sample|[2] Siehe Kapitel 2.1.1]]<br />
 
[http://de.wikipedia.org/wiki/Konfidenzintervall &#91;3&#93; http://de.wikipedia.org/wiki/Konfidenzintervall]<br />
 
 
 
 
 
== 1.3.2 Irrtumswahrscheinlichkeit und Signifikanzniveau ==
 
 
 
Unter der Irrtumswahrscheinlichkeit p versteht man die zahlenmäßig ausgedrückte Wahrscheinlichkeit, dass sich ein Ergebnis einer statistischen Analyse substantiell vom tatsächlichen Ergebnis der Grundpopulation unterscheidet.
 
 
 
In der Statistik arbeitet man meist mit den drei folgenden '''Signifikanzniveaus''' oder -grenzen:
 
 
 
p ≤ 0,05: '''signifikant''' (Irrtumswahrscheinlichkeit kleiner als 5 %)
 
 
 
p ≤ 0,01: '''sehr signifikant''' (Irrrtumswahrscheinlichkeit kleiner als 1 %)
 
 
 
p ≤ 0,001: '''höchst signifikant''' (Irrtumswahrscheinlichkeit kleiner als 1 ‰)
 
 
 
Wenn daher bei einer Hochrechnung am Wahlabend gesagt wird, dass bei einer '''Irrtumswahrscheinlichkeit''' von weniger als 1 % eine Partei zwischen 35,2 und 35,6 % der Stimmen erhalten wird, dann bedeutet dies, dass nur in weniger als 1% aller Fälle das tatsächliche Endergebnis außerhalb dieses Bereiches liegen wird.
 
 
 
Siehe auch '''Signifikanz (Wikipedia)[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93;]'''.
 
 
 
 
 
 
 
'''Verweise:'''<br />
 
[http://de.wikipedia.org/wiki/Statistische_Signifikanz &#91;1&#93; http://de.wikipedia.org/wiki/Statistische_Signifikanz]<br />
 
 
 
 
 
'''[[Grundlagen_Statistischer_Auswertungsverfahren|&crarr; Zurück zur Übersicht]]'''
 
 
----
 
----
[[#1.3 Wahrscheinlichkeiten, nicht Gewissheit|&uarr; Nach oben]]
+
[[#2. Von der Fragestellung zur statistischen Analyse|&uarr; Nach oben]]

Latest revision as of 14:31, 24 September 2020

↵ Zurück zur Übersicht

2. Von der Fragestellung zur statistischen Analyse

verfasst von Erwin Ebermann

Wesentliche Elemente bei quantitativen Forschungsansätzen

Bei quantitativen Forschungsansätzen sind die folgenden Teilbereiche von besonderer Bedeutung:

  • die Untersuchungsobjekte, über welche wir eine Aussage machen möchten (z.B. LateinamerikanerInnen in Wien);
  • die Forschungsfrage, die wir mit den Untersuchungsobjekten verbinden (z.B. ihre Erfahrungen in Wien)
  • die Operationalisierung, d.h. die Art und Weise, wie wir Einstellungen und Sachverhalte messen

Interessiert uns z.B. die Einstellung der lokalen Bevölkerung zur Entwicklungszusammenarbeit, dann ist das zu untersuchende Objekt die Bevölkerung (die Grundpopulation), während die thematischen Fragen die Einstellungen der Bevölkerung zur EZA darstellen.

Befragung der richtigen Personen mit den richtigen/relevanten Fragen

Wir müssen sowohl sicherstellen, dass wir uns tatsächlich bei unseren Befragungen an diese Grundpopulation wenden (siehe dazu auch Grundpopulation und Repräsentativität[1]), als auch, dass die thematischen Fragen in eindeutiger Weise beantwortet werden können, die eine statistische Interpretation ermöglichen (siehe Operationalisierung[2] und Messen[3]).

Im oben genannten Beispiel müssen wir also genau abklären, wer oder was die lokale Bevölkerung ist, wie sie sich differenziert (Objekt) und zusätzlich eine Reihe von thematischen Fragestellungen entwickeln, deren Gesamtheit es erlaubt, die Einstellung von Menschen zur Entwicklungszusammenarbeit einzuschätzen (wie z.B. prinzipielle Zustimmung bzw. Ablehnung der EZA; Frage nach privaten Spenden oder anderen Aktivitäten für diesen Bereich; Fragen nach der bevorzugten Art der EZA; Frage nach der Akzeptanz von Transfair-Produkten; Fragen nach der gewünschten Höhe der EZA-Leistungen; Fragen nach Ländern und Regionen, die als förderungswürdig gelten usw.).


Verweise:
[1] Siehe Kapitel 2.1.4
[2] Siehe Kapitel 2.2
[3] Siehe Kapitel 2.2.2

Inhaltsverzeichnis


Nächstes Kapitel: 2.1 Die Grundpopulation: worüber wir Aussagen machen


↑ Nach oben