Stichprobe

 

(= S.) [engl. sample], [FSE], eine für Forschungszwecke gebildete Auswahl von Fällen aus der Gesamtheit von Fällen, über die im Rahmen einer empirischen Studie Aussagen getroffen werden sollen (Grundgesamtheit, Population). Bei den Fällen handelt es sich in der Ps. oft um Personen (Personens.), es können aber je nach Forschungsfrage auch Objekte aller Art (z. B. Zeitungsartikel, Curricula von Studiengängen, Unternehmen) die interessierenden Fälle einer Grundgesamtheit bilden, aus der eine S. ausgewählt wird. S.erhebungen sind in der Ps. sowie in der empirischen Sozialforschung generell typ.; nur selten wird mit Vollerhebungen gearbeitet, bei denen alle zur Population gehörenden Fälle untersucht werden. Eine S. ist für die Forschung i. d. R. umso nützlicher, je besser sie im Kleinen die interessierende Population abbildet.

Jede S. zeichnet sich durch zwei zentrale Merkmale aus: (1) die S.art, die bezeichnet, nach welchem Auswahlverfahren Fälle aus der Population in die S. gelangen (z. B. bewusst oder zufällig ausgewählt), und (2) den S.umfang (kleine oder große S.), der durch die Anzahl der Fälle in der S. definiert ist. Welche S.art und welcher S.umfang zu wählen sind, hängt maßgeblich vom Erkenntnisinteresse einer Studie ab, insbes. werden in der qual. Forschung andere S.auswahlverfahren verwendet als in der quant. Forschung (Datenerhebungsverfahren, Datenanalysemethoden, quantitative).

Über Art und Umfang der in einer Studie realisierten S. entscheiden in der Praxis nicht nur methodologische Gründe, sondern auch forschungsökonomische Rahmenbedingungen, denn mit wachsendem S.umfang steigt meist der Arbeitsaufwand der S.bildung. Zudem unterscheiden sich versch. S.auswahlverfahren hinsichtlich Zeit-, Personal- bzw. Kostenaufwand erheblich. Forschungspraktisch reicht es nämlich nicht, ein S.auswahlverfahren für die eigene Studie zu def. Die ausgewählten Fälle müssen bei Personens. auch entspr. rekrutiert, d. h. für die tatsächliche Teilnahme an der Studie gewonnen werden. Rekrutierungsverfahren sind bspw. postalische, telefonische oder persönliche Ansprache und Einladung. Probleme bei der Rekrutierung (z. B. Nichterreichbarkeit ausgewählter Fälle) beeinflussen die Realisierbarkeit geplanter Samples. Nicht zuletzt ist zu beachten, dass aus forschungsethischen Gründen die Teilnahme an jeder wiss. Studie freiwillig ist und für Forschungszwecke gebildete Personens. demnach immer Freiwilligens. sind. In dieser Hinsicht besteht eine systemat. Verzerrung nahezu aller Personens. gegenüber der zugehörigen Population, in der sich meist auch Personen befinden, die eine Teilnahme an wiss. Studien generell ablehnen und deswegen nie in Samples auftauchen.

In der qual. Forschung (Datenanalysemethoden, qualitative, Qualitative Sozialforschung) wird typ.weise mit relativ kleinen S. im ein- bis unteren zweistelligen Bereich gearbeitet, da die differenzierte interpretative Rekonstruktion jedes einzelnen Falles angestrebt wird. Typ. für qual. S. ist eine bewusste Auswahl von Fällen nach Maßgabe ihres Informationsgehaltes i. d. S., dass die Heterogenität des Feldes bzw. der Population sich möglichst erschöpfend widerspiegelt (qualitative Fallauswahl). Häufig sind in der qual. Forschung die Auswahl- und das Rekrutierungsverfahren von S. eng miteinander verknüpft (qualitative Rekrutierungsverfahren). Bei dem aus der Grounded-Theory-Methodologie (Grounded Theory) stammenden Typ der theoretischen S. handelt es sich um eine bes. konsequente Umsetzung der Prinzipien qual. Forschung auf die S.bildung: Es wird nicht vorab ein S.plan festgelegt, sondern es werden nach und nach anhand der vorliegenden Zwischenergebnisse der laufenden qual. Studie gemäß unterschiedlicher theoret. und empir. Kriterien immer wieder neue Fälle hinzugenommen, bis weitere Fälle keinen zusätzlichen Erkenntnisnutzen mehr bringen (theoretische Sättigung).

In der quant. Forschung wird typ.erweise mit größeren bis sehr großen S. im drei- bis vier- oder noch höherstelligen Bereich operiert, da es v. a. darum geht, fallübergreifende Aussagen über Merkmalsausprägungen, Merkmalszusammenhänge sowie Ursache-Wirkungs-Relationen zu treffen. Während z. B. für standardisierte Befragungsstudien in der Umfrage-, Markt-, Meinungs- oder Wahlforschung S. im oberen drei- bis vierstelligen Bereich typisch sind, werden in der quant. Online-Forschung (internetbasierte Methoden) – je nach Rekrutierungsverfahren – teilweise Tausende von Fällen untersucht. Im Zuge der Digitalisierung der Gesellschaft erschließt sich die quant. Sozialforschung eine Fülle digitaler Dokumente als Spuren menschlichen Verhaltens (Abrufprotokolle von Webservern, Postings in Online-Foren, Handyverbindungsdaten etc.). Abgesehen von den forschungs- und wissenschaftsethischen sowie erkenntnistheoret. Aspekten dieser Entwicklung von big data, ist aus forschungsökonomischer Perspektive zu beachten, dass durch die nonreaktive Datenerhebung und S.bildung aus digitalen Archiven und Datenbanken hier alle mit herkömmlichen Personens. sowie auch mit nicht digitalen Objekts. verbundenen Rekrutierungs- bzw. Beschaffungsprobleme entfallen und somit S. bislang ungewohnter Größe zus.gestellt und analysiert werden können.

Tendenziell nimmt mit wachsendem S.umfang die Aussagekraft einer quant. Studie zu. So sind bei größeren Fallzahlen genauere stat. Schätzungen der Populationsparameter (Punktschätzung oder Intervallschätzung) anhand der S.kennwerte möglich. Mit dem S.umfang steigt die Teststärke stat. Signifikanztests, d. h., die Wahrscheinlichkeit steigt, dass ein in der Population vorliegender Effekt tatsächlich anhand der S.daten aufgedeckt werden kann. Stets eine extrem große oder auch nur möglichst große S. zu realisieren, ist jedoch aufgrund der damit meist verbundenen Kosten kein rationales Vorgehen. Empfehlenswert ist es, bei quant. Studien im Vorfeld festzulegen, welche Effektgrößen im Signifikanztest noch nachweisbar sein sollen bzw. wie präzise Parameterschätzungen ausfallen sollen, und auf dieser Basis den optimalen Stichprobenumfang festzulegen.

Quant. S., d. h. S., die auf die Erkenntnisziele der quant. Forschung abgestimmt sind, werden anhand ihres Umfangs, aber vor allem auch anhand ihres Auswahlverfahrens dahingehend bewertet, wie gut sie die Population abbilden. Man spricht von stat. Repräsentativität, wenn sich die Populationsverhältnisse hinsichtlich Ausprägungen und Relationen der interessierenden Merkmale bzw. Variablen in der S. entspr. widerspiegeln und die S.kennwerte somit gute Schätzer der Populationsparameter (Verteilungsparameter) darstellen. Der beste Garant für eine möglichst repräsentative S. ist ein zufallsgesteuertes Auswahlverfahren von Fällen aus der Population, das im Ergebnis eine probabilistische (zufällige, zufallsgesteuerte) S. liefert. Damit das stat. Zufallsprinzip angewendet werden kann, wird bei probabilistischen S. ein Auswahlrahmen (sampling frame) benötigt, d. h. eine möglichst vollst. Darstellung aller Fälle der Population, aus denen ausgewählt werden kann (z. B. stellt das Einwohnermelderegister einen Auswahlrahmen für die Population der lokalen Wohnbevölkerung dar).

Probabilistische Personens. aus der Wohnbevölkerung werden i. d. R. nur in der vorexp. Umfrage-, Markt-, Meinungs- und Wahlforschung genutzt (Demoskopie), nicht in quasi-exp. oder exp. Untersuchungsdesigns (Experiment, randomisierte kontrollierte Studie), in denen eher nicht probabilistische S. zum Einsatz kommen (die Zufallss. ist nicht mit der Randomisierung – der zufälligen Zuordnung von Pbn zu den Untersuchungsgruppen im Experiment – zu verwechseln). Man unterscheidet v. a. folg. fünf Arten von probabilistischen S., die für unterschiedliche Arten von Populationen und Datenerhebungsmethoden geeignet sind:

(1) einfache Zufallss. (direkte Zufallsauswahl von Fällen aus der Population, setzt eine vollst. Liste aller Fälle in der Population voraus); (2) Geschichtete bzw. stratifizierte S. (separate Zufallsauswahl von Fällen aus merkmalshomogenen Schichten der Population; setzt eine Strukturierung der interessierenden Population in Schichten voraus: z. B. Population eines Landes ist geschichtet nach Bildung); (3) Klumpens. (Zufallsauswahl von natürlichen Gruppen von Fällen = Klumpen, die dann jew. vollst. untersucht werden; setzt eine Strukturierung der interessierenden Population in Klumpen voraus: z. B. Population der Studierenden ist geklumpt gemäß ihren Hochschulen); (4) zwei- oder mehrstufige S. (S.auswahl, die über zwei oder mehr Ziehungsstufen erfolgt: Bsp. 1: dreistufige Bevölkerungsstichprobe eines Landes: a) Ziehungsstufe: zufallsgesteuerte Gebietsauswahl von Wahlbezirken des Landes, b) Ziehungsstufe: zufallsgesteuerte Adressauswahl von Haushalten in den ausgewählten Wahlbezirken, c) Ziehungsstufe: zufallsgesteuerte Auswahl von Personen in den ausgewählten Haushalten; Bsp. 2: zweistufige Stichprobe aus der Population der Studierenden in Dt.: a) Ziehungsstufe: Zufallsauswahl von Hochschulen aus der Liste aller Hochschulen in Dt., b) Ziehungsstufe: einfache Zufallsauswahl von Studierenden aus dem jew. Immatrikulationsregister der ausgewählten Hochschulen). (5) Zufallsgesteuerte Telefons. (S.auswahl für Telefonumfagen, bei der nach einem best. System zufällig Telefonnummern für Festnetz- und/oder Mobilfunkanschlüsse generiert werden).

Bei einer nicht probabilistischen S. erfolgt die Auswahl der Fälle willkürlich (ohne Ansehen der Merkmale der Fälle) und/oder systemat. (gezielt unter Berücksichtigung einzelner Merkmale der Fälle) – in jedem Fall nicht durch blinden Zufall, sondern durch aktives Zutun der Forschenden, was zu diversen Verzerrungen führt. Somit ist unbekannt, welche Auswahlwahrscheinlichkeit die einzelnen Fälle der Population haben bzw. in welcher Weise und in welchem Ausmaß die S.zusammensetzung von der Zielpopulation abweicht. Man unterscheidet v. a. vier Arten von nicht probabilistischen S.:

(1) Gelegenheits-, Ad-hoc-, Anfallss: (es wird eine günstige Gelegenheit abgepasst, bei der man eine gewisse Zahl von Fällen aus der Population erreichen oder antreffen kann, z. B. Musikfans werden auf einem Musikfestival angesprochen, für die S. rekrutiert und ggf. gleich vor Ort befragt); (2) Selbstselektionss. (ein öffentlicher Teilnahmeaufruf wird z. B. per Zeitungs- oder Internetanzeige verbreitet und die S. setzt sich aus denjenigen zus., die sich für die Studie melden); (3) Quotens. (die S. wird willkürlich zus.gestellt, dabei werden einzelne Merkmalsverteilungen vorgegeben, sei es, um die Populationsverhältnisse hinsichtlich dieses Merkmals abzubilden oder eine für die Fragestellung besonders aussagekräftige S. zu erhalten, in der z. B. eine gesellschaftliche Minderheit überproportional vertreten ist; z. B. Quote 50% Inländer und 50% Ausländer in der S.). (4) Schneeballs. (eine Personens. wird willkürlich zusammengestellt, indem man Personen, die bereits rekrutiert wurden, darum bittet, weitere Personen über ihre sozialen Netzwerke zu rekrutieren; dieses Verfahren kommt v. a. bei schwer zugänglichen Populationen – z. B. Drogenkonsumenten, Angehörige gesellschaftlicher Minoritäten – zum Einsatz).

Nicht probabilistische S. sind in der akademischen Forschung weit verbreitet, dürfen aber niemals den Anspruch erheben, auf die Population generalisierbare Aussagen über deren Merkmalsverteilungen treffen zu können (Validität, externe). Wohl aber können mit nicht probabilistischen S. verallgemeinerbare Aussagen über Kausaleffekte getroffen werden. So arbeitet z. B. die psychol. Experimentalforschung i. d. R. mit Gelegenheits- oder Selbstselektionss., die bewusst homogen gehalten werden und relativ klein sind (oft mittlerer zweistelliger Bereich).

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.