extra keine 50 extra eine 12 extra mehr 28 intro keine 50 intro eine 8 intro mehr 2Die Variable Persönlichkeit besitzt nur nominales Niveau; bei den abhängigen Variablen handelt es sich um Häufigkeiten. Deshalb ist hier der Chi-Quadrat-Unabhängigkeitstest anzuwenden, um feststellen zu können, ob die beiden Variablen Persönlichkeit und Zigarettenkonsum voneinander abhängen. Die Nullhypothese H_0 ist dabei, daß das Rauchverhalten unabhängig von der Persönlichkeitsstruktur sei. Die Kommandozeile
contab < ueb1_1.datliefert folgendes Ergebnis:
FACTOR: A B DATA
LEVELS: 2 3 150
A count
extra 90
intro 60
Total 150
NOTE: Yates' correction for continuity applied
chisq 5.606667 df 1 p 0.017892
B count
keine 100
eine 20
mehr 30
Total 150
chisq 76.000000 df 2 p 0.000000
SOURCE: A B
keine eine mehr Totals
extra 50 12 28 90
intro 50 8 2 60
Totals 100 20 30 150
Analysis for A x B:
chisq 18.055556 df 2 p 0.000120
Cramer's V 0.346944
Contingency Coefficient 0.327777
Wichtig ist dabei insbesondere der Ausdruck chisq = 18.055556; d.h. die Nullhypothese muß abgelehnt werden, da die Wahrscheinlichkeit für sie p < 0.001 ist. Die Persönlichkeitsstruktur hat also einen Einfluß auf das Rauchverhalten.
19 15 22 7 32 31 17 10 37 28 20 12 23 23 24 17 28 19 21 24 15 11 18 16Weil vor und nach Betrachten des Films Datenpunkte erhoben werden, handelt es sich um eine abhängige Stichprobe. Falls die Daten metrisch sind, muß der t-Test für abhängige Stichproben eingesetzt werden. Dies geht folgendermaßen:
pair < ueb1_2.datDieses Kommando erzeugt folgenden Output:
Analysis for 12 points:
Column 1 Column 2 Difference
Minimums 15.0000 7.0000 -3.0000
Maximums 37.0000 31.0000 15.0000
Sums 276.0000 213.0000 63.0000
SumSquares 6806.0000 4395.0000 595.0000
Means 23.0000 17.7500 5.2500
SDs 6.4526 7.4727 4.9013
t(11) 12.3476 8.2283 3.7106
p 0.0000 0.0000 0.0034
Correlation r-squared t(10) p
0.7617 0.5802 3.7174 0.0040
Intercept Slope
-2.5382 0.8821
Man erhält also als Ergebnis t(11) = 3.71 und p = 0.0034. Geht man dagegen von ordinalen Daten aus, muß ein nichtparametrischer Test eingesetzt werden. Bei dem nichtparametrischen Test kann beispielsweise derjenige nach Wilcoxon angewandt werden, der mit dem Kommando rankrel durchgeführt wird:
rankrel < ueb1_2.datDer auf diese Weise erzeugte Output sieht folgendermaßen aus:
N Min 25% Median 75% Max
Cond-1 12 15.00 18.50 21.50 26.00 37.00
Cond-2 12 7.00 11.50 16.50 23.50 31.00
Total 24 7.00 15.50 19.50 24.00 37.00
Binomial Sign Test:
Number of cases Cond-1 is above Cond-2: 10
Number of cases Cond-1 is below Cond-2: 1
One-tail probability (exact) 0.005859
Wilcoxon Matched-Pairs Signed-Ranks Test:
Comparison of Cond-1 and Cond-2
T (smaller ranksum of like signs) 3.000000
N (number of signed differences) 11.000000
z 2.622870
One-tail probability approximation 0.004360
NOTE: Yates' correction for continuity applied
Check a table for T with N = 11
Friedman Chi-Square Test for Ranks:
Chi-square of ranks 6.750000
chisq 6.750000 df 1 p 0.009375
Check a table for Friedman with N = 12
Spearman Rank Correlation (rho) [corrected for ties]:
Critical r (.05) t approximation 0.575983
Critical r (.01) t approximation 0.707888
rho 0.727273
Hier erhält man somit einen z-Wert von 2.62; die Wahrscheinlichkeit dafür, daß der Mittelwertsunterschied zufällig zustande kan, beträgt nur p = 0.0044.
Bonusfrage: Wie hoch ist die Rangkorrelation nach Spearman zwischen den beiden Wertepaaren? Antwort: rho = 0.73. Was bedeutet dies? Etwa die Hälfte der Varianz im Rauchverhalten läßt sich durch das Betrachten oder Nicht-Betrachten des abschreckenden Films erklären.
------------------------------------------------------------
Under Range In Range Over Range Sum
0 150 0 39067.000
------------------------------------------------------------
Mean Median Midpoint Geometric Harmonic
260.447 220.000 494.500 225.734 195.950
------------------------------------------------------------
SD Quart Dev Range SE mean
152.608 78.500 895.000 12.460
------------------------------------------------------------
Minimum Quartile 1 Quartile 2 Quartile 3 Maximum
47.000 157.000 220.000 314.000 942.000
------------------------------------------------------------
Skew SD Skew Kurtosis SD Kurt
1.849 0.200 7.596 0.400
------------------------------------------------------------
Null Mean t prob (t) F prob (F)
0.000 20.902 0.000 436.892 0.000
------------------------------------------------------------
Man erhält also folgende Ergebnisse:
zurück zur Hauptseite zum Seminar "Rechnergestützte Auswertung von psychologischen Experimenten"
Anmerkungen und Mitteilungen an
rainer@zwisler.de