Você está na página 1de 39

Introduccin a la Estadstica

Inferencial con SPSS


Juan Jos Igartua Perosanz
Universidad de Salamanca
jigartua@usal.es

Contenidos


1. Conceptos bsicos de Estadstica
Inferencial.
2. Tablas de contingencia.
3. Coeficiente de correlacin de Pearson.
Conceptos bsicos de Estadstica
Inferencial

Hiptesis nula y alternativa.
Pruebas de contraste de hiptesis.
Tipos de contraste de hiptesis.
El concepto de significacin estadstica.
Contexto de la investigacin
Teoras y/o
investigaciones previas
Hiptesis de
investigacin
Hiptesis alternativa (H
1
)
Hiptesis estadstica
Diferencia-igualdad entre 2 ms
grupos
Asociacin entre 2 ms
variables
Toma de decisiones bajo
incertidumbre sobre lo adecuadas
que son las explicaciones tericas y
la hiptesis que se deducen de ellas
Contexto de las pruebas de contraste de
hiptesis
Escepticismo (azar,
casualidad)
Reglas de inferencia negativa
Se da por supuesto que la hiptesis
nula es verdadera
Pruebas de contraste
de hiptesis
Hiptesis nula (H
0
) versus
alternativa (H
1
)
Comprobar la validez de la
hiptesis estadstica
Comparar H
0
con H
1
Estadstico de contraste Significacin estadstica (p)
Reglas de inferencia negativa
Las pruebas de contraste de hiptesis
tienen una presuncin a favor de la
hiptesis nula (), de forma similar a
como ocurre en los tribunales de
justicia, donde hay una presuncin de
inocencia. Dado que uno es inocente
hasta que se demuestre lo contrario, la
evidencia aportada debe ser muy
consistente para admitir la culpabilidad
(Baxter y Babbie, 2004, p. 278).
Pginas del manual 399-413
Significacin estadstica (p)
El azar explica los resultados?
Probabilidad de equivocarse al rechazar la
hiptesis nula.
Credibilidad de la H
0
.
Probabilidad de error (error tipo I) al rechazar H
0
.
Probabilidad de obtener un estadstico de
contraste tan grande como el obtenido si H
0
fuera
cierta.
La probabilidad de que las diferencias (o
asociacin entre las variables) pueda explicarse
simplemente por el azar o la casualidad.
Tablas de contingencia
Analizar la relacin entre dos variables con un nivel
de medida nominal u ordinal (cualitativas).
Comprobar si existen diferencias entre dos o ms
grupos (variable columna, cualitativa) en una
variable (fila) cualitativa.
Analizar la fuerza de la relacin entre dos variables
cualitativas.
Se toma como base una tabla de contingencia.
Se calcula el estadstico de contraste Chi o Ji
cuadrado.
Clculo del estadstico de contraste
2
Hiptesis nula
No existe relacin entre 2 variables
No existen diferencias entre los grupos en la
variable criterio
Hiptesis alternativa
Existe asociacin entre 2 variables
Existen diferencias entre los grupos en la
variable criterio
Frmulas:
Interpretacin
Chi cuadrado:
El nivel de significacin asociado al estadstico representa la
probabilidad de obtener un determinado valor de en el caso
de que las dos variables sean independientes (hiptesis nula).
Cuando el valor obtenido sea menor que 0.05 (p<0.05) se podr
rechazar la hiptesis nula y afirmar que existe una asociacin
significativa entre las variables consideradas.
Calculo de las frecuencias esperadas y del
estadstico de contraste
2
(ejemplo 1)
Clculo de
2
con SPSS (ejemplo 1)
Pruebas de chi-cuadrado
,000
b
1 1,000
,000 1 1,000
,000 1 1,000
1,000 ,624
,000 1 1,000
40
Chi-cuadrado de Pearson
Correccin por
continuidad
a
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Valor gl
Sig. asinttica
(bilateral)
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
Calculado slo para una tabla de 2x2.
a.
0 casillas (,0%) tienen una f recuencia esperada inf erior a 5. La f recuencia mnima esperada
es 10,00.
b.
Tabla de contingencia VotoPartido Vot al partido poltico en las elecciones? * VioSpot
Vio el spot sobre la campaa del Partido Poltico?
10 10 20
10,0 10,0 20,0
10 10 20
10,0 10,0 20,0
20 20 40
20,0 20,0 40,0
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
0 No
1 S
VotoPartido Vot
al partido poltico
en las elecciones?
Total
0 No 1 S
VioSpot Vio el spot
sobre la campaa del
Partido Poltico?
Total
Tabla de
contingencia
Chi
cuadrado
Calculo de las frecuencias esperadas y del
estadstico de contraste
2
(ejemplo 2)
Clculo de
2
con SPSS (ejemplo 2)
Tabla de contingencia VotoPartido Vot al partido poltico en las elecciones? * VioSpot
Vio el spot sobre la campaa del Partido Poltico?
15 5 20
10,0 10,0 20,0
5 15 20
10,0 10,0 20,0
20 20 40
20,0 20,0 40,0
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
0 No
1 S
VotoPartido Vot
al partido poltico
en las elecciones?
Total
0 No 1 S
VioSpot Vio el spot
sobre la campaa del
Partido Poltico?
Total
Pruebas de chi-cuadrado
10,000
b
1 ,002
8,100 1 ,004
10,465 1 ,001
,004 ,002
9,750 1 ,002
40
Chi-cuadrado de Pearson
Correccin por
continuidad
a
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Valor gl
Sig. asinttica
(bilateral)
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
Calculado slo para una tabla de 2x2.
a.
0 casillas (,0%) tienen una f recuencia esperada inf erior a 5. La f recuencia mnima esperada
es 10,00.
b.
Tabla de
contingencia
Chi
cuadrado
TABLAS DE CONTINGENCIA
(matriz de datos)

AC Latinoamerica
en prensa.sav
Estudio sobre el
tratamiento
informativo de
Latinoamrica en
la prensa
espaola
Metodologa:
Anlisis de
contenido (n=309
noticias)
Pginas del manual 524-525
Construccin de una tabla de contingencia
(paso 1)
Men Analizar > Estadsticos descriptivos >Tabla de Contingencia
Variable fila: VD
(carcter)
Variable columna:
VI (pais)
Construccin de una tabla de contingencia
(paso 2)
Recuento
34 22 26 14 24 14 134
44 14 7 17 7 5 94
13 19 10 15 10 14 81
91 55 43 46 41 33 309
1 Negativ o
2 Neutro o ambiguo
3 Positiv o
caracter Carcter
(eval uati vo) del
aconteci mi ento
pri ncipal
Total
1 Chile 2 Cuba 3 Colombia 4 Mx ic o 5 Venez uela 6 Brasil
pais Pa s protagonista de l a informaci n anal iz ada
Total
Nmero de noticias sobre Chile y que aluden a
acontecimientos de carcter negativo (n=34)
Nmero de noticias totales sobre Chile,
independientemente del carcter
evaluativo del acontecimiento principal
que se relata (n=91)
Nmero de noticias que informan
de acontecimientos de carcter
negativo, independientemente
del pas protagonista (n=134)
Construccin de una tabla de contingencia
(paso 3)
Porcentajes
columna
Regla de Zeisel
Siempre que la
variable
independiente
aparezca como
variable
columna.
Construccin de una tabla de contingencia
(resultado final)
% de pais Pas protagonista de la informacin analizada
37, 4% 40, 0% 60, 5% 30, 4% 58, 5% 42, 4% 43, 4%
48, 4% 25, 5% 16, 3% 37, 0% 17, 1% 15, 2% 30, 4%
14, 3% 34, 5% 23, 3% 32, 6% 24, 4% 42, 4% 26, 2%
100, 0% 100, 0% 100, 0% 100, 0% 100, 0% 100, 0% 100, 0%
1 Negativo
2 Neutro o ambiguo
3 Positivo
caracter Carcter
(eval uati vo) del
aconteci mi ento
pri ncipal
Total
1 Chile 2 Cuba 3 Colombia 4 Mxico 5 Venez uela 6 Brasil
pais Pa s protagonista de l a informaci n anal iz ada
Total
Se comparan los % entre las columnas.
El 60.5% de las noticias
sobre Colombia son
negativas, mientras que
slo lo son el 30.4% de las
noticias sobre Mxico.
Es estadsticamente
significativa esta diferencia de
porcentajes o se puede explicar
por el azar?
Obtencin de frecuencias observadas, esperadas y
residuos en una tabla de contingencia
Se solicitan las
frecuencias
observadas,
esperadas y los
residuos no
tipificados
Tabla de contingencia con informacin sobre
frecuencias observadas, esperadas y residuos
34 22 26 14 24 14 134
39, 5 23, 9 18, 6 19, 9 17, 8 14, 3 134, 0
-5, 5 -1, 9 7, 4 -5, 9 6, 2 -,3
44 14 7 17 7 5 94
27, 7 16, 7 13, 1 14, 0 12, 5 10, 0 94, 0
16, 3 -2, 7 -6, 1 3, 0 -5, 5 -5, 0
13 19 10 15 10 14 81
23, 9 14, 4 11, 3 12, 1 10, 7 8, 7 81, 0
-10, 9 4, 6 -1, 3 2, 9 -,7 5, 3
91 55 43 46 41 33 309
91, 0 55, 0 43, 0 46, 0 41, 0 33, 0 309, 0
Recuento
Frecuencia es perada
Residuo
Recuento
Frecuencia es perada
Residuo
Recuento
Frecuencia es perada
Residuo
Recuento
Frecuencia es perada
1 Negativ o
2 Neutro o ambiguo
3 Positiv o
caracter
Carcter
(eval uati vo) del
aconteci mi ento
pri ncipal
Total
1 Chile 2 Cuba 3 Colombia 4 Mx ic o 5 Venez uela 6 Brasil
pais Pa s protagonista de l a informaci n anal izada
Total
Calculo MANUAL del estadstico de
contraste
2

Calculo del estadstico de contraste
2
con
SPSS
Botn
Estadsticos
Obtencin del estadstico de contraste
2

con SPSS (resultado final)
La prueba detecta si
existe una asociacin
significativa entre las
variables.
Existe una relacin
estadsticamente
significativa entre el
carcter evaluativo del
acontecimiento
principal abordado en
la noticia y el tipo de
pas protagonista de la
misma [ (10, N=309)
= 36.83, p<.001]
Distribucin
2
de Pearson

Tabla
2

Obtencin de los residuos tipificados
corregidos
Permite saber
cul es el
sentido de la
asociacin o de
las diferencias
entre los grupos:
en este caso, qu
pases de manera
significativa
difieren en el
tratamiento
informativo.
Obtencin de los residuos tipificados
corregidos (resultado final)
34 22 26 14 24 14 134
37, 4% 40, 0% 60, 5% 30, 4% 58, 5% 42, 4% 43, 4%
-5, 5 -1, 9 7, 4 -5, 9 6, 2 -,3
-,9 -,4 1, 7 -1, 3 1, 5 -,1
-1, 4 -,6 2, 4 -1, 9 2, 1 -,1
44 14 7 17 7 5 94
48, 4% 25, 5% 16, 3% 37, 0% 17, 1% 15, 2% 30, 4%
16, 3 -2, 7 -6, 1 3, 0 -5, 5 -5, 0
3, 1 -,7 -1, 7 , 8 -1, 5 -1, 6
4, 4 -,9 -2, 2 1, 0 -2, 0 -2, 0
13 19 10 15 10 14 81
14, 3% 34, 5% 23, 3% 32, 6% 24, 4% 42, 4% 26, 2%
-10, 9 4, 6 -1, 3 2, 9 -,7 5, 3
-2, 2 1, 2 -,4 , 8 -,2 1, 8
-3, 1 1, 5 -,5 1, 1 -,3 2, 2
91 55 43 46 41 33 309
100, 0% 100, 0% 100, 0% 100, 0% 100, 0% 100, 0% 100%
Recuento
% de pais
Residuo
Residuos tipificados
Residuos corregidos
Recuento
% de pais
Residuo
Residuos tipificados
Residuos corregidos
Recuento
% de pais
Residuo
Residuos tipificados
Residuos corregidos
Recuento
% de pais
1 Negativ o
2 Neutro o ambiguo
3 Positiv o
caracter
Carcter
(ev aluativ o)
del
acontecimiento
princ ipal
Total
1 Chile 2 Cuba 3 Colombia 4 Mx ic o 5 Venez uela 6 Brasil
pais Pas protagonista de la informacin analizada
Total
Los residuos tipificados corregidos se considerarn estadsticamente
significativos los residuos cuyo valor sea mayor que 1.96 menor
que -1.96. El signo del residuo sirve para ver la direccin de la relacin
entre las categoras de las variables implicadas.
Obtencin de estadsticos para evaluar la
fuerza de la asociacin
Obtencin de estadsticos para evaluar la
fuerza de la asociacin (resultado final)
Coeficiente de correlacin r de Pearson
Asociacin lineal entre dos variables (de
intervalo o razn).
Diagrama de dispersin.
Covarianza (=s
xy
).
Signo y fuerza de la asociacin.
Coeficiente de determinacin (=r
2
) y varianza
explicada (=r
2
x 100).
Ojo! Correlacin no es causacin.
Clculo MANUAL del coeficiente de
correlacin de Pearson (2)
Signo: forma
de la relacin
(+, -)
Valor numrico:
fuerza o magnitud
de la relacin (-1,
+1)
Clculo MANUAL del coeficiente de
correlacin de Pearson (1)
0; 1
2; 3
4; 5
7; 7
9; 8
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
X
Y
Ecuacin de la lnea recta: y = a + bX
COEFICIENTE DE CORRELACIN DE
PEARSON (matriz de datos)
Encuesta TV y
violencia.sav
Estudio sobre
el efecto de
cultivo
Metodologa:
Encuesta
(n=96)
Pginas del manual 508-509
Obtener un diagrama de dispersin
(paso 1)
Men Grficos > Dispersin/Puntos > Dispersin simple (Botn Definir)
Obtener un diagrama de dispersin
(paso 2)
Variable X: TV
Variable Y: victim
Obtener un diagrama de dispersin
(resultado final)
Relacin positiva
entre X e Y
Pero de qu
magnitud es la
relacin?
Clculo del coeficiente de correlacin de
Pearson (paso 1)
Men Analizar > Correlaciones > Bivariadas
Clculo del coeficiente de correlacin de
Pearson (paso 2)
Clculo del coeficiente de correlacin de
Pearson (resultado final)
Ventana de
resultados
r[94]=0.53, p<.001
Correlacin entre
consumo de TV y
victimizacin: