Você está na página 1de 13

Ejemplo:

Un investigador est interesado en saber si el desarrollo mental de un nio


se asocia a la educacin formal de la madre. De esta manera, obtiene la
calificacin de desarrollo mental en la escala de Gesell de ocho nios
elegidos aleatoriamente y se informa del grado de escolaridad de las
madres.
Eleccin de la prueba estadstica.
Se desea medir asociacin o correlacin. Las calificaciones de la educacin
formal de cada madre estn dadas en una medicin cualitativa, pero tienen
una escala ordinal, por lo cual es posible ordenarlas en
rangos. Vase: Flujograma 6

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). El desarrollo mental de los hijos es una


variable dependiente de la educacin formal de la madre; por lo
tanto, existe una correlacin significativa.

Hiptesis nula (Ho). La asociacin entre las variables educacin


formal de la madre y desarrollo mental de los hijos no es significativa,
ni hay correlacin.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se
rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza
Ha.
Desarrollo mental de algunos nios y escolaridad de las madres.

Aplicacin de la prueba estadstica.


Inicialmente, las observaciones de las variables X y Y se ordenan en rangos.

Arreglo en rangos de las observaciones presentadas en la tabla anterior.

De acuerdo con esto, se efecta un ordenamiento natural de los rangos de


las variables X y Y.
Rangos de la variable independiente X y su correspondiente de la variable
dependiente.

El clculo de la puntuacin efectiva (S) se realiza con el ordenamiento de los


rangos de la variable dependiente (Y).
El primer valor del rango de Y es 1. Respecto a los dems rangos, existen
siete mayores que Y y ninguno es menor, de manera que queda:
S = (7 - 0) +
Despus est el rango 5, luego se hallan tres por arriba y tres por debajo de
ste y se contina:
S = (7 - 0) + (3 - 3) +
En rango siguiente es el 3, del cual cuatro son mayores y uno menor, y
queda:
S = (7 - 0) + (3 - 3) + (4 - 1) +
El rango inmediato es el 2, y los cuatro subsecuentes son mayores y
ninguno menor:
S = (7 - 0) + (3 - 3) + (4 - 1) + (4 - 0) +
Despus se halla el rango 7, en el que uno es mayor y dos menores:
S = (7 - 0) + (3 - 3) + (4 - 1) + (4 - 0) + (1 - 2) +
Finalmente, se encuentra el rango 8, el subsecuente es el 6, que es menor y
se concluye el clculo de S, como sigue:
S = (7 - 0) + (3 - 3) + (4 - 1) + (4 - 0) + (1 - 2) + (0 - 1)
S = 7 + 0 + 3 + 4 - 1 - 1 = 12
Aplicamos la ecuacin de la prueba estadstica.

Calculamos el nivel se significancia.

Una vez calculado el valor Z, se obtiene la probabilidad en la tabla de


coeficientes de correlacin en niveles de p 0.05 y 0.01; a su vez en
buscamos en la tabla de probabilidades asociadas en valores extremos
como los de 2 en la distribucin normal.
Se localiza el valor 1.4 y en la interseccin de la columna 0.09, se observa el
valor 0.0681, el cual corresponde a la probabilidad de obtener un valor Z de
esta magnitud, que difiere del promedio y es mayor que el nivel de
significancia.
Decisin.
Como el valor Z tiene mayor probabilidad que el nivel de significancia, se
acepta Ho y se rechaza Ha.
Interpretacin.
La correlacin entre las variables educacin materna y desarrollo mental del
hijo no es significativa. Esta misma conclusin se obtuvo mediante el
coeficiente de correlacin de Spearman.

En la seccin de coeficiente de correlacin de Spearman se seal que al


aumentar el tamao de la muestra, existe mayor probabilidad de empates o
ligas entre los rangos de las observaciones. Para esta condicin se presenta
la siguiente ecuacin:

Donde:
t (tau) = coeficiente de correlacin de Kendall.
S = puntuacin efectiva de los rangos.
N = tamao de la muestra en parejas de variables.
Lx = sumatoria de ligas o empates dados en la variable independiente (X).
Ly = sumatoria de ligas o empates dados en la variable dependiente (Y).

Ahora analizamos los datos de la segunda tabla que nos dio la pantalla de
resultados.
Los nuevos datos se registran en la tabla 9.10.
Analicemos ahora los datos de la tabla 9.7 que registra los dos estadsticos
Tau y Gamma

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.
El estadstico Kendalls Tau mide la probabilidad de las diferencias entre las
probabili-dades de que los datos observados estn en el mismo orden,
versus la probabilidad de que no estn en el mismo orden.
Hay dos variantes de Tau: Tau b y Tau c, variantes que difieren en la manera
cmo se percibe las ordenaciones de las variables relacionadas entre s.
Kendalls Tau-b es una medida de asociacin que computa los excesos de
los pares de los datos observados concordantes en relacin a los
discordantes
Todo eso de acuerdo con una frmula establecida.
Tiende a un valor 0 cuando las variables son estadsticamente dependientes
En el cuadro de anlisis su valor es 0.107 y su Sig 0.001
Estos bajos niveles nos permite desechar la hiptesis de que ambas
variables,Shopping frecuency y Overall satisfaction, sean independientes
entre s.
Esto es, aceptamos la hiptesis alternativa de que las variables estn
asociadas entre s.
Tau-c, tambin conocida como Kendall-Stuart Tau-c, es una variante de Taub pero para tablas mayores; iguala el exceso de concordancia sobre los
pares discordantes.
Su valor en la tabla que analizamos tambin est respaldado por Sig. 0.001,
que es otra razn para desechar la hiptesis nula que sostiene la
independencia de las variables.

Uso de la Tabla de Contingencia para medir el riesgo relativo de un evento.


Una compaa que vende revistas enva tradicionalmente correos a clientes
que figuran en la base de datos; el porcentaje de respuestas es tpicamente
bajo.
Para mejorar las respuestas mensuales, decidieron enviar correos
mensuales a personas que tienen suscripciones de peridicos.
Esta iniciativa se basaba en el supuesto de que la gente que lee peridicos
estar ms interesada en suscribirse a una revista.
Para tener los estadsticos que les permita tomar una decisin al respecto,
nos encargan testar las bondades del nuevo sistema y nos entregan los
datos en el archivo demo.sav.
Nuestra tarea consiste en estimar el Riesgo Relativo de que una persona
que est suscrita a un peridico responde o no a los avisos que se les hace
llegar mensualmente.
Vamos a usar el procedimiento referido a las Tablas de Contingencia para
testar la teora, construyendo una tabla de dos por dos, con relacin a las
suscripciones de peridicos.
Men principal Estadsticos Descriptivos Tablas de Contingencia
Newspaper en la casilla de Filas y Response en la casilla de Columna.
Todava no pedimos Estadsticos; pero en la misma pantalla,
debajo Estadsticos click en Casilla Recuentos: click
observado esperado
A la derecha, click en comparar las proporciones de columna; abajo, en la
seccin Porcentajes click columna continuar aceptar.
Los datos aparecen en la tabla que copiamos como tabla 9.8
El Riesgo
El riesgo relativo es una razn de las probabilidades de dos eventos, en este
caso, nos interesa el riesgo relativo de una respuesta a los correos
mensuales.
Medimos ese riesgo por medio de una razn de probabilidades.
La razn de la probabilidad de que alguien suscrito a un peridico responda
a los correos, con relacin a la probabilidad de que alguien que no est
suscrito tambin responda.
As, de la tabla anterior el estimado del riesgo relativo es 13.7%/8.2% =
1.668.
Veamos ahora el riesgo relativo de no respuesta

Es la razn de la probabilidad de que alguien suscrito a un peridico no


responda con relacin a la probabilidad de que una persona no suscrita
tampoco responda.
Esto es 86,3%/91.8% = 0.94
Podemos afirmar que la probabilidad de que una persona suscrita a un
peridico res-ponda es 1.6680 veces que alguien no suscrita responda a los
correos.
Tambin se puede llegar a la misma conclusin diciendo que una persona
que est suscrita a un peridico responda, es 0.94 veces que alguien no
suscrito no responda.

Ejercicio :
Muestras
Hay dos muestras en este estudio, la primera constituida por la serie de 23
datos (aos) consecutivos, del nmero de suicidios (y su tasa), ocurridos en
Chile entre 1981 y 2003, obtenida de los anuarios estadsticos publicados
por el SML. La segunda es la relativa al PIB chileno entre los aos 1981 y
2003, provisto por el Banco Central de Chile (2003) cuyos datos estn en
trminos reales medidos a precio constante en millones de pesos de
1986.
Procedimientos
Con la base de datos relativa al PIB se establece una relacin entre el
nmero de suicidios y el PIB para el perodo 1981-2003. El problema de
ajustar una lnea entre series temporales se desarrolla en varias etapas

diferentes: primera, se analiza la estacionariedad de las series Y t : Nmero


de Suicidios y Xt: PIB; segunda, se elige la forma de la ecuacin
economtrica que representa el fenmeno estudiado el cual ser formulado
en trminos de las series Yt y Xt. Tercera, se estima el valor numrico de los
parmetros bj contenidos en la ecuacin elegida usando el mtodo de los
mnimos cuadrados ordinarios (MCO), identificando dentro del modelo
escogido, la ecuacin de regresin que mejor se ajuste a los puntos
observados disponibles. Una tarea importante que valida las consecuencias
de un modelo consiste en la comprobacin de los supuestos que operan en
la base misma de su construccin, a saber; la autocorrelacin y la
homoscedasticidad. Finalmente, cuarta, se estudia el efecto de no
cointegracin que puede resultar al relacionar, a travs de una ecuacin de
regresin, dos series temporales Yt y Xt no estacionarias.
Resultados
Los datos constitutivos de la muestra 2 relativa al PIB, recogidos desde los
archivos del Banco Central de Chile (2003) se presentan en Tabla 1,
conjuntamente con el nmero y tasa de suicidio en el pas de 1981 a 2003.
El comportamiento estandarizado de las series Xt e Yt, entre PIB y nmero
de suicidios se muestra en la Figura 1.

Del anlisis de la prueba de estacionariedad obtenemos la estadstica Q de


Ljung-Box para las variables nmero de suicidios (LBQ = 178, 46; gl = 22;
p< 0,01) y PIB ( LBQ = 194, 906; gl = 22; p < 0,01) a partir de la cual se
puede establecer que cada serie temporal es no estacionaria.
Se observa, tambin, que la curva PIB es suave y ascendente mientras que
la curva del nmero de suicidios es algo accidentada pero igualmente
ascendente, observndose una cierta similitud entre el comportamiento de
ambas. El modelo de regresin que representa aproximadamente la relacin
entre ambas series es lineal tanto en sus parmetros como en sus variables,
cuya formulacin general es:
Yt = 1 Xt + 0 + et

dnde et representa el residuo o error de modelo.


Usando el mtodo de estimacin MCO se obtiene las siguientes
estimaciones de los parmetros del modelo de regresin.
b1 = 0,00010956 y b0 = 287,15156608
donde b1 y b0 son estimaciones de 1 y 0 respectivamente.
En la Figura 2 se registra la relacin existente entre el PIB y el nmero de
suicidios para los 23 aos analizados, (1981 a 2003), junto con la lnea de
regresin estimada.
El resultado de la relacin entre el nmero suicidio y PIB es una r = 0,874
para el perodo 1981-2003 calculado mediante la estadstica Tau-b de
Kendall (Taprox = 21,08; p< 0,01) por lo cual, existe una relacin significativa
y positiva entre ambas variables (Siegel & Castellan, 1995).

El anlisis de varianza nos entrega la significancia de la ecuacin de


regresin lineal Freg= 478,652; glreg= 1, glresiduo= 22; p < 0,01. Para los
coeficientes estimados tb0=9,405; gl = 21; p < 0,01 y tb1 =? 22,083; gl = 21;
????p < 0,01. El modelo y sus coeficientes son estadsticamente
significativos. La ecuacin de regresin para el perodo 1981 2003 es:
Yt = 0.00010956 Xt + 287.15156608 + et
Aunque es posible la extrapolacin, sta es una operacin siempre
peligrosa, y tanto ms cuando esas predicciones sobrepasan plazos
prudentes o apropiados (Venables & Ripley, 1998).
La aplicacin de pruebas de significacin t y F usuales son vlidas si las
estimaciones de los coeficientes de la ecuacin de regresin, mediante

MCO, son eficientes. Para que tal situacin ocurra es necesario comprobar
las suposiciones de normalidad, ausencia de autocorrelacin y la
homoscedasticidad en los residuos de la regresin.
Para analizar la autocorrelacin aplicaremos la prueba de Durbin-Watson. La
estadstica obtenida es d = 1,254 y p > 0,01, por lo tanto, se puede afirmar
que no hay evidencia significativa de autocorrelacin en los residuos de la
regresin.
Sin embargo, es necesario probar el comportamiento normal de tales
residuos (estandarizados) que supone la prueba de Durbin-Watson.
Basndonos en el test de normalidad de Anderson-Darling se puede afirmar
que no hay evidencia que indique un desajuste significativo del
comportamiento normal, (A-Squared = 0,401; p > 0,01). En consecuencia,
los residuos estandarizados provienen de una poblacin normalmente
distribuida (Gujarati, 2004). En la Figura 3 se puede observar la curva
relativa a la bondad de ajuste de los residuos estandarizados.

Una prueba que nos ayuda a establecer la ausencia de autocorrelacin en


los residuos (estandarizados), en forma complementaria a la prueba de
Durbin-Watson, es la prueba de rachas, la cual no hace suposiciones sobre
la distribucin de probabilidades de donde se obtuvieron las observaciones
(Dickinson, 1985; Gujarati, 2004). Al analizar los resultados de la prueba de
rachas, se puede afirmar que no existe evidencia significativa (z = -0,350; p
> 0,01) que muestre un patrn sistemtico en el comportamiento de los
residuos estandarizados a travs del tiempo. Tales residuos constituyen un
proceso estocstico estacionario llamado ruido blanco.
En la Figura 4 se puede observar la distribucin correspondiente al
comportamiento de los residuos (estandarizados) en el tiempo.

Se recogi evidencia de confiabilidad de la versin preparada para los


usuarios de negocio mediante el clculo del coeficiente alfa de Cronbach
(), mtodo para estimar la consistencia interna del cuestionario, ecuacin
(1)(correlacin que sera obtenida entre dos formas perfectamente paralelas
de pruebas si no hubiera cambios en los examinandos) [9].

El clculo del coeficiente alfa para la muestra de patrocinadores, lderes de


proyecto, analistas de negocio y desarrolladores fue de 726. El clculo del
coeficiente alfa para el instrumento utilizado con la muestra de usuarios de
negocio fue de .841. Estos coeficientes de confiabilidad, tanto para la
muestra de patrocinadores, lderes de proyecto, analistas de negocio y
desarrolladores como para la muestra de usuarios de negocio son
considerados altos. Nunnally, sugiere, para los tipos de investigacin
exploratorios, los niveles del coeficiente alfa mayores de 0.7 (considerados
altos) [10]. Esto implica que existe asociacin entre los tems del
instrumento con relacin a los constructos que lo constituyen (consistencia
interna) [10] (ver Tabla 1).

Se utiliz el coeficiente de correlacin de Kendall con el propsito de


examinar la relacin entre factores de implementacin, xito de la
implementacin y xito del sistema, que afecta la implementacin exitosa
de un DW [9]. El coeficiente de correlacin tau de Kendall se usa cuando las
variables estudiadas son medidas en escala ordinal y se ordenan por rangos
o jerarquas. La frmula es la ecuacin (2):

Donde;
T (tau) = coeficiente de correlacin de Kendall
S = puntuacin efectiva de los rangos
N = tamao de la muestra en parejas de variables
Solamente se calcularon coeficientes de correlacin para la muestra
administrada a los usuarios de negocio. La muestra de patrocinadores,
lderes de proyecto, analista de negocios y desarrollado-res, no se utiliz
debido a la homogeneidad de la muestra obtenida.
El coeficiente de correlacin es un nmero (entre -1.00 y +1.00 inclusive)
que indica el grado de la relacin entre las dos variables. El signo indica la
direccin de la relacin. Cuando el valor es positivo, significa que existe una
relacin directa entre ambas variables, esto es, si las dos aumentan al
mismo tiempo. El valor negativo indica que la relacin es inversa, es decir,
cuando una variable disminuye a medida que la otra aumenta. Cuando no
hay correlacin entre dos variables el coeficiente de correlacin es 0. Para
interpretar el nivel de asociacin entre dos variables se utiliza el tamao del
coeficiente de correlacin teniendo en consideracin los criterios
establecidos por [11] (ver Tabla 2).

Você também pode gostar