Você está na página 1de 41

CONOCIMIENTOS PREVIOS

Qu diferencia existe entre una estimacin puntal e


intervalica?
Qu distribucin utilizo para construir un IC. Cuando
no se conoce la varianza poblacional?
Cules son los pasos para construir una prueba de
hiptesis?
En un problema determinado como identifico que
estoy en IC. o en una prueba de hiptesis?
Caso de estudio:
RENDIMIENTO ACADMICO EN LA FACULTAD DE NEGOCIOS
INTERNACIONALES EN UPN
El la Facultad de Negocios de UPN se desea determinar si existe asociacin entre el
ciclo de estudios del estudiante y su nivel de nerviosismo frente a una exposicin.
Este es medido por una prueba estndar de nerviosismo y ansiedad. Se elige
aleatoriamente a 400 estudiantes de los tres turnos y se obtienen los siguientes
resultados, considerando un nivel de significacin del 5%

Cules son las variables de estudio?


El ciclo de estudio es igual o diferente al nivel de nerviosismo y ansiedad?
Se podrn relacionar estas dos variables cualitativas
PROBABILIDAD Y ESTADISTICA
Sesin N 12

PRUEBAS NO PARAMETRICAS: PRUEBA


CHI CUADRADO PARA LA
INDEPENDENCIA DE VARIABLES.
PRUEBA DE CORRELACIN DE
ESPEARMAN

Docente:
Dr. Juan Carlos Oruna Lara
LOGRO DE APRENDIZAJE

Al finalizar la sesin, el estudiante ser


capaz de determinar la prueba Chi
cuadrado para la independencia de
variables y la prueba de correlacin de
Spearman con informacin obtenida de
muestras relacionadas.
PRUEBA DE NO PARAMETRICA

En Una prueba no paramtrica es una prueba de hiptesis que no requiere que la


distribucin de la poblacin se caracterice en funcin de determinados
parmetros. Por ejemplo, numerosas hiptesis se basan en el supuesto de que la
poblacin sigue una distribucin normal con los parmetros y . Las pruebas no
paramtricas no tienen este supuesto, de modo que son tiles cuando sus datos
sean firmemente no normales y resistentes a transformaciones.
Sin embargo, las pruebas no paramtricas no estn completamente exentas de
supuestos sobre los datos. Por ejemplo, las pruebas no paramtricas requieren
que los datos sean una muestra aleatoria independiente

Por ejemplo, los datos sobre salarios son altamente asimtricos a la derecha,
debido a que muchas personas devengan salarios modestos y pocas personas
devengan salarios ms cuantiosos. Usted puede utilizar pruebas no paramtricas.
PRUEBAS NO PARAMTRICAS

Son pruebas no paramtricas cuando:


Se trata de variables cualitativas.
Se trata de variables cuantitativas,
con menos de 30 datos y no
provienen de una curva normal.
Cuando son seis o menos datos.
Algunos indican 11 o 20 datos.
ELECCIN DE LA PRUEBA NO PARAMETRICA

Chi cuadrado
1 muestra Cuantitativa y cualitativa
Binomial

U de mann
independientes Cuantitativa
Whitney

2 muestras Cuantitativa Wilcoxon


Relacionadas
Cualitativa Mc Nemar

independientes Cuantitativa Kruskal Wallis

Ms de 2
muestras Cuantitativa Friedman
Relacionadas

Cualitativa Q de Cochran
PRUEBA DE INDEPENDENCIA PARA DOS VARIABLES

Estamos interesados en determinar si dos cualidades o


variables referidas a individuos de una poblacin estn
relacionadas.
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:

Las Hiptesis nula y alternativa:

H0: Las variables son independientes entre s


H1: Las variables no son independientes entre s
DEFINICION:

o Supongamos que de n elementos de una poblacin se han observado


dos caractersticas X e Y, obtenindose una muestra aleatoria simple
bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn).
o Se desea conocer si la base de dichas observaciones al contrastar si las
caractersticas poblacionales X e Y son independientes o no.
o Teniendo la siguiente tabla de contingencia:
A (i=1,2,,r) filas ; B(j=1,2,,k) columnas; n=tamao de muestra.
Pasos para dar solucin a una prueba de independencia:

1 Formular las hiptesis:


Ho: las variables son independientes.
H1: las variables no son independientes.

2 Estadstico de prueba calculado:

3 Ji cuadrado calculado:

4 Regla de decisin:
Si el estadstico de prueba calculado es mayor que el valor de ji cuadrado en
tabla, entonces rechazamos la hiptesis nula y se concluye que ambas variables
son dependientes o estn relacionadas.
APLICACIN

1. Para estudiar la dependencia entre la prctica de algn deporte y


la depresin, se seleccion una muestra aleatoria de 100 jvenes,
con los siguientes resultados:
Sin depresin Con depresin
Deportista 38 9
No deportista 31 22

Determinar si existe independencia entre la actividad del


sujeto y su estado de nimo. Con un nivel de significacin
(5%)
APLICACIN

2. Un estudio que se realiz con 81 personas referente a la relacin


entre la cantidad de violencia vista en la televisin y la edad del
televidente produjo los siguientes resultados

16-34 34-55 55 o mas


Poca violencia 8 12 21
Mucha violencia 18 15 7

Indican los datos que ver violencia en la televisin depende


de la edad del televidente, a un nivel de significacin del 5%?
Ejemplo

El departamento medico de una universidad estudia el nivel de efectividad de tres remedios para
la alergia: R1, R2 y R3. Cada remedio se suministro a 60 profesores. Los resultados del
experimento se dan en la tabla que sigue:

Efectividad Remedio para la alergia


R1 R2 R3
Sin alivio 10 20 15
Cierto alivio 40 30 20
Alivio total 10 10 25

Podemos concluir al nivel de significancia 0,01, que los tres remedios para la alergia son
igualmente efectivos?
Ejemplo

Una sociloga quiere determinar si hay alguna relacin entre el tamao de la familia y el nivel de
educacin del padre. Para esto, escogi una muestra de 500 hogares y los clasifico de acuerdo con
dos criterios: por el tamao de la familia y por el nivel de educacin. Las frecuencias observadas
estn registradas en la tabla. se puede concluir al nivel de significancia de 0,05 que el tamao de
la muestra de la familia es independiente del nivel de educacin del padre?

Nivel de Nmero de hijos


educacin
Menos de 3 De 3 a 5 Mas de 5
Primaria 40 90 70
Secundaria 50 60 60
Superior 60 50 20
QU HEMOS APRENDIDO HOY?

CMO RESOLVER PROBLEMAS


APLICANDO LA DISTRIBUCIN CHI-
CUADRADO

Que son valores observados y


esperados
ANLISIS DE LA VARIANZA PARA UN
FACTOR
Definicin.-
Herramienta mediante la cual la variacin total
presente en un conjunto de datos se distribuye en
varios componentes. Asociada con cada uno de estos
componentes hay una fuente especfica de variacin,
de modo que en el anlisis es posible averiguar la
magnitud de las contribuciones de cada una de estas
fuentes a la variacin total.
La base del ANOVA radica en la particin de las varianzas

En el siguiente cuadro observe:


grupo 1 grupo 2
La diferencia entre los promedios 2 2 6
3 2 7
1 2 5
promedio 2 6
suma 6 18
2
suma de cuadrados (Sx i) 2 2

media general 4
suma total de cuadrados 28
La base del ANOVA radica en la particin de las varianzas

En el siguiente cuadro observe:


grupo 1 grupo 2
La similitud de la suma de cuadrados 2 2 6
al interior de cada grupo 3 2 7
1 2 5
promedio 2 6
suma 6 18
2
suma de cuadrados (Sx i) 2 2

media general 4
suma total de cuadrados 28
La base del ANOVA radica en la particin de las varianzas

En el siguiente cuadro observe:


grupo 1 grupo 2
El contraste con la magnitud 2 2 6
de la suma total de cuadrados 3 2 7
1 2 5
promedio 2 6
suma 6 18
2
suma de cuadrados (Sx i) 2 2

media general 4
suma total de cuadrados 28
La base del ANOVA radica en la particin de las varianzas

En el siguiente cuadro observe:


grupo 1 grupo 2
La diferencia se debe a la 2 2 6
diferencia entre los promedios 3 2 7
1 2 5
promedio 2 6
suma 6 18
2
suma de cuadrados (Sx i) 2 2

media general 4
suma total de cuadrados 28
DEP VAR: VALOR N: 6 MULTIPLE R: 0.926 SQUARED MULTIPLE
R: 0.857

ANALYSIS OF VARIANCE

SOURCE SUM-OF-SQUARES DF MEAN-SQUARE F-RATIO P

GRUPO 24.000 1 24.000 24.000 0.008

ERROR 4.000 4 1.000

Se observa que la suma total de cuadrados (28) fue dividida


en una variabilidad dentro de grupo (2+2=4) y una variabilidad
debida a las diferencias entre promedios (28-(2+2)=24).
Suma de cuadrados del error (SCError) y
Suma de cuadrados de efectos (SCEfecto)

La suma de cuadrados dentro de grupos tambin se le


llama Varianza del Error. Denota el hecho de que es
una fraccin de la varianza que no podemos explicar
con el diseo elegido.
Podemos explicar la fraccin de varianza en la
SCEfecto.
PRUEBAS DE SIGNIFICANCIA

En el anlisis de varianza, la realizacin de pruebas de


significancia se basa en una comparacin de la varianza
debida a la variabilidad ENTRE GRUPOS (CMEfecto)
y a la variabilidad DENTRO DE GRUPOS (CMError).

Bajo la hiptesis nula, an puede haber pequeas


fluctuaciones en la media de dos grupos, especialmente
si las muestras son pequeas, por lo tanto, de acuerdo
con esta hiptesis, la variabilidad en ambas fuentes
debera ser ms o menos la misma.
La prueba de F, evala la tasa de las estimaciones de
ambas varianzas para determinar si es significativamente
mayor que uno.
1. Modelo. El modelo consiste en una representacin
simblica de un valor tpico tomado de los
datos que se estn analizando.
2. Supuestos. Se especificarn las suposiciones que
fundamentan el modelo.
3. Hiptesis. Se indicarn las hiptesis que pueden
probarse de acuerdo al modelo.
4. Clculos. Clculos aritmticos apropiados.
5. Tabla de ANOVA. Resumen de los clculos
aritmticos
6. Decisin. Decisin estadstica acerca del rechazo
o aceptacin de la hiptesis nula.
Peso final
m

s2
Yi Yi Yi
Yi
Yi Yi Yi Yi
Yi Y
Yi Yi i
Yi Yi
Yij Yij Yij
Yij
Yij Yij Yij Yij
Yij Y
Yij Yij ij
Yij Yij
Modelo lineal de explicacin de los
componentes de varianza.

Yij= m + ai +eij
Yij: observacin individual
m: media general
ai: efecto del i simo grupo (i=1,2)
e: error residual inexplicado
Una representacin diagramtica del
Anlisis de varianza

Media del
grupo A2
A2

A1
m
Media A3
general Desviacin
individual
Efectos fijos versus efectos aleatorios

Efectos fijos Efectos aleatorios

escogidos En este caso los tratamientos


especficamente son una muestra al azar de
por el experimentador. una poblacin mayor de
tratamientos posibles.
Para probar hiptesis
acerca de los promedios En esta situacin interesa
de los grupos. extender las conclusiones
a todos los tratamientos
Las conclusiones se posibles, hayan sido
aplican considerados explcitamente
slo a los niveles del o no.
factor
considerado en el anlisis
y no a tratamientos
similares
que no fueron
considerados
Anlisis de varianza de un factor (efectos fijos)
Datos:
observaciones Media
Grupo 1 Y11 Y12 .... Y1n m + A1
Grupo 2 Y21 Y22 .... Y2n m+ A2
. . . . .
Grupo k Yk1 Yk2 .... Ykn m + Ak

donde
Modelo Lineal
Yij= observaciones
Yij= m Ai + eij m = media general
Ai = desviaciones del i-simo
i=1,...k; j=1,...n grupo desde la media
general
eij = error residual inexplicado
Hiptesis= H0: no hay diferencia entre las medias, Ai= 0
H1: existen diferencias entre medias de grupos

Notacin

n
Yi.=SYij = suma de los observaciones individuales j dentro
j=1 de cada grupo, desde j=1 hasta n (el total de
cada grupo)

n k
Y..=S S Yij = gran total, suma de observaciones, primero
j=1 i=1
dentro de grupos y luego a travs de grupos,
desde i=1 hasta k (total de grupos)
Calculo de ANOVA simplificado (efectos fijos)

Fuente de grados de suma de cuadrado F


Variacin libertad cuadrados medio
k
Si=1
entre (Yi.)2 (Y..)2 SCG CMG
grupos k-1
n N k-1 CMR
dentro de
grupos N-k por diferencia SCR
(residual) N- k
(Y..)2
Total N-1 Y2.. - ( N )
N= nk

SCG= suma de cuadrados de grupos


SCR= suma de cuadrados residual
CMG/CMR= cuadrado medio grupos/cuadrado medio residual
Suponga que 30 pollitos de un da fueron asignados al azar a tres
grupos, en cada uno de ellos se adicion un antibitico promotor del
crecimiento diferente, A, B, y C. Al termino de la recra los pesos de
los pollitos fueron los siguientes (en gramos):
ANTIBIOTICO
A B C
72 78 85
70 76 83
74 73 80
73 75 79
73 74 80
71 74 82
73 75 89
71 76 76
75 70 79
70 75 83
Promedio 72.2 74.6 81.6

Hiptesis nula: no hay diferencias entre los promedios


de los grupos, equivalente a: los efectos de los grupos
son iguales a cero.
A B C
72 78 85
70 76 83
74 73 80
73 75 79
73 74 80
71 74 82
(Y..)2 73 75 89
= 173888.53
71 76 76
N 75 70 79
70 75 83
Yi. 722 746 816 Y.. = 2284
Y2i. 52154 55692 66706 Y2.. = 174552

Suma de cuadrados Totales= Suma de Cuadrados + Suma de Cuadrados


de tratamientos del error

El total de la varianza est representado por la suma de cuadrados totales,


que se divide o reparte en las causas de variacin identificadas en el
diseo: variacin entre tratamientos o grupos y variacin dentro de grupos.
Calculo de ANOVA simplificado (efectos fijos)

Fuente de grados de suma de cuadrado F


Variacin libertad cuadrados medio
238.5
entre 174365.6-173888.53 477.07 6.91
grupos 2
477.07 2
238.5 34.5
dentro de
grupos 27 por diferencia 186.6
(residual) 186.4 27 6.91
174552 - 173888.53
Total 29
663.47

N= nk

SCG= suma de cuadrados de grupos


SCR= suma de cuadrados residual
CMG/CMR= cuadrado medio grupos/cuadrado medio residual
BIBLIOGRAFA BSICA:

Estimado estudiante, puedes revisar los siguientes textos que se encuentran en


tu biblioteca:

Nro. CDIGO AUTOR TTULO AO

519.2 PROBABILIDAD Y ESTADSTICA PARA


1 SCHEAFFER Mc. CLAVE 2005
SCHE INGENIERA

519.5 ESTADSTICA PARA


2 LEVINE-KREHBIEL-BERENSON 2006
LEVI/P ADMINISTRACIN.

WILLIAM W. HINES
519.2 DOUGLAS C. MONTGOMERY PROBABILIDAD Y ESTADSTICA PARA
3 2011
HINE DAVID M. GOLDSMAN INGENERIA
CONNIE M. BORROR
Jams desesperes, an estando en las mas sombras aflicciones. Pues de las nubes
negras, cae agua limpia y fecundante
Annimo

Você também pode gostar