Escolar Documentos
Profissional Documentos
Cultura Documentos
ndi ce
Introduccin:........................................................................ ....................................... .... 4 Objetivos....................................................................................................................... 4 General: .................................................................................................................... 4 Especficos:............................................................................................................... 4 Estrategias de Estudio............................................................................................... 6 Metodologa a emplearse en el desarrollo del mdulo ................................................. 6 Evaluacin y Acreditacin............................................................................................ 7 UNIDAD 1: Revisin de Estadstica Descriptiva. ........................................................ 8
2 1.1 Variables ................................................................................................................. 8 Una variable es una propiedad o caracterstica que puede variar y esta variacin es susceptible de medicin................................................................................................ 8 1.2 Distribucin de frecuencias, medidas de centralizacin y dispersin para datos no agrupados:................................................................................................................ 9 1.2.1 Frecuencias de datos no agrupados: ................................................................ 9 1.2.2 Medidas de centralizacin ................................................................................. 9 1.2.3 Medidas de dispersin: .................................................................................. 11 1.3 Distribucin de frecuencias, medidas de centralizacin y dispersin para datos agrupados:................................................................................................................... 12 1.3.1. Frecuencias de datos agrupados: ................................................................. 12 1.3.2 Medidas de centralizacin ............................................................................. 13 1.3.2 Medidas de dispersin ..................................................................................... 16 1.4 Medidas de Posicin ............................................................................................ 17 1.5 Grficos: Diagramas de barras, grfico de lneas, circular o de pastel, histogramas y polgonos de frecuencias ..................................................................... 20 Cuadro Resumen 1: .................................................................................................... 21 Cuadro Resumen 2: PRINCIPALES MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS Y NO AGRUPADOS........................................................................ 22 Actividad 1: ................................................................................................................... 23 Auto evaluacin 1.......................................................................................................... 23 UNIDAD 2: TEORA DEL MUESTREO .................................................................. 24 2.1 Generalidades de la estadstica inferencial .......................................................... 24 2.2 Variables normalizadas y no normalizadas ........................................................ 24 2.2.1 Variable normalizada................................................................................... 24 2.2.2 Escalas ........................................................................................................... 24 2.3 La curva normal .................................................................................................... 25 2.3.1 Frmula y propiedades de la curva normal .................................................. 25 2.3.2 reas bajo la curva normal .......................................................................... 26 2.3.3 Lectura de la tabla........................................................................................ 27 2.3.3.1 Dado el valor de z hallar el rea ............................................................... 27 2.3.3.2 Dado el rea hallar el valor de z ............................................................... 28 2.4 Muestreo ............................................................................................................. 29 2.4.1 Poblaciones y muestras................................................................................ 30 2.4.1.1 Tipos de muestras ........................................................................................... 30 2.4.1.2 Frmulas para calcular el tamao de la muestra........................................ 31 Actividad 2..................................................................................................................... 33 Auto evaluacin 2.......................................................................................................... 34
3 UNIDAD 3: PLANTEAMIENTO ............................................................................... 35 DE HIPOTESIS ............................................................................................................ 35 3.1 Planteamiento de hiptesis, variables .................................................................. 35 3.1.1 Variables ...................................................................................................... 36 3.2 Tipos de hiptesis ................................................................................................ 36 3.2.1 Hiptesis de investigacin ( H i ). .................................................................. 36 3.2.2 Hiptesis nulas y alternativas ....................................................................... 37 3.2.3 Hiptesis estadsticas ................................................................................... 38 Actividad 3..................................................................................................................... 40 Auto evaluacin 3: ........................................................................................................ 40 UNIDAD 4: PRUEBA DE HIPTESIS ..................................................................... 41 4.1 Errores de tipo I y de tipo II ............................................................................... 41 4.2 Nivel de significacin y nivel de confianza........................................................ 42 4.3 Pasos para la prueba de hiptesis y Tcnicas Estadsticas ................................. 42 4.3.1 z normalizado .............................................................................................. 42 4.3.2 t-student ....................................................................................................... 48 4.3.3 Prueba de diferencia de proporciones.......................................................... 51 4.3.4 Chi cuadrado ( 2 ) ................................................................................... 53 4.3.5 La correlacin ............................................................................................... 56 Actividad 4..................................................................................................................... 61 Auto evaluacin 4: ........................................................................................................ 62 Bibliografa ................................................................................................................. 63 Anexo 1 .......................................................................................................................... 64 Anexo 2 .......................................................................................................................... 65 Anexo 3 .......................................................................................................................... 66 Anexo 4 68
Introduccin:
La Estadstica ocupa un lugar importante dentro de la vida cotidiana en diversas reas. La educacin y la investigacin son sl dos de los muchos ejemplos que podramos citar. En este contexto, se hace imprescindible el conocimiento tanto de la Estadstica Descriptiva como Inferencial. Adems, con el avance de la tecnologa se han desarrollado herramientas de software que nos facilitan el trabajo y nos ahorran tiempo. Por tal motivo, se ha preparado este mdulo tratando de resumir los aspectos ms importantes, los que sern de mucha utilidad al momento de presentar resultados o probar una hiptesis en una investigacin, as como la utilizacin de la hoja electrnica Excel y el paquete estadstico GSTAT para que nos ayuden en el tratamiento y presentacin de la informacin. Esperamos que el mdulo, le sea de mucha ayuda y auguramos xito en el desarrollo de este y los posteriores eventos.
Objetivos
General:
Proporcionar los elementos tericos y de software para el manejo de la Estadstica Descriptiva e Inferencial necesarios para la organizacin, presentacin y anlisis de datos, as como el tratamiento de hiptesis estadsticas.
Especficos:
v Recordar los elementos bsicos de la Estadstica Descriptiva as como
estrategias para su aprendizaje. v Conocer los elementos ms importantes de la teora de muestreo y su aplicacin en investigaciones reales. v Proporcionar las herramientas estadsticas indispensables para la prueba de hiptesis de manera que puedan ser aplicados posteriormente en sus trabajos de graduacin..
5 v Conocer las principales herramientas que proporcionan la hoja electrnica Excel y el paquete GSTAT en cuanto a la estadstica descriptiva e inferencial.
Estrategias de Estudio
& Lea detenidamente los contenidos de cada tema. & Para la unidad I, compare los resultados obtenidos en el mdulo, con los que usted va a obtener en la clase prctica utilizando el computador. & Revise con cuidado los ejercicios resueltos, fijndose en cada paso realizado, luego reptalos recordando los pasos establecidos. & Resuelva los ejercicios propuestos tomando como base la teora y los ejercicios resueltos.
La ESTADSTICA INFERENCIAL es la encargada de estudiar los PARMETROS que son las estadsticas de la poblacin o universo, stos generalmente no se calculan pero son inferidos de los estadgrafos (con un grado de error o nivel de significacin).
normalizadas
no
Una distribucin de datos puede tener medias y desviaciones estndar diferentes, este problema se puede solucionar transformando los datos medias y desviaciones idnticas; es decir, transformando los valores brutos en valores estandarizados. Las distribuciones de calificaciones estndar tienen valores fijos paras las medias ( ) y las desviaciones estndar (); as: La distribucin de calificaciones z tienen valores fijos = 0 y = 1. La distribucin de calificaciones de CI (coeficiente intelectual) de Wechsler tiene como valores = 100 y = 15.
2.2.2 Escalas
En estadstica, como vimos antes se puede hablar de muchas escalas, pero en la prctica se utilizan especialmente dos: la no normalizada y la normalizada.
9 Es un puntaje o una nota que se obtiene en la realidad, por ejemplo en una prueba. La representacin de estos puntajes se lo hace sobre una recta real donde tenemos la media aritmtica y los puntajes no normalizados.
2) Un estudiante de cuarto ao de Ciencias Exactas de la ESPOCH tiene en lgebra 16 donde la X = 15 y s = 2; y tiene en Fsica 15 donde X = 14 y s = 2,2. Decir en cual de las dos asignaturas est mejor ubicado. Como dicha puntuacin est expresado en dos escalas diferentes, estadarizamos las escalas a puntuaciones z, as: Tipificamos 16: z = 16 15 2 = 0.5 , significa que el valor 16 est en la escala
normalizada z a 0.5 unidades 15 14 de la media que es cero. Tipificamos 15: z = 2.2 = 0.45 , significa que el valor 15 est en la escala normalizada z a 0.45 unidades de la media que es cero. En consecuencia, el mencionado estudiante est mejor ubicado en lgebra.
1 2 e Y=
z 2
x , donde z =
Algunas propiedades de la curva normal son: La curva es simtrica al eje vertical. La media, la mediana y el modo coinciden con el centro y valen cero, y cada unidad es una desviacin estndar. La grfica de la curva normal tiene la forma de una campana y su rea total bajo la curva es 1. Veamos algunos valores de z con su porcentaje correspondiente de rea: valor de z en rea bajo la curva (-1,1) 68.27% (-2,2) 95.45% (-3,3) 99.73% El vrtice de la curva tiene coordenadas (z = 0, y = 0.4) La curva normal o distribucin muestral es terica; aunque en la prctica las distribuciones de muchas variables de las ciencias sociales se aproximan a una distribucin normal. Esta distribucin es la ms importante en estadstica.
NOTA. El teorema del LIMITE CENTRAL manifiesta que aunque la distribucin de la poblacin de origen no sea normal la distribucin muestral de medias se aproxima a la normalidad conforme n se incrementa.
bajo
la
curva
Dado un valor de z se puede hablar de: 1. rea en (-z, +z) (zona de aceptacin de la hiptesis nula en un ensayo a dos colas) 2. rea fuera de (-z, +z) (zona de rechazo de la hiptesis nula en un ensayo a
dos colas)
3. rea hasta z (zona de rechazo de la hiptesis nula en un ensayo a una cola (cola izquierda)) 4. rea hasta z (zona de aceptacin de la hiptesis nula en un ensayo a una cola (cola derecha)) 5. rea despus de z (zona de rechazo de la hiptesis nula en un ensayo a una cola (cola derecha))
de
la
NOTA. En el caso anterior de un ensayo a una cola el rea acumulada es de 0.95, esto significa que al valor crtico de z = 1.6 le corresponde el percentil 95. Esto es, el rea acumulada es correspondiente a un percentil de la distribucin. Ejemplo 2 1. En un curso de 17 estudiantes se tiene: X = 15 y s = 2. a) Qu porcentaje y cuntos estudiantes obtienen ms de 16?. b) Qu porcentaje y cuntos estudiantes estn bajo 13?. c) Encontrar el nmero de estudiantes que tiene de 12 a 17 Respuesta 16 15 a) Tipificamos el 16: z = = 0.5 2 En la tabla del anexo 1 vemos a la izquierda 0.5 y arriba 0, el valor que se obtiene es 0.1915. Significa que desde el centro hasta el valor tipificado de z = 0.5 hay un rea de 0.1915, luego, restamos de 0.5 y se obtiene: 0.5 0.1915 = 0.3085, que es el rea que falta en la cola derecha. Lo que significa que el 30.8% de estudiantes est sobre la nota de 16; es decir:
100% 30.8%
17 x luego, x =
13 15 b) Tipificamos el 13: z = 2 = -1 En la tabla del anexo 1 vemos a la izquierda 1.0 y arriba 0, el valor que se obtiene es 0.3413. Significa que desde el centro hasta el valor tipificado de z =-1 hay un rea de 0.3413, luego, restamos de 0.5 y se obtiene: 0.5 0.3413 = 0.1587. Lo que significa que el 15.8% de estudiantes est bajo la nota de 13; es decir: 100% 15.8% 17 x luego, x = 15.8(17)
100 = 2.68 , es decir, 2 a 3 estudiantes estn bajo 13. 17 15 c) Tipificamos el 17: z = 2 =1 En la tabla del anexo 1 vemos a la izquierda 1 y arriba 0, el valor que se obtiene es 0.3413. Significa que desde el centro hasta el valor tipificado de z = 1 hay un rea de 0. 3413 12 15 Tipificamos el 12: z = 2 = 1.5 En la tabla del anexo 1 vemos a la izquierda 1.5 y arriba 0, el valor que se obtiene es 0.4332. Significa que desde el centro hasta el valor tipificado de z = -1.5 hay un rea de 0.4332 a la izquierda del centro. Sumando las dos reas se tiene : 0.3413+0.4332 = 0.7745. Luego, el 77.45% de datos estn entre 12 y 17. Hallamos cuantos son: 100% 77.45% 12 a 17. 17 x 77.45(17) 100 luego, x = = 13 , es decir, 13 estudiantes tienen puntajes de
3) Si se da el rea anterior al valor positivo de z , se trata del nivel de confianza 1- en un ensayo a una cola. As, si 1- = 0.95, se resta 0.5, esto es 0.45, se localiza este valor en el interior de la tabla y vemos que a la izquierda est 1.6 y arriba 5, luego, z = 1.65 4) Si se da el rea que sigue al valor positivo de z , se trata del nivel de significacin ( ) en un ensayo a una cola. As, si = 0.05, el rea desde el centro hasta el valor positivo de z es 0.45, se localiza este valor en el interior de la tabla y vemos que a la izquierda est 1.6 y arriba 5, luego, z = 1.65
2.4 Muestreo
Si se pudiera trabajar con todos los elementos de una poblacin, no cabra la estadstica inferencial, porque directamente se calcularan los parmetros de dicha poblacin. Pero muy a menudo se trabaja solamente con muestras de dicha poblacin, muestras que deben ser elegidas de modo probabilstico (principio de aleatoriedad), de tal manera que todos los elementos de la poblacin tengan la misma posibilidad de ser elegidos. Pero dicha seleccin casi nunca se realiza de manera totalmente aleatoria, sino que se utiliza tambin modos no probabilsticos (no aleatorios), buscando al menos el principio de representatividad de la muestra. NOTA. Hay que tener cuidado con los trminos aleatoriedad y representatividad, tenga presente lo siguiente: a) Es preferible una muestra representativa pequea a una muestra grande no representativa. b) A veces se cree que se est tomando una muestra aleatoria cuando en realidad no lo es; as, si se quisiera consultar la opinin a los ciudadanos de Chimborazo sobre sus preferencias para elegir prefecto y se encuesta a las 10 de la maana a una muestra al azar por telfono, esta muestra no es representativa porque contestaran nicamente las personas que estn a esa hora en la casa y no opinaran estudiantes, docentes y otros profesionales que no tienen telfono en ese momento ni personas del permetro rural sin telfono. Estos resultados no
Aleatoria Simple: En la que sus elementos han sido selelccionados por procesos aleatorios Estratificada: Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica.
Probabilstica
Todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos
Por conglomerados: La unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos.
Casual : Se seleccionan a los n primeros elementos necesarios para la muestra, que sean de fcil acceso. (Voluntarios) Intencional : Se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" incluyendo a grupos supuestamente tpicos. (Expertos) Por Bola de nieve: Se localiza a algunos de los elementos muestrales los que conducen a otros y stos a otros hasta completar la muestra.
No probabilstica
No todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.
Por cuotas: En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones y se eligen los primeros que se encuentren.
Cmo se seleccionan los elementos muestrales para una muestra probabilstica? Las dos formas probabilsticas principales son: a) Procesos Aleatorios simples (Tmbola).- Se numeran los elementos muestrales del 1 al N, se hacen fichas una por cada elemento, se las revuelve en una caja y se sacan n fichas, estos elementos conformarn la muestra. b) Seleccin sistemtica de elementos muestrales.- Es muy til y fcil, se selecciona dentro de una poblacin N una muestra de n elementos a partir de un intervalo K, siendo N K= n . Ejemplo 4. Supongamos que la poblacin est formada por 90 colegios y se tiene N que elegir una muestra de 15 colegios. Se numeran los colegios del 1 al 90, como K = n = 90 15 = 6, entonces, se eligen los colegios numerados, por ejemplo, con 1,7,13, ...hasta completar los 15.
a)
n=
Np q
2
(N 1)
dond e n = tamao de la muestra N = tamao del universo (o de la poblacin) p = probabilidad de ocurrencia (homogeneidad del fenmeno, generalmente p = 0,5) q = 1-p = probabilidad de no ocurrencia ME = margen de error o precisin admisible con que se toma la muestra (generalmente se elige del 0,01 al 0,15) NC = nivel de confianza o exactitud con que se infieren los resultados (valor terico del normalizado z en un ensayo a dos colas) ; por ejemplo: Si ME = 0. 3174; o sea al 68.26% de confianza, NC = 1 Si ME = 0.15; o sea al 85% de confianza, NC = 1.44 Si ME = 0.1336; o sea al 86.64% de confianza, NC = 1.50 Si ME = 0.10; o sea al 90% de confianza, NC = 1.64 Si ME = 0.05; o sea al 95% de confianza, NC = 1.96 (el ms usual) Si ME = 0.03; o sea al 97% de confianza, NC = 2.17 Si ME = 0.01; o sea al 99% de confianza, NC = 2.57 Si ME = 0.0026; o sea al 99.7% de confianza, NC = 3 NOTA.- Para que el nivel de confianza sea NC=2 (constante) como dicen algunos libros, el margen de error debe ser ME= 0.055 b) n = M E 2 ( N 1 ) + 1 d N
M E N C 2
+ pq
o n d e n = t a m a o d e l a m u e s t r a N = t a m a o d e l a p o b l a c i
n ME = margen de error o precisin admisible NOTA. Cundo se puede obtener la frmula b de la frmula a? En poblaciones denominadas infinitas (ms de 5.000; cuestionarios entre 20 y 40 preguntas de preferencia cerradas de respuestas mutuamente excluyentes, por ejemplo: si, no; muy bueno, bueno, regular, malo; etc), se puede utilizar la siguiente frmula:
2
NC pq c) n = dond e:
2
ME
n = Tamao de la muestra p = Probabilidad de ocurrencia (homogeneidad del fenmeno, generalmente p = 0.5) q = 1-p = Probabilidad de no ocurrencia ME = margen de error o precisin admisible NC = nivel de confianza o exactitud (expresado como el valor terico (en un ensayo a dos colas ) del normalizado z que determina el rea de probabilidad buscada); es decir , idntico al literal a). NOTA. Cuando la poblacin es igualmente grande y no se conoce exactamente N, algunos investigadores utilizan la c) de la siguiente manera: Z d) n = E 2 Donde: Z es el nivel de confianza con que se generaliza a la poblacin (NC) E es el margen de error o precisin con que se toma la muestra (ME) poblacional que se expresa en trminos de la probabilidad de la es la varianza variabilidad del fenmeno (mxima variabilidad = 0.5)
2 2 2
(similar a la c))
Actividad 2
EJERCICIO 1 1) Un estudiante de cuarto semestre de Ciencias Exactas de la UNACH tiene en lgebra 8 donde la X = 7.5 y s = 1.2; y tiene en Fsica 9 donde X = 7 y s = 1.1. En cual de las dos asignaturas est mejor ubicado?. 2) Suponiendo que unas puntuaciones se distribuyen normalmente y que = 60 y = 8. En esta distribucin un estudiante tiene una nota de 65. Transforme a escala z. EJERCICIO 2. Suponiendo que se trata de un ensayo a dos colas 1) Si = 0.08 (92% de confianza), hallar z. 2) Si = 0.12 (12% de significacin), hallar z. EJERCICIO 3: En un curso de 15 estudiantes se tiene: X = 7.8 y s = 1.2. a) Qu porcentaje y cuntos estudiantes obtienen ms de 7?. b) Qu porcentaje y cuntos estudiantes estn bajo 6?. c) Encontrar el nmero de estudiantes que tiene de 6 a 8. d) Encontrar el porcentaje y el nmero de estudiantes que tienen de 8 a 10. e) Realizar todos los literales anteriores utilizando Excel y compare los resultados.
EJERCICIO 4: En un centro escolar de 1.200 estudiantes, hay 100 estudiantes en la seccin PRE bsica, 800 en la seccin bsica, 300 en la seccin Bachillerato. Se desea estudiar el nmero de estudiantes que aprueban todas las asignaturas, se sabe que puede haber diferencias entre los distintos niveles educativos, por lo que es de inters para el estudio que en la muestra estn representadas todas las secciones. a) Qu tamao de muestra sugiere con un error del 5%? b) Cuntos estudiantes de cada seccin se deben incluir para que la muestra sea significativa? c) Si se desea una muestra ms pequea que la obtenida en el literal a) Qu margen de error considera se debera usar?
Auto evaluacin 2
Diga si son verdaderos o falsos los siguientes enunciados: a) La curva normal es simtrica respecto al eje y. b) La media en la curva normal es 1 y la desviacin estndar es 0. c) Bajo la curva normal el 68.27% de los datos se encuentra a una desviacin estndar de la media. d) Una muestra es no probabilstica cuando todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.
3.1.1 Variables
Qu es una variable?. Es una propiedad o cualidad (de la realidad) que puede variar y esta variacin es susceptible de medicin por medio de indicadores. NOTA. Pueden haber hiptesis que tericamente sean muy valiosas pero que no se puede probar en la realidad. Ej. El alma de un nio es ms blanca que la de un adulto
Pueden involucrar una sola variable.- Sealan la presencia de cierto fenmeno en una
poblacin. Ej.1. El porcentaje de votantes por el candidato N.N ser superior al 70%.
Para hablar de variable independiente y variable dependiente es necesario que la hiptesis sea causal. NOTA.- Una hiptesis correlacional se puede probar con Chi cuadrado y se puede medir la magnitud de la correlacin entre las dos variables con el coeficiente de correlacin de Pearson o de Spearman. c) Hiptesis de la diferencia entre grupos.- Se utilizan cuando se comparan grupos, en estudios experimentales y cuasiexperimentales. Ej.1. Hay diferencia de percepcin entre los que miran en blanco y negro y los que miran a colores un determinado comercial. Ej.2. El rendimiento de los alumnos del grupo A es superior al rendimiento de los alumnos del grupo B utilizando metodologas diferentes. NOTA.- Una hiptesis de la diferencia entre grupos se puede probar con: z-normalizado o tstudent o diferencia de proporciones d) Hiptesis que establecen relacin de causalidad .- Estas hiptesis establecen relaciones de causa-efecto entre las variables, pueden ser enunciados condicionales. Ej.1. El divorcio de los padres provoca bajo rendimiento de los hijos. Ej.2. Si la metodologa utilizada en el proceso de enseanza es adecuado, entonces el rendimiento escolar es bueno. NOTA. Cuando la relacin de causalidad en una hiptesis se expresa entre varias variables dependientes e independientes que se relacionan entre s de distintas maneras, es preferible separar en dos o ms hiptesis.
aceptar la de investigacin, pero no siempre es as. Ejemplo 2: No hay diferencia en el rendimiento de los estudiantes de la muestra A y los estudiantes de la muestra B; o tambin El rendimiento de los estudiantes de la muestra A es igual al rendimiento de los estudiantes de la muestra B . b) Hiptesis alternativas ( H
a
investigacin y nula. A veces constituyen otras hiptesis de investigacin adicionales a las originales. Ejemplo 3: De hiptesis de investigacin, nula y dos alternativas: H i : El rendimiento de los estudiantes ES DIFERENTE utilizando las metodologas A y B.
H o : El rendimiento de los estudiantes ES IGUAL utilizando las metodologa A y B H a : El rendimiento de los estudiantes que utilizaron la metodologa A ES SUPERIOR al de los que utilizaron la metodologa B. H a : El rendimiento de los estudiantes que utilizaron la metodologa A ES INFERIOR al de los que utilizaron la metodologa B.
H o : El promedio (1) de rendimiento del grupo A utilizando la metodologa M no difiere del promedio (2) de rendimiento utilizando la metodologa N.
H a : El promedio (1) de rendimiento del grupo A utilizando la metodologa M es superior al promedio (2) de rendimiento utilizando la metodologa N. H : > (simbologa estadstica de la primera hiptesis alternativa (cola derecha))
a 1 2
H a : El promedio (1) de rendimiento del grupo A utilizando la metodologa M es inferior al promedio (2) de rendimiento utilizando la metodologa N. H a : 1< 2 (simbologa estadstica de la segunda hiptesis alternativa (cola izquierda)) NOTA. Estas hiptesis se pueden probar con z-normalizado o t-student. Su estimacin puede hacerse con promedios, mediana, porcentajes. c) Hiptesis estadsticas de correlacin.- Tienen por objeto traducir en trminos estadsticos una correlacin entre dos ( smbolo r) o ms variables (smbolo R) Ej. existe una correlacin significativa entre el coeficiente intelectual (x) y el tiempo para aprender un concepto (y) H i : rxy 0 H : r = 0 (indica que las dos variables no estn correlacionadas)
o xy
NOTA. No hay una regla para decidir cuantas hiptesis debe tener una investigacin; esto mas bien depende del tipo de estudio, deben ser las mnimas necesarias y suficientes para realizar el trabajo. NOTA IMPORTANTE 1. Cuando el investigador plantea hiptesis de investigacin y nula; e hiptesis estadstica de investigacin y nula, se puede hablar de: Modelo Lgico.- Es el enunciado de las hiptesis de investigacin y nula Modelo Matemtico.- Es la expresin matemtica de las hiptesis de investigacin y nula. Modelo Estadstico.- Son las frmulas estadsticas de la correspondiente tcnica a utilizarse, con el respectivo nivel de significacin y el significado de los smbolos. Ejemplo 6: MODELO LGICO H i : El promedio A de rendimiento del grupo A difiere del promedio B de rendimiento del grupo B. H o : El promedio A de rendimiento del grupo A es igual al promedio B de rendimiento del grupo B.
MODELO MATEMTICO H i : A B (simbologa matemtica de esta hiptesis de investigacin (dos colas)) H o : A= B (simbologa matemtica de la hiptesis nula) MODELO ESTADISTICO Si los estadsticos de prueba son los promedios y las varianzas muestrales y conocien do los tamaos de las muestra A y B, la tcnica a utilizarse en la prueba de estas hiptesis es el tstudent. XA XB 2 2 t= A B 1)s (n 1)s 1 + 1 (n A n + n nA +nB 2 B A
se pued e utiliz ar un nivel de signi ficacin = 0.05 NOTA. Ms adelante se indica la forma cmo se realiza la prueba de hiptesis.
Actividad 3
1.- En cada uno de los siguientes casos identifique la clase de hiptesis y luego escriba las hiptesis nulas correspondientes: a) A mayor preparacin del docente mejor nivel acadmico en sus estudiantes b) El rendimiento de los estudiantes del grupo A es superior al rendimiento de los estudiantes del grupo B. c) La media de los alumnos del grupo 1 difiere de 17. 2.- Escriba un ejemplo de hiptesis estadsticas de estimacin y un ejemplo de hiptesis estadsticas de diferencia de medias.
Auto evaluacin 3:
Complete la(s) palabra(s) necesaria(s) para obtener enunciados verdaderos: 1.- Cuando se puede determinar una variable independiente y una variable dependiente se trata de una hiptesis . . . . . . . . . . . . . . . . . . . . . . 2.- Las hiptesis estadsticas son la transformacin de las hiptesis de investigacin, nulas y alternativas en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.- Una hiptesis debe estar lgicamente formulada o estructurada mediante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ., refirindose a situaciones . . . . . . . . . . . . . . . . . . . . . . . de manera sencilla, precisa y clara.
Una vez que se ha realizado el anlisis parcial y dinmico (de los datos descriptivos) de la(s) muestra(s), se hayan calculado los estadgrafos necesarios, se procede a elegir el estadstico ms apropiado para la prueba de la(s)
hiptesis. Las hiptesis planteadas deben ser sometidas a prueba para ver si son apoyadas o refutadas de acuerdo a los resultados de los datos obtenidos. Mientras ms investigaciones apoyen una hiptesis ms credibilidad y validez tendr en el contexto en el que se la plante. Una prueba de hiptesis estadstica es una regla que con base en una hiptesis nula ( H
o
) nos ayuda a decidir si sta se acepta o rechaza. Generalmente, en educacin, la prueba de hiptesis se realiza: a) Cuando se analiza alguna caracterstica (rendimiento por ejemplo) de dos muestras; b) Cuando se analiza el rendimiento de un grupo al que se le ha aplicado dos metodologas diferentes y se quiere establecer que una de ellas es mejor que la otra ( H a ); c)Cuando se quiere ver si el rendimiento entre dos grupos de alumnos de diferentes colegios es el mismo ( H o );d) Cuando se analiza por ejemplo caractersticas cuantitativas de un grupo y se compara con algn promedio poblacional hipotetizado ; etc. Se pone a su consideracin con ejemplos ilustrativos las siguientes tcnicas estadsticas para la prueba de hiptesis: z normalizado, t-student, prueba de diferencia de proporciones, Chi cuadrado ( 2 ), los coeficientes de correlacin de Pearson, Spearman y Kendall para ver la correlacin o la concordancia entre variables.
poblacin.
4.3.1 z normalizado
Si el valor de la varianza poblacional 2 es conocido, entonces la estadstica de prueba es la media muestral x . La distribucin muestral es una distribucin normal de puntuaciones z en unidades de desviacin estndar. DEF. Se llama puntuacin z de la distribucin (normal) y se denota con z o simplemente z al valor crtico que separa las reas de rechazo y aceptacin de la hiptesis nula (ver Anexo 1).
t
Para un nivel de significacin del 1% z = 2.57 t El rea entre el centro y el valor terico se obtiene as: 0.5 (0.01)/2 = 0.495. Viendo 0.495 en el interior de la tabla del Anexo 1, encontramos para 0.4949 que es el ms prximo a 0.495, a la izquierda 2.5 y arriba 7; luego, el valor terico es 2.57 Para un nivel de significacin del 5% z = 1.96 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.05)/2 = 0.475. Viendo 0.475 en el interior de la tabla del Anexo 1, encontramos a la izquierda 1.9 y arriba 6; luego, el valor terico es 1.96 Para un nivel de significacin del 10% z = 1.64 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.10)/2 = 0.45. Viendo 0.45 en el interior de la tabla del Anexo 1, encontramos para 0.4495 que es el ms prximo a 0.45, a la izquierda 1.6 y arriba 4; luego, el valor terico es 1.64 En un ensayo a una cola, se tiene:
t t
Hiptesis unidireccional, cola derecha Hiptesis unidireccional, cola izquierda Para un nivel de significacin del 1%
z = 2.33 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.01) = 0.49. Viendo 0.49 en el interior de la tabla del Anexo 1, encontramos para 0.4901 que es el ms prximo a 0.49, a la izquierda 2.3 y arriba 3; luego, el valor terico es 2.33
t
z = 1.64 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.05) = 0.45. Viendo 0.45 en el interior de la tabla del Anexo 1, encontramos para 0.4495 que es el ms prximo a 0.45, a la izquierda 1.6 y arriba 4; luego, el valor terico es 1.64 z = 1.28 Para un nivel de significacin del 10% El rea entre el centro y el valor terico se obtiene as: 0.5 0.10 = 0.4. Viendo 0.4 en el interior de la tabla del Anexo 1, encontramos para 0.3997 que es el ms prximo a 0.4, a la izquierda 1.2 y arriba 8; luego, el valor terico es 1.28 Llamaremos valor calculado de la puntuacin z al valor que se obtiene utilizando una de las frmulas para z; as por ejemplo: En el caso de una muestra A (con una distribucin muestral normal de la poblacin) :
z = x
t t
donde: x es la media aritmtica muestral, es la desviacin tpica poblacional, es la media poblacional o hipotetizada. Luego se ve si z calculado cae en la regin de rechazo o aceptacin de la hiptesis nula. EJEMPLO En una prueba de rendimiento a 40 estudiantes de la FIE se obtiene como promedio x = 7.6, la varianza poblacional es = 1.1. Pruebe que este promedio 7.6 difiere significativamente del promedio poblacional
= 7 con un nivel de significacin del 5%. 1) Planteamiento de las hiptesis H : 7 (El promedio de i rendimiento del grupo es diferente a 7) H o : = 7 (El promedio de rendimiento del grupo es igual a 7) 2) Nivel de significacin = 0.05 3) Criterio Rech si z c z c 1.96 ace la H -1.96 o o Donde 1.96 es el valor terico de z en un ensayo a dos colas con un nivel de significaci es el valor calculado n de de z que se obtiene 0.05, y z c aplicando la frmula:
x z= n
5) Decisin Como el valor de z calculado es mayor al valor de z terico; esto es: z c = 3.441.96 = z t 3.44 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo es diferente a 7.
A
x B respectivamente, y con
2 2
se utiliza la
EJEMPLO
B A n +n
A
En una prueba de rendimiento a los grupos A con n A = 20, y B con n = 18 de la B ESPOCH se han obtenido los siguientes resultados:
x A = 7.9 x B ==7.1 0.9
A = 1.3
B
Pruebe que el rendimiento de los dos grupos es significativamente diferente con un nivel del 0.05 1) Planteamiento de las hiptesis H i : A B (El promedio de rendimiento del grupo A es diferente al promedio de rendimiento del grupo B)
H o : A = B (El promedio de rendimiento del grupo A es igual al promedio de rendimiento del grupo B ) 2) Nivel de significacin = 0.05 3) Criterio Rechace la H
o
si z c -1.96 o z c 1.96
Donde 1.96 es el valor terico de z en un ensayo a dos colas con un nivel de significacin de 0.05, y z c es el valor calculado de z que se obtiene aplicando la frmula: zc = 4) Clculos Reemplazando los datos
x A = 7.9 x = 7.1 B 2 = (0.9)2
xA xB
2 2
A A
+n
B B
= 0.81 A 2 = (1.3) 2 = 1.69 n B = 20 n B = 18 en la frmula correspondiente, se obtiene: xA xB 0.8 7.9 7.1 = 2.18 c = z = = 0.81 1.69 0.3666 18 20 + 2 2 n 5) Decisin Como el valor de z calculado es mayor al valor de z terico; esto es: z c = 2.18 1.96 = z t 2.18 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo A es diferente al promedio de rendimiento del grupo B.
A A A
+n
B B
NOTA. Si en el ejemplo anterior, se pidiera probar que el rendimiento del grupo A es significativamente superior al rendimiento del grupo B con un nivel de significacin del 0.05, entonces se trata de un ensayo a una cola y la prueba de hiptesis se realizara de la siguiente manera. 1) Planteamiento de las hiptesis H i : A > B (El promedio de rendimiento del grupo A es superior al promedio de rendimiento del grupo B) H o : A = B (El promedio de rendimiento del grupo A es igual al promedio de rendimiento del grupo B ) 2) Nivel de significacin = 0.05 3) Criterio Rechace la H
o
si
z c 1.64
Donde 1.64 es el valor terico de z en un ensayo a una cola con un nivel de significacin de 0.05, y z c es el valor calculado de z que se obtiene aplicando la frmula: zc = 4) Clculos Reemplazando los datos
x A = 7.9 x = 7.1 B 2 = (0.9)2
xA xB
2 2
A A
+n
B B
xA xB zc =
7.9 7.1
0.8 =
= 2.18 + 1 . 5 6 9 1 8 Com o el valo r de z calc ulad o es may or al valo r de z teri co; esto es:
0.3666
zc= 2.18 1.64 = zt 2.18 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo A es superior al promedio de rendimiento del grupo B. Si el valor calculado est en la zona de rechazo de la hiptesis nula se rechaza la(s) hiptesis nula(s) y a su vez se acepta la(s) hiptesis de investigacin o viceversa.
4 . 3 . 2 t s t u d e n t
Cuando no se conoce la varianza poblacional, el mejor estadstico de prueba a utilizarse es t-student. DEF. La prueba tstudent sirve para comparar (sobre una variable, por ejemplo rendimiento) la media de una muestra con la media de una poblacin; o evaluar si dos grupos difieren entre s de manera significativa respecto a sus medias. NOTA.Algunos autores recomiendan utilizar t-student en muestras menores que 30, pero se puede aplicar tranquilamente en muestras un poco mayores a 30, cuando la distribucin es aproximadamente normal, siempre que se conozca la desviacin tpica o estndar muestral s. En el caso de
acional = 7.1 1 ) P l a n t e a m i e n t o d e l a h i p t e s i s
d o n d e n 1
s o n
l o s g r a d o s d e l
En un curs i o de 20 b estud iante e s de la r ESP OCH t se ha obte a nido un d prom edio . x = 7.4 y E una desvi J aci n E tpic a s M = 1.2. P Prue be L con un O nivel de signi ficac 1 in del 1% que este prom edio no es signi ficati vam ente difer ente al prom edio pobl
H i : 7.1 (El promedio de rendimiento del grupo es diferente a 7.1) H o : = 7.1 2) Nivel de significacin = 0.01
3) Criterio Rechace H
o
si
t c -2.86 o t c 2.86
Donde 2.86 es el valor terico de t con 19 grados de libertad (ver APNDICE B), y t c es el valor calculado de t que se obtiene aplicando la frmula:
t =
c
x s n1
4) Clculos Reemplazando los datos x = 7.4 s = 1.2 = 7.1 n = 20 en la frmula correspondiente, se obtiene:
t =
c
x s n1
5) Decisin Como el valor calculado de t calculado es 1.09 se encuentra a la izquierda del valor terico que es 2.86, no se puede rechazar la H ; esto es El promedio de rendimiento
o
del grupo no es significativamente diferente a 7.1. En el caso de dos muestras A y B de las que se 2 conocen las medias x A y x B y s y con la hiptesis nula H :
o
B A
respectivamente, las varianzas muestrales 2 A = B. Se utiliza el estadstico t- student, cuyo valor se calcula con la siguiente frmula:
t =
c
A B
(n A 2 + 1)s 1 1 1) (n B s + n B n nA +nB 2
A
+ son los grados nmero de do n A de libertad; n elementos de A, nd n A n B e 2 nmero de elementos de B. Mientras mayor sea el nmero de grados de libertad, la distribucin t se acerca ms a ser una distribucin normal. EJEMPLO 1 En una prueba de rendimiento aplicada a dos grupos A de 20 alumnos que ha utilizado una nueva metodologa, y B de 17 alumnos que ha utilizado una metodologa tradicional, se han obtenido = x = s s A 7.8 B = los siguientes resultados: x 7.2, 1, B = A , 1.2. Pruebe con un nivel de significacin = 0.05 que los promedios son significativamente diferentes. 1) Planteamiento de las hiptesis H i : A B (El promedio de rendimiento del grupo A que ha utilizado una nueva metodologa es significativamente diferente al promedio de rendimiento del grupo B que ha utilizado la metodologa tradicional) H
o
B
: A
= B
( El promedio de
rendimiento del grupo A que ha utilizado una nueva metodologa no es diferente al promedio de rendimiento del grupo B que ha utilizado la metodologa tradicional) 2 )
N i v e l d e s i g n i f i c a d o = 0 . 0 5 3 ) C r i t e r i o
B
es el r terico de t con 35 grados de libertad valo y = 0.05 (ensayo a dos colas, ver Anexo 2), caso t c es el contrario acepte la de valor calculado investigacin. de t que se obtiene aplicando la frmula: t =
c A
x
2
(n A 2 + 1)s 1 1 1) (n B s + n nA +nB 2 B n
A
= 7.8 xA x = 7.2 B s 2 = (1)2 = 1 sA 2 = B (1.2) n = 20 n B = 17 estos datos se reemplazan en la frmula correspondiente del t-student x x A B c t = 2 A 2 B 1)s (n 1)s 1 + 1 (n A B n n nA +nB 2 A + B donde X A = promedio de rendimiento del grupo A s
B A 2
= 1.44
7.8 7.2
B 2
0.6 = 0.13
= (19)1 + (16)1.44 1 1 20 + 17 35
= 4.6
n n
(n 1)s + (n 1)s 1 1 A A B B +
B A
n
A
+n
B
t = 4.6 > t = 2.03, se rechaza la hiptesis nula y se acepta la de investigacin, 5) Decisin t Como c esto es: El promedio de rendimiento del grupo A utilizando una nueva metodologa es significativamente diferente al promedio de rendimiento del grupo B utilizando la metodologa tradicional.
significativamente entre s. La variable de los grupos debe ser medida en proporciones o porcentajes. Se aplica la siguiente frmula de puntuacin z para proporciones:
p1 p 2 z = p1q 1 p 2 q 2 n + n
1 2
donde: p proporcin del primer grupo y n el nmero de sus elementos p1 proporcin del segundo grupo y 1n el nmero de sus elementos 2 2 q1 = 1 p1 q =1p
2 2
EJEMPLO En una prueba de rendimiento a dos grupos A y B de 30 y 27 alumnos respectivamente, se obtuvieron los siguientes resultados: Grupo A: porcentaje del 68% de muy buenos de un total de 30 estudiantes Grupo B: porcentaje del 40% de muy buenos de un total de 27 estudiantes Pruebe que el porcentajes de muy buenos del grupo A es significativamente superior a porcentaje de muy buenos del grupo B.
1) Planteamiento de las hiptesis H : > (El porcentaje de muy buenos del grupo A es mayor que el del grupo B)
i 1 2
H o : 1 =2 (No hay diferencia entre los porcentaje de muy buenos del grupo A y del grupo B) 2) Nivel de significacin = 0.05 3) Criterio Rechace la H
o
si
z c 1.64
Donde 1.64 es el valor terico de z en un ensayo a una cola con un nivel de significacin de 0.05, y z c es el valor calculado de z que se obtiene aplicando la frmula: p1 p 2 z = p1q 1 p 2 q 2 n + n 4) Clculos
1 2
Reemplazando los datos p1 = 0.68; q 1 = 1- 0.68 = 0.32; n 1 = 30; p 2 = 0.4; q 2 = 1 - 0.4 = 0.6; n = 27
2
5) Decisin Como el valor de z calculado es mayor al valor de z terico; esto es: z c = 2.2 1.64 = z t 2.2 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El porcentaje de muy buenos del grupo A es significativamente mayor que el del grupo B.
La se calcula utilizando una tabla cruzada de dos dimensiones, cada dimensin contiene una variable y cada variable se subdivide a la vez en dos o ms categoras. El 2 donde
2
(f o f e ) f
e
f o = frecuencia observada f e = frecuencia esperada EJEMPLO 1 Determinar si el voto de apoyo o no al gobierno depende del gnero. Luego de la respectiva investigacin y aplicacin de la encuesta, la tabulacin de los datos se presenta en el siguiente cuadro.
RESULTADOS DE LA ENCUESTA APLICADA A 76 PERSONAS (HOMBRES Y MUJERES) RESPECTO AL APOYO O NO AL GOBIERNO VOTO DE APOYO O NO AL GOBIERNO SEXO apoy no apoyan Tota an l4 masculino 2 1 8 6 4 femenino 1 1 3 5 7 2 Total 4 3 7 3 3 6 Por ser un estudio de tipo correlacional, la prueba se la realiza con el CHICUADRADO. Estos son los pasos que se han utilizado para ello: 1) Planteamiento de las hiptesis 2 2 (Hay relacin entre la variable voto de apoyo o no al gobierno y la c t H : variable voto masculino y femenino (o, la variable voto de apoyo o no al gobierno, depende de la variable voto masculino y femenino)). 2 2 (No hay relacin entre la variable voto de apoyo o no al gobierno y la c = t H : variable voto masculino y femenino ( o, la variable voto de apoyo o no al gobierno, no depende de la variable voto masculino y femenino)). 2) Nivel de significacin = 0.05 3) Criterio
c t 0
Rechace la H si
0
2 2 = 3.84
GL = (renglones-1)(columnas-1) = (2-1)(2-1) = 1 4) Clculos Datos: En una encuesta a 76 personas (hombres y mujeres) respecto al apoyo o no al gobierno, se obtuvieron los siguientes resultado sexo masculino femenino Total voto de apoyo o no al gobierno apoyan no apoyan 2 1 8 6 1 1 5 7 4 3 3 3 Tot al44 32 76 (44)(43) 76
= 24.9
(44)(33) = 19.1; f e (15) = (32)(43) = 18.1; f e (17) =(32)(33) = 13.9 f e (16) = 2 76 76 Indiquemos en 76 un cuadro las celdas con todos los datos necesarios y2 hallemos
fo 28 16 15 17
fe
24 19 18 13
L2 u e g= o , (f
o
= 2.11
fe
f
e
= 2 (r 2 0.05 1) , 1 (= = 1) 3.8 =( (2 .4 1 1
<
g i
(est H H ) en o i 0 se la de acept regi ace a la n pta hipt de ci esis rec nula. haz n o de de Esto significa que no hay relacin entre el voto de apoyo o no y la variable voto masculino y femenino; o lo que es lo mismo la variable voto de apoyo o no al gobierno, no depende de la variable voto masculino y femenino.
Con = 1 grado de libertad y con un nivel de significa cin = 0.05 se obtiene t un valor 2= E te 2 n d e ri0.05, 1 v q c= iu o 3.84 s e (Ane t xo a 3).
4.3.5 La correlacin
En algunos estudios descriptivos ser interesante examinar el grado de relacin (o dependencia) entre dos variables. Se llama correlacin al grado de relacin que existe entre dos medidas de cada uno de los individuos de un grupo. Se dice dependencia positiva cuando al aumento o disminucin de la una variable corresponde un aumento o disminucin de la otra respectivamente (por ejemplo capacidad intelectual versus rendimiento escolar). Se dice dependencia negativa cuando al aumento o disminucin de la una variable le corresponde una disminucin o aumento de la otra respectivamente (por ejemplo capacidad intelectual versus tiempo para aprender un concepto). Ilustremos con un ejemplo la correlacin entre dos variables de dos grupos de 10 individuos cada uno: sujeto 1 2 3 4 5 6 7 8 9 10 grupo M x y 1 1 0 0 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 grupo N x y 1 1 0 2 9 3 8 4 7 5 6 6 5 7 4 8 3 9 2 1 1 0
r=1
r = -1
En el caso del grupo M hay una dependencia o correlacin positiva perfecta r = 1, en el caso del grupo N hay una correlacin negativa perfecta r = -1. Si r = 0 o cercano a cero se dice que los datos son independiente o no estn en relacin. Por tanto la dependencia positiva oscilar entre 0 y +1, y la dependencia negativa entre -1 y 0.
[N
De acuerdo al valor de r se acostumbra a decir: Si r = -1 se dice correlacin negativa perfecta Si r = -0.9 se dice correlacin negativa muy fuerte Si r = -0.75 se dice correlacin negativa considerable Si r = -0.5 se dice correlacin negativa media Si r = -0.1 se dice correlacin negativa dbil Si r = 0 se dice no existe correlacin entre las variables Si r = 0.1 se dice correlacin positiva dbil Si r = 0.5 se dice correlacin positiva media Si r = 0.75 se dice correlacin positiva considerable Si r = 0.9 se dice correlacin positiva fuerte Si r = 1 se dice correlacin positiva perfecta EJEMPLO A continuacin se presentan los promedios de matemtica III de dos trimestres consecutivos de un grupo de 8 estudiantes de cuarto ao C.E de la UNACH, ao 2000: Nota No 1 2 3 4 5 6 7 8 TOTAL r= I X 1 0 1 0 9 8 8 8 7 7 6 7 Nota Y 1 0 9 1 0 1 0 9 7 8 6 6 9 8(586) (67)(69) II XY 100 9 0 9 0 8 0 7 2 5 6 5 6 4 28 6 5
2 1 0 1 0 8 1 6 4 6 4 6 4 9 4 9 5 7 = 0.64
2 10 0 8 1 10 0 10 0 8 1 4 9 6 4 3 6 61 1
Interpretacin.- Como r = 0.64 existe una correlacin positiva media considerable entre las notas del primero y segundo semestres. Si la hiptesis hubiera sido: "Existe una correlacin considerable entre las calificaciones del primero y segundo semestres", sta queda verificada.
n(n 2 1)
donde rs = coeficiente de correlacin de Spearman d = diferencia entre dos rdenes n = nmero de casos. EJEMPLO 4 Aplicar el coeficiente de correlacin de Spearman a las calificaciones de fsica y matemtica de 10 alumnos de la Escuela de Ciencias Exactas de la UNACH para ver si existe dependencia entre stas. Alumnos 1 2 3 4 5 6 7 8 Nota de matem. x 2 0 1 6 1 2 1 4 1 5 1 7 1 9 1 6 Nota de Fsica y 1 9 1 7 1 3 1 5 1 6 1 8 1 7 1 5 Orden de x O 1 5 9 7 6 4 2 5 Orden de y O 2 4 8 6 5 3 4 6 d 1 1 1 1 1 1 2 1
d
1 1 1 1 1 1 4 1
9 10
1 8 2 0 r =1
s
1 9 1 7
3 1 126 990
2 4
1 1 - 9 3 2 1
= = 1 6(21) 10(99)
=1
= 0.87
6 2d 1) n(n
Este resultado nos indica que existe una correlacin dependiente alta entre las variables calificaciones de matemtica y calificaciones de fsica.
4.3.5.3
Este coeficiente sirve para determinar el grado de concordancia que existe entre m miembros de un jurado respecto a la evaluacin de n proyectos. Se usa la frmula
2
12 d W = m 2 (n)(n 2 1) EJEMPLO 4 miembros de un jurado hacen una calificacin por rangos de 8 candidatas para proclamar madrina. El resultado es el siguiente: candidatas 1 2 3 4 5 6 7 8 Jurado 1 1 2 3 4 5 6 7 8 Jurado 2 2 1 4 3 2 6 5 7 8 Jurado 3 3 1 3 2 4 5 6 8 7 Jurado 4 4 1 2 4 3 5 7 6 8
Indicar el grado de concordancia (de Kendal) entre los miembros candidatas 1 2 3 4 5 6 7 8 Jurado 1 1 2 3 4 5 6 7 8 3 7 Jurado 2 1 4 3 2 6 5 7 8 3 8 Jurado 3 1 3 2 4 5 6 8 7 3 9 Jurado 4 1 2 4 3 5 7 6 8 4 0 Rang o 4 1 1 1 2 1 3 2 1 2 4 2 8 3 1 144 d=Rx -14 7 6 5 3 6 1 0 1 3 0
d 196 4 9 3 6 2 5 9
x = 144/8 = 18
2
12(620)
2
12
W=
m 2 (n)(n 2 = 1)
4 (8)(63)
7440 = 0.92 . 8064 = El grado de concordancia es alto. Esto significa que se puede llegar a un consenso para elegir la madrina.
Actividad 4
EJERCICIO 1 Una cadena de restaurantes afirma que el tiempo medio de espera de clientes por atender est distribuido normalmente, con una media de 3 minutos y una desviacin estndar de 1 minuto. El departamento de aseguramiento de calidad hall en una muestra de 50 clientes en un cierto restaurante, que el tiempo medio de espera era de 2.75 minutos. Al nivel de significancia de 0.05 Se puede concluir que dicho tiempo es menor que 3 minutos? E J E R C I C I O 2 De los 1200 graduados de una Escuela de la ESPOCH se toman dos muestras elegidas por separado y al azar, de tamaos 22 y 18 respectivamente. Del estudio de la primera se desprende que el promedio de aos de estudio y preparacin de la tesis hasta graduarse fue de 7, con una desviacin tpica de 2, mientras que en la segunda fue de 7.4 con una desviacin tpica de 3.5. Averiguar si los promedios en ambas muestras se diferencian significativamente al 5% de significancia.
E J E R C I C I O
3 Para estimar el rendimiento de parcelas plantadas con papa de una cierta variedad, se cosecharon ocho de ellas, obtenindos e la siguiente informacin expresada en kg/parcela: 5,5 5,3 5,4 4,9 5,3 5,7 6,2 4,8 Se puede asegurar, con =0,05, de que esta variedad de papas tiene un rendimiento promedio de 5,25 kg? (Sugerencia: Halle primero la media y varianza muestral) E J E R C I C I O 4 Para
demostrar la efectividad de un nuevo medicamento que alivia el dolor, a un primer grupo de 80 pacientes de una clnica se les dio una pastilla que contiene el medicamento nuevo y a otro grupo de 80 se les administr un medicamento anterior. Con un nivel de significacin del 1% Qu podemos concluir acerca de la efectividad de la droga, si en el primer grupo 56 de los pacientes sintieron un efecto benfico, mientras que en el segundo grupo 38 sintieron un efecto benfico? E J E R C I C I O 5 Se plantea un estudio con 200 estudiantes en el cual se quiere determinar si existe relacin entre el gnero y tipo de programa escolar, obtenindose la siguiente tabla de contingencia: Gnero Hombres Mujeres General 21 24
Con esta informacin Se puede concluir que hay relacin entre el gnero y el tipo de programa escolar?
EJERCICIO 6 Se seleccion una muestra aleatoria de seis estudiantes para hacer un estudio piloto a fin de investigar la relacin entre la velocidad de lectura (X) medida en minutos para leer una composicin y recordar en detalle el contenido (Y) medido por un examen sobre el material presentado en la composicin, cuyos resultados son Retencin del contenido (y) 1 7 1 7 1 3 1 6 1 5 1 2 Calcule el coeficiente de correlacin e interprete el resultado obtenido. Velocidad de lectura (x) 10 8 15 12 14 16
Auto evaluacin 4:
Subraye la respuesta correcta: 1.- El error tipo I se conoce tambin como: a) Error de tipo II. b) Nivel de confianza c) Nivel de significancia.
2.- Cuando no se conoce la varianza poblacional y n < 30, se utiliza la prueba: a) z b) t c) Chi cuadrado
3.- Si existe una correlacin negativa perfecta el valor del coeficiente de correlacin de Pearson es: a) -1 b) 3 c) 1
4.- En una prueba chi cuadrado, los grados de libertad se calculan: a) n-1 b) 1 - c) (renglones-1)(columnas-1)
Bibliografa
FREUD J y MANNING R, Estadstica, Ed. Prentice Hall, 1986. HOPKINS Kenneth, Estadstica Bsica, Ed. Prentice Hall, 1996. MASON/LIND MARCHAL, Estadstica para Administracin y Economa, Ed. Alfaomega, Colombia, 2003. URQUIZO Angel, Estadstica para la Educacin y la Investigacin, obra indita. URQUIZO Angel, Cmo Realizar la tesis o una investigacin, Ed. Grficas Riobamba, Riobamba, 2005. URQUIZO Anglica, Estadstica Aplicada a la Educacin, obra indita. ESTADSTICA II. INTERNET: www.ns.ing.usac.edu.gt/estadistica PRUEBA DE HIPTESIS.INTERNET: www.cosmech.tripod.com/Estadistica/pruebas.htm
Anexo 1
TABLA DE LA PRUEBA za (La 1 en un ensayo dosregin colas)rayada es el valor de
2
z 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 0. 6 0. 7 0. 8 0. 9 1. 0 1. 1 1. 2 1. 3 1. 4 1. 5 1. 6 1. 7 1. 8 1. 9 2. 0 2. 1 2. 2 2. 3 2. 4 2. 5 2. 6 2. 7 2. 8 2. 9 3. 0 3. 1 3. 2 3. 3 3. 4 3. 5 3. 6 3. 7 3. 8
0 0.00 00 0.03 98 0.07 93 0.11 79 0.15 54 0.19 15 0.22 58 0.25 80 0.28 81 0.31 59 0.34 13 0.36 43 0.38 49 0.40 32 0.41 92 0.43 32 0.44 52 0.45 54 0.46 41 0.47 13 0.47 72 0.48 21 0.48 61 0.48 93 0.49 18 0.49 38 0.49 53 0.49 65 0.49 74 0.49 81 0.49 87 0.49 90 0.49 93 0.49 95 0.49 97 0.49 98 0.49 98 0.49 99 0.49 99
1 0.00 40 0.04 38 0.08 32 0.12 17 0.15 91 0.19 50 0.22 91 0.26 12 0.29 10 0.31 86 0.34 38 0.36 65 0.38 69 0.40 49 0.42 07 0.43 45 0.44 63 0.45 64 0.46 49 0.47 19 0.47 78 0.48 26 0.48 64 0.48 96 0.49 20 0.49 40 0.49 55 0.49 66 0.49 75 0.49 82 0.49 87 0.49 91 0.49 93 0.49 95 0.49 97 0.49 98 0.49 98 0.49 99 0.49 99
2 0.00 80 0.04 78 0.08 71 0.12 55 0.16 28 0.19 85 0.23 24 0.26 42 0.29 39 0.32 12 0.34 61 0.36 86 0.38 88 0.40 66 0.42 22 0.43 57 0.44 74 0.45 73 0.46 56 0.47 26 0.47 83 0.48 30 0.48 68 0.48 98 0.49 22 0.49 41 0.49 56 0.49 67 0.49 76 0.49 82 0.49 87 0.49 91 0.49 94 0.49 95 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
3 0.01 20 0.05 17 0.09 10 0.12 93 0.16 64 0.20 19 0.23 57 0.26 73 0.29 67 0.32 38 0.34 85 0.37 08 0.39 07 0.40 82 0.42 36 0.43 70 0.44 84 0.45 82 0.46 64 0.47 32 0.47 88 0.48 34 0.48 71 0.49 01 0.49 25 0.49 43 0.49 57 0.49 68 0.49 77 0.49 83 0.49 88 0.49 91 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
4 0.01 60 0.05 57 0.09 48 0.13 31 0.17 00 0.20 54 0.23 89 0.27 04 0.29 98 0.32 64 0.35 08 0.37 25 0.39 25 0.40 99 0.42 51 0.43 82 0.44 95 0.45 91 0.46 71 0.47 38 0.47 93 0.48 38 0.48 75 0.49 04 0.49 27 0.49 45 0.49 59 0.49 69 0.49 77 0.49 84 0.49 88 0.49 92 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
5 0.01 99 0.05 96 0.09 87 0.13 68 0.17 36 0.20 88 0.24 22 0.27 34 0.30 22 0.32 89 0.35 31 0.37 49 0.39 44 0.41 15 0.42 65 0.43 94 0.45 05 0.45 99 0.46 78 0.47 44 0.47 98 0.48 42 0.48 78 0.49 06 0.49 29 0.49 46 0.49 60 0.49 70 0.49 78 0.49 84 0.49 89 0.49 92 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
6 0.02 39 0.06 36 0.10 26 0.14 06 0.17 72 0.21 23 0.24 54 0.27 66 0.30 51 0.33 15 0.35 54 0.37 70 0.39 62 0.41 31 0.42 79 0.44 06 0.45 15 0.46 08 0.46 86 0.47 50 0.48 03 0.48 46 0.48 81 0.49 09 0.49 31 0.49 48 0.49 61 0.49 71 0.49 79 0.49 85 0.49 89 0.49 92 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
7 0.02 70 0.06 75 0.10 64 0.14 43 0.18 08 0.21 57 0.24 86 0.27 94 0.30 78 0.33 40 0.35 77 0.37 90 0.39 80 0.41 47 0.42 92 0.44 18 0.45 25 0.46 16 0.46 93 0.47 56 0.48 08 0.48 50 0.48 84 0.49 11 0.49 32 0.49 49 0.49 62 0.48 72 0.49 79 0.49 85 0.49 89 0.49 92 0.49 95 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
8 0.03 19 0.07 14 0.11 03 0.14 80 0.18 44 0.21 90 0.25 18 0.28 23 0.31 06 0.33 65 0.35 99 0.38 10 0.39 97 0.41 62 0.43 06 0.44 29 0.45 35 0.46 25 0.46 99 0.47 61 0.48 12 0.48 54 0.48 87 0.49 13 0.49 34 0.49 51 0.49 63 0.49 73 0.49 80 0.49 86 0.49 90 0.49 93 0.49 95 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
9 0.03 59 0.07 54 0.11 41 0.15 17 0.18 79 0.22 24 0.25 49 0.28 52 0.31 33 0.33 89 0.36 21 0.38 30 0.40 15 0.41 77 0.43 19 0.44 41 0.45 45 0.45 33 0.47 06 0.47 67 0.48 17 0.48 57 0.48 90 0.49 16 0.49 36 0.49 52 0.49 64 0.49 74 0.49 81 0.49 86 0.49 90 0.49 93 0.49 95 0.49 97 0.49 98 0.49 98 0.49 99 0.49 99 0.49 99
Anexo 2
TABLA DE LA PRUEBA t-student. Si el ensayo es a una cola se toma el valor de t , , y si es a dos colas se toma el valor de . La
t ,
2
2 t
0.025
(a dos colas).
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 55 60 70 80
t 3. 08 1. 89 1. 64 1. 53 1. 48 1. 44 1. 42 1. 40 1. 38 1. 37 1. 36 1. 36 1. 35 1. 35 1. 34 1. 34 1. 33 1. 33 1. 33 1. 33 1. 32 1. 32 1. 32 1. 32 1. 32 1. 32 1. 31 1. 31 1. 31 1. 31 1. 31 1. 30 1. 30 1. 30 1. 30 1. 30 1. 30 1. 30
0.1 0
t 6. 34 2. 92 2. 35 2. 23 2. 02 1. 94 1. 90 1. 86 1. 83 1. 81 1. 80 1. 78 1. 77 1. 76 1. 75 1. 75 1. 74 1. 73 1. 73 1. 72 1. 72 1. 72 1. 71 1. 71 1. 71 1. 71 1. 70 1. 70 1. 70 1. 70 1. 69 1. 68 1. 68 1. 68 1. 68 1. 67 1. 67 1. 66
0.0 5
t
0.01
t
0.005
12. 71 4.3 0 3.1 8 2.5 8 2.5 7 2.4 5 2.3 6 2.3 1 2.2 6 2.2 3 2.2 0 2.1 8 2.1 6 2.1 4 2.1 3 2.1 2 2.1 1 2.1 0 2.0 9 2.0 9 2.0 8 2.0 7 2.0 7 2.0 6 2.0 6 2.0 6 2.0 5 2.0 5 2.0 4 2.0 4 2.0 3 2.0 2 2.0 2 2.0 1 2.0 0 2.0 0 2.0 0 1.9 9
31. 82 6.9 6 4.5 4 3.7 6 3.3 6 3.1 4 3.0 0 2.9 0 2.8 2 2.7 6 2.7 2 2.6 8 2.6 5 2.6 2 2.6 0 2.5 3 2.5 7 2.5 5 2.5 4 2.5 3 2.5 2 2.5 1 2.5 0 2.4 9 2.4 8 2.4 8 2.4 7 2.4 7 2.4 6 2.4 6 2.4 4 2.4 2 2.4 1 2.4 0 2.3 9 2.3 9 2.3 8 2.3 8
63. 66 9.9 2 5.8 4 4.6 0 4.0 3 3.7 1 3.5 0 3.3 6 3.2 5 3.1 7 3.1 1 3.0 6 3.0 1 2.9 8 2.9 5 2.9 2 2.9 0 2.8 8 2.8 6 2.8 4 2.8 3 2.8 2 2.8 1 2.8 0 2.7 9 2.7 8 2.7 7 2.7 6 2.7 6 2.7 5 2.7 2 2.7 1 2.6 9 2.6 8 2.6 6 2.6 5 2.6 4 2.6 3
Anexo 3
TABLA DE LA PRUEBA . es el nivel de significacin (regin rayada) y los grados de libertad.
2
=g.l
0.01
0.025 5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.54 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98 59.34 71.42 83.30 95.02 106.6 3 118.1 4
0.05
0.10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90
6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58 32.00 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89 63.69 76.15 88.38 100.4 3 112.3 3 124.1 2
3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 26.30 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.42 37.65 38.88 40.11 41.34 42.56 43.77 55.76 67.50 79.01 90.53 101.8 8 113.1 5
2.71 4.60 6.25 7.78 9.24 10.65 12.02 13.36 14.69 15.99 17.28 18.55 19.81 21.07 22.31 23.55 24.77 25.99 27.21 28.42 29.62 30.82 32.01 33.20 34.38 35.57 36.74 37.92 39.09 40.26 51.80 63.16 74.39 85.52 96.57 107.56
Anexo 4
Tabla de Nmeros Aleatorios
Fuente: Donald B Owen, Handbook of Statistical Tables, Reading Mass , Adysson Wesley 1962