Modulo Muestreo e Hipotesis

1
ndi ce
Introduccin:........................................................................ ....................................... .... 4 Objetivos....................................................................................................................... 4 General: .................................................................................................................... 4 Especficos:............................................................................................................... 4 Estrategias de Estudio............................................................................................... 6 Metodologa a emplearse en el desarrollo del mdulo ................................................. 6 Evaluacin y Acreditacin............................................................................................ 7 UNIDAD 1: Revisin de Estadstica Descriptiva. ........................................................ 8
2 1.1 Variables ................................................................................................................. 8 Una variable es una propiedad o caracterstica que puede variar y esta variacin es susceptible de medicin................................................................................................ 8 1.2 Distribucin de frecuencias, medidas de centralizacin y dispersin para datos no agrupados:................................................................................................................ 9 1.2.1 Frecuencias de datos no agrupados: ................................................................ 9 1.2.2 Medidas de centralizacin ................................................................................. 9 1.2.3 Medidas de dispersin: .................................................................................. 11 1.3 Distribucin de frecuencias, medidas de centralizacin y dispersin para datos agrupados:................................................................................................................... 12 1.3.1. Frecuencias de datos agrupados: ................................................................. 12 1.3.2 Medidas de centralizacin ............................................................................. 13 1.3.2 Medidas de dispersin ..................................................................................... 16 1.4 Medidas de Posicin ............................................................................................ 17 1.5 Grficos: Diagramas de barras, grfico de lneas, circular o de pastel, histogramas y polgonos de frecuencias ..................................................................... 20 Cuadro Resumen 1: .................................................................................................... 21 Cuadro Resumen 2: PRINCIPALES MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS Y NO AGRUPADOS........................................................................ 22 Actividad 1: ................................................................................................................... 23 Auto evaluacin 1.......................................................................................................... 23 UNIDAD 2: TEORA DEL MUESTREO .................................................................. 24 2.1 Generalidades de la estadstica inferencial .......................................................... 24 2.2 Variables normalizadas y no normalizadas ........................................................ 24 2.2.1 Variable normalizada................................................................................... 24 2.2.2 Escalas ........................................................................................................... 24 2.3 La curva normal .................................................................................................... 25 2.3.1 Frmula y propiedades de la curva normal .................................................. 25 2.3.2 reas bajo la curva normal .......................................................................... 26 2.3.3 Lectura de la tabla........................................................................................ 27 2.3.3.1 Dado el valor de z hallar el rea ............................................................... 27 2.3.3.2 Dado el rea hallar el valor de z ............................................................... 28 2.4 Muestreo ............................................................................................................. 29 2.4.1 Poblaciones y muestras................................................................................ 30 2.4.1.1 Tipos de muestras ........................................................................................... 30 2.4.1.2 Frmulas para calcular el tamao de la muestra........................................ 31 Actividad 2..................................................................................................................... 33 Auto evaluacin 2.......................................................................................................... 34
3 UNIDAD 3: PLANTEAMIENTO ............................................................................... 35 DE HIPOTESIS ............................................................................................................ 35 3.1 Planteamiento de hiptesis, variables .................................................................. 35 3.1.1 Variables ...................................................................................................... 36 3.2 Tipos de hiptesis ................................................................................................ 36 3.2.1 Hiptesis de investigacin ( H i ). .................................................................. 36 3.2.2 Hiptesis nulas y alternativas ....................................................................... 37 3.2.3 Hiptesis estadsticas ................................................................................... 38 Actividad 3..................................................................................................................... 40 Auto evaluacin 3: ........................................................................................................ 40 UNIDAD 4: PRUEBA DE HIPTESIS ..................................................................... 41 4.1 Errores de tipo I y de tipo II ............................................................................... 41 4.2 Nivel de significacin y nivel de confianza........................................................ 42 4.3 Pasos para la prueba de hiptesis y Tcnicas Estadsticas ................................. 42 4.3.1 z normalizado .............................................................................................. 42 4.3.2 t-student ....................................................................................................... 48 4.3.3 Prueba de diferencia de proporciones.......................................................... 51 4.3.4 Chi cuadrado ( 2 ) ................................................................................... 53 4.3.5 La correlacin ............................................................................................... 56 Actividad 4..................................................................................................................... 61 Auto evaluacin 4: ........................................................................................................ 62 Bibliografa ................................................................................................................. 63 Anexo 1 .......................................................................................................................... 64 Anexo 2 .......................................................................................................................... 65 Anexo 3 .......................................................................................................................... 66 Anexo 4 68
Introduccin:
La Estadstica ocupa un lugar importante dentro de la vida cotidiana en diversas reas. La educacin y la investigacin son sl dos de los muchos ejemplos que podramos citar. En este contexto, se hace imprescindible el conocimiento tanto de la Estadstica Descriptiva como Inferencial. Adems, con el avance de la tecnologa se han desarrollado herramientas de software que nos facilitan el trabajo y nos ahorran tiempo. Por tal motivo, se ha preparado este mdulo tratando de resumir los aspectos ms importantes, los que sern de mucha utilidad al momento de presentar resultados o probar una hiptesis en una investigacin, as como la utilizacin de la hoja electrnica Excel y el paquete estadstico GSTAT para que nos ayuden en el tratamiento y presentacin de la informacin. Esperamos que el mdulo, le sea de mucha ayuda y auguramos xito en el desarrollo de este y los posteriores eventos.
Objetivos
General:
Proporcionar los elementos tericos y de software para el manejo de la Estadstica Descriptiva e Inferencial necesarios para la organizacin, presentacin y anlisis de datos, as como el tratamiento de hiptesis estadsticas.
Especficos:
v Recordar los elementos bsicos de la Estadstica Descriptiva as como
estrategias para su aprendizaje. v Conocer los elementos ms importantes de la teora de muestreo y su aplicacin en investigaciones reales. v Proporcionar las herramientas estadsticas indispensables para la prueba de hiptesis de manera que puedan ser aplicados posteriormente en sus trabajos de graduacin..
5 v Conocer las principales herramientas que proporcionan la hoja electrnica Excel y el paquete GSTAT en cuanto a la estadstica descriptiva e inferencial.
Estrategias de Estudio
& Lea detenidamente los contenidos de cada tema. & Para la unidad I, compare los resultados obtenidos en el mdulo, con los que usted va a obtener en la clase prctica utilizando el computador. & Revise con cuidado los ejercicios resueltos, fijndose en cada paso realizado, luego reptalos recordando los pasos establecidos. & Resuelva los ejercicios propuestos tomando como base la teora y los ejercicios resueltos.
UNIDAD 2: TEORA DEL MUESTREO

2.1 Generalidades de la estadstica inferencial
El propsito de una investigacin no slo es describir las distribuciones de las variables, sino tambin el de inferir los resultados obtenidos en la muestra a la poblacin. La ESTADSTICA DESCRIPTIVA es la encargada ESTADGRAFOS que son resultados estadsticos obtenidos en una muestra. de estudiar los
La ESTADSTICA INFERENCIAL es la encargada de estudiar los PARMETROS que son las estadsticas de la poblacin o universo, stos generalmente no se calculan pero son inferidos de los estadgrafos (con un grado de error o nivel de significacin).
2.2 Variables normalizadas
normalizadas
no
Una distribucin de datos puede tener medias y desviaciones estndar diferentes, este problema se puede solucionar transformando los datos medias y desviaciones idnticas; es decir, transformando los valores brutos en valores estandarizados. Las distribuciones de calificaciones estndar tienen valores fijos paras las medias ( ) y las desviaciones estndar (); as: La distribucin de calificaciones z tienen valores fijos = 0 y = 1. La distribucin de calificaciones de CI (coeficiente intelectual) de Wechsler tiene como valores = 100 y = 15.
2.2.1 Variable normalizada

Sea x una puntuacin no elaborada (valor a transformarse) , X la media aritmtica muestral, s la desviacin estndar. Se llama puntuacin z o puntuacin normalizada z al siguiente cociente: xX z= s el valor de z indica la direccin y grado en que x se aleja de la media en unidades de desviacin estndar. En esta escala = 0 y = 1
2.2.2 Escalas
En estadstica, como vimos antes se puede hablar de muchas escalas, pero en la prctica se utilizan especialmente dos: la no normalizada y la normalizada.
2.2.2.1 Escala no normalizada o no elaborada (natural)
9 Es un puntaje o una nota que se obtiene en la realidad, por ejemplo en una prueba. La representacin de estos puntajes se lo hace sobre una recta real donde tenemos la media aritmtica y los puntajes no normalizados.
2.2.2.2 Escala normalizada o escala z

Son puntuaciones z distribuidas en unidades de desviacin estndar ( = 1) positivamente y negativamente a partir de la media aritmtica que en este caso tiene el valor de cero. valores de z -4 Ejemplo 1 1) Representar en la recta real los siguientes puntajes: 5,7,8,6,10, X = 7.2 . 5 . 6 X . . 7 7.2 . 8 . 9 . 10 -3 -2 -1 =0 1 2 1.96 3 4 . .
2) Un estudiante de cuarto ao de Ciencias Exactas de la ESPOCH tiene en lgebra 16 donde la X = 15 y s = 2; y tiene en Fsica 15 donde X = 14 y s = 2,2. Decir en cual de las dos asignaturas est mejor ubicado. Como dicha puntuacin est expresado en dos escalas diferentes, estadarizamos las escalas a puntuaciones z, as: Tipificamos 16: z = 16 15 2 = 0.5 , significa que el valor 16 est en la escala
normalizada z a 0.5 unidades 15 14 de la media que es cero. Tipificamos 15: z = 2.2 = 0.45 , significa que el valor 15 est en la escala normalizada z a 0.45 unidades de la media que es cero. En consecuencia, el mencionado estudiante est mejor ubicado en lgebra.
2.3 La curva normal

2.3.1 Frmula y propiedades de la curva normal
La curva normal o de Gauss es simtrica al eje y, su frmula es:
1
1 2 e Y=
z 2
x , donde z =
2 z si Y = 1 donde =1 es la forma tipificada, z se distribuye normalmente con 2 e media cero y varianza 1.
Algunas propiedades de la curva normal son: La curva es simtrica al eje vertical. La media, la mediana y el modo coinciden con el centro y valen cero, y cada unidad es una desviacin estndar. La grfica de la curva normal tiene la forma de una campana y su rea total bajo la curva es 1. Veamos algunos valores de z con su porcentaje correspondiente de rea: valor de z en rea bajo la curva (-1,1) 68.27% (-2,2) 95.45% (-3,3) 99.73% El vrtice de la curva tiene coordenadas (z = 0, y = 0.4) La curva normal o distribucin muestral es terica; aunque en la prctica las distribuciones de muchas variables de las ciencias sociales se aproximan a una distribucin normal. Esta distribucin es la ms importante en estadstica.
NOTA. El teorema del LIMITE CENTRAL manifiesta que aunque la distribucin de la poblacin de origen no sea normal la distribucin muestral de medias se aproxima a la normalidad conforme n se incrementa.
2.3.2 reas normal
bajo
la
curva
Dado un valor de z se puede hablar de: 1. rea en (-z, +z) (zona de aceptacin de la hiptesis nula en un ensayo a dos colas) 2. rea fuera de (-z, +z) (zona de rechazo de la hiptesis nula en un ensayo a
dos colas)
3. rea hasta z (zona de rechazo de la hiptesis nula en un ensayo a una cola (cola izquierda)) 4. rea hasta z (zona de aceptacin de la hiptesis nula en un ensayo a una cola (cola derecha)) 5. rea despus de z (zona de rechazo de la hiptesis nula en un ensayo a una cola (cola derecha))
2.3.3 Lectura tabla
de
la
2.3.3.1 Dado el valor de z hallar el rea

Se hace el proceso inverso, por ejemplo, si z = 1.65, a la izquierda de la tabla (ver anexo 1) se ve el 1,6 y arriba el 5 el valor del cruce en la tabla es 0.45, que es el rea del centro al valor de z, luego: En un ensayo a dos colas = 0.10 (10%), esto es, el rea entre los valores crticos negativo y positivo de z = 1.6 y z =1.6 es 0.90 En un ensayo a una cola = 0.05 (5%), esto es, el rea anterior al valor crtico de z = 1.6 es 0.95 y el rea posterior es 0.05
NOTA. En el caso anterior de un ensayo a una cola el rea acumulada es de 0.95, esto significa que al valor crtico de z = 1.6 le corresponde el percentil 95. Esto es, el rea acumulada es correspondiente a un percentil de la distribucin. Ejemplo 2 1. En un curso de 17 estudiantes se tiene: X = 15 y s = 2. a) Qu porcentaje y cuntos estudiantes obtienen ms de 16?. b) Qu porcentaje y cuntos estudiantes estn bajo 13?. c) Encontrar el nmero de estudiantes que tiene de 12 a 17 Respuesta 16 15 a) Tipificamos el 16: z = = 0.5 2 En la tabla del anexo 1 vemos a la izquierda 0.5 y arriba 0, el valor que se obtiene es 0.1915. Significa que desde el centro hasta el valor tipificado de z = 0.5 hay un rea de 0.1915, luego, restamos de 0.5 y se obtiene: 0.5 0.1915 = 0.3085, que es el rea que falta en la cola derecha. Lo que significa que el 30.8% de estudiantes est sobre la nota de 16; es decir:
100% 30.8%
17 x luego, x =
30.8(17) 100 = 5.2 , es decir, 5 estudiantes estn sobre 16.
13 15 b) Tipificamos el 13: z = 2 = -1 En la tabla del anexo 1 vemos a la izquierda 1.0 y arriba 0, el valor que se obtiene es 0.3413. Significa que desde el centro hasta el valor tipificado de z =-1 hay un rea de 0.3413, luego, restamos de 0.5 y se obtiene: 0.5 0.3413 = 0.1587. Lo que significa que el 15.8% de estudiantes est bajo la nota de 13; es decir: 100% 15.8% 17 x luego, x = 15.8(17)
100 = 2.68 , es decir, 2 a 3 estudiantes estn bajo 13. 17 15 c) Tipificamos el 17: z = 2 =1 En la tabla del anexo 1 vemos a la izquierda 1 y arriba 0, el valor que se obtiene es 0.3413. Significa que desde el centro hasta el valor tipificado de z = 1 hay un rea de 0. 3413 12 15 Tipificamos el 12: z = 2 = 1.5 En la tabla del anexo 1 vemos a la izquierda 1.5 y arriba 0, el valor que se obtiene es 0.4332. Significa que desde el centro hasta el valor tipificado de z = -1.5 hay un rea de 0.4332 a la izquierda del centro. Sumando las dos reas se tiene : 0.3413+0.4332 = 0.7745. Luego, el 77.45% de datos estn entre 12 y 17. Hallamos cuantos son: 100% 77.45% 12 a 17. 17 x 77.45(17) 100 luego, x = = 13 , es decir, 13 estudiantes tienen puntajes de
2.3.3.2 Dado el rea hallar el valor de z

El valor del rea en realidad es el nivel de significacin o del nivel de confianza 1. Ejemplo 3 1) Si se da el rea entre los valores negativo y positivo de z, se trata del nivel de confianza en un ensayo a dos colas. As, si 1- = 0.95, se toma la mitad, esto es 0.475, se localiza este valor en el interior de la tabla del Anexo 1 y vemos que a la izquierda est 1.9 y arriba 6, luego z = 1.96 2) Si se da el rea fuera de los valores negativo y positivo de z, se trata del nivel de significacin () en un ensayo a dos colas. As, si = 0.10 entonces 1- = 1-0.10 = 0.90, se toma la mitad que es 0.45. Este valor tiene a la izquierda 1.6 y arriba 5, luego, z = 1.65
3) Si se da el rea anterior al valor positivo de z , se trata del nivel de confianza 1- en un ensayo a una cola. As, si 1- = 0.95, se resta 0.5, esto es 0.45, se localiza este valor en el interior de la tabla y vemos que a la izquierda est 1.6 y arriba 5, luego, z = 1.65 4) Si se da el rea que sigue al valor positivo de z , se trata del nivel de significacin ( ) en un ensayo a una cola. As, si = 0.05, el rea desde el centro hasta el valor positivo de z es 0.45, se localiza este valor en el interior de la tabla y vemos que a la izquierda est 1.6 y arriba 5, luego, z = 1.65
Ilustremos en grficos lo que acabamos de ver
Se da el rea entre los valores negativo y positivo de z (1-)
Se da el rea fuera de los valores negativo y positivo de z ()
Se da el rea anterior al valor positivo de z (1)
Se da el rea siguiente al valor positivo de z ()
2.4 Muestreo
Si se pudiera trabajar con todos los elementos de una poblacin, no cabra la estadstica inferencial, porque directamente se calcularan los parmetros de dicha poblacin. Pero muy a menudo se trabaja solamente con muestras de dicha poblacin, muestras que deben ser elegidas de modo probabilstico (principio de aleatoriedad), de tal manera que todos los elementos de la poblacin tengan la misma posibilidad de ser elegidos. Pero dicha seleccin casi nunca se realiza de manera totalmente aleatoria, sino que se utiliza tambin modos no probabilsticos (no aleatorios), buscando al menos el principio de representatividad de la muestra. NOTA. Hay que tener cuidado con los trminos aleatoriedad y representatividad, tenga presente lo siguiente: a) Es preferible una muestra representativa pequea a una muestra grande no representativa. b) A veces se cree que se est tomando una muestra aleatoria cuando en realidad no lo es; as, si se quisiera consultar la opinin a los ciudadanos de Chimborazo sobre sus preferencias para elegir prefecto y se encuesta a las 10 de la maana a una muestra al azar por telfono, esta muestra no es representativa porque contestaran nicamente las personas que estn a esa hora en la casa y no opinaran estudiantes, docentes y otros profesionales que no tienen telfono en ese momento ni personas del permetro rural sin telfono. Estos resultados no
sern confiables y sern sesgados.
2.4.1 Poblaciones y muestras

El problema y los objetivos de la investigacin orientan a ver cules son las unidades de anlisis (libros, personas, instituciones, organizaciones; etc), luego se procede a delimitar la poblacin. Cuando sta es muy grande (para nuestro estudio) se selecciona una parte de ella denominada muestra. Elegir una muestra probabilstica o no probabilstica depende del tipo de estudio, del nivel de inferencia que se quiera dar a los resultados; as como de la disponibilidad de tiempo y recursos del investigador.
2.4.1.1 Tipos de muestras
Aleatoria Simple: En la que sus elementos han sido selelccionados por procesos aleatorios Estratificada: Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica.
Probabilstica
Todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos
Por conglomerados: La unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos.
Casual : Se seleccionan a los n primeros elementos necesarios para la muestra, que sean de fcil acceso. (Voluntarios) Intencional : Se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" incluyendo a grupos supuestamente tpicos. (Expertos) Por Bola de nieve: Se localiza a algunos de los elementos muestrales los que conducen a otros y stos a otros hasta completar la muestra.
No probabilstica
No todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.
Por cuotas: En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones y se eligen los primeros que se encuentren.
Cmo se seleccionan los elementos muestrales para una muestra probabilstica? Las dos formas probabilsticas principales son: a) Procesos Aleatorios simples (Tmbola).- Se numeran los elementos muestrales del 1 al N, se hacen fichas una por cada elemento, se las revuelve en una caja y se sacan n fichas, estos elementos conformarn la muestra. b) Seleccin sistemtica de elementos muestrales.- Es muy til y fcil, se selecciona dentro de una poblacin N una muestra de n elementos a partir de un intervalo K, siendo N K= n . Ejemplo 4. Supongamos que la poblacin est formada por 90 colegios y se tiene N que elegir una muestra de 15 colegios. Se numeran los colegios del 1 al 90, como K = n = 90 15 = 6, entonces, se eligen los colegios numerados, por ejemplo, con 1,7,13, ...hasta completar los 15.
c) Tabla de nmeros Aleatorios: Es una tabla generada aleatoriamente (generalmente

por una computadora). La forma de utilizar la tabla es la siguiente: Si el total de la poblacin es un nmero de 3 cifras, por ejemplo 160, se debe escoger un punto desde el cual empezar a obtener los nmeros, que puede ser por filas, columnas diagonal, luego hacia arriba, abajo, derecha o izquierda. En nuestro ejemplo, se van formando nmeros de 3 cifras y se seleccionan los elementos hasta completar el nmero deseado. (Ver Anexo 4)
2.4.1.2 Frmulas para calcular el tamao de la muestra

Cuanto mayor sea la muestra mejor representar a la poblacin. Las muestras, generalmente se dicen pequeas si tiene menos de 30 elementos, se dicen grandes si tienen ms de 30 elementos. A partir de los estadgrafos (o estadsticos) se pueden calcular los parmetros correspondientes con un cierto margen de error. Los estadsticos calculados sobre todas las muestras que es posible extraer de una poblacin se distribuyen segn una curva normal o distribucin muestral. Veamos entonces como elegir el tamao de la muestra en poblaciones finitas e infinitas: En poblaciones finitas (menos de 5.000, posiblemente con un nmero elevado de preguntas, muchas preguntas abiertas, muestra de varios grupos)
a)
n=
Np q
2
(N 1)
dond e n = tamao de la muestra N = tamao del universo (o de la poblacin) p = probabilidad de ocurrencia (homogeneidad del fenmeno, generalmente p = 0,5) q = 1-p = probabilidad de no ocurrencia ME = margen de error o precisin admisible con que se toma la muestra (generalmente se elige del 0,01 al 0,15) NC = nivel de confianza o exactitud con que se infieren los resultados (valor terico del normalizado z en un ensayo a dos colas) ; por ejemplo: Si ME = 0. 3174; o sea al 68.26% de confianza, NC = 1 Si ME = 0.15; o sea al 85% de confianza, NC = 1.44 Si ME = 0.1336; o sea al 86.64% de confianza, NC = 1.50 Si ME = 0.10; o sea al 90% de confianza, NC = 1.64 Si ME = 0.05; o sea al 95% de confianza, NC = 1.96 (el ms usual) Si ME = 0.03; o sea al 97% de confianza, NC = 2.17 Si ME = 0.01; o sea al 99% de confianza, NC = 2.57 Si ME = 0.0026; o sea al 99.7% de confianza, NC = 3 NOTA.- Para que el nivel de confianza sea NC=2 (constante) como dicen algunos libros, el margen de error debe ser ME= 0.055 b) n = M E 2 ( N 1 ) + 1 d N
M E N C 2
+ pq
o n d e n = t a m a o d e l a m u e s t r a N = t a m a o d e l a p o b l a c i
n ME = margen de error o precisin admisible NOTA. Cundo se puede obtener la frmula b de la frmula a? En poblaciones denominadas infinitas (ms de 5.000; cuestionarios entre 20 y 40 preguntas de preferencia cerradas de respuestas mutuamente excluyentes, por ejemplo: si, no; muy bueno, bueno, regular, malo; etc), se puede utilizar la siguiente frmula:
2
NC pq c) n = dond e:
2
ME
n = Tamao de la muestra p = Probabilidad de ocurrencia (homogeneidad del fenmeno, generalmente p = 0.5) q = 1-p = Probabilidad de no ocurrencia ME = margen de error o precisin admisible NC = nivel de confianza o exactitud (expresado como el valor terico (en un ensayo a dos colas ) del normalizado z que determina el rea de probabilidad buscada); es decir , idntico al literal a). NOTA. Cuando la poblacin es igualmente grande y no se conoce exactamente N, algunos investigadores utilizan la c) de la siguiente manera: Z d) n = E 2 Donde: Z es el nivel de confianza con que se generaliza a la poblacin (NC) E es el margen de error o precisin con que se toma la muestra (ME) poblacional que se expresa en trminos de la probabilidad de la es la varianza variabilidad del fenmeno (mxima variabilidad = 0.5)
2 2 2
(similar a la c))
Actividad 2
EJERCICIO 1 1) Un estudiante de cuarto semestre de Ciencias Exactas de la UNACH tiene en lgebra 8 donde la X = 7.5 y s = 1.2; y tiene en Fsica 9 donde X = 7 y s = 1.1. En cual de las dos asignaturas est mejor ubicado?. 2) Suponiendo que unas puntuaciones se distribuyen normalmente y que = 60 y = 8. En esta distribucin un estudiante tiene una nota de 65. Transforme a escala z. EJERCICIO 2. Suponiendo que se trata de un ensayo a dos colas 1) Si = 0.08 (92% de confianza), hallar z. 2) Si = 0.12 (12% de significacin), hallar z. EJERCICIO 3: En un curso de 15 estudiantes se tiene: X = 7.8 y s = 1.2. a) Qu porcentaje y cuntos estudiantes obtienen ms de 7?. b) Qu porcentaje y cuntos estudiantes estn bajo 6?. c) Encontrar el nmero de estudiantes que tiene de 6 a 8. d) Encontrar el porcentaje y el nmero de estudiantes que tienen de 8 a 10. e) Realizar todos los literales anteriores utilizando Excel y compare los resultados.
EJERCICIO 4: En un centro escolar de 1.200 estudiantes, hay 100 estudiantes en la seccin PRE bsica, 800 en la seccin bsica, 300 en la seccin Bachillerato. Se desea estudiar el nmero de estudiantes que aprueban todas las asignaturas, se sabe que puede haber diferencias entre los distintos niveles educativos, por lo que es de inters para el estudio que en la muestra estn representadas todas las secciones. a) Qu tamao de muestra sugiere con un error del 5%? b) Cuntos estudiantes de cada seccin se deben incluir para que la muestra sea significativa? c) Si se desea una muestra ms pequea que la obtenida en el literal a) Qu margen de error considera se debera usar?
Auto evaluacin 2
Diga si son verdaderos o falsos los siguientes enunciados: a) La curva normal es simtrica respecto al eje y. b) La media en la curva normal es 1 y la desviacin estndar es 0. c) Bajo la curva normal el 68.27% de los datos se encuentra a una desviacin estndar de la media. d) Una muestra es no probabilstica cuando todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.
UNIDAD 3: PLANTEAMIENTO DE HIPOTESIS

3.1 Planteamiento de hiptesis, variables
La hiptesis es una posible respuesta al problema planteado, es una suposicin anticipada que deber ser confirmada o refutada. Responde a la pregunta Qu quiero probar? Una hiptesis puede originarse en la identificacin con teoras (en el marco terico), en el resultado de otros estudios, en la intuicin lgica y racional del investigador de la observacin de los hechos; o, de la informacin emprica. En una investigacin se podra tener una, dos o ms hiptesis o ninguna. Las hiptesis indican lo que estamos buscando o tratando de probar. Las hiptesis deben relacionar (generalmente dos) variables. Ejemplo 1: A mayor ingreso econmico mejor nivel de vida de la familia. Una hiptesis para considerarla bien formulada y poderla verificar empricamente debe reunir las siguientes caractersticas (requisitos o condiciones) principales: 1) Estar lgicamente formulada o estructurada mediante las unidades de observacin, las variables y los trminos de enlace, refirindose a situaciones concretas o reales de manera sencilla, precisa y clara. 2) Para que sea cientfica debe tener referentes tericos; y, la relacin entre las variables debe ser observable y medible en la realidad, verificable o refutable con referentes empricos de un universo determinado. 3) En el momento de su planteamiento se debe pensar en la tcnica para su prueba, de acuerdo al tipo de variables. NOTA. En una tesis se puede tener una sola hiptesis de investigacin o de trabajo si en ella se globaliza lo que pretendemos probar. En ciertos estudios complejos es posible que sea necesario plantear una hiptesis principal o general de acuerdo al objetivo general, y otras hiptesis secundarias o particulares de acuerdo a ciertos objetivos particulares. NOTA. Recuerde que debe haber una intima relacin entre el problema general, el objetivo general y la hiptesis general; entre los problemas particulares o secundarios, los objetivos particulares o especficos y las hiptesis particulares.
3.1.1 Variables
Qu es una variable?. Es una propiedad o cualidad (de la realidad) que puede variar y esta variacin es susceptible de medicin por medio de indicadores. NOTA. Pueden haber hiptesis que tericamente sean muy valiosas pero que no se puede probar en la realidad. Ej. El alma de un nio es ms blanca que la de un adulto
3.2 Tipos de hiptesis

3.2.1 Hiptesis de investigacin ( H i ).
Son las que se utilizan durante el desarrollo del trabajo, se formulan en forma afirmativa. Ej. Los estudiantes de la muestra A difieren en rendimiento de los estudiantes de la muestra B utilizando metodologas diferentes. Estas a su vez pueden ser: a) Hiptesis Descriptivas.- Son simples afirmaciones de ciertos hechos o fenmenos sujetos a comprobacin. Se pueden plantear en estudios descriptivos.
Pueden involucrar una sola variable.- Sealan la presencia de cierto fenmeno en una
poblacin. Ej.1. El porcentaje de votantes por el candidato N.N ser superior al 70%.
Pueden relacionar dos o ms variables mediante asociacin, pero dicha relacin no es

causal. Ej1. A mayor ingreso econmico familiar mayor escolaridad de los hijos. NOTA.- Estas hiptesis se pueden probar utilizando por ejemplo porcentajes, tasas, incremento porcentual. b) Hiptesis Correlacionales.- Especifican la relacin entre dos (correlacin bivariada) o ms variables (correlacin multivariada); o sea, establecen que dos o ms variables estn asociadas y a veces indican cmo estn asociadas. Ej.1. Los profesores de matemtica muestran cada vez mayores niveles de conocimientos (claramente se ve la correlacin bivariada entre tiempo y conocimientos) Ej.2. A mayor nivel de ingreso en una familia mayor nivel de escolaridad de los hijos Ej.3. Hay relacin entre el perfil profesional y la calidad de la prctica profesional NOTA.- Si una hiptesis es puramente correlacional, no tiene sentido hablar de variable independiente y variable dependiente. Ej. Los alumnos que tienen altas calificaciones en matemtica tienden a tener altas calificaciones en estadstica.
Para hablar de variable independiente y variable dependiente es necesario que la hiptesis sea causal. NOTA.- Una hiptesis correlacional se puede probar con Chi cuadrado y se puede medir la magnitud de la correlacin entre las dos variables con el coeficiente de correlacin de Pearson o de Spearman. c) Hiptesis de la diferencia entre grupos.- Se utilizan cuando se comparan grupos, en estudios experimentales y cuasiexperimentales. Ej.1. Hay diferencia de percepcin entre los que miran en blanco y negro y los que miran a colores un determinado comercial. Ej.2. El rendimiento de los alumnos del grupo A es superior al rendimiento de los alumnos del grupo B utilizando metodologas diferentes. NOTA.- Una hiptesis de la diferencia entre grupos se puede probar con: z-normalizado o tstudent o diferencia de proporciones d) Hiptesis que establecen relacin de causalidad .- Estas hiptesis establecen relaciones de causa-efecto entre las variables, pueden ser enunciados condicionales. Ej.1. El divorcio de los padres provoca bajo rendimiento de los hijos. Ej.2. Si la metodologa utilizada en el proceso de enseanza es adecuado, entonces el rendimiento escolar es bueno. NOTA. Cuando la relacin de causalidad en una hiptesis se expresa entre varias variables dependientes e independientes que se relacionan entre s de distintas maneras, es preferible separar en dos o ms hiptesis.
3.2.2 Hiptesis nulas y alternativas

a) Hiptesis nula ( H
o
).- Generalmente se la plantea con la intencin de rechazarla y
aceptar la de investigacin, pero no siempre es as. Ejemplo 2: No hay diferencia en el rendimiento de los estudiantes de la muestra A y los estudiantes de la muestra B; o tambin El rendimiento de los estudiantes de la muestra A es igual al rendimiento de los estudiantes de la muestra B . b) Hiptesis alternativas ( H
a
).- Indican posibilidades alternas ante las hiptesis de
investigacin y nula. A veces constituyen otras hiptesis de investigacin adicionales a las originales. Ejemplo 3: De hiptesis de investigacin, nula y dos alternativas: H i : El rendimiento de los estudiantes ES DIFERENTE utilizando las metodologas A y B.
H o : El rendimiento de los estudiantes ES IGUAL utilizando las metodologa A y B H a : El rendimiento de los estudiantes que utilizaron la metodologa A ES SUPERIOR al de los que utilizaron la metodologa B. H a : El rendimiento de los estudiantes que utilizaron la metodologa A ES INFERIOR al de los que utilizaron la metodologa B.
3.2.3 Hiptesis estadsticas

Son la transformacin de las hiptesis de investigacin, nulas y alternativas en smbolos matemticos o estadsticos. Se formulan con la finalidad de probarlas o rechazarlas cuando los datos que se van a recoger son cuantitativos: nmeros, porcentajes, proporciones, promedios. Las hiptesis estadsticas pueden ser: a) Hiptesis estadsticas de estimacin (o de diferencia entre el valor hipotetizado y el valor observado en la muestra).- Son las correspondientes a las hiptesis de investigacin descriptivas de una variable. Se utiliza cuando se desea evaluar un supuesto respecto al valor de alguna caracterstica de una muestra de individuos u objetos y de una poblacin. Ejemplo 4: El promedio mensual del sueldo de los profesores de la UNACH es diferente a 150 dlares. Al transformar esta hiptesis de investigacin a hiptesis estadstica, vemos que el parmetro al que hace referencia es la media (). Luego, su simbologa estadstica es: H i : 150 Este es un ensayo a dos colas porque al ser 150 puede ser : > 150 (cola derecha) o < 150 (cola izquierda). Ms adelante hablaremos de esto NOTA. Estas hiptesis se pueden probar con z-normalizado o t-student. b) Hiptesis estadsticas de la diferencia de medias (u otros valores).- Comparan una estadstica entre dos grupos (o en un mismo grupo donde se han utilizado por ejemplo dos metodologas). Ejemplo 5 H i : El promedio (1) de rendimiento del grupo A utilizando la metodologa M difiere del promedio (2) de rendimiento utilizando la metodologa N. H : (simbologa estadstica de esta hiptesis de investigacin (dos colas))
i 1 2
H o : El promedio (1) de rendimiento del grupo A utilizando la metodologa M no difiere del promedio (2) de rendimiento utilizando la metodologa N.
H : = (simbologa estadstica de la hiptesis nula)

o 1 2
H a : El promedio (1) de rendimiento del grupo A utilizando la metodologa M es superior al promedio (2) de rendimiento utilizando la metodologa N. H : > (simbologa estadstica de la primera hiptesis alternativa (cola derecha))
a 1 2
H a : El promedio (1) de rendimiento del grupo A utilizando la metodologa M es inferior al promedio (2) de rendimiento utilizando la metodologa N. H a : 1< 2 (simbologa estadstica de la segunda hiptesis alternativa (cola izquierda)) NOTA. Estas hiptesis se pueden probar con z-normalizado o t-student. Su estimacin puede hacerse con promedios, mediana, porcentajes. c) Hiptesis estadsticas de correlacin.- Tienen por objeto traducir en trminos estadsticos una correlacin entre dos ( smbolo r) o ms variables (smbolo R) Ej. existe una correlacin significativa entre el coeficiente intelectual (x) y el tiempo para aprender un concepto (y) H i : rxy 0 H : r = 0 (indica que las dos variables no estn correlacionadas)
o xy
NOTA. No hay una regla para decidir cuantas hiptesis debe tener una investigacin; esto mas bien depende del tipo de estudio, deben ser las mnimas necesarias y suficientes para realizar el trabajo. NOTA IMPORTANTE 1. Cuando el investigador plantea hiptesis de investigacin y nula; e hiptesis estadstica de investigacin y nula, se puede hablar de: Modelo Lgico.- Es el enunciado de las hiptesis de investigacin y nula Modelo Matemtico.- Es la expresin matemtica de las hiptesis de investigacin y nula. Modelo Estadstico.- Son las frmulas estadsticas de la correspondiente tcnica a utilizarse, con el respectivo nivel de significacin y el significado de los smbolos. Ejemplo 6: MODELO LGICO H i : El promedio A de rendimiento del grupo A difiere del promedio B de rendimiento del grupo B. H o : El promedio A de rendimiento del grupo A es igual al promedio B de rendimiento del grupo B.
MODELO MATEMTICO H i : A B (simbologa matemtica de esta hiptesis de investigacin (dos colas)) H o : A= B (simbologa matemtica de la hiptesis nula) MODELO ESTADISTICO Si los estadsticos de prueba son los promedios y las varianzas muestrales y conocien do los tamaos de las muestra A y B, la tcnica a utilizarse en la prueba de estas hiptesis es el tstudent. XA XB 2 2 t= A B 1)s (n 1)s 1 + 1 (n A n + n nA +nB 2 B A
se pued e utiliz ar un nivel de signi ficacin = 0.05 NOTA. Ms adelante se indica la forma cmo se realiza la prueba de hiptesis.
Actividad 3
1.- En cada uno de los siguientes casos identifique la clase de hiptesis y luego escriba las hiptesis nulas correspondientes: a) A mayor preparacin del docente mejor nivel acadmico en sus estudiantes b) El rendimiento de los estudiantes del grupo A es superior al rendimiento de los estudiantes del grupo B. c) La media de los alumnos del grupo 1 difiere de 17. 2.- Escriba un ejemplo de hiptesis estadsticas de estimacin y un ejemplo de hiptesis estadsticas de diferencia de medias.
Auto evaluacin 3:
Complete la(s) palabra(s) necesaria(s) para obtener enunciados verdaderos: 1.- Cuando se puede determinar una variable independiente y una variable dependiente se trata de una hiptesis . . . . . . . . . . . . . . . . . . . . . . 2.- Las hiptesis estadsticas son la transformacin de las hiptesis de investigacin, nulas y alternativas en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.- Una hiptesis debe estar lgicamente formulada o estructurada mediante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ., refirindose a situaciones . . . . . . . . . . . . . . . . . . . . . . . de manera sencilla, precisa y clara.
UNIDAD 4: PRUEBA DE HIPTESIS

Prueba de hiptesis - Tcnicas estadsticas
Una vez que se ha realizado el anlisis parcial y dinmico (de los datos descriptivos) de la(s) muestra(s), se hayan calculado los estadgrafos necesarios, se procede a elegir el estadstico ms apropiado para la prueba de la(s)
hiptesis. Las hiptesis planteadas deben ser sometidas a prueba para ver si son apoyadas o refutadas de acuerdo a los resultados de los datos obtenidos. Mientras ms investigaciones apoyen una hiptesis ms credibilidad y validez tendr en el contexto en el que se la plante. Una prueba de hiptesis estadstica es una regla que con base en una hiptesis nula ( H
o
) nos ayuda a decidir si sta se acepta o rechaza. Generalmente, en educacin, la prueba de hiptesis se realiza: a) Cuando se analiza alguna caracterstica (rendimiento por ejemplo) de dos muestras; b) Cuando se analiza el rendimiento de un grupo al que se le ha aplicado dos metodologas diferentes y se quiere establecer que una de ellas es mejor que la otra ( H a ); c)Cuando se quiere ver si el rendimiento entre dos grupos de alumnos de diferentes colegios es el mismo ( H o );d) Cuando se analiza por ejemplo caractersticas cuantitativas de un grupo y se compara con algn promedio poblacional hipotetizado ; etc. Se pone a su consideracin con ejemplos ilustrativos las siguientes tcnicas estadsticas para la prueba de hiptesis: z normalizado, t-student, prueba de diferencia de proporciones, Chi cuadrado ( 2 ), los coeficientes de correlacin de Pearson, Spearman y Kendall para ver la correlacin o la concordancia entre variables.
4.1 Errores de tipo I y de tipo II

Cuando aceptamos o rechazamos una hiptesis podemos cometer errores, por ejemplo se podra rechazar una hiptesis cuando debera ser aceptada (cuando las muestras no son significativas o son mal tomadas), a este error se lo conoce como error de TIPO I, y si se acepta una hiptesis que se debera rechazar se comete un error de TIPO II. Por lo tanto, se trata de minimizar los errores de decisin, tarea que no resulta tan fcil; pues, al intentar reducir los errores de tipo I podramos incrementar los errores de tipo II y viceversa. Se logra una reduccin de los dos errores al mismo tiempo cuando se incrementa el tamao de la muestra, lo cual a veces es posible y a veces no; o al menos se seleccionan los elementos de la muestra de tal manera que sea una verdadera representacin de la
poblacin.
4.2 Nivel de significacin y nivel de confianza

El error de tipo I se denota por y se lo llama nivel de significacin y generalmente se toma (fijo) los valores entre 0.01 (1%) y 0.15 (15%) (el ms usual es 0.05 (5%)). Representa reas de riesgo (de rechazo de la hiptesis H ) o confianza (de aceptacin o de la hiptesis de investigacin H ) en la distribucin normal (muestral) cuya rea total bajo la curva se considera 1. Algunos autores aceptan de 0.01 (1%) a 0.10 (10%) Al valor 1- se le llama nivel de confianza. Por ejemplo, cuando se elige = 0.05 entonces el margen de error que cometemos es del 5%, es decir tenemos un 95% de confianza de que se est tomando la decisin adecuada; luego, el nivel de confianza es 1- = 0.95. NOTA.- Una decisin es adecuada cuando se rechaza la hiptesis nula cuando es falsa o se acepta cuando es verdadera. NOTA.- A mayor conocimiento del tema menor ser el valor de
i
4.3 Pasos para la prueba de hiptesis y Tcnicas Estadsticas

A continuacin se indican los pasos generales que se siguen para realizar la prueba de la(s) hiptesis: 1) Planteamiento de las hiptesis. 2) Determinacin del Nivel de significacin. 3) Criterio con el que se rechaza o acepta H . 4) Clculos con las frmulas correspondientes a la tcnica estadstica seleccionada. 5) Decisin que se toma de acuerdo a los valores calculados y tericos. A continuacin vamos a tratar las pruebas estadsticas : z normalizado, t-student, diferencia de proporciones, Chi cuadrado, y los coeficientes de correlacin de Pearson, Spearman y Kendall. De acuerdo al diseo de la investigacin, al tipo de los datos recogidos y la(s) hiptesis planteada(s) se deber seleccionar el estadstico ms apropiado para probar la(s) hiptesis.
o
4.3.1 z normalizado
Si el valor de la varianza poblacional 2 es conocido, entonces la estadstica de prueba es la media muestral x . La distribucin muestral es una distribucin normal de puntuaciones z en unidades de desviacin estndar. DEF. Se llama puntuacin z de la distribucin (normal) y se denota con z o simplemente z al valor crtico que separa las reas de rechazo y aceptacin de la hiptesis nula (ver Anexo 1).
t
En un ensayo a dos colas, se tiene:
Para un nivel de significacin del 1% z = 2.57 t El rea entre el centro y el valor terico se obtiene as: 0.5 (0.01)/2 = 0.495. Viendo 0.495 en el interior de la tabla del Anexo 1, encontramos para 0.4949 que es el ms prximo a 0.495, a la izquierda 2.5 y arriba 7; luego, el valor terico es 2.57 Para un nivel de significacin del 5% z = 1.96 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.05)/2 = 0.475. Viendo 0.475 en el interior de la tabla del Anexo 1, encontramos a la izquierda 1.9 y arriba 6; luego, el valor terico es 1.96 Para un nivel de significacin del 10% z = 1.64 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.10)/2 = 0.45. Viendo 0.45 en el interior de la tabla del Anexo 1, encontramos para 0.4495 que es el ms prximo a 0.45, a la izquierda 1.6 y arriba 4; luego, el valor terico es 1.64 En un ensayo a una cola, se tiene:
t t
Hiptesis unidireccional, cola derecha Hiptesis unidireccional, cola izquierda Para un nivel de significacin del 1%
z = 2.33 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.01) = 0.49. Viendo 0.49 en el interior de la tabla del Anexo 1, encontramos para 0.4901 que es el ms prximo a 0.49, a la izquierda 2.3 y arriba 3; luego, el valor terico es 2.33
t
Para un nivel de significacin del 5%
z = 1.64 El rea entre el centro y el valor terico se obtiene as: 0.5 (0.05) = 0.45. Viendo 0.45 en el interior de la tabla del Anexo 1, encontramos para 0.4495 que es el ms prximo a 0.45, a la izquierda 1.6 y arriba 4; luego, el valor terico es 1.64 z = 1.28 Para un nivel de significacin del 10% El rea entre el centro y el valor terico se obtiene as: 0.5 0.10 = 0.4. Viendo 0.4 en el interior de la tabla del Anexo 1, encontramos para 0.3997 que es el ms prximo a 0.4, a la izquierda 1.2 y arriba 8; luego, el valor terico es 1.28 Llamaremos valor calculado de la puntuacin z al valor que se obtiene utilizando una de las frmulas para z; as por ejemplo: En el caso de una muestra A (con una distribucin muestral normal de la poblacin) :
z = x
t t
donde: x es la media aritmtica muestral, es la desviacin tpica poblacional, es la media poblacional o hipotetizada. Luego se ve si z calculado cae en la regin de rechazo o aceptacin de la hiptesis nula. EJEMPLO En una prueba de rendimiento a 40 estudiantes de la FIE se obtiene como promedio x = 7.6, la varianza poblacional es = 1.1. Pruebe que este promedio 7.6 difiere significativamente del promedio poblacional
= 7 con un nivel de significacin del 5%. 1) Planteamiento de las hiptesis H : 7 (El promedio de i rendimiento del grupo es diferente a 7) H o : = 7 (El promedio de rendimiento del grupo es igual a 7) 2) Nivel de significacin = 0.05 3) Criterio Rech si z c z c 1.96 ace la H -1.96 o o Donde 1.96 es el valor terico de z en un ensayo a dos colas con un nivel de significaci es el valor calculado n de de z que se obtiene 0.05, y z c aplicando la frmula:
x z= n
4) Clculos Reemplazando los datos x = 7.6, = 1.1, = 7 y n = 22, en la frmula, se obtiene:

x n 7.6 7 40 z= = 1.1 = 0.6 0.1739 = 3.44
5) Decisin Como el valor de z calculado es mayor al valor de z terico; esto es: z c = 3.441.96 = z t 3.44 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo es diferente a 7.
A
En el caso de dos muestras = A y B de medias x A la hiptesis nula H :

o A B
x B respectivamente, y con
2 2
, B Si se conocen los valores de las varianzas poblacionales,

puntuacin z , cuyo valor se calcula con la siguiente frmula: xA xB z= 2 2
se utiliza la
EJEMPLO
B A n +n
A
En una prueba de rendimiento a los grupos A con n A = 20, y B con n = 18 de la B ESPOCH se han obtenido los siguientes resultados:
x A = 7.9 x B ==7.1 0.9
A = 1.3
B
Pruebe que el rendimiento de los dos grupos es significativamente diferente con un nivel del 0.05 1) Planteamiento de las hiptesis H i : A B (El promedio de rendimiento del grupo A es diferente al promedio de rendimiento del grupo B)
H o : A = B (El promedio de rendimiento del grupo A es igual al promedio de rendimiento del grupo B ) 2) Nivel de significacin = 0.05 3) Criterio Rechace la H
o
si z c -1.96 o z c 1.96
Donde 1.96 es el valor terico de z en un ensayo a dos colas con un nivel de significacin de 0.05, y z c es el valor calculado de z que se obtiene aplicando la frmula: zc = 4) Clculos Reemplazando los datos
x A = 7.9 x = 7.1 B 2 = (0.9)2
xA xB
2 2
A A
+n
B B
= 0.81 A 2 = (1.3) 2 = 1.69 n B = 20 n B = 18 en la frmula correspondiente, se obtiene: xA xB 0.8 7.9 7.1 = 2.18 c = z = = 0.81 1.69 0.3666 18 20 + 2 2 n 5) Decisin Como el valor de z calculado es mayor al valor de z terico; esto es: z c = 2.18 1.96 = z t 2.18 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo A es diferente al promedio de rendimiento del grupo B.
A A A
+n
B B
NOTA. Si en el ejemplo anterior, se pidiera probar que el rendimiento del grupo A es significativamente superior al rendimiento del grupo B con un nivel de significacin del 0.05, entonces se trata de un ensayo a una cola y la prueba de hiptesis se realizara de la siguiente manera. 1) Planteamiento de las hiptesis H i : A > B (El promedio de rendimiento del grupo A es superior al promedio de rendimiento del grupo B) H o : A = B (El promedio de rendimiento del grupo A es igual al promedio de rendimiento del grupo B ) 2) Nivel de significacin = 0.05 3) Criterio Rechace la H
o
si
z c 1.64
Donde 1.64 es el valor terico de z en un ensayo a una cola con un nivel de significacin de 0.05, y z c es el valor calculado de z que se obtiene aplicando la frmula: zc = 4) Clculos Reemplazando los datos
x A = 7.9 x = 7.1 B 2 = (0.9)2
xA xB
2 2
A A
+n
B B
= 0.81 A 2 = (1.3) 2 = 1.69 n B = 20 n B = 18 en la frmula correspondiente, se obtiene:

A
xA xB zc =
7.9 7.1
0.8 =
= 2.18 + 1 . 5 6 9 1 8 Com o el valo r de z calc ulad o es may or al valo r de z teri co; esto es:
0.3666
zc= 2.18 1.64 = zt 2.18 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo A es superior al promedio de rendimiento del grupo B. Si el valor calculado est en la zona de rechazo de la hiptesis nula se rechaza la(s) hiptesis nula(s) y a su vez se acepta la(s) hiptesis de investigacin o viceversa.
4 . 3 . 2 t s t u d e n t
Cuando no se conoce la varianza poblacional, el mejor estadstico de prueba a utilizarse es t-student. DEF. La prueba tstudent sirve para comparar (sobre una variable, por ejemplo rendimiento) la media de una muestra con la media de una poblacin; o evaluar si dos grupos difieren entre s de manera significativa respecto a sus medias. NOTA.Algunos autores recomiendan utilizar t-student en muestras menores que 30, pero se puede aplicar tranquilamente en muestras un poco mayores a 30, cuando la distribucin es aproximadamente normal, siempre que se conozca la desviacin tpica o estndar muestral s. En el caso de
un a m ue str a A (c on un a di str ib uc i n m ue str al no r m al de la po bl ac i n) , se co no ce n x y s qu e es la de sv ia ci n es t
acional = 7.1 1 ) P l a n t e a m i e n t o d e l a h i p t e s i s
d o n d e n 1
s o n
l o s g r a d o s d e l
En un curs i o de 20 b estud iante e s de la r ESP OCH t se ha obte a nido un d prom edio . x = 7.4 y E una desvi J aci n E tpic a s M = 1.2. P Prue be L con un O nivel de signi ficac 1 in del 1% que este prom edio no es signi ficati vam ente difer ente al prom edio pobl
H i : 7.1 (El promedio de rendimiento del grupo es diferente a 7.1) H o : = 7.1 2) Nivel de significacin = 0.01
3) Criterio Rechace H
o
si
t c -2.86 o t c 2.86
Donde 2.86 es el valor terico de t con 19 grados de libertad (ver APNDICE B), y t c es el valor calculado de t que se obtiene aplicando la frmula:
t =
c
x s n1
4) Clculos Reemplazando los datos x = 7.4 s = 1.2 = 7.1 n = 20 en la frmula correspondiente, se obtiene:
t =
c
x s n1
7.4 7.1 = 1.2 19
0.3 = 1.09 = 0.2752
5) Decisin Como el valor calculado de t calculado es 1.09 se encuentra a la izquierda del valor terico que es 2.86, no se puede rechazar la H ; esto es El promedio de rendimiento
o
del grupo no es significativamente diferente a 7.1. En el caso de dos muestras A y B de las que se 2 conocen las medias x A y x B y s y con la hiptesis nula H :
o
B A
respectivamente, las varianzas muestrales 2 A = B. Se utiliza el estadstico t- student, cuyo valor se calcula con la siguiente frmula:
t =
c
A B
(n A 2 + 1)s 1 1 1) (n B s + n B n nA +nB 2
A
+ son los grados nmero de do n A de libertad; n elementos de A, nd n A n B e 2 nmero de elementos de B. Mientras mayor sea el nmero de grados de libertad, la distribucin t se acerca ms a ser una distribucin normal. EJEMPLO 1 En una prueba de rendimiento aplicada a dos grupos A de 20 alumnos que ha utilizado una nueva metodologa, y B de 17 alumnos que ha utilizado una metodologa tradicional, se han obtenido = x = s s A 7.8 B = los siguientes resultados: x 7.2, 1, B = A , 1.2. Pruebe con un nivel de significacin = 0.05 que los promedios son significativamente diferentes. 1) Planteamiento de las hiptesis H i : A B (El promedio de rendimiento del grupo A que ha utilizado una nueva metodologa es significativamente diferente al promedio de rendimiento del grupo B que ha utilizado la metodologa tradicional) H
o
B
: A
= B
( El promedio de
rendimiento del grupo A que ha utilizado una nueva metodologa no es diferente al promedio de rendimiento del grupo B que ha utilizado la metodologa tradicional) 2 )
N i v e l d e s i g n i f i c a d o = 0 . 0 5 3 ) C r i t e r i o
B
es el r terico de t con 35 grados de libertad valo y = 0.05 (ensayo a dos colas, ver Anexo 2), caso t c es el contrario acepte la de valor calculado investigacin. de t que se obtiene aplicando la frmula: t =
c A
x
2
(n A 2 + 1)s 1 1 1) (n B s + n nA +nB 2 B n
A
4 ) Clculos Los datos son:
t < - t = -2.03 o c Rechac bien t t > t = 2.03 e la c t hiptesi s nula si d t t o n d e
= 7.8 xA x = 7.2 B s 2 = (1)2 = 1 sA 2 = B (1.2) n = 20 n B = 17 estos datos se reemplazan en la frmula correspondiente del t-student x x A B c t = 2 A 2 B 1)s (n 1)s 1 + 1 (n A B n n nA +nB 2 A + B donde X A = promedio de rendimiento del grupo A s
B A 2
= 1.44
X B = promedio de rendimiento del grupo de control B

2
= varianza del grupo A
s 2 = varianza del grupo de control B n = nmero de elementos del grupo A

A
n B = nmero de elementos del grupo de control B y se obtiene : t =

c 2
7.8 7.2
B 2
0.6 = 0.13
= (19)1 + (16)1.44 1 1 20 + 17 35
= 4.6
n n
(n 1)s + (n 1)s 1 1 A A B B +
B A
n
A
+n
B
t = 4.6 > t = 2.03, se rechaza la hiptesis nula y se acepta la de investigacin, 5) Decisin t Como c esto es: El promedio de rendimiento del grupo A utilizando una nueva metodologa es significativamente diferente al promedio de rendimiento del grupo B utilizando la metodologa tradicional.
4.3.3 Prueba de diferencia de proporciones

Se utiliza para analizar (sobre una variable) si dos proporciones de dos grupos difieren
significativamente entre s. La variable de los grupos debe ser medida en proporciones o porcentajes. Se aplica la siguiente frmula de puntuacin z para proporciones:
p1 p 2 z = p1q 1 p 2 q 2 n + n
1 2
donde: p proporcin del primer grupo y n el nmero de sus elementos p1 proporcin del segundo grupo y 1n el nmero de sus elementos 2 2 q1 = 1 p1 q =1p
2 2
EJEMPLO En una prueba de rendimiento a dos grupos A y B de 30 y 27 alumnos respectivamente, se obtuvieron los siguientes resultados: Grupo A: porcentaje del 68% de muy buenos de un total de 30 estudiantes Grupo B: porcentaje del 40% de muy buenos de un total de 27 estudiantes Pruebe que el porcentajes de muy buenos del grupo A es significativamente superior a porcentaje de muy buenos del grupo B.
1) Planteamiento de las hiptesis H : > (El porcentaje de muy buenos del grupo A es mayor que el del grupo B)
i 1 2
H o : 1 =2 (No hay diferencia entre los porcentaje de muy buenos del grupo A y del grupo B) 2) Nivel de significacin = 0.05 3) Criterio Rechace la H
o
si
z c 1.64
Donde 1.64 es el valor terico de z en un ensayo a una cola con un nivel de significacin de 0.05, y z c es el valor calculado de z que se obtiene aplicando la frmula: p1 p 2 z = p1q 1 p 2 q 2 n + n 4) Clculos
1 2
Reemplazando los datos p1 = 0.68; q 1 = 1- 0.68 = 0.32; n 1 = 30; p 2 = 0.4; q 2 = 1 - 0.4 = 0.6; n = 27
2
en la frmula correspondiente, se obtiene: p1 p 2 = 2.2 0.68 0.4 z = p1q 1 p 2 q 2 = (0.68)(0.32) (0.4)(0.6) + + n n 30 27

1 2
5) Decisin Como el valor de z calculado es mayor al valor de z terico; esto es: z c = 2.2 1.64 = z t 2.2 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El porcentaje de muy buenos del grupo A es significativamente mayor que el del grupo B.
4.3.4 Chi cuadrado ( 2 )

Es una prueba (de significacin para anlisis no paramtrico) estadstica que se utiliza para evaluar hiptesis correlacionales que relacionan dos variables categricas. El nivel de medicin de las variables es nominal u ordinal (aplicada a sujetos).
2
La se calcula utilizando una tabla cruzada de dos dimensiones, cada dimensin contiene una variable y cada variable se subdivide a la vez en dos o ms categoras. El 2 donde
2
calculado se obtiene con la siguiente frmula :
(f o f e ) f
e
f o = frecuencia observada f e = frecuencia esperada EJEMPLO 1 Determinar si el voto de apoyo o no al gobierno depende del gnero. Luego de la respectiva investigacin y aplicacin de la encuesta, la tabulacin de los datos se presenta en el siguiente cuadro.
RESULTADOS DE LA ENCUESTA APLICADA A 76 PERSONAS (HOMBRES Y MUJERES) RESPECTO AL APOYO O NO AL GOBIERNO VOTO DE APOYO O NO AL GOBIERNO SEXO apoy no apoyan Tota an l4 masculino 2 1 8 6 4 femenino 1 1 3 5 7 2 Total 4 3 7 3 3 6 Por ser un estudio de tipo correlacional, la prueba se la realiza con el CHICUADRADO. Estos son los pasos que se han utilizado para ello: 1) Planteamiento de las hiptesis 2 2 (Hay relacin entre la variable voto de apoyo o no al gobierno y la c t H : variable voto masculino y femenino (o, la variable voto de apoyo o no al gobierno, depende de la variable voto masculino y femenino)). 2 2 (No hay relacin entre la variable voto de apoyo o no al gobierno y la c = t H : variable voto masculino y femenino ( o, la variable voto de apoyo o no al gobierno, no depende de la variable voto masculino y femenino)). 2) Nivel de significacin = 0.05 3) Criterio
c t 0
Rechace la H si
0
2 2 = 3.84
GL = (renglones-1)(columnas-1) = (2-1)(2-1) = 1 4) Clculos Datos: En una encuesta a 76 personas (hombres y mujeres) respecto al apoyo o no al gobierno, se obtuvieron los siguientes resultado sexo masculino femenino Total voto de apoyo o no al gobierno apoyan no apoyan 2 1 8 6 1 1 5 7 4 3 3 3 Tot al44 32 76 (44)(43) 76
las frecuencias esperadas de los datos se calculan as: f e (28) =
= 24.9
(44)(33) = 19.1; f e (15) = (32)(43) = 18.1; f e (17) =(32)(33) = 13.9 f e (16) = 2 76 76 Indiquemos en 76 un cuadro las celdas con todos los datos necesarios y2 hallemos
Celda masculino de apoyo masculino no apoyo femenino de apoyo femenino no apoyo

2 2
fo 28 16 15 17
fe
24 19 18 13
L2 u e g= o , (f
o
= 2.11
fe
f
e
Los grados de libertad (GL) se obtiene con la frmula: GL
= 2 (r 2 0.05 1) , 1 (= = 1) 3.8 =( (2 .4 1 1
<
2 2 = 2.1 0.95, = 1 1 3.84

5) Decisi n
g i
(est H H ) en o i 0 se la de acept regi ace a la n pta hipt de ci esis rec nula. haz n o de de Esto significa que no hay relacin entre el voto de apoyo o no y la variable voto masculino y femenino; o lo que es lo mismo la variable voto de apoyo o no al gobierno, no depende de la variable voto masculino y femenino.
Con = 1 grado de libertad y con un nivel de significa cin = 0.05 se obtiene t un valor 2= E te 2 n d e ri0.05, 1 v q c= iu o 3.84 s e (Ane t xo a 3).
4.3.5 La correlacin
En algunos estudios descriptivos ser interesante examinar el grado de relacin (o dependencia) entre dos variables. Se llama correlacin al grado de relacin que existe entre dos medidas de cada uno de los individuos de un grupo. Se dice dependencia positiva cuando al aumento o disminucin de la una variable corresponde un aumento o disminucin de la otra respectivamente (por ejemplo capacidad intelectual versus rendimiento escolar). Se dice dependencia negativa cuando al aumento o disminucin de la una variable le corresponde una disminucin o aumento de la otra respectivamente (por ejemplo capacidad intelectual versus tiempo para aprender un concepto). Ilustremos con un ejemplo la correlacin entre dos variables de dos grupos de 10 individuos cada uno: sujeto 1 2 3 4 5 6 7 8 9 10 grupo M x y 1 1 0 0 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 grupo N x y 1 1 0 2 9 3 8 4 7 5 6 6 5 7 4 8 3 9 2 1 1 0
r=1
r = -1
En el caso del grupo M hay una dependencia o correlacin positiva perfecta r = 1, en el caso del grupo N hay una correlacin negativa perfecta r = -1. Si r = 0 o cercano a cero se dice que los datos son independiente o no estn en relacin. Por tanto la dependencia positiva oscilar entre 0 y +1, y la dependencia negativa entre -1 y 0.
4.3.5.1 Coeficiente de correlacin r de Pearson

Es una prueba estadstica (paramtrica) que se utiliza para medir la magnitud de la correlacin entre dos variables, el valor de r estar en el intervalo [-1,1]. Se utiliza la siguiente frmula: r= X2( N XY ( X)( Y) X )2 ] [N Y2( Y )2 ]
[N
De acuerdo al valor de r se acostumbra a decir: Si r = -1 se dice correlacin negativa perfecta Si r = -0.9 se dice correlacin negativa muy fuerte Si r = -0.75 se dice correlacin negativa considerable Si r = -0.5 se dice correlacin negativa media Si r = -0.1 se dice correlacin negativa dbil Si r = 0 se dice no existe correlacin entre las variables Si r = 0.1 se dice correlacin positiva dbil Si r = 0.5 se dice correlacin positiva media Si r = 0.75 se dice correlacin positiva considerable Si r = 0.9 se dice correlacin positiva fuerte Si r = 1 se dice correlacin positiva perfecta EJEMPLO A continuacin se presentan los promedios de matemtica III de dos trimestres consecutivos de un grupo de 8 estudiantes de cuarto ao C.E de la UNACH, ao 2000: Nota No 1 2 3 4 5 6 7 8 TOTAL r= I X 1 0 1 0 9 8 8 8 7 7 6 7 Nota Y 1 0 9 1 0 1 0 9 7 8 6 6 9 8(586) (67)(69) II XY 100 9 0 9 0 8 0 7 2 5 6 5 6 4 28 6 5
2 1 0 1 0 8 1 6 4 6 4 6 4 9 4 9 5 7 = 0.64
2 10 0 8 1 10 0 10 0 8 1 4 9 6 4 3 6 61 1
[8(571) - (67) 2 ] [8(611) (69) 2 ]
Interpretacin.- Como r = 0.64 existe una correlacin positiva media considerable entre las notas del primero y segundo semestres. Si la hiptesis hubiera sido: "Existe una correlacin considerable entre las calificaciones del primero y segundo semestres", sta queda verificada.
4.3.5.2 Coeficiente de Correlacin Ordinal de Spearman

Si el nmero de casos es menor a 30 y si las variables x e y estn representadas por rdenes se puede utilizar el coeficiente de correlacin de Spearman aunque ste es menos exacto que el de Pearson. DEF. El orden de una distribucin de datos (para este caso) es el puesto de mayor a menor que ocupan los puntajes; as: si se tiene puntajes de 8 a 20, el 20 ocupa el orden 1 (primer puesto) el 19 ocupa el orden 2 (segundo puesto) , . . ., el 8 ocupa el orden 13. NOTA. En un estudio cualitativo la ordenacin, tambin puede efectuarse por criterios cualitativos. DEF. Llamaremos diferencia d a la resta de dos rdenes de dos datos. La frmula para hallar el coeficienterde correlacin de Spearman es la siguiente: = 1 6 d 2
s
n(n 2 1)
donde rs = coeficiente de correlacin de Spearman d = diferencia entre dos rdenes n = nmero de casos. EJEMPLO 4 Aplicar el coeficiente de correlacin de Spearman a las calificaciones de fsica y matemtica de 10 alumnos de la Escuela de Ciencias Exactas de la UNACH para ver si existe dependencia entre stas. Alumnos 1 2 3 4 5 6 7 8 Nota de matem. x 2 0 1 6 1 2 1 4 1 5 1 7 1 9 1 6 Nota de Fsica y 1 9 1 7 1 3 1 5 1 6 1 8 1 7 1 5 Orden de x O 1 5 9 7 6 4 2 5 Orden de y O 2 4 8 6 5 3 4 6 d 1 1 1 1 1 1 2 1
d
1 1 1 1 1 1 4 1
9 10
1 8 2 0 r =1
s
1 9 1 7
3 1 126 990
2 4
1 1 - 9 3 2 1
= = 1 6(21) 10(99)
=1
= 0.87
6 2d 1) n(n
Este resultado nos indica que existe una correlacin dependiente alta entre las variables calificaciones de matemtica y calificaciones de fsica.
4.3.5.3
Coeficiente de Correlacin o Concordancia de Kendall
Este coeficiente sirve para determinar el grado de concordancia que existe entre m miembros de un jurado respecto a la evaluacin de n proyectos. Se usa la frmula
2
12 d W = m 2 (n)(n 2 1) EJEMPLO 4 miembros de un jurado hacen una calificacin por rangos de 8 candidatas para proclamar madrina. El resultado es el siguiente: candidatas 1 2 3 4 5 6 7 8 Jurado 1 1 2 3 4 5 6 7 8 Jurado 2 2 1 4 3 2 6 5 7 8 Jurado 3 3 1 3 2 4 5 6 8 7 Jurado 4 4 1 2 4 3 5 7 6 8
Indicar el grado de concordancia (de Kendal) entre los miembros candidatas 1 2 3 4 5 6 7 8 Jurado 1 1 2 3 4 5 6 7 8 3 7 Jurado 2 1 4 3 2 6 5 7 8 3 8 Jurado 3 1 3 2 4 5 6 8 7 3 9 Jurado 4 1 2 4 3 5 7 6 8 4 0 Rang o 4 1 1 1 2 1 3 2 1 2 4 2 8 3 1 144 d=Rx -14 7 6 5 3 6 1 0 1 3 0
d 196 4 9 3 6 2 5 9
3 6 100 169 620
x = 144/8 = 18
2
12(620)
2
12
W=
m 2 (n)(n 2 = 1)
4 (8)(63)
7440 = 0.92 . 8064 = El grado de concordancia es alto. Esto significa que se puede llegar a un consenso para elegir la madrina.
Actividad 4
EJERCICIO 1 Una cadena de restaurantes afirma que el tiempo medio de espera de clientes por atender est distribuido normalmente, con una media de 3 minutos y una desviacin estndar de 1 minuto. El departamento de aseguramiento de calidad hall en una muestra de 50 clientes en un cierto restaurante, que el tiempo medio de espera era de 2.75 minutos. Al nivel de significancia de 0.05 Se puede concluir que dicho tiempo es menor que 3 minutos? E J E R C I C I O 2 De los 1200 graduados de una Escuela de la ESPOCH se toman dos muestras elegidas por separado y al azar, de tamaos 22 y 18 respectivamente. Del estudio de la primera se desprende que el promedio de aos de estudio y preparacin de la tesis hasta graduarse fue de 7, con una desviacin tpica de 2, mientras que en la segunda fue de 7.4 con una desviacin tpica de 3.5. Averiguar si los promedios en ambas muestras se diferencian significativamente al 5% de significancia.
E J E R C I C I O
3 Para estimar el rendimiento de parcelas plantadas con papa de una cierta variedad, se cosecharon ocho de ellas, obtenindos e la siguiente informacin expresada en kg/parcela: 5,5 5,3 5,4 4,9 5,3 5,7 6,2 4,8 Se puede asegurar, con =0,05, de que esta variedad de papas tiene un rendimiento promedio de 5,25 kg? (Sugerencia: Halle primero la media y varianza muestral) E J E R C I C I O 4 Para
demostrar la efectividad de un nuevo medicamento que alivia el dolor, a un primer grupo de 80 pacientes de una clnica se les dio una pastilla que contiene el medicamento nuevo y a otro grupo de 80 se les administr un medicamento anterior. Con un nivel de significacin del 1% Qu podemos concluir acerca de la efectividad de la droga, si en el primer grupo 56 de los pacientes sintieron un efecto benfico, mientras que en el segundo grupo 38 sintieron un efecto benfico? E J E R C I C I O 5 Se plantea un estudio con 200 estudiantes en el cual se quiere determinar si existe relacin entre el gnero y tipo de programa escolar, obtenindose la siguiente tabla de contingencia: Gnero Hombres Mujeres General 21 24
Tipo de programa escola Acadmico Vo 47 23 58 27
Con esta informacin Se puede concluir que hay relacin entre el gnero y el tipo de programa escolar?
EJERCICIO 6 Se seleccion una muestra aleatoria de seis estudiantes para hacer un estudio piloto a fin de investigar la relacin entre la velocidad de lectura (X) medida en minutos para leer una composicin y recordar en detalle el contenido (Y) medido por un examen sobre el material presentado en la composicin, cuyos resultados son Retencin del contenido (y) 1 7 1 7 1 3 1 6 1 5 1 2 Calcule el coeficiente de correlacin e interprete el resultado obtenido. Velocidad de lectura (x) 10 8 15 12 14 16
Auto evaluacin 4:
Subraye la respuesta correcta: 1.- El error tipo I se conoce tambin como: a) Error de tipo II. b) Nivel de confianza c) Nivel de significancia.
2.- Cuando no se conoce la varianza poblacional y n < 30, se utiliza la prueba: a) z b) t c) Chi cuadrado
3.- Si existe una correlacin negativa perfecta el valor del coeficiente de correlacin de Pearson es: a) -1 b) 3 c) 1
4.- En una prueba chi cuadrado, los grados de libertad se calculan: a) n-1 b) 1 - c) (renglones-1)(columnas-1)
Bibliografa
FREUD J y MANNING R, Estadstica, Ed. Prentice Hall, 1986. HOPKINS Kenneth, Estadstica Bsica, Ed. Prentice Hall, 1996. MASON/LIND MARCHAL, Estadstica para Administracin y Economa, Ed. Alfaomega, Colombia, 2003. URQUIZO Angel, Estadstica para la Educacin y la Investigacin, obra indita. URQUIZO Angel, Cmo Realizar la tesis o una investigacin, Ed. Grficas Riobamba, Riobamba, 2005. URQUIZO Anglica, Estadstica Aplicada a la Educacin, obra indita. ESTADSTICA II. INTERNET: www.ns.ing.usac.edu.gt/estadistica PRUEBA DE HIPTESIS.INTERNET: www.cosmech.tripod.com/Estadistica/pruebas.htm
Anexo 1
TABLA DE LA PRUEBA za (La 1 en un ensayo dosregin colas)rayada es el valor de
2
z 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 0. 6 0. 7 0. 8 0. 9 1. 0 1. 1 1. 2 1. 3 1. 4 1. 5 1. 6 1. 7 1. 8 1. 9 2. 0 2. 1 2. 2 2. 3 2. 4 2. 5 2. 6 2. 7 2. 8 2. 9 3. 0 3. 1 3. 2 3. 3 3. 4 3. 5 3. 6 3. 7 3. 8
0 0.00 00 0.03 98 0.07 93 0.11 79 0.15 54 0.19 15 0.22 58 0.25 80 0.28 81 0.31 59 0.34 13 0.36 43 0.38 49 0.40 32 0.41 92 0.43 32 0.44 52 0.45 54 0.46 41 0.47 13 0.47 72 0.48 21 0.48 61 0.48 93 0.49 18 0.49 38 0.49 53 0.49 65 0.49 74 0.49 81 0.49 87 0.49 90 0.49 93 0.49 95 0.49 97 0.49 98 0.49 98 0.49 99 0.49 99
1 0.00 40 0.04 38 0.08 32 0.12 17 0.15 91 0.19 50 0.22 91 0.26 12 0.29 10 0.31 86 0.34 38 0.36 65 0.38 69 0.40 49 0.42 07 0.43 45 0.44 63 0.45 64 0.46 49 0.47 19 0.47 78 0.48 26 0.48 64 0.48 96 0.49 20 0.49 40 0.49 55 0.49 66 0.49 75 0.49 82 0.49 87 0.49 91 0.49 93 0.49 95 0.49 97 0.49 98 0.49 98 0.49 99 0.49 99
2 0.00 80 0.04 78 0.08 71 0.12 55 0.16 28 0.19 85 0.23 24 0.26 42 0.29 39 0.32 12 0.34 61 0.36 86 0.38 88 0.40 66 0.42 22 0.43 57 0.44 74 0.45 73 0.46 56 0.47 26 0.47 83 0.48 30 0.48 68 0.48 98 0.49 22 0.49 41 0.49 56 0.49 67 0.49 76 0.49 82 0.49 87 0.49 91 0.49 94 0.49 95 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
3 0.01 20 0.05 17 0.09 10 0.12 93 0.16 64 0.20 19 0.23 57 0.26 73 0.29 67 0.32 38 0.34 85 0.37 08 0.39 07 0.40 82 0.42 36 0.43 70 0.44 84 0.45 82 0.46 64 0.47 32 0.47 88 0.48 34 0.48 71 0.49 01 0.49 25 0.49 43 0.49 57 0.49 68 0.49 77 0.49 83 0.49 88 0.49 91 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
4 0.01 60 0.05 57 0.09 48 0.13 31 0.17 00 0.20 54 0.23 89 0.27 04 0.29 98 0.32 64 0.35 08 0.37 25 0.39 25 0.40 99 0.42 51 0.43 82 0.44 95 0.45 91 0.46 71 0.47 38 0.47 93 0.48 38 0.48 75 0.49 04 0.49 27 0.49 45 0.49 59 0.49 69 0.49 77 0.49 84 0.49 88 0.49 92 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
5 0.01 99 0.05 96 0.09 87 0.13 68 0.17 36 0.20 88 0.24 22 0.27 34 0.30 22 0.32 89 0.35 31 0.37 49 0.39 44 0.41 15 0.42 65 0.43 94 0.45 05 0.45 99 0.46 78 0.47 44 0.47 98 0.48 42 0.48 78 0.49 06 0.49 29 0.49 46 0.49 60 0.49 70 0.49 78 0.49 84 0.49 89 0.49 92 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
6 0.02 39 0.06 36 0.10 26 0.14 06 0.17 72 0.21 23 0.24 54 0.27 66 0.30 51 0.33 15 0.35 54 0.37 70 0.39 62 0.41 31 0.42 79 0.44 06 0.45 15 0.46 08 0.46 86 0.47 50 0.48 03 0.48 46 0.48 81 0.49 09 0.49 31 0.49 48 0.49 61 0.49 71 0.49 79 0.49 85 0.49 89 0.49 92 0.49 94 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
7 0.02 70 0.06 75 0.10 64 0.14 43 0.18 08 0.21 57 0.24 86 0.27 94 0.30 78 0.33 40 0.35 77 0.37 90 0.39 80 0.41 47 0.42 92 0.44 18 0.45 25 0.46 16 0.46 93 0.47 56 0.48 08 0.48 50 0.48 84 0.49 11 0.49 32 0.49 49 0.49 62 0.48 72 0.49 79 0.49 85 0.49 89 0.49 92 0.49 95 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
8 0.03 19 0.07 14 0.11 03 0.14 80 0.18 44 0.21 90 0.25 18 0.28 23 0.31 06 0.33 65 0.35 99 0.38 10 0.39 97 0.41 62 0.43 06 0.44 29 0.45 35 0.46 25 0.46 99 0.47 61 0.48 12 0.48 54 0.48 87 0.49 13 0.49 34 0.49 51 0.49 63 0.49 73 0.49 80 0.49 86 0.49 90 0.49 93 0.49 95 0.49 96 0.49 97 0.49 98 0.49 99 0.49 99 0.49 99
9 0.03 59 0.07 54 0.11 41 0.15 17 0.18 79 0.22 24 0.25 49 0.28 52 0.31 33 0.33 89 0.36 21 0.38 30 0.40 15 0.41 77 0.43 19 0.44 41 0.45 45 0.45 33 0.47 06 0.47 67 0.48 17 0.48 57 0.48 90 0.49 16 0.49 36 0.49 52 0.49 64 0.49 74 0.49 81 0.49 86 0.49 90 0.49 93 0.49 95 0.49 97 0.49 98 0.49 98 0.49 99 0.49 99 0.49 99
Anexo 2
TABLA DE LA PRUEBA t-student. Si el ensayo es a una cola se toma el valor de t , , y si es a dos colas se toma el valor de . La

t ,
2
regin sombreada es el valor de (a una cola) o de
2 t
0.025
(a dos colas).
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 55 60 70 80
t 3. 08 1. 89 1. 64 1. 53 1. 48 1. 44 1. 42 1. 40 1. 38 1. 37 1. 36 1. 36 1. 35 1. 35 1. 34 1. 34 1. 33 1. 33 1. 33 1. 33 1. 32 1. 32 1. 32 1. 32 1. 32 1. 32 1. 31 1. 31 1. 31 1. 31 1. 31 1. 30 1. 30 1. 30 1. 30 1. 30 1. 30 1. 30
0.1 0
t 6. 34 2. 92 2. 35 2. 23 2. 02 1. 94 1. 90 1. 86 1. 83 1. 81 1. 80 1. 78 1. 77 1. 76 1. 75 1. 75 1. 74 1. 73 1. 73 1. 72 1. 72 1. 72 1. 71 1. 71 1. 71 1. 71 1. 70 1. 70 1. 70 1. 70 1. 69 1. 68 1. 68 1. 68 1. 68 1. 67 1. 67 1. 66
0.0 5
t
0.01
t
0.005
12. 71 4.3 0 3.1 8 2.5 8 2.5 7 2.4 5 2.3 6 2.3 1 2.2 6 2.2 3 2.2 0 2.1 8 2.1 6 2.1 4 2.1 3 2.1 2 2.1 1 2.1 0 2.0 9 2.0 9 2.0 8 2.0 7 2.0 7 2.0 6 2.0 6 2.0 6 2.0 5 2.0 5 2.0 4 2.0 4 2.0 3 2.0 2 2.0 2 2.0 1 2.0 0 2.0 0 2.0 0 1.9 9
31. 82 6.9 6 4.5 4 3.7 6 3.3 6 3.1 4 3.0 0 2.9 0 2.8 2 2.7 6 2.7 2 2.6 8 2.6 5 2.6 2 2.6 0 2.5 3 2.5 7 2.5 5 2.5 4 2.5 3 2.5 2 2.5 1 2.5 0 2.4 9 2.4 8 2.4 8 2.4 7 2.4 7 2.4 6 2.4 6 2.4 4 2.4 2 2.4 1 2.4 0 2.3 9 2.3 9 2.3 8 2.3 8
63. 66 9.9 2 5.8 4 4.6 0 4.0 3 3.7 1 3.5 0 3.3 6 3.2 5 3.1 7 3.1 1 3.0 6 3.0 1 2.9 8 2.9 5 2.9 2 2.9 0 2.8 8 2.8 6 2.8 4 2.8 3 2.8 2 2.8 1 2.8 0 2.7 9 2.7 8 2.7 7 2.7 6 2.7 6 2.7 5 2.7 2 2.7 1 2.6 9 2.6 8 2.6 6 2.6 5 2.6 4 2.6 3
Anexo 3
TABLA DE LA PRUEBA . es el nivel de significacin (regin rayada) y los grados de libertad.
2
=g.l
0.01
0.025 5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.54 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98 59.34 71.42 83.30 95.02 106.6 3 118.1 4
0.05
0.10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90
6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58 32.00 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89 63.69 76.15 88.38 100.4 3 112.3 3 124.1 2
3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 26.30 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.42 37.65 38.88 40.11 41.34 42.56 43.77 55.76 67.50 79.01 90.53 101.8 8 113.1 5
2.71 4.60 6.25 7.78 9.24 10.65 12.02 13.36 14.69 15.99 17.28 18.55 19.81 21.07 22.31 23.55 24.77 25.99 27.21 28.42 29.62 30.82 32.01 33.20 34.38 35.57 36.74 37.92 39.09 40.26 51.80 63.16 74.39 85.52 96.57 107.56
Anexo 4
Tabla de Nmeros Aleatorios
Fuente: Donald B Owen, Handbook of Statistical Tables, Reading Mass , Adysson Wesley 1962

Modulo Muestreo e Hipotesis

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Modulo Muestreo e Hipotesis

Enviado por

Direitos autorais:

Formatos disponíveis

1

UNIDAD 2: TEORA DEL MUESTREO

2.2 Variables normalizadas

2.2.1 Variable normalizada

2.2.2.1 Escala no normalizada o no elaborada (natural)

2.2.2.2 Escala normalizada o escala z

2.3 La curva normal

2 z si Y = 1 donde =1 es la forma tipificada, z se distribuye normalmente con 2 e media cero y varianza 1.

2.3.2 reas normal

2.3.3 Lectura tabla

2.3.3.1 Dado el valor de z hallar el rea

30.8(17) 100 = 5.2 , es decir, 5 estudiantes estn sobre 16.

2.3.3.2 Dado el rea hallar el valor de z

Ilustremos en grficos lo que acabamos de ver

Se da el rea entre los valores negativo y positivo de z (1-)

Se da el rea fuera de los valores negativo y positivo de z ()

Se da el rea anterior al valor positivo de z (1)

Se da el rea siguiente al valor positivo de z ()

sern confiables y sern sesgados.

2.4.1 Poblaciones y muestras

2.4.1.1 Tipos de muestras

c) Tabla de nmeros Aleatorios: Es una tabla generada aleatoriamente (generalmente

2.4.1.2 Frmulas para calcular el tamao de la muestra

UNIDAD 3: PLANTEAMIENTO DE HIPOTESIS

3.2 Tipos de hiptesis

Pueden relacionar dos o ms variables mediante asociacin, pero dicha relacin no es

3.2.2 Hiptesis nulas y alternativas

).- Generalmente se la plantea con la intencin de rechazarla y

).- Indican posibilidades alternas ante las hiptesis de

3.2.3 Hiptesis estadsticas

H : = (simbologa estadstica de la hiptesis nula)

UNIDAD 4: PRUEBA DE HIPTESIS

4.1 Errores de tipo I y de tipo II

4.2 Nivel de significacin y nivel de confianza

4.3 Pasos para la prueba de hiptesis y Tcnicas Estadsticas

En un ensayo a dos colas, se tiene:

Para un nivel de significacin del 5%

4) Clculos Reemplazando los datos x = 7.6, = 1.1, = 7 y n = 22, en la frmula, se obtiene:

En el caso de dos muestras = A y B de medias x A la hiptesis nula H :

, B Si se conocen los valores de las varianzas poblacionales,

= 0.81 A 2 = (1.3) 2 = 1.69 n B = 20 n B = 18 en la frmula correspondiente, se obtiene:

un a m ue str a A (c on un a di str ib uc i n m ue str al no r m al de la po bl ac i n) , se co no ce n x y s qu e es la de sv ia ci n es t

7.4 7.1 = 1.2 19

0.3 = 1.09 = 0.2752

4 ) Clculos Los datos son:

t < - t = -2.03 o c Rechac bien t t > t = 2.03 e la c t hiptesi s nula si d t t o n d e

X B = promedio de rendimiento del grupo de control B

= varianza del grupo A

s 2 = varianza del grupo de control B n = nmero de elementos del grupo A

n B = nmero de elementos del grupo de control B y se obtiene : t =

4.3.3 Prueba de diferencia de proporciones

en la frmula correspondiente, se obtiene: p1 p 2 = 2.2 0.68 0.4 z = p1q 1 p 2 q 2 = (0.68)(0.32) (0.4)(0.6) + + n n 30 27

4.3.4 Chi cuadrado ( 2 )

calculado se obtiene con la siguiente frmula :

las frecuencias esperadas de los datos se calculan as: f e (28) =

Celda masculino de apoyo masculino no apoyo femenino de apoyo femenino no apoyo

Los grados de libertad (GL) se obtiene con la frmula: GL

2 2 = 2.1 0.95, = 1 1 3.84

4.3.5.1 Coeficiente de correlacin r de Pearson

[8(571) - (67) 2 ] [8(611) (69) 2 ]

4.3.5.2 Coeficiente de Correlacin Ordinal de Spearman

Coeficiente de Correlacin o Concordancia de Kendall

3 6 100 169 620

Tipo de programa escola Acadmico Vo 47 23 58 27