Escolar Documentos
Profissional Documentos
Cultura Documentos
Se seguirán ciertos procedimientos de selección para asegurar de que las muestras reflejen observaciones
a la población de la que proceden, ya que solo se pueden hacer observaciones probabilísticas sobre una
población cuando se usan muestras representativas de la misma.
Muestreo
El muestreo es una herramienta que se utiliza cuando no es posible obtener la probabilidad de cada uno
de los elementos de una poblacion, es decir cuando se tienen una poblacion muy grande en donde no es
posible analizar toso los datos, pero si una muestra de ellos.
hipotesis
una hipotesis es una aseveración de una poblacion construida con el fin de poner a prueba, para saber si
una afirmación es verdadera o falsa.
La hipótesis nula (H0): es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre
contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa (H1): es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que
se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le
conoce también como la hipótesis de investigación.
Se utilizan para decidir si las medias de dos poblaciones son iguales. Se requieren dos muestras
independientes. Considérese, por ejemplo, una compañía investigadora que experimentan con dos
diferentes mezclas de pintura, para ver si se puede modificar el tiempo de secado de una pintura
para uso doméstico. Cada mezcla es probada un determinado número de veces, y comparados
posteriormente los tiempos medios de secado de las dos muestras. Una parece ser superior, ya que
su tiempo medio de secado (muestra) es 30 minutos menor que el de la otra muestra.
Pero, ¿son realmente diferentes los tiempos medios de secado de las dos pinturas, o esta diferencia
muestral es nada más la variación aleatoria que se espera, aun cuando las dos fórmulas presentan
idénticos tiempos medios de secado.
Con frecuencia se utilizan pruebas de dos muestras para comparar dos métodos de enseñanza, dos
marcas, dos ciudades y otras cosas semejantes.
La hipótesis nula puede establecer que las dos poblaciones tienen medias iguales:
Para tamaños más pequeños de muestra, Z estará distribuida normalmente sólo si las dos
poblaciones que se muestrean también lo están.
6.6. Intervalos de confianza para la proporción poblacional
siendo el valor que en una distribución normal estándar deja a su derecha una probabilidad
de .
Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es plantearse a priori
obtener una cierta fiabilidad y precisión en la estimación, buscando el tamaño muestral necesario
para conseguirlas. La longitud del intervalo de confianza para p resulta:
En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión determinada
en el caso más desfavorable (p=q=0.5).
Son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de
elementos de dos o más clases. Las pruebas se basan en la premisa de que una proporción muestral
(es decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de la
población.
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la
proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de
prueba depende de si el número de observaciones de la muestra es grande o pequeño.
Las pruebas de grandes muestras de medias y proporciones son bastante semejantes. De este modo,
los valores estadísticos de prueba miden la desviación de un valor estadístico de muestra a partir
de un valor propuesto.
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla normal a
un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de
una o dos colas.
La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la tercera, una
prueba de dos colas.
Prueba de proporciones de dos muestras
El objetivo de una prueba de dos muestras es determinar si las dos muestras independientes fueron
tomadas de dos poblaciones, las cuales presentan la misma proporción de elementos con
determinada característica. La prueba se concentra en la diferencia relativa (diferencia dividida
entre la desviación estándar de la distribución de muestreo) entre las dos proporciones muéstrales.
El valor estadístico de prueba (diferencia relativa) es comparado con un valor tabular de la
distribución normal, a fin de decidir si H0 es aceptada o rechazada.
La hipótesis nula en una prueba de dos muestras es:
Por lo tanto, el valor estadístico de prueba para este caso es la prueba ji cuadrado o conocida
también como chi cuadrado
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en la cola) a partir
de una tabla de ji cuadrado, se debe seleccionar un nivel de significación y determinar los grados
de libertad para el problema que se esté resolviendo.
6.8. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Sea X1, X2,..., Xn1 una muestra aleatoria extraída de una población Bernoulli. Sea X la variable
Binomial definida como el número de éxitos en esta muestra y con parámetro π1, proporción
poblacional de éxitos.
Sea Y1, Y2,..., Yn2 una muestra aleatoria extraída de una población Bernoulli. Sea Y la variable
Binomial definida como el número de éxitos en esta muestra y tomemos a π2 como la
proporción de éxitos en esta otra población. Supongamos que ambas muestras son
independientes.
Algunas veces estamos interesados en analizar la diferencia entre las proporciones de poblaciones
de grupos con distintas características. Por ejemplo, pensemos que la administración de las tiendas
Oxxo cree, sobre la base de una investigación, que el porcentaje de hombres que visitan sus tiendas
9 o más veces al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo
mismo. Las especificaciones requeridas y el procedimiento para probar esta hipótesis es la
siguiente:
nH 45 nM 71
PH .58 PM .42
2. Especifica el nivel de significación de .05 . El valor crítico para la prueba de una sola
cola es de 1.64.
1 1
s phm P(1 P)
nH nM
donde:
n H PH nM PM
P
nH nM
PH = proporción muestra de hombres (H)
PM = proporción muestra de mujeres (M)
NH = tamaño de muestra hombres
NM = tamaño de muestra mujeres
Por lo tanto:
45(.58) 71(.42)
P 0.48
45 71
y
1 1
s phm .48(1 .48) 0.10
45 71
La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el valor crítico Z. La
administración no puede concluir con un 95 por ciento de confianza que la proporción de hombres
que visita 9 o más veces los Oxxo es mayor que la proporción de mujeres.
SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de proporciones. Probemos si
el porcentaje de hombres dueños de microempresas es estadísticamente diferente del porcentaje
de mujeres.
1634(83.9) 314(16.1)
P 72.97
1634 314
y
1 1
s phm ..73(1 ..73) 0.0274
1634 314
La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el valor crítico Z.
Podemos concluir que el porcentaje de hombres dueños de microempresas es estadísticamente
superior al porcentaje de mujeres propietarias de microempresas.
6.10. Intervalo de confianza para la varianza poblacional
Se llama intervalo de confianza para la varianza a un par de números entre los cuales se estima
que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente,
estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor
desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa
por 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio
o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante
tal intervalo.
6.11. Prueba de hipótesis para la varianza poblacional
Es frecuente que se desee comprobar si la variación o dispersión de una variable he tenido alguna
modificación, lo cual se hace con la prueba de hipótesis para la varianza.
Pruebas de hipótesis para la varianza poblacional:
Con σ0 2 para denotar el valor hipotético de la varianza poblacional, las tres formas de una prueba
de hipótesis son:
Estas tres pruebas son semejantes a las pruebas de hipótesis de las sesiones anteriores, para pruebas
de una o dos colas para medias y proporciones poblacionales.
Una vez calculado el estadistico de prueba X 2 , para determinar si se acepta o se rechaza la hipótesis
nula se encuentra el valor crítico y se realiza la comparación.
Ejemplo: Una empresa de transporte, desea dar una imagen de confiabilidad haciendo que sus
conductores sean puntuales en los horarios de llegada a las paradas. La empresa desea que haya
poca variabilidad en dichos tiempos. En términos de la varianza de los tiempos de llegada de las
paradas, la empresa desea que la varianza sea de 4 minutos o menos. Esta prueba de hipótesis se
realiza con un nivel de significancia de α = 0.05
Asuma que en una muestra aleatoria de 24 llegadas a cierta parada en una intersección en el centro
de la ciudad, la varianza muestral encontrada es s2=4.9
Paso 2: Nivel de significancia de α = 0.05, como la prueba es de una sola cola (la del lado derecho),
se considera una distribución X2 .
Paso 3: Obtenemos el valor critico X2c utilizando la tabla de valores de esta distribución:
Paso 5: Se concluye que existe evidencia suficiente para rechazar H0, en tal caso habrá que tomar
medidas para reducir la varianza poblacional.
En algunas aplicaciones estadísticas interesa comparar las varianzas de las calidades de producto
obtenido mediante dos métodos de producción diferentes, o las varianzas de tiempos de fabricación
empleando dos métodos diferentes, o las varianzas de temperaturas que se tienen con dos
dispositivos distintos de calentamiento. Para comparar dos varianzas poblacionales, se emplean
datos obtenidos de dos muestras aleatorias independientes, una de la población 1 y otra de la
población 2.