Você está na página 1de 14

Introduccion

Uno de los propósitos de la estadística inferencial es estimar las características poblacionales


desconocidas, examinando la información obtenida de una muestra, de una población. El punto de interés
es la muestra, la cual debe ser representativa de la población objeto de estudio.

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras reflejen observaciones
a la población de la que proceden, ya que solo se pueden hacer observaciones probabilísticas sobre una
población cuando se usan muestras representativas de la misma.

Muestreo

El muestreo es una herramienta que se utiliza cuando no es posible obtener la probabilidad de cada uno
de los elementos de una poblacion, es decir cuando se tienen una poblacion muy grande en donde no es
posible analizar toso los datos, pero si una muestra de ellos.

hipotesis

una hipotesis es una aseveración de una poblacion construida con el fin de poner a prueba, para saber si
una afirmación es verdadera o falsa.

La prueba de hipotesis es un procedimiento basado en la evidencia muestral y la teoría de la probabilidad,


lo cual se utiliza para determinar si la hipotesis es una afirmación razonable.

Pasos generales para realizar una prueba de hipotesis

1. Platear la hipotesis nula y la hipotesis alternativa


2. Seleccionar el nivel de significancia
3. Calculo del valor estadistico

Plantear la hipotesis nula y la alternativa

La hipótesis nula (H0): es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre
contiene un signo de igualdad con respecto al valor especificado del parámetro.

La hipótesis alternativa (H1): es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que
se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le
conoce también como la hipótesis de investigación.

Seleccionar el nivel de significancia

Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota


mediante la letra griegaα, también es denominada como nivel de riesgo, este término es más adecuado
ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel está
bajo el control de la persona que realiza la prueba.
Prueba media de una muestra
Se utiliza una prueba de una muestra para probar una afirmación con respecto a una media de una
población única.

Prueba media de dos muestras

Se utilizan para decidir si las medias de dos poblaciones son iguales. Se requieren dos muestras
independientes. Considérese, por ejemplo, una compañía investigadora que experimentan con dos
diferentes mezclas de pintura, para ver si se puede modificar el tiempo de secado de una pintura
para uso doméstico. Cada mezcla es probada un determinado número de veces, y comparados
posteriormente los tiempos medios de secado de las dos muestras. Una parece ser superior, ya que
su tiempo medio de secado (muestra) es 30 minutos menor que el de la otra muestra.
Pero, ¿son realmente diferentes los tiempos medios de secado de las dos pinturas, o esta diferencia
muestral es nada más la variación aleatoria que se espera, aun cuando las dos fórmulas presentan
idénticos tiempos medios de secado.
Con frecuencia se utilizan pruebas de dos muestras para comparar dos métodos de enseñanza, dos
marcas, dos ciudades y otras cosas semejantes.
La hipótesis nula puede establecer que las dos poblaciones tienen medias iguales:

Para tamaños más pequeños de muestra, Z estará distribuida normalmente sólo si las dos
poblaciones que se muestrean también lo están.
6.6. Intervalos de confianza para la proporción poblacional

En la inferencia sobre una proporción el problema se concreta en estimar y contrastar la proporción


p de individuos de una población que presentan una determinada característica A (proporción de
votantes a un partido político, proporción de parados, ...).

siendo el valor que en una distribución normal estándar deja a su derecha una probabilidad

de .

Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es plantearse a priori
obtener una cierta fiabilidad y precisión en la estimación, buscando el tamaño muestral necesario
para conseguirlas. La longitud del intervalo de confianza para p resulta:

De aquí podremos calcular el valor de n en función de la longitud del intervalo, L, y de su


fiabilidad, 1- :

Adviértase que llegamos a un resultado en principio incongruente: queremos saber cuántas


observaciones tenemos que realizar para estimar p y para ello necesitaremos conocer su
estimación, valor que conoceremos una vez hayamos realizado las observaciones. ¿Cómo
solucionar este problema? Existen tres posibles vías:

a) Si tuviésemos información (encuestas anteriores, opiniones de experto,...) sobre el posible valor


de la proporción a estimar, sustituiríamos este valor en la anterior expresión.
b) Podríamos
realizar una pequeña encuesta (encuesta piloto) que nos proporcionase una primera evaluación de
la proporción muestral. Además, esta encuesta puede servir para probar y reformar el cuestionario,
organizar el trabajo de campo, etc.
c) Si no contásemos con información alguna ni tuviésemos la
posibilidad de realizar la encuesta piloto, nos pondríamos en la situación más desfavorable, esto
es, la que da lugar al tamaño muestral más grande para la fiabilidad y precisión deseadas. Esa
situación se produce cuando n alcanza su máximo, lo cual ocurre cuando p=q=0.5.

En este caso, por otro lado el más habitual, resulta:

En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión determinada
en el caso más desfavorable (p=q=0.5).

6.7. Pruebas de hipótesis acerca de una proporción poblacional

Son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de
elementos de dos o más clases. Las pruebas se basan en la premisa de que una proporción muestral
(es decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de la
población.

Las pruebas para medias y proporciones se utilizar para evaluar afirmaciones:


1) Un parámetro de población único (prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras)
3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).
4) Prueba de proporciones de una muestra

Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la
proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de
prueba depende de si el número de observaciones de la muestra es grande o pequeño.
Las pruebas de grandes muestras de medias y proporciones son bastante semejantes. De este modo,
los valores estadísticos de prueba miden la desviación de un valor estadístico de muestra a partir
de un valor propuesto.

Esta prueba comprende el cálculo del valor estadístico de prueba Z

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla normal a
un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de
una o dos colas.

La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la tercera, una
prueba de dos colas.
Prueba de proporciones de dos muestras
El objetivo de una prueba de dos muestras es determinar si las dos muestras independientes fueron
tomadas de dos poblaciones, las cuales presentan la misma proporción de elementos con
determinada característica. La prueba se concentra en la diferencia relativa (diferencia dividida
entre la desviación estándar de la distribución de muestreo) entre las dos proporciones muéstrales.
El valor estadístico de prueba (diferencia relativa) es comparado con un valor tabular de la
distribución normal, a fin de decidir si H0 es aceptada o rechazada.
La hipótesis nula en una prueba de dos muestras es:

Prueba de proporciones de k muestras


La finalidad de una prueba de k muestras es evaluar la aseveración que establece que todas las k
muestras independientes provienen de poblaciones que presentan la misma proporción de algún
elemento. De acuerdo con esto, las hipótesis nula y alternativa son
En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias observadas
"o"(las que se observa directamente) y frecuencias esperadas o teóricas "e" (las que se calculan de
acuerdo a las leyes de probabilidad).

Por lo tanto, el valor estadístico de prueba para este caso es la prueba ji cuadrado o conocida
también como chi cuadrado
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en la cola) a partir
de una tabla de ji cuadrado, se debe seleccionar un nivel de significación y determinar los grados
de libertad para el problema que se esté resolviendo.
6.8. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Sea X1, X2,..., Xn1 una muestra aleatoria extraída de una población Bernoulli. Sea X la variable
Binomial definida como el número de éxitos en esta muestra y con parámetro π1, proporción
poblacional de éxitos.

Sea Y1, Y2,..., Yn2 una muestra aleatoria extraída de una población Bernoulli. Sea Y la variable
Binomial definida como el número de éxitos en esta muestra y tomemos a π2 como la
proporción de éxitos en esta otra población. Supongamos que ambas muestras son
independientes.

Si p1 y p2 son los estadísticos muéstrales y definimos a = p1-p2 como el estimador de la


diferencia de proporciones poblacionales θ = π1-π2 entonces se debe cumplir que
6.9. Prueba de hipótesis sobre la diferencia de proporciones poblacionales

Algunas veces estamos interesados en analizar la diferencia entre las proporciones de poblaciones
de grupos con distintas características. Por ejemplo, pensemos que la administración de las tiendas
Oxxo cree, sobre la base de una investigación, que el porcentaje de hombres que visitan sus tiendas
9 o más veces al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo
mismo. Las especificaciones requeridas y el procedimiento para probar esta hipótesis es la
siguiente:

1. Las hipótesis nula y alternativa son las siguientes:

H o  PH  PM  0 , la proporción de hombres que reportan 9 o más visitas por mes es la


misma o menor que la proporción de mujeres que hacen lo mismo.

H a  PH  PM  0 , la proporción de hombres que reportan 9 o más visitas por mes es


mayor a la proporción de mujeres que hacen lo mismo.

La información proporcionada es:

nH  45 nM  71

PH  .58 PM  .42

PH  PM  .58  .42  .16

2. Especifica el nivel de significación de   .05 . El valor crítico para la prueba de una sola
cola es de 1.64.

3. Estima el error estándar de la diferencia de las dos proporciones:

 1 1 
s phm  P(1  P)  
 nH nM 
donde:
n H PH  nM PM
P
nH  nM
PH = proporción muestra de hombres (H)
PM = proporción muestra de mujeres (M)
NH = tamaño de muestra hombres
NM = tamaño de muestra mujeres

Por lo tanto:

45(.58)  71(.42)
P  0.48
45  71
y

 1 1
s phm  .48(1  .48)    0.10
 45 71 

4. Calcula de prueba estadística:

(diferencia _ entre _ proporcion es _ observadas)  (diferencia _ entre _ proporcion es _ H o )


Z
s ph  m

(.58  .42)  (0)


Z  1.60
.10

La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el valor crítico Z. La
administración no puede concluir con un 95 por ciento de confianza que la proporción de hombres
que visita 9 o más veces los Oxxo es mayor que la proporción de mujeres.
SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de proporciones. Probemos si
el porcentaje de hombres dueños de microempresas es estadísticamente diferente del porcentaje
de mujeres.
1634(83.9)  314(16.1)
P  72.97
1634  314
y

 1 1 
s phm  ..73(1  ..73)    0.0274
 1634 314 

(.839  .161)  (0)


Z  24.74
.0274

La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el valor crítico Z.
Podemos concluir que el porcentaje de hombres dueños de microempresas es estadísticamente
superior al porcentaje de mujeres propietarias de microempresas.
6.10. Intervalo de confianza para la varianza poblacional
Se llama intervalo de confianza para la varianza a un par de números entre los cuales se estima
que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente,
estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor
desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa
por 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio
o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante
tal intervalo.
6.11. Prueba de hipótesis para la varianza poblacional
Es frecuente que se desee comprobar si la variación o dispersión de una variable he tenido alguna
modificación, lo cual se hace con la prueba de hipótesis para la varianza.
Pruebas de hipótesis para la varianza poblacional:

Con σ0 2 para denotar el valor hipotético de la varianza poblacional, las tres formas de una prueba
de hipótesis son:
Estas tres pruebas son semejantes a las pruebas de hipótesis de las sesiones anteriores, para pruebas
de una o dos colas para medias y proporciones poblacionales.

En una prueba de hipótesis para la varianza poblacional de emplean el valor hipotético de la


varianza poblacional σ0 2 y la varianza muestral S 2 para calcular el valor estadistico de prueba X 2 .
Si la población tiene una distribución normal, el estadistico de prueba es el siguiente:

Una vez calculado el estadistico de prueba X 2 , para determinar si se acepta o se rechaza la hipótesis
nula se encuentra el valor crítico y se realiza la comparación.

Ejemplo: Una empresa de transporte, desea dar una imagen de confiabilidad haciendo que sus
conductores sean puntuales en los horarios de llegada a las paradas. La empresa desea que haya
poca variabilidad en dichos tiempos. En términos de la varianza de los tiempos de llegada de las
paradas, la empresa desea que la varianza sea de 4 minutos o menos. Esta prueba de hipótesis se
realiza con un nivel de significancia de α = 0.05

Asuma que en una muestra aleatoria de 24 llegadas a cierta parada en una intersección en el centro
de la ciudad, la varianza muestral encontrada es s2=4.9

Paso 1: Formular las hipótesis


 Ho: σ2 ≤ 4
 Ha: σ2 > 4

Paso 2: Nivel de significancia de α = 0.05, como la prueba es de una sola cola (la del lado derecho),
se considera una distribución X2 .

Paso 3: Obtenemos el valor critico X2c utilizando la tabla de valores de esta distribución:

Grados de libertad = n-1= 24 – 1 = 23 (renglones de tabla).


Probabilidad: nivel de significancia α = 0.05 (columnas de tabla).
Buscando estos valores en la tabla tenemos que X2c = 35.172.
Paso 4: Calcular el estadístico de prueba X2p 𝑋𝑝2 = (𝑛 − 1)𝑠2 𝜎02 = (24 − 1)(4.9) 4 = 28.18
Si el estadístico de prueba es menor que el valor crítico, se rechaza H0, de manera contraria se
acepta. Por lo tanto, para esta prueba, tenemos que:

28.18 < 35.172, se rechaza H0

Paso 5: Se concluye que existe evidencia suficiente para rechazar H0, en tal caso habrá que tomar
medidas para reducir la varianza poblacional.

6.12. Prueba de hipótesis para un comparativo de varianza poblacionales

En algunas aplicaciones estadísticas interesa comparar las varianzas de las calidades de producto
obtenido mediante dos métodos de producción diferentes, o las varianzas de tiempos de fabricación
empleando dos métodos diferentes, o las varianzas de temperaturas que se tienen con dos
dispositivos distintos de calentamiento. Para comparar dos varianzas poblacionales, se emplean
datos obtenidos de dos muestras aleatorias independientes, una de la población 1 y otra de la
población 2.

Distribución muestral de 𝑠12/𝑠22 cuando 𝜎12/𝜎22 se utiliza la distribución F con n1 -1 grados de


libertad en el numerador y n2 -1 grados de libertad en el denominador. Formula general del
estadistico de prueba:

Você também pode gostar