Você está na página 1de 15

La Inferencia Estadística es el procedimiento por medio del cual se llega a conclusiones

acerca de una población con base en la información que se obtiene a partir de una
muestra seleccionada de esa población.
Ref. Gustavo Larrazabal

► El proceso de Estimación implica calcular, a partir de los datos de una muestra,


alguna estadística que se ofrece como aproximación correspondiente de la población de
la cual fue extraída la muestra. Ref. Gustavo Larrazabal

La estimación puede ser: Puntual o por intervalos.

Estimación Puntual: Es solo un valor numérico utilizado para estimar el parámetro


correspondiente de la población.
Ref. Gustavo Larrazabal

Otro Conceptos:
1. Una estimación puntual del valor de un parámetro poblacional desconocido
(como puede ser la media µ , o la desviación estándar σ ), es un número que se
utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de
realizar tal estimación, tomaremos una muestra de la población y calcularemos el
parámetro muestral asociado ( x para la media, s para la desviación estándar,
etc.). El valor de este parámetro muestral será la estimación puntual del parámetro
poblacional.

2. Una estimación es puntual cuando se usa un solo valor extraído de la muestra


para estimar el parámetro desconocido de la población. Al valor usado se le llama
estimador.

La distinción técnica entre un estimador como una función de variables aleatorias y una
estimación como un único número es la distinción entre un proceso (el estimador) y el
resultado del proceso (la estimación).
Cuando se analiza la estimación de un parámetro desconocido, deben considerarse dos
posibilidades.

1. Puede calcularse un único número a partir de la muestra y considerar que es el


más representativo del parámetro poblacional desconocido. Se llama estimación
puntual.
2. También se puede hallar el intervalo o rango que es más probable que contenga el
valor del parámetro poblacional: intervalo de confianza. Una estimación de este
tipo indica el error de dos maneras: por la extensión del intervalo y por la
probabilidad de que el verdadero parámetro poblacional se encuentre dentro del
intervalo.

A menudo, una estimación puntual es insuficiente debido a que sólo tienen dos opciones:
es correcta o está equivocada. Una estimación puntual es mucho más útil si viene
acompañada por una estimación del error que podría estar implicando. Ambas
estimaciones, la puntual y el intervalo de confianza, son complementarias.
Las propiedades de los estimadores que se van a analizar son tres:

1.Insesgadez. Un estadístico es un estimador insesgado (no sesgado) si, en promedio,


tiende a tomar valores que están por arriba del parámetro de la población que se está
estimando con la misma frecuencia y la misma extensión con la que tiende a asumir
valores por abajo del parámetro poblacional que se está estimando.

2.Consistencia. Un estadístico es un estimador consistente de un parámetro de la


población si al aumentar el tamaño de la muestra, se tiene casi la certeza de que el valor
del estadístico se aproxima bastante al valor del parámetro poblacional. Si un estimador
es consistente, se vuelve más confiable al tener tamaños de muestra más grandes.

3.Eficiencia. La eficiencia se refiere al tamaño del error estándar del estadístico. Si


comparamos dos estadísticos de una muestra del mismo tamaño y tratamos de decir cuál
de ellos es un estimador más eficiente, escogeríamos el estadístico que tuviera el menor
error estándar o la menor desviación estándar de la distribución muestral. Tiene sentido
pensar que un estimador con un error estándar menor (con menos variación) tendrá
mayor oportunidad de producir una estimación más cercana al parámetro poblacional que
se está considerando.

Se dice que un estimador puntual θˆ es un estimador insesgado de un parámetro


poblacional θ si su valor esperado es igual a ese parámetro.

Estimación por intervalos: Dada una población x sigue una distribución cualquiera con
media y desviación estándar. Ref. Gustavo Larrazabal

Sabemos que el TLC de valores grandes cuando n es mayor que 30.


Ref. Gustavo Larrazabal
Otro Conceptos:
1. A veces es conveniente obtener unos límites entre los cuales se encuentre el
parámetro con un cierto nivel de confianza, en este caso hablamos de estimación
por intervalos.
2. Consiste en dos valores entre los cuales esperamos que se encuente el verdadero
valor del parámetro
3. Un estimador de un intervalo de confianza de un parámetro poblacional es una
regla para hallar (basándose en la información muestral) un intervalo que es
probable que incluya ese parámetro. La estimación correspondiente se llama
estimación de un intervalo de confianza.
Ensayos de hipótesis
Que es una hipótesis:
Es una declaración sobre el valor de un parámetro de la población desarrollado con el fin
de poner a prueba.

Que es una prueba de hipótesis: E un procedimiento basado en la evidencia de la


muestra y la teoría de las probabilidades, usadas para determinar si la hipótesis es una
declaración razonable y no debe ser rechazada, o es irrazonable y debe ser rechazada.

PRUEBA DE HIPOTESIS
Nuestro objetivo al tomar una muestra es extraer alguna conclusión o inferencia sobre una
población. El interés es conocer acerca de los parámetros que caracterizan la población
en estudio. El único motivo para examinar muestras es que las poblaciones suelen ser
demasiado grandes y costosas de estudiar. Ref. Gustavo Larrazabal

La prueba de hipótesis es un procedimiento estadístico que comienza con una suposición


que se hace con respecto a un parámetro de población, luego se recolectan datos de
muestra, se producen estadísticas de muestra y se usa esta información para decidir qué
tan probable es que sean correctas nuestras suposiciones acerca del parámetro de la
población en estudio.
Ref. Gustavo Larrazabal

Ejemplos de hipótesis pueden ser: Se desea


a) Probar si las ventas diarias de un abasto son 1 Millón de bolívares o no
b) Probar si la proporción de individuos que compran algún artículo en una tienda es o no
mayor del 0.3.
Ref. Gustavo Larrazabal
Objetivo de la prueba de hipótesis
Decidir, basado en una muestra de una población, cuál de dos hipótesis complementarias
es cierta. Las dos hipótesis complementarias se denominan hipótesis nula e hipótesis
alternativa.
Ref. Gustavo Larrazabal
 Hipótesis Nula (H0)
Representa la hipótesis que mantendremos cierta a no ser que los datos indiquen su
falsedad. Esta hipótesis nunca se considera aceptada, en realidad lo que se quiere decir
es que no hay suficiente evidencia estadística para rechazarla por lo que aceptar H0 no
garantiza que H0 sea cierta. Es la hipótesis que se desea probar.
Ref. Gustavo Larrazabal
Otros conceptos:
1. Representa la afirmación de lo que se supone está sucediendo en el momento.
2. Es la más precisa de las dos hipótesis formuladas. Su rechazo da como resultado
la aceptación de la alternativa.
3. Es aquella en la que se asegura que los dos parámetros analizados son
independientes uno del otro.

 Hipótesis Alternativa (H1 o Ha)


Hipótesis que se acepta cuando los datos no respaldan la hipótesis nula.
Ref. Gustavo Larrazabal
Otros conceptos:
1. Contradice la afirmación de Ho. Es la hipótesis del experimentador.
2. Por lo general es la hipótesis de la investigación, es decir, la que se formula
inicialmente.
3. Es aquella en la que se asegura que los dos parámetros analizados si son
dependientes.

La elaboración de las hipótesis nula y alternativa. En algunas aplicaciones no parece


obvio cómo formular la hipótesis nula y la hipótesis alternativa. Se debe tener cuidado en
estructurar las hipótesis apropiadamente de manera que la conclusión de la prueba de
hipótesis proporcione la información que el investigador o la persona encargada de tomar
las decisiones desea. Se darán los lineamientos para establecer la hipótesis nula y la
hipótesis alternativa en tres tipos de situaciones en las cuales se suele emplear el
procedimiento de prueba de hipótesis.

Resumen de las formas para las hipótesis nula y alternativa: Se refieren a dos
parámetros poblacionales: la media poblacional y la proporción poblacional. A partir de la
situación, las pruebas de hipótesis para un parámetro poblacional asumen una de estas
tres formas: en dos se emplean desigualdades en la hipótesis nula y en la tercera se
aplica una igualdad en la hipótesis nula. En las pruebas de hipótesis para la media
poblacional, μ0 denota el valor hipotético y para la prueba de hipótesis hay que escoger
una de las formas siguientes.

A las dos primeras formas se les llama pruebas de una cola. A la tercera se le llama
prueba de dos colas. Con frecuencia se tienen situaciones en las que no es obvio cómo
elegir H0 y Ha y se debe tener cuidado para elegirlas en forma adecuada. Sin embargo,
como se observa en las formas anteriores, la igualdad (ya sea ≥, ≤, O, =) debe aparecer
siempre en la hipótesis nula. Al elegir la forma adecuada para H0 y Ha hay que tener en
mente que la hipótesis alternativa a menudo es lo que la prueba está tratando de
demostrar. Por tanto, preguntarse si el usuario está buscando evidencias en apoyo de μ ‹
μ0, μ › μ0, o μ ≠ μ0 ayuda a determinar Ha.
3.3 Nivel de significancia
3.4 Error tipo I y tipo II
Tipos de errores
Cuando se decide sobre el rechazo de una hipótesis se pueden cometer dos
equivocaciones.

a) Error tipo I (α): Es el rechazo de una hipótesis nula cuando esta es cierta.
b) Error tipo II (β): Es la aceptación de una hipótesis nula cuando esta es falsa.
Una vez especificado el valor de α, el de β queda fijado para cualquier tamaño de
muestra determinado. El valor de β depende del valor verdadero de μ por lo tanto
existe un número infinito de valores de β, ya que hay un valor de β diferente para
cada valor verdadero que pueda tomar μ. Ahora bien, dado un valor fijo de α, la
probabilidad de cometer un error de tipo II disminuirá a medida que aumente el
tamaño de la muestra.

Existe un equilibrio entre los dos tipos de errores, la probabilidad de cometer un


tipo de error puede reducirse sólo si deseamos incrementar la probabilidad de
cometer el otro.

c) Se llama potencia a la probabilidad de rechazar H0 siendo H0 falsa, es decir,


potencia = 1-.

Ref. Gustavo Larrazabal


Otros conceptos:
Errores tipo I y II Las hipótesis nula y alternativa son afirmaciones opuestas acerca de la
población. Una de las dos, ya sea la hipótesis nula o la alternativa es verdadera, pero no
ambas. Lo ideal es que la prueba de hipótesis lleve a la aceptación de H0 cuando H0 sea
verdadera y al rechazo de H0 cuando Ha sea verdadera. Por desgracia, las conclusiones
correctas no siempre son posibles. Como la prueba de hipótesis se basa en una
información muestral debe tenerse en cuenta que existe la posibilidad de error. La tabla
9.1 ilustra las dos clases de errores comunes en una prueba de hipótesis. En el primer
renglón de la tabla 9.1 se muestra lo que sucede cuando se acepta H0. Si H0 es
verdadera la conclusión es correcta. Pero, si Ha es verdadera se comete un error tipo II;
es decir, se acepta H0 cuando es falsa. En el segundo renglón de la tabla 9.1 se muestra
lo que sucede si la conclusión es rechazar H0. Si H0 es verdadera se comete un error tipo
I; es decir, se rechaza H0 cuando es verdadera. Pero si Ha es verdadera, es correcto
rechazar H0.

SITUACIONES POSIBLES AL PROBAR UNA HIPÓTESIS.

H0 es H0 es falsa
verdadera
Se acepta H0 Decisión Error tipo II
correcta
Se rechaza H0 Error tipo I Decisión correcta

Hay que dejar claro que al trabajar con una muestra y no con toda la población, el
rechazar ó no rechazar la hipótesis nula puede llevar a un error.
Tipos de pruebas
a) Pruebas de hipótesis de 2 extremos o bilaterales.
Es una prueba en la que H0 se rechaza si el valor de la muestra es significativamente
mayor o menor que el valor hipotetizado del parámetro de población. Esta prueba
involucra dos regiones de rechazo.

Ejemplo: Para probar la hipótesis alternativa bilateral

Ref. Gustavo Larrazabal

b) Pruebas de hipótesis de 1 extremo o unilaterales. Es una prueba en la que sólo hay


una región de rechazo, es decir, sólo nos interesa si el valor observado se desvía del
valor hipotetizado en una dirección. Pueden ser:
b.1) Prueba de extremo inferior: Es una prueba en la que si hay un valor de muestra que
se encuentra significativamente por debajo del valor de la población hipotetizado, nos
llevará a rechazar la hipótesis nula. Gráficamente:

b.2) Prueba de extremo superior. Es una prueba en la que, si hay un valor de muestra que
se encuentra significativamente por encima del valor de la población hipotetizado, nos
llevará a rechazar la hipótesis nula. Gráficamente:

Ref. Gustavo Larrazabal


PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS

1) Del contexto del problema, identificar el parámetro de interés.


2) Establecer la hipótesis nula, 𝐻0 .
3) Especificar una apropiada hipótesis alternativa, 𝐻1 . (Ha)
4) Seleccionar un nivel de significancia α.
5) Establecer un estadístico de prueba apropiado.
6) Establecer la región de rechazo para el estadístico.
7) Calcular todas las cantidades muestrales necesarias, sustituirlas en la ecuación
para el estadístico de prueba, y calcular el valor correspondiente.
8) Decidir si debe o no rechazarse 𝐻0 y notificar esto en el contexto del problema.

Los pasos 1 a 4 deben completarse antes de examinar los datos muestrales.

Estadísticos de Pruebas a utilizar:


a) Prueba de hipótesis para la media:
a.1 Para varianza conocida el estadístico es:

𝑋̅ − 𝜇
𝑍=
σ2 /√𝑛
a.2 Para varianza desconocida y muestras pequeñas, n < 30, y
aproximadamente normal la población, el estadístico es:

𝑋̅ − 𝜇
𝑇=
𝑆/√𝑛
Y para muestras grandes (n ≥ 30), el estadístico es:

𝑋̅ − 𝜇
𝑍=
σ2 /√𝑛

a.3 Pruebas de hipótesis para proporciones (muestras grandes np≥5, n(1-p)≥5),


el estadístico es:
𝑃̂ − 𝑝
𝑍=
√𝑝(1 − 𝑝)
𝑛

Ref. Gustavo Larrazabal


NIVEL DE SIGNIFICANCIA: Es la probabilidad de cometer un error tipo I cuando la
hipótesis nula es verdadera como igualdad.

Para denotar el nivel de significancia se usa la letra griega α (alfa), y los valores que se
suelen usar para α son 0.05 y 0.01. En la práctica la persona responsable de la prueba de
hipótesis especifica el nivel de significancia. Al elegir α se controla la probabilidad de
cometer un error tipo I. Si el costo de cometer un error tipo I es elevado, los valores
pequeños de α son preferibles. Si el costo de cometer un error tipo I no es demasiado
elevado, entonces se usan valores mayores para α. A las aplicaciones de la prueba de
hipótesis en que sólo se controla el error tipo I se les llama pruebas de significancia.
Muchas aplicaciones de las pruebas de hipótesis son de este tipo.

Aunque en la mayor parte de las aplicaciones de las pruebas de hipótesis se controla la


probabilidad de cometer un error tipo I, no siempre sucede lo mismo con un error tipo II.
Por tanto, si se decide aceptar H0 no es posible establecer la confianza en esa decisión.
Debido a la incertidumbre de cometer un error tipo II al realizar una prueba de
significancia los dedicados a la estadística suelen recomendar que se diga “no se rechaza
H0” en lugar de “se acepta H0”. Decir “no se rechaza H0” implica la recomendación de
reservarse tanto el juicio como la acción. En efecto al no aceptar directamente H0, se
evita el riesgo de cometer un error tipo II. Siempre que no se determine y controle la
probabilidad de cometer un error tipo II, no se dirá “se acepta H0”. En esos casos sólo son
posibles dos conclusiones: no se rechaza H0 o se rechaza H0. Aunque controlar el error
tipo II en una prueba de hipótesis es poco común, es posible.
EJERCICIO 1: Prueba de Hipótesis de la media, muestras pequeñas.

Debido al ahorro energético en el País CORPOELEC publica cifras del número anual de
Kilowatt-hora que gastan varios aparatos electrodomésticos. Se afirma que una aspiradora
gasta un promedio mínimo de 46 kilowatt-hora al año. Si una muestra aleatoria de 12
hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un
promedio de 42 kilowatt-hora al año con una desviación estándar de 11.9 kilowatt-hora,
¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-
hora es normal.

Solución:
1. Sea μ: gasto promedio en kilowatt-hora al año de una aspiradora.
μ= 46 kilowatt-hora, s= 11.9 kilowatt-hora
𝑥̅ = 42 kilowatt-hora
𝑛 = 12
2. H0 : μ ≥ 46
3. H1 : μ < 46
4. Nivel de significancia: 0.05
5. Estadístico de prueba: Como la varianza de la población es desconocida y el
tamaño de muestra es menor de 30, y se supuso que la población es norma,
utilizaremos la distribución t de student en el cálculo del estadístico:
𝑋̅ − 𝜇
𝑡0 =
𝑆/√𝑛
6. Región de Rechazo:

t α, n-1

Puesto que es un intervalo unilateral se utiliza tα,n-1 → Por la tabla IV se obtiene el

estadístico t0,05,11 = 1.796

Si 𝑡0 < - 1,796 Rechazar la H0


Si t0 ≥ - 1,796 Aceptar la H0

7. Se evalua 𝑡0 para los datos:


42̇ − 46
𝑡0 = = −1.16
11.9/√12
8. Justificación y decisión:

Como (𝑡0 > −t0,05,11), es decir, -1.16 > -1.796, no se rechaza Ho y se concluye con un nivel
de significancia del 0.05 que no existen suficientes evidencias para afirmar que el número
promedio de kilowatt-hora que gastan al año las aspiradoras sea menor de 46 Kw la hora.

Ref. Gustavo Larrazabal


EJERCICIO 2: Prueba de Hipótesis de la media, muestras grandes.

El peso en libras de una muestra aleatoria de bebés de seis meses sigue una distribución
normal con una desviación de 1.21 libras. Según se ha establecido, en promedio un bebé
de esta edad debe pesar alrededor de 14 libras. Un pediatra sin embargo considera que
ahora los bebés han variado su peso y para ello ha considerado el peso de 100 bebés de
esta edad obteniendo un peso medio de 14.3 libras. Con un nivel de confianza del 5%,
pruebe si el pediatra tiene razón en lo planteado.

Solución:
1. Sea μ: peso promedio en libras de una población de bebes de 6 meses.
𝜇0 = 14 Libras, σ = 1.21 libras
𝑥̅ = 14.3 libras
𝑛 = 100
2. H0 : μ = 14
3. H1 : μ ≠ 14.3
4. Nivel de significancia: 0.05
5. Estadístico de prueba: Como la varianza de la población es conocida, n>30 y la
distribución es normal, utilizamos el estadístico z:
𝑋̅ − 𝜇
𝑍=
σ2 /√𝑛
6. Región de Rechazo:

α/2 α/2

-Z α/2 Z α/2

Puesto que es un intervalo bilateral se utiliza zα/2 → Por la tabla II se obtiene el


estadístico z0,975 = 1.96

Si 𝑧0 < - 1,96 ó z0 ≥ 1,96 Rechazar la H0

Si 1.96 ≤ z0 ≤ 1,96 Aceptar la H0

Ref. Gustavo Larrazabal


7. Se evalua 𝑡0 para los datos:
̇ − 14
14.3
𝑧0 = = 2.48
1.21/√100
8. Justificación y decisión
Como 𝑧0 = 2.48 >1.96, se rechaza Ho y se concluye con un nivel de significancia del 0.05
que el peso promedio de todos los bebés de seis meses ha variado según las pruebas
disponibles.

EJERCICIO 3: Prueba de Hipótesis para proporciones.

Históricamente la proporción de clientes que compran con tarjeta de crédito en una


determinada tienda es como mínimo del 25%, sin embargo la dueña de la tienda piensa
que esta cifra ha disminuido significativamente. De los últimos 1122 clientes 242
compraron con tarjeta de crédito, si α = 10%. ¿Se está cumpliendo lo que piensa la
dueña?.

Solución:
1. Sea p: proporción promedio de clientes que compran con TDC.
𝑝0 = 0.25,
𝑃̅ = 242/1122 = 0.215
𝑛 = 1122
2. H0 : p = 0.25
3. H1 : p < 0.25
4. Nivel de significancia: 0.1
5. Estadístico de prueba es:
𝑃̂ − 𝑝0
𝑍0 =
√𝑝(1 − 𝑝)
𝑛
6. Región de Rechazo: Rechazar H0: p= 0.25 si 𝑧0 < −𝑧0.1 = -1.29
7. Se evalúa 𝑡0 para los datos:
̇ − 0.25
0.215
𝑍0 = = −2.707
√0.25(1 − 0.25)
1122
8. Justificación y decisión
Como 𝑧0 = −2.707 < −1.29 , se rechaza Ho y se concluye con un nivel de significancia
del 0.1 que se cumpliendo lo que piensa la dueña.
Ref. Gustavo Larrazabal
Glosario:

Hipótesis nula H 0 : Una declaración sobre el valor de un parámetro de la población.

Hipótesis alternativa H 1 : Una declaración que se acepta si los datos de la muestra


proporcionan evidencia de que la hipótesis nula es falsa.

Nivel de significancia: La probabilidad de rechazar la hipótesis nula cuando es verdadera.

Error tipo I: Rechazar la hipótesis nula cuando es verdadera.

Error tipo II: Aceptar la hipótesis nula cuando es falsa.

Estadístico de prueba: Un valor determinado a partir de la información muestral, usado


para determinar si se rechaza la hipótesis nula.

Valor crítico: Punto de división entre la región en la que se rechaza la hipótesis nula y la
región en la que no rechaza la hipótesis nula.

https://es.slideshare.net/lexoruiz/pruebas-de-hiptesis-para-una-muestra