Escolar Documentos
Profissional Documentos
Cultura Documentos
INTRODUCCIN
Los objetivos de esta unidad son:
REPASANDO!!
Ac retomaremos algunas de los conceptos que vimos en la unidad de Azar. Eventualmente
les podra ser til releerla!!!
En nuestras investigaciones siempre trabajamos con muestras. Sin
embargo el propsito de nuestra investigacin no es saber qu pasa en la
muestra, si no extrapolar esos hallazgos a toda la poblacin de individuos
similares a la muestra.
Uno de los principales propsitos del anlisis estadstico es usar la informacin obtenida de
una muestra de individuos para realizar inferencias de lo que ocurre en la poblacin.
En otros casos, lo que se pretende es tomar decisiones, y aqu tambin la estadstica
inferencial nos lo permite, siempre con un margen controlado de error.
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
ESTIMACIN
Comenzaremos con los conceptos de estimacin e intervalos de confianza, para ello
repasaremos primero la distribucin de muestreo
Distribucin de muestreo
Recordemos tambin que una distribucin de probabilidad (y, por tanto, cualquier
distribucin de muestreo) poda ser descripta parcialmente por dos parmetros: su media y
desviacin estndar o desvo estndar o desvo tpico.
Veamos todo esto con un ejemplo:
Recuerdan el ejercicio de la unidad de azar, donde seleccionaron 10 muestras de n= 10 y
calcularon las medias? Bueno utilizaremos todas esas muestras para este ejemplo.
Obtuvimos en total 340 medias (es decir 340 muestras de tamao 10). Tomaremos esas
medias como si fueran valores y calcularemos la media de esas medias, y el desvo estndar de
las medias conocido como.... ERROR ESTANDARD
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
Observaciones
MEDIA
Total
16822.2000 49.4771
340
Mnimo
25%
Mediana 75%
Varianza
Desviacin tpica
o desvo
estndar
10.0436
3.1692
Mximo Moda
10
Frequency
20
30
40
ver en el eje de las x los intervalos de edad que tomo cada programa son diferentes)
40
45
50
Media
55
60
normal!!
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
Como dijimos, a esta curva de distribucin la definen dos parmetros que son:
la media y
el desvo estndar.
En este caso la media ser la media de medias (recordemos que cada una era una media
de una muestra de tamao 10!!!) y el DS es el DS de la media de medias: cmo lo llamaremos??
Correcto!! Lo llamaremos: Error estndar.
Los resultados de estos dos estadsticos son:
MEDIA
Desviacin tpica
49.4771
3.1692
Media
49.42
Desvo Estndar
10.10
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
El teorema del lmite central es tal vez el ms importante de toda la inferencia estadstica.
Nos asegura que la distribucin de muestreo de la media se aproxima a la normal al
incrementarse el tamao de la muestra.
Una muestra no tiene que ser muy grande para que la distribucin de muestreo de la
media se acerque a la normal. Los estadsticos utilizan la distribucin normal como una
aproximacin a la distribucin de muestreo siempre que el tamao de la muestra sea al menos de
30, pero la distribucin de muestreo de la media puede ser casi normal con muestras incluso de la
mitad de ese tamao.
La importancia del teorema del lmite central es que nos permite usar
estadsticas de nuestra muestra para hacer inferencias con respecto a los
parmetros de poblacin sin saber nada sobre la forma de la distribucin
de frecuencias de esa poblacin ms que lo que podamos obtener de la
muestra.
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
Media
46.9
DS
Error
estndar
10.8058626 3.41711379
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
43,5
46,9 50,3
Entonces sabemos que entre 43,5 y 50,3 estarn el 68,26% de la poblacin, entre 40,6 y
53,7 estarn el 95,44 % de la poblacin.
PERO CUIDADO AC: DE QU POBLACIN ESTAMOS HABLANDO?
Respuesta 1:__________________________________
Este es un buen momento para introducir el concepto de intervalo de confianza!
Intervalo de confianza
Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de
confianza especfico.
Pero qu es un NIVEL DE CONFIANZA especfico?
Es la probabilidad de que el parmetro a estimar se encuentre en el intervalo de
confianza. Los mas utilizados son el 95% o en 99%.
El concepto es que el intervalo de confianza cubre una amplia proporcin de la
distribucin de muestreo del estadstico que estamos investigando.
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
Por lo tanto, sabemos que 1,96 DS por arriba y por abajo esta el 95% de la poblacin.
Muestra
Media
46.9
DS
Error
estndar
10.8058626 3.41711379
Queremos entonces saber entre qu valores estar el 95% de las medias si tomamos
muestras de tamao 10 de esa poblacin.
La formula nuevamente es muy sencilla y la pueden deducir ustedes!
Claro no hay ms que sumarle 1,96 DS para arriba y 1,96 DS para debajo de la media.
Entonces sera:
Limite inferior = X (1,96 x ES)
= 46,9 (1,96 x 3,42) = 40,20
Limite superior= X + (1,96 x ES)
= 46,9 + (1,96 x 3,42) = 53,6
Esto quiere decir que yo tengo un 95% de confianza que el valor real (parmetro) de la
media de edad de esta poblacin est entre 40,2 y 53,6 aos. O dicho de otro modo: si
seleccionamos 100 muestras (en este caso de tamao 10) al azar de la poblacin y usamos esas
muestra para calcular 100 diferentes intervalos de confianza para u (media de la poblacin:
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
30
40
Media
50
60
70
Podemos ver que cada una de estas muestras no contiene el 49,42 que es el valor de la
media de la poblacin, en su intervalo de confianza del 95%. Sin embargo, las otras 95
muestras s lo contienen!
Veamos esto en un grafico:
20
40
60
80
100
Muestra
Se animan a encontrar las muestras cuyos Intervalos de confianza no contienen el valor real de la
media de la poblacin??
Respuesta 3:___
Confirmamos lo que venamos diciendo!!
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
10
No significa que u sea una variable aleatoria que asume un valor dentro del intervalo
95 % de las veces.
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
11
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
12
TEST DE HIPTESIS
Recordemos que habamos dicho que las dos grandes formas de realizar estadstica
inferencial eran:
la estimacin y
el test de hiptesis o testeo de hiptesis o contraste de hiptesis.
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
13
La pregunta del milln es: Por qu si nosotros queremos comprobar una hiptesis (como
dijimos generalmente la hiptesis de diferencia), lo que contrastamos o testeamos es la hiptesis
nula (hiptesis de no diferencia)?
Para testear o contrastar una hiptesis estadsticamente debemos conocer el valor del
efecto (lo mencionamos ms arriba). Cuando testeamos la hiptesis nula, cul es el valor del
efecto? S, correcto: es 0!
Sin embargo, si quisiramos testear la hiptesis alternativa, qu valor de efecto
pondramos? Tendramos que realizar un clculo estadstico para cada valor de efecto que
quisiramos contrastar, y esto sera muy poco prctico!!
Volveremos sobre esto, no desesperen!
Ejemplo 1
Un fabricante de lmparas elctricas sostiene que la duracin media de las
mismas (horas) es en promedio de 1.300 h. Se toma una muestra de 17 lmparas
siendo el resultado de la media de 1100 h.
Cul es la hiptesis nula y cul la alternativa?
Respuesta 4:_____
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
14
Ejemplo 2
Un semillero publicita que el peso promedio de una espiga de una cierta variedad es de
180 gramos con un desvo estndar de 30 gramos. Un productor de avanzada sospecha que el
peso es distinto de 180 gramos, decide por lo tanto conducir un experimento. El propsito del
mismo es ver si el peso de 180 gramos es incorrecto. Por lo tanto
Cul es la hiptesis nula de inters?
Cul es la hiptesis alternativa?
Cul es la hiptesis nula y cul la alternativa?
Respuesta 5:_____
valor observado
valor esperado
Obviamente, esta es una formula general que tiene variaciones en cada estadstico que
veamos, pero conceptualmente ayuda mucho a comprender qu es lo que hacemos cuando
hacemos los clculos para el test de hiptesis.
Veamos un ejemplo.
Supongamos que sabemos que el colesterol promedio de la poblacin entre 20 y 74
aos es de 211 mg %. Queremos saber si los pacientes hombres hipertensos tienen el mismo
colesterol. Seleccionamos una muestra al azar de 12 hombres de esta poblacin y les
medimos su colesterol. Encontramos que el valor promedio es de 217 mg % y DS: 46 mg %
Cul es la hiptesis nula? Cul la hiptesis alternativa?
Respuesta 6:_____
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
15
Adivinen qu?
Esta probabilidad es el famoso valor de p!!!
0
p-valor!!
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
16
Veamos el grfico:
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
17
Esto dicho de otra manera sera: la probabilidad de que mis pacientes tengan la misma
edad que la poblacin general a la luz de lo que encontr en mi muestra, es muy baja.
Si digo que mis pacientes son ms viejos que la poblacin general, tengo muy poca
probabilidad de equivocarme. Puedo equivocarme, pero la probabilidad de error es de 2 por 1000.
Qu pasa si el p valor es alto?
Supongamos que en nuestro ejemplo obtengamos un p valor de 0,5 (50%).
La probabilidad de encontrar valores como los de nuestra muestra, si la hiptesis nula es
cierta, es alta. La hiptesis nula es bastante probable a la luz de los hallazgos de mi muestra.
Esto dicho de otra manera sera: la probabilidad de que mis pacientes tengan la misma
edad a la luz de lo que med en la muestra es alta. Si digo que mis pacientes son ms viejos,
tengo mucha probabilidad de equivocarme.
1 Error de tipo I: que es rechazar la hiptesis nula cuando la hiptesis nula es verdadera:
la probabilidad de cometer este tipo de error es justamente . Por eso, a este error se lo
denomina muchas veces error . y
2- rror de tipo II: conocido como error de aceptacin o error : aceptar la hiptesis nula
cuando la hiptesis nula es falsa. es la probabilidad de cometer un error de tipo II.
Veamos esto con un ejemplo ms grfico!!!. Supongamos que nosotros somos miembros
de un jurado, donde se presenta un acusado por asesinato. Hay una sola verdad: el sujeto es
culpable o es inocente: cometi o no cometi el asesinato.
El jurado llega a un veredicto: y pueden ocurrir cuatro cosas que se grafican en el siguiente
cuadro:
1- El acusado era inocente y el jurado lo declaro inocente: OK esta todo bien: buen
trabajo: el tipo sale libre y no hay problema.
2- El acusado era culpable (el muy desgraciado la mat!!), y el jurado (muy astutos
ellos!!), lo declaran culpable: cadena perpetua: y todo OK (merecido se lo tena!!).
3- Que declare al acusado culpable y el pobre tipo era inocente!!!: Error de tipo I,
4- Que el jurado declare al acusado inocente y el muy desgraciado era culpable: Error de
tipo II
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
18
Veredicto del
Acusado
Jurado
Inocente
Culpable
Inocente
O.K
Error tipo II
Culpable
Error tipo I
O.K
Si el valor de p nos da que la probabilidad de haber encontrado ese valor por azar es
muy baja (ms baja que el valor de corte . que nos habamos impuesto):
rechazaremos la hiptesis nula: diremos que la diferencia es estadsticamente
significativa: si nos equivocamos estaremos cometiendo un error de tipo I.
Si el valor de p nos da alto: diremos que la probabilidad de haber encontrado ese valor
por azar es alta. Por lo tanto, aceptaremos la hiptesis nula: diremos que las
diferencias encontradas no eran estadsticamente significativas: si nos equivocamos (y
SI haba diferencias): estaremos cometiendo un error de tipo II.
Verdad de la naturaleza
Resultado del
test
Hiptesis nula
verdadera
Acepta Ho
O.K
Hiptesis nula
falsa (hiptesis
alternativa
verdadera)
Error tipo II
Rechaza Ho
Error tipo I
O.K
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
19
El error de tipo II slo puede cometerse cuando se acepta Ho, es decir, cuando
se concluye que las diferencias son estadsticamente no significativas. Es obvio que si
rechazamos Ho el error de aceptarla no se puede cometer.
Resumiendo:
= P rechazarH 0 H 0verdadera
= P norechazarH 0 H 0 falsa
Poder = P rechazarH 0 H 0 falsa
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
20
probabilidad de que Ho sea cierta es mnima, pero jams ser nula! Cul es la probabilidad de
sacarse la lotera? Sin embargo, muchas veces alguien la saca!!
Resultado estadsticamente
significativo y clnicamente
relevante.
Resultado estadsticamente
no significativo pero
clnicamente relevante.
Resultado estadsticamente
significativo pero sin
relevancia clnica.
Resultado estadsticamente
no significativo y sin
relevancia clnica.
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
21
Media
DS
Error estndar
41.8
8.47
2.68
36.55
47.05
12
56.4
9.13
2.89
50.74
62.06
21
44.2
7.04
2.23
39.84
48.56
82
56.4
9.13
2.89
50.74
62.06
92
42.4
8.44
2.67
37.17
47.63
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
22
DS
Error
estndar
Mnimo IC
95%
Mximo IC
95%
41.8
8.47
2.68
36.55
47.05
12
56.4
9.13
2.89
50.74
62.06
21
44.2
7.04
2.23
39.84
48.56
82
56.4
9.13
2.89
50.74
62.06
92
42.4
8.44
2.67
37.17
47.63
30
40
Media
50
60
70
Respuesta 3:
20
40
60
80
100
Muestra
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
23
Respuesta 7:
MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS
24