Você está na página 1de 12

Distribución de la proporción muestral

Vamos a considerar que tenemos una población de modo que en cada una de ellas
estudiamos una v.a. dicotómica (Bernoulli) de parámetro respectivo p . De la población
vamos a extraer una muestra de tamaño n .
Entonces,
n
X   xi  B  n, p 
i 1

x
y la proporción de éxito en la muestra es pˆ 
n

Luego se cumple:

 pˆ  E ( pˆ )  p
a)

p(1  p)
 p2ˆ  V ( pˆ ) 
b) n

c) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:

pˆ  p
z  N (0,1)
pq
n

Nota: (Error estándar o Error típico de la proporción muestral)

pq p y q conocidos
 p̂  Tamaño de población (N) demasiado grande o
n infinita.
p y q conocidos
pq  N  n 
 pˆ    Tamaño de población (N) conocido o finita.
n  N 1 
ˆˆ
pq p y q desconocidos, entonces p  pˆ y q  qˆ
S pˆ  Tamaño de población (N) demasiado grande o
n infinita.
ˆ ˆ  N n
pq p y q desconocidos, entonces p  pˆ y q  qˆ
S pˆ    Tamaño de población (N) conocida o finita.
n  N 1 

Intervalo de Confianza para una Proporción


En este caso, interesa construir un intervalo de confianza para una proporción o un
porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensión,
fumadoras, etc.)

Donde, p es el porcentaje de personas u objetos con la característica de interés en la


población (o sea, es el parámetro de interés) y p̂ es su estimador puntual muestral.

Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo


de confianza para la proporción poblacional p, con una confianza de 1   .

ˆ  Z1 / 2 *  pˆ  p  p
p ˆ  Z1 / 2 *  pˆ

Donde:
x
pˆ 
n
qˆ  1  pˆ

Tamaño de muestra

Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera que
si p se estima por p̂ , el error de estimación no sea mayor que un valor dado e. En efecto:

 Tamaño de población (N) demasiado


grande o infinita.
 Si p y q son desconocidas, se estima por p̂
Z12 / 2 * pq
n y q̂ hallados a partir de una muestra piloto.
e2  En últimos de los casos si no se tiene
ninguna información de p y q se asume el
máximo riesgo de p = 0,5 y q = 0,5.
 Tamaño de población (N) conocida o finita
 Si p y q son desconocidas, se estima por p̂
Z12 / 2 * pq * N y q̂ hallados a partir de una muestra piloto.
n 2  En últimos de los casos si no se tiene
Z1 / 2 * pq  e2 ( N  1) ninguna información de p y q se asume el
máximo riesgo de p = 0,5 y q = 0,5.

Distribución de la diferencia de proporciones muestrales


Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas
estudiamos una v.a. dicotómica (Bernoulli) de parámetros respectivos p1 y p2 . De cada
población vamos a extraer muestras de tamaño n1 y n2 .
Entonces
n1
x
X1   x1i  B  n1 , p1  pˆ1  1
i 1 n1
n2
x2
X 2   x2i  B  n2 , p2  pˆ 2 
i 1 n2

Luego se cumple:

a)  pˆ1  pˆ 2  E ( pˆ1  pˆ 2 )  p1  p2
p1q1 p2 q2
b)  p2ˆ ¨1  pˆ ¨2  V ( pˆ1  pˆ 2 )  
n1 n2

c) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:

( pˆ1  pˆ 2 )  ( p1  p2 )
Z  N (0,1)
 pˆ  pˆ
1 2

Intervalo de Confianza para la diferencia de dos proporciones


Si las muestras son suficientemente grandes ocurre que una aproximación para un
intervalo de confianza al nivel 1   para la diferencia de proporciones de dos poblaciones
es:
p1  p2   p ˆ 2   Z1 / 2 * pˆ1  pˆ 2
ˆ1  p

ˆ1qˆ1 p
p ˆ q
Dónde:  pˆ  pˆ   2 2
1 2
n1 n2

Inferencia basada en pruebas de hipótesis para una y


dos muestras

Hipótesis Estadística es una afirmación, conjetura que se hace acerca de un parámetro


poblacional.

Tipos de Hipótesis

Hipótesis nula, es la afirmación que está establecida y que se espera sea rechazada
después de aplicar una prueba estadística y se representa por Ho.

Hipótesis alterna, es la afirmación que se espera sea aceptada después de aplicar una
prueba estadística y se representa por H1 .

Nivel de significación, representada por  , es la probabilidad de cometer error tipo I, y


por lo general se asume que tiene un valor de 0,05 ó 0,01.
Prueba estadística o Estadístico de prueba, es una fórmula, basada en la distribución
del estimador puntual del parámetro que aparece en la hipótesis y que va a permitir tomar
una decisión acerca de aceptar o rechazar una hipótesis nula.

Contraste de Hipótesis para la media “µ”

Formas de contraste de las hipótesis:

Depende del planteamiento de la hipótesis alterna

Prueba bilateral Prueba unilateral superior Prueba unilateral inferior


H 0 :   0 H 0 :   0 H 0 :   0
H1 :   0 H1 :   0 H1 :   0
Fijar nivel de significancia:  = 0,05; 0,01 etc.

Seleccionar el estadístico de prueba:

Caso I: X→ N (µ, σ), σ conocida

El estadístico de prueba es:

X 
Z   N (0,1)
X

Prueba Z- Normal estándar para una muestra.

Usualmente la varianza es desconocida

Caso II: X→ N (µ, σ), σ desconocida

El estadístico de prueba es:

X 
T   tn 1
sX

Prueba T- Student para una muestra con n - 1 grados de libertad (gl.)

Regiones Críticas:
Depende de las formas de contraste de las hipótesis.

Contraste Bilateral Contraste unilateral superior Contraste unilateral inferior


-- ZR-- /-------------ZA--------------/--ZR-- ----------------ZA---------------/----ZR---- ----ZR-----/-------------ZA----------------
Decisión:

Forma Tabular
Si el valor numérico del estadístico de prueba se ubica en la Zona de Aceptación (ZA) se
acepta la Hipótesis nula H 0 .
Si el valor numérico del estadístico de prueba se ubica en la Zona de Rechazo (ZR) se
rechaza la Hipótesis nula H 0 .

Forma Método “p”


Si el valor numérico de “p” es superior que el nivel de significancia fijado “  ” se acepta
la Hipótesis nula H 0 .
Si el valor numérico de “p” es inferior que el nivel de significancia fijado “  ” se rechaza
la Hipótesis nula H 0 .

Prueba de Hipótesis para la diferencia de medias ( 1  2 )

Supongamos que se tiene dos poblaciones distribuidas normalmente con medias


desconocidas 1 y  2 , respectivamente. Se puede aplicar una prueba z o t de Student
para comparar las medias de dichas poblaciones basándonos en dos muestras
independientes tomadas de ellas. La primera muestra es de tamaño n1 , con media X 1 y
la segunda muestra es de tamaño n2 , tiene media X 2 . Donde las varianzas poblacionales
pueden ser conocidas (  12 y  22 ) o desconocidas ( s12 y s22 ).

Formulación de las hipótesis para muestras independientes

Depende del planteamiento de la hipótesis alterna

Prueba bilateral Prueba unilateral superior Prueba unilateral inferior


H 0 : 1  2 H 0 : 1  2 H 0 : 1  2
H1 : 1  2 H1 : 1  2 H1 : 1  2

Fijar el nivel de significancia:  = 0,05; 0,01 etc.

Estadístico de prueba

Caso I: Muestras independientes, Varianzas poblacionales conocidas (  12 y  22 )

El estadístico de prueba es:


( X 1  X 2 )  ( 1  2 )
Z  N (0,1)
 X X
1 2

Donde:  X  12  22
1 X2
 
n1 n2

Caso IIA: Normal-Muestras independientes, Varianzas poblacionales iguales (


 12   22 ) y desconocidas

El estadístico de prueba es:

( X 1  X 2 )  ( 1  2 ) t n1  n2  2
T 
S X1  X 2

Donde: v  n1  n2  2 es el grado de libertad.

S X1  X 2 
 n1  1 * s12   n2  1 * s22  1 1 
  
n1  n2  2  n1 n2 

Caso IIB: Normal-Muestras independientes, Varianzas poblacionales diferentes (


 12   22 ) y desconocidas

El estadístico de prueba es:

( X 1  X 2 )  ( 1  2 )
T  tv
S X1  X 2

Donde:
s12 s2
S X1  X 2   2
n1 n2

2
 S12 S22 
 n 
n2 
   2 Es el grado de libertad, que toma un valor numérico
1
2 2
 S12   S22 
 n   n 
 1

2

n1  1 n2  1
redondeado entero.

Usualmente las varianzas son desconocidas

Regiones críticas
Contraste Bilateral Contraste unilateral superior Contraste unilateral inferior

-- ZR-- /-------------ZA--------------/--ZR-- ----------------ZA---------------/----ZR---- ----ZR-----/-------------ZA----------------

Decisión:

Forma Tabular
Si el valor numérico del estadístico de prueba se ubica en la Zona de Aceptación (ZA) se
acepta la Hipótesis nula H 0 .
Si el valor numérico del estadístico de prueba se ubica en la Zona de Rechazo (ZR) se
rechaza la Hipótesis nula H 0 .

Forma Método “p”


Si el valor numérico de “p” es superior que el nivel de significancia fijado “  ” se acepta
la Hipótesis nula H 0 .
Si el valor numérico de “p” es inferior que el nivel de significancia fijado “  ” se rechaza
la Hipótesis nula H 0 .
Caso III: Normal- Muestras dependientes
Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del
primer grupo no son independientes de los del segundo.

Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los
individuos de un grupo experimental antes y después de la administración de una droga.

El objetivo es comprobar si la droga produce efectos en el nivel del metabolito

Los pares de observaciones (antes y después) obtenidas en cada individuo no son


independientes ya que el nivel posterior a la administración de la droga depende del nivel
inicial.

Ejemplo

ANTES DESPUES DIF


8,69 7,24 1,45
7,13 7,10 0,03
7,79 7,80 -0,01
7,93 7,95 -0,02
7,59 7,50 0,09
7,86 7,79 0,07
9,06 9,00 0,06
9,59 9,48 0,11

Formulación de Hipótesis

Prueba bilateral Prueba unilateral inferior Prueba unilateral superior


H 0 : d = 0 H 0 : d = 0 H 0 : d = 0
H1 : d  0 H1 : d  0 H1 : d  0

Fijar nivel de significancia


 = 0,05; 0,01 etc.

Estadístico de prueba

T 
D    ~ t d
n 1
 S d2 
 
 n 

T 
 D     0, 22  0  1.26
d

 S d2  0, 50
  8
 n 
Regiones críticas

-- ZR-- /-------------ZA--------------/--ZR--
- t / 2 t1 / 2
-2,365 2,365

Fijando  = 0.05, la región de aceptación es el intervalo (t/2= -2,365, t1- /2 = 2,365),
con 7 grados de libertad

Como T = 1,26 es menor que t1- /2= 2,365, se ubica en la zona de aceptación, por lo
tanto se acepta H 0 : d = 0

Se concluye que la droga no causo efectos significativos, es decir que no existe diferencias
observadas entre los niveles de metabolitos por uno u otro individuo en forma
significativa.

Prueba de hipótesis para la proporción (de éxitos) de una sola


población
Vamos a considerar que tenemos una población de modo que en cada una de ellas
estudiamos una v.a. dicotómica (Bernoulli) de parámetro respectivo p . De la
población vamos a extraer una muestra de tamaño n .
Entonces,
n
X   xi  B  n, p 
i 1

En este caso, interesa contrastar hipótesis para una proporción o un porcentaje


poblacional (por ejemplo, el porcentaje de personas con hipertensión, fumadoras,
etc.)

Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:

 p(1  p) 
pˆ  N  p; 
 n 

O bien:

pˆ  p
z  N (0,1)
ˆˆ
pq
n

Donde:

p es la proporción o el porcentaje de personas u objetos con la característica de


interés en la población (o sea, es el parámetro de interés) y p̂ es su estimador
puntual muestral.

Formulación de Hipótesis

Prueba Bilateral Prueba unilateral superior Prueba unilateral inferior


H 0 : p  p0 H 0 : p  p0 H 0 : p  p0
H1 : p  p0 H1 : p  p0 H1 : p  p0

Fijar nivel de significancia


 = 0,05; 0,01 etc.

Estadística de prueba

pˆ - p0
Z   Normal ( 0 , 1)
p0q 0

Donde:
q0  1  p0
p : Proporción muestral de éxitos

Regiones críticas

Contraste Bilateral Contraste unilateral superior Contraste unilateral inferior

-- ZR-- /-------------ZA--------------/--ZR-- ----------------ZA---------------/----ZR---- ----ZR-----/--------------ZA----------------

Decisión

Forma Tabular
Si el valor numérico del estadístico de prueba se ubica en la Zona de Aceptación (ZA) se
acepta la Hipótesis nula H 0 .
Si el valor numérico del estadístico de prueba se ubica en la Zona de Rechazo (ZR) se
rechaza la Hipótesis nula H 0 .

Forma Método “p”


Si el valor numérico de “p” es superior que el nivel de significancia fijado “  ” se acepta
la Hipótesis nula H 0 .
Si el valor numérico de “p” es inferior que el nivel de significancia fijado “  ” se rechaza
la Hipótesis nula H 0 .

Prueba de hipótesis para la diferencia entre las proporciones de dos


poblaciones

Vamos a considerar que tenemos dos poblaciones de modo que en cada una de
ellas estudiamos una v.a. dicotómica (Bernoulli) de parámetros respectivos p1 y
p2 . De cada población vamos a extraer muestras de tamaño n1 y n2 .
Entonces
n1
X1   x1i  B  n1 , p1 
i 1

n2
X 2   x2i  B  n2 , p2 
i 1
Si las muestras son suficientemente grandes ocurre que una aproximación para la
prueba de hipótesis al nivel de significancia “  ” para la diferencia de proporciones
de dos poblaciones es:

Formulación de Hipótesis

Prueba bilateral Prueba unilateral inferior Prueba unilateral superior


H 0 : p1  p2 H 0 : p1  p2 H 0 : p1  p2
H1 : p1  p2 H1 : p1  p2 H1 : p1  p2

Fijar nivel de significación


 = 0,05; 0,01 etc.

Estadística de prueba

(pˆ 1 - pˆ 2 )-(p1-p 2 )
Z   Normal ( 0 , 1)
 1 1 
pq   

 n1 n2 
ˆ 1  n 2p
n1 p ˆ2
p 
n1  n 2

Regiones críticas

Contraste Bilateral Contraste unilateral superior Contraste unilateral inferior

-- ZR-- /-------------ZA--------------/--ZR-- ----------------ZA---------------/----ZR---- ----ZR-----/--------------ZA----------------

Decisión

Forma Tabular
Si el valor numérico del estadístico de prueba se ubica en la Zona de Aceptación (ZA) se
acepta la Hipótesis nula H 0 .
Si el valor numérico del estadístico de prueba se ubica en la Zona de Rechazo (ZR) se
rechaza la Hipótesis nula H 0 .

Forma Método “p”


Si el valor numérico de “p” es superior que el nivel de significancia fijado “  ” se acepta
la Hipótesis nula H 0 .
Si el valor numérico de “p” es inferior que el nivel de significancia fijado “  ” se rechaza
la Hipótesis nula H 0 .

Você também pode gostar