Você está na página 1de 33

Distribucin Binomial y de Poisson.

Distribucin Normal. Aplicaciones


Dr. Hugo Arroyo Hernndez
Direccin General de Epidemiologa

Probabilidad
Ejemplos
Cuando se presenta una epidemia en una comunidad, cada
habitante puede enfermar o no (Experimento aleatorio). No se
sabe cual resultado va a ocurrir pero se puede dar una medida
de la posibilidad de ocurrencia de cada uno de los dos posibles
resultados.
Cuando un paciente es sometido a una operacin quirrgica,
puede sobrevivir o morir. No se tiene seguridad de lo que va a
ocurrir, pero se puede dar una medida de la posibilidad de la
ocurrencia de uno de los dos posibles resultados.

La probabilidad es un concepto matemtico desarrollado para
obtener una medida numrica de la posibilidad de ocurrencia de
un evento de inters en un experimento aleatorio,

Principales leyes de distribucin
de variables aleatorias
Una vez elegida la muestra y recogido los
datos, el siguiente paso es inferir las
propiedades de la poblacin a partir de la
muestra. El instrumento conceptual que
permitir esta generalizacin es un modelo de
la poblacin, es decir, una representacin
simblica de su comportamiento.
Existen tres leyes tericas que tienen la
particularidad de ser seguidas por una inmensa
mayora de fenmenos biolgicos habituales; estas
leyes son:

Distribucin binomial (variables discretas).
Distribucin de Poisson o de los sucesos raros
(variables discretas).
Distribucin normal o de Gauss (variables
continuas).
Variables discretas y continuas
Cuando la variable cuantitativa slo se puede medir en
valores enteros: como el nmero de alumnos, el nmero de
partos, el nmero de publicaciones, se le denomina variable
discreta, discontinua o de intervalo, mientras que si la variable
se puede expresar en fracciones, como peso al nacimiento
(3,460 g) o estatura (51.3 cm), se les denominan variables
continuas o de razn y puede ser que los datos tengan una
distribucin normal (sesgo de -0.5 a +0.5 y curtosis de 2 a 4).
Distribucin binomial
Es una ley terica de aplicaciones siempre que se conozca, de
entrada, la probabilidad de aparicin de un fenmeno
biolgico (p).
La variable de inters es el nmero de xitos alcanzados en n
pruebas.
En el anlisis epidemiolgico permite modelar eventos que
slo tienen dos posibles resultados (enfermo/sano,
vive/muere).
La probabilidad de xito (p) puede ser interpretada como la
probabilidad de ocurrencia de un dao o enfermedad en la
poblacin (prevalencia).
La distribucin binomial constituye siempre un diagrama de
barras discontinuo.
Distribucin binomial
Consideremos un experimento que consiste en seleccionar aleatoriamente
una muestra de 3 personas sin lazos familiares y se les realiza pruebas para
averiguar si tienen diabetes.
Para cada individuo se tiene dos posibles resultados: presencia (xito) y
ausencia (fracaso) de diabetes.
La probabilidad de que una persona tenga diabetes es igual a p (prevalencia
de diabetes en esa poblacin) y la probabilidad de no encontrar la
enfermedad es 1-p.
Para cada una de las 3 personas la presencia de diabetes (xito) es
independiente de la presencia de la enfermedad en las otras dos personas
X: Nmero de personas con diabetes en una muestra de 3 personas
Ejemplo
Modelo de probabilidad binomial
X = Nmero de personas con diabetes en una muestra de tamao n=3.
Los posibles valores de la variable aleatoria son: x=0, 1, 2, 3 (n=3)
Eventos X P(X=x) P(X=x)
D-D-D-
0 (1-p)
3
(1-p)
3

D-D-D+
1 (1-p)
2
p
3(1-p)
2
p

D-D+D-
1 (1-p)
2
p
D+D-D-
1 (1-p)
2
p
D+D+D-
2 (1-p) p
2

3(1-p) p
2


D+D-D+
2 (1-p) p
2

D-D+D+
2 (1-p) p
2

D+D+D+
3 P
3
P
3

3 3
3
3!
( ) (1 ) (1 )
!(3 )!
x x x x
P X x p p p p
x x x

| |
= = =
|

\ .
La formula general para calcular probabilidades binomial es:
EJEMPLO.
Supongamos que la probabilidad de encontrar una persona con diabetes es de 0.05
(prevalencia de diabetes en el Per).
Cul es la probabilidad de que en la muestra de 3 personas seleccionadas
aleatoriamente , se encuentren 2 personas con la enfermedad ?

A: Exactamente dos personas con la enfermedad (x=2)
2 3 2 2 3 2
3
3!
( 2) (0.05) (1 0.05) (0.05) (1 0.05)
2 2!(3 2)!

| |
= = =
|

\ .
P X
P(X=2) = 3 (0.05)
2
(0.95) = 0,007125
Distribucin de probabilidad binomial
La probabilidad de encontrar 2 personas con diabetes en una muestra aleatoria de 3
personas es de 0,71%
Ejemplo: En cierta poblacin la prevalencia de alergia es de
20%. Si se selecciona una muestra aleatoria de n=10.
Calcular la probabilidad de que la muestra contenga
exactamanente un alrgico.
Solucin:
Datos:
xito = tener alergia p = 0,2 y 1-p = 0,8
n = 10
x = 1
Luego: p(X=1)=10!(0,2)
1
(0,8)
9

1! 9!

= 10(0,2)(0,8)
9

p(x=1) = 0,2684


Distribucin binomial
B(5, 0.1)
B(5, 0.2)
B(5, 0.5) B(5, 0.8) B(5, 0.9)
Distribucin binomial para n = 5 y distintos valores de p, (B(5, p))


Distribucin de Poisson
=np es el nmero promedio de xitos en un nmero muy grande de ensayos

( ) , 0 1 2 0
!

= = = >
x
e
P X x x , , ,...
x

Dado que el nmero de ensayos es muy grande, tericamente la variable
aleatoria Poisson toma valores entre cero e infinito X=0,1,2,
La distribucin Poisson surge como una aproximacin a la binomial para
experimentos aleatorios en los cuales el tamao de la muestra (n) es muy
grande y la probabilidad (p) de ocurrencia del evento de inters es muy
pequea (evento raro).

Distribucin de probabilidades Poisson
Se selecciona una muestra de 200 personas de una poblacin en la cual la
probabilidad de tener diabetes es 0,05. En este caso se puede aproximar la
distribucin Poisson a la binomial.

El nmero esperado de diabticos en una muestra de 200 personas es:
=np=200(0,05)=10.
Ejemplo
10
10
( ) , 0 1 2
!

= = =
x
e
P X x x , , ,...
x
La distribucin de probabilidades de la variable aleatoria

X: nmero de diabticos
A partir de este modelo se puede calcular la probabilidad de cualquier evento
aleatorio.
Distribucin de probabilidades Poisson
a) Cul es la probabilidad de encontrar exactamente dos personas con
diabetes en la muestra?
10 2
10
( 2) =0.0023
2!

= =
e
P X
b) Cul es la probabilidad de encontrar no ms de un diabtico
10 0 10 1
10 10
( 2) ( 0) ( 1)
0! 1!

< = = + = = +
e e
P X P X P X
( 2) 0.000045 0.00045 0.0005 < = + = P X
Distribucin de probabilidades Poisson
Esta distribucin tambin se utiliza en :

a) Estudios longitudinales para modelar la incidencia de una enfermedad o
dao en un periodo de tiempo. Ej. Nmero de personas con peste bubnica
en Cajamarca durante el ao 2013.

b) Para modelar el nmero de ocurrencias de un evento en un rea. Ej. Nmero
de pacientes que acuden a un servicio.

c) Para modelar el nmero de ocurrencias de un evento en un volumen. Ej.
Nmero de bacterias en un medio de cultivo.
La distribucin Poisson se utiliza como una alternativa a la distribucin
binomial en estudios transversales donde el tamao de muestra es grande y el
evento de inters es raro (lo cual se refleja en una probabilidad de ocurrencia
muy pequea).
Toro-Polo LM, Pereyra-Elas R, Nizama-Va A, et al. Publicacin de los trabajos presentados a los congresos cientficos de estudiantes de medicina, Per 2002-2009: caractersticas y
factores asociados. Rev Peru Med Exp Salud Publica. 2012;29(4):461-8.
0
20
40
60
80
100
120
140
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
R
e
s

m
e
n
e
s

Universidades
Publicados
No Publicados
0
2
4
6
8
10
12
14
16
18
20
N


d
e

a
u
t
o
r
e
s

N de publicaciones
Arroyo-Hernndez CH. Anlisis bibliomtrico de la produccin cientfica sobre parasitosis en Per, 1990-2009.
Estimacin Poisson
Distribucin normal o de Gauss
Es seguida por una
inmensa cantidad de
variables biolgicas cuyas
medidas se agrupan
alrededor de un valor
central, y que presentan
una frecuencia cada vez
menor a medida que se
alejan de dicho valor
medio.
Caractersticas de la distribucin normal :
Corresponde a variables cuantitativas continuas.
Se caracteriza por dos medidas: media y desviacin tpica.
Es unimodal.
Es simtrica alrededor de la media. Por tanto, media, mediana
y moda coinciden.
Tiene forma acampanada, sin un pico excesivo.
Va desde - infinito a + infinito (asinttica al eje de abscisas).
El rea bajo la curva = 1 (100%).

Histograma de frecuencias relativas
Como surgen las distribuciones de probabilidad continuas?
La distribucin de frecuencias relativas (probabilidades estimadas) de las
edades de una poblacin de pacientes con VIH/SIDA es como se muestra en el
grfico.
La edad es una variable
aleatoria continua
Importancia de la distribucin normal en el anlisis
estadstico de datos
La mayora de las tcnicas de anlisis de datos que se utilizan con frecuencia se
basan en la suposicin de que la variable aleatoria en estudio tiene distribucin
normal .
Por ejemplo las estadsticas de prueba de hiptesis:

t de student para una media.
t de student para comparacin de dos grupos (independientes)
Anlisis de varianza.
Anlisis de regresin lineal,

Incluso en los casos en que la variable en estudio no tiene distribucin normal,
si el tamao de muestra es suficientemente grande se realizan aproximaciones
a la normal (Teorema del limite central).

IMPACTO DE UN BROTE EPIDMICO DE DENGUE SOBRE LAS BSQUEDAS EN GOOGLE EN PER
Al evaluar la asociacin entre las bsquedas en Google para dengue y los casos notificados,
se obtuvo un rho de Spearman 0,94 mostrando una correlacin p=0,001; no se hall
correlacin entre los casos notificados y artculos periodsticos disponibles en Internet (rho
de Spearman= -0,17, p=0,39); as como entre las bsquedas en Google y artculos
periodsticos disponibles en Internet (rho de Spearman= -0,11, p=0,59).
Es importante tener en cuenta que las tcnicas estadsticas
de anlisis de datos que se basan en la suposicin de que la
caracterstica de inters (variable) tiene una distribucin
normal tienen una buena performance en el anlisis de
datos (pruebas de hiptesis, intervalos de confianza, etc.)
siempre que esta suposicin se verifique.

Si el tamao de muestra es suficientemente grande se
puede tener cierta tranquilidad al usar estas tcnicas pues
la normalidad de las estadsticas utilizadas (ya no de los
datos) est garantizada en la mayora de los casos.
Recomendaciones
Gracias
hugoarroyo2001@yahoo.com

Você também pode gostar