Escolar Documentos
Profissional Documentos
Cultura Documentos
= = = >
x
e
P X x x , , ,...
x
Dado que el nmero de ensayos es muy grande, tericamente la variable
aleatoria Poisson toma valores entre cero e infinito X=0,1,2,
La distribucin Poisson surge como una aproximacin a la binomial para
experimentos aleatorios en los cuales el tamao de la muestra (n) es muy
grande y la probabilidad (p) de ocurrencia del evento de inters es muy
pequea (evento raro).
Distribucin de probabilidades Poisson
Se selecciona una muestra de 200 personas de una poblacin en la cual la
probabilidad de tener diabetes es 0,05. En este caso se puede aproximar la
distribucin Poisson a la binomial.
El nmero esperado de diabticos en una muestra de 200 personas es:
=np=200(0,05)=10.
Ejemplo
10
10
( ) , 0 1 2
!
= = =
x
e
P X x x , , ,...
x
La distribucin de probabilidades de la variable aleatoria
X: nmero de diabticos
A partir de este modelo se puede calcular la probabilidad de cualquier evento
aleatorio.
Distribucin de probabilidades Poisson
a) Cul es la probabilidad de encontrar exactamente dos personas con
diabetes en la muestra?
10 2
10
( 2) =0.0023
2!
= =
e
P X
b) Cul es la probabilidad de encontrar no ms de un diabtico
10 0 10 1
10 10
( 2) ( 0) ( 1)
0! 1!
< = = + = = +
e e
P X P X P X
( 2) 0.000045 0.00045 0.0005 < = + = P X
Distribucin de probabilidades Poisson
Esta distribucin tambin se utiliza en :
a) Estudios longitudinales para modelar la incidencia de una enfermedad o
dao en un periodo de tiempo. Ej. Nmero de personas con peste bubnica
en Cajamarca durante el ao 2013.
b) Para modelar el nmero de ocurrencias de un evento en un rea. Ej. Nmero
de pacientes que acuden a un servicio.
c) Para modelar el nmero de ocurrencias de un evento en un volumen. Ej.
Nmero de bacterias en un medio de cultivo.
La distribucin Poisson se utiliza como una alternativa a la distribucin
binomial en estudios transversales donde el tamao de muestra es grande y el
evento de inters es raro (lo cual se refleja en una probabilidad de ocurrencia
muy pequea).
Toro-Polo LM, Pereyra-Elas R, Nizama-Va A, et al. Publicacin de los trabajos presentados a los congresos cientficos de estudiantes de medicina, Per 2002-2009: caractersticas y
factores asociados. Rev Peru Med Exp Salud Publica. 2012;29(4):461-8.
0
20
40
60
80
100
120
140
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
R
e
s
m
e
n
e
s
Universidades
Publicados
No Publicados
0
2
4
6
8
10
12
14
16
18
20
N
d
e
a
u
t
o
r
e
s
N de publicaciones
Arroyo-Hernndez CH. Anlisis bibliomtrico de la produccin cientfica sobre parasitosis en Per, 1990-2009.
Estimacin Poisson
Distribucin normal o de Gauss
Es seguida por una
inmensa cantidad de
variables biolgicas cuyas
medidas se agrupan
alrededor de un valor
central, y que presentan
una frecuencia cada vez
menor a medida que se
alejan de dicho valor
medio.
Caractersticas de la distribucin normal :
Corresponde a variables cuantitativas continuas.
Se caracteriza por dos medidas: media y desviacin tpica.
Es unimodal.
Es simtrica alrededor de la media. Por tanto, media, mediana
y moda coinciden.
Tiene forma acampanada, sin un pico excesivo.
Va desde - infinito a + infinito (asinttica al eje de abscisas).
El rea bajo la curva = 1 (100%).
Histograma de frecuencias relativas
Como surgen las distribuciones de probabilidad continuas?
La distribucin de frecuencias relativas (probabilidades estimadas) de las
edades de una poblacin de pacientes con VIH/SIDA es como se muestra en el
grfico.
La edad es una variable
aleatoria continua
Importancia de la distribucin normal en el anlisis
estadstico de datos
La mayora de las tcnicas de anlisis de datos que se utilizan con frecuencia se
basan en la suposicin de que la variable aleatoria en estudio tiene distribucin
normal .
Por ejemplo las estadsticas de prueba de hiptesis:
t de student para una media.
t de student para comparacin de dos grupos (independientes)
Anlisis de varianza.
Anlisis de regresin lineal,
Incluso en los casos en que la variable en estudio no tiene distribucin normal,
si el tamao de muestra es suficientemente grande se realizan aproximaciones
a la normal (Teorema del limite central).
IMPACTO DE UN BROTE EPIDMICO DE DENGUE SOBRE LAS BSQUEDAS EN GOOGLE EN PER
Al evaluar la asociacin entre las bsquedas en Google para dengue y los casos notificados,
se obtuvo un rho de Spearman 0,94 mostrando una correlacin p=0,001; no se hall
correlacin entre los casos notificados y artculos periodsticos disponibles en Internet (rho
de Spearman= -0,17, p=0,39); as como entre las bsquedas en Google y artculos
periodsticos disponibles en Internet (rho de Spearman= -0,11, p=0,59).
Es importante tener en cuenta que las tcnicas estadsticas
de anlisis de datos que se basan en la suposicin de que la
caracterstica de inters (variable) tiene una distribucin
normal tienen una buena performance en el anlisis de
datos (pruebas de hiptesis, intervalos de confianza, etc.)
siempre que esta suposicin se verifique.
Si el tamao de muestra es suficientemente grande se
puede tener cierta tranquilidad al usar estas tcnicas pues
la normalidad de las estadsticas utilizadas (ya no de los
datos) est garantizada en la mayora de los casos.
Recomendaciones
Gracias
hugoarroyo2001@yahoo.com