Você está na página 1de 14

Apuntes de Estadística

Distribuciones de Probabilidad
Distribuciones discretas. Variable aleatoria discreta: Función de Probabilidad. Función de
distribución acumulada. Esperanza matemática. Varianza. Propiedades Modelos Discretos:
Distribución Binomial, Poisson e Hipergeometrica.
Distribuciones continuas: Variable aleatoria continua: Función de Probabilidad. Función de
distribución acumulada.Modelos Continuos: Distribución Normal de Gauss.

Variable Aleatoria:

Una variable aleatoria es un valor numérico determinado por el resultado de un


experimento.

Hemos visto que los resultados de un experimento aleatorio pueden ser cuantitativos
(por ej, lanzar un dado y registrar el número de la cara superior), o cualitativos (por ej,
lanzar dos monedas y registrar el resultado de cada una).
Los eventos de mayor interés a la hora de hacer inferencia estadística son eventos
numéricos. ¿Qué significa? Que, por ejemplo, estaremos más interesados en conocer
el número de caras que resultan en cada repetición del experimento que en la
secuencia en sí.

Experimento Aleatorio: “Tirar dos monedas”

El Espacio Muestral se puede representar como producto cartesiano:


W = { (c1,c2); (c1,s2); (s1,c2); (s1,s2)}

Como matriz

C2 S2
C1
S1

Como Diagrama Cartesiano

s2

c2

c1 s1

Como diagrama de árbol

C2 c2

C1 s1

S2 s2
Variable Aleatoria: El número de caras. Es una función definida sobre el espacio
muestral W:

X: Número de caras f(x) (probabilidad) F(x) Acumulada

1
Apuntes de Estadística

0 ¼= 0,25 0,25
1 2/4= 0,50 0,75
2 ¼= 0,25 1
Total Σ f(x) = 1

La función definida anteriormente se denomina variable aleatoria.

Una variable aleatoria es entonces una función que asocia un número real a cada
elemento de un espacio muestral.

Notación:
X: representa el valor que toma la variable aleatoria al ser valuada en el elemento W.
f (x) indica la función de probabilidad de la variable aleatoria

Una distribución de probabilidad es una lista de todos los resultados posibles de un


experimento y de la probabilidad que se asocia con cada uno de los resultados.

Las variables aleatorias suelen clasificarse de acuerdo con el número de valores que
puede asumir.

Una distribución de probabilidad discreta puede suponer solo ciertos valores. Las
características principales son:
 La suma de las probabilidades es 1.
 La probabilidad de un resultado particular es entre 0 y 1.
 Los resultados son mutuamente excluyentes.

Las variables aleatorias se dividen en dos grupos: discretas y continuas.

Variables aleatorias discretas

Una variable discreta puede tomar una cantidad finita o infinita numerable de valores.
Se asocia a los números naturales.

Ejemplos:
 número de votos de un candidato en las próximas elecciones.
 n° de muertos por accidentes de tránsito en el próximo mes.
 n° de pacientes que atenderán en una clínica el día de mañana.

Variables aleatorias continuas

Una variable aleatoria continua puede tomar infinitamente muchos valores


correspondientes a puntos en un intervalo de la recta real.

Ejemplos:
 peso
 altura
 presión arterial
 temperatura

2
Apuntes de Estadística

Variables aleatorias discretas

Distribución de probabilidades

Una distribución de probabilidades es una distribución de frecuencias teórica. Las


distribuciones de frecuencia que elaboramos en la unidad I eran sobre datos reales.
Una distribución de probabilidades se construye sobre la expectativa (probabilidad) de
que algo suceda. Por eso son modelos útiles para realizar inferencias y tomar
decisiones en condiciones de incertidumbre.
La distribución de probabilidad describe la forma en que se espera varíen los
resultados de un experimento aleatorio.
Se calcula como una función llamada función de probabilidad cuya fórmula es:

f(x) = casos favorables /casos posibles

Condiciones que debe cumplir:

1) 0 ≤ f(x) ≤ 1
2) Σ f(x) = 1

En el ejemplo de las monedas


X: número de caras

f(c,c) = ¼ = 0,25

Una variable discreta se representa en un diagrama de bastones

Función de Distribución Acumulada de Probabilidades

Es la frecuencia acumulada. Acumula probabilidades


Gráfico de escalones

3
Apuntes de Estadística

Distribuciones Discretas:

Existen 4 tipos de distribuciones discretas:


 Distribución Bernoulli (no la estudiaremos en este curso)
 Distribución Binomial
 Distribución Hipergeométrica
 Distribución de Poisson

DISTRIBUCION BINOMIAL

Existen muchos problemas aplicados en que nos interesa la probabilidad de que un


evento ocurra x veces de n o x aciertos en n intentos.

Características:
 Cada resultado se clasifica dentro de una de dos categorías mutuamente
excluyentes.
 La probabilidad de éxito permanece igual de un ensayo al siguiente.
 Cada ensayo es independiente.
 La distribución es resultado de un conteo del número de éxitos en un número
fijo de ensayos, es decir existe un número fijo de intentos o ensayos.

La distribución binomial se determina de la siguiente manera:


 n  x n x
f(x) =  . p .q
 x
La media se calcula así:  = n.p
La varianza es: 2 = n.p.q

DISTRIBUCION POISSON

Aproximación de Poisson a la distribución binomial.

Cuando n es grande ( n > 30) y p es chica ( p < 0.1), las probabilidades binomiales a
menudo se aproximan por medio de la siguiente formula:

e  n. p .( n. p ) x
f(x) =
x!

Distribución de Poisson (parámetro ).

La distribución de Poisson tiene, asimismo muchas aplicaciones importantes que no


tiene relación directa con la distribución binomial. En ese caso, n.p se sustituye por el
parámetro  y se calcula la probabilidad de lograr x “aciertos” por medio de la fórmula:

4
Apuntes de Estadística

e   . x
f(x) =
x!
donde  se interpreta como el número esperado o promedio de aciertos.

DISTRIBUCION HIPERGEOMETRICA.

Si se eligen n objetos al azar de un conjunto N, que consta de D objetos de un


tipo (aciertos, defectuosos) y N-D objetos de otra clase y la selección se hace
sin sustitución, entonces la probabilidad de lograr “x aciertos y n-x fracasos” es:

 D  N  D
 . 
 x   n  x 
f(x) =
N
 
n

Características:
 Solo existen dos resultados posibles.
 La probabilidad de aciertos no es la misma en cada uno de los ensayos.
 La distribución es resultado de un conteo del número de éxitos en una
cantidad fija de ensayos.

5
Apuntes de Estadística

PARTE B: Distribuciones continuas:

Distribución Normal de Gauss

Es una distribución de variable aleatoria continua

Por qué se llama normal?. Cuando hablamos de describir algunas variables hablamos
de peso normal, altura normal, coeficiente intelectual normal. Lo que queremos decir
que el valor de la variable se encuentra entre lo que pesa la mayoría, mide la mayoría
o el coeficiente intelectual de la mayoría.
Se justifica por la frecuencia o normalidad con la que ciertos fenómenos tienden a
parecerse en su comportamiento.

En resumen, la importancia de la distribución normal se debe principalmente a que hay


muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal

 Caracteres morfológicos de individuos (personas, animales, plantas,...) de


una especie, p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,...
 Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un
fármaco, o de una misma cantidad de abono.
 Caracteres sociológicos, por ejemplo: consumo de cierto producto por un
mismo grupo de individuos, puntuaciones de examen.
 Caracteres psicológicos, por ejemplo: cociente intelectual, grado de
adaptación a un medio,...
 Errores cometidos al medir ciertas magnitudes.
 Valores estadísticos muestrales, comportamiento de la media de diferentes
medias muestrales.
 Distribuciones discretas como la Binomial o la de Poisson que al aumentar el
tamaño muestral, pueden aproximarse en su comportamiento a una
distribución normal...

Y en general cualquier característica que se obtenga como suma de muchos


factores.

Si hablamos de mayoría podemos asociarlo a lo más frecuente o de mayor frecuencia.


Qué medida de tendencia central indica el valor más frecuente?- la moda. Pero en
este caso en particular para distribuciones simétricas la moda, la mediana y la media
aritmética coinciden. Los parámetros que utilizaremos para hablar de población de una
distribución normal serán μ media aritmética o esperanza (valor esperado promedio) y
σ desviación estándar. Cuando hablamos de muestras serán y Ѕ

Gráficamente una distribución se representa con una curva en forma de campana


(campana de Gauss) que presenta un valor más frecuente y a partir de él decae o
disminuyen los valores hacia ambos lados con una simetría perfecta. Esto hace que a
valores situados a igual distancia del valor de la moda por izquierda y por derecha, les
corresponda la misma probabilidad y los valores extremos son escasos.

6
Apuntes de Estadística

Ejemplo: la altura de los hombres adultos entre 20 y 60 años sanos sigue una
distribución normal con media 1,70 y desviación estándar 10 cm.
Qué significa esta información. Existe una gran cantidad de varones entre 20 y 60
años que miden 1,70 con una variación de + o – 10 cm., es decir que la mayoría mide
entre 1,60 y 1,80 cm.
Pero a qué llamamos la mayoría?. Para ello se definen zonas de probabilidad bajo la
curva

68,2 % de la población se concentra entre μ-σ y μ+σ


95,4 % de la población se concentra entre μ-2σ y μ+2σ
99,8 % de la población se concentra entre μ-3σ y μ+3σ

Traducido al ejemplo:
Existe un 68,2% de hombres adultos sanos entre 20 y 60 años que miden entre 1,60 y
1,80 m
Existe un 95,4% de hombres adultos sanos entre 20 y 60 años que miden entre 1,50 y
1,90
Existe un 99,8% de hombres adultos sanos entre 20 y 60 años que miden entre 1,40 y
2,00.

Función Densidad de Probabilidad:

La función de variable aleatoria continua que representa la distribución normal se


denomina función densidad de probabilidad y se calcula con la siguiente fórmula:

7
Apuntes de Estadística

donde -∞ < x < ∞ es decir cualquier valor real por eso es continua

como la distribución normal es perfectamente simétrica la media, mediana y moda


coinciden y la desviación estándar σ da idea de la dispersión de los datos alrededor de
la μ . Cuando σ crece, la curva se achata (platicurtica) y se dice que la población es
más heterogénea.
Cuando σ es pequeña la población es homogénea y la curva se hace leptocurtica.

Características de la distribución normal

1) el área bajo la curva representa la probabilidad. El área total bajo la curva es


igual a 1.

P(-∞ < x < ∞) = 1

2) Como la curva es simétrica, el 50% de las observaciones está debajo de μ y el


50% por encima de ella.

P(-∞ < x < μ) = 0,5 y P(μ < x < ∞) = 0,5

3) Los campos de variación de los parámetros son

-∞ < μ < ∞

0<σ<∞

0<P<1

Esto implica que existen infinitas curvas normales en función de los valores que tomen
μyσ

Como los cálculos con la fórmula son complicados se selecciona una de todas La
combinaciones posibles de μ y σ. A esta distribución particular se la conoce como
Distribución normal estandarizadas y es la que corresponde a la combinación de
parámetros μ = 0 y σ = 1 y las probabilidades (áreas bajo la curva) están tabuladas.

Definición: una distribución normal se denomina estandarizada si su media es cero y


su desviación estándar es igual a 1.

Para obtener la variable normal estandarizada z se realiza una transformación de la


variable normal original x a partir del siguiente cálculo:

x
z

8
Apuntes de Estadística

Distribución normal estandarizada

Podemos realizar la siguiente equivalencia de variables:

Probabilidad Variable continua x Variable estandarizada z


(área bajo la curva)
68,2 % μ-σ < x < μ+σ -1 < z < 1
95,4 % μ-2σ < x < μ+2σ -2 < z < 2
99,8 % μ-3σ < x < μ+3σ -3 < z < 3

DISTRIBUCION NORMAL.
Manejo de la tabla N(0,1). Casos más frecuentes

1 Cuando la probabilidad pedida se encuentra directamente en


las tablas

Hallar la probabilidad p (z 0,45)

9
Apuntes de Estadística

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

En la 1ª columna buscamos el valor de las unidades y las décimas.


En la 1ª fila el valor de las centésimas.
Basta buscar 0,4 en la columna y 0,05 en la fila. Su intersección nos da la probabilidad.
Leemos y nos da 0,6736. p (z 0,45) = 0,6736.

2 Probabilidad de un valor positivo p ( z > 1,24)

p ( z >1,24) p(z 1,24)

En este caso la probabilidad pedida no está en las tablas. Sin embarg o, si tenemos en
cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la figura que:
P (z > 1,24) = 1 – p (z 1,24) = 1 – 0,8925 = 0,1075

10
Apuntes de Estadística

3 Probabilidad de una valor negativo p ( z -0,72 )

p(z - 0,72 ) p(z 0,72)

Como la gráfica es simétrica respecto al eje de ordenadas, p (z - 0,72) = p(z 0,72).


Calculamos la p (z 0,72) igual que en el caso 2.

p (z - 0,72) = p(z > 0,72) = 1 – p ( z 0,72) = 1 – 0,7642 = 0,2358

4 Probabilidad entre dos valores positivos p (0,5 z 1,76)

Podemos leer directamente en la tabla la p (z 1,76) y la p (z 0,5), la diferencia entre


ellas es la probabilidad que nos piden.

p (z 1,76) p (z 0,5) p (0,5 z 1,76)

p (0,5 z 1,76) =p (z 1,76) - p (z 0,5)= 0,9608 – 0,6915 = 0,2693

5 Probabilidad entre dos valores negativos p (- 1,76 z - 0,5)

Por simetría cambiamos los dos valores negativos a positivos y calculamos sus
probabilidades.
p (- 1,76 z - 0,5)= p (0,5 z 1,76) =
p (z 1,76) - p (z 0,5)= 0,9608 – 0,6915 = 0,2693

Observa que el área sombreada es la misma que en el caso 4

11
Apuntes de Estadística

6 Probabilidad entre un valor positivo y uno negativo p ( -


0,53 < z 2,46)

p ( - 0,53 < z 2,46) = p ( z 2,46) - p ( z< - 0,53)


p ( z< - 0,53) = p (z > 0,53 ) = 1 – p (z 0,53) =1 – 0,7019 = 0,2981
p ( - 0,53 < z 2,46) = p ( z 2,46) - p ( z< - 0,53) = 0,9931 – 0,2981 = 0,695

Ejercicios
Sea z una variable normal N ( 0, 1). Calcula: Soluciones

a) p (z 2,34 ) p (z 2,34 ) = 0,9904

b) p (z 1,52 ) p (z 1,52 ) = 0,0643

c) p (1,73 < z 1,87) p (1,73 < z 1,87) = 0,011


d) p ( z -1,24 ) p(z -1,24 ) = 0,1075

M anejo de la tabla de forma inversa

12
Apuntes de Estadística

Tipificación de la variable

Porcentaje de población en los diferentes intervalos simétricos


de una distribución normal

Para hallar el porcentaje %, hallamos la probabilidad y multiplicamos por 100. Ver


problema 1.

13
Apuntes de Estadística

Problemas resueltos de tipificación de la variable

14

Você também pode gostar