Você está na página 1de 11

Simulación de la Distribución Muestral de la Media para una

Distribución Beta
Integrantes: Carlos E. Tito Canecillas, Giancarlo G. Donayre Giribaldi, Arthur E. Bernardo Coopi, Jerad
N. Miranda Vasquez

Docente:

Asignatura: Lenguaje de Programación I

Escuela Profesional de Ingeniería Estadística

Facultad de Ingeniería Económica, Estadística y CCSS

Universidad Nacional de Ingeniería

RESUMEN INTRODUCCIÓN

Se simulan muestras provenientes de En estadística, la distribución beta es una


distribuciones beta y se observan las familia de distribuciones de probabilidad
distribuciones de sus medias. De aquí se continuas definidas en el intervalo
aprecia si usar la regla práctica de “30” es [0,1]parametrizado por dos parámetros de forma
apropiada para distribuciones beta y se forman comúnmente denotados α y β.
conclusiones acerca del tamaño de muestra
necesario que sean específicamente para
distribuciones beta y más útiles para esta que
usar dicha regla práctica.
Su media aritmética es α/(α+β), el cual también
Palabras claves: Distribución Beta, tamaño de
sería la esperanza de una media muestral que
muestra, comportamiento gaussiano.
proviene de una población que se distribuye
según dicha distribución beta. Lo que no es tan
evidente es la función de densidad de esta
ABSTRACT media muestral; sin embargo, el teorema del
límite central nos puede dar una idea.
Samples whose parent distribution are betas
are simulated and the distributions of their
means are observed to check for normality. PRESENTACIÓN DEL PROBLEMA
Then, it’s noted whether using the “30” rule of
thumb is appropriate for beta distributions and a ¿Cuándo ha de usarse la aproximación normal
set of conclusions are drawn that provide a para cómo está distribuida la media de una
better insight into how the required sample size muestra en el caso que la población sea una
behaves rather than just using said rule of distribución beta?
thumb. ¿Será suficiente la regla práctica de “30”?¿Será
demasiado?
Keywords: Beta distribution, sample size,
gaussian behavior. Primero habrá que decidir qué tan aproximado
es suficiente y este documento, por simplicidad,
supondrá que basta con pasar pruebas visuales.
OBJETIVOS

Objetivo Principal:
Simular la distribución muestral de la media de
distribuciones beta y verificar su tendencia a
distribuirse normalmente con tamaños mayores
de muestra.

Objetivos secundarios:
Poner a prueba la regla práctica de que 30 es
un tamaño de muestra suficientemente grande  B(25; 25):
para usar la aproximación de la distribución de  Parámetros son mucho mayores que
la media muestral sugerido por el teorema de uno
 Parámetros iguales
límite central para los casos de una distribución
poblacional beta y, en caso sea suficiente,
encontrar si es que y qué tamaños de muestra
más pequeños también son suficientes.
Obtener un conjunto de reglas más apropiado
que simplemente considerar treinta como un
tamaño de muestra suficientemente grande para
muestras provenientes de distribuciones beta.

METODOLOGÍA  B(15; 35):


Dado que este tamaño ideal variaría conforme  Parámetros son mucho mayores que
lo hagan los parámetros, diez pares de uno
parámetros fueron escogidos para representar  Parámetros difieren significativamente
distintos casos con respecto al tamaño de estos
y la razón entre ellos.
 B(5; 5):
 Parámetros mayores que uno, pero no
por mucho
 Parámetros iguales

 B(8; 42):
 Parámetros son mucho mayores que
uno
 Parámetros difieren por mucho

 B(3; 7):
 Parámetros mayores que uno, pero no
por mucho
 Parámetros difieren significativamente
 B(0.5; 0.5):
 Parámetros menores a uno, pero no por
mucho
 Parámetros iguales

 B(0.02; 0.18):
 Parámetros mucho menores a uno
 Parámetros difieren por mucho

 B(0.2; 0.8):
 Parámetros menores que uno, pero no
por mucho
 Parámetros difieren significativamente

También se escogieron distintos tamaños de


muestra “n” a probar:

n=5, 10, 20, 30 (regla práctica) y 50

Se simularon muestras pseudo-aleatoriamente


en R, se calcularon sus medias aritméticas y se
 B(0.1; 0,1):
trazaron las distribuciones de estas medias
 Parámetros mucho menores a uno
muestralespara cada combinación entre tamaño
 Parámetros iguales
de muestra “n” y pares de parámetros
previamente mencionados. (50 combinaciones,
10000000 de muestras simuladas por cada una)

Para verificar más fácilmente el comportamiento


normal de estas distribuciones, también se
trazaron las funciones de densidad de
distribuciones normales con la misma media y
varianza para cada distribución de media
muestral respectiva.

 B(0.05; 0.15):
 Parámetros mucho menores a uno
 Parámetros difieren significativamente
-Teorema del Límite Central:

Sean X1,X2, X3…Xn una muestra aleatoria de


una distribución con media μ y varianza σ . 2

Entonces ladistribución de:

Es una distribución normal estándar N (0,1)en el


límite cuando n → ∞ (o de manera aproximada
cuando n essuficientemente grande).

RESULTADOS

Las siguientes gráficas son las distribuciones de


las medias de las muestras simuladas.

Se indica la distribución beta de la proviene


cada una en la parte superior de cada gráfica.
Distribución de Tamaño de muestra
la población 5 10 20 30 50
B(5; 5)
B(3; 7)
B(25; 25)
B(15; 35)
B(8; 42)
B(0.5; 0.5)
B(0.2; 0.8)
B(0.1; 0.1)
B(0.05; 0.15)
B(0.02; 0.18)

CONCLUSIONES

El tamaño de muestra recomendado para que la


media muestral siga una distribución
aproximadamente normal a la vista de media
α/(α+β) y varianza αβ/((α+β)2(α+β+1)) es mucho
menor en caso los parámetros sean iguales
(distribución beta simétrica) y moderadamente
menor conforme los parámetros sean mayores.

Siendo “n” dicho tamaño de muestra


recomendado en el caso de la media muestral:
 Para distribuciones beta simétricas de
parámetros significativamente mayores
que uno, n<5.
 Para distribuciones beta asimétricas de
parámetros significativamente mayores
que uno, n varía mucho según
incremente la diferencia entre los
parámetros, pero esta sensibilidad
disminuye conforme aumenta el tamaño
de los parámetros.
 Para distribuciones beta simétricas de
parámetros significativamente menores
que uno, 10<n<20.
 Para distribuciones beta asimétricas de
parámetros significativamente menores
que uno, n es demasiado grande para
propósitos generales (n>80) en la
mayoría de los casos.

En fin, parece confirmarse el criterio de requerir


un tamaño de muestra mayor conforme más
asimétrica sea la distribución para el caso de las
distribuciones beta.
RECOMENDACIONES
En la siguiente tabla se resumen los resultados
de las pruebas visuales de normalidad.
Hay sugerencias por parte del equipo que -Teorema del Límite Central:
realizó esta investigación con el propósito de
que futuros trabajos lleguen a conclusiones más Sean X1,X2, X3…Xn una muestra aleatoria de
específicas y robustas: una distribución con media μ y varianza σ . 2

 Utilizar pruebas formales de normalidad Entonces ladistribución de:


para la verificación del comportamiento
gaussiano de las medias muestrales.
 Realizar más pruebas de normalidad
para analizar una gama más amplia de Es una distribución normal estándar N (0,1)en el
casos con más tamaños de muestra. límite cuando n → ∞ (o de manera aproximada
cuando n essuficientemente grande).
BIBLIOGRAFÍA

-Mohd, N. N., &Wah, Y. B. (2011). Power


comparisons of Shapiro-Wilk, Kolmogorov- -Código utilizado (lenguaje de programación R):
Smirnov, Lilliefors and Anderson-Darling tests.
#beta, simulación de medias muestrales
Journal of Statistical Modeling and Analytics,
2(1), 21-33. Retrieved November 14, 2017. muestras <- 1000000
-Quora. (2017). Why can hyper parameters in # cantidad de muestras
beta and dirichlet distribution be less than 1? sizes<- c(5, 10, 20, 30, 50)
# tamaño de muestra
[online] Available at:
https://www.quora.com/Why-can-hyper- alpha<- 8
parameters-in-beta-and-dirichlet-distribution-be- bet<- 42
less-than-1 [Accessed 7 Nov. 2017]. poblacion<- rbeta(n = 10000000,alpha,bet)
-Aguirre, B., Casabona, W., Herencia, L. and for (j in sizes){
m <- rep(NA, muestras)
Poma, C. (2017). SIMULACIÓN DE LA
for(i in 1:muestras){
DISTRIBUCIÓN MUESTRAL DE LA MEDIA aux = sample(poblacion,
PARA UNA DISTRIBUCIÓN WEIBULL. Lima: size = j, replace = T)
Escuela Profesional de Ingeniería Estadística. m[i] = mean(aux)
}
hist(m, breaks=100, prob=T,
main =
paste("B(",as.character(alpha),
";", as.character(bet),
") n=", as.character(j),
sep=''),
xlab="x", ylab="densidad")
curve(dnorm(x,mean=mean(m),sd=sd(m)),
add = T,col = "red")
}

#Este código se ejecuta para cada


# par de parámetros a probar

ANEXOS

Você também pode gostar