Você está na página 1de 34

Distribuciones Teóricas de Probabilidad

Las Distribuciones Teóricas de Probabilidad, son modelos matemáticos que


describen el comportamiento probabilístico de variables aleatorias discretas o
continuas y son la que posibilita la realización de un Análisis Inferencial.

Distribuciones para Variables Discretas

Las distribuciones realizadas con variables aleatorias discretas y que se han


desarrollado en la teoría, se clasifican en “Binomial, Hipergeométrica y
Poissón” según las características con que se realice el Acontecimiento o
Experimento Aleatorio.

Binomial

Para la aplicación de la distribución Binomial se deben cumplir las siguientes


condiciones:
a) La variable aleatoria debe ser discreta.
b) El espacio muestral debe ser finito.
c) El espacio muestral debe poder ser dividido dicotómicamente, es decir
en dos atributos de una misma variable.
d) La probabilidad de un suceso permanece constante de extracción en
extracción, o sea, que se realizan extracciones con reposición.

Función de Probabilidad

La probabilidad de obtener (v) veces, variables con atributo (A), en (n)


extracciones con reposición, está dada por la Función de Frecuencia o Función
de Probabilidad siguiente:

Donde:
n = cantidad de extracciones o repeticiones del experimento o acontecimiento
aleatorio
v = cantidad de elementos que poseen el atributo(A) y ((n-v) son los
elementos, que no lo posean.
p = probabilidad de ocurrencia del atributo (A).
q = probabilidad de que no ocurra el atributo (A).

Función de Distribución:

Si la variable (v) adopta un valor arbitrario (v ≤u) la siguiente expresión


define dicha Función:

Aplicación:

El personal del Dique Florentino Ameghino desea analizar la cota de embalse


registrada en el Dique. Sabiendo que la probabilidad de que la cota sea mayor
o igual a 152,857 msnm es de 0,44, calcular las siguientes probabilidades al
seleccionar una muestra de 25 mediciones con reposición:

a) P( x ≤ 15) =0,96472

Existe una probabilidad del 96,472% de que 15 cotas de embalse sean


menores o iguales a 152,857 msnm

b) P( x = 7) = 0,0450223

Existe una probabilidad del 4,5022 % de que 7 cotas de embalse sean iguales a
152,857 msnm.
Todas estas probabilidades fueron realizadas sobre los 25 ensayos.

Hipergeométrica

Este tipo de distribución se usa bajo condiciones similares a las requeridas


para la Distribución Binomial, con la diferencia que las extracciones se
realizan sin reposición, lo que implica una variación en la probabilidad de
ocurrencia del suceso, de extracción en extracción.
Condiciones:
a) La variable aleatoria debe ser discreta.
b) El espacio muestral debe ser finito.
c) El espacio muestral debe poder ser dividido dicotómicamente.
d) La probabilidad de un suceso varía de extracción en extracción, es
decir que la selección se realiza sin reposición.

La Función de Probabilidad:

Donde:
Na = cantidad de elementos que poseen el atributo A
Nb = cantidad de elementos que no poseen el atributo A
N= total de elementos de la población
n = número de extracciones o repeticiones en la muestra
V= cantidad de elementos extraídos que deben cumplir con el atributo A

La Función de Distribución:

Aplicación

Ahora el personal de la cooperativa decide tomar el mismo ensayo pero en


este caso sin reposición. Se sabe que la probabilidad de que el consumo de
energía sea menor o igual a 155,286 msnm es de 0,44. Se desea determinar las
siguientes probabilidades:

a) P(x =7) =0,03355


Existe una probabilidad del 33,55 % de que 7 de los 25 datos seleccionados
sin reposición pertenezcan a un valor de cota de embalse menor o igual a
155,286 msnm.

b) P(x≤ 15) = 0,0505186

Existe una probabilidad del 50,51 % de que 15 de los 25 datos


seleccionados sin reposición pertenezcan a un valor de cota de embalse
menor o igual a 155,286 msnm.

Poisson

Esta distribución es una extensión de la Distribución Binomial, ya que se


realizan extracciones con reposición, el espacio muestral está dividido
dicotómicamente y la variable es discreta, con la diferencia que Poisson es
aplicable cuando n∞ y p0.
En la práctica, este modelo se aplica cuando n≥50 y p ≤ 0,10.
El único parámetro de la Distribución de Poissón es λ, que a su vez es igual a
la Esperanza Matemática y la Variancia, λ se calcula de la siguiente forma:

λ = n. p = E(x) =o ²

Función de Probabilidad:

v = cantidad de elementos extraídos que poseen el atributo (A).


λ =n * p = Constante.

Función de Distribución:
Aplicación:

Del análisis de 60cotas de embalse, se sabe que la Probabilidad de que el


mismo tenga unacota de embalse menor o igual a 65msnm es igual a 0,23.
En base a ello, se desea conocer las siguientes Probabilidades:
a) Que 10 o más cotas de embalse sean mayores a 60,5 msnm.
b) Que exactamente 4 lo sean.

λ =60 * 0,23 = 13,8

a) P(x ≥10) = 0,8807884

Existe una probabilidad del 88% de que al menos 10 de esas 60cotas de


embalse sean menores o iguales a 60,5 msnm.

b) P(x= 4) = 0,00153476

Existe una probabilidad del 0,153% de que 4 cotas de embalse sean iguales a
60,5 msnm.
Distribuciones para Variables Continuas

Normal

La Distribución Normal refleja el comportamiento de variables aleatorias


continuas, que tienen una gráfica de forma campanular simétrica, asintóticas
en sus extremos y unimodal, es decir monótona decreciente a ambos lados del
valor modal, y además cumple con la condición de cierre.
Características del espacio muestral son las siguientes:
Espacio muestral continuo e infinito.
Muestras grandes (n ≥ 30)
Las medidas características de la Distribución Normal son las Media (μ) y la
Variancia(σ ²).

Función de Densidad:

1 -½ (xi – μ) ²⁄σ²
f(x) =------------ е
√2∏*σ

Donde μ y o ² son la media y la variancia de la distribución bajo análisis

Función de Distribución

t 1 -½ (xi – μ) ²⁄σ²
F (t) =∫------------ е
-∞√2∏*σ

Aplicación:

Suponiendo que la cota de embalse sigue una Distribución Normal con


=156,46 y Ŝ= 4,21279, determinar las siguientes probabilidades:

a) De encontrar cota de embalse entre 150 y 165 msnm.

P (150<x<165) = 0,9160
Existe una probabilidad del 91,60% de que existan cotas de embalse
comprendidos entre 150 msnm y 165msnm.

b) De encontrar cota de embalse menores a 152msnm.


P (x <152) = 0,144872

Existe una probabilidad del 14,48% de cota de embalse menor a 152msnm.


CAPITULO III

AJUSTE DE LA DISTRIBUCION EMPIRICA MEDIANTE UNA

LEY TEORICA DE PROBABILIDAD


AJUSTE DE UNA DISTRIBUCIÓN EMPÍRICA MEDAINTE UNA LEY
TEÓRICA DE PROBABILIDAD

Después de realizar el Análisis Descriptivo en nuestra investigación, es


necesario asociar una Ley o Distribución Teórica de Probabilidad a la
Distribución de Frecuencias obtenida anteriormente, para luego realizar un
Análisis Inferencial.
La importancia de este tema radica en que, para realizar dicho análisis, bajo la
Estadística Paramétrica, es necesario conocer la Distribución de Probabilidad
de la variable en la Población.
Como en la generalidad de los estudios estadísticos ese conocimiento no se
posee entonces se lo logra asignándole una Ley o Distribución Teórica de
Probabilidad a la muestra ya que ésta es representativa de la población.
Para la elección de la Distribución de Probabilidad que mejor se adecue al
comportamiento de nuestra variable en la muestra, es necesario destacar las
siguientes características de nuestra distribución empírica:

a) La variable es de tipo continuo y homogénea.


b) Su grafica se asemeja a una distribución de tipo campanular.
c) Los valores de la Media Aritmética (156,46 msnm), la Mediana
(155,79 msnm), y el Modo (149,47 msnm), se encuentran bastante
cercanos entre sí, indicando un sesgo a la izquierda poco pronunciado:
As= 0,042623por lo tanto su asimetría no es acentuada, siendo la Media
representativa de la muestra
d) El valor de la curtósis no es superior a la unidad en valor absoluto k=-
0,992601
e) En los intervalos ( +/- tŜ) se obtuvieron los siguientes porcentajes:
62,5%, 96,5 %, 99,73 % valores similares a los que presenta la
Distribución Normal.
f) Un tamaño de muestra grande
g) El Coeficiente de Variación menor del 50% lo que indica una
homogeneidad.

En virtud de esas características y su similitud con las que posee el Modelo


Normal, se adoptará la Función de Densidad de la Distribución Normal,
reemplazando en ella los estimadores muéstrales, es decir:

𝟏 𝟏 (𝒙𝒊−𝟏𝟓𝟔,𝟒𝟔)𝟐
− ,
𝒇(𝒙) = 𝒆 𝟐 𝟏𝟕,𝟕𝟒𝟕𝟔
√𝟐𝝅 𝟒, 𝟐𝟏𝟐𝟕𝟗
En base a esa función, se calcularan las probabilidades que le corresponden a
cada uno de los intervalos de clase obtenidos en la distribución agrupada del
consumo de energía obtenida precedentemente
Dicho cálculo se realiza considerando los estimadores indicado en esa Función
de Densidad en el programa estadístico ya empleado en cálculos anteriores.
En el siguiente cuadro se indican los valores de probabilidad obtenidos, como
así también las Frecuencias Esperada:

AJUSTAMIENTO
LI LS fi Pi f’i
148 150,429 10 0,0538175 5,38175
150,429 152,857 10 0,120075 12,0075
152,857 155,286 24 0,19404 19,404
155,286 157,714 19 0,226778 22,6778
157,714 160,143 14 0,191985 19,1985
160,143 162,571 13 0,117544 11,7544
162,571 165 10 0,052125 5,2125
TOTALES 100 0,9563645 95,63645

CALCULO DE LA BONDAD DEL AJUSTE

fi f’i (fi – f’i)²/f’i


20 17,38925 0,3919672

24 19,404 1,08860111

19 22,6778 0,59645172

14 19,1985 1,40763092

23 16,9669 2,14525315

5,629904098

Vemos entonces que el Chi-Cuadrado de Pearson es igual a:


X² obs = 5,629904098

Por su parte, Chi-Cuadrado Teórico para el 95% de Confiabilidad, es:

X²(5-1-2); 95% = 5,991

Toma de decisión:
Como:

5,629904098<5,991

Se acepta el Modelo Normal como ajuste a la Distribución Empírica, es decir


que la cota de embalse en el Dique Florentino Ameghino presenta un
comportamiento probabilístico dado por la Distribución Normal con Media
igual a 156,46 y Variancia Corregida de 4,21279.
El siguiente gráfico muestra el acople del Modelo Teórico (comportamiento
curvilíneo) a la Distribución de Frecuencias con Datos Agrupados
(Histograma)

Histograma para consumo

30 Distribución
Normal
25

20
frecuencia

15

10

0
0 50 100 150 200 250 300
Consumo de energía
SEGUNDO INFORME DE AVANCE

Mediante la Teoría Probabilística, y la aplicación de sus diferentes teoremas,


se calculó las probabilidades de distintos sucesos de la variable bajo estudio:

LAPLACE
 Existe una probabilidad del 37% de que la cota de embalse sea mayor e
igual a 157,714 msnm.
NO EXCLUYENTE
 La probabilidad de que en una muestra de cien datos de cota de embalse
y erogación, se encuentren niveles de cotas menores a 161 msnm o
erogaciones mayores a 60 m3/seg es del 80%.
EXCLUYENTES
 La probabilidad de que haya un nivel por sobre el nivel del mar mayor a
150 metros o que se registre una erogación mayor a 50m3/seg es del 37%.
CONDICIONAL
 La probabilidad de que no habiéndose dado la condición de que el
erogación sea mayor a 50 m3/seg, la cota de embalse que se haya producido
sea menor a 155 msnm es del 50,79%.
DEPENDIENTES
 Existe una probabilidad del 19% de que se hayan registrado valores de
erogación máxima mayor a 55 m3/seg y cota de embalse menor a 160 msnm.
INDEPENDIENTES
 Existe una probabilidad del 1,53 % de que se produzcan una cota de
embalse menor a 150 msnm y una erogación mayor a 70 m3/seg.
BAYES
 Existe una probabilidad del 36,59 % de que no habiéndose cumplido
con los requerimientos de cota de embalse, la erogación máxima pertenezca
al intervalo 45,01 – 61 m3/seg.

Mediante las Distribuciones de Probabilidad se calculó las probabilidades de


distintos sucesos para la población bajo estudio:

BINOMIAL
c) P( x ≤ 15) =0,96472
Existe una probabilidad del 96,472% de que 15 cotas de embalse sean
menores o iguales a 152,857 msnm
a) P( x = 7) = 0,0450223
Existe una probabilidad del 4,5022 % de que 7 cotas de embalse sean iguales a
152,857 msnm.
Todas estas probabilidades fueron realizadas sobre los 25 ensayos.

HIPERGEOMETRICA
c) P( x ≤ 15) =0,0505186
Existe una probabilidad del 50,51 % de que 15 de los 25 datos seleccionados
sin reposición pertenezcan a un valor de cota de embalse menor o igual a
155,286 msnm.
a) P( x = 7) = 0,03355
Existe una probabilidad del 33,55 % de que 7 de los 25 datos seleccionados
sin reposición pertenezcan a un valor de cota de embalse menor o igual a
155,286 msnm.

POISSON
a) P(x ≥10) = 0,8807884
Existe una probabilidad del 88% de que al menos 10 de esas 60cotas de
embalse sean menores o iguales a 60,5 msnm.

b) P(x= 4) = 0,00153476
Existe una probabilidad del 0,153% de que 4 cotas de embalse sean iguales a
60,5 msnm.

NORMAL
a) De encontrar cota de embalse entre 150 y 165 msnm.
P (150<x<165) = 0,9160
b) De encontrar cota de embalse menores a 152msnm.
P (x <200) = 0,144872

Mediante el Ajuste de Distribuciones se ha podido establecer que la


distribución de cota de embalse se ajusta al modelo de la Distribución Normal
x~ N (156,46; 4,21279), con un nivel de confiabilidad del 95%.
CAPITULO IV

TEORIA DEL MUESTREO


PROPIEDAD DE LOS ESTIMADORES

Las estimaciones a realizarse sobre una determinada característica poblacional


en base a una muestra, serán tanto más confiables o precisas cuanto “mejores”
sean los estimadores calculados con dicha muestra. El concepto de “mejor”
está referido a ciertas condiciones que deben cumplir los estimadores.
Estas condiciones o propiedades son las de: Insesgado (no viciados);
Consistente, Eficiente y Suficiente, las cuales dependerán del procedimiento
de muestreo utilizado y del método de cálculo que se emplee para obtener al
estimador, entre otros.
 Insesgado (no viciado): Un estimador será Insesgado o No Viciado, cuando
la Esperanza Matemática del estimador sea igual al parámetro poblacional
a estimar.

 Consistente: cuando la probabilidad de que, el estimador tienda al


parámetro a estimar, tienda a 1 cuando (n) tiene a (N).
 Eficiente:
a) Eficiencia Relativa: Es cuando un estimador analizado en el conjunto de
la (k) muestras posibles posee menor variabilidad que otros estimador,
obtenidores obtenidos con la misma muestra.
b) Eficiencia Asintótica: Es cuando la distribución del estimador tiene a la
Distribución Normal, con Media igual al parámetro a estimar y el
Desvió Estándar igual a una constante dividida por la raíz cuadrada del
tamaño de la muestra.

 Suficiente: Cuando la muestra contiene toda la información relativa al


verdadero valor del parámetro a estimar.

Propiedad de Insesgamiento

Media
Para su demostración empírica, consideraremos (por razones prácticas) 4 cotas
de embalse como un conjunto de datos poblacionales, que en nuestro caso son:

157,2 162,8 163,23 149,74

Calculando la media, la variancia corregida y la variancia, se tiene:

µ= 158,24
0,929092
Ŝ² = 39,6751
0,929092 - 1) = 29,756325
σ² = 39,6751*(4
4

σ² = 29,756325

Seleccionando muestras de tamaño 𝑛 = 2

157,2 157,2 157,2 162,8 162,8 149,74


162,8 163,23 149,74 163,23 149,74 163,23
𝑥̅ 160 160,215 153,47 163,015 156,27 156,485

E (𝑥̅ ) = ∑ xi * Pi = 949,455* 1 = 158,24


6

E (𝑥̅ ) = 158,24 = μ

Es decir que:
𝐸(𝑥̅ ) = 𝜇
Por lo tanto, la media es un estimador Insesgado o no viciado.

Variancia Corregida

Considerando el ejemplo el caso anterior se obtiene:

157,2 157,2 157,2 162,8 162,8 149,74


162,8 163,23 149,74 163,23 149,74 163,23
Ŝ² 15,68 18,18045 27,8258 0,09245 85,2818 90,99005
𝑠2 7,84 9,090225 13,9129 0,046225 42,6409 45,495025

E (Ŝ²) = ∑ Ŝ²ί * P ί = 238,05 * 1/6 =39.675 = S²

E (Ŝ’²)=39.675 =S²
Es decir que:
E (Ŝ’²)= S²

Por lo tanto, la Variancia Corregida muestral es un estimador Insesgado o no


Viciado de la Variancia Corregida Poblacional

Veamos ahora la Variancia Sin Corregir:

E (s²) =∑ s² ί * P ί = 119,023* 1/6 =19,34≠ σ²

E (S²)=19,34 ≠ σ²

Por lo tanto se demuestra que la Variancia muestral sin corregir es un


estimador Sesgado de la Variancia Poblacional.

Propiedad de Consistencia

Resultará Consistente o “conciliable”, cuando la probabilidad de que él


estimador tienda al parámetro estimar, la misma tienda a 1, cuando (n) tiende
a (N), o sea:

Prob. (estimador → parámetro) → 1 cuando (n) → (N)

Propiedad de Eficiencia

Relativa
Cuando un estimador analizado en el conjunto de las (k) muestras posibles
tiene menor variabilidad que otros estimadores obtenidos de esas muestras.
En el caso bajo estudio, se realizó el cálculo de la Variancia Corregida de
todos los estimadores para comparar su eficacia.
Sabiendo que, (𝑥̅ =156,46msnm) ( g= 156,404msnm); (Me=155,79 msnm) y
el (Mo=149,47) se obtuvo:
𝑛
2 (𝑋)
(𝑥𝑖 − 𝑋)²
𝑆 =∑ = 17,748
𝑛−1
𝑖=1

𝑛(𝑥𝑖 − 𝑋𝑔)2
𝑆 2 (𝑋𝑔)
= ∑ 𝑛 − 1 = 17.75
𝑖=1

𝑛
2 (𝑀𝑒)
(𝑥𝑖 − 𝑀𝑒)²
𝑆 =∑ = 18.20
𝑛−1
𝑖=1

𝑛(𝑥𝑖 − 𝑀𝑜)2
𝑆 2 (𝑀𝑜)
= ∑ 𝑛 − 1 = 67.11
𝑖=1

Por lo calculado, podemos decir que la Media Aritmética es el estimador que


presenta una mejor Eficiencia Relativa con respecto a los demás estimadores.
Asintótica
Cuando la Distribución Empírica tiende a la Distribución Normal con media
igual al parámetro a estimar, y Desvió igual a una constante dividida por la
raíz cuadrada del tamaño de la muestra.

Propiedad de Suficiencia

En este trabajo, se puede observar esta Propiedad comparado los Coeficientes


de Variación calculados en base a la Media Aritmética, Media Geométrica,
Mediana y Modo, teniendo en cuenta las Variancias Corregidas obtenidas en
el punto anterior respecto a cada una de esas medidasy aquél estimador que
posea menor Coeficiente de Variación, será el más eficiente:

CV ( X ) = s * 100 = 4.2128 * 100 = 2.6925%


X 156.46

CV( g) = s * 100 = 4.2131* 100 = 2.6937%


g156.404
CV (Me) = s *100 = 4,2661* 100 = 2,74%
Me155,79

CV (Mo) = s * 100 = 4,1921 * 100 = 5,48%


Mo149,47

Cómo conclusión de los cálculos realizados precedentemente, la Media


aritméticaresulta ser un estimador Suficiente ya que presenta un menor
Coeficiente de Variación.
Distribución de los Estimadores

Teniendo en cuenta que en cada una de las (K) posibles muestras, se pueden
calcular los estimadores de los Parámetros (μ) y (σ²); se puede pensar que es
altamente probable que no todos los valores de esos estimadores coincidan
entre si y por lo tanto constituirán una Variable Aleatoria cuyo
comportamiento probabilístico responderá a un Modelo Teórico de
Probabilidad.
Así, los estimadores ( ) y (Ŝ²), se distribuirán de la siguiente forma:

Distribución de las Medias en el conjunto de las (K) Muestras ( )


El Teorema Central del Límite dice que:

“Cualquiera sea la Distribución de Probabilidad de la variable en la


Población, siempre el conjunto de los (K) Promedios muestrales se
distribuirán Normalmente”.
Aplicación del Teorema Central del Límite

Con el fin de demostrar empíricamente ese Teorema, se consideran los


siguientes (9) valores de la variable bajo estudio (cota de embalse), como una
Población:

161.45 161 159.97 158.82 157.57 155.96 154.98 152.07 150.94 160.67

Seleccionando muestras de tamaño (𝑛 = 2) y calculando sus respectivos


promedios aritméticos, se tiene:

Muestra Media
161,45 159,97 160,71
161,46 158,82 160,14
161,47 157,57 159,52
161,48 155,96 158,72
161,49 154,98 158,235
161,5 152,07 156,785
161,51 150,94 156,225
159,97 158,82 159,395
159,97 157,57 158,77
159,97 155,96 157,965
159,97 154,98 157,475
159,97 152,07 156,02
159,97 150,94 155,455
158,82 157,57 158,195
158,82 155,96 157,39
158,82 154,98 156,9
158,82 152,07 155,445
158,82 150,94 154,88
157,57 155,96 156,765
157,57 154,98 156,275
157,57 152,07 154,82
157,57 150,94 154,255
155,96 154,98 155,47
155,96 152,07 154,015
155,96 150,94 153,45
154,98 152,07 153,525
154,98 150,94 152,96
152,07 150,94 151,505
160,67 161,45 161,06
160,67 159,97 160,32
160,67 158,82 159,745
160,67 157,57 159,12
160,67 155,96 158,315
160,67 154,98 157,825
160,67 152,07 156,37
160,67 150,94 155,805

Con los 36 promedios, calculamos la Distribución Agrupada de los mismos:

-Frecuencia = 36
-Media = 156,94
-Desvío Corregido= 2,366
-Mínimo = 151,505
-Máximo =161,06
-Rango = 9,555
K=1+3,33 log (36) =6,18
K=6
h=161, 06 – 151,505 =1, 59
6
h= 2
Li=151,505– 2 = 150,505
2
Li=151
𝟐
Intervalos de 𝒇𝒊 ′ ′ (𝒇𝒊 − 𝒇𝒊 ′ )
𝒇𝒊 𝒑𝒊 𝒇𝒊 𝒇𝒊
Clases (𝒏 ∗ 𝒑𝒊 ) 𝒇𝒊 ′
151 153 2 1,50853032 1,50853032
8 7,2034243 0,0880877
153 155 6 5,694894 5,694894
155 157 11 10,943892 10,943892 11 10,943892 0,0002877

157 159 9 10,724904 10,724904 9 10,724904 0,2774192

159 161 7 5,359824 5,359824


161 163 1 1,363284 1,363284
8 6,910416 0,1717977
163 165 0 0,17586 0,17586
165 167 0 0,011448 0,011448
TOTAL 36 0,99396212 35,78263632 0,53759214

X²obs = 0,5375

X²t (4 – 1 – 2); (95%)= 3,841


Para la toma de la decisión:
Como
0,5375<3,841

Se acepta que los promedios muéstrales se distribuyen


normalmente, es decir:

𝑥̅ ~𝑁(𝜇; 𝜎 2 𝑥̅ )

Siendo las variancias de las medias en población finita:

𝜎2 𝑛
𝜎 2 𝑥̅ = (1 − )
𝑛 𝑁

Dado que en nuestro caso el cociente (n/N) no tiende a cero y considerando al


a la Variancia Corregida de la muestra como estimador insesgado de la
Variancia poblacional, nos queda:

o² = 17,748 1 – 100 = 0,1288


100 365
o² =0,1288

Siendo el Desvío Estándar:

o = 0,3589

Distribución de las Variancias Corregidas (Ŝ²):

Es demostrable que:

Ŝ²≈X²(n-1)*σ²⁄(n-1)

que en este trabajo resulta ser:

Ŝ²≈X²(99)*17,7476⁄ (99)

DETERMINACION DEL TAMAÑO DE LA MUESTRA

La importancia que la representatividad de una muestra tiene en el logro de


"buenos " estimadores primero y en la confiabilidad de las estimaciones
inferenciales que con ellos se realicen después; es que pasaremos a determinar
el tamaño de la muestra (número de unidades a seleccionar de la población)
mediante la cual calcularemos los estimadores, de forma tal que esa
representatividad sea lograda.

Tamaño de Muestra en Población Finita

Con la ejemplificación de este tema, se pretende justificar la representatividad


del tamaño de la muestra con la que se realiza esta investigación, situación
mencionada en el punto Diseño Muestra llevado a cabo al comienzo de la
misma.
Por lo desarrollado en la teoría, sabemos que existen dos tipos de situaciones
con respecto al tamaño de la Población, la cual puede ser Finita o Infinita y
que para cada una de esas situaciones se desarrollaron fórmulas para calcular
el Tamaño de la Muestra, procedimiento metodológico que justificara la
representatividad de la misma frente a la Población de la cual fue extraída.
Como en este trabajo la relación (n/N) no tiende a cero, entonces estamos
frente al caso de Población Finita, situación en la se debe aplicar la siguiente
fórmula para estimar un Promedio Poblacional:

N * t² * σ²
n = ---------------------
t² * σ² + N * e²

En virtud de que en esta investigación se parte de un Tamaño de Muestra


preestablecido, la justificación o no del mismo se lograr despejando de la
expresión anterior, el valor del Error Máximo Admisible (e).

Determinación del Error Máximo Admisible para este trabajo

Realizado el procedimiento algebraico, se obtiene la siguiente expresión:

𝑁 ∗ 𝑡2 ∗ 𝜎2 − 𝑛 ∗ 𝑡2 ∗ 𝜎2
𝑒=√
𝑛∗𝑁

Recordando que en esta investigación:

 N= 365
 n= 100
 Ŝ²=17,7476

Y considerando un Nivel de Confiabilidad del 95%, el valor de (t) en una


Normal Reducida, y considerando área centrada, resulta ser:

 t=z(95%)=1,96
e= 365*1,96²*17,7476–100*1,96²*17,7476 = 0,7035
100*365

Dividiendo ese valor por la Media Aritmética de la muestra y multiplicando


por 100, se obtiene el valor del Error Máximo Admisible en términos
porcentuales:

e% = e * 100 = 0,7035 * 100 = 0,4496%


156,46

Como e = 0,4496% y resulta ser inferior al 10%, el tamaño de muestra


prefijado de antemano, garantiza la representatividad de la muestra.

Muestra Artificial

Simulación de Modelos

Caso Discreto: Distribución de Poisson:

Planteo del Problema:

La Central del Dique Florentino Ameghino selecciona determinados días


enla represa para realizar una investigación sobre la cota de embalse,
esperan que dicho estudio los oriente para realizar futuras
regulacionesy/o realizar cálculos para otros días.

Suceso (S): la probabilidad de seleccionar un asociado al azar de los 100 aquí


investigados y que este posea unacota de embalse que este entre162 y
163msnm, es igual a 0,04(Probabilidad de cota de embalse alto)

La Central estaría estudiando la posibilidad de regular la cota de embalse


durante una cantidad de días, el cual se encuentra en etapa de precipitaciones
sobre la cuenca, esto sería siempre que se pueda llegar a la conclusión de que
habiendo 100 días seleccionados no más de un 10% de los mismos tengan una
probabilidad de cota de embalse alta, lo que es decir que la cota sea mayor a
163 msnm. Se realiza una muestra al azar de 6 cotas de embalse y se desea
conocer si no más de 2 cotas de embalse no cumplen con la premisa
estipulada.
Ante ello, el ingeniero, simula un Modelo de Control de Calidad por Atributos
(Muestra Artificial) y en base a ello desea saber si su consumo de energía será
o no Aceptada por la Central.

Simulación del Modelo:

Dados los datos del problema, la Distribución de Probabilidad de la Variable


Aleatoria "cota con Suceso (S)", viene dada por la Distribución de POISSON
ya que:

n = 100 p = 0,04

por lo que:

λ = n*p= 100 * 0,04 = 4

Ahora el productor selecciona 6 Números Aleatorios entre 100 (dado que en


porcentaje representa la Condición de Cierre de una Distribución de
Probabilidad), conforme al uso del software estadístico y surge la siguiente
Muestra Aleatoria:

12 32 35 50 60 65

los que al transformarlos en Función de Distribución (F´v), quedan:


0,12 0,32 0,35 0,50 0,60 0,65

Por otro lado y en base al Software con λ= 4obtenemos los valores de la


Función de Probabilidad y de la Distribución según el Modelo de Poisson.
Con ello y la F´(v) construimos la siguiente tabla:

COTA DE Cantidad de Cotas


EMBALSE ALTA F(v) F´(v) por días(v’)
0,0183156 0,12
0 2

0,0915782 0,32
1 3

0,2381032 0,35
2 3

0,43347 0,50
3 4

0,628837 0,60
4 4

0,78513 0,65
5 5

Los valores de (V') se obtienen de la siguiente forma:


1. Se ve que el segundo valor de la (Fv) ACUMULA al primero de la
(F´v), con lo cual la primer cota seleccionada contiene valores que
cumplan con el Suceso (S).
2. Por su parte el tercer valor de la (Fv), ACUMULA a los valores de la
(F’v) que ocupan el segundo y tercero lugar, lo cual nos indica que en
cada uno de esas doscotas se encontró solo un valor que cumple el
Suceso (S).
3. El cuarto valor de la (Fv) ACUMULA al cuarto, quinto valor de las
F’(v), situación que nos conduce a decir que en la cuarta y quintacotas
seleccionadas existen dos (2) cotas que cumplen con el suceso (S).
4. El sexto valor de la (Fv) ACUMULA al sexto valor de las F’(v),
situación que nos conduce a decir que en la sexta cotaseleccionada
existen una cota que cumple con el suceso (S).
De esta manera y agotados los valores de las F´(v), se concluye con la
siguiente situación:
Cota de embalse Cantidad de usuarios con
consumo de energía alto
1 2
2 3
3 4
4 5

Conclusión:
Es decir que, de las 10cotas examinadas, se encontró:
a) Una cota con dosusuario que tenga consumo de energía alto.
b) Dos cotas con tresusuario que tenga consumo de energía alto.
c) Tres cotas con cuatrousuarios que tenga consumo de energía alto
d)Cuatrocotas con cincousuarios que tenga consumo de energía alto

Toma de Decisión:

Como existen en esa Muestra Artificial de (6) cotas, uno con MAS de dos (2)
consumos de energía altos, entonces la CentralHidroeléctrica RECHAZA la
REGLA DE DECISION.

Caso Continuo
Aplicando la Distribución Normal

Siguiendo con el tema investigado por este Trabajo Integrador, recurrimos al


tema “Ajustamiento de la Distribución Empírica mediante un modelo teórico
de Pronabilidad” y en el vemos que el consumo de energía se Distribuyen
Normalmente con los siguientes estimadores del modelo:

= 156,46 Ŝ = 4,21

Planteo del Problema:

Se desea construir una Muestra Artificial de tamaño (n=12 cotas) con el fin de
detectar con este Modelo de Simulación, la cantidad de cotas cuyos valores
superen el valor medio (156,46msnm).
Suceso (S) = cota cuya altura sobre el nivel del mar supere el valor medio
(156,46 msnm).
Para ello, se siguen los siguientes pasos:
Primer Paso: Seleccionar 12 Números Aleatorios entre 100, los que en este
caso fueron:
1 3 26 35 49 51 52 55 72 78 81 83

Segundo Paso: transformar esos valores en Función de Distribución:


0.01 0.03 0.26 0.35 0.49 0.51 0.52 0.55 0.72 0.78 0.81 0.83
Tercer Paso: Construir la siguiente tabla:

Cota Fx F’x Cota Suceso (S)


(Xi) (Xi)
148 0,0222419 0,01 148 0
150,429 0,0759942 0,03 150,429 0
152,857 0,196048 0,26 155,286 0
155,286 0,390174 0,35 155,286 0
157,714 0,617098 0,49 157,714 1
160,143 0,809165 0,51 157,714 1
162,571 0,926686 0,52 157,714 1
165 0,978746 0,55 157,714 1
-------- -------- 0,72 160,143 1
-------- -------- 0,78 160,143 1
-------- -------- 0,81 162,571 1
--------- -------- 0,83 162,571 1

Conclusión:
Es decir que, de las (12) cotas, se encontró:
a) Cuatro usuarios que no cumplía con el suceso (S).
b) Ocho usuarios que si cumplía con el suceso (S).

Toma de Decisión:

En virtud de lo expuesto, más de la mitad de las cotas seleccionadas poseen un


valor superior al nivel de cota promedio (156,46 msnm).
CAPITULO V

TEORIA DE ESTIMACION
ESTIMACION PUNTUAL

La misma consiste en estimar a un Parámetro mediante “UN” solo valor.


Para ello y en virtud de la Distribución Teórica de Probabilidad, mediante la
cual ajustamos nuestros datos empíricos, se deducirán los Estimadores
Puntuales de los Parámetros Media y Variancia.
Para llevar a cabo esas estimaciones, recordemos que en esta investigación la
Función de Densidad del Modelo Probabilístico con el cual realizamos el
Ajustamiento, fue:

1 -½ (xi – μ) ²⁄σ²
f(x) =------------ е
√2∏* σ

Por lo desarrollado en la Teoría, al aplicar dicha Función a todos y cada uno


de los (n) puntos de la muestra y luego operando algebraicamente, se obtienen
los siguiente Estimadores Puntuales

μ*= Σ Xi =
n
Y
σ*²= Σ (xI - )² =
n

que en el presente trabajo, resultan ser:

μ* = 156,46

σ*² = 15,57
ESTIMACION POR INTERVALOS

Consiste en estimar un Parámetro Poblacional, mediante un Conjunto de


valores, definido como intervalo, dentro del cual se espera, que se encuentre
comprendido el verdadero valor del Parámetro Poblacional a estimar.

Media (μ)

La estimación por Intervalos para este parámetro, se obtiene mediante la


siguiente expresión:

𝑃{𝑥̅ − 𝑡 ∗ 𝜎𝑥̅ ≤ 𝜇 ≤ 𝑥̅ + 𝑡 ∗ 𝜎𝑥̅ } = 1 − 𝛼

Recordando que:

 =156,46
 o² = 0,1288
 o = 0,3589
 t=1,96 (Nivel de confiabilidad del 95%-Área centrada)
Reemplazando los valores:
𝑃{𝑥̅ − 𝑡 ∗ 𝜎𝑥̅ ≤ 𝜇 ≤ 𝑥̅ + 𝑡 ∗ 𝜎𝑥̅ } = 1 − 𝛼

P {156,46- 1,96 * 4,176 ≤ µ ≤ 141,25 + 1,96 * 4,176}=0,95


140,54 ≤ µ ≤ 141,95

A través de esto podemos concluir que, con un 95% de confiabilidad, se


espera que la verdadera Media Poblacional del consumo de energía, se
encuentre entre 140,54 msnm y 141,95msnm.

Variancia (σ²)

En virtud de la distribución del Estimador Variancia Corregida, se deduce la


siguiente expresión, la cual nos permite, con un cierto Nivel de Confiabilidad,
estimar los valores de un intervalo dentro de los cuales se esperó este
comprendida la verdadera Variancia de la Población:

P (n-1) Ŝ² ≤ σ² ≤ (n-1) Ŝ²
X²2 X²1

Recordando que:
n=100

Ŝ²=17,7476

(1-α)= 0,95 (Considerando área centrada)


Chi-Cuadrada
Probabilidad = 0,95
0,03 G. L.
99
0,025
95%
0,02
densidad

0,015

0,01
2.5% 2.5%
0,005

0
0 30 60 90 120 150 180
x

73,361 128,422

P 17,7476*99 ≤o²≤17,7476*99 = 0,95

128,422 73,361

2017,38 ≤ o²≤ 3531,52

Podemos concluirquecon un 95% de confiabilidad, se espera que la verdadera


Variancia Poblacional de la cota de embalse, se encuentre entre… msnm y…
msnm.

Você também pode gostar