Você está na página 1de 27

Simulacin de Sistemas

Modelado Estadstico
Prueba de Bondad de Ajuste

Objetivo de la Sesin
Aprender a Crear una Distribucin de
Probabilidad
Determinar cual es la mejor distribucin
que se ajusta a los datos
Manejar pruebas de bondad de ajuste

Sistemas
Tabla de Contenido

Creando una distribucin de probabilidad


Distribucin de Probabilidad
Variable Aleatoria

Funcin de Distribucin Exponencial


Pruebas de Bondad de Ajuste
Prueba Chi-Cuadrado ()
Prueba Kolmogorov Smirnov (K-S)

Creando una Distribucin de Probabilidad


Distribucin de Probabilidad y Simulacin
Una distribucin de probabilidad es un conjunto
de valores los cuales son contabilizados a partir
de una frecuencia relativa, en el cual, un evento
ocurre o es probable que ocurra.
Los modelos de simulacin estocstica utilizan
distribuciones de probabilidad para representar
una gran cantidad de eventos que ocurren
aleatoriamente.

Ajuste de Curvas

16

51
9

3 27
8

54
22

10
43
12

43

Variable Aleatoria
Una variable aleatoria es una variable cuyos
resultados son determinados por los resultados
de un experimento.
Ejemplo.
Cantidad de tiempo entre arribos de paquetes que
llegan a u muelle

P(X x) indica que la probabilidad de la variable


aleatoria X ser menor que o igual a un valor x.

Funcin de Densidad de Probabilidad


Una fdp relaciona la probabilidad correspondiente a un
valor x individual asociado con una variable aleatoria X
Un histograma de probabilidad asocia probabilidades con
grupos de valores de x
Ellos pueden ser expresados grficamente, describiendo
los pares de valores. Tpicamente el eje horizontal
significa valor x y un eje vertical usualmente denota el
valor y.
Usualmente denotado como y = f(x) (interpretado como
y es una funcin de x)

Creando una Distribucin de Probabilidad


Primer paso: Recolectar data emprica (data
bruta). La data emprica es informacin recuperada
(puede ser data histrica), esto es contado o
medido, recopilada en su forma original.
Dado el siguiente ejemplo de data emprica.
Consideremos que se han registrado 100
observaciones de tiempo entre arribos de mnibus a
una terminal terrestre.

Tiempo entre arribos de mnibus a una terminal terrestre (minutos)

N= 100 observaciones

18

13

40

29

10

10

17

29

22

22

32

20

10

11

13

15

23

29

34

17

10

15

40

24

14

24

14

28

12

18

10

54

12

13

22

45

12

14

12

33

23

12

46

18

39

19

25

12

Graficando los tiempo entre arribos de mnibus


a una terminal terrestre (minutos)

T
0

1=18

18 2=13

31 3=3

34

4=40

74

Creando una Distribucin de Probabilidad

Segundo paso: creacin de un histograma de


frecuencia (probabilidad) relativa a la data. Agrupar la
data por intervalos.
Intervalos de clase:
Regla de STURGES:

K = 1 + 3.3 Log (n)

n: nmero total de observaciones


K: nmero de intervalos
Para nuestro ejemplo: K = 1 + 3.3 Log (100) = 7.6
Entones K es igual a 8 intervalos de clase.
Ancho de clase = (Max valor Min valor) / k
Ancho de clase = (54 - 1) / 8 = 6.625

Frecuencia relativa del tiempo entre arribos

Nro.

Intervalo
de clase

1
2
3
4
5
6
7
8

[01.000 - 07.625)
[07.625 14.250)
[14.250 20.875)
[20.875 27.500)
[27.500 34.125)
[34.125 40.750)
[40.750 47.375)
[47.375 54.000]
TOTAL

Frecuencia Probabilidad
44
26
9
8
7
3
2
1
100

0.44
0.26
0.09
0.08
0.07
0.03
0.02
0.01
1

Creando una Distribucin de Probabilidad


La ecuacin matemtica que describe una
funcin de densidad es a menudo dificultosa
para establecerla.
Esto puede ser aproximado frecuentemente
hallando una distribucin de probabilidad
estndar
conocida
(ejemplo:
normal,
exponencial, gamma, etc.), la cual representa
con precisin la distribucin de frecuencia
relativa de la data actual.
La figura de un histograma de frecuencia
relativa provee una pista o indicio para
encontrar
una
distribucin
estndar
representativa.

Creando una Distribucin de Probabilidad


Tercer paso: Graficar en un Histograma la frecuencia

relativa
La figura del histograma en el grfico indica que una distribucin
exponencial es un candidato probable para representar la
distribucin de probabilidad de la data observada.

Funcin Exponencial
Media:
Varianza:2

1 x
f ( x) e

Para nuestro ejemplo = 12.41 (este valor resulta de la


suma total de los valores observados, entre el nmero
de observaciones)

Funcin de densidad de probabilidad

1 x12.41
f ( x)
e
12.41

f(x)

Probabilidad

0.08
1
.

1.- y = f(0) = 0.08

0.05

2.- y = f(10) = 0.035


2
.

0.035

3.- y = f(40) = 0.003


3
.

0.003

20

40

60

80

Tiempo entre arribos

PRUEBA DE BONDAD DE AJUSTE


Luego de analizar la forma que tiene el grfico del
histograma de frecuencias relativas, ste puede mostrar
que uno o ms de las distribuciones estndares se
parecen para ajustar la data.
Su utilidad es determinar cual es el mejor tipo de
distribucin que ajusta la data.

Prueba Chi-Cuadrado ()
Prueba Kolmogorov Smirnov (K-S)

Test

Aplicable a v.a. continuas y v.a .discretas y compara las funciones de densidad


de probabilidad
Procedimiento
1o. Elaborar el histograma de frecuencias relativas, con la que podemos apreciar
cul sera la funcin terica de densidad que se ajusta mejor a los datos del
histograma.
2o. Desarrollo de la prueba estadstica :
2.1. Planteamiento de hiptesis
Hp : La variable en estudio se ajusta a determinada distribucin terica
(Uniforme,
exponencial, normal, poisson).
Ha : La variable en estudio tiene un comportamiento aleatorio que no se ajusta
a
determinada distribucin terica.
3o. Establecimiento del nivel de significacin .
4o. Clculos previos y estimacin de la frecuencia esperada o terica
5o. Criterios de decisin :
Se acepta la Hp, si X2 calc < X2 tab
Se rechaza la Hp si X2 calc > X2 tab

Test

Dada una muestra X1, X2, ..., Xn de una Fx(x) desconocida. Se


desea contrastar.
Ho : Fx(x) = Fo(x)

v/s H1 : Fx(x) Fo(x)

Efectuando una particin del soporte de X en k subconjuntos I1, I2, ..., Ik :

Ii X Ii I j

f i ei 2

i 1

ei

2 ( k 1 p )

fi : Nmero observados en el subconjunto i-simo (Ii)


ei: nmero de observaciones esperadas en Ii bajo Ho

Prueba Chi-Cuadrado ()
P(X x) =1- e-x/
Intervalos

P(X<=Ls)

P(X<=Li)

Prob.

(Oi E i ) 2
Ei

01.000 - 07.625

44

0.459

0.077

0.3816

38.163

0.893

07.625 - 14.250

26

0.683

0.459

0.2238

22.377

0.587

14.250 - 20.875

0.814

0.683

0.1312

13.120

1.294

20.875 - 27.500

0.891

0.814

0.0769

7.693

0.012

27.500 - 34.125

0.936

0.891

0.0451

4.511

1.374

34.125 - 40.750

0.963

0.936

0.0264

2.645

0.048

40.750 - 47.375

0.978

0.963

0.0155

1.551

0.130

47.375 - 54.000

0.987

0.978

0.0091

0.909

0.009

Total

100

4.35

Chi - cuadrado calculado


2(calculado)

Prueba Chi-Cuadrado ()
P(X x) =1- e-x/
Intervalos

P(X<=Ls)

P(X<=Li)

Prob.

(Oi E i ) 2
Ei

01.000 - 07.625

44

0.459

0.077

0.3816

38.163

0.893

07.625 - 14.250

26

0.683

0.459

0.2238

22.377

0.587

14.250 - 20.875

0.814

0.683

0.1312

13.120

1.294

20.875 - 27.500

0.891

0.814

0.0769

7.693

0.012

27.500 - 34.125

0.936

0.891

0.0451

4.511

1.374

34.125 - 40.750

0.963

0.936

0.0264

2.645

0.048

40.750 - 47.375

0.978

0.963

0.0155

1.551

0.130

47.375 - 54.000

0.987

0.978

0.0091

0.909

0.009

Total

100

4.35

Chi - cuadrado calculado


2(calculado)

Prueba Chi-Cuadrado ()
Para un nivel de confianza del 95%

Grados de Libertad
Cantidad parmetros a estimar
(media)

2(teorico) = 2(95%, k 1-P ) = 2(95%, 8 1-1

Se tiene las siguientes hiptesis:

2(95%, 6) = 12.592

Ho: Los datos se ajustan a una fdp


Exponencial

2(calculado) < 2(teorico)

Hi: Los datos NO se ajustan a una


fdp Exponencial

4.35

<

12.592

No se rechaza la hiptesis H0

Test de Kolmogorov - Smirnov (Test K-S)


Mediante la prueba se compara la distribucin acumulada de las frecuencias tericas
(Fo) con la distribucin acumulada de las frecuencias observadas (Fn), se encuentra
el punto de divergencia mxima y se determina qu probabilidad existe de que una
diferencia de esa magnitud se deba al azar.
Procedimiento:
1o. Calcular las frecuencias esperadas de la distribucin terica especfica por
considerar para determinado nmero de clases, en un arreglo de rangos de menor a
mayor.
2o Arreglar estos valores tericos en frecuencias acumuladas.
3o Arreglar acumulativamente las frecuencias observadas.
4o Aplicar la ecuacin D = |Fo Fn| , donde D es la mxima discrepancia de ambas.
5o Comparar el valor estadstico D de Kolmogorov-Smirnov en la tabla de valores
crticos de D.
6o Decidir si se acepta o rechaza la hiptesis.

Test de Kolmogorov - Smirnov (Test K-S)


Sea Fo una funcin de distribucin continua y sea Fn la
funcin de distribucin emprica de la muestra.
Bajo Ho: Fn(x) = Fo(x) se espera que Fn se aproxime a Fo
Dn = Sup | Fn(x) - Fo(x) |
xR
La distribucin
exacta de Dn est tabulada para valores
n 40 y distintos niveles de significacin .

Para muestras grandes se utiliza la distribucin


asinttica de Dn dada por

lim P(
n

n Dn z ) L( z ) 1 2 (1) e
i 1

i 1 2 i 2 z

Prueba Kolmogorov Smirnov


Se tiene las siguientes hiptesis:
Ho: Los datos se ajustan a una fdp
Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

F ( x) 1 e x /12.41

K_S
Intervalos
1
7.625
14.25
20.875
27.5
34.125
40.75
47.375

FO
7.625
14.25
20.875
27.5
34.125
40.75
47.375
54

FOA
44
26
9
8
7
3
2
1
100
Max-Dif

POA
44
70
79
87
94
97
99
100

0.44
0.7
0.79
0.87
0.94
0.97
0.99
1

D
D Tabla 0.05

Como:
Mxima Diferencia < D(5%,100)
No se rechaza la hipotesis H0

PE
0.38162846
0.22376666
0.13120489
0.07693158
0.0451086
0.02644929
0.01550846
0.00909334

PEA
IPEA-POAI
0.38162846 0.05837154
0.60539512 0.09460488
0.73660001 0.05339999
0.81353159 0.05646841
0.85864019 0.08135981
0.88508948 0.08491052
0.90059793 0.08940207
0.90969127 0.09030873

0.09460488Menor
no se Rechaza
0,13403

FO: Frecuencia Observada


FOA: Frec. Observada Acumulada
POA: Prob. Observada Acumulada
PEA: Prob. Esperada Acumulada

Prueba Kolmogorov Smirnov


Se tiene las siguientes hiptesis:
Ho: Los datos se ajustan a una fdp
Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

F ( x) 1 e x /12.41

K_S
Intervalos
1
7.625
14.25
20.875
27.5
34.125
40.75
47.375

FO
7.625
14.25
20.875
27.5
34.125
40.75
47.375
54

FOA
44
26
9
8
7
3
2
1
100
Max-Dif

POA
44
70
79
87
94
97
99
100

0.44
0.7
0.79
0.87
0.94
0.97
0.99
1

D
D Tabla 0.05

Como:
Mxima Diferencia < D(5%,100)
No se rechaza la hipotesis H0

PE
0.38162846
0.22376666
0.13120489
0.07693158
0.0451086
0.02644929
0.01550846
0.00909334

PEA
IPEA-POAI
0.38162846 0.05837154
0.60539512 0.09460488
0.73660001 0.05339999
0.81353159 0.05646841
0.85864019 0.08135981
0.88508948 0.08491052
0.90059793 0.08940207
0.90969127 0.09030873

0.09460488Menor
no se Rechaza
0,13403

FO: Frecuencia Observada


FOA: Frec. Observada Acumulada
POA: Prob. Observada Acumulada
PEA: Prob. Esperada Acumulada

Conclusiones
El Ajuste de curvas se realiza con datos
obtenidos del sistema real
La pruebas de bondad de ajuste nos ayudan a
determinar que distribucin se ajusta mejor a los
datos recolectados.

Você também pode gostar