Escolar Documentos
Profissional Documentos
Cultura Documentos
So Paulo, 2005.
Sumrio
1
2
Figura 1. Tipos de distribuies mais comuns em climatologia (Assis, et al., 1996, pg. 36).
2
Definies
6
primeira regra citada acima. O valor 1/6 maior do que zero e menor do que 1, assim
satisfaz a segunda regra acima.
A distribuio de probabilidades pode ser representada por um histograma de
probabilidades. Este se assemelha ao histograma de freqncias apresentado na Parte I,
entretanto a escala vertical representa probabilidades, em lugar das freqncias
relativas.
O histograma de probabilidades nos permite visualizar a forma da distribuio. A
mdia, a varincia e o desvio-padro traduzem outras caractersticas. Para uma
distribuio de probabilidades, essas medidas podem ser determinadas usando as
expresses mostradas na tabela 1.
Tabela 1. Expresses para clculo da mdia, varincia e desvio-padro das distribuies
de probabilidades.
Mdia
Varincia
Varincia
Desvio-Padro
=x P(x)
=[(x-)2 P(x)]
2=[x2 P(x)] - 2
=([x2 P(x)] - 2)1/2
2
(1)
7
Observamos que E=. Isto , a mdia de uma varivel aleatria discreta coincide
com seu valor esperado.
Exemplo (extrado de Triola, 1998, pag 96): Na tabela abaixo so fornecidas as
probabilidades de ocorrncias de um determinado evento. Entretanto, o objetivo da
mesma enfatizar o clculo da mdia, da varincia e do desvio-padro. Juntamente com a
tabela ser mostrado o histograma de probabilidades.
Tabela 2. Clculo da mdia, varincia e desvio-padro para uma distribuio de
probabilidades.
X
P(x)
x P(x)
x2
x2 P(x)
0
1
2
3
4
5
6
7
0,210
0,367
0,275
0,115
0,029
0,004
0
0
0,000
0,367
0,550
0,345
0,116
0,020
0,000
0,000
0
1
4
9
16
25
36
49
0,000
0,367
1,100
1,035
0,464
0,100
0,000
0,000
Total
1,000
1,398
3,066
9
distribuies paramtricas, porque seus atributos especficos dependem dos valores
numricos de seus parmetros.
2.2.3 Parmetros e Estatsticas
comum a confuso entre parmetros da distribuio e estatsticas da amostra.
Os parmetros da distribuio so as caractersticas de uma distribuio terica
particular. Eles representam sucintamente as propriedades fundamentais de uma
populao. J as estatsticas so quantidades calculadas a partir de uma amostra de
dados. A confuso entre eles pode ser devido a algumas distribuies tericas comuns
onde estatsticas so bons estimadores para os parmetros da populao. Por exemplo, o
desvio-padro da amostra, s, pode ser confundido com o parmetro da distribuio
Gaussiana porque os dois so iguais quando a distribuio Gaussiana representa bem os
dados amostrais. Para esta distribuio a mdia da amostra igual ao parmetro e o
desvio-padro igual ao parmetro . importante ressaltar que nem sempre os
parmetros das distribuies so encontrados usando estatsticas das amostras.
Normalmente, a notao para estatsticas da amostra envolve letras romanas e para os
parmetros envolve letras gregas.
2.2.4
Distribuies Contnuas
10
A maioria das variveis atmosfricas podem assumir valores contnuos. A
temperatura, a precipitao, a altura geopotencial, a velocidade do vento, e outras
quantidades no esto restritas a valores inteiros de unidades fsicas em que so
medidas. Embora a natureza da medio e os sistemas de relatos tal que as medidas
atmosfricas so arredondadas para valores discretos, mas o conjunto de valores
observados normalmente grande o suficiente para que a maioria das variveis possam
ainda ser tratadas como quantidades contnuas.
Existem duas funes associadas a cada varivel contnua X: a funo densidade
de probabilidade, simbolizada por f(X), e a funo cumulativa de probabilidade, ou
funo de distribuio de probabilidade representada por F(X). A funo f(X) aquela
cuja integral de X = a at X = b (b a) d a probabilidade de que X assuma valores
compreendidos no intervalo (a, b), ou seja,
P a
b f X dX
a
(2)
f X dX
(3)
(4)
F X e X dX 1 e X
0
(5)
Qualquer funo definida no campo real s pode ser considerada como uma funo
densidade de probabilidade se forem satisfeitas as seguintes condies:
f X 0
(6)
para todo X e
F X
dX 1
(7)
11
P a X b f X dX F b F a
a
(8)
P a X b f X dX F b F b 0
a
(9)
Distribuio Normal
12
tamanho de amostra. Alm disso, mesmo no caso de uma distribuio no-normal, a
distribuio das mdias amostrais ser aproximadamente normal, desde que a amostra
seja grande. Este um resultado notvel, na verdade, pois nos diz que no necessrio
conhecer a distribuio de uma populao para podermos fazer inferncia sobre ela a
partir de dados amostrais. A nica restrio que o tamanho da amostra seja grande.
Uma regra prtica muito usada que a amostra deve consistir de 30 ou mais
observaes.
Estes resultados so conhecidos como o Teorema do Limite Central e representam
talvez o conceito mais importante na inferncia estatstica (Stevenson, 1981).
Agora ser mostrado um exemplo ilustrativo adaptado de Triola (1998, pg. 126).
Vamos realizar quatro amostragens para identificar o ltimo algarismo do Nmero do
Seguro Social (NSS) de estudantes de uma determinada cidade. Ou seja, selecionaremos
na primeira amostragem 50 estudantes e verificamos o ltimo algarismo do NSS,
repetimos por mais trs vezes esse procedimento e como resultado obtemos a tabela 3.
Nesta tabela se combinarmos as amostras numa grande coleo de duzentos nmeros,
obtemos uma mdia x 4,5 e um desvio-padro s = 2,8 e, uma distribuio
aproximadamente uniforme como mostra o grfico da figura 3. Entretanto, se
calcularmos as mdias das amostras (linhas da tabela), obtemos as mdias amostrais e
estas possuem uma distribuio normal (figura 4). Conclui-se que embora a coleo
original de dados tenha uma distribuio aproximadamente uniforme, as mdias amostrais
tm distribuio aproximadamente normal. O conjunto original de 200 nmeros tem
distribuio uniforme (porque os algarismos 0-9 ocorrem aproximadamente com a mesma
freqncia), mas as 50 mdias amostrais tm distribuio normal. um fenmeno
verdadeiramente fascinante e intrigante na estatstica que, extraindo amostras de
qualquer distribuio, possamos criar uma distribuio normal ou, ao menos,
aproximadamente normal.
Em geral, a distribuio amostral das mdias amostrais a distribuio das mdias
amostrais quando extramos repetidas amostras de mesmo tamanho, da mesma populao.
Em outras palavras, se extrairmos amostras de mesmo tamanho da mesma populao,
calculamos suas mdias e construmos um histograma destas mdias, esse histograma
tende para a forma de um sino de uma distribuio normal. Isto verdade
independentemente da forma da distribuio da populao original.
Suponhamos que a varivel x represente notas que podem ter, ou no, distribuio
normal, e que a mdia dos valores x seja e o desvio-padro seja . Suponha que
coletemos amostras de tamanho n e calculemos as mdias amostrais. O que sabemos
sobre a coleo de todas as mdias amostrais que obtemos repetindo esse experimento?
O Teorema do Limite Central nos diz que, na medida em que o tamanho n da amostra
aumenta, a distribuio amostral das mdias amostrais tente para uma distribuio
normal com mdia e desvio-padro / n . A distribuio das mdias amostrais tende
Projeto PAE Bolsista: Michelle S. Reboita
13
para uma distribuio normal no sentido de que, quando n aumenta, a distribuio das
mdias amostrais se aproxima de uma distribuio normal. Essa concluso no obvia
intuitivamente; foi obtida aps extensa pesquisa de anlise.
Embora a demonstrao formal rigorosa exija recursos da matemtica avanada,
ultrapassando o mbito deste material, podemos encontrar uma certa justificativa com
base nos dados da tabela 3. Se selecionamos aleatoriamente amostras de algarismos de
uma populao distribuda uniformemente com mdia = 4,5, as mdias amostrais
resultantes tambm tendero a centrar-se em torno de 4,5, de modo que as mdias
amostrais tambm tm mdia 4,5; a mdia das 50 mdias amostrais da tabela 3 , de
fato, 4,5. inspecionando visualmente os 200 algarismos da tabela 3, vemos que eles
variam de 0 a 9, mas as 50 mdias amostrais acusam menor variao indo de 1,75 a 8,25.
O conjunto original de 200 algarismos tem desvio-padro de 2,8, mas as 50 mdias
amostrais tm um desvio-padro de 1,4, que menor, conforme esperado.
Tabela 3. Amostragens do Nmero do Seguro Social de estudantes de uma determinada
cidade.
Amostra I
Amostra II
Amostra III
Amostra IV
Mdia
1
5
9
5
9
4
7
9
5
7
0
9
6
8
5
6
7
5
4
1
4
3
0
1
9
7
9
8
5
9
6
8
0
2
8
3
8
1
3
2
7
1
3
8
5
8
1
1
9
2
4
7
1
2
0
1
3
5
7
3
1
6
6
3
0
2
2
0
6
3
8
2
3
6
1
5
3
4
6
2
5
3
6
3
0
5
5
0
2
2
4
1
4
1
1
5
4
9
7
9
8
9
4
6
8
5
5
2
6
4
9
1
1
2
7
0
9
4
7
6
7
6
8
5
0
0
0
1
3
9
1
5
3
6
6
7
4,75
4,25
8,25
3,25
5,00
3,50
5,25
4,75
5,00
5,00
3,00
5,25
4,75
3,00
7,25
3,75
4,50
5,75
4,25
2,25
3,50
2,75
1,75
1,75
5,00
3,00
3,50
7,00
4,00
6,50
4,00
6,25
4,00
4,50
14
5
6
4
7
2
8
2
6
2
2
5
0
2
7
8
5
8
5
8
1
9
3
7
7
3
4
4
4
5
1
3
6
9
4
7
2
5
2
1
7
3
7
3
3
8
3
7
6
0
9
6
0
0
2
6
1
9
5
7
8
6
4
0
7
5,50
6,00
6,25
2,50
4,00
3,75
4,00
5,25
4,25
4,50
4,75
3,75
5,25
3,75
4,50
6,00
15
f X
X 2
para x
(10)
2
onde e so a mdia e o desvio-padro da populao, respectivamente. estimado
por x e por s, que so obtidos atravs das relaes:
22
X
i 1
X X
N
s2
(11)
i 1
(12)
N 1
Uma notao bastante empregada para designar que uma varivel tem distribuio
normal com mdia x e varincia s2 (s a representao de e x de de uma amostra)
N X , s 2 . Se uma amostra de dados tem realmente distribuio normal a seguinte relao
vlida: A = (K-3) = 0. A curtose da distribuio normal igual a 3 e a assimetria nula.
O histograma de freqncias da distribuio normal tem a forma de sino ou
parecida. Com a mdia constante e a varincia varivel, o grfico da curva normal assume
diferentes formas de sino: de alongada a achatada.
A probabilidade de que X assuma valores menores ou iguais a um dado x quando X
N( x ,s2) estimada por:
F X
1
2
X 2
2 2
dX
(13)
Mas essa equao no pode ser resolvida analiticamente sem o uso de mtodos de
integrao aproximada. Por essa razo usa-se a transformao Z
varivel Z tem N(0,1).
A varivel Z chamada varivel reduzida e a curva
Projeto PAE Bolsista: Michelle S. Reboita
X X
s
e com isso a
16
F Z
1
2
Z2
2
dZ
(14)
17
18
Exemplo 1
Como exemplo de uso da tabela acima, considera-se uma varivel X com N(15,25).
Qual a probabilidade de que X assuma os valores (16 X 20)?
A probabilidade desejada pode ser obtida, utilizando-se a varivel transformada
(Z). Assim:
Z
X X
s
Para X = 16 Z
16 15
0,04
25
20 15 0,20
Para X = 20 Z
25
P(0,04 Z 0,20) = P(Z 0,2)-P(Z 0,04)
19
Prec.
Ano
Prec.
Ano
Prec.
Ano
Prec.
1895
1896
1897
1898
1899
1900
1901
1902
1903
1904
1905
1906
1907
1908
1909
1910
1911
1912
1913
1914
1915
1916
1917
1918
1919
923
973
1258
1695
1066
1334
952
1746
1320
1510
1501
1212
1166
1305
1198
1004
1323
1539
885
2338
1455
1011
689
1510
1138
1920
1921
1922
1923
1924
1925
1926
1927
1928
1929
1930
1931
1932
1933
1934
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944
1300
1054
1326
1360
931
1377
1099
1160
1144
1321
1350
1298
1780
998
1535
1496
1995
1718
1311
1297
1724
1945
1237
680
1153
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
864
1307
919
1443
1114
1225
926
1270
1112
1373
890
1191
1220
1232
1778
1331
1372
856
1582
832
1255
1605
1271
1049
982
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1040
1090
1344
1110
1355
1048
1361
1654
1179
1137
1555
1352
1342
1543
1694
1178
1656
1815
890
857
1423
1330
1435
1390
1265
f 7 18 27 27 29 11 5 2 1 100
fX 7 x783 18x991 27 x1199 29x1407 11x1615 5x1823 2x2031 1x2239 129.676,00
fX 7x783
X
fX 129.676,00 1.296,8
100
f
Projeto PAE Bolsista: Michelle S. Reboita
20
s
fX
fX / f
2
f 1
176.764.592,00 129.676,00
99
/ 100
86.928,71
s = 294,83
Tabela 6. Distribuio de freqncias dos totais anuais de chuva de Pelotas RS, no
perodo de 1895 a 1994. Ajuste distribuio normal.
Classes
Zi
F(Zi)
F(Xi)
fe
679 - 887
887 1095
1095 1303
1303 1511
1511 1719
1719 -1927
1927 2135
2135 2343
783
991
1199
1407
1615
1823
2031
2239
7
18
27
29
11
5
2
1
-1,39
-0,68
0,02
0,73
1,43
2,14
2,84
3,55
0,0823
0,2483
0,5080
0,7673
0,9236
0,9838
0,9977
1,0000
0,0823
0,1660
0,2597
0,2593
0,1563
0,0602
0,0139
0,0023
8,2
16,6
26,0
26,0
15,6
6,0
1,4
0,2
Totais
100
1,0000
100,0
21
Como F(Zi) acumulada, a F(X), ou seja, a probabilidade de que ocorra um valor de
chuva menor ou igual ao da classe, calculada subtraindo-se do valor de F(Z) de cada
classe o valor de F(Z) da classe anterior, como indicado na tabela 6.
As freqncias esperadas (fe) em cada classe, (a ltima coluna da tabela 6) so
obtidas, multiplicando-se o valor de F(X) pela soma de todas as freqncias, ou seja:
fe1 = 0,0823 x 100 = 8,2
fe2 = 0,1660 x 100 = 16,6
fe3 = 0,2597 x 100 = 26,0
fe4 = 0,2593 x 100 = 26,0
fe5 = 0,1563 x 100 = 15,6
fe6 = 0,0602 x 100 = 6,0
fe7 = 0,0139 x 100 = 1,4
fe8 = 0,0023 x 100 = 0,2
A soma das freqncias esperadas (fe) deve ser igual a soma das freqncias
observadas (f).
A representao grfica do ajuste acima indicada na figura 5.
22
Figura 5. Totais anuais de chuva de Pelotas (RS), no perodo de 1895 a 1994, ajustada
distribuio normal (Assis et al., 1996, pg. 49).
3.2 Distribuio Gamma
Muitas variveis atmosfricas possuem assimetria positiva, ou seja, so distorcidas
direita. Freqentemente a distoro ocorre quando h um limite fsico esquerda que
relativamente prximo a variao dos dados (Wilks, 1995). Exemplos comuns desta
situao so as quantias de precipitao e a velocidade do vento que so fisicamente no
negativas. H uma variedade de distribuies contnuas que so limitas esquerda por
zero. Entretanto, a distribuio gamma comumente usada para representar dados de
precipitao.
A freqncia ou funo densidade de probabilidade da distribuio gamma :
X
1
f X
X 1 e
(15)
e XdX
(16)
X X 1 !
para X 1, 2, 3, ...
X 1 X X
para X 0
1 / 5
1,77245
O valor de (X) pode ser obtido, com boa aproximao, atravs da seguinte
relao:
2 X ln X f X
e
X
(17)
1
1
1
2
4
12X
360X
1260X6
(18)
onde:
f X 1
23
A mdia, a varincia e o coeficiente de assimetria (A) da distribuio gamma
podem ser obtidos por:
X
(19)
s2 2
(20)
(21)
Pode-se concluir, com base na equao (21), que, quando tende para infinito A
0, ou seja, a distribuio gamma, neste caso, tende a ser simtrica.
As estimativas dos parmetros e resultam da soluo das equaes (19) e (20).
Mas essas estimativas no so adequadas, preferindo-se as estimativas descritas em
Thom (1966):
Projeto PAE Bolsista: Michelle S. Reboita
24
1
4A
1 1
4A
3
(22)
(23)
sendo
(24)
A ln X Xg
onde
1 N
Xi
N i 1
(25)
1 N
ln Xi
N 1
(26)
X
a mdia aritmtica e
Xg
(27)
(28)
(29)
Z ln X Xg
dX
(30)
25
Esta equao no tem soluo imediata, exigindo tabelas ou tcnicas de integrao
numrica como expanso em srie e a frmula de Simpson, por exemplo. A srie
normalmente utilizada a seguinte:
F t
t
t1
t2
t3
1
...
1 2 3
e t
1 1 2
(31)
f 18 28 20 13 9 4 2 1 95
fX 18 31,1 28 73,1 20 115,1 13 157,1 9 199,1 4 241,1 2 283,1 1 325,1 10.598,5
X
10.598,5
111,56
95
fX
s
fX
fX / f
2
f 1
94
A ln 111,93
429,3573
0,19504
95
26
Ano
189...
190...
191...
192...
193...
194...
195...
196...
197...
198...
68,3
203,6
81,5
97,0
269,0
10,4
143,5
83,9
59,6
77,5
117,8
65,7
239,6
271,3
84,9
106,6
148,1
85,4
2
113,3
81,3
159,0
31,5
68,3
62,8
64,5
178,1
71,0
3
35,8
50,1
182,0
59,0
25,1
144,4
151,1
213,9
135,9
145,6
197,7
28,8
151,7
244,7
160,1
11,5
127,0
246,8
112,6
22,3
132,6
129,6
45,7
44,1
22,1
48,1
129,8
78,6
32,1
20,2
130,1
33,4
64,5
113,4
210,9
107,8
140,1
166,0
129,9
15,5
72,8
82,7
64,5
101,8
58,4
84,4
119,7
82,7
183,1
121,4
86,6
59,3
232,0
340,3
162,0
191,3
72,5
149,5
63,4
148,5
23,1
119,7
92,4
87,6
134,5
105,2
14,7
209,4
FX
FX2
ln(X) f
10,1 52,1
52,1 94,1
94,1 136,1
136,1 178,1
178,1 220,1
220,1 262,1
262,1 - 304,1
304,1 346,1
31,1
73,1
115,1
157,1
199,1
241,1
283,1
325,1
18
28
20
13
9
4
2
1
559,8
2.046,8
2.302,0
2.042,3
1.791,9
964,4
566,2
325,1
17.409,78
149.621,08
264.960,20
320.846,33
356.767,29
232.516,84
160.291,22
105.609,01
61,8697
120,1712
94,9160
65,7395
47,6443
21,9408
11,2916
5,7841
Totais
95
10.598,5
1.608.101,75
429,3573
1 / 4 0,19504 1
1 4 0,19504 / 3 2,7206
111,56
41,0066
2,7206
As estimativas dos parmetros com base nas equaes (19) e (20) a fim de
comparaes, fica como exerccio.
Projeto PAE Bolsista: Michelle S. Reboita
27
Com os parmetros e estimado tem-se, ento, a funo densidade de
probabilidade, na forma da equao (15),
f x 2,61x10 X
5
1, 7206
X
41, 0066
1, 706
X
41, 0066
dX
52,1
1,2705
41,0066
,1 2705 ,1 27052
,1 27053
1
,1 2705
F t
,1 2705
2,7206 ,1 5704 e
2,7206
,1 2705
,1 2705
F X1 0,1838
Tabela 10. Distribuio de freqncias dos totais mensais de chuva de janeiro em
Pelotas RS, ajustados distribuio gamma de probabilidade.
Classes
FX
fe
10,1 52,1
52,1 94,1
94,1 136,1
136,1 178,1
31,1
73,1
115,1
157,1
18
28
20
13
0,1838
0,4734
0,7052
0,8489
17
28
22
14
28
178,1 220,1
220,1 262,1
262,1 - 304,1
304,1 346,1
199,1
241,1
283,1
325,1
9
4
2
1
0,9272
0,9663
0,9849
0,9934
7
4
2
1
Totais
95
95
F X e e
(32)
(33)
29
O duplo sinal no segundo expoente da equao (33) refere-se aos valores extremos
mximo (sinal negativo) e mnimo (sinal positivo).
As estimativas dos parmetros e podem ser obtidas por diferentes mtodos
como por exemplo: o mtodo dos momentos, o mtodo da regresso, o mtodo de Lieblein
e o mtodo da mxima verossimilhana (Assis et al., 1996). Entretanto, aqui, sero
descritos o mtodo dos momentos, o mtodo da regresso e o mtodo da mxima
verossimilhana, atravs do exemplo a seguir. O mtodo de Lieblein pode ser encontrado
em detalhes em Thom (1966) e Assis et al. (1996).
Exemplo
Considerem-se os 72 valores anuais de chuva mxima de 24 horas de Piracicaba,
SP, apresentados na tabela 11.
Tabela 11. Chuva mxima de 24 horas de Piracicaba, SP, no perodo de 1917 a 1988.
Ano
191...
192...
193...
194...
195...
196...
197...
198...
64,0
86,5
83,3
55,5
83,8
71,6
50,7
65,0
93,0
77,9
62,4
55,5
68,5
59,2
55,0
69,0
104,9
73,9
82,9
80,4
68,6
64,0
65,0
97,7
54,4
52,0
99,5
114,0
4
60,0
83,0
111,2
57,8
48,3
68,6
51,1
5
57,0
50,0
95,3
80,1
80,4
76,0
70,4
66,5
64,4
64,4
39,9
70,7
72,7
62,0
65,0
64,0
58,8
75,2
59,1
49,1
71,8
103,2
68,0
50,0
58,0
46,8
80,0
63,0
46,4
86,7
65,0
59,2
109,5
108,4
78,4
73,7
63,4
72
s2
X / N
2
N 1
72
296
= 17,22
30
6
s
(34)
equivalente a =0,7794s e,
(35)
X 0,5772
Com base nos dados da tabela 11 e nas equaes (34) e (35) tm-se:
6
17,22 13,43
3,14
n
N1
(36)
ou
e
N 1
ln
(37)
ln ln
N 1
(38)
n
X
ln ln
N 1
(39)
ou, ainda,
1
n
a e
b , ela toma a
Y,
Assim, se na equao (39) tomarmos ln ln
N 1
forma Y = a + bX, que a equao da reta. Desse modo os parmetros a e b podem ser
estimados por:
31
a Y bX
(40)
X Y
XY N
b
X
X N
2
(41)
32
n
Na tabela 12, fazendo-se Y ln ln
, tem-se:
N 1
1
1
14,5012
b
0,06896
Xe
i
(42)
33
log
Xi
(43)
O valor inicial de para iniciar a iterao dado pela equao (34). Com os dados
da tabela 11 tem-se:
X 71,12
s 17,22
Momentos
Regresso
Mxima Verossimilhana
13,4300
14,5012
13,7932
63,3700
63,0686
63,1869
As estimativas dos parmetros at aqui foram feitas com os dados brutos, mas o
mtodo da regresso tambm pode ser aplicado a dados agrupados, trabalhando-se com
as freqncias acumuladas e com o ponto mdio de cada classe.
Com as estimativas pelo mtodo da mxima verossimilhana, a funo cumulativa de
probabilidade ento:
F X exp exp X 63,1869 / 13,7932
34
Tabela 14. Chuva mxima anual de 24 horas de Piracicaba, SP, ajustada distribuio
de valores extremos.
Classes
FX
fe
39,1 - 48,1
48,1 57,1
57,1 66,1
66,1 75,1
75,1 84,1
84,1 93,1
93,1 102,1
102,1 111,1
111,1 120,1
43,6
52,6
61,6
70,6
79,6
88,6
97,6
106,6
115,6
3
12
19
13
12
4
3
4
2
0,0505
0,2112
0,4450
0,6560
0,8029
0,8920
0,9422
0,9695
0,9840
4
12
17
15
11
6
4
2
1
Totais
72
72
35
(44)
1 e X
(45)
1
X
(46)
X
X
(47)
36
Classes
PM (X)
fX
fX2
F(X)
fe
1 10
10 20
20 30
30 - 40
40 50
50 - 60
60 -70
70 80
80 90
90 -100
100 110
110 -120
5,5
15
25
35
45
55
65
75
85
95
105
115
450
184
80
43
23
9
7
5
2
2
0
1
2475
2760
2000
1505
1035
495
455
375
170
190
0
115
13612,5
41400,0
50000,0
52675,0
46575,0
27225,0
29575,0
28125,0
14450,0
18050,0
0,0
13225,0
0,5016
0,7516
0,8762
0,9383
0,9692
0,9847
0,9924
0,9962
0,9981
0,9990
0,9995
0,9998
404
201
100
50
25
12
6
3
2
1
0
0
Totais
806
11575
334912,5
806
fX 11575 14,361
f 806
fX
fX / f
2
f 1
805
s = 14,48
1
1
0,0696
X 14,361
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
x
x
x
x
x
x
x
10)
20)
30)
40)
50)
60)
70)
=0,5016
=0,7516
=0,8762
=0,9383
=0,9692
=0,9847
=0,9924
fe
fe
fe
fe
fe
fe
fe
= 404
= 201
= 100
= 50
= 25
= 12
=6
37
F(X8) =
F(X9) =
F(X10) =
F(X11) =
F(X12) =
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
x
x
x
x
x
80)
90)
100)
110)
120)
=0,9962
=0,9981
=0,9990
=0,9995
=0,9998
fe
fe
fe
fe
fe
=3
=2
=1
=0
=0
Distribuies Discretas
(48)
38
A distribuio binomial com parmetros n e q, por exemplo, tem a seguinte funo
de probabilidade:
n X
q 1 q n X
p X
X
(49)
P X p X
0
(50)
com X = 0, 1, 2, 3, ... n e X n.
Diferentemente da distribuio contnua, a probabilidade de que uma varivel
discreta assuma um valor particular qualquer diferente de zero.
4.1
Distribuio Binomial
(51)
39
onde q a probabilidade de um evento ocorrer, 1 q a probabilidade do evento no
ocorrer, X a freqncia de ocorrncia e X pode tomar os valores 0, 1, 2, ..., n. Portanto,
esta funo fornece a probabilidade de ocorrerem X sucessos em n provas.
A funo de distribuio de probabilidade dada por:
P(X)
onde t = 0, 1, 2, ..., n.
n t
q 1 q n t
t
t0
(52)
p X
6
p 0 0,30 0 0,70 6 0,118
0
6
p 4 0,30 4 0,70 2 0,060
4
6
p 1 0,30 1 0,70 5 0,303
1
6
p 5 0,30 5 0,70 1 0,010
5
6
p 2 0,30 2 0,70 4 0,324
2
6
p 6 0,30 6 0,70 0 0,001
6
6
p 3 0,30 3 0,70 3 0,185
3
40
Distribuio de Poisson
Muitas vezes, no uso da distribuio binomial acontece que n muito grande
onde
e X X X
X!
(53)
X nq,
e X = 0, 1, 2, 3, ...
41
X
P X X t
t0
e X
t!
(53)
onde t = 0, 1, 2, ..., n.
O nico parmetro dessa distribuio a mdia que numericamente igual a
varincia. Sendo estimada por: X n q .
Exemplo
A distribuio de Poisson geralmente citada como a distribuio de eventos
raros. Os dados que sero utilizados nesse exemplo referem-se ao nmero de meses no
ano em que o nmero de dias chuvosos maior do que 10. Os dados foram observados em
Pelotas, RS, no perodo de 1895 a 1989.
Tabela 16. Nmero de meses no ano com mais de 10 dias chuvosos em Pelotas, RS, no
perodo de 1895 a 1989.
Anos
1890
1900
1910
1920
1930
1940
1950
1960
1970
1980
1
1
3
0
5
2
1
2
4
0
2
1
1
5
0
3
1
3
4
2
3
4
1
0
1
5
4
2
1
1
1
1
1
2
2
4
2
7
0
1
3
2
0
3
5
0
4
2
1
1
1
0
2
1
2
0
2
1
3
3
1
2
3
3
3
1
4
0
0
2
0
2
2
5
3
5
0
3
1
2
2
0
2
2
2
2
4
2
2
2
1
5
0
2
1
f 15 24 27 13 8 7 0 1 95
fx 15 0 24 1 27 2 13 3 8 4 7 5 0 6 1 7 191
X
fX 191 2,0105
f 95
fx
15 02 24 12 27 22 13 32 8 42 7 52 0 62 1 7 2 601
42
f 1
94
Tabela 17. Distribuio de freqncias do nmero de meses no ano com mais de 10 dias
chuvosos em Pelotas, RS, no perodo de 1895 a 1989.
Classes X
fX
fX2
p(X)
fe
0
1
2
3
4
5
6
7
15
24
27
13
8
7
0
1
0
24
54
39
32
35
0
7
0
24
108
117
128
175
0
49
0,1339
0,2692
0,2707
0,1814
0,0912
0,0367
0,0123
0,0035
12,7
25,6
25,7
17,2
8,7
3,5
1,2
0,4
Totais
95
191
601
0,9989
95
Para efeitos prticos pode-se considerar a mdia igual a varincia. Assim, o clculo
das probabilidades se segue com base na equao (53), ou seja:
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
= 0)
= 1)
= 2)
= 3)
= 4)
= 5)
= 6)
= 7)
(2,01050 e-2,0105)/1
(2,01051 e-2,0105)/1
(2,01052 e-2,0105)/2
(2,01053 e-2,0105)/6
(2,01054 e-2,0105)/24
(2,01055 e-2,0105)/120
(2,01056 e-2,0105)/720
(2,01057 e-2,0105)/5040
=
=
=
=
=
=
=
=
0,1339
0,2692
0,2707
0,1814
0,0912
0,0367
0,0123
0,0035
X
X
X
X
X
X
X
X
=0
=1
=2
=3
=4
=5
=6
=7
fe
fe
fe
fe
fe
fe
fe
fe
= 0,1339 x 95
= 0,2692 x 95
= 0,2707 x 95
= 0,1814 x 95
= 0,0912 x 95
= 0,0367 x 95
= 0,0123 x 95
= 0,0035 x 95
=
=
=
=
=
=
=
=
12,7
25,6
25,7
17,2
8,7
3,5
1,2
0,4
43
Figura 10. Histograma de freqncias do nmero de meses do ano com mais de 10 dias
chuvosos em Pelotas, RS, no perodo de 1895 a 1989 (Assis et al., 1996, pg. 81).
4.3
Distribuio Geomtrica
(54)
X 1
com 0 1 , sendo:
1
1
X
2
A varincia da distribuio geomtrica obtida pelas expresso: s
(55)
1
.
2
44
Exemplo 1
Aplicando a frmula (54), constatamos, por exemplo, que, em jogadas repetidas de
um dado equilibrado, a probabilidade de o primeiro 6 ocorrer na quinta jogada :
5
6
5 1
1
625
0,080
6 7776
Exemplo 2
Os dados da tabela 18 mostram as seqncias de dias com chuva iniciadas nos 31
dias seguintes ao dia 21 de dezembro de 1997 a 1989, em Piracicaba, SP, a qual permite
calcular:
f 146 84 76 34 28 15 10 6 6 6 1 0 2 2 0 1 0 1 418
fX 146 1 84 2 76 3 34 4 28 5 15 6 10 7 6 8 6 9 6 10
1 11 0 12 2 13 2 14 0 15 1 16 0 17 1 18 1.239
fX
X
6341
fX 1239 63,41
f 418
fX
fX / f
2
f 1
417
1
0,6626
2,9641
1 1 0,6626 0,3374
45
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
= 1)=
= 2)=
= 3)=
= 4)=
= 5)=
= 6)=
= 7)=
= 8)=
= 9)=
= 10)=
= 11)=
= 12)=
= 13)=
= 14)=
= 15)=
= 16)=
= 17)=
= 18)=
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
x 0,66260 =
x 0,66261 =
x 0,66262 =
x 0,66263 =
x 0,66264 =
x 0,66265 =
x 0,66266 =
x 0,66267 =
x 0,66268 =
x 0,66269 =
x 0,662610 =
x 0,662611 =
x 0,662612 =
x 0,662613 =
x 0,662614 =
x 0,662615 =
x 0,662616 =
x 0,662617 =
0,33737
0,22355
0,14816
0,09816
0,06504
0,04309
0,02856
0,01892
0,01254
0,00831
0,00550
0,00365
0,00242
0,00160
0,00106
0,00070
0,00047
0,00031
=141
=93
=62
=41
=27
=18
=12
=8
=5
=3
=2
=2
=1
=1
=0
=0
=0
=0
Tabela 18. Seqncia de dias chuvosos iniciados nos 31 dias seguintes a 21 de dezembro
em Piracicaba, SP. Ajuste distribuio geomtrica.
Classes X
fX
fX2
p(X)
fe
1
2
3
4
5
6
7
8
9
10
11
12
13
14
146
84
76
34
28
15
10
6
6
6
1
0
2
2
146
168
228
136
140
90
70
48
54
60
11
0
26
28
146
336
684
544
700
540
490
384
486
600
121
0
338
392
0,33737
0,22355
0,14816
0,09816
0,06504
0,04309
0,02856
0,01892
0,01254
0,00831
0,00550
0,00365
0,00242
0,00160
141
93
62
41
27
18
12
8
5
3
2
2
1
1
46
15
16
17
18
0
1
0
1
0
16
0
18
0
256
0
324
0,00106
0,00070
0,00047
0,00031
0
0
0
0
Totais
418
1.239
6.341
1,0000
418
Figura 11. Histograma de freqncias das seqncias de dias chuvosos iniciados nos 31
dias seguintes a 21 de dezembro em Piracicaba, SP (Assis et al., 1996, pg. 94).
A tabela a seguir resume algumas das propriedades das distribuies tericas
contnuas e discretas descritas no texto.
Tabela 19. Principais distribuies contnuas e discretas utilizadas em climatologia.
Nome
Funo Densidade
E(X)
Var(X)
2 s2
Distribuies Contnuas
f X
Distribuio Normal
1
2
X 2
22
1
f X
X 1 e
Distribuio Gamma
1
f X e
f X e X
6
1
Distribuies Discretas
Distribuio Binomial
n X
q 1 q n X
p X
X
nq
0,5772
1
2
n q 1 q
47
Distribuio de Poisson
Distribuio Geomtrica
p X
e X X X
X!
X nq
p X 1 X 1
nq
nq
1
2
5 Referncias
ASSIS, F. N., et al, 1996. Aplicaes de Estatstica Climatologia . Ed. Universitria,
UFPEL, Pelotas, RS.
FREUND, J. E., and SIMONS, G., 1995: Statistics :a first course. Prentice-Hall.
MORETTIN, L. G., 1999: Estatstica Bsica - Probabilidade . 7. Ed., Makron Books, So
Paulo, SP.
STEVENSON, W. J., 1981: Estatstica Aplicada Administrao . Ed. Harper & Row do
Brasil, So Paulo, SP.
THOM, H. C. S., 1966: Some Methods of Climatological Analysis Technical Note n 81,
WMO n 199 TP 103.
TRIOLA, M. F., 1998. Introduo Estatstica. 7 Ed., LTC, Rio de Janeiro, RJ.
WILKS, D. S., 1995: Statistical Methods in the Atmospheric Sciences An Introduction.
Academic Press, New York.