Escolar Documentos
Profissional Documentos
Cultura Documentos
Disciplina: Hidrometeorologia
Considerações Gerais:
• Apresentação
• Clima e o aquecimento global?
• Previsão climática. O que importa? Cálculo ou conclusão? FDP é um modelo
de previsão climática !!!!! Ciência sobrevive de evidências !!!
• Internet é confiável? Sites oficiais e o resto !!!
• O que vamos fazer neste curso?
• Quase tudo que vocês já sabem, mas esqueceram!
• Climatologia é estudar o clima do passado para tentar entender o clima do
“futuro” !!!!!
• Muitas vezes usa-se a estatística como um bêbado usa um poste de luz: Mais
para suporte do que para iluminação.
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Avaliação:
Análise estatística é um processo sistemático que inicia com os dados brutos. Esses
dados podem ser do tipo numérico ou categórico. O produto final pode ser informação
útil ou conclusões numéricas.
[15 17) 7
17,9 23,0 16,1 18,1 18,0
[17 19) 19
17,9 19,4 16,2 19,8 20,5 [19 21) 11
20,0 23,4 16,8 26,3 18,5 [21 23) 5
18,0 22,6 16,7 18,4 19,2 [23 25) 6
17,9 20,2 16,2 21,0 18,5 [25 27) 1
[27 29] 1
18,9 22,1 17,2 20,1 20,9
17,6 25,0 15,7 18,2 23,5
18,5 22,0 15,7 17,5 19,2 Com base em uma amostra de
18,8 24,0 24,7 18,6 25,0 observações pode-se tirar conclusões
17,7 20,2 28,0 17,1 21,1 acerca da população.
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Considerações Gerais: Análises Estatísticas
Estatística
População descritiva
Amostra
Inferência estatística:parte da estatística que usa uma amostra para fazer generalizações
a respeito de aspectos importantes de uma população.
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Considerações Gerais: Definições básicas
d detx
E[ xe ] (t 0) E[ x] 1
tx tx
(t ) E[ e ] E
' '
dt dt
Do mesmo pode-se concluir que: '' (0) E[ x 2 ] 2'' , ''' (0) E[ x3 ] 3'''
1 n
mr fi .( xi x ) r
se r =1, m1= 0 soma dos desvios
se r = 2, m2 = S2
n i 1
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Medidas de tendência central
Determina valores típicos ou representativos de um conjunto de dados
Moda (M): É o valor que ocorre com maior freqüência. Quando dois valores ocorrem
com mesmas freqüências, cada um deles é chamado de moda, e o conjunto é BIMODAL
Se mais de dois valores ocorrem com mesmas freqüências, cada um deles é uma moda e o
conjunto é MULTIMODAL. Quando nenhum valor é repetido o conjunto não tem moda.
Ponto médio: Valor que está a meio caminho entre o maior e o menor valor
valor maior valor menor
Ponto médio
2
Seja o seguinte conjunto de valores:
5 7 8 10 12 15 20
5 7 8 10 12 15 200
média = 11, mediana = 10 e ponto médio = 12,5
Se alterarmos significativamente o último valor:
média = 36,7, mediana = 10 e ponto médio = 102,5
Universidade Federal de Campina Grande - UFCG
Disciplina: Métodos Estatísticos em Climatologia
Medidas de tendência central
Conclusão!
• Percentis
• Decis dados ordenados
• Quartis
Dado o conjunto de valores, calcule o 25º percentil (os valores devem estar ordenados)
72, 74, 75, 77, 78, 79, 82, 85, 86, 90, 93, 94
Calcule: L= (k/100).n
• L: posição do percentil desejado no conjunto de dados ordenado
• k: percentil desejado = 25 %
• n: número de valores = 12
L=(25/100).12=3
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Exemplo
L é um número inteiro?
SIM - o k-ézimo percentil está a meio NÃO - Modificar L, arredondando seu valor
caminho do L-ézimo valor e o próximo para o inteiro maior mais próximo. Ex.: se
valor do conjunto de dados. n=11 => L=2,75. Logo a posição do k-ézimo
Assim, L=3 para n=12 percentil será 3.
Assim, L=3 para n=11, exemplo retira 77
P25 = (L3+ L4)/2 = (75+77)/2 = 76
P25 = (L3+ L4)/2 = (75+78)/2 = 76,5
Seja o seguinte conjunto de n=8 valores ordenados: 5, 7, 8, 10, 12, 15, 20, 25, calcule o
25º e 75º percentis
Obs. Uma série com valores decimais, as posições dos percentis seriam mais visíveis
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Decis e Quartis
Dividem o conjunto de dados em 10 partes iguais de 10%. Portanto, há nove decis numa
nesse conjunto dividido em 10 grupos de 10% de dados.
Os decis são os percentis: P10, P20, P30, P40, P50, P60, P70, P80, P90
Assim, o primeiro decil corresponde a 10% dos dados D1= P10 ...................,D9= P90
Baseado nos conceitos de Percentis, Decis e Quartis, pode-se definir outras descrições
estatísticas:
Intervalo interquartil Q3 – Q4
Intervalo semi-interquartil (Q3 – Q1)/2
Quartil médio (Q3+ Q1)/2
Amplitude de percentis P90-P10
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Estatística descritiva
As três principais características de um conjunto de dados são:
• Um valor representativo do conjunto de dados: média (Medidas de Tendência Central)
• Uma medida de dispersão ou variação: desvio-padrão
• A natureza ou forma da distribuição dos dados: Normal, Log-normal, uniforme.
(Tabelas de freqüências e histogramas)
Medidas de Variação: Determina a característica de variação de um conjunto de dados
• Amplitude = Diferença entre o maior e o menor valor do rol de dados
• Coeficiente de variação CV ( S / X ).100 (%) n
xi x
• Desvio médio ou desvio absoluto i 1
D
1 n 2 n
• Variância 2
S xi x
n 1 i 1
• Desvio-padrão S S2
• Desvio D xi x
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Fórmula alternativa para o cálculo do desvio-padrão
n 2 n 2
n.( x ( x )
S i 1 i 1
n( n 1)
Vantagens e desvantagens:
• Mais conveniente para uso com números extensos e com grande amostra de valores
• Maior facilidade de uso com calculadoras e computadores (apenas três registros: n, Σx e
Σx2)
• Elimina erros de arredondamento
• Não evidencia o conceito de desvio-médio da fórmula tradicional
Teorema de Tchebichev
A proporção de qualquer conjunto de dados a menos de k desvios-padrão, a contar da
média é sempre ao menos 1-1/k2, onde k é um número positivo maior do que 1.
Exemplo: Para k=2 e k=3 tem-se:
• Ao menos 3/4 ou 75% de todos os valores estão no intervalo de [ X 2.S ; X 2.S ]
•Ao menos 8/9 ou 89% de todos os valores estão no intervalo de [ X 3.S ; X 3.S ]
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Uso do Teorema de Tchebichev
Exemplo: Barbeadores elétricos sem fio da marca Z têm vida útil média de 8,0 anos, com
desvio padrão de 3,0 anos. Faça uma estimativa da vida mais breve e da mais longa.
Indica a dispersão dos dados: quanto mais dispersos maior o desvio padrão
• Regra prática desvio-padrão ≅ amplitude/4 (só usar em casos muito extremos)
• valor mínimo ≅ [ X 2S ]
• valor máximo ≅ [ X 2S ]
Teorema de Tchebichev
A proporção de qualquer conjunto de dados a menos de k desvios-padrão a contar da
média é sempre ao menos 1-1/k2, onde k é um número positivo maior do que 1. Para k=2
e k=3, temos:
• Ao menos 3/4 ou 75% de todos os valores estão no intervalo [ X 2S ; X 2S ] de ±2
desvios-padrão em torno da média;
• Ao menos 8/9 ou 89% de todos os valores estão no intervalo [ X 3S ; X 3S ] de ±3
desvios-padrão em torno da média,
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Exercício
Barbeadores elétricos sem fio da marca Z têm vida média de 8,0 anos, com desvio-padrão
de 3,0 anos. Faça uma estimativa:
CV S amostral CV S populacional
X X
É útil para comparar a variabilidade (dispersão) de dois conjuntos de dados com ordens
de grandezas diferentes.
Seja o seguinte conjunto de preços de geladeiras em 7 lojas distintas
• Uma vez que uma geladeira custa bem mais que um liquidificador, a tendência é que o
desvio-padrão da geladeira seja também maior!
• O coeficiente de variação é uma medida adimensional que normaliza o desvio padrão
em relação à média;
• Uma medida de dispersão alternativa que pode ser empregada é o intervalo interquartil
ou amplitude interquartílica. É dado pela diferença entre o terceiro e o primeiro quartis;
Escore padronizado - Número de desvios-padrão pelo qual um valor dista da média (para
mais ou para menos)
x X
Zi i
S é uma relação linear entre Zi e Xi
Pode ser utilizado para comparar valores de variáveis com unidades diversas (mm, m3/s)
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Exercício
As alturas da população de homens adultos dos EUA têm média μ=1,752 m, desvio-
padrão σ=0,071 m e distribuição Normal). O jogador de basquete Michael Jordan, que
mede 1,98m, pode ser considerado excepcionalmente alto? Determine o escore padrão
para ele.
x 1,981,572
Zi i 3,211
0,071
Este resultado indica que a altura de Michael Jordan está a 3,21 desvios-padrão acima da
média da população. Considerando que valores acima ou abaixo de 2 desvios da média
são incomuns, conclui-se que Michael Jordan é de fato excepcionalmente alto comparado
com a população geral.
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição de Freqüência
Os dados agrupados podem ser resumidos em tabelas ou gráficos e, a partir desses, pode-
se obter estatísticas descritivas já definidas: média, mediana, desvio, etc.
Dados organizados em grupos ou categorias/classes são usualmente designados como
“distribuição de freqüência”
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Construindo uma distribuição de freqüência
Em que
Liminf: limite inferior da classe modal
fMo: freqüência da classe modal
fant: freqüência da classe anterior à modal
fpost: freqüência da classe posterior à modal
h: amplitude da classe modal
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Moda e mediana para dados agrupados
Em que
n 2 n 2
n.[ ( fi xi )][ ( fi xi )]
S i 1 i 1
n(n 1)
Escalas de assimetria:
| As | < 0,15 => assimetria pequena
0,15 < | As | < 1 => assimetria moderada
| As | > 1 => assimetria elevada
Simétrico
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Interpretando histogramas
Bimodal
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Interpretando histogramas
Achatado ou platô
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Coeficiente de Curtose
Denomina-se curtose o grau de achatamento de uma distribuição em relação a uma
distribuição padrão (curva normal). A curva normal, que é a nossa base referencial,
recebe o nome de mesocúrtica.
C1 = (Q3 - Q1) / 2(P90 - P10) Este coeficiente é conhecido como
percentílico de curtose. Em relação a
n 4 curva normal (simétrica), temos:
fi. ( xi x )
C 2 i 1
/ S4
n
C1 = 0,263 => curva mesocúrtica
C1 < 0,263 => curva leptocúrtica
C1 > 0,263 => curva platicúrtica
Em que S é desvio padrão
C2 = 3 => curva mesocúrtica Obs: fórmula está dentro da planilha Excel
C2 > 3 => curva leptocúrtica
C2 < 3 => curva platicúrtica
C2 = 3 = C2 > 3 C2 < 3
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Probabilidade
Observação: Problema clássico de probabilidade, uma vez que todas as cartas tem a
mesma chance de ocorrer (equiprováveis)
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Probabilidade
Exemplo:
Diagrama de Veen
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Probabilidade
Lei dos grandes números - Quando maior for a repetição do experimento, maior a
aproximação da probabilidade efetiva de acontecimento de um determinado evento
através da freqüência relativa.
Uma pessoa pode ir de um ponto A até o ponto B por dois caminhos: do ponto B ela pode
ir ao ponto C por 3 caminhos. Quantas alternativas tem essa pessoa de sair do ponto A ir
ao B e então seguir para o ponto C?
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Variáveis Aleatórias
Quando se conhece todos os possíveis valores de uma variável aleatória com suas
respectivas probabilidades de ocorrência, tem-se uma DISTRIBUIÇÃO DE
PROBABILIDADE. Assim, uma distribuição de probabilidade fornece a probabilidade
de ocorrência de cada um dos valores que uma variável aleatória pode assumir.
3ª - A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável aleatória X assumir qualquer valor real;
=1
=5
= 10
X
= 50
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Considerações Gerais: Efeito da variação dos parâmetros (desvios-padrão idêntico e
variação das médias)
X
= 15 =25 = 40
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Considerações Gerais: Efeito da variação dos parâmetros (Variação das médias e dos
desvios-padrão)
=1
= 3
= 10
= 15 =25 = 40
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Considerações Gerais: Áreas sob a curva Normal
16% 16%
68.26%
X
1 1
2.25% 2.25%
95.45%
X
2 2
z = 1
x z
z =0
(x )
Z i
i , var iável reduzida
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Considerações Gerais: Exemplo P(3.8 x 5)
=10 x 3,8 5
z ,12
10
3.8 = 5 X
0,0478
0 Z
-0,12
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Curvas da Normal: f.d.p e acumulada
0,4
0,35
1,2
0,3
1
0,25
0,2 0,8
0,15 0,6
0,1 0,4
0,05
0,2
0
-4 -3 -2 -1 0 1 2 3 4 0
-0,05 -4 -3 -2 -1 0 1 2 3 4
Prob. density Mean value Selected probability Distr. function Computation of quantiles Computati
2
x x y y
1 x x y y
2
1
f ( x, y , ) exp 2
2 x y (1 2 ) 2 (1 ) x y x y
2
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição de probabilidade Normal bivariada
x y 0 e zx z y
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição de probabilidade Normal bivariada
Admita que a variável X tenha distribuição log-normal, ou seja que Y=ln (X) tenha
distribuição normal com média e variância 2.
1 (ln x )2
f ( x) exp , com
x 2 2 2
1
média exp( 2 )
2
2 2 2
2
var iância e .e .[e 1]
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Log-normal
ln( xi ) y
Zi
y
Parâmetros:
E[ X ] 1
2
V[X ] 1
Obs. Para dados agrupados a variável x das funções é o limite superior de cada classe
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Exponencial
Sejam os limites de chuva [25 a 48] mm e a média igual a 72,5 mm. Estime a
probabilidade de ocorrer chuva igual ou inferior a 48 mm, com limite inferior igual a 25
mm, então:
λ=1/E[x]=1/72,5=0,0138
x (2)
F ( x) exp exp
6 ˆ
Estimativa dos parâmetros ˆ S. e x .ˆ em que γ=0,57721 é a constante de
Euler. Para aplicação à dados agrupados utiliza-se a variável reduzida: y ( xi ) (3)
Substituindo (3) em (2) tem-se:
F ( y) exp[ exp( y)] P[Y y] probabilidade de nãoexcedência
Universidade Federal de Campina Grande - UFCG
Disciplina: Métodos Estatísticos em Climatologia
Distribuição de Weibull – É aplicada a valores de extremos mínimos e tem assimetria
positiva. A constatação de que, em um cenário extremo, as vazões que escoam por uma
seção fluvial são limitadas inferiormente pelo valor zero, faz com que a distribuição de
Weibull seja uma candidata natural a modelação de eventos hidrológicos mínimos.
x 1
x
f ( x) .exp
Para x ≥ μ; α, β > 0
μ – parâmetro de locação;
α - parâmetro de forma;
β - parâmetro de escala.
Quando μ=0 e β=1 obtém-se a distribuição de padrão de Weibull. Quando μ=0 e β≠1 a
distribuição é dita bi-paramétrica e é dada por:
x 1
x (*)
f ( x) . .exp
, com x, α e β > 0
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição de Weibull:
Um aspecto conveniente da Weibull é que a f.d.p (*) é analiticamente integrável, sua
função distribuição de probabilidade é:
x
F ( x) P X x 1 exp (1) (probabilidade de não excedência)
Parâmetros
11/
2 2 1 2 / 11/
2
F(x) = i/n+1 freqüência de Kimbal. Substituindo em (1) tem-se:
1 x
1 exp
n 1 (2), linearizando-se tem-se:
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição de Weibull:
Y a X b;
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Beta: Algumas variáveis de interesse são restritas à seguimentos com limites
inferior e superior. Na meteorologia a umidade relativa do ar ocorre limita-se entre 0 e
100% ou 0 e 1. Uma f.d.p para representar esse tipo de variável é a Beta, dada por:
( 1)
x x .1 x
( 1 k )
F ( x) dx , 0 x 1 e , 0 (1)
0 B ,
0
ˆ
Y 1 Y
2
Y (3);
2 ˆ
ˆ 1 Y
(4)
2
SY Y
ˆ e ˆ são parâmetros de forma Y é o parâmetro de locação. As equações (1) e (2) podem
ser integradas numericamente. O valor da constante k pode ser obtido por tentativa e erro.
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Beta: Se a variável X estiver restrita a um intervalo (a, b) ela poderá ser
representada por uma distribuição Beta após passar pela transformação:
Y xi a b a 0,0001 curva empírica
a – limite inferior da amostra
b - limite superior da amostra
A equação (1) é a função distribuição
de probabilidade acumulada ou
seja, é a P[X≤x] ou probabilidade de
não excedência.
Assimetria negativa
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Gama: Se X for uma variável aleatória contínua, tal que ( 0 < x < ), com
distribuição gama de parâmetros , e X 0 , então a sua função densidade de
probabilidade é definida como:
f (X ) 1
X 1e X / (1), em que ( ) é a função gama de gama (γ)
( )
( X ) X 1e X dx ,
x para todo X>0; ( X ) pode ser obtido por:
0
N N
Em que A LnX X g ; X 1 fi .xi e X g 1 Ln( xi ). fi que é a média geométrica.
N i1 N i1
1 x 1 X /
F(X ) X
( ) 0
e dx (10)
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Gamma:
F (t ) t 1
1 t t2 t3 ..........
.( ).e
t 1
1 2
1 2
3
(11)
p( x)
e . e a função acumulada P ( x)
p ( x)
x 0
x!
Parâmetros:
E(x)=λ=média
V(x)= λ=S2=variância
OBS. Pode-se utilizar a Distribuição de Poisson como uma aproximação da Distribuição Binomial
quando “n” for grande e “p”, muito pequeno (n ≥100 e n.p ≤10). Ao utilizar Poisson como
aproximação da Binomial, pode-se estimar o valor de λ por λ= n.p
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Binomial: Uma variável Bernoulli é aquela que pode assumir apenas dois
valores excludentes: “p” probabilidade de sucesso e “q=1-p” insucesso. Exemplos, sejam
os eventos dicotômicos:
• respostas a um questionário (sim ou não);
• dia com chuva ou dia sem chuva;
• arremesso de uma moeda etc.
O modelo Bernoulli tem valor esperado E[X] = np e Var[X] = np (1-p). Uma distribuição
Binomial é considerada como a soma de “n” variáveis independentes Bernoulli e sua
função de probabilidade é:
. p x q n x
n!
P( x)
x!(n x)!
A Binomial é utilizada em climatologia em casos especiais, haja vista que nos eventos
naturais climatológicos há persistência (eventos correlacionados e dependentes)
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Distribuição Binomial:
Quando p > q a distribuição é assimétrica positiva
2 2
2 k Oi npi k Oi Ei
i 1 Oi i 1 Oi
Em que,
Oi – freqüência observada (empírica)
Ei – freqüência esperada (teórica)
pi – probabilidade da f.d.p. postulada
n – tamanho da amostra
k – número de classes ou valores observados Xi
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Qui-quadrado (χ2)
Se χ2 < χ2Tabelado não há razão para 40
rejeitar a hipótese básica de ajuste 35 Oi
ao nível de significância α e υ = r-1- 30 Ei = pi*n
Frqüências
m graus de liberdade. 25
20
r – número de classes 15
m – número de parâmetros 10
5
Em que
'
F ( x ) probabilidade teórica acumulada
F ( x ) probabilidade empírica f a N
Se, ao nível de significância α, o valor calculado Dmáx for maior ou igual ao valor crítico
Dmáx Tabelado , a hipótese de que os dados amostrais provém de uma população com
distribuição teórica F ' ( x) é rejeitada.
Universidade Federal de Campina Grande - UFCG
Disciplina: Hidrometeorologia
Kolmogorov-Smirnov (K.S)
1
0,9
Freqüências acumuladas
0,8
0,7
Se Dmáx < Dmáx Tabelado aceita-
0,6
se o ajuste ao nível de 0,5 F(x) - empírica
significância α. 0,4
F'(x) - teórica
0,3
0,2
0,1
0
1 2 3 4 5 6 7 8 9 10 11
Limites superiores das classes
Erro Tipo I: Rejeitar a Hipótese Nula, H0, quando ela é efetivamente verdadeira. A
probabilidade do erro tipo I é igual ao nível de significância, α
Erro Tipo II: Aceitar a Hipótese Nula, H0, quando é efetivamente falsa. A probabilidade
do erro tipo II é igual a (beta)
Região de rejeição
Região de
Se α=0,05 1- α=0,95 aceitação