Escolar Documentos
Profissional Documentos
Cultura Documentos
NOTA DE AULA 10
DISTRIBUIÇÃO DE FREQUÊNCIA EM HIDROLOGIA
Distribuição Normal
0,45
Probabilidade
0,4
0,35
0,3
0,25
0,2 Dist Normal
0,15
0,1
0,05
0
-0,05 -5 0 5
Variável Reduzida Z
1 1 x 2
f ( x) exp para todo x
2 2
1
x
z
1
f ( z) e 0,5 z
2
2
2, 25 2, 25
1
p(0,5 z 2,25) f ( z )dz e 0,5 z dz
2
0,5 0,5 2
Devido ao fato de que integrais desse tipo são frequentemente requeridas, foram
elaboradas tabelas dando a probabilidade de z entre e qualquer outro valor de z
entre 3,40 até +3,40 com incrementos de 0,01.
A Tabela 2 apresenta esses valores sob a curva padrão normal. Probabilidades para
casos no qual o limite inferior seja diferente de podem ser determinados usando
a seguinte identidade:
p( z L z z 0 ) p( z z 0 ) p( z z L )
2
Tabela 2: Áreas sob a Curva Padrão Normal
3
4
TESTE DE HIPÓTESE EM DISTRIBUIÇÃO DE FREQUÊNCIA
Um dos usos mais comuns dos testes de hipótese é verificar se uma distribuição de
frequência (por exemplo, a distribuição Normal) se ajusta bem aos dados amostrais
passando ela a ser considerada a distribuição de frequência base da população.
Para se fazer uma análise estatística de uma hipótese, devem ser seguidos os
seguintes passo:
1) Formule uma hipótese (por exemplo: “Os dados amostrais da série histórica de
precipitações observadas em Fortaleza se ajustam a uma Distribuição de
Frequência Normal”. Será isso verdadeiro?);
2) Selecione o teorema estatístico apropriado que identifica o teste estatístico;
3) Especifique o nível de significância, o qual é uma medida do risco;
4) Colete ou selecione dados amostrais e calcule uma estimativa do teste
estatístico;
5) Defina a região de rejeição;
6) Selecione a apropriada hipótese.
Vamos ver com maiores detalhes cada um dos passos aqui citados e um exemplo.
5
A primeira hipótese é denominada hipótese nula (H0) sendo sempre formulada para
indicar que não existe diferença.
Para esclarecer melhor: Suponha que se tenha uma amostra de n valores máximos
de precipitação anual observada durante n anos em Fortaleza e fosse desejado
investigar se as precipitações máximas anuais em Fortaleza seguem uma
distribuição Normal com média = 110mm e desvio-padrão = 40mm, você
poderia formular as hipóteses dessa forma:
Como você pode ver, emprega-se o til (~) para indicar que a variável aleatória
pertence a uma distribuição de frequência específica e () para indicar que a mesma
não pertence a tal distribuição.
6
Há vários modelos teóricos disponíveis para quase todos teste de hipótese
frequentemente empregados. Por exemplo, existem as funções de distribuição para
teste de hipótese do tipo:
Distribuição F;
Distribuição t;
Distribuição 2 (Lê-se qui-quadrado), sendo a mais empregada em hidrologia.
Veremos a seguir o uso desta distribuição em exemplos.
Decisão Situação
H0 é verdadeira H0 é falsa
Aceita H0 Decisão correta Decisão incorreta = erro
tipo II ()
Rejeita H0 Decisão incorreta = erro Decisão correta (potência
tipo I () do teste)
Estes dois tipos de erros não são independentes, porém, de qualquer forma, o
processo de decisão é mais frequentemente discutido com referência a somente um
tipo de decisão.
A seleção do nível de significância deve ser baseado numa análise racional dos
efeitos de sua decisão e deve ser selecionado anteriormente ao processo de coleta e
análise da amostra de dados.
7
diferenciado do nível de significância para a cheia de projeto de uma galeria de
drenagem urbana, por exemplo.
potência do teste = 1 –
O valor crítico do teste estatístico é definido como aquele que separa a região de
rejeição da região de aceitação. O valor crítico do teste estatístico depende de:
8
Tal como foi anteriormente afirmado, a região de rejeição pode consistir de valores
associados com um ou ambas as caudas da distribuição de frequência do teste
estatístico.
Isto seria melhormente entendido com um exemplo:
Forma matemática: H0 : = 0
Hipótese Alternativa H A :
Forma matemática: HA : 0
O problema é ilustrado conforme a figura abaixo, onde a distribuição de frequência
seria relativa aos dados amostrais de um certo teste estatístico S. Os valores críticos
do teste estatístico são –S/2 e S/2 relativos a ambas as caudas da distribuição
amostral.
9
Por exemplo: Suponha que as leis ambientais proíbam o lançamento de esgoto
proveniente de indústrias em um determinado rio, de tal forma que o teor de
oxigênio dissolvido mínimo seja de 3,5 mgO2/L de água do rio. As regras adotadas
pela agência reguladora ambiental (SEMACE, por exemplo) indicam que o teor de
oxigênio dissolvido será determinado a partir da média de 10 amostras de qualidade
de água. Nesse caso, a SEMACE estaria interessada somente em saber se o padrão
estabelecido está sendo minimamente alcançado, não interessando valores
superiores ao padrão mínimo.
A fiscalização seria feita coletando-se amostras da água a montante e logo a jusante
do ponto de despejo da indústria que lançasse seu esgoto dentro do rio. Se a média
das amostras coletadas de jusante não assegurasse o padrão sanitário mínimo,
estando a qualidade da água pior do que a das amostras coletadas a montante do
lançamento, a indústria poderia ser multada e até mesmo fechada.
Para a SEMACE, quanto maior fosse o teor de oxigênio dissolvido, melhor seria a
qualidade ambiental das águas do rio, por isso ela estaria tão somente interessada
em saber se o padrão mínimo foi alcançado. Daí seria o caso do emprego do teste
estatístico onde somente um lado da cauda interessaria. Resumidamente seria:
HA : < 0
Neste caso, a região de rejeição seria associada com valores em somente um lado
da distribuição amostral.
10