Você está na página 1de 5

TESTES DE HIPTESE OU TESTES DE SIGNIFICNCIA TEIS EM CINCIAS ATMOSFRICAS

Introduo
Em primeiro lugar, vamos discutir brevemente para que serve um teste de significncia em cincias atmosfricas.
Exemplos de aplicao so muitos, mas vamos citar algumas situaes mais corriqueiras. Comumente olhamos para campos
de anomalias e gostaramos de fazer uma mdia desses campos que caracterize uma certa situao que estamos
interessados (por exemplo, anomalias da superfcie do mar em anos chuvosos sobre sul do Brasil). Em geral, estaremos
usando um conjunto finito de dados e queremos saber se aquele valor positivo/negativo eventualmente encontrado em uma
certa regio pode ser interpretado fisicamente ou algo que surgiu devido limitada amostragem. O problema fcil de
entender se imaginarmos que naquele ponto em que o valor absoluto da anomalia foi alto o desvio-padro tambm alto. Em
outras palavras, possvel que em um determinado dia/ms/ano/ (dependendo da resoluo temporal dos dados) o valor do
mdulo da anomalia foi to alto que acabou influenciando a mdia da anomalia. Mas isso no significa um padro que esteja
ocorrendo na maior parte dos casos de chuva intensa que estamos interessados. Obviamente, se interpretarmos esse valor
como correto estaremos cometendo um erro grosseiro que pode atrapalhar a nossa anlise.
Outra situao bastante comum diz respeito ao clculo de correlaes. Suponha que estejamos correlacionando as
anomalias temperatura em um certo ponto no espao com as anomalias de temperatura do oceano (TSM) em todo globo.
Como decidir se podemos ou no interpretar uma correlao? Obviamente, algum poderia dizer vamos utilizar apenas as
correlaes lineares de Pearson maiores do que 0.7 porque nos dariam um coeficiente de determinao maior do que 0.5, o
que indica que a aproximao linear a melhor. Isso est correto se o que queremos determinar que a relao linear entre a
varivel x1 e x2 a melhor para a explicao da varincia total dos seus dados. Mas podemos apenas querer saber se existe
uma variao conjunta das variveis analisadas (no exemplo precipitao e TSM) em um determinado sentido, no
necessariamente utilizar um modelo linear para explic-la. Assim, gostaramos de saber se uma determinada correlao
observada pode ser interpretada como diferente de zero. Isso vai depender das caractersticas da nossa amostra, como
veremos depois.
Ainda, comum analisarmos distribuies de freqncias em situaes distintas e gostaramos de saber se podemos
ter confiabilidade que uma certa classe de situaes pode ser considerada diferente da outra. Por exemplo, digamos que
estejamos interessados em saber se em uma certa localidade, durante os diferentes os episdios El Nio/La Nia/Neutro, o
nmero de dias com temperatura acima de um certo percentil ocorre com maior freqncia. O problema de decidir sobre a
existncia de uma modulao dos extremos de temperatura pelas fases do El Nio/Oscilao Sul (ENOS) poderia ser
resolvido calculando-se a freqncia de dias acima do percentil de temperatura em cada uma das fases do ENOS. Contudo, se
temos mais anos de El Nio que La Nia ou Neutro, como ter uma idia se as diferenas eventualmente observadas na
amostra podem ser consideradas como representativas de uma populao de casos de ENOS? Assim, precisamos assumir
algumas hipteses e test-las para termos um pouco mais de confiana em concluir relaes a partir de nossos dados.
Muitos exemplos existem que poderiam ser citados, como o clculo de tendncias, anlises de varincias, medianas,
componentes principais, e uma infinidade de outras estatsticas que costumamos utilizar. sempre bom ter em mente que
quando trabalhamos com dados e amostras, utilizamos mtodos estatsticos para analis-los e isso implica em termos que
aplicar testes de significncia para depois (e s depois) nos aventurarmos em atribuir explicaes fsicas ao que estamos
observando! Bons livros de estatstica possuem a maioria dos testes que precisamos. Consulte-os antes de qualquer passo em
falso! No presente curso iremos falar apenas de alguns poucos. Parte das discusses que se seguem encontram-se na
referncia WI, captulo 5. Exerccios e outras aplicaes podem ser encontrados em livros como os da Coleo Schaum de
estatstica.
1. Testes Paramtricos versus No-Paramtricos

TESTES PARAMTRICOS: so os testes conduzidos em situaes onde sabemos ou assumimos que uma teoria
particular de distribuio apropriada para representar os dados e/ou o teste estatstico. Na realidade, o termo
paramtrico pode ser interpretado como sinnimo para Terico com respeito s distribuies de probabilidade. Por
exemplo, alguns testes estatsticos relacionados a um certo processo fsico de interesse podem se reduzir a um teste de
um parmetro da distribuio, tal como a mdia da distribuio Gaussiana (vamos entender melhor adiante o que isso
significa).

TESTES NO-PARAMTRICOS: So conduzidos sem assumirmos qualquer particular forma terica para aquela dada
situao.

2. Conceito de distribuio Amostral

Esse conceito fundamental para todos os testes estatsticos. Uma distribuio amostral para uma dada estatstica
a distribuio de probabilidade descrevendo conjunto-a-conjunto a distribuio dessa estatstica. Obviamente, isso implica que
uma distribuio tambm sofre variaes amostrais. Esse conceito tambm aplicado ao teste de hiptese que ser realizado,
como esclareceremos a seguir. Em outras palavras, o valor de uma estatstica calculado para um conjunto de dados ser, em
geral, diferente da mesma estatstica calculada para outro conjunto de dados da mesma espcie! Por exemplo, a temperatura
mdia em janeiro pode ser obtida fazendo a mdia diria das temperaturas em um local particular para um dado ano. Esta
estatstica muda ano a ano, porque depende da variabiliadade da sua srie temporal que pode depender de diversos fatores.
As variaes aleatrias de uma estatstica amostral podem ser descritas usando-se as distribuies de probabilidade.
Assim, as estatsticas amostrais podem ser vistas como sendo retiradas das distribuies de probabilidade. Estas distribuies
so chamadas distribuies amostrais e fornecem o modelo de probabilidade descrevendo as freqncias relativas possveis
da estatstica.
3. Os elementos de qualquer teste de hiptese
Abaixo encontram-se os 5 passos que devem ser seguidos para realizar os testes de hiptese:
i.

ii.

iii.
iv.

v.

Identificar o teste estatstico que apropriado para os dados em questo. O teste estatstico a quantidade calculada a
partir dos valores dos dados (como dados entendam as estatsticas avaliadas como mdias, correlaes, freqncias,
tendncias, etc.) que estaro sujeitos ao teste. Em testes paramtricos utilizaremos uma distribuio terica. Por
exemplo, diremos que a mdia amostral obtida em qualquer conjunto de dados, (por exemplo, as temperaturas mdias
obtidas de dados dirios em todos os Janeiros) segue uma certa distribuio cujas caractersticas ns conhecemos de
antemo. Se o teste for no paramtrico, temos uma certa liberdade em definir o teste porque no vamos assumir
nenhuma distribuio conhecida.
Definir a HIPTESE NULA, usualmente denominada de Ho. A hiptese Ho constitui uma referncia lgica especifica
para podermos julgar o teste estatstico observado. Em geral, escolhemos como hiptese nula aquela que gostaramos
de rejeitar e provar o contrrio (por exemplo, no caso da correlao a hiptese nula seria aquela em que a correlao
populacional zero, e nada podemos afirmar sobre a existncia de uma correlao entre as amostras utilizadas para a
anlise que efetuamos) .
Definir a HIPTESE ALTERNATIVA, HA. Muitas vezes a hiptese alternativa ser to simples quanto Ho no
verdade, embora hipteses alternativas mais complexas possam ser feitas.
Obter a DISTRIBUIO NULA, a qual simplesmente a distribuio amostral do teste estatstico dado que a hiptese
nula verdadeira. Dependendo da situao, a distribuio nula pode ser uma distribuio cujos parmetros eu conheo
(por exemplo, uma distribuio normal, com mdia e desvio-padro , uma distribuio t-student, uma distribuio 2,
etc) ou uma distribuio emprica obtida pela re-amostragem dos dados. Por exemplo, tomar uma srie temporal de N
dados e orden-la de forma aleatria 1000 vezes e para cada uma calcular uma tendncia. Esse procedimento me daria
uma distribuio nula de tendncias provinda do prprio conjunto de dados. IDENTIFICAR A DISTRIBUIO NULA
UM PASSO CRUCIAL PARA DEFINIR O TESTE DE HIPTESE.
Comparar a estatstica observada com a distribuio nula. Se o teste estatstico cai numa regio suficientemente
improvvel da distribuio nula, ento Ho rejeitado como improvvel de ser verdade, dado evidncias observacionais.
Se, por outro lado, eu fizer o teste e cair numa regio ordinria da distribuio nula, ento no posso rejeitar Ho.
Notem apenas que no rejeitar Ho no significa que a hiptese nula verdade, apenas que existe INSUFICIENTE
evidncia para rejeitar a hiptese Ho. Quando Ho no rejeitada podemos realmente dizer que No inconsistente
com os dados observados. No se preocupe se voc no est entendendo nada sobre a aceitao de hipteses porque
compreender melhor com exemplos.
4. Nvel de testes e Valores p

A regio suficientemente improvvel da distribuio nula referida como nvel de rejeio ou simplesmente nvel do teste. A
hiptese nula rejeitada se a probabilidade (representada pela distribuio nula) do teste estatstico observado, e TODOS
OUTROS RESULTADOS PELO MENOS DESFAVORVEIS PARA A HIPTESE, for menor que ou igual ao nvel do teste. O
nvel do teste escolhido previamente aos clculos, mas depende de um julgamento do investigador, tal que existe usualmente
um certo grau de arbitrariedade sobre esse valor especfico. Comumente, o nvel de 5% escolhido, embora testes conduzidos
ao nvel de 10% ou de 1% no so to incomuns. O valor p a probabilidade especfica que o valor observado do teste
estatstico, junto com todos outros desfavorveis hiptese nula, ocorrer de acordo com a hiptese nula da distribuio.
Assim, a hiptese nula rejeitada se o valor p for menor ou igual ao nvel do teste. Veja a Fig. 1 para entender o significado de
p, supondo uma distribuio nula Normal.

Fig. 1. Ilustrao de uma distribuio nula e o que ocorre quando consideramos valores de p cada vez menores. (extraidas
do site: http://www.psychstat.smsu.edu/introbook/sbk26m.htm)
5. Tipos de erros e poder de um teste.
Uma outra forma de olhar para o nvel de um teste pensar na probabilidade de que nos temos de rejeitar a hiptese nula
se esta estiver correta. Assim, se assumimos um nvel p=5% estamos, no fundo, admitindo que, admitindo-se que a hiptese
nula falsa, temos 5% de probabilidade de estarmos redondamente enganados. A rejeio de Ho sendo a mesma verdadeira,
chamada de ERRO TIPO-I e sua probabilidade (o nvel do teste) freqentemente chamada de . Erros do tipo I so
definidos em contraste com ERROS DE TIPO-II, que ocorrem se Ho no rejeitada quando , de fato, falsa. A probabilidade
do erro de tipo-II usualmente chamada de (Fig. 2)

Fig. 2. Exemplo do erro tipo II. (extradas do site: http://www.psychstat.smsu.edu/introbook/sbk26m.htm)


Vamos supor a seguinte situao descrita abaixo: Suponha que estejam querendo construir um aeroporto prximo de uma
regio urbana e que voc tenha sido chamado para fazer um estudo sobre impacto de poluentes oriundos dos avies na sade
da populao. Suponha que voc tenha coletado dados do poluente (por exemplo, o O3) de outro aeroporto semelhante (por
exemplo, Congonhas) e tambm coletado dados de entradas de crianas e idosos nos hospitais da regio prxima ao
aeroporto (no caso, Congonhas). Voc precisa decidir se o novo aeroporto deve ou no ser construdo naquele local baseado
no impacto na sade constatado pelas entradas nos hospitais de outras localidades. Para esse experimento, voc calculou a
concentrao mdia diria do poluente e a mdia de entrada nos hospitais das crianas e idosos. A sua deciso vai ser feita
olhando para duas mdias de entrada de pessoas num hospital, uma observada em dias com condies de forte poluio
causada pelo aeroporto e a outra sem condio mensurvel de alerta da poluio. Sua hiptese nula Ho seria a de que as
mdias (com ou sem alerta de poluentes) so iguais. Para a sua deciso, voc pode seguir o seguinte quadro:

DECISO

O Mundo Real
Poluentes No Afetam a sade.
Poluentes afetam a sade.
ERRO
CORRETO

Decide que a poluio afeta

Tipo I

probabilidade = 1-

No faz o aeroporto

probabilidade =

"power"

(rejeita Ho isto , no se pode afirmar


que as mdias sejam iguais)
Decide que a poluio no afeta

CORRETO

ERRO

probabilidade = 1 -

Tipo II

Faz o aeroporto
(Aceito Ho afirma-se que as mdias
sejam iguais)

probabilidade =

Notem que no sabemos a priori se a poluio causada nos aeroportos pode ou no ser responsvel pelo aumento da entrada
de pessoas nos hospitais. Se soubssemos no faria sentido fazermos o teste, certo? Tambm estamos supondo que
conhecemos a forma da distribuio de probabilidades da diferena entre as mdias e que essa segue algo semelhante com a
Fig. 1. Isso , na prtica, estamos assumindo que se tivssemos muitas amostras distintas obtidas em situaes aleatrias e
calculssemos as mdias dessas amostras e as diferenas entre essas mdias, encontraramos algo parecido com a
distribuio de probabilidade indicadas nas Figs. 1 e 2. Por exemplo, digamos que tivssemos 20 anos de dados dirios de
entradas de pacientes em hospitais. Para cada ano, vamos tomar 364 dias e embaralhar aleatoriamente esses dados. Se
pegssemos metade dessa amostra embaralhada (182 dias) e calculssemos a mdia M1 e fizssemos o mesmo para a outra
metade M2 e calculssemos a diferena M1-M2, poderamos determinar grosseiramente como seria a cara dessa distribuio.
Claro que 20 anos e, portanto, 20 dados seria pouco para conhecermos bem a cara da distribuio de probabilidades M1-M2
Entretanto, outros estatsticos j pensaram no problema e calcularam com melhor preciso a cara das distribuies de alguns
tipos de estatsticas que temos interesse, como a diferena entre as mdias.
Esquematicamente, o que se tem na tabela acima pode ser mostrado na Fig. 3 abaixo

Fig. 3. Relao entre o nvel de rejeio, correspondente probabilidade de erro tipo I ( em vermelho), e probabilidade
de erro tipo II, (em amarelo), para um teste conduzido ao nvel de 5% (topo) e 1% (abaixo). O eixo horizontal representa o valor
do teste estatstico (valor para qual a rea sombreada em vermelho corresponde ao nvel do teste). Isso mostra que
decrescendo a probabilidade de um erro tipo I necessariamente aumenta a probabilidade de erro tipo II, e vice-versa. (Figura
extrada do site http://www.psychstat.smsu.edu/introbook/sbk26m.htm). A distribuio a esquerda representa a funo
densidade de probabilidade da distribuio nula (ou da hiptese Ho) enquanto a funo de distribuio de probabilidade
direita representa o teste estatstico se um especfico HA for verdade.

Analisando os possveis erros e acertos cometidos no experimento da Tabela-1:


1) Decidir que a poluio do aeroporto no afeta a sade humana e construir o aeroporto quando, de fato, a
poluio aumenta as chances de problemas de sade:
Este seria o erro Tipo I e poderia representar um custo grande para os hospitais e pacientes. Mudar o valor de para um valor
mais baixo, teramos mais certeza sobre no estar cometendo um erro do tipo I, mas poderamos estar aumentando as
chances de cometer um erro do tipo II.
2) Decidir que a poluio do aeroporto no afeta a sade humana e construir o aeroporto quando, de fato, a
poluio no afeta a entrada de pacientes no hospital
Esta seria a deciso correta, feita com probabilidade 1 (=0.95 para =0.5) de que a entrada de crianas e idosos nos
hospitais depende de outros fatores que no a poluio causada pelos avies.
3) Decidir que a poluio afeta a sade humana e que o aeroporto no pode ser construdo quando a poluio no
altera as chances de problemas de sade.
Esse seria um erro do tipo II que feito com probabilidade , rejeitar Ho quando a mesma verdadeira. No caso do exemplo, a
deciso errnea poderia custar a populao de uma cidade toda os efeitos da no construo de um aeroporto. Importante
lembrar que o valor de no diretamente determinado pelo experimentador. Isto se deve ao fato de que a hiptese
alternativa definida mais genericamente que a hiptese nula e usualmente consiste da unio de muitas hipteses alternativas
especficas. Enquanto depende da distribuio nula, a qual deve ser conhecida de forma a conduzir o teste, depende de
qual hiptese alternativa realmente verdade, e isso raramente conhecido. Note que diminuir pode implicar em aumentar
4) Decidir que a poluio afeta a sade humana e que o aeroporto no pode ser construdo quando a poluio
altera as chances de problemas de sade.
Em geral, esse o tipo de resultado que, na maioria das vezes, gostaramos de provar (no caso do exemplo, estamos testando
se as mdias podem ser consideradas diferentes de zero). A probabilidade de tomar essa deciso 1- e dada o nome de
power. Se fosse alto, como um resultado 1- seria pequeno

6. Testes one-sided versus two-sided ( usa uma cauda ou as duas caudas da distribuio)
Um teste estatstico pode usar uma ou duas caudas da distribuio. A cauda da distribuio usada porque queremos
saber sobre a probabilidade de extremos (caudas) da hiptese nula que governa a significncia do teste. Quando usamos
uma ou duas caudas? Depende da natureza do problema a ser testado.
O teste que usa uma nica cauda apropriado se existe a priori (por exemplo, baseado na fsica do problema) razes
para se esperar que violaes da hiptese nula levaro a valores do teste estatstico em um lado particular da distribuio
nula. Esta situao pode ser ilustrada na figura 3, a qual foi desenhada para implicar que a hiptese alternativa produzindo
menores valores do teste estatstico foi determinada com base numa informao a priori. Aqui a hiptese alternativa
estaria estabelecida em termos do valor verdadeiro sendo maior que o valor da hiptese nula (por exemplo, H A: > o), ao
invs de uma hiptese alternativa vaga de que o valor verdadeiro no igual ao valor nulo (H A: o). Na Fig. 3 qualquer
teste estatstico maior que 100( 1 ) da porcentagem determinada da distribuio nula resulta na rejeio de Ho ao nvel
, enquanto valores baixos no levam a rejeio de Ho.
Um teste do tipo one side tambm apropriado quando apenas os valores em uma cauda ou na outra da
distribuio nula so desfavorveis para Ho, por causa do jeito que o teste estatstico foi construido. Por exemplo, um teste
estatstico envolvendo o quadrado da diferena ser prximo de zero se a diferena for pequena, mas ter valores
positivos altos se a diferena for alta. Neste caso, resultados a esquerda na cauda esquerda da distribuio nula poderia
dar suporte para Ho, tal que apenas as probabilidades da cauda direita seriam de interesse.
Testes de dois lados (two-sided tests) so apropriados quando valores muito grandes ou muito pequenos de um teste
estatstico so desfavorveis para a hiptese nula. Usualmente, tais testes pertencem a alternativa de hiptese bem geral
do tipo Ho no verdade. A regio de rejeio da distribuio nula para testes de dois lados consiste de ambos extremos
esquerdo e direito das caudas da distribuio. Estas duas pores da regio de rejeio so delineadas de tal forma que a
soma de suas duas probabilidades sob a hiptese de rejeio nula igual ao nvel de significncia do teste . Isto , a
hiptese nula rejeitada ao nvel do teste estatstico se o teste estatstico maior que 100(1-)/2 % desta distribuio
na cauda a esquerda. Assim, um teste estatstico precisa cair bem fora da cauda para ser declarado significante em um
teste de dois lados (two-tailed, two sided) comparativamente a teste de uma cauda.

Você também pode gostar