Você está na página 1de 71

LEIES CIDINE Maio 2007 : Mdulo III

Estatsticas Paramtricas e no paramtricas

Testes de hipteses

Tecer consideraes sobre a populao com base numa amostra da populao.

TESTES DE HIPTESES Generalidades

Em Estatstica, uma hiptese uma afirmao ou conjectura sobre uma propriedade ou caracterstica da populao. Um teste de hipteses (ou teste de significncia) um procedimento estatstico padro para averiguar se os dados sustentam uma possvel afirmao acerca da populao. Se, sob uma certa hiptese, a probabilidade de ocorrncia de um determinado acontecimento for muito pequena, conclumos que essa hiptese no deve ser verdadeira.

Hiptese Nula (H0)


Explicita a afirmao (numrica) a ser testada directamente. Engloba o valor do parmetro que se assume verdadeiro para a populao. Deve expressar o conceito de igualdade (inexistncia de diferenas) Hiptese a ser rejeitada (ou no) a partir dos dados

Hiptese Alternativa (H1 ou Ha)


a afirmao complementar ou o oposto da hiptese nula. Desafia o Status Quo. Normalmente no contm o sinal de = Hiptese a ser aceite (ou no) a partir dos dados Exerccio: Identifique a hiptese nula e a hiptese alternativa em cada uma das situaes que se seguem. Escreva as hipteses referidas numa forma simblica.
1. A proporo de condutores que admitem passar no vermelho maior do que 0.5. 2. A altura mdia dos jogadores profissionais de basquetebol no mximo 2m.

Testes de hipteses - Erros

Um erro do tipo I ocorre quando a hiptese nula rejeitada, apesar de ser verdadeira. Um erro de tipo II ocorre quando a hiptese nula no rejeitada, apesar de ser falsa.

A ESTATSTICA de um teste um valor calculado a partir da amostra e que usado para tomar a deciso acerca de rejeitar ou no a hiptese nula. Normalmente representa-se por T. Exemplo:

Teste bilateral: (a repartido de igual modo para as 2 caudas da RC

Teste unilateral

Mtodo do p-value (ou valor da probabilidade) O p-value a probabilidade de obter um valor da estatstica de teste que seja pelo menos to extremo quanto o representado pelos dados, admitindo que H0 verdadeira. se p-value (onde o nvel de significncia) ____ Rejeitar H0 se p-value > ____ No rejeitar H0

RESUMO Procedimentos para o teste de hipteses de tamanho

1. 2.

Identificar o parmetro de interesse e especificar H0 e H1. Procedimento a) com base na RC de rejeio: Escolher uma estatstica de teste, T, com uma distribuio (Normal) conhecida admitindo que H0 verdadeira). Identificar a RC de rejeio. Calcular t obs que o valor que T assume para os dados observados. b) alternativo com base nos intervalos de confiana (vlido apenas para testes bilaterais) Construir um intervalo de confiana (IC) para o parmetro. Rejeitar H0 se o valor do parmetro especificado em H0 no pertencer a IC. (O IC fornece uma regio de no rejeio do teste.)

c) com base no valor de probabilidade p-value (SPSS) Determinar o p-value do teste. (O SPSS fornece o teste bilateral) Rejeitar H0 se p-value . No rejeitar H0 se p-value > .

3.

Tomar uma deciso

Testes Paramtricos vs No Paramtricos

Estatsticas paramtricas aquelas em que a funo de distribuio de uma varivel aleatria especificada obedecendo a certas premissas (modelos probabilsticos tericos contnuos - Distribuio
Normal).

Estatsticas no paramtricas se no conhecemos a distribuio terica subjacente nossa estatstica de teste ou quando so utilizadas medidas nominais, categoriais e ordinais. Estes testes so frequentemente designados por distribution-free.

TESTES PARAMTRICOS (POPULACES NORMAIS)

Pressupostos exigidos:
1. 2. 3. As observaes devem ser independentes e retiradas da mesma populao (amostra aleatria): A populao deve ter uma distribuio Normal A varincia da populao 2, deve ser conhecida priori

Pressupostos exigidos:
1. 2. As observaes devem ser independentes e retiradas da mesma populao (amostra aleatria): A populao deve ter uma distribuio Normal com dois parmetros desconhecidos. No SPSS o teste t est disponvel no menu Analyse / Compare Means / One Sample T Test

Pressupostos exigidos:
1. 2. 3. Temos duas amostras X1, , Xn , Y1, , Ym independentes Cada amostra deve ser constituda por observaes independentes e retiradas da mesma populao (amostra aleatria) As duas populaes devem ter uma distribuio Normal com as varincias 12 e 22 desconhecidas, mas, iguais.

Teste t para a comparao de mdias X e Y em amostras independentes no SPSS

No SPSS o teste t de comparao de mdias em amostras independentes est disponvel no menu Analyse / Compare Means / Independent Samples T Test

OBS: A tabela de Output do teste contm os resultados de um teste auxiliar (Teste de Levene) para averiguar se as varincias so homogneas (iguais). Caso o p-value do teste de Levene conduza no rejeio da hiptese de igualdade de varincias (sig. > ), os resultados do teste t so os da primeira linha da tabela de output, obtidos com base na estatstica dada anteriormente. Caso o p-value do teste de Levene conduza rejeio da hiptese de igualdade de varincias ( sig. ), os resultados do teste t so os da segunda linha da tabela de output, obtidos com base numa outra estatstica do teste

Pressupostos exigidos: 1. 2. 3. Temos duas amostras X1, , Xn , Y1, , Ym emparelhadas, ie., formando pares (Xi, Yi) Cada amostra deve ser constituda por observaes independentes e retiradas da mesma populao (amostra aleatria) As duas populaes devem ter uma distribuio Normal

Teste t para a comparao de mdias X e Y em amostras emparelhadas no SPSS

No SPSS o teste t de comparao de mdias em amostras emparelhadas est disponvel no menu Analyse / Compare Means / Paired-Samples T Test

OBS: Para alm da tabela de Output do teste propriamente dito surgem mais duas tabelas: a primeira com medidas amostrais (estatstica descritiva das amostras) e, a segunda com um estudo da correlao (associao) entra as variveis. Este estudo permite averiguar se a associao entre as variveis significativa, pois, caso no seja prefervel efectuar o teste t de comparao de mdias em amostras independentes ( o n de graus de liberdade duplica)

Pressupostos exigidos:
1. 2. As observaes devem ser independentes e retiradas da mesma populao (amostra aleatria) A populao deve ter uma distribuio Normal.

Pressupostos exigidos:
1. 2. As observaes devem ser independentes e retiradas da mesma populao (amostra aleatria) A populao deve ter uma distribuio Normal.

Pressupostos exigidos: 1. 2. 3. Temos duas amostras X1, , Xn , Y1, , Ym independentes Cada amostra deve ser constituda por observaes independentes e retiradas da mesma populao (amostra aleatria) As duas populaes devem ter uma distribuio Normal

Pressupostos exigidos: 1. 2. 3. As observaes devem ser independentes e retiradas da mesma populao (amostra aleatria) A populao deve ter uma distribuio que esteja nas condies de aplicao do TLC ( mdia e varincia finitas) A amostra deve ser grande ( n 30, pelo menos)

Este teste est disponvel no SPSS no menu Analyse / Nonparametric Tests /

Binomial

TESTES NO PARAMTRICOS

Pressupostos exigidos:

1.

As observaes (amostra original no caso de uma s amostra das diferenas no caso de duas amostras) devem ser independentes e retiradas da mesma populao (amostra aleatria)

2.

A varivel de interesse medida numa escala que seja, pelo menos ordinal)

3.

A funo distribuio da populao X (caso de uma amostra) ou das diferenas D (caso de duas amostras) contnua.

No SPSS, este teste surge apenas para a comparao de amostras emparelhadas : menu Analyse / Nonparametric Tests / 2 Related Samples. OBS: possvel utilizar este menu para uma s amostra criando uma varivel com todas as observaes iguais ao valor em teste 0 e tomando essa varivel como a amostra Y

Pressupostos exigidos:

1.

As observaes (amostra original no caso de uma s amostra das diferenas no caso de duas amostras) devem ser independentes e retiradas da mesma populao (amostra aleatria) A varivel de interesse medida numa escala que seja, pelo menos ordinal A funo distribuio da populao X (caso de uma amostra) ou das diferenas D (caso de duas amostras) contnua e simtrica relativamente sua mediana Nota: Se a distribuio for simtrica e tiver mdia finita a mediana igual mdia

2.

3.

O teste de Wilcoxon (signed ranks) assenta no seguinte algoritmo: 1. Determinam-se as distncias entre as observaes e a mediana em teste |Di |, Di = Xi - 0 (no caso de duas amostras, determina-se o mdulo das diferenas Di = Xi Yi ). Ordena-se (crescente) a amostra das distncias. Associa-se a cada distncia ordenada a sua ordem ou rank Ri, mantendo informao sobre o sinal original de Di . Calcular a soma dos ranks das diferenas Di positivas, T+ (ranks das observaes que excedem 0, no caso de uma amostra; ranks dos pares em que Xi > Yi , no caso de duas amostras). Calcular a soma dos ranks das diferenas Di , negativas, T- . Se H0 for verdadeira estas duas somas no devero diferir muito. Wilcoxon estabeleceu valores crticos que definem quando que a diferena entre as duas somas se deve considerar significativa. Quando n grande, com base no TLC considera-se a distribuio assimpttica da estatstica do teste T+ (que Normal)

2. 3. 4.

5. 6.

7.

No SPSS, este teste surge apenas para a comparao de amostras emparelhadas: menu Analyse / Nonparametric Tests / 2 Related Samples. possvel utilizar este menu para uma s amostra criando uma varivel com todas as observaes iguais ao valor em teste 0 e tomando essa varivel como a amostra Y

Pressupostos exigidos:

1. 2.

A varivel de interesse medida numa escala (pelo menos) ordinal Os dados disponveis para anlise so compostos por uma realizao de duas amostras provenientes de duas populaes de interesse. As duas amostras ( X1, , Xn) e ( Y1, , Ym) so independentes As funes de distribuio das populaes X e Y so contnuas. As distribuies na gnese das amostras so idnticas no que respeita forma, mas, no imperativo que sejam Normais.

3. 4. 5.

O teste de Wilcoxon (rank-sum) assenta no seguinte algoritmo: 1. 2. 3. 4. Ordenam-se todas as observaes (das duas amostras em conjunto) e atribuem-se ranks. Somam-se os ranks das observaes provenientes de cada uma das amostras e calcula-se a mdia (dos ranks) correspondente a cada amostra. Se H0 for verdadeira, os ranks mdios no devero diferir muito. Wilcoxon determina os valores crticos para se considerar a diferena significativa. Para amostras grandes, toma-se a distribuio assimpttica da estatstica do teste (que Normal).

O teste de U de Mann-Whitney assenta no seguinte algoritmo: 1. 2. 3. 4. 5. Sem perda de generalidade, toma-se para amostra X a amostra de menor dimenso (tendo o cuidado de enunciar correctamente as hipteses). Ordena-se a amostra global e identifica-se a amostra de origem de cada um dos valores. Define-se como estatstica de teste U, o nmero de vezes que cada valor da amostra X maior que um valor da amostra Y, na amostra global. A estatstica de teste de Wilcoxon definida como a soma dos ranks provenientes da amostra X. Para amostras de pequena dimenso, acede-se distribuio exacta da estatstica de teste que se encontra tabelada. Se n e m so suficientemente elevados, utiliza-se a distribuio assimpttica da estatstica de teste (Normal).

Pressupostos exigidos:

1. 2.

A amostra provm de uma distribuio contnua Os parmetros da distribuio em teste so pr-especificados e no devem ser estimados a partir da amostra.

Testes especficos de ajustamento Normal

(amostras grandes, n 30 ) -- Teste K-S: Kolmogorov- Smirnov com correco de Lillefors, quando se utiliza para estimar parmetros a partir da amostra sem perder potncia do teste.

(amostras reduzidas, n < 30 ) -- Teste de Shapiro-Wilk alternativa com melhor performance que o teste de K-S para amostras reduzidas com convergncia Normal.

Testes disponveis no SPSS, menu Analyse / Descriptive Statistics / Explore / Charts > Normality Tests with plots

Anlise de Varincia simples (One-way ANOVA) Anlise de experincias com vrios grupos de observaes classificados atravs de um s factor (por exemplo grupos de indivduos sujeitos a diferentes tratamentos para uma mesma doena). Muitas vezes tambm se utiliza a palavra tratamento em vez de grupo e dizse que a experincia tem tantos nveis ou efeitos quantos tratamentos (ou grupos) distintos. Se os grupos so pr-determinados partida temos uma experincia com efeitos fixos (planeados). Se os grupos forem escolhidos aleatoriamente entre um conjunto alargado de possibilidades temos uma experincia com efeitos aleatrios (no planeados).

Exemplo: Uma farmacutica est a desenvolver um novo medicamento para baixar a tenso arterial de doentes hiper-tensos. Por forma a averiguar a eficcia do medicamento foram seleccionados 160 indivduos hiper-tensos e foram administrados 4 tratamentos diferentes. Dois desses tratamentos correspondem a medicamentos (hiperten e o captorex) que j existem no mercado com a mesma o, cuja substancia activa. O terceiro tratamento diz respeito ao novo tratamento baseado numa nova substncia activa, e o ltimo tratamento consiste apenas num placebo (medicamento sem nenhuma substncia activa). Os 160 indivduos foram distribudos aleatoriamente pelos 4 tratamentos.

Os tratamentos tm efeitos (localizaces) diferentes? O medicamento em teste produz melhores resultados que os existentes no mercado?

Para testar estas hipteses recorre-se a uma anlise das varincias dos vrios grupos e d-se o nome ANOVA. A ideia de base a seguinte: Estimar a varincia 2 por dois mtodos diferentes, um que no depende da veracidade de H0 e outro que sim. Depois comparamos as duas estimativas. Se os grupos tiverem todos a mesma mdia (H0 verdadeiro) as duas estimativas devero ser prximas, seno diferem significativamente.

OBS: Uma forma de estimar 2, sem depender da veracidade de H0, consiste em calcular para cada grupo a varincia amostral corrigida (estimativa de 2) e tomar a mdia das vrias estimativas que se obtm. Se pensarmos agora que as mdias so todas iguais (H0 verdadeiro) estamos perante um conjunto de g amostras todas da mesma populao Sabemos que V ar X] = 2/n e podemos obter uma amostrade g mdias amostrais (uma para cada grupo). Calculando a varincia amostral desta amostrade mdias amostrais temos uma estimativa de 2/n. Multiplicando por n temos uma estimativa de 2. Mas esta ltima estimativa s boa se H0 for verdadeira. Caso contrrio inflaccionada. Assim, ao dividir a ltima estimativa pela primeira devemos obter um valor prximo de 1 se H0 for verdadeiro e muito maior que 1 caso contrrio.

No SPSS

OBS: A forma usual de apresentar os resultados de uma ANOVA consiste em apresentar caractersticas amostrais de cada grupo (mdias e DP) e depois indicar o valor observado da estatatistica de teste F e o valor do p-value da ANOVA. A tabela de ANOVA propriamente dita deve ser apresentada em anexo.

LEIES PACGI Maio 2007

MDULO III

Você também pode gostar