Você está na página 1de 13

Estatstica II Sociologia e Sociologia e Planeamento

ISCTE SOCIOLOGIA E SOCIOLOGIA E PLANEAMENTO Ano Lectivo 2003/2004 (2 Semestre)

ESTATSTICA II
(Textos de Apoio das Aulas)

Testes de Hipteses Para Mais de Duas Amostras One-Way ANOVA


(ou anlise de varincia a um factor) Carlos Loureno, Dep. Mtodos Quantitativos (carlos.lourenco@iscte.pt)

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

4. TESTES PARAMTRICOS PARA MAIS DE 2 AMOSTRAS ONE-WAY ANOVA1 4.1. Introduo Nos testes de hipteses at agora apresentados pretendamos realizar inferncia para um (teste para uma mdia populacional, em grandes e em pequenas amostras) ou para dois parmetros (teste para a diferena de mdias em amostras independentes e em amostras emparelhadas, e em grandes e em pequenas amostras).2 Estes testes requeriam que se recolhessem uma ou, no mximo, duas amostras independentes (ou no, caso em que seriam emparelhadas). Como procedemos ento em situaes em que temos k amostras (ou grupos, ou categorias, ou), com k >2?

Haver diferenas entre as mdias da nota esperada consoante os 3 diferentes estados civis? Imaginemos que pretendamos testar se a mdia da nota esperada a Estatstica II era ou no significativamente diferente entre os 3 estados civis presentes na amostra recolhida junto dos alunos de Sociologia e Sociologia e Planeamento: solteiro, casado/unio de facto e outra situao ( k = 3 ). partida, no existem razes para crer que as expectativas face cadeira se modifiquem consoante o estado civil do aluno. de esperar que no se rejeite a hiptese de igualdade das mdias entre os 3 estados civis. Mas como procederamos para operacionalizar esta hiptese, uma vez que estamos a trabalhar com 3 amostras (aleatrias)? Uma soluo parece ser executar um teste t para cada par de estados civis (3 testes t): - um teste para a diferena de mdias entre os solteiros e os casados/unies de facto; - um teste para a diferena de mdias entre os solteiros e outra situao; - e um teste para a diferena de mdias entre os casados/unies de facto e outra situao. O problema desta abordagem perdermos o controlo do nvel de significncia conjunto para os 3 testes. Se em cada um deles fixssemos um nvel de significncia de 5%, e admitindo que os trs testes eram independentes, a probabilidade conjunta de tomar uma deciso correcta seria k 3 dada por: P[deciso conjunta correcta ] = (1 ) = (1 0,05) = 0,95 3 = 0,857 .
O que equivalente a afirmar que a probabilidade de cometer um erro Tipo I igual a 1 0,857 = 0,143( 100% ) = 14,3% . Parece consensual que a probabilidade conjunta de errar demasiadamente alta: por cada 100 julgamentos/testes realizados, estaramos a errar em 14 deles!3

A soluo passa ento pela anlise de varincia (ANOVA), que na sua verso mais simples (oneway ANOVA) corresponde a uma generalizao do teste t para a igualdade de duas mdias.
Continuaremos a utilizar um nvel de significncia de 5% ( = 0,05 ). Apesar de no terem sido apresentados, os testes para uma proporo e a para a diferena de propores tambm so muito usuais. Para os alunos que os queiram executar, ser til rever os procedimentos para a sua estimao, mas desta feita por meio de Intervalos de Confiana, e seguidamente consultar bibliografia apropriada para o efeito. 3 Note-se que se estivesse em causa realizar um teste para 5 grupos (por exemplo, solteiros, casados, unio de facto, divorciados e vivos), j teramos: P[deciso conjunta correcta] = 0,955 = 0,774 e, consecutivamente, a probabilidade de errar seria de 22,6%! Esta questo da realizao de testes t simultneos pode ainda assim ser atenuada usando a correco de Bonferroni. Esta correco consiste simplesmente na diviso do nvel de significncia pelo nmero p de testes simultneos efectuados, e s depois usar este valor para comparar com o p-value obtido para cada um deles. Neste caso, teramos p = 0,05 3 = 0,017 . Parece ser bvio que desta forma seria mais difcil rejeitar H 0 (ou dito de outra forma, seria mais difcil encontrar diferenas estatisticamente significativas), uma vez que seria necessrio obter p values 0,017 .
1 2

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

4.2. Outras ANOVAs


Nmero de variveis dependentes Nmero de factores independentes 1 factor que permite a definio de mais de 2 amostras (ou grupos, classes, categorias, etc.); ex.: intensidade do estudo quanto ao nmero de horas: baixo, mdio, alto. Apenas 1 varivel dependente, Y; ex.: nota esperada a Estatstica II 2 factores; ex.: (1) intensidade do estudo e (2) rea de estudos no secundrio: cientfico, econmico, humanidades ou artes 3 factores; ex.: (1) intensidade do estudo e (2) rea de estudos no secundrio e (3) aprovao a Estatstica I: sim ou no + de 3 factores + de 1 varivel dependente, Y1 , Y2 , Y3 , etc. ; ex.: nota obtida a Estatstica I, nota esperada a Estatstica II, assiduidade nas aulas, etc. Deste modo, passamos a ter ANOVAs Multivariadas (+ de uma varivel). 1 factor 2 factores 3 factores + de 3 factores Designao em Ingls One-way ANOVA

Two-way ANOVA

Three-way ANOVA

Multi-way ANOVA One-way MANOVA Two-way MANOVA Three-way MANOVA Multi-way MANOVA

4.3. Pressupostos de aplicao da One-Way ANOVA


Pressupostos Populaes normais Comentrios Este pressuposto j se verificava no teste t para comparao de duas mdias. Como testar Teste K-S (Kolmogorov-Smirnov)4 quando n > 50 ; teste de ShapiroWilk quando n 50 , dado que nestas circunstncias mais potente do que o teste K-S. Consequncias da violao Tal como na violao de qualquer outro pressuposto terico que presida a um teste paramtrico, a probabilidade de erro Tipo I pode no ser igual ao risco terico fixado (normalmente 5%); Quando as amostras so suficientemente grandes (T.L.C.), (e as distribuies nas populaes em estudo so idnticas) a ANOVA um mtodo bastante robusto. No caso de no se verificar a homogeneidade de varincias, esta violao ser to mais grave quanto mais as amostras tiverem dimenses diferentes entre si.

Populaes com a mesma varincia

Este pressuposto j se verificava no teste t para comparao de duas mdias.

Teste de Levene.5 Este teste mais robusto do que outras alternativas, como o teste de Bartlett. O teste de Levene um dos mais robustos face violao do pressuposto da normalidade e um dos mais potentes para testar a homogeneidade de varincias. 6

Amostras aleatrias simples e independentes

Supe-se sempre que o teste de K-S que aqui se trata o teste com a correco de Lilliefors. Ver a sua justificao em Carlos Loureno (2004) Teste Para a Diferena de Mdias em Amostras Emparelhadas, Textos de apoio das aulas, nota de rodap n.8, pg.6. 5 Para uma explicao detalhada de como calcular este teste ver Carlos Loureno (2004) Testes de Hipteses, Textos de apoio das aulas, ANEXO. 6 Neste caso, recorde-se que no clculo da estatstica F do teste de Levene, deve usar-se a mediana amostral e no a mdia amostral, dado o desvio da normalidade (In Carlos Loureno, 2004, Testes de Hipteses, Textos de apoio das aulas, ANEXO, pg.17).

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

4.4. Modelo de efeitos fixos na ANOVA a um factor (One-Way ANOVA ou ANOVA tipo I)

Queremos ento comparar a nota esperada a Estatstica II em trs grupos de alunos definidos pelo estado civil, ou seja, queremos verificar se a nota esperada (varivel dependente) est ou no condicionada pelo factor em estudo, estado civil (varivel independente) que define 3 nveis ou grupos/amostras. As trs amostras em comparao so as seguintes: amostra 1 grupo de alunos solteiros; amostra 2 grupo de alunos casados/unio de facto; e amostra 3 grupo de alunos noutra situao.

Formulao das hipteses estatsticas H 0 : 1 = 2 = K = k 7 H a : i, j : i j (com i j; i, j = 1, K , k ) 8


Ou, para apenas 3 populaes: H 0 : 1 = 2 = 3 9 H a : i, j : i j (com i j; i, j = 1,2,3 ) No que respeita hiptese alternativa, a mdia da nota esperada a Estatstica II pode ser diferente entre os grupos solteiros e casados/unio de facto, entre os solteiros e os que esto noutra situao e ainda entre os casados/unio de facto e os que esto noutra situao.

Definio da estatstica de teste: o modelo da ANOVA


Para auxiliar a compreenso da especificao do modelo subjacente ANOVA, vamos acordar a seguinte notao:
Notao Identificao Comentrio j varia do seguinte modo: de 1 at k, ou seja, j = 1,2, K , k i varia do seguinte modo: de 1 at ao total do grupo/amostra j a que pertence, ou seja, i = 1,2, K , n j

diz respeito aos grupos/amostras

diz respeito aos indivduos o valor observado da varivel dependente X (ex.: nota esperada) para o indivduo i pertencente amostra j so as dimenses de cada uma das k amostras

X ij

n1 , n 2 , K , n k

Interpretao da hiptese nula: as k mdias populacionais so iguais ou, alternativamente, as k amostras provm de uma mesma populao 8 Interpretao da hiptese alternativa: existe pelo menos um i e um j tal que i j . Ou seja, a hiptese alternativa representa a situao em que pelo menos duas das k populaes tm mdias diferentes. 9 Interpretao da hiptese nula: as k mdias populacionais so iguais ou, alternativamente, as k amostras provm de uma mesma populao

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

Podemos ento definir o seguinte:

Xj =
k

X
i =1

nj

ij

a mdia da varivel dependente (ex.: nota esperada) em cada grupo j

nj
nj ij

X=

X
j =1 i =1

a mdia global da varivel dependente (ex.: nota esperada), ou seja, corresponde soma de todos os valores da varivel X para todos os indivduos i e para todos os k grupos

n=

n
i =1

obviamente, o total de indivduos da amostra igual soma do nmero de indivduos nos k grupos/amostras

Uma vez que as hipteses formuladas dizem respeito s mdias dos grupos, por que razo este mtodo se chama anlise de varincia (ANOVA, analysis of variance)? Porque neste teste sero precisamente as varincias dos grupos que iro servir para definir a estatstica de teste e que esto na base do modelo da ANOVA. Basicamente, o que a ANOVA faz analisar a varincia entre (between) os grupos e a varincia dentro (within) dos grupos. Nesse sentido, definimos ento as seguintes variaes:
Definio Identificao Variao factorial (ou explicada) ou variao entre os grupos/amostras Variao residual (ou no explicada) ou variao dentro dos grupos Compreenso o desvio de cada uma das mdias dos k grupos/amostras em relao mdia total; resulta da influncia do factor (ou varivel independente) sobre a varivel dependente em estudo o desvio de cada observao i do grupo j em relao mdia desse grupo j; resulta da influncia de outros factores no controlados o desvio de cada observao em relao mdia total

(X (X
ij

) )

Xj

(X

ij

Variao total

Como facilmente se constatar, a variao total corresponde soma das variaes entre e dentro dos grupos/amostras:

(X

ij

X = X j X + X ij X j

) (

) (

10

Se elevarmos ao quadrado cada uma das variaes (para evitar ter desvios negativos e desvios positivos) e somarmos para todos os indivduos de todas os grupos/amostras, obtemos as somas de quadrados:

(X
k j =1 i =1

nj

ij

) = n (X
2 k j j =1

) + (X
2 k j =1 i =1

nj

ij

Xj

10

(X

A soma das variaes entre e dentro dos grupos pode ser simplificada: j X + X ij X j = X j X + X ij X j = X ij X , ou seja, a variao total, c.q.d.

) (

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

Esta expresso, conhecida como a equao da anlise de varincia, pode ser escrita, por uma questo de aproximao com as designaes anglo-saxnicas (e porque o SPSS usa as mesmas designaes), como:

SST = SSB + SSW Sum of Squares Total = Sum of Squares Between + Sum of Squares Within11
Podemos tambm estabelecer uma relao idntica para os graus de liberdade associados ao clculo de cada uma das somas de quadrados:

(n 1) = (k 1) + (n k ) 12
Finalmente, se dividirmos cada uma das somas de quadrados pelo respectivo nmero de graus de liberdade, vamos obter as somas mdias de quadrados (MSS, Mean Squares):

MSST =

SST (n 1)

MSSB =

SSB (k 1)

MSSW =

SSW (n k )

Ora, o que a One-way ANOVA faz comparar a variabilidade entre os grupos com a variabilidade dentro dos grupos, depois de divididas pelos respectivos graus de liberdade (o que d origem s referidas somas mdias de quadrados). A estatstica de teste ento a seguinte:
SSB (k 1) , F= SSW (n k ) a qual, sob H 0 , segue uma distribuio F de Snedcor com (k 1, n k ) graus de liberdade, ou seja, SSB (k 1) F F= (k 1, n k ) ) , SSW (n k ) desde que no tenham sido violados os pressupostos de que as observaes dos k grupos so amostras aleatrias independentes e de que as populaes de onde se retiraram as k amostras tm distribuies normais com varincias iguais.

11

mdias dos k grupos, mas precisamos de saber a mdia total, perdendo ento 1 grau de liberdade, e da (k 1) ; para calcular a soma de quadrados dentro dos grupos temos n observaes (total), mas precisamos de saber as k mdias de cada um dos k grupos, perdendo ento k graus de liberdade, e da (n k ) .

Em Portugus: a soma dos quadrados totais igual soma dos quadrados entre os grupos com a soma dos quadrados dentro dos grupos. 12 Para calcular a soma de quadrados total temos n observaes (total), mas precisamos de saber a mdia total, perdendo ento 1 grau de liberdade, e da (n 1) ; para calcular a soma de quadrados entre os grupos temos as

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

O Mecanismo da ANOVA Quando a variabilidade entre os grupos (Between) for elevada quando comparada com a variabilidade dentro dos grupos (Within), significa que os grupos so bastante heterogneos entre si e homogneos no seu interior. Ora, o facto de serem bastante heterogneos em comparao com a homogeneidade que se verifica no interior de cada um deles, torna-os bastante diferentes entre si e de esperar que as suas mdias para a varivel dependente, sejam significativamente diferentes. Nesta situao, plausvel esperar que a hiptese nula venha a ser rejeitada. Assim, parece ser bvio que quanto maior for a variabilidade entre os grupos relativamente variabilidade dentro dos grupos, maior ser a estatstica de teste F, e bem assim, maior a probabilidade de vir a rejeitar a hiptese nula (existiro mdias diferentes entre os k grupos). Ora, uma vez que a F de Snedcor uma distribuio positiva (no assume valores negativos) assimtrica (enviesada esquerda), e como a rejeio da hiptese nula suceder para valores de F o mais elevados possvel, os valores crticos devem ser identificados na tabela da F de Snedcor para uma probabilidade associada de (1 ) na aba direita, isto , F1 ;(k 1, n k ) ) . O teste da ANOVA , pois, e sempre, um teste unilateral direita.

Nota Sobre a Leitura da Tabela da F de Snedcor A caracterizao da distribuio F de Snedcor faz-se com recurso a dois parmetros, m e n, respectivamente, os graus de liberdade do numerador e os graus de liberdade do denominador.13 Genericamente, se uma qualquer varivel X segue uma F de Snedcor, escrevemos: X F(m ,n ) . Ento, na ANOVA os (k 1) graus de liberdade correspondem aos graus de liberdade m, e os (n k ) graus de liberdade corespondem aos graus de liberdade n.

Aplicao com um Exemplo14

Pretendemos ento testar se existem diferenas entre as mdias da varivel dependente nota esperada a Estatstica II para os 3 grupos definidos pelo factor estado civil: solteiros, casados/unio de facto e outra situao ( k = 3 ). Vejamos a informao amostral de que dispomos:
Case Processing Summary Cases Missing N Percent 7 5,4% 5 17,9% 0 ,0%

Que nota espera vir a ter em Estatstica II?

Estado civil Solteiro Casado/Unio de facto Outra situao

Valid N Percent 123 94,6% 23 82,1% 6 100,0%

Total Percent 130 100,0% 28 100,0% 6 100,0%

Esta identificao grosseira da posio dos graus de liberdade explicada pelo facto de uma varivel F quando construda como um rcio de duas outras variveis X e Y quaisquer com distribuies do Chiquadrado, respectivamente, com m e n graus de liberdade, divididas pelos seus respectivos graus de liberadade, seguir teoricamente uma distribuio F de Snedcor com m e n graus de lierdade:
Se X (2m ) e Y (2n ) , ento F =
14

13

X m F(m, n ) . Y n

Se nada dito em contrrio, os testes apresentados sero executados para um nvel de significncia de 5% ( = 0,05 ).

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento


Descriptives Estado civil Solteiro Casado/Unio de facto Outra situao Statistic 11,47 2,255 12,57 1,996 12,83 1,602

Que nota espera vir a ter em Estatstica II?

Mean Std. Deviation Mean Std. Deviation Mean Std. Deviation

A primeira impresso a retirar da anlise dos outputs anteriores, que estamos a lidar com amostras cujas dimenses so bastante diferentes: 123 alunos solteiros, 23 alunos casados/unio de facto e apenas 6 alunos noutra situao, num total de 152 alunos ( n = 152 ). Arredondada s unidades, a mdia amostral da nota esperada dos solteiros de 11 valores, e a mdia amostral da nota esperada dos casados/unio de facto e dos alunos noutra situao de 13 valores. Graficamente, temos
Mean of Que nota espera vir a ter em Estatstica II?
13,0 12,8 12,6 12,4 12,2 12,0 11,8 11,6 11,4 11,2 Solteiro Casado/Unio de fact Outra situao

Estado civil

Poderemos considerar estes valores como diferenas significativas? Ou ainda, ser que estas diferenas, ainda que no muito pronunciadas, sero significativas para as 3 populaes em estudo? Apliquemos ento a ANOVA.

Verificao dos Pressupostos de Aplicao da ANOVA


Normalidade Solicitando um teste K-S ao SPSS para os 3 grupos/amostras, temos
Tests of Normality Kolmogorov-Smirnov Statistic df Sig. ,240 123 ,000 ,177 23 ,061 ,267 6 ,200*
a

Que nota espera vir a ter em Estatstica II?

Estado civil Solteiro Casado/Unio de facto Outra situao

Statistic ,811 ,901 ,809

Shapiro-Wilk df 123 23 6

Sig. ,000 ,026 ,070

*. This is a lower bound of the true significance. a. Lilliefors Significance Correction

A normalidade da distribuio da varivel nota esperada no grupo solteiros rejeitada nos dois testes ( p value 0,05 ); para os outros dois grupos aconselhvel usar apenas o teste de Shapiro-Wilk ( n 2 , n3 50 ), o qual rejeita a normalidade da varivel nota esperada no grupo dos casados/unio de facto ( p value 0,05 ), mas no para o grupo dos alunos noutra situao ( p value > 0,05 ). Que deciso tomar?

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

Solteiros: podemos fazer uso conveniente do T.L.C. e, uma vez na presena de uma amostra suficientemente grande, admitir a normalidade, porque neste caso sabemos que a violao do pressuposto no tem consequncias srias. Casados/unio de facto: o teste de Shapiro-Wilk rejeita a normalidade para um nvel de significncia de 5% ( p value 0,05 ), mas se usarmos diminuirmos a probabilidade de erro Tipo I admissvel para 0,01, a normalidade j no rejeitada ( p value > 0,01 ). Por outro lado, curiosamente, e apesar de sabermos que o teste K-S no to potente quanto o de Shapiro-Wilk em amostras menores ou iguais a 50, o teste K-S no rejeita a normalidade. Na dvida, admitimos que a varivel tem disribuio normal tambm no grupo dos casados/unio de facto, principalmente porque o teste de Shapiro-Wilk no rejeita essa hiptese para um nvel de significncia de 1%. Outra situao: o teste de Shapiro-Wilk no rejeita a normalidade para um nvel de significncia de 5% ( p value > 0,05 ). O pressuposto da normalidade no violado. Verificada a normalidade, temos agora de testar a homogeneidade de varincias entre os 3 grupos.

Homogeneidade de Varincias

Apenas solicitando a ANOVA possvel aplicar o teste de Levene no SPSS. Apresentamos ento o output correspondente:
Test of Homogeneity of Variances Que nota espera vir a ter em Estatstica II? Levene Statistic ,473 df1 2 df2 149 Sig. ,624

No teste de Levene testamos na hiptese nula a igualdade de varincias: 2 2 H 0 : 12 = 2 = 3


H a : i, j : i2 2 (com i, j = 1, K , k ) j Ora, como podemos verificar no output, no se rejeita a hiptese nula ( p value > 0,05 ), ou seja, no rejeitamos a hiptese de haver homogeneidade de varincias na varivel nota esperada entre os 3 grupos definidos pelo estado civil. Estamos pois em condies de avanar com a ANOVA, escrevendo de imediato as hipteses em teste.

Formulao das hipteses estatsticas H 0 : 1 = 2 = 3 H a : i, j : i j (com i j; i, j = 1,2,3 )

Escolha e clculo da estatstica de teste Sabemos agora qual a estatstica de teste a usar (a estatstica F) e qual a sua distribuio terica: SSB (k 1) F F= (k 1, n k ) ) . SSW (n k )

Carlos Loureno

ISCTE, 2004

Estatstica II Sociologia e Sociologia e Planeamento

Como se compreender pela exposio terica anteriormente apresentada, realizar mo os clculos para chegar s somas dos quadrados entre os grupos e dentro dos grupos, seria, no mnimo, uma tarefa fastidiosa. Por essa razo, limitamo-nos a retirar do output do SPSS os valores necessrios para comprovar o valor da estatstica F que o software apresenta:
ANOVA Que nota espera vir a ter em Estatstica II? Sum of Squares 31,156 720,917 752,073 df 2 149 151 Mean Square 15,578 4,838 F 3,220 Sig. ,043

Between Groups Within Groups Total

Comprovando o valor da estatstica F, temos SSB 31,156 31,156 (k 1) = (3 1) = 2 = 15,578 = 3,220 , F= SSW 720,917 720,917 4,838 (n k ) (152 3) 149 retirando do output apenas os valores da coluna Sum of Squares (e usando o n e o k definidos); ou

SSB 31,156 df SSB 15,578 2 F= = = = 3,220 , SSW 720,917 4,838 df SSW 149 retirando do output os valores das colunas Sum of Squares e df; ou ainda, simplesmente, SSB (k 1) = MSSB = 15,578 = 3,220 , F= SSW MSSW 4,838 (n k ) retirando do output os valores da coluna Mean Square.

Determinao do valor crtico Teremos de consultar na tabela da distribuio F de Snedcor o valor crtico associado probabilidade acumlada 0,95 e com (m = 2, n = 149 ) graus de liberdade, ou seja, F1 ;(k 1,n k ) = F0,95;(2,149 ) 3,000 .

Tomada de Deciso Como temos F F0,95;(2,149 ) 3,220 > 3,000 , rejeitamos H 0 . Ou seja, com um nvel de significncia de 5%, rejeitamos a hiptese de no existirem diferenas significativas nas mdias da nota esperada a Estatstica II entre as 3 populaes solteiros, casados/unio de facto e outra situao. Existe, portanto, evidncia estatstica para afirmar que h pelo menos dois grupos que tm mdias diferentes entre si. No output do SPSS comprovamos esta mesma deciso, rejeita-se H 0 , uma vez que p value 0,05 .

Carlos Loureno

ISCTE, 2004

10

Estatstica II Sociologia e Sociologia e Planeamento

Nota final: a necessidade de aplicao dos testes Post-Hoc Este resultado bastante satisfatrio, uma vez que conseguimos de facto testar 3 mdias, algo que no sabamos concretizar at agora, e mais ainda porque partida no espervamos que houvesse alguma diferena entre os estados civis. Mas resta uma questo: os grupos so todos diferentes (as 3 mdias so diferentes) ou haver apenas 2 grupos que diferem entre si? Esta questo s ter resposta aplicando os testes post-hoc, isto , os testes de comparaes mltiplas a posteriori.15

4.5. Testes Post-Hoc de Comparaes Mltiplas

Como vimos logo no incio deste captulo, a realizao de testes t em simultneo no permite controlar o nvel de significncia global, pelo que se torna nexcessrio definir outros testes de hipteses simultneos que permitam comparaes mltiplas, isto , identificar diferenas entre as k mdias populacionais, e controlem ao mesmo tempo o nvel de significncia global. Assim, os testes de comparao mltipla a posteriori, ou post-hoc, mais conhecidos so: Quando se assume que as varincias entre os grupos so iguais: - teste Least Significant Difference de Fisher (LSD no SPSS); - teste Honestly Significant Difference de Tukey (Tukey no SPSS); - teste de Scheff; - teste de Newman-Keuls (S-N-K no SPSS); - teste de Duncan - teste de Gabriel - teste de Hochbergs GT2 - teste de Bonferroni - teste R-E-G-W Q Quando no se assume que as varincias entre os grupos so iguais: - teste de Dunnetts T3 - teste de Dunnetts C - teste de Games-Howell Obviamente, as hipteses em teste para cada um destes testes : H 0 : i = j H a : i j , ambas com i j; i, j = 1,2, K , k ; e o que cada um deles faz usar uma estatstica de teste que incorpore alguma correco para contornar o facto de se estarem a realizar comparaes mltiplas e ao mesmo tempo controle o nvel de significncia, e onde essas estatsticas ou seguem distribuies muito especficas em que aqueles objectivos tambm so cumpridos, ou seguem distribuies mais comuns mas onde os valores crticos tabelados so corrigidos. Por exemplo, o teste HSD de Tukey usa uma estatstica de teste que segue uma distribuio S T (k , n k ) , isto , uma distribuio Studentized Range com (k , n k ) graus de liberdade, e que depois comparada com o valor crtico tabelado desta distribuio e ainda assim corrigido por

15

Os testes post-hoc devem o seu nome ao facto de a sua aplicao s fazer sentido aps a aplicao da ANOVA. Uma vez rejeitada a hiptese nula que far sentido tentar identificar entre que pares de grupos haver diferenas.

Carlos Loureno

ISCTE, 2004

11

Estatstica II Sociologia e Sociologia e Planeamento

um factor de comparaes mltiplas.16 J o teste de Scheff usa uma estatstica de teste que segue uma F de Snedcor com (k 1, n k ) graus de liberdade, mas igualmente corrigida por um factor que tem em conta o facto de se estarem a comparar k mdias, duas a duas.17

O teste de Tukey e o teste de Scheff so indicados por alguns autores como sendo os mais utilizados, granjeando o Scheff as maior parte das preferncias. Vejamos algumas das vantagens de ambos. Teste de Tukey - gera intervalos de confiana com menor amplitude, portanto, mais precisos. Teste de Scheff - maior simplicidade de clculo; - permite usar amostras com dimenses diferentes; - robusto a violaes dos pressupostos de normalidade e de igualdade de varincias.18 Sobre os outros testes, podemos resumir algumas instrues ad-hoc para a sua utilizao:
Dimenses das amostras iguais Dimenses ligeiramente diferentes Dimenses muito diferentes Dimenses muito diferentes Tukey R-E-G-W Q Gabriel Hochbergs GT2 Games-Howell

Varincias iguais

Varincias diferentes

Como se compreender, no vamos exemplificar o clculo de nenhum dos testes, preferindo apresentar apenas um output de SPSS e proceder sua interpretao. E, como habitualmente, vigora a seguinte regra: p value rejeitar H 0 ; p value > no rejeitar H 0 .

16

A estatstica do teste HSD de Tukey dada por W =

Xi X j S '2 2 1 + 1 ni n j

S T (k ,n k ) ,

onde a hiptese nula rejeitada quando o valor absoluto da diferena entre as 2 mdias em comparao maior ou igual do que o valor crtico multiplicado pela respectiva correco, isto , quando

X i X j S T 1 ;(k ,n k )

S '2 2

1 + 1 . ni n j Xi X j 1 1 S '2 + ni n j F(k 1, n k ) (k 1) ,

17

A estatstica do teste de Scheff dada por W =

onde a hiptese nula rejeitada quando o valor absoluto da diferena entre as 2 mdias em comparao maior ou igual do que o valor crtico multiplicado pela respectiva correco, isto , quando

1 1 . X i X j F1 ;(k 1,n k ) (k 1) S '2 + ni n j


18

Um teste diz-se robusto quando a sua validade no afectada por violaes dos pressupostos que lhe esto subjacentes, isto , os resultados so muito prximos num e noutro casos.

Carlos Loureno

ISCTE, 2004

12

Estatstica II Sociologia e Sociologia e Planeamento

Uma vez que a hiptese de igualdade das varincias no foi rejeitada, iremos solicitar ao SPSS o clculo de todos os testes disponveis nestas condies:
Multiple Comparisons Dependent Variable: Que nota espera vir a ter em Estatstica II? Mean Difference (I-J) -1,09 -1,36 1,09 -,27 1,36 ,27 -1,09 -1,36 1,09 -,27 1,36 ,27 -1,09* -1,36 1,09* -,27 1,36 ,27 -1,09 -1,36 1,09 -,27 1,36 ,27 -1,09 -1,36 1,09 -,27 1,36 ,27 -1,09 -1,36 1,09 -,27 1,36 ,27 -1,09 -1,36 1,09 -,27 1,36 ,27 -1,36 -,27

Tukey HSD

(I) Estado civil Solteiro Casado/Unio de facto Outra situao

Scheffe

Solteiro Casado/Unio de facto Outra situao

LSD

Solteiro Casado/Unio de facto Outra situao

Bonferroni

Solteiro Casado/Unio de facto Outra situao

Sidak

Solteiro Casado/Unio de facto Outra situao

Gabriel

Solteiro Casado/Unio de facto Outra situao

Hochberg

Solteiro Casado/Unio de facto Outra situao

Dunnett t (2-sided)a

Solteiro Casado/Unio de facto

(J) Estado civil Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Casado/Unio de facto Outra situao Solteiro Outra situao Solteiro Casado/Unio de facto Outra situao Outra situao

Std. Error ,500 ,920 ,500 1,008 ,920 1,008 ,500 ,920 ,500 1,008 ,920 1,008 ,500 ,920 ,500 1,008 ,920 1,008 ,500 ,920 ,500 1,008 ,920 1,008 ,500 ,920 ,500 1,008 ,920 1,008 ,500 ,920 ,500 1,008 ,920 1,008 ,500 ,920 ,500 1,008 ,920 1,008 ,920 1,008

Sig. ,078 ,305 ,078 ,962 ,305 ,962 ,096 ,339 ,096 ,965 ,339 ,965 ,031 ,142 ,031 ,791 ,142 ,791 ,092 ,425 ,092 1,000 ,425 1,000 ,089 ,368 ,089 ,991 ,368 ,991 ,059 ,225 ,059 ,989 ,225 ,989 ,089 ,366 ,089 ,991 ,366 ,991 ,196 ,917

95% Confidence Interval Lower Bound Upper Bound -2,27 ,09 -3,54 ,82 -,09 2,27 -2,66 2,12 -,82 3,54 -2,12 2,66 -2,33 ,15 -3,63 ,92 -,15 2,33 -2,76 2,23 -,92 3,63 -2,23 2,76 -2,08 -,10 -3,18 ,46 ,10 2,08 -2,26 1,72 -,46 3,18 -1,72 2,26 -2,30 ,12 -3,59 ,87 -,12 2,30 -2,71 2,17 -,87 3,59 -2,17 2,71 -2,30 ,12 -3,58 ,86 -,12 2,30 -2,70 2,17 -,86 3,58 -2,17 2,70 -2,21 ,03 -3,23 ,51 -,03 2,21 -2,58 2,05 -,51 3,23 -2,05 2,58 -2,30 ,12 -3,58 ,86 -,12 2,30 -2,70 2,17 -,86 3,58 -2,17 2,70 -3,33 ,61 -2,43 1,89

*. The mean difference is significant at the .05 level. a. Dunnett t-tests treat one group as a control, and compare all other groups against it.

Como se pode verificar, pelos testes de Tukey e Scheff s rejeitaremos que a diferena entre as mdias nula se fixarmos um nvel de significncia de 10% ( = 0,10 ). Desse modo, rejeitada a igualdade de mdias apenas entre os grupos solteiros e casados/unio de facto ( p value 0,10 ).19 O teste LSD de Fisher o nico que rejeita a igualdade de mdias entre os mesmos 2 grupos para o nvel de significncia habitualmente usado de 5% ( p value 0,05 ).20 Podemos assim concluir que existe uma diferena significativa entre as mdias da nota esperada a Estatstica II nas populaes alunos solteiros e alunos casados/unio de facto.
bvio que esta rejeio acontece 2 vezes: quando comparamos solteiros vs. casados e quando comparamos casados vs. solteiros. 20 Note que o SPSS d nota desta mesma concluso ao colocar um asterisco junto da diferena de mdias entre os 2 grupos em questo (veja a nota de rodap do output).
19

Carlos Loureno

ISCTE, 2004

13

Você também pode gostar