Você está na página 1de 10

Anlise Psicolgica (1997), 1 (XV): 19-28

A hiptese de estudo determina a anlise estatstica: Um exemplo com o modelo ANOVA


TERESA GARCIA-MARQUES (*)

INTRODUO

Os trabalhos de Fisher relativamente ao modelo estatstico ANOVA, desenvolvidos no campo da agricultura desde 1935, tiveram como linha orientadora a considerao de que o delineamento de um estudo anda de mos dadas com a sua anlise e tratamento estatstico. Mas esta aparente verdade de Lapalisse no acompanhou sempre o desenvolvimento de estudos no campo da psicologia. Desde os anos 20 que se podem encontrar referncias a estudos com um delineamento experimental multifactorial. No entanto, apenas nos anos 40 que no campo da psicologia se comeam a encontrar referncias modelao destes dados por um modelo ANOVA (Lovie, 1991). Um fenmeno contrrio tende agora a verificar-se: o de na literatura experimental recorrer-se indescriminadamente ao uso do modelo ANOVA. Recorre-se ao modelo ANOVA mesmo quando o delineamento do estudo no o permite (por diversas razes que apontaremos adiante) representar os dados. Recorre-se ao modelo ANOVA global para analisar todos os efeitos que

lhe esto associados, mesmo quando estes no so contemplados nas nossas hipteses, isto , quando anlises mais especficas orientaram o estudo. Neste artigo, pretendemos alertar o leitor para a importante relao que existe entre hiptese de estudo e hiptese estatstica. Ao definirmos o design ou planeamento do nosso estudo definimos tambm o modelo estatstico que poder estar subjacente aos dados recolhidos. Assim, a hiptese emprica associada ao estudo tem uma traduo na linguagem probabilistica que define a hiptese estatistica que queremos testar. Mas, mais do que isso, a especificidade da hiptese de estudo determina o grau de especificidade do efeito que se pretende associado a esse modelo estatstico, pelo que determina o tipo de abordagem estatstica a realizar. Com o objectivo de ilustrar os argumentos a apresentar ao longo do artigo, consideremos um hipottico estudo publicitrio realizado no campo da publicidade (ver pgina seguinte).

(*) Instituto Superior de Psicologia Aplicada.

Como analisar os dados recolhidos sob este design, com vista a testar directamente as hipteses colocadas? 19

EXEMPLO: Estudo publicitrio

Objectivo: Verificar se o nmero de experincias com o produto x apresentado por trs anncios publicitrios diferentes tem implicaes no grau de satisfao que os sujeitos manifestam com o produto. A literatura aponta para a possvel existncia de efeitos da varivel sexo sobre o nvel de satisfao em geral com produtos. Deste modo, embora no se pretenda estudar a varivel sexo per si, ela foi includa no design, com o objectivo de controlar (isolar) o seu efeito. Assim, as hipteses que determinaram o delineamento do estudo foram: H1: Existncia de diferenas no grau de satisfao com o produto manifestado pelos homens e pelas mulheres. (M F) H2: Existncia de um impacto diferencial dos trs anncios no grau de satisfao com o produto (A B > C) H3: Diminuio do grau de satisfao com o produto consoante o nmero de experincias tidas com ele. ({1.} > {2.} > {3.} > {4.})

Sendo, por tal, o design que presidiu recolha dos dados factorial:

SEXO (2)

ANNCIO (3)

N. DE EXPERINCIAS (4)

A varivel dependente (medida) foi o GRAU DE SATISFAO COM O PRODUTO (operacionalizada por uma questo qual se associava a possibilidade de resposta numa escala grfica ancorada em 1- nada satisfeito e 9 - muito satisfeito).

HOMENS ANUNC. A 1. EXPERINCIA 2. EXPERINCIA 3. EXPERINCIA 4. EXPERINCIA ANUNC. B ANUNC. C ANUNC. A.

MULHERES ANUNC. B ANUNC. C

20

A primeira questo que se levanta Que modelo estatstico se associa a este tipo de design? Um modelo ANOVA de efeitos fixos parece ser o que, de uma forma mais simples, poder representar a estrutura/padro subjacente aos dados da varivel grau de satisfao com o produto1. Trata-se de um modelo que se define pela amostragem de uma varivel aleatria contnua, com distribuio normal, num nmero fixo de grupos ou estratos da populao. Estes grupos podem ser definidos por um s factor ou podem resultar da considerao simultnea de mais dimenses (factores). O modelo ANOVA especfico a estes dados poder ser definido por um nmero varivel de componentes: entre dois [no caso de se considerar apenas a grande mdia e o residual] e nove [se para alm de se considerar a grande mdia e o residual se incluirem tambm os trs efeitos principais, as trs interaces de primeira ordem e a interaco de segunda ordem]. Testando a significncia de cada um destes efeitos, podemos verificar quais os componentes que definem o modelo mais ajustado, ou que melhor representa, os dados. Um efeito principal que se verifique estar associado, por exemplo, ao factor Sexo, refere que existem diferenas no modo como homens e mulheres manifestam satisfao com o produto. Pelo que o efeito principal desta varivel fica definido pelo valor que se adiciona ou se subtrai mdia global em cada uma das condies definidas pelos nveis do factor (condio Feminino, Masculino). A existncia de interaces define que a diferena observada entre as condies de

uma varivel definida num nvel de outra varivel, no a mesma que no(s) outro(s) nvel(eis) desta ltima. Um exemplo de um possvel efeito de interaco entre Sexo e Tipo de Anncio verificar-se-ia caso o impacto diferencial dos anncios no fosse o mesmo em ambos os sexos. A componente de Erro ou Residual, incorporada em todo e qualquer modelo estatstico, representa o efeito sobre o grau de satisfao de todas as variveis no includas no design experimental. Assim, se a varivel sexo no tivesse sido controlada, o seu efeito, que se pressupe significativo, teria sido adiccionado ao termo de Erro, inflaccionando-o. O termo de Erro por vezes designado como Acaso. Tal reflecte o facto de se considerar acaso toda a variao cuja fonte desconhecida (no explicada). O modelo estatstico ANOVA pressupe que os erros (residuais) so variveis aleatrias independentes (no covariam com as variveis estudadas), cuja distribuio assumida como normal, centrada em zero, e com varincia constante em todas as condies estudadas. Estes pressupostos tm consequncias directas no grau de adequao (validade e preciso) com que o modelo ANOVA representa os dados recolhidos, pelo se torna necessrio garantir a sua verificao. Verificando os pressupostos sobre os quais assenta o modelo ANOVA, sabemos no estar a construir castelos no ar, garantindo a validade das concluses retiradas do modelo2.

1 O modelo ANOVA pressupe que a varivel em estudo (varivel dependente) seja de natureza intervalar. Alguns autores contestam a natureza intervalar de medidas em rating-scales ou outro tipo de escalas grficas, pelo que colocam igualmente em dvida a adequao do modelo ANOVA modelao desses dados, tidos como ordinais. Neste artigo, consideraremos que a varivel dependente grau de satisfao com o produto de natureza intervalar. No cabe no mbito deste artigo a apresentao da discusso em torno deste assunto, pelo que ao leitor interessado recomendamos a leitura dos trabalhos de: Borgatta e Bohrnstedt (1980), Davidson e Sharma (1988), Gaito (1980) e Michell (1986).

2 Caso os residuais no tenham mdia zero, as estimativas dos efeitos estudados so, seguramente, enviezadas. A violao de outros pressupostos no questiona directamente as estimativas mas afecta a integridade da afirmao probabilstica, que define um efeito como significativo ou no (inflaccionando os erros Tipo I e Tipo II em porpores desconhecidas que podem atingir valores alarmantes). Os estudos realizados sobre estas violaes, esto longe de ser conclusivos. A anlise realizada por Box (1954) sugere que a violao simultnea dos pressupostos de normalidade e homocedasticidade, quando esta ltima pequena (Fmax<3) no acarreta grandes enviesamentos caso exista igual nmero de observaes por clula. Em caso de violaes mais acentuadas ou no existncia de igual nmero de observaes por clula, a adequabilidade do modelo ANOVA posta em causa, pelo que se deve recorrer a outro tipo de modelo estatstico, ou proceder a uma transformao dos dados, com vista a verificar os pressupostos do modelo ANOVA.

21

Consideremos as hipteses que guiaram a realizao deste estudo. Elas representam os trs possveis efeitos principais associados ao modelo ANOVA. Uma simples leitura das mdias obtidas em cada condio experimental poder-nos-ia sugerir que os padres previstos caracterizam ou no os nossos dados. Ficar-nos-ia, no entanto, uma dvida: este padro foi obtido por mero acaso ou reflecte uma realidade passvel de ser encontrada na maioria das amostras que recolhssemos? Esta dvida pode ser dissipada se considerarmos a probabilidade deste padro ter surgido por mero acaso na nossa amostra, isto , se considerarmos a probabilidade dele se verificar na nossa amostra partindo do princpio que no existe na populao (Ho verdadeira). Quanto mais pequena for esta probabilidade, maior a confiana com que se afirma poder encontrar o mesmo padro de resultados em qualquer outra amostra retirada aleatoriamente da populao. Assim, caso a probabilidade seja inferior a um valor pr-estabelecido (), toma-se o padro de diferenas encontrado como significativo, isto , rejeita-se Ho como verdadeira. Como estudar ento a significncia dos padres postulados em cada uma das trs hipteses de estudo? A especificidade com que as hipteses so colocadas, impelem a uma abordagem estatstica confirmatria (por oposio exploratria) que se centre directamente em cada padro postulado de efeitos. Tal necessidade, sendo frequentemente compreendida pelos experimentadores, muitas vezes mal orientada em termos da anlise especfica que estes levam a cabo, que tende a negligenciar o facto dos dados terem sido recolhidos sob um design global. Para compreendermos as consequncias, em termos de validade das concluses retiradas da anlise estatstica aos dados, do facto de no considerarmos a estreita relao entre o delineamento do estudo e a anlise dos dados, atendamos a trs abordagens diferentes ao estudo publicitrio em questo: 1) Testar cada hiptese por uma ANOVA ONE-WAY (simples) 2) Testar simultaneamente as trs hipteses numa ANOVA 3-WAY (3 factores) 3) Testar cada hiptese em contrastes planeados Estas trs abordagens diferem relativamente s probabilidades de erro (Erro Tipo I e Erro 22

Tipo II) associadas deciso de significncia do efeito. Lembramos que a concluso de um teste se refere validade da hiptese nula (Ho), e que a esta concluso se associam dois tipos de erro. O erro designado de Tipo I ocorre quando rejeitamos Ho sendo esta verdadeira, e a sua probabilidade define o nvel de significncia () da concluso. Por outro lado, se Ho for falsa e a tomarmos como verdadeira, cometeremos um erro designado de Tipo II e a sua probabilidade complementar probabilidade do teste detectar um efeito quando este est presente, que define a potncia do teste (1-). Assim temos, () Erro Tipo I e (1-) Coeficiente de confiana associado rejeio de Ho; () Erro Tipo II e (1-) Potncia de teste ou coeficiente de confiana associada aceitao de Ho. A probabilidade de se rejeitar erroneamente uma hiptese nula numa comparao/teste estatstico, aumenta consoante o nmero de comparaes independentes a realizar sob os mesmos (fenmeno que se designa de inflaco do alfa ver por exemplo, Garcia-Marques & Azevedo, 1995; Scheff, 1953, 1959). Se pretendermos ter 95% de confiana na concluso de que os trs efeitos postulados nas hipteses de estudo esto presentes (ou seja, assumindo a hiptese de errar em 5 de 100 vezes, por decidir pela presena de um efeito quando este, na realidade no existe), ento estamos a definir partida a probabilidade de erro Tipo I como sendo igual a 0.05. Qual a probabilidade de no cometermos nenhum erro Tipo I nas trs anlises postuladas pela primeira abordagem? A probabilidade da conjuno de acontecimentos independentes dada pelo produto das probabilidades de cada um desses acontecimentos (ver por exemplo Murteira, 1990) pelo que a probabilidade de no se cometer, nesta anlise, nenhum erro Tipo I, caso as comparaes sejam independentes, dada por: (1-0.05) (1-0.05) (1-0.05) = 0.857 Assim sendo, a probabilidade de se concluir erroneamente a validade de pelo menos uma das hipteses de estudo de: (1- 0.857) = 0.143

Verifica-se assim que o valor pretendido de alfa (5%) inflaccionado para 14,3%. A potncia de um teste estatstico, estando dependente do prprio modelo estatstico, funo de trs parmetros especficos: (1) Magnitude do efeito estudado (ME); (2) Nvel de significncia escolhido (); e (3) Preciso/fidelidade dos dados recolhidos (S/N = Erro Padro) (ver por exemplo Cohen, 1988 e Azevedo & Garcia-Marques, no prelo). Nas trs abordagens aqui em comparao, a magnitude de efeito estudado a mesma, visto que as reportamos ao mesmo conjunto de dados. O nvel de significncia utilizado em cada um pode, caso o desejarmos, ser idntico. O mesmo no se passa no que diz respeito variabilidade que se define como Erro. Como j referimos, qualquer efeito includo num modelo ANOVA subtrado variao residual. Qualquer efeito excludo do modelo adiccionado ao Residual. A realizao de ANOVAS simples sobre cada um dos efeitos em estudo, postula a construo de trs modelos distintos onde se considera apenas um efeito principal. Assim, a proporo da variabilidade associada a cada um dos restantes efeitos principais e associada s interaces acoplada variabilidade deixada por explicar no nosso delineamento, pelo que considerada Erro. Se algum dos efeitos ignorados for de

grande magnitude, inflaccionar a quantidade de variabilidade que se atribui erradamente ao acaso, pelo que inflaccionar o termo de erro do modelo. Para um efeito observado ser considerado significativo, compara-se a variabilidade que o define com a atribuda ao acaso (calculando-se a estatstica de teste), esperando-se que o primeiro se sobreponha ao segundo. Um efeito principal considerado presente se assumir uma magnitude que o destaque de todo o rudo (acaso). Ora, se o rudo foi inflaccionado, corremos o risco de no detectarmos a presena do dito efeito mesmo quando este est presente (diminumos a potncia do teste, aumentamos a probabilidade de erros Tipo II). Desta forma, os testes a realizar sob esta abordagem tm fraca potncia comparativamente s restantes abordagens e, consequentemente, a validade das concluses extradas mais fraca. Para ilustrar este ponto, comparemos as decises estatsticas a que nos conduziriam as duas primeiras abordagens. Para o efeito, recorremos ao programa informtico de anlise de dados STATISTICA, mdulo ANOVA/MANOVA, definindo os respectivos designs. O Quadro 1 sumariza os outputs do procedimento efectuado.

1) Testar cada hiptese por uma ANOVA 1WAY (SIMPLES)

QUADRO 1

Resultados extrados a partir de uma ANOVA 1-Way (SIMPLES)


1-way ANOVA Effect SEXO df Effect 1* DEPENDENT: 1 variable: MS Effect 147.4083* SATISFAO MS Error 4.510028* BETWEEN: 1-SEXO (2): M F F 32.68457* p-level .000000*

df Error 118*

1-way ANOVA Effect df Effect ANNCIO 2

DEPENDENT: 1 variable: MS Effect 10.75833

SATISFAO

BETWEEN: 1-ANUNCIO (2): A B C F 1.912738 p-level .152265

df Error 117

MS Error 5.624573

1-way ANOVA Effect N. EXP df Effect 3

DEPENDENT: 1 variable: MS Effect 12.69722

SATISFAO df Error 116

BETWEEN: 1-N. EXP (4): 1 2 3 4 MS Error 5.530172 F 2.295990 p-level .081385

23

Face ao conjunto de resultados das trs anlises realizadas, seramos induzidos a concluir que apenas a varivel Sexo teve algum efeito sobre o grau de satisfao manifestado pelos sujeitos experimentais. O paradoxo reside essencialmente no facto da varivel que se sabia a priori ter efeito e por tal ter sido introduzida no design, no estar a ser controlada quando se analisam os restantes efeitos. Vejamos, ento, em que mudariam as nossas decises se controlssemos o efeito da varivel sexo, em termos estatsticos (Quadro 2).

rincia, aumentaram. Trata-se de uma anlise mais potente que a da primeira abordagem utilizada. No entanto, contrariamente primeira abordagem, a Anova 3-Way, tem as caractersticas globais de uma abordagem exploratria, e no faz uso das capacidades de uma abordagem confirmatria que se foca exclusivamente sob os efeitos esperados. 3) Testar cada hiptese em contrastes planeados A realizao de contrastes planeados adicciona potncia de teste da anlise global do design o ganho em potncia de teste que advm da abordagem confirmatria. Para a compreendermos, tenhamos em considerao a noo de contraste. Designa-se por contraste uma comparao muito especfica entre as mdias de um design mais ou menos complexo. Note-se que um conjunto de 4 mdias pode estabelecer 3 padres independentes (ortogonais) de diferenas entre si (o que determina o nmero de graus de liberdade associados ao factor). Ao definir um contraste, definimos um padro especfico de diferena. Assim ao estudar a significncia de um contraste definido ao nvel de um efeito principal, contrariamente a testar se existe algum padro de diferenas entre as mdias desse

2) Testar simultaneamente as trs hipteses numa ANOVA 3 -WAY (3 FACTORES) Construindo o modelo estatstico adequado ao verdadeiro delineamento do estudo, detectamos a presena do efeito esperado de acordo com a hiptese 3, do factor N. de Experincias. Neste tipo de anlise exercemos um verdadeiro controlo da varivel sexo, visto que subtramos o seu efeito ao termo de erro do modelo. Na realidade, nesta anlise, o termo de erro constante para todos os efeitos estudados, e embora os graus de liberdade associados ao erro diminuam, a verdade que os valores de F associados aos dois efeitos de Anncio e de Expe-

QUADRO 2

Resultados extrados a partir de uma ANOVA 3-WAY (3 FACTORES)


3 - way ANOVA DEPENDENT: 1 variable: SATISFAO BETWEEN: 1-SEXO (2): M F

2-ANNCIO (3): A B C 3-N.EXP Effect SEXO ANNCIO N.EXP SEX x ANUN SEX x N.EXP ANUN x N.EXP df Effect 1 2 3 2 3 6 MS Effect 147.4083 10.7583 12.6972 2.3583 .5194 1.7472 .5694 df Error 96 96 96 96 96 96 96 MS Error 4.712500 4.712500 4.712500 4.712500 4.712500 4.712500 4.712500 F 31.28028 2.28294 2.69437 .50044 .11023 .37076 .12084 (4): 1 2 3 4 p-level .000000 .107495 .050314 .607835 .953936 .895883 .993652

SEX x ANUNC x N.EXP 6

24

factor, testa-se se aquele padro especfico (ao qual se associa apenas um grau de liberdade) est ou no presente. Tal s possvel se o nosso estudo tiver hipteses tambm elas muito especficas. A relao entre as mdias de um mesmo factor definida por uma combinao linear Lk= aiXi + ... + amXm, onde ai refere o coeficiente associado ao grupo i e Xi a mdia do grupo I, onde (ai)=0. A ausncia de um nvel do factor (grupo) coincide com este se se encontrar associado ao coeficiente zero. A significncia do contraste estudada relativamente ao modelo global onde este se define, pelo que, assumindo homogeneidade de varincias, temos que o erro padro da comparao dado por:
sek = a 2 MSe i ni

Pode-se definir um tipo especfico de contraste quando a natureza da varivel independente ordinal. Isto porque, no contraste, pode-se definir a relao entre esta varivel e a varivel de medida como linear ou no linear. Nestes casos, o contraste especfico define uma trend (tendncia), qualificada de linear, quadrtica, cbica, etc., positiva ou negativa. Uma trend define um padro especfico que se pensa descrever a relao entre as variveis em estudo, um padro especfico de diferenas entre as mdias obtidas nos diferentes nveis da varivel ordinal. A terceira hiptese do nosso estudo, define precisamente a existncia de uma relao linear negativa entre o nmero de experincias que os sujeitos tiveram com o produto e o grau de satisfao para com o mesmo. Mas qual a vantagem de se realizarem contrastes, relativamente abordagem global? A vantagem encontra-se no facto da anlise em contraste diminuir os nveis de erro Tipo I e de erro Tipo II que se associam s suas concluses. Ao diminuir o nmero de comparaes estatsticas que se levam a cabo, exerce-se um maior controlo sobre o erro Tipo I. Diminuemse, igualmente, os erros do Tipo II por a potncia do teste associado a um contraste ser superior potncia associada abordagem geral, e isto porque nos concentramos na magnitude de um efeito especfico em vez da magnitude mdia de uma classe de efeitos possveis. Quando no teste global (ANOVA 3-WAY) consideramos a presena de um efeito associado ao tipo de anncio, no especificamos que tipo de efeito. Assim, havendo trs anncios, estes podem estabelecer apenas dois padres de diferena que sejam independentes um do outro (pelo que dois graus de liberdade). A variabilidade observada em termos de satisfao com o produto que se associa aos anncios, dada pela soma da variabilidade subjacente a qualquer um destes padres. Assim, a variabilidade mdia associada aos efeitos do factor (padres) calculada dividindo o total dessa variabilidade (soma dos quadrados- SS) pelo seu nmero de graus de liberdade (resultando no MS). Tal dever ser a estratgia utilizada caso hipotetizemos a existncia de um padro de diferenas e no o especifiquemos (isto , caso se pretenda interpretar qualquer padro que surja nos dados mesmo que diferente do hipotetizado). 25

em que MSe representa o quadrado mdio do erro residual da ANOVA. Assim a estatstica de teste associada hiptese nula, Ho: Lk=0, L definida por t k = sek que tem subjacente uma k distribuio T-Student com o nmero de graus de liberdade associados ao termo de erro (o que equivalente a uma distribuio F(1,v)). Dois ou mais contrastes dizem-se ortogonais quando, se referindo a comparaes de nveis do mesmo factor, se referem a questes independentes, no correlacionadas. A r condies experimentais (nveis do factor), associam-se r-1 contrastes ortogonais (que coincidem com o nmero de graus de liberdade associados ao factor). Uma forma rpida de garantir ortogonalidade dos contrastes garantir que a soma dos produtos dos pesos atribudos aos i nveis do factor (ai) zero. Assim, dizemos que j contrastes (j=1,..,r-1) realizados para os valores Xi, aos quais se atribudos pesos aij, so ortogonais se:
r r 1 a ij = 0 i =1 j =1

(o somatrio da multiplicao dos pesos atribudos for igual a zero):


EX:
+1 -1/2 -1/2 0 +1 -1 aij =0 -1/2 +1/2 ( aij) = 0 i) +1 0 -1 -1/2 +1 -1/2 aij=-1/2 0 +1/2 ( aij) = 0 ii)

Mas, se quisermos fazer uma afirmao precisa relativamente ao tipo de efeito que se associa a um dado factor (uma afirmao que tenha por detrs a ideia de que ou o efeito este ou como se ele no existisse!), ento pretendemos apenas interpretar a variabilidade que se associa a esse padro especfico dos dados. Assim sendo, devemos ter apenas em considerao a magnitude do efeito associado a esse padro. Se o padro se ajusta perfeitamente aos dados, esta magnitude atingir valores que se distanciam dos que seriam de esperar por mero acaso, pelo que ser significativa. Paralelamente, para que o argumento seja completo, h que verificar que nenhum outro padro diferente do que testamos, se associa aos nossos dados. Tal verificao advm de se testar que o residual do contraste no significativo. Quando definimos as hipteses de estudo publicitrio sob anlise, associmos um padro especfico a cada uma delas e definimos a anlise como confirmatria. Ao definir a anlise como confirmatria, afirmamos querer apenas saber se os dados davam ou no suporte s nossas hipteses, em vez de nos prepararmos para interpretar todo e qualquer padro que pudesse emergir dos dados. Sendo assim, podemos definir

concretamente os padres que as nossas hipteses associam a cada efeito principal em termos de contrastes ou comparaes planeadas, e testar a sua significncia. No Quadro 3, sumarizamos os resultados da anlise da significncia dos contrastes definidos. Quando procedemos a uma anlise to especfica, qualquer das hipteses de estudo parece ter suporte emprico (a um nvel de a de 5%). Pelo que podemos concluir pela no rejeio das hipteses em estudo. Os anncios A e B, promovendo igual satisfao com o produto, parecem ser mais eficazes que o anncio C. Porm, tal como se previa, o nmero de experincias com o produto leva a uma progressiva diminuio dessa satisfao. A anlise global realizada sugere interpretaes de carcter hipottico relativas ausncia de efeitos interactivos. Assim, ela sugere que o efeito de consumo progressivo se verifica independentemente do anncio que apresentou o produto ao sujeito e que todos estes efeitos so constantes para ambos os sexos (apesar de homens e mulheres diferirem na satisfao com o produto). Os objectivos da anlise estatstica de um conjunto de dados so os mesmos que conduzi-

QUADRO 3

Resultados extrados a partir da anlise de contrastes


ANOVA DEPENDENT: 1 variable: Contraste: SATISFAO A B 1 1 df Error 96 96 BETWEEN: 1-ANNCIO: A B C C -2 SS Error 452.40 452.40 MS Error 4.71 4.71 F 3.97 0.59 p-level .049184 n.s.

ANNCIO RESIDUAL

df Effect 1 1

SS Effect 18.70 2.81

MS Effect 18.70 2.81

ANOVA

DEPENDENT: 1 variable: Contraste: 1 3 df Effect 1 2 SS Effect 38.00 .09

SATISFAO 2 3 1 -1 df Error 96 96

BETWEEN: 1-N.EXP (4): 1 2 3 4 -3 (TREND LINEAR negativo) SS Error 452.40 452.4 MS Error 4.71 4.71 F 8.06 .00

N.EXP RESIDUAL

MS Effect 38.00 0.45

p-level .005512 n.s.

26

ram recolha desses mesmos dados. Quanto maior o carcter exploratrio do estudo, maior o carcter exploratrio da anlise estatstica. Quanto mais precisas e especficas as hipteses em estudo, mais precisas devem ser as anlises estatsticas que as testam. Em condies ideais, as hipteses de um estudo traduzem-se em hipteses que se associam a um modelo estatstico. No entanto, nem sempre se consegue desenvolver o modelo estatstico que se associa ao delineamento do estudo. Para certos delineamentos, tem sido extremamente difcil quer encontrar algoritmos que estimem eficientemente os parmetros do modelo que lhes pode estar subjacente, quer estudar as suas caractersticas distribucionais. Como exemplo, temos o caso de modelos de anlise de varincia em heteroscedasticidade e os modelos log-lineares para medidas repetidas. A outros planos de estudo podem associar-se modelos probabilsticos com caractersticas computacionais mais fceis mas no directamente disponveis em programas estatsticos. Por todas estas razes de extrema importncia que o investigador considere a anlise estatstica dos seus dados ao conceber o plano do seu estudo. Quanto mais perfeita for a relao entre os objectivos do estudo, o seu delineamento experimental e a abordagem estatstica, mais a funo desta ltima cumprida. H que deixar de pensar nas decises sobre a anlise estatstica dos dados como uma tarefa independente da do planeamento do estudo a ser realizada aps a recolha dos dados. Ao conceber um estudo, h que conceber um estudo passvel de ser modelado em termos de partio de variabilidade e estudo da sua probabilidade, por algum dos modelos j desenvolvidos em estatstica. Ao deduzir da teoria as hipteses que orientam a construo de design, h que procurar verificar o seu nvel de especificidade e perceber se pretendemos apenas perceber a presena ou ausncia de um efeito especfico ou a teoria nos d liberdade de interpretar outro tipo de padres nos resultados. Deste modo situar-nos-emos no contnuo confirmatrio-exploratrio que definir a anlise dos nossos dados. Com o desenvolvimento de programas estatsticos, a anlise dos dados de um estudo foi apenas facilitada em termos de clculos e rapidez de implementao de algoritmos. Os programas substituem o conhecimento das frmulas e da

sua aplicao, e nada mais. Os programas no decidem as anlises a serem levadas a cabo, nem nos elucidam sobre a validade das concluses a que nos induzem. O centro de deciso e controlo de todo o processo ainda est no utilizador e no na mquina. L porque uma batedeira bate ovos e massa, no quer dizer que saiba fazer bolos. Ela no distinguir, por exemplo farinha de cimento... e ns que partamos os dentes ao digerir as concluses de alguns estudos publicados.

REFERNCIAS
Azevedo, M. & Garcia-Marques, T. (no prelo). Que confiana podemos ter nas concluses estatsticas que apresentamos?. Psicologia. Borgatta, E. F., & Bohrnstedt, G. W. (1980). Level of measurement: Once over again. Sociological Methods and Research, 9, 147-160. Box, G. E. P. (1954). Some theorems on quadratic forms applied in the study of analysis of variance problems, I. Effects of inequality of variance in the one-way classification. Annual of Mathematics Statistics, 25, 290-302. Davidson, M. L., & Sharma, A. R. (1988). Parametric statistics and levels of measurement. Psychological Bulletin, 140, 137-144. Gaito, J. (1980). Measurement scales and statistic: Resurgence of an old misconception. Psychological Bulletin, 87, 564-567. Garcia-Marques, T., & Azevedo, M. (1995). A inferncia estatstica mltipla e o problema da inflao do nvel de alfa: a ANOVA como exemplo. Psicologia, 10 (1), 195-220. Lovie, A. D. (1991). New developments in statistics for psychology and the social sciences. London: BPS and Routledge. Michell, J. (1986). Measurement scales and statistic: a clash of paradigms. Psychological Bulletin, 100, 398-407. Murteira, B. J. F. (1990). Probabilidades e estatstica (Vol. I). Lisboa: McGraw-Hill. Scheff, H. (1953). A method for judging all contrasts in the analysis of variance. Biometrika, 40, 87-104. Scheff, H. (1959). Analysis of variance. New York: Wiley.

RESUMO As decises sobre a anlise estatstica dos dados de uma investigao, estando intimamente relacionadas com o delineamento do estudo e com as hipteses que o geram, no podem ser encaradas como uma tarefa independente, a ser realizada aps a recolha de dados.

27

Para ilustrar a estreita relao entre hiptese de estudo e hiptese estatstica, dados de um estudo publicitrio so abordados de trs modos diferentes, tendo por subjacente o modelo ANOVA. A primeira abordagem negligencia o delineamento factorial do estudo e analisa cada efeito principal por uma ANOVA Oneway. A segunda tem em considerao a natureza factorial do delineamento experimental mas no a especificidade das hipteses em estudo. A terceira procura a total adequao entre hiptese de estudo e abordagem estatstica, realizando anlises especficas definidas em contrastes ou comparaes planeadas. Uma leitura comparativa das concluses retiradas de cada abordagem permite perceber o argumento de estreita relao entre a planificao de um estudo e seu tratamento estatstico. Palavras-chave: Anlise Estattica, ANOVA, Contrastes.

ABSTRACT There is a close relation between experimental hypothesis, experimental design and statistical data analysis. In order to understand the way statistical data analysis is dependent of design and hypothesis this article discusses three different approaches to the same set of data, all them within an ANOVA model. The first approach neglects the factorial nature of the design and analyses the data with an One-way ANOVA. The second approach has in consideration the nature of the design but not the specificity of the hypothesis that orientated the study. The third approach tries to achieve a total fit between statistical and study hypothesis, suggesting a couple of planned comparisons. The conclusions associated with these three different approaches allow us to understand the argument of a close relation between the way we plan the study and the way we analyze its data. Key words: Statistical Analysis, ANOVA, Contrast.

28

Você também pode gostar