Objetivo: O objetivo do presente trabalho descrever a rotina bsica de comandos para realizao de
anlises de varincia, utilizando o software SPSS, verso 13.0. No sero explorados todos os comandos.
Apenas os essenciais para o incio da anlise.
Antes de qualquer anlise estatstica necessrio que se faa uma anlise exploratria dos dados
coletados. Esta anlise tem duas finalidades principais: (1) descrever e explorar as caractersticas
principais dos resultados sem uma preocupao exclusiva com os objetivos ou hipteses do trabalho (o que
no significa que no possam ocorrer conjuntamente), e (2) investigar se um conjunto de pressupostos
estatsticos est presente nos dados. Neste ltimo caso, verifica-se o ajustamento entre o conjunto de
dados e pressupostos estatsticos fundamentais para o uso correto das diversas tcnicas estatsticas
(normalidade de distribuio das variveis, presena de casos extremos, homocedasticidade,
multicolinearidade, entre outros). Neste texto temos o objetivo (2) como nossa atividade principal. Para
tanto, vamos utilizar o banco de dados fornecido no livro de Hair, Anderson, Tatham e Black denominado
HATCO. Na figura abaixo est uma reproduo parcial desse banco de dados.
Resultados das Compras: duas medidas que refletiram os resultados das relaes de compra
dos respondentes com a HATCO
X9 Nvel de Uso quanto do produto total da empresa comprado da HATCO, medido em
uma escala de 100 pontos percentuais, que varia de zero a 100%;
X10 Nvel de Satisfao: nvel de satisfao do comprador com as compras que realizou
junto HATCO, medido atravs da mesma escala grfica de percepes utilizada nos itens
X1 a X7.
Esse tipo de delineamento usado em pesquisas experimentais ou quase experimentais de modo que cada
grupo, constitudo por sujeitos distintos, submetido a uma condio especfica que caracteriza
diferentes nveis de uma varivel independente ou fator.
Agora imagine um experimento em que os mesmos sujeitos so submetidos a trs condies do mesmo
fator. Esse caso denominado de delineamento unifatorial com medidas repetidas. O quadro a seguir
ilustra um desenho desse tipo:
Nvel 1 Nvel 2 Nvel 3
P1 P1 P1
P2 P2 P2
P3 P3 P3
P4 P4 P4
. . .
. . .
. . .
. .
P10 P10. P100
P = sujeito ou participante da pesquisa. Nvel (condio de pesquisa) do fator.
A Anlise de Varincia procura diferenas entre mdias de grupos. Quando as mdias so bem diferentes,
existe um alto grau de variao entre as condies. Se no existirem diferenas entre as mdias dos
grupos, no existe variao. As variaes entre grupos surgem como efeito de tratamentos ou
experimentos, diferenas individuais e erro experimental. Para analisar essas variaes a ANOVA compara
a varincia entre grupos e a variao intra grupo ou dentro do grupo.
Por que denominada anlise da varincia o procedimento que compara mdias de grupos
diferentes? Por que na preparao das variabilidades entre e dentro so utilizados os quadrados
dos desvios dos valores das amostras, que fazem parte da definio da varincia.
A estatstica F a razo entre varincia entre os grupos pela varincia dentro do grupo. Essa razo
pode ser vista na prxima tabela. Quanto maior a razo F maior a probabilidade das diferenas entre
grupos se deverem ao tratamento ou condies e no a erro amostral. Quando a varincia entre grupos for
bem maior do que a varincia dentro dos grupos, o valor F grande. Leia mais sobre essa tcnica para
ficar por dentro dos clculos e pressupostos nela envolvidos (por exemplo, em DANCEY; REIDY, 2006) .
Para a realizao da anlise de varincia, so considerados os seguintes pressupostos bsicos:
A amostra ser retirada de uma populao normal;
Independncia entre observaes;
Homogeneidade de varincias.
Para medidas repetidas ainda h a esfericidade, analisada pelo teste Greenhouse-Geiser.
A ANOVA relativamente robusta a violaes a esses pressupostos, mas a esfericidade um problema
srio. A esfericidade s importante quando os grupos no so independentes, isto , quando os mesmos
indivduos foram submetidos a todas as condies ou fazem parte de todos os grupos. Espera-se nesse
caso que haja correlao entre as condies. Se h um pequeno nmero de participantes, os dados so
assimtricos e existe um nmero diferente de valores em cada condio, deve-se considerar a execuo
de um teste no paramtrico.
H0: m1 = m2 = m3 ... = mn
Varincia entre S b2
Fo
Varincia dentro S w2
Com o F crtico Fc correspondente ao nvel de significncia a adotado. Tambm podem ser
comparados o p-value de Fo e o nvel de significncia a.
No exemplo que se segue, sero realizadas duas anlises de varincia one-way com as variveis
dependentes (uma por vez): nvel de satisfao (x10) e qualidade do produto (x7) e a seguinte varivel
independente: tipo de situao de compra (x14).
Relembrando :
ANOVA = varivel independente no mtrica + varivel dependente mtrica
ANOVA ONEWAY = avalia um fator (grupo, tratamento, condio, varivel independente,
nvel) e uma varivel dependente mtrica por vez.
ANOVA UNIFATORIAL = avalia mais de um fator para uma nica varivel dependente
mtrica
MANOVA = avalia mais de um fator para mais de uma varivel dependente mtrica.
Entre com os dados da forma usual. Selecione Analyse, Compare Means e One-way ANOVA (Anova de um
fator).
Ser aberta a janela da figura 1.1 em que sero inseridas as variveis da pesquisa. Para realizar
comparaes minuciosas entre os grupos, clique no item Post Hoc. Para realizar as comparaes Post Hoc
necessrio ter mais de dois grupos na varivel independente ou fator.
Ao abrir a janela do Post Hoc Multiple Comparisons, marque a opo Tukey e Continue. Ao retornar
janela da figura 1.1, marque a opo Options e depois as opes Descriptives, homogeneity of variance
test, conforme figura 1.3.
Levene
Statistic df1 df2 Sig.
Satisfaction Level 3,302 2 97 ,041
Product Quality
2,051 2 97 ,134
Descriptives
Note que no desenho abaixo, h diferena entre as mdias, mas h sobreposio dos intervalos de
confiana. Quando h sobreposio dos intervalos de confiana, as mdias so estatisticamente iguais.
Quando no h sobreposio dos intervalos de confiana, h diferena entre as mdias dos grupos
A estatstica F a razo entre varincia entre os grupos pela varincia dentro do grupo. Essa razo
pode ser vista na prxima tabela.
Diferenas significativas. A hiptese
nula foi rejeitada. Os graus de liberdade
do grupo o nmero de grupos menos
um. Os graus de liberdade dentro do
grupo (participantes) so n-1.
ANOVA
Sum of
Squares df Mean Square F Sig.
Product Quality Between Groups 49,751 2 24,876 12,123 ,000
Within Groups 199,035 97 2,052
Total 248,786 99
Satisfaction Level Between Groups 39,007 2 19,503 56,542 ,000
Within Groups 33,459 97 ,345
Total 72,466 99
Segundo a tabela da ANOVA (One-way), pode-se observar que as hipteses nulas foram rejeitadas.
Ou seja, existe diferena significativa entre as mdias dos grupos pesquisados para as duas variveis
dependentes: satisfao e qualidade do produto. Contudo, a estatstica para nvel de satisfao
problemtica porque viola o pressuposto da ANOVA. A partir daqui, pode-se deixar de fazer a anlise.
Contudo, a anlise ter prosseguimento para que se possa perceber o impacto da violao dos resultados.
Aps a comparao geral dos trs grupos, os testes Post Hoc realizam comparaes dois a dois, entre os
grupos. A tabela seguinte traz essas comparaes. As comparaes dois a dois trazem informaes
detalhadas a respeito das diferenas que so realmente significativas. H necessidade de olhar novamente
as descritivas para uma compreenso melhor das diferenas.
Diferenas significativas para a
qualidade do produto considerando o
tipo de compra. A recompra direta est
associada a maior satisfao que a
Multiple Comparisons primeira compra.
Tukey HSD
Mean
(I) Type of (J) Type of Difference 95% Confidence Interval
Dependent Variable Buying Situation Buying Situation (I-J) Std. Error Sig. Lower Bound Upper Bound
Product Quality New Task Modified Rebuy ,2991 ,3528 ,674 -,541 1,139
Straight Rebuy 1,6118* ,3474 ,000 ,785 2,439
Modified Rebuy New Task -,2991 ,3528 ,674 -1,139 ,541
Straight Rebuy 1,3127* ,3528 ,001 ,473 2,152
Straight Rebuy New Task -1,6118* ,3474 ,000 -2,439 -,785
Modified Rebuy -1,3127* ,3528 ,001 -2,152 -,473
Satisfaction Level New Task Modified Rebuy -1,0737* ,1447 ,000 -1,418 -,729
Straight Rebuy -1,4647* ,1424 ,000 -1,804 -1,126
Modified Rebuy New Task 1,0737* ,1447 ,000 ,729 1,418
Straight Rebuy -,3910* ,1447 ,022 -,735 -,047
Straight Rebuy New Task 1,4647* ,1424 ,000 1,126 1,804
Modified Rebuy ,3910* ,1447 ,022 ,047 ,735
*. The mean difference is significant at the .05 level.
As outras tabelas trazem os subgrupos que so formados a partir das mdias. Para
qualidade do produto, h dois subgrupos formados a partir da mdia. Um subgrupo envolve a
recompra direta e o outro subgrupo envolve a recompra modificada e a nova compra.
Product Quality
a,b
Tukey HSD
Subset for alpha = .05
Type of Buying Situation N 1 2
Straight Rebuy 34 6,003
Modified Rebuy 32 7,316
New Task 34 7,615
Sig. 1,000 ,672
Means for groups in homogeneous subsets are displayed.
a. Uses Harmonic Mean Sample Size = 33,306.
b. The group sizes are unequal. The harmonic mean of
the group sizes is used. Type I error levels are not
guaranteed.
Para a varivel satisfao, h claramente trs grupos formados com mdias diferenciadas.
Portanto, houve diferena para a varivel satisfao.
Satisfaction Level
a,b
Tukey HSD
Subset for alpha = .05
Type of Buying Situation N 1 2 3
New Task 34 3,929
Modified Rebuy 32 5,003
Straight Rebuy 34 5,394
Sig. 1,000 1,000 1,000
Means for groups in homogeneous subsets are displayed.
a. Uses Harmonic Mean Sample Size = 33,306.
b. The group sizes are unequal. The harmonic mean of the group sizes
is used. Type I error levels are not guaranteed.
Existe efeito do tipo de compra e do tipo de empresa sobre a percepo de qualidade do produto? Ou
a percepo de qualidade do produto afetada pela forma com que a compra foi realizada e
pelo tipo de empresa?
Tipo de Trabalho
8,0 Novo trabalho
Readaptao
Trabalho normal
Mdias Marginais Estimadas
7,5
7,0
6,5
6,0
Condio 1 Condio 2
Tipo de Condio
No grfico anterior, h poucos indcios de interao. Apenas entre os grupos Novo Trabalho e
Readaptao, h efeito de interao na qualidade de vida quando pertencentes condio 2. o que
significa ter uma interao entre duas variveis? Se h duas variveis e cada uma apresenta duas
condies, uma interao ocorre quando uma varivel se comporta de forma diferente em cada condio
da outra varivel. Ento, os grupos Novo Trabalho e Readaptao, se comportam de forma diferente nas
duas condies. Quando no existe interao, as linhas que representam a varivel so paralelas. H maior
qualidade de vida na condio 2, para os grupos Novo trabalho e Readaptao.
Analyse
General Linear Model
Univariate
A figura 1.4 apresenta a janela em que so inseridas as variveis para comparao. A varivel
dependente inserida na local indicado e as variveis independentes so inseridas no espao Fixed
Factor (s). Nessa mesma janela, selecione a opo Post Hoc para indicao dos fatores que
apresentam comparaes para mais de trs grupos.
Aps selecionar o teste Post Hoc, retorne a janela da figura 1.5 ao clicar em Continue. Na janela da
figura 1.4, selecione a opo Options. Na janela Options, selecione as opes Descriptives statistics e
Homogeneity tests.
Between-Subjects Factors
Value Label N
Type of Buying 1 New Task 34
Situation 2 Modified
32
Rebuy
3 Straight
34
Rebuy
Type of Industry 0 FIRM TYPE
50
(SIC) ONE
1 FIRM TYPE
50
TWO
Na tabela descriptives, h a apresentao das mdias para cada um dos grupos e seus
respectivos tamanhos (N). a mdia obtida pelo cruzamento dos grupos dos dois fatores.
Descriptive Statistics
De acordo com os resultados, existe diferena estatstica de mdias entre os grupos dos fatores:
tipo de situao de compra, tipo de empresa e para a interao entre eles.
Na janela 1.7, h a indicao do pedido de efeitos parciais que traz uma medida de correlao ao
quadrado (eta ao quadrado parcial) que indica o percentual de variao que explicado pelo fator.
Figura 1.7 Janela Options com novas indicaes
A opo pelo Partial Eta Squared indica uma avaliao dos efeitos parciais. O eta indica que 22%
da variao na qualidade do produto se deve ao tipo de situao de compra.
O eta parcial j est ao quadrado e um
coeficiente de correlao que indica variaes
em uma varivel explicada por variaes em
outra varivel.
Multiple Comparisons
Mean
(I) Type of (J) Type of Difference 95% Confidence Interval
Buying Situation Buying Situation (I-J) Std. Error Sig. Lower Bound Upper Bound
New Task Modified Rebuy ,299 ,3371 ,650 -,504 1,102
Straight Rebuy 1,612* ,3319 ,000 ,821 2,402
Modified Rebuy New Task -,299 ,3371 ,650 -1,102 ,504
Straight Rebuy 1,313* ,3371 ,001 ,510 2,115
Straight Rebuy New Task -1,612* ,3319 ,000 -2,402 -,821
Modified Rebuy -1,313* ,3371 ,001 -2,115 -,510
Based on observed means.
*. The mean difference is significant at the ,05 level.
Na ltima tabela so inseridos os subgrupos que compem as mdias de qualidade do produto. Existem
dois subgrupos homogneos para as mdias, um que engloba os grupos nova tarefa e recompra modificada
e outro com a recompra direta.
Homogeneous Subsets
Product Quality
a,b,c
Tukey HSD
Subset
Type of Buying Situation N 1 2
Straight Rebuy 34 6,003
Modified Rebuy 32 7,316
New Task 34 7,615
Sig. 1,000 ,647
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 1,873.
a. Uses Harmonic Mean Sample Size = 33,306.
b. The group sizes are unequal. The harmonic mean of
the group sizes is used. Type I error levels are not
guaranteed.
c. Alpha = ,05.
A primeira coisa que deve-se fazer visualizar os dados num grfico, ou por meio de um boxplot ou por
meio de um grfico de pontos.
Diferentemente do teste t para duas amostras independentes, devemos assumir que as varincias so
iguais em todos os grupos, e adicionalmente que os dados so aproximadamente normais.
Um teste F de Levene pode ser feito para testar a hiptese nula de igualdade de varincias. um -valor
pequeno indica que a ANOVA no apropriada como um mtodo de anlise.
Quanto maior for a primeira comparada segunda, maior a evidncia de que existe variabilidade entre
grupos, ou seja, mdias diferentes.
em que
Aqui SQD utilizado para denotar soma de quadrados entre grupos e SQE para a soma de quadrado
dentro dos grupos.
Agora tendo separado a variabilidade, possvel mostrar que podemos obter estimativas independentes da
varincia populacional comum a partir destas duas quantidades. Elas so chamadas de valores
quadrados mdios, e obtemos as seguintes estimativas:
em que o nmero de grupos, e o tamanho amostral total, aqui 20. Como estas estimativas de
varincia so construdas a partir de dois tipos diferentes de variabilidade, quanto mais elas diferirem,
mais evidncia existe de diferena nas mdias.
A estatstica de teste
e comparamos este valor com uma distribuio F com e graus de liberdade para obter
um -valor. Sempre que uma ANOVA feita usual expressar os resultados numa tabela como segue:
Estes resultados so dos dados de estorninhos, e conclumos que existem evidncias estatisticamente
significativas ao nvel de 5% de uma diferena nas mdias de quatro situaes de pousada diferentes.
A anlise multivariada de varincia uma extenso da ANOVA. A MANOVA permite trabalhar com
mais de uma varivel dependente simultaneamente. Quando mltiplas variveis dependentes, a MANOVA
trabalha com uma varivel estatstica que a combinao linear das variveis dependentes mtricas
escolhidas na pesquisa. O teste utiliza essa combinao como se fosse uma nica varivel dependente.
Conseqentemente, a anlise identifica o efeito das variveis independentes ou da varivel independente
na combinao linear das variveis dependentes. Tal combinao pode ser uma simples adio das
variveis dependentes, ou ainda uma adio das variveis, incluindo pesos na equao (x1 * 3) + (x2 * 2). A
MANOVA escolhe a combinao por meio do critrio de maximizar as diferenas entre as vrias condies
das variveis independentes. Por isso, ela utiliza vrios testes para indicar o valor de F.
Pressupostos: Os pressupostos da Anlise Multivariada de Varincia incluem a normalidade
multivariada, a homogeneidade da matriz de varincia-covarincia, a linearidade, a homogeneidade de
regresso, a multicolinearidade e a singularidade.
1. Normalidade multivariada: A normalidade multivariada difcil avaliar. Refere-se suposio
de que as distribuies de mdias amostrais das VDs em cada cela e todas as combinaes lineares delas
sejam normalmente distribudas. importante verificar a normalidade da distribuio de todas as
variveis dependentes. A MANOVA robusta a uma modesta violao da normalidade, se essa violao for
resultante de assimetria da distribuio e no da presena de outliers.
Ao abrir a janela, coloque as variveis dependentes no local apropriado e os fatores (VIs) nos
locais indicados. Em seguida, pressione o boto Options.
Para realizao dos testes de homogeneidade de varincia, marque a opo Homogeneity test. Alm
disso, solicite as descritivas (Descriptives) e o tamanho do efeito (Estimates of effect size). Em seguida,
selecione Continue. Aps essas selees, h o retorno para a janela inicial. Para os testes Post Hoc,
selecione a opo Post Hoc. Na janela Post Hoc, selecione o teste desejado.
O teste Box M indica que a matriz de covarincia extrada entre essas duas variveis
apresenta homogeneidade de varincia. Tal resultado indica que a MANOVA poder ser
realizada.
O teste de Levene faz a comparao univariada das VDs, o que no indicado para
nosso clculo. De acordo com o teste de Levene, a varivel satisfao apresenta problemas de
homogeneidade de varincia, o que no ocorre com a varivel qualidade do produto.
a
Levene's Test of Equality of Error Variances
Partial Eta
Effect Value F Hypothesis df Error df Sig. Squared
Intercept Pillai's Trace ,990 4524,617a 2,000 96,000 ,000 ,990
Wilks' Lambda ,010 4524,617a 2,000 96,000 ,000 ,990
Hotelling's Trace 94,263 4524,617a 2,000 96,000 ,000 ,990
Roy's Largest Root 94,263 4524,617a 2,000 96,000 ,000 ,990
x14 Pillai's Trace ,636 22,604 4,000 194,000 ,000 ,318
Wilks' Lambda ,401 27,756a 4,000 192,000 ,000 ,366
Hotelling's Trace 1,398 33,204 4,000 190,000 ,000 ,411
Roy's Largest Root 1,328 64,416b 2,000 97,000 ,000 ,570
a. Exact statistic
b. The statistic is an upper bound on F that yields a lower bound on the significance level.
c. Design: Intercept+x14
Tukey HSD
Mean
(I) Type of (J) Type of Difference 95% Confidence Interval
Dependent Variable Buying Situation Buying Situation (I-J) Std. Error Sig. Lower Bound Upper Bound
Product Quality New Task Modified Rebuy ,299 ,3528 ,674 -,541 1,139
Straight Rebuy 1,612* ,3474 ,000 ,785 2,439
Modified Rebuy New Task -,299 ,3528 ,674 -1,139 ,541
Straight Rebuy 1,313* ,3528 ,001 ,473 2,152
Straight Rebuy New Task -1,612* ,3474 ,000 -2,439 -,785
Modified Rebuy -1,313* ,3528 ,001 -2,152 -,473
Satisfaction Level New Task Modified Rebuy -1,074* ,1447 ,000 -1,418 -,729
Straight Rebuy -1,465* ,1424 ,000 -1,804 -1,126
Modified Rebuy New Task 1,074* ,1447 ,000 ,729 1,418
Straight Rebuy -,391* ,1447 ,022 -,735 -,047
Straight Rebuy New Task 1,465* ,1424 ,000 1,126 1,804
Modified Rebuy ,391* ,1447 ,022 ,047 ,735
Based on observed means.
*. The mean difference is significant at the ,05 level.