Estatistica Sem Matematica

M é t o d o s ^ * d e P e s q u i s a
ESTATÍSTICA
SEM MATEMÁTICA
PARA PSICOLOGIA
Usando SPSS para Windows
D 173e Dancey. C hristine P.
Estatística sem matemática para psicologia / Christine P. Dancey. John
Reidy : tradução Lori Viali, - Porto Alegre : Artnied. 2006,
608 p, ! il. ; 25 cm.
ISBN 978-85-363-0688-9
1. E statística - Psicologia. I. Reidy, John. II. Título.
CDU 311:159.9
Catalogação na publicação: Júlia Angst Coelho - CRB 10/1712

Christine P. Dancey
University of East London
John Reidy
University Sheffield HaLLarn
ESTATÍSTICA
SEM MATEMÀTICA
PARA PSICOLOGIA
3a edição
T radução, consultoria e supervisão desta edição:

Lori Viali
Professor Titular da Faculdade de Matemàtica da PUCRS
Professor Adjunto do Instituto de Matemàtica da UFRGS
Reimpressão 2007
© Pearson Education Limited 2004
This translation of Statistics without maths fo r psychology. 3 edition is published by arrangem ent with Pearson
Education Limited.
ISBN 0-13-L24941-X
Capa: Paola Manica
Preparação do original: Kútia Michelle Lopes Aires
Leitura final: Julia Angst Coelho
Supervisão editorial: Monica Bailejo Canto
Editoração eletrônica: Laser House
Reservados todos os direitos de publicação, em língua portuguesa, à

ARTMED® EDITORA S.A.
Av. Jerônimo de Orneias, 670 - Santana
90040-340 Porto Alegre RS
Fone (51) 3027-7000 Fax (51) 3027-7070
É proibida a duplicação ou reprodução deste volume, no todo ou em parte,

sob quaisquer formas ou por quaisquer meios (eletrônico, mecânico, gravação,
fotocópia, distribuição na Web e outros), sem permissão expressa da Editora.
SÃO PAULO
Av. Angélica, 1.091 - Higienópolis
01227-100 São Paulo SP
F o n e (11)3665-1100 F a x ( I I ) 3667-1333
SAC 0800 703-3444
IMPRESSO NO BRASIL
PRINTED IN BRAZIL
Christine dedica este livro a J, Johnstone, pelo amor e apoio nos últimos 18
anos, E também para Heike e Heinz Ka rstens por seu carinhoso apoio.
John dedica este livro para Lisa, Issy, Ollie e Arsenal. Obrigado a vocês
por manter o sorriso em. meu rosto.
Agradecimentos
Gostaríamos de agradecer a valiosa contribuição feita às duas edições anteriores do

Estatística sem matemática para psicologia pela equipe do curso de psicologia da Open Uni
versity Psychology e particularmente por Martin Le Voi e Jarrod Hollis. Agradecimentos são
também devidos a Elizabeth Attree, Lisa Heavey. Joan Painter, Mary Fox e Katja Lippert.
Somos gratos a John Todman pelas informações sobre projetos pré e pós-teste e à Barbara
Alexander por nos fornecer os dados originais utilizados no Capítulo 12.
Gostaríamos de agradecer, ainda, as seguintes pessoas por suas contribuições para a ter
ceira edição deste livro: Aiden P., Brian Everitt, Dr. Chong Ho (Alex) Yu e aos revisores
anônimos que gastaram seu tempo nos fornecendo um retorno de grande utilidade.
Christine P. Dancey
John Reidy
Agradecimentos do Editor
Somos gratos às seguintes instituições pela permissão de reprodução de material prote
gido por direitos autorais:
À SPSS pela utilização das imagens do programa. O SPSS é uma marca registrada e os
nomes de outros produtos são propriedades da SPSS Inc.: aos editores Lawrence Erlbaum
Associados pela tabela da página 223 reproduzida de Statistical Power fo r Behavioural Scien
ces, segunda edição, de J. Cohen, 1988. A Sage Publications pela Tabela 6.4 reproduzida do
artigo “Denial of depression as an independent correlate of coronary artery disease” de M. W.
Ketterer e colaboradores, publicado no Journal o f Health Psychology, v. 1. n. 1. de 1996. A
Taylor & Francis Ltda. pela Tabela 7.1 reproduzida do artigo de Maclean e colaboradores, de
2000, publicado no Journal o f Reproductive and Infant Psychology. \. 18. n. 2, p. 153-162. A
Sociedade Britânica de Psicologia e ao autor S. Golombok pela Tabela 8.9 retirada do artigo
“The role of coping strategies in protecting individuals against long-term tranquilizer” publi
cado no British Journal o f Medical Psychology, v. 69. n. 2. p. 101-15 em 1996. A Elsevier
pela Tabela 9.6 reproduzida do artigo “Eating attitudes and the irritable bowel syndrome” de
Sullivan e outros e publicado no GeneraI Hospital Psychiatiy. v. 19 p. 62-4 em 1997, A So
ciedade Britânica de Psicologia e a M. R. Kebbell pela Tabela 9.9 reimpressa do artigo “The
influence of item difficulty on the relationship between eyewitness confidence and accuracy”
publicado no British Journal o f Psychology, v. 87, p. 653-62 em 1996. A Taylor & Francis
Ltda. pela Tabela 11.3 reproduzida do artigo publicado no Psychology and Health, v. 12. n.
12, p. 265-275 de Emery e colaboradores em 1997. À Elsevier Inc. pela tabela da página 437
reproduzida do artigo publicado no Psychosomatic Research, v. 45, n. 2, p. 171-178 de Tang
e outros em 1998. A Taylor & Francis Ltda. pela Tabela 15.4 reproduzida do artigo publicado
no Psychology, Health, and Medicine, v, 7, n. 1, p. 99-112 de Sher e colaboradores em 1996.
A Sage Publications pela Tabela 15.7 reproduzida do artigo "An academic detailing interven
tion to decrease esposure to HIV infection among health-care workers”, publicado no Journal
viíi Agradecimentos
o f Health Psychology, v. 1, n. 4 de Treloan e colaboradores em 1996. A Blackwell Publishing

Ltda., pelo poema ‘T he problem, the implications ”, de Robert Rosenthal, retirado do artigo
“Cumulating Psychology: an apreciation", de Donald T. Campell, publicado no Psychologi
cal Science, v. 2 de 1991. The Guardian Services Limited, por conteúdos do “Labour Website
Spin Like Orwell’s 1984”, de David Walker, publicado no The Guardian de 08 de outubro de
2002 .
Em alguns casos não conseguimos determinar o proprietário do material protegido por
direitos autorais, e apreciaríamos qualquer informação que tornasse isto possível.
Prefácio à Primeira Edição
Escrevemos este livro primeiramente para nossos alunos, muitos dos quais não gostam de
matemática e não conseguem entender porque precisam aprender fórmulas quando existem
programas de computador para fazer isto. Eles não foram convencidos pelo argumento de que
os cálculos realizados servem para dar-lhes um maior entendimento do teste, aliás, nem nós.
Nós queremos que eles tenham um entendimento conceituai da estatística e que gostem da
análise de dados. Durante a última década tivemos que adaptar nosso ensino a grandes gru
pos, nos quais uma boa parte das pessoas não tinha um treinamento formal em matemática.
Encontramos dificuldade para recomendar a esses alunos alguns dos livros didáticos tradicio
nais de estatística. Estes textos estavam cheios de formulas matemáticas e eram vistos pelos
estudantes como difíceis ou chatos, ou então, forneciam meras “receitas”, isto é, mostravam
apenas como fazer os cálculos sem fornecer um entendimento conceituai de estatística.
Outro problema que tivemos ao recomendar livros-texto de estatística foi a grande
dependência dos valores probabilísticos para a interpretação dos resultados. Encontramos di
ficuldades para convencê-los a levar em consideração o tamanho do efeito e os intervalos de
confiança quando os textos disponíveis não faziam considerações sobre testes de hipóteses,
mas simplesmente recomendavam que p < 0,05 é significativo e que p > 0,05 não é! Espera
mos que com este livro os leitores fiquem mais atentos a tais assuntos.
Queremos ainda mostrar aos alunos como incorporar os resultados das suas análises nos
relatórios laboratoriais e como interpretar a seção de resultados de artigos de periódicos. Até
recentemente os livros de estatística ignoravam este aspecto da análise de dados. E claro, en
tendemos que a forma que escrevemos nosso exemplo “resultados da seção” será diferente da
forma que outros psicólogos o fariam. Os estudantes podem utilizar esta seção como forma
de ganhar confiança para escrever seus próprios resultados e esperamos que eles o façam com
o desenvolvimento dos seus cursos.
Tentamos simplificar conceitos complexos, e, algumas vezes, bastante complexos. En
tretanto, ao simplificar existe uma perda de acurácia. Estamos cientes disso e tentamos ser
cuidadosos ao máximo possível, enquanto tentamos dar, também, a explicação mais simples
possível. Além disso, estamos cientes de que os estudantes não utilizam o SPSS em suas
análises de dados. O SPSS, no entanto, é o pacote estatístico mais popular para as ciências so
ciais e é por isso que o texto está tão ligado a esse programa. Os estudantes que não utilizam
esse pacote deverão achar o livro útil de qualquer modo.
Esperamos que os estudantes que leiam o livro não apenas aprendam com ele, mas tam
bém apreciem nossas explicações e exemplos.
Prefácio à Segunda Edição
Desde que escrevemos a primeira edição de Estatística sem matemática para psicologia
tivemos muito retomo, tanto em relação ao conteúdo quanto ao estilo e projeto do livro: como
resultado desse retorno, revisamos e reescrevemos seções substanciais deste texto. Simpli
ficamos e esclarecemos partes do material e acrescentamos também novos conteúdos. Um
novo capítulo introduzindo Análise de Fatores foi adicionado e a estatística nâo-paramétrica
também ganhou um capítulo próprio. A revisão do livro proporcionou-nos a oportunidade
de corrigir alguns dos erros tipográficos que se infiltraram na primeira edição. Esta edição
foi atualizada para o uso do SPSSPW versão 10. Esperamos que você aprecie esta edição do
Estatística sem matemática para psicologia.
Os conjuntos de dados utilizados pelos autores no texto podem ser acessados no endere
ço: www.booksites.net/dancey.
Prefácio à Terceira Edição
Desde a publicação da segunda edição do Estatística sem matemática para psicologia,

tivemos um retorno bastante útil dos leitores, sendo alguns anônimos, outros não. Boa parte
desse retorno tem sido positiva, e isto tem ajudado a confirmar nossa crença de que este é um
livro que apresenta um apelo bastante amplo. Um livro que objetiva ser simples, é claro, não
agrada a todos, mas mesmo o retorno negativo tem servido de auxílio para tornar mais claras
explicações de alguns dos conceitos mais complicados. Gostaríamos de agradecer a todos
esses leitores pelos seus comentários: percebemos que o texto teve melhorias por força dos
comentários de pessoas que lecionam estatística. Algumas sugestões que recebemos foram
para aumentar a aeurácia matemática. Nós levamos em conta esses conselhos sempre que
possível, mas em alguns casos seguir as sugestões significaria aumentar a complexidade das
explicações, o que fugiria ao objetivo principal do texto. Em alguns casos, fornecemos refe
rências para outras fontes, e, em outros, adicionamos notas de rodapé. É sempre conveniente
lembrar que alguma precisão matemática pode ser perdida quando são dadas explicações
conceituais ou quando se simplifica conteúdos mais complicados. Esperamos ter conseguido
um equilíbrio razoável entre os dois propósitos. A forma de melhorar o entendimento das se
ções onde os leitores sugeriram melhor clareza foi incluir exemplos atualizados da literatura
da área da psicologia em conjunto com questões de múltipla escolha ao final de cada capí
tulo. Esta edição foi, ainda, atualizada com o SPSSPW versões 11 e 12; contudo, ela ainda é
adequada para uso se você estiver utilizando a versão 10 do programa. Esperamos que você
ache útil esta terceira edição do Estatística sem matemática para psicologia e aumente seu
encantamento com a estatística e com a pesquisa em psicologia.
Sumário
Panoram a do capítulo 23
.1 Por que ensinar estatística sem fórmulas matemáticas? 23

.2 Variáveis 24
.3 Planejamento da pesquisa 29
.4 Delineamentos entre e dentre participantes 36
SPSS para Windows (SPSSPW) 39
Resumo 51
Exercícios para o SPSSPW 52
Questões de múltipla escolha 53
Referências 54
Panorama do capítulo 56
2.1 Amostras e populações 56

2.2 Medidas de tendência central 58
2.3 Erro amostrai 63
SPSSPW: obtenção de medidas de tendência central 66
2.4 Descrição gráfica dos dados 70
SPSSPW: geração de descritivas gráficas 80
2.5 Diagramas de dispersão 82
SPSSPW: geração de diagramas de dispersão 84
2.6 Erro de amostragem e relacionamento entre variáveis 86
2.7 Distribuição normal 88
2.8 Variação ou dispersão de distribuições 90
SPSSPW: obtenção de medidas de variação 93
2.9 Outras características das distribuições 95
2.10 Distribuições não-normais 95
SPSSPW: geração de curvas normais e histogramas 101
2.11 Obtenção de estatísticas descritivas 102
14 Sumário
Resumo 103
Referências 107
...................................... > : . * .
3.1 Probabilidade 108

3.2 Distribuição normal padrão 111
3.3 Aplicação da probabilidade à pesquisa 118
3.4 Distribuições amostrais 118
3.5 Intervalos de confiança e erro padrão 121
SPSSPW: obtenção de intervalos de confiança 129

3.6 Diagramas de barras de erros 131
3.7 Sobreposição de intervalos de confiança 132
SPSSPW: geração de diagramas de barras de erro 134
3.8 Intervalos de confiança e outras estatísticas 137
SPSSPW': uso do instrutor de resultados {Resuhs Ccrnch) 137
Resumo 139
Referências 142
4.1 Outra forma de aplicar probabilidades à pesquisa: teste de hipóteses 143

4.2 Hipótese nula 148
4.3 Lógica dos testes de hipóteses 149
4.4 Nível de significâneia 151
4.5 Significâneia estatística 152
4.6 Interpretação correta do valor p 154
4.7 Testes estatísticos 155
4.8 Erro do Tipo 1 157
4.9 Erro do Tipo II 158
4.10 Por que estabe lecer a = 0.05 ? 160
4.11 Testes unilaterais e bilaterais 160
4.12 Hipóteses subjacentes ao uso dos testes estatísticos 165
SPSSPW: conselheiro estatístico (Stutistics Coach) 169
Resumo 173
Sumar.o 15

Referências l?^
is®-"'"--.
5.1 Correlações bivariadas 178

SPSSPW; coiTelações bivariadas - o rd e Pearson 192
SPSSPW: obtenção uma matriz de diagramas de dispersão 201
5.2 Correlações de primeira e segunda ordens 205
SPSSPW: correlações parciais.rde Pearson 206
5.3 Padrões de correlações 212
Resumo 213
Referências 218
m m
6.1 Análise de duas condições 220

SPSSPW: para um teste f independente 231
SPSSPW: delineamento de medidas repetidas para duas amostras:
leste t pareado 238
Resumo 244
Referências 248
IjllSSjPBst
7.1 Critérios de significância 250

7.2 Tamanho do efeito 251
7.3 Poder 2<p
7.4 Fatores que influenciam o poder 253
7S Cálculo do poder 258
7.6 Intervalos de confiança 261
Resumo 262
Referências 266
16 Sumário
8 .1 Freqüências (dados categóricos) 267

8.2 Variável ou teste cie aderência 269
SPSSPW: yj de uma variável 272
SPSSPW: y de urna variável, utilizando freqüências diferentes das
esperadas sob a hipótese nula 277
8.3 Teste %' para independência: 2 x 2 281
SPSSPW: X 2 x 2 284
8.4 Teste de independência yj: r x c 290
Resumo 294
Exercícios para o SPSSPW' 294
Referências 299
9 .1 Visualização do delineamento 301

9.2 Significado da análise de variância 302
SPSSPW': execução da A NOVA de uma classificação 307
9.3 Estatísticas descritivas 309
9.4 Comparações planejadas 3 11
9.5 Controle para múltiplos testes 3 11
9.6 Testes posf hoc 3I2
9.7 ANOVA de medidas repetidas 3 15
SPSSPW': instruções para a ANOVA de medidas repetidas 3 17
Resumo 323
Referências 328
10.1 Introdução 329

10.2 Fontes de variação 330
10.3 Delineamentos apropriados para uma ANOVA fatorial 331
10.4 Terminologia da ANOVA 333
Sum ário 17
10.5 Duas variáveis independentes entre participantes 334

SPSSPW: análise de dois fatores entre participantes 349
10.6 Duas variáveis dentre participantes 356
SPSSPW: ANOVA dentre participantes com dois fatores 364
10.7 Uma variável entre e outra dentre participantes 367
SPSSPW: ANOVA com um fator entre participantes e um dentre participantes 374
Resumo 375
Referências 380
11.1 Propósito da análise de regressão 381

SPSSPW: traçando a linha de melhor aderência 385
SPSSPW: análise de regressão linear 398
1 1.2 Regressão múltipla 405
Resumo 415
Referências 419
12.1 Qual é o objetivo da análise de fatores? 420

12.2 Principais tipos de análise de fatores 422
12.3 Uso da análise de fatores na psicometria 423
12.4 Visualização de fatores 424
12.5 O conceito de análise de fatores 425
12.6 Denominação de fatores 427
12.7 Cargas de variáveis em fatores 427
12.8 Matriz das correlações 429
12.9 Matrizes com rotação e sem rotação 431
12.10 Plotagem das variáveis no espaço dos fatores 432
12.11 Rotação da matriz 434
12.12 Execução da análise de fatores 435
12.13 Uso de fatores ou componentes em outras análises 441
12.14 Significado das cargas negativas 442
SPSSPW: análise de fatores - análise de componentes principais 443
Resumo 452
Referências 455
18 Sumário
-v. ' - , . ~ >'N; '■=. ■. M<H^:.:'-^-l»tg>.
Panoram a do capítulo 456
SPSSPW: obtenção de um diagrama das linhas deregressão 458

13.1 Grupos preexistentes 463
13.2 Delineamentos pré e pós-testes 470
SPSSPW7: obtenção de resultados deuma ANCOVA 473
Resumo 482
Referências 486
14.1 Estatísticas multivariadas 487

14.2 Por que utilizar a análise multivariada de variância ? 488
14.3 Análise multivariada de variância 488
14.4 A lógica da M ANOVA 489
14.5 Condições da M ANOVA 491
14.6 Qual o valor F? 496
14.7 Post-hoc: análise de variáveis dependentes individualmente 497
14.8 Variáveis dependentes correlacionadas 499
14.9 Como relatar essas análises 500
SPSSPW: execução da MANOVA com uma variável independente entre
participantes e duas variáveis dependentes 502
14.10 Delineamentos dentre participantes 504
SPSSPW: uma variável independente dentre participantes e duas variáveis
dependentes 512
Resumo 515
Referências 523
15.1 Aternativas ao r de Pearson: o p de Spearman 525

SPSSPW: análise de correlação - o p de Spearman 525
Passeio Guiado pelo Livro e Site*
Panoram a dos ^-Caixas de

\ 1ÍC .
cap ítu lo s. Usta *% Estatística D escritiva
atividad es.
o que você deve \ L Fornece
entender ao final \ oportunidades
de cada capítulo. \ adicionais para
você testar sua
compreensão das
teorias e idéias
discutidas.
'; ' - ■ ■ Pontos de

' ■............ " ■ discussão.
......... ■.■ ' ■ Expiora
.. . ............ ■. . VVK.. diferentes idéias
ou teorias em
detalhe.
Exem plos da
literatu ra.
Enriquece as
teorias mostrando
outras áreas
de oesquisa ou
opinião
N. de R. N o endereço www.booksiies.nei/dancey. o leitor encontrará materiais para estudo, que incluem: Questões de múltipla escolha, que auxi
liam a testar a aprendizagem; arquivos de dados do SPSSPW: guia dc estudos: e ím k x com outros relevantes. C O N T EÚ D O EM INGLÊS.
Caixas de
cuidado. Ao-
longo do texto
servem de aviso
sobre possíveis
problemas ou
questões a serem
considerados.
■
■ ■‘ -■ — D iagram as e
' ' .......................... , .... • ..... . fig u ras. Servem
de auxilio ao
....................... .............. ^ / 5~ entendimento e à
fixação do texto.
' 7 ........•— •—
Captura de telas Exercícios com o

co m entadas. \ SPSSPW. Ao fina,
São dicas visuais de cada capitulo,
que ilustram fornecem uma
exemplos práticos. oportunidade
para testar a
aprendizagem.
Sum ários de fim „

de capítulo.
Permitem uma
revisão dos
pontos principais
de cada caoítulo.
Q uestões —----- ---- Referências.
de m últipla Fornecem opções
escolha. Ao fina de leituras
de cada capítulo, adicionais.
fornecem uma
oportunidade
para testar a
aprendizagem.
¿iquiwi éAUm |r Favofos Fenareniòà Q

- \ ■
Statistics Without Maths P r a tio e P, Dance*
for Psychology ' ' • Third edm on
ç3 » * * i* r I ; S a n a b l e s
I aaMrestsmrctt d esign
M uftipl«’ c h o ic e
•SP'»*» rfflta s e t s
Wwtoflrfc &
AjfoofiUt
Sytlafeti* M a n a g e r
Arquivos de
dados do
SPSSPW.
wnw
fiicjmvo £<M# Extor Ii rsvortos feriamenlat
'-• ' L, , '• " N I h->-

Statistics Without Maths Cnnsline P. Dancey
for Psychology • • • T h ird « f i b e r
i“ s o m e ilt in g t h a t n a
p r c c is io r i.
r v o m e t liin g th a t w e m u m e a s u r e .
r th e m a in fo c u s o f r e s e a r c h in s c ii?
Questões de
a ll o f t h e a b o v p .
escolha m últipla
■adirinnak
Variáveis e Projeto de Pesquisa
Panorama do capítulo
Na te n ta tiv a de e xp lica r co m o u tiliz a r e e n te n d e r e sta tístic a , ta lve z seja m e lh o r in icia r co m o

d e sta q u e dos p rin cip ais tó p ico s p ara o d e lin e a m e n to de um a p e sq u isa. D escreve rem o s, e n tã o ,
os asp e cto s m ais im p o rta n te s de um p rojeto de pesq u isa co m o o b jetivo de m o stra r co m o ele
in flu e n cia o uso da e s ta tístic a . A s sim , neste c a p ítu lo q u e re m o s e n sin a r a vo cê o se g u in te :
■ v ariáveis c o n tín u a s, d iscre tas e cate g ó rica s

■ v ariáveis d e p e n d e n te s e in d e p e n d e n te s
■ pro jeto s co rre la c io n a is, e xp e rim e n ta is e q u a se -e xp e rim e n ta is
■ pro jeto s e n tre e d e n tre p a rticip a n te s
1.1 Por que ensinar estatística sem fórmulas matemáticas?
A estatística como um conteúdo tende a despertar medo em corações e mentes de muitos es
tudantes de ciências sociais e em muitos palestrantes* também. Entender os conceitos estatísticos
não deve, no entanto, ser mais difícil do que compreender qualquer outro conceito teórico (por
exemplo, o conceito de inteligência). De fato, alguém poderia pensar que entender um conceito
bastante concreto tal como o de média aritmética seria mais fácil do que compreender o conceito
psicológico, bem mais vago, de “uma atitude”. Ainda assim, a cada ano, parece que a maioria
dos estudantes, que aparentemente percebem muitos conceitos não-estatísticos como um caso
consumado, lutam para entender estatística. No nosso modo de ver, muitas pessoas temem a
estatística porque os conceitos estão perdidos em meio às fórmulas matemáticas. Desta forma,
procuramos explicar a estatística de um modo conceitual, sem confundir os estudantes com
fórmulas matemáticas desnecessárias - isto é, desnecessárias hoje em dia, na era dos pacotes
computacionais. Se o estudante quer aprender estas fórmulas para melhorar o seu conhecimento,
que ponto de partida melhor do que um entendimento conceitual da estatística?
A estatística tende a ter uma má reputação, como ilustra a máxima de Disraeli**: “Existem
três tipos de mentiras: mentiras, mentiras deslavadas e estatísticas”. Entretanto, o problema
não é da estatística, mas sim da forma como ela é utilizada. Com freqüência, particularmente
na política, a estatística é utilizada fora de contexto. Esse problema é claramente ilustrado no
seguinte trecho extraído de um artigo publicado, em 2002, no Guardian***:
* N. de T. O termo no original é lecturer que é uma categoria de professor nas universidades inglesas.
** N. de T. Benjamin Disraeli (1804-1881), primeiro ministro britânico em 1868 e 1874 a 1880.
*** N. de T. Jornal britânico fundado em Manchester em 1821.
24 Christine P. Dancey & John Reidy
O site do partido gira como o 1984, de Orwell*

Por D avid Walker
O partido dos trabalhadores tem sistematicamente manipulado dados em seu site para m os
trar melhorias na saúde, escolaridade e outros serviços, de acordo com um estudo não-publicado.
Essa prática fo i iniciada no correr das eleições do último ano e tem continuado desde então, com
o partido dos trabalhadores apresentando ao público estatísticas tendenciosas de crimes e desem
prego, bem como de gastos com escolas e hospitais.
Os números têm sido manipulados para fo rn ecer uma m elhor impressão sobre o desempenho
do partido em nível local.
Em um artigo de pesquisa circulando entre acadêmicos, após ter sido apresentado recente
m ente em uma conferência de uma associação de estudos políticos, quatro renomados geógrafos
se detiveram nos números publicados no site para áreas locais. Liderados pelos professores Danny
Dorling da Universidade de Leeds e p o r R on Johnston da Universidade de Bristol, a equipe verifi
cou que o partido consistentemente ajustou e manipulou dados sem conhecê-los.
Em vez de fo rn ecer a impressão de uma série de meias verdades ocasionais, está começando
a parecer que este suprimento de valores distorcidos é uma estratégia de longo prazo do partido,
disse o jornal.
O webmaster do partido é comparado a Winston Smith, personagem do livro 1984 de George
Orwel, que passava o seu tempo no ministério do abastecimento reescrevendo a história. Nenhum
número individualmente é fa lso no sentido estrito da palavra. É a form a como são agrupados - m is
turando e emparelhando áreas e anos para dar a impressão de que as coisas melhoraram - que não
é sincera como um todo.
Por meio do código postal, os visitantes do site do partido podem , ao que parece, acessar
informações detalhadas sobre o local onde vivem. No entanto, alguns dos números apresentados
referem-se ao Reino Unido ou à Inglaterra como um todo, outros a regiões inteiras, alguns à área
de uma cidade ou município, mas muitos poucos a uma área específica e muito menos à rua onde
as pessoas vivem.
Os visitantes do site são informados sobre o aumento de enfermeiras sem ser dito que os
números se referem às regiões do N H S em vez de hospitais específicos. M elhorias na educação
são anunciadas sem que o público seja informado que se referem a toda uma área educacional - a
qual pode conter até 20 regiões. As taxas de criminalidade no site não são específicas ao código
postal, mas a toda uma área policial, algumas muito grandes ou até mesmo à Inglaterra e ao País
de Gales como um todo.
(Extraído do Guardian de 8 de outubro de 2002)1
O estudo mencionado nesta reportagem foi de fato publicado em 2002 no The Political
Quarterly (Dorling et al., 2002).
Este artigo ilustra claramente a importância de se colocar estatísticas em um contexto
correto. Se for dito a você, por exemplo, que a altura média de um adulto é 173 cm, isto pode
ser correto para um homem brasileiro, mas não necessariamente para um homem de uma
tribo africana de pigmeus, na qual a altura média pode ser tão baixa quanto 145 cm.
1.2 Variáveis
Explicamos um aspecto muito importante das estatísticas: elas só tem sentido em um

contexto. Mas o que é que a estatística realmente faz? Essencialmente, a estatística nos for
nece informações sobre fatores que podemos medir. Na pesquisa, as coisas que medimos são
denominadas variáveis.
* N. de T. George Orwell (1903-1950), escritor inglês.

** N. de T. NHS (National Health Service) - Serviço Nacional de Saúde.
1Veja página 55 do Guardian.
Estatística sem Matemática para Psicologia 25
As variáveis são o foco principal da pesquisa em ciências. Uma variável é simplesmente

algo que pode variar, isto é, pode assumir valores ou categorias diferentes. Alguns exemplos
de variáveis são gênero (sexo), velocidade de digitação, velocidade máxima de um carro,
número de sintomas registrados de uma doença, temperatura, público em um festival de
rock, nível de ansiedade, número de gols em uma partida de futebol, inteligência, número
de encontros sociais ao levar o cachorro para passear, quantidade de violência na televisão,
ocupação e cores favoritas. Estes são exemplos de itens que se pode medir e registrar e que
variam de uma situação ou pessoa para outra.
Por que estamos interessados em variáveis? Geralmente nos interessamos por variáveis
porque queremos entender o motivo da sua variação. De forma a compreender esta varia
ção, devemos ter capacidade de medir e registrar as alterações nestas variáveis em qualquer
situação dada.
1.2.1 Características das variáveis

Pode ser notado nos exemplos de variáveis dados que elas apresentam diferentes carac
terísticas. Enquanto se pode medir a temperatura em termos de graus Celsius ou Fahrenheit e
atribuir um valor ao resultado, não se pode fazer o mesmo com o tipo de ocupação, por exem
plo. Isso representa uma característica importante das variáveis: o quão precisamente podem
ser avaliadas. No topo, mais preciso, da escala uma variável é dita contínua, ou seja, ela pode
assumir qualquer valor em um intervalo dado. Dito de outra forma, a variável não varia em
passos discretos. Um exemplo de variável contínua é a temperatura. Ela é contínua porque se
pode medir a temperatura, digamos, como sendo 40 oC ou, então, se pode medi-la de forma
mais precisa como 40,2558 oC. Outro exemplo, menos óbvio, é a quantidade de violência na
televisão. Pode-se medi-la em termos da quantidade de tempo que aparece na tela por dia. Se
avaliada desta forma, isto é, em termos de tempo, a variável pode assumir qualquer valor em
termos de segundos ou partes de segundo, como 1000 s ou 1000,1235672 s por dia. A única
limitação na precisão da medida de tal tipo de variável é a acurácia do equipamento de me
dida. Com variáveis contínuas, existe a hipótese implícita de que seja contínua mesmo que a
forma de medi-la não o seja. Dos exemplos fornecidos anteriormente, temperatura, nível de
ansiedade, velocidade máxima de um carro, velocidade de digitação e inteligência podem ser
consideradas contínuas, enquanto as demais não (veja Tabela 1.1).
Uma variável pode, também, ser discreta, ou seja, ela pode assumir somente valores
discretos dentro de um determinado intervalo. Um exemplo deste tipo de variável é o nú
mero de sintomas observados de uma doença que uma pessoa possui. Isso somente pode ser
Tabela 1.1 Exemplos de variáveis contínuas, discretas e categóricas
Contínuas Discretas Categóricas
■ Temperatura ■ Número de sintomas registrados de ■ Gênero (sexo)

uma doença
■ Velocidade máxima de um carro ■ Número de carros possuídos ■ Ocupação
■ Velocidade de digitação ■ Número de gols em uma partida de ■ Cor favorita
futebol
■ Inteligência ■ Número de encontros sociais enquanto ■ Tipo de restaurante
passeia com o cachorro
■ Nível de ansiedade ■ Participantes de um festival de rock
■ Número de filhos de uma família
registrado em termos de presença ou não do sintoma. Outro exemplo seria se escolhêssemos

medir a quantidade de violência na televisão de acordo com o número de incidentes violentos
por semana. Não podemos medir esta variável em termos de frações de incidentes violentos
por semana. Assim, o número de incidentes violentos semanais na televisão é uma variável
discreta. Dos exemplos dados anteriormente, as variáveis discretas mais óbvias são o número
de “sintomas registrados de uma doença”, o de “encontros sociais enquanto passeia com o
cão”, o de “freqüentadores de um festival de rock”, o de “carros possuídos”, o de “filhos por
família” e o de “gols em uma partida de futebol”.
Quando estudamos variáveis discretas e contínuas, existe o perigo de confundir a variável
subjacente - a variável propriamente dita - com a forma de mensurá-la. Uma variável pode
ser teoricamente contínua, mas a forma de medi-la é sempre discreta, não importa o grau
de precisão da medida utilizada. Poderíamos medir a ansiedade (uma variável teoricamente
contínua) utilizando um questionário (p. ex., o Inventário das Características e Estados da
Ansiedade,* Spielberger et al., 1983) no qual o escore total no questionário fornece uma
indicação do nível de ansiedade de uma pessoa. O escore total pode aumentar somente em
unidades, digamos de 38 para 39 ou de 61 para 62. Assim, a forma de mensuração da ansie
dade é discreta, enquanto a variável envolvida é de fato contínua.
Ademais, na análise de variáveis discretas, é comum tratá-las como contínuas. Muitos dos
testes estatísticos usados indicam que estamos tratando com variáveis contínuas. Freqüente
mente, quando uma variável discreta pode assumir um grande número de valores dentro de
certo intervalo (p. ex., público de um festival de rock pesado), pode, para efeitos práticos, ser
tratada como se fosse contínua na utilização do teste estatístico.
Outro tipo de variável é a categórica: aquela em que os valores assumidos são catego
rias. Um bom exemplo é gênero, que pode ter apenas dois valores: masculino e feminino.
Variáveis categóricas podem, algumas vezes, apresentar muitos valores possíveis, como o
tipo de ocupação (p. ex., juiz, professor, advogado, engenheiro, etc.). Quando lidamos com
dados categóricos temos um grande número de variáveis que gostaríamos de investigar. Po
deríamos, se desejássemos, categorizar pessoas com base em “se elas comeram ou não bolo
de chocolate às 6h30min desta manhã’ ou talvez (ou pouco mais bizarro) ‘se elas deram ou
não contribuições ao time de futebol Manchester United”. Os únicos exemplos óbvios de
variáveis categóricas apresentadas na lista do início desta seção são ocupação, gênero e cor
favorita.
Tente se assegurar de que você entendeu os diferentes tipos de variáveis que está medin
do, pois isto é importante quando se decidir como analisar os dados.
1.2.2 Dicotomização de variáveis contínuas e discretas

Existem casos em que os pesquisadores convertem variáveis discretas e contínuas em
variáveis categóricas. Por exemplo, poderíamos querer comparar a habilidade espacial de
pessoas altas e baixas. Podemos fazer isto comparando pessoas que são mais altas do que
193 cm com aquelas que são mais baixas do que 147 cm em um teste de habilidade espacial.
Desta maneira, escolhemos pontos na escala contínua (altura) e decidimos comparar aqueles
participantes que estão acima e abaixo destes pontos (veja Figura 1.1).
Outro exemplo poderia ser a comparação da habilidade de memória de pessoas ansiosas
e não-ansiosas. Pode-se medir os níveis de ansiedade utilizando um questionário, isto é, uma
* N. de T. STAI (State-Trait Anxiety Inventory).

Valores da variável categórica
A tu ra (cm
Alto — Baixo
Valores da variável contínua
Ilu stração da co n ve rsã o de variáveis c o n tín u a s em c a te g ó rica s.
variável contínua medida em uma escala discreta. Por exemplo, a escala hospitalar de ansie
dade e depressão apresenta valores que variam de 0 a 21. Para convertê-la em uma variável
categórica, iremos simplesmente comparar os escores superiores a certo valor (p. ex., diga
mos, 11) com aqueles abaixo deste mesmo valor.
Essa dicotomização (divisão em duas categoriais) de variáveis discretas e contínuas é
comum na psicologia e permite que se encontrem diferenças entre grupos que podem estar
nos extremos de variáveis discretas ou contínuas, por exemplo, pessoas altas e baixas. No
entanto, não recomendamos tal prática, pois ela reduz a sensibilidade da análise estatística.
Existe uma boa discussão de tais problemas em Streiner (2002) e Maxwell e Delaney (1993).
Mencionamos isto aqui para que você possa estar ciente do que ocorre na literatura científica
e, assim, entenda o que o pesquisador fez.
PONTO DE DISCUSSÃO:
DICOTOMIZAÇÃO DE VARIÁVEIS CONTÍNUAS
Por que os pesquisadores dicotomizam variáveis? Streiner (2002) ressalta o fato de que
muitas decisões em psicologia, psiquiatria e medicina são binárias. Neste tipo de decisão,
têm-se apenas duas escolhas, tais como se a pessoa apresenta ou não problema mental, se
tem ou não uma determinada doença, se precisa ou não ser hospitalizada, ou se deve ou não
receber alta do hospital. O argumento utilizado é que, se estes profissionais precisam tomar
decisões binárias, então é legítimo investigar estes tipos de variáveis. Tal raciocínio é utiliza
do para dar suporte à prática disseminada de dicotomizar variáveis contínuas.
Streiner argumenta que não precisamos ver as decisões que os médicos tomam como
binárias. Ele sugere que seria melhor pensar em uma doença mental, por exemplo, como um
contínuo. Quantos mais sintomas alguém apresenta mais afetado está. Devemos medir tais
constructos de forma contínua, e não dicotomizá-los. Assim, em vez de se utilizar questio

nários para categorizar pessoas, poderíamos usá-los para obter uma medida na qual estejam
em um contínuo. Tal informação pode então ser utilizada na decisão de como tratar certas
pessoas ou de alguma outra forma.
Um exemplo pode ilustrar melhor a dicotomização. Foi sugerido anteriormente que é
possível categorizar pessoas em ansiosas e não-ansiosas com base em escores obtidos num
questionário. Pesquisadores investigando ansiedade utilizam regularmente questionários des
ta forma. Aqueles participantes que apresentam altos escores são classificados como de alta
ansiedade, enquanto os que têm pouca pontuação são classificados como de baixa ansiedade.
O método de divisão pela mediana é muitas vezes utilizado com este propósito, categorizando
os que ficaram acima da mediana como ansiosos e os que ficaram abaixo como não-ansiosos
(p. ex., Egloff e Hock, 2003).
Streiner argumenta que a prática de dicotomizar variáveis contínuas tende a diminuir
o poder da pesquisa (o poder de um teste será tratado nos Capítulos 4 e 7). A razão disto é
que se perdem muitas informações sobre os participantes. Por exemplo, suponha que duas
pessoas tenham os escores de 20 e 38 em um teste de ansiedade e que, quando a variável for
dicotomizada, eles serão contados como de baixa ansiedade (os dois estão abaixo da media
na). Em qualquer análise subseqüente baseada na categorização feita, ambos serão tratados
como se possuíssem o mesmo nível de ansiedade, isto é, serão considerados não-ansiosos.
Entretanto, de acordo com os escores originais, o nível de ansiedade entre eles é bastante
diferente. Tratar estas duas pessoas como idênticas em termos de níveis de ansiedade não pa
rece fazer sentido. Seria mais sensato tentar incluir os valores reais de ansiedade em qualquer
análise estatística realizada.
Além disso, pode-se observar uma diferença muito maior entre os níveis de ansiedade das
duas pessoas classificadas como não-ansiosas do que entre uma classificada como ansiosa e
a outra não. Por exemplo, suponha que a mediana fosse 39, então todos aqueles acima deste
escore seriam classificados como ansiosos e todos os abaixo como não-ansiosos. Pode-se ver
aqui que uma pessoa não-ansiosa que tenha um escore de 38 tem muito mais em comum com
uma ansiosa cujo escore seja 41 do que com outra não-ansiosa cujo escore seja 20. Ainda em
qualquer análise posterior, os participantes com escores de 20 e 38 são classificados como
idênticos em termos de ansiedade, e estes são classificados como diferentes de uma pessoa
que tenha um escore de 41. Isso não faz sentido.
Streiner ainda ressalta pesquisas que mostram que análises utilizando variáveis dicotômi
cas apresentam aproximadamente 67% da eficiência das que utilizam as variáveis contínuas
ou discretas originais. Isso é uma grande perda de sensibilidade do estudo. Significa que
você tem apenas 67% de probabilidade de detectar relacionamentos entre variáveis se estiver
utilizando variáveis contínuas ou discretas dicotomizadas. Isso é uma séria desvantagem na
condução de uma pesquisa. Além do mais, a perda de poder não é o único problema que surge
quando variáveis são dicotomizadas. Maxwell e Delaney (1993) mostraram que esta prática
pode levar a achados espúrios na análise estatística.
Conseqüentemente, aconselhamos a não dicotomizar variáveis contínuas.
Atividade 1.1
Q u ais das se g u in te s variáveis são c a te g ó rica s, d iscretas ou c o n tín u a s?
■ V e lo cid a d e do ven to
■ Tip o s de títu lo s o fe re cid o s por um a u n ive rsid ad e
■ Nível de extro versão
■ M arcas de carro s
■ Tim e s de fu te b o l
■ N úm ero de peças d e xa d re z c a p tu ra d a s em um jo g o
■ Peso de p a n d a s g ig an tes
■ N úm ero de p in tu ra s e xp o stas em g a le ria s de arte
A s resp o stas co rre tas p o d em ser e n c o n tra d a s no fin a l do livro.
1.3 Planejamento da pesquisa
Existem muitas técnicas estatísticas que podem ser usadas para se analisar dados cole
tados em uma pesquisa. Neste livro serão apresentadas algumas das mais utilizadas. Muitas
destas técnicas apresentam fórmulas matemáticas complexas para calcular as estatísticas en
volvidas. Estas fórmulas não serão abordadas, pois preferimos fornecer ajuda para que você
entenda as técnicas a partir de um ponto de vista conceitual.
Um dos principais fatores na determinação de qual teste estatístico será utilizado para
analisar os dados é a forma como o estudo foi projetado ou planejado. Existem várias manei
ras de projetar ou planejar um estudo, e a forma como este é feito exercerá grande influência
nos tipos de procedimentos estatísticos disponíveis. Algumas vezes, os pesquisadores querem
observar diferenças entre dois grupos de participantes em uma variável particular. Em outra
situação pode-se querer verificar se duas variáveis apresentam algum tipo de relacionamento.
Um exemplo de procura de diferenças entre dois grupos pode ser a pesquisa relatada por Ni
cholas e Collis (2000). No estudo, eles compararam o número de encontros sociais que pessoas
tinham enquanto levavam o cão para passear com a quantidade de encontros sociais sem o cão.
Constataram que caminhar com o cão aumenta o número de encontros sociais. Um exemplo de
pesquisa correlacional foi relatado por Walsh e Ugumba-Agwunobi (2002). Neste estudo, entre
outras coisas, investigou-se o relacionamento entre ansiedade causada pelo estudo da estatís
tica e a procrastinação. Os autores verificaram que existem relações entre vários componentes
da ansiedade causada pelo estudo da estatística (doravante denominada ansiedade estatística)
(p. ex., temor do professor de estatística) e a procrastinação. Os testes estatísticos que seriam
utilizados nestes exemplos são denominados de testes de diferenças e testes correlacionais,
respectivamente. A forma de planejar o estudo influenciará a decisão de qual destes testes será
utilizado. Nas seções seguintes serão apresentadas várias maneiras de se planejar estudos e os
tipos de testes disponíveis para que o pesquisador analise os resultados.
1.3.1 Variáveis de confusão*

Caso se pense no exemplo da caminhada com o cão, percebe-se que existem outros fatores,
além da posse do cachorro, que podem afetar o número de encontros sociais das pessoas enquan
to caminham. Alguns destes fatores incluem a timidez de quem está caminhando, a atratividade,
o gênero, a raça do cão e diversas outras variáveis. Todos são fatores que o pesquisador não levou
em consideração, mas que podem ter influenciado a interação social. Esses fatores são denomi
nados variáveis de confusão. Em qualquer situação de pesquisa, quer em química, física, quer
em psicologia, deve-se levar em conta a influência destas variáveis. Se elas forem negligencia
das, as conclusões obtidas do estudo podem não ser confiáveis. Assim, no estudo da caminhada
com o cachorro, se as variáveis de confusão não são controladas, não é possível dizer, ao certo,
que as diferenças obtidas se devem à propriedade do cachorro. As diferenças podem ocorrer por
quaisquer outras combinações das variáveis mencionadas. A principal razão para se fazer pes
quisa em condições de laboratório é tentar manter o controle sobre as variáveis de confusão tanto
quanto possível. Poderá ser notado que muitas das questões de pesquisa abordadas neste capítulo
foram projetadas com o objetivo de reduzir a influência das variáveis de confusão.
Você deve estar ciente de que para cada variável medida existirão várias outras que po
dem estar relacionadas a ela (veja Figura 1.2, por exemplo). Quando um estudo como o da
caminhada com o cachorro é conduzido, não é possível termos certeza se é a existência ou
não do cão responsável pelas diferenças na interação social. Assim, precisamos tentar elimi
nar as outras variáveis (as de confusão) como possíveis razões para as alterações observadas.
Fazemos isto tentando controlar estas variáveis, por exemplo, tentar combinar o máximo
possível os participantes com e sem o cão nos aspectos timidez, atratividade e gênero. Ainda,
pode-se assegurar que todos os participantes façam a caminhada com o mesmo tipo de cão e
que caminhem nos mesmos horários e dias da semana. Uma vez que se tenha controlado estas
variáveis, então é possível se ter mais confiança na conclusão de que caminhar com um cão
exerce influência sobre o número de interações sociais que uma pessoa terá.
Ilu stração das variáveis q u e p o d em in flu e n c ia r o n ú m e ro de in te ra çõ e s so ciais de um a

p e sso a .
* N. de T. São também utilizados os termos variável de confundimento ou confundidora.

1.3.2 Delineamentos correlacionais

Expusemos que o principal objetivo da ciência é o entendimento das variáveis. Mais
especificamente, desejamos entender como e por que certas variáveis estão relacionadas. Tal
vez a forma mais simples de examinar o relacionamento entre variáveis seja a utilização de
delineamentos correlacionais. Em tais projetos, medimos a variável de interesse e verificamos
como cada variável se altera em relação às mudanças provocadas na variável de interesse. Um
exemplo pode auxiliar a entender a situação. Anteriormente, nesta seção, descrevemos, de
forma breve, o estudo de Walsh e Ugamba-Agwunobi (2002) investigando o relacionamento
entre ansiedade estatística e procrastinação. Neste estudo, os pesquisadores mediram a ansie
dade estatística com a Escala de Ordenação da Ansiedade Estatística (Cruise et al., 1985).
A escala mede seis componentes da ansiedade estatística, incluindo medo do professor de
estatística, autoconceito de habilidades computacionais, ansiedade em aulas e provas, medo
de fazer perguntas, ansiedade de interpretação e valor da estatística. Os autores realizaram
uma análise correlacional e descobriram que existem relações entre procrastinação e três
componentes da ansiedade estatística (medo dos professores de estatística, medo de solicitar
ajuda e ansiedade de interpretação). Os pesquisadores concluíram que as variáveis medo da
estatística e procrastinação estavam correlacionadas. Isto é, se uma das variáveis mudar a
outra também mudará, ou ainda as duas variáveis covariam. Deve-se notar que os termos “re
lacionar”, “correlacionar” e “covariar” são muitas vezes utilizados indistintamente.
Outro exemplo excelente de pesquisa conduzida com a utilização de desenho correla-
cional é a que verifica a relação entre o hábito de fumar e o câncer. Tem sido geralmente
verificado que, à medida que aumenta o consumo de cigarros, o mesmo ocorre com a incidên
cia de câncer. Portanto, existe um relacionamento entre o número de cigarros consumidos e a
chance de desenvolver câncer.
Se você usar um delineamento correlacional, então o tipo de técnica estatística provavel
mente utilizada será o coeficiente de correlação momento-produto de Pearson ou talvez o
coeficiente de correlação rô de Spearman. Tais coeficientes serão abordados nos Capítulos
5 e 15, respectivamente.
* N. de T. STAR (Statistics Anxiety Ratings Scale, Cruise et al., 1985).

** N. de T. Karl Pearson (1857-1936).
*** N. de T. Charles Edward Spearman (1863-1945).
1.3.3 Causação
A questão da causação é problemática em ciência, ainda mais quando utilizamos deli
neamentos correlacionais. Um dos principais objetivos da ciência, é descobrir a causa dos
acontecimentos. Em todos os ramos da ciência pesquisadores estão tentando determinar
relações causais entre variáveis. Por exemplo, Newton* produziu uma teoria elegante para
explicar o que causa a queda de maçãs. Estabeleceu uma relação causal entre a queda das
maçãs e a gravidade. Em muitas pesquisas psicológicas também tentamos estabelecer tal re
lação causal. Quando usamos delineamentos correlacionais, no entanto, é difícil estabelecer
se a alteração em uma variável causa a mudança em outra variável. Isso ocorre porque em
tais delineamentos estamos simplesmente observando e registrando mudanças em variáveis e
tentando estabelecer se elas covariam de alguma forma que faça sentido. Em virtude de que
estarmos apenas observando como as variáveis mudam, é difícil (para não dizer impossível)
estabelecer a relação causal entre elas. Para sermos capazes de fazer isto de forma mais fácil,
é necessário manipularmos uma das variáveis (mudá-la sistematicamente) e então observar o
que acontece com a outra variável. Esta abordagem será discutida mais tarde nesta seção.
Uma das regras de ouro do delineamento correlacional é não se poder inferir causação
a partir de uma correlação. A indústria do tabaco tem se valido desta fraqueza da correlação
para argumentar que não existe evidência de que o fumo cause câncer. Estritamente falando,
isso pode estar correto, pois os estudos têm sido principalmente correlacionais. Todavia, con
siderado a quantidade de pesquisas feitas corroborando uma relação causal entre o hábito de
fumar e o câncer, alguém seria tolo em ignorar as pesquisas e acreditar nas pessoas que estão
tendo lucro com a venda de tabaco.
Descobrir que ansiedade estatística e procrastinação estão relacionadas não nos infor
ma muito sobre a relação causal entre estas duas variáveis. Pode ser que o aumento na
ansiedade estatística aumente a procrastinação, ou então que alterações na procrastinação
causem alterações na ansiedade estatística. De forma alternativa, podem existir outras va
riáveis, tais como uma neurose, que pode causar mudanças tanto na ansiedade estatística
quanto na procrastinação (veja Figura 1.4). Você pode ver, portanto, que a existência de um
relacionamento entre duas variáveis não nos informa, necessariamente, muita coisa sobre
causa e efeito.
Neurose
Ansiedade estatística Procrastinação
Possível relação cau sal e n tre n eu ro se, a n sie d a d e estatística e p ro c ra stin a çã o .
* N. de T. Isaac Newton (1642-1727).

Um outro exemplo da limitação do delineamento correlacional é o relacionamento entre

ansiedade e depressão. Muitos estudos mostraram que ansiedade e depressão estão altamente
relacionadas (veja Clark e Watson, 1991). Pessoas que apresentam altos níveis de ansiedade
também apresentam altos níveis de depressão. Poderíamos dizer, então, que depressão causa
ansiedade ou ansiedade causa depressão? Não, não podemos. É bastante provável que alguma
variável interveniente esteja entre estes dois estados de humor. De fato, o que se tem verificado
é que a ansiedade e a depressão apresentam um elemento angustiante geral em comum, e é ele
que explica o alto valor do relacionamento entre as duas variáveis (veja Figura 1.5).
É possível estabelecer relacionamento causal utilizando delineamentos correlacionais,
mas estas situações são bem mais complexas do que os delineamentos indicados nesta seção
e envolvem a medida das variáveis em vários pontos no tempo.
©
A ngústia
Ansiedade ^ ► Depressão
Aqui não existe uma

conexão causal direta
Ilu stração do ele m e n to c o m u m c o m p a rtilh a d o por a n sie d a d e e d e p ressão e a au sê n cia

Figura 1.5
de um a co n exã o cau sal e n tre eles.
1.3.4 Projeto experimental

Para estabelecermos relações causais entre variáveis com mais facilidade, precisamos
manipular uma das variáveis de modo sistemático e ver qual o efeito obtido na outra variável.
Tal processo é, essencialmente, o realizado no projeto experimental*.
Um dos delineamentos ou projetos mais utilizado em ciência é o projeto de experimentos,
também denominado de experimento verdadeiro. Se você lembrar de experimentos típicos que
realizou, na escola, em química ou física, perceberá que eles representam o projeto de experi
mentos. Por exemplo, queremos ver o que ocorre com o sódio quando exposto ao ar e comparar
isto com o resultado de sua exposição à água. Observaríamos uma reação lenta na condição “ar”
(a superfície brilhante do sódio torna-se opaca) e uma reação rápida na condição “água” (o sódio
torna-se efervescente e pode entrar em combustão). Em um experimento temos uma variável
que estamos mensurando (o estado do sódio, denominada de variável dependente) e queremos
descobrir que efeito sofrerá a outra variável, denominada de variável independente (por exem
plo, ao que o sódio está exposto). A variável manipulada pelo observador é denominada de
variável independente, isto é, o seu valor não é dependente das outras variáveis investigadas.
A outra variável do experimento é denominada de variável dependente. Ela é denominada de
* N. de T. Os termos em inglês são DOE (Design O f Experiments) e experimental design (utilizado pelos autores). No Brasil são
utilizadas as versões: projeto de experimentos, desenho de experimentos ou ainda delineamento de experimentos.
dependente porque depende dos valores da variável independente. De fato, o propósito de um

experimento é comprovar ou descartar tal dependência.
Podemos conduzir tal pesquisa em psicologia, por exemplo, se quisermos verificar que
caminhar com o cão de fato influencia o número de encontros sociais. Para conduzirmos tal
estudo, tomamos um grupo de pessoas e aleatoriamente sorteamos alguns para caminhar com
o cão, enquanto os demais caminham sem o cão. Poderíamos prever que caminhar com o cão
acarretará mais encontros sociais do que caminhar sozinho. Dessa forma, estabelecemos uma
hipótese que será testada por meio da estatística.
Vamos supor que o experimento foi realizado e verificou-se que os que caminharam com o
cão tiveram mais encontros sociais do que aqueles que caminharam sozinhos. Este resultado con
firmaria a nossa previsão. Entretanto, existem vários outros fatores que podem ter influenciado na
verificação de uma diferença de encontros sociais entre as duas condições (veja Figura 1.2). Como
saberemos que a diferença observada foi causada pela manipulação da variável independente em
vez de uma das possíveis variáveis de confusão? Não sabemos. O que é possível fazer, neste caso,
é tentar limitar o impacto das variáveis de confusão sobre o estudo, pela alocação aleatória dos
participantes às condições da variável independente. Por meio da alocação aleatória dos partici
pantes às condições, pode-se reduzir a probabilidade de que os dois grupos difiram em aspectos
como timidez, atratividade, gênero e, assim, eliminar estes fatores enquanto causas possíveis da
diferença no número de encontros sociais entre os dois grupos. Se a alocação dos participantes às
condições for feita de forma aleatória, então poderemos ter mais confiança na nossa habilidade
para inferir um relacionamento causal entre a variável independente e a variável dependente (ca
minhar com ou sem cão e número de encontros sociais). É a alocação aleatória que torna o projeto
de experimentos tão útil na determinação do relacionamento causal entre variáveis.
Dessa forma, uma das principais características definidoras de um projeto de experimen
tos é a alocação aleatória dos participantes às condições. Para utilizar a alocação aleatória,
no exemplo mencionado, atribui-se a cada participante um número, ao acaso, gerado em um
computador. Pode-se, então, solicitar a todos aqueles cujo número seja inferior a um determi
nado valor que caminhem com o cão e aos demais que caminhem sozinhos. Assim, teremos
alocado aleatoriamente os participantes a cada uma das duas condições do estudo.
É claro que a alocação aleatória é mais útil para controlar fatores interpessoais, tais
como timidez. Existem, entretanto, outros fatores relacionados ao projeto de experimentos
que não podem ser controlados pela alocação aleatória dos participantes às condições. Dê
uma nova olhada na Figura 1.2 e irá notar que variáveis de confusão, como a hora do dia e
o tipo de cão, não serão controladas pela alocação aleatória dos participantes às condições
da variável independente. Estas são questões que deverão ser tratadas por outros aspectos do
projeto de experimentos, como assegurar que variados tipos de cão sejam utilizados no estudo
e que as duas condições sejam realizadas na mesma hora do dia e no mesmo dia da semana.
1.3.5 Projetos quase-experimentais

Muitas vezes em psicologia queremos trabalhar com variáveis que não podemos manipu
lar diretamente. Se quisermos comparar homens e mulheres de alguma forma, não podemos
manipular o grupo ao qual cada participante pertence. Não é possível alocar aleatoriamente
participantes às condições masculino e feminino. Assim, estritamente falando, não temos um
projeto experimental. Para ressaltar o fato de que tais projetos não são estritamente experi
mentais, são denominados de projetos quase-experimentais.
Como um exemplo, suponha que estejamos conduzindo o estudo da caminhada com o
cão mencionado anteriormente e que desejemos remover o gênero como variável de con
fusão. Podemos conduzir um estudo no qual tentamos descobrir se as mulheres têm mais
encontros sociais quando caminham sem cão do que os homens. Pode-se ver que neste estudo
os participantes não são alocados aleatoriamente às condições, pois já são homens ou mulhe
res. Assim, temos um projeto quase-experimental. Se for verificado que as mulheres têm mais
encontros sociais do que os homens, então será possível argumentar que o fato de ser mulher
encoraje mais a interação social.
Um dos problemas com os projetos quase-experimentais é a alocação não-aleatória das
várias condições que constituem a variável independente. Não podemos ter certeza de que
a manipulação da variável independente (ou deveríamos dizer pseudomanipulação) é a res
ponsável pelas diferenças entre as várias condições. Assim, é mais difícil inferir relações
causais de projetos quase-experimentais do que de projetos experimentais. Como ilustração,
o exemplo anterior pode apresentar algum fator, além do gênero, que distingue os dois grupos
(tamanho, por exemplo). Pode ser que as mulheres sejam vistas como menos ameaçadoras em
virtude de serem menores do que os homens. Desta forma, uma variável de confusão impor
tante infiltrou-se em nosso estudo. Em virtude do aumento do risco das variáveis de confusão
estarem associadas com estudos quase-experimentais, os estudos experimentais devem ser
preferidos sempre que possível. Caso você não saiba se está lidando com um projeto experi
mental ou quase-experimental, observe a alocação aleatória dos participantes às condições.
Se ela não for uma característica do estudo, então é mais provável que você esteja lidando
com um estudo quase-experimental.
Outra razão importante para preferir estudos experimentais é o fato de muitas das técni
cas estatísticas utilizadas indicarem que os participantes foram atribuídos aleatoriamente às
condições. Se a alocação não foi ao acaso, pode-se ter uma redução na validade das conclu
sões baseadas nestas técnicas estatísticas. Na prática este não é um grande problema, mas
você precisa estar ciente de que ele existe.
Se você está utilizando um estudo experimental ou quase-experimental, então algumas das
técnicas disponíveis para você são: o teste t, o teste U de Mann-Whitney*, o teste de Wilco-
xon** e a análise de variância (ANOVA). Todos eles serão abordados mais adiante no livro.
1.3.6 Panorama dos delineamentos de pesquisa

Descrevemos três dos principais delineamentos de pesquisa e como eles influenciam os
diferentes tipos de análises estatísticas que podemos utilizar. A Tabela 1.2 fornece um breve
sumário das principais características destes delineamentos em conjunto com os testes esta
tísticos que seriam apropriados a cada tipo.
Tabela 1.2 Panoram a das principais características dos vários delineamentos de pesquisa
Delineam ento Características Teste estatístico
Experimental ■ Manipulação da variável independente ■ Testes t

■ Alocação aleatória dos participantes aos diversos grupos ■ ANOVA
■ Análise por comparação entre os grupos ■ Teste U de Mann-Whitney
Quase-experimental ■ Pseudomanipulação da variável independente ■ Testes t
■ Alocação não-aleatória dos participantes ■ ANOVA
■ Análise por comparação entre os grupos ■ Teste U de Mann-Whitney
■ Teste de Wilcoxon
Correlacional ■ Investigar o grau com que as variáveis co-variam ■ Correlação de Pearson
■ Não se pode inferir causação a partir de correlação ■ p de Spearman
■ Analisar por meio de testes de correlação
* N. de T. Henry Berthold Mann (1905-2000) e Donald Ransom Whitney (1915- ).

** N. de T. Frank Wilcoxon (1892-1965).
Atividade 1.2
C lassifiq u e os se g u in tes estud o s em c o rre lacio n ais, exp e rim e n tais ou q u ase -exp erim en tais:
(a) R elação e n tre o c o n su m o de c a fe ín a e a in cid ê n cia d e d o r de cab eça

(b) D iferença e n tre h o m e n s e m u lh eres na h a b ilid a d e verbal
(c) Efeito no d e se m p e n h o em u m a prova na qual p a rticip a n te s são alo cad o s a le a to ria
m en te a c o n d içõ e s sem ruíd o e com alto ruído
(d) D iferen ças na a u to -e stim a de p essoas altas e baixas
(e) R e la cio n a m e n to e n tre estresse e h o ras g a sta s tra b a lh a n d o
(f) Diferença em escores de ansiedade entre dois g rup os de particip antes aleato riam e n te
alo cad o s, co nsid erand o que um grup o ap rendeu técn icas de relaxam en to e o o utro não
1.4 Delineamentos entre e dentre participantes
Outra característica importante dos delineamentos de pesquisa é verificar se os partici

pantes fazem parte de mais de uma condição. Retomando o exemplo da caminhada com o cão
e encontros sociais, temos um experimento no qual a variável independente é o participante
estar caminhando com o cão, e a variável dependente é o número de encontros sociais.
Como podemos alocar os participantes às condições neste experimento?
■ Você deve lembrar que se sugeriu como melhor alternativa alocar os participantes
aleatoriamente às condições de caminhar com o cão e sem o cão.
■ Existe, no entanto, a alternativa de que cada participante tome parte nas duas condições.
O primeiro procedimento é denominado de delineamento entre participantes (algumas
vezes também denominado de delineamento independente ou não-correlacionado); o segun
do, de delineamento dentre participantes (algumas vezes denominado de medidas repetidas
ou delineamento relacionado). Para decidir qual destes dois procedimentos utilizar, é preciso
levar em consideração as vantagens e desvantagens de cada um.
1.4.1 Delineamentos dentre participantes

A principal vantagem de utilizarmos o delineamento dentre participantes é podermos con
trolar muitas das variáveis de confusão interindividuais. Quando utilizamos grupos diferentes
de pessoas em cada condição, corremos o risco de que exista alguma variável, além da variável
independente, que influencie na diferença entre os grupos. Você terá, se isto acontecer, uma
variável confundidora ou de confusão. Quando usamos o delineamento dentre participantes te
remos um controle, muito maior, sobre tais variáveis. Em virtude de termos as mesmas pessoas
em todas as condições da variável independente, existirão muito menos variações externas
entre as condições. Em geral a mesma pessoa trará os mesmos problemas ou vantagens para
todas as condições da variável independente.
Uma segunda vantagem da utilização deste tipo de delineamento é a necessidade de tra
balhar com menos participantes para realizar o experimento. Por exemplo, se existirem duas
condições e necessitamos de um mínimo de 12 participantes por condição, o total necessário
para completar o estudo é de 24 pessoas com o delineamento entre participantes, mas apenas
12 no delineamento dentre participantes. Se você estiver realizando um estudo em que os cus
tos envolvidos forem altos, então este delineamento deverá ser levado em consideração.
Entretanto, nem tudo são rosas no jardim do delineamento dentre participantes. Se você
pensar um pouco sobre o estudo da caminhada com o cão, será capaz de identificar alguns
possíveis problemas. Poderá ocorrer, se utilizadas as mesmas pessoas em ambos os casos,
que a familiaridade com o caminho e com outras pessoas, já encontradas, encoraje a inte
ração. Assim, na segunda condição os participantes podem ter mais encontros sociais em
virtude desta familiaridade do que pelo fato de ter o cachorro. Por outro lado, eles podem
ficar aborrecidos ou cansados quando completarem a caminhada na segunda condição, e
isto, talvez, afete o número de encontros sociais que teriam. Esses fatores serão variáveis
de confusão e podem dificultar a interpretação dos dados. Qualquer diferença no número
de encontros sociais detectada entre as duas condições poderá ter origem nesses fatores, em
vez da manipulação experimental da variável independente. Esses fatores são denominados
de efeitos de ordem.
Uma forma de eliminar os efeitos de ordem é introduzir um contrabalanço no estudo.
Para contrabalançar, pode-se fazer metade dos participantes completar a primeira condição e
em seguida a segunda condição, enquanto a outra metade segue o mesmo procedimento, mas
na ordem contrária. Como forma de introduzir o contrabalanço no estudo da caminhada com
o cão, é preciso que a metade dos participantes caminhe primeiro com o cão e depois sem o
mesmo, enquanto a outra metade faz o contrário. Qualquer efeito como fadiga ou tédio será,
desta maneira, distribuído entre as duas condições da variável independente e não será mais
variável de confusão (veja Figura 1.6). Você ainda verificará que cada participante caminhará
sob as duas condições, retendo, assim, as vantagens da utilização do delineamento dentre
participantes.
Outra limitação do delineamento dentre participantes é a maior probabilidade de os par
ticipantes perceberem o objetivo do experimento por terem tomado parte nas duas condições.
Trata-se de um problema porque os participantes podem querer fazer o que o experimentador
deseja que façam, e não o que normalmente fariam. Isso é denominado de efeito de demanda.
É mais provável que ocorra no delineamento dentre participantes porque cada participante
é exposto a mais condições experimentais do que no delineamento equivalente entre parti
cipantes. Em certo sentido, o contrabalanceamento pode reduzir, mas não necessariamente
eliminar, os efeitos de demanda.
Um problema adicional associado ao delineamento dentre participantes é a impossibi
lidade de poder utilizá-lo em muitos projetos quase-experimentais. Por exemplo, se você
Todos os efeitos
de ordem na
Todos os Caminhando Caminhando
condição
participantes com o cão sem o cão
"sem o cão"
Delineamento dentre participantes sem contrabalanceamento
Metade dos _ Caminhando Caminhando

participantes com o cão sem o cão N. Efeitos de ordem
igualmente as
Metade dos Caminhando Caminhando ^ duas condições
participantes sem o cão com o cão
Delineamento dentre participantes com contrabalanceamento
Ilu stração da fo rm a de e lim in a r efeito s de o rd em pela u tiliz a ç ã o de

Figura 1.6
c o n tra b a la n c e a m e n to .
quiser comparar encontros sociais de homens e mulheres enquanto estão caminhando, não
será possível a utilização do delineamento dentre participantes. Não se pode ter uma pessoa
que seja homem e mulher simultaneamente em duas ocasiões separadas, e uma pessoa não
pode tomar parte nas duas condições (a menos, é claro, que faça uma mudança de sexo entre
a participação nas duas condições).
Atividade 1.3
C o m o vo cê in tro d u ziria o c o n tra b a la n c e a m e n to no se g u in te estu d o ?
U m e stu d o é c o n d u zid o para te sta r os efeito s da m o tiva ç ã o no d e se m p e n h o na ta re fa de

d e se n h a r so b re um esp e lh o . O s p a rticip a n te s são so licitad o s a d e se n h a r u m a estrela u tiliza n d o
o e q u ip a m e n to para d e sen h o so b re o esp elh o . O te m p o d e co rrid o para d e se n h a r a estrela e o
n ú m e ro de erros são re g istrad o s. O s p a rticip a n te s d e vem , e n tã o , re a liza r a ta re fa n o va m e n te ,
m as desta vez g a n h a rã o R$ 3 0 ,0 0 se co m p le ta re m a ta re fa m ais ráp id o e co m m en o s erro s.
1.4.2 Delineamentos entre participantes

Uma das mais importantes características positivas do delineamento entre participantes
é, em virtude de se ter grupos diferentes em cada condição das VI, cada participante estar me
nos sujeito a ficar chateado, cansado ou frustrado com o experimento. Como conseqüência,
há maior probabilidade de apresentarem desempenho ótimo. De modo semelhante, o experi
mento será menos suscetível a efeitos práticos, e os participantes estarão menos propensos a
racionalizar sobre os objetivos do estudo. Esse tipo de delineamento, portanto, reduz os efei
tos de demanda e de ordem, e pode-se, de modo geral, eliminar do experimento esses fatores
como variáveis de confusão.
O fator negativo é a necessidade de um número maior de participantes do que em um
experimento dentre participantes. Ainda, em virtude de cada uma das condições utilizar di
ferentes participantes, perde-se um certo grau de controle sobre as variáveis de confusão
interparticipantes. Por exemplo, suponha que você está conduzindo o estudo sobre a cami
nhada com o cão descrito previamente como um delineamento entre participantes. O que
ocorre se realmente constatarmos que caminhar com o cão leva a mais encontros sociais? An
tes de podermos aceitar isso como verdadeiro, precisamos nos assegurar de que não existem
variáveis de confundimento. Uma variável confundidora importante, em tal estudo, talvez
seja a timidez dos que estão caminhando. Pode acontecer, por acaso, de os caminhantes sem o
cão serem mais tímidos, e, desta forma, o menor número de encontros se deve a esta variável.
Se tivéssemos feito este experimento como um delineamento dentre participantes, teríamos
condições de controlar essa variável de confusão, pois cada pessoa caminha com e sem o
cão. Isso significa que o nível geral de timidez seria o mesmo sob as duas condições, e essa
variável de confusão não existiria.
Da discussão referida você pode ver que um problema do delineamento entre partici
pantes é pessoas diferentes trazerem características diferentes às condições do experimento.
Quando estamos aleatoriamente alocando participantes às condições, podemos, por acaso,
alocar todos os participantes com uma determinada característica a um grupo, e isso talvez
confunda ou mascare os resultados. As técnicas estatísticas que descrevemos neste livro
darão indicações da probabilidade de tais circunstâncias aparecerem na nossa pesquisa.
A Tabela 1.3 fornece um sumário das vantagens e desvantagens dos delineamentos entre
e dentre participantes. Deve ficar claro que as vantagens do delineamento dentre participantes
tendem a ser desvantagens no delineamento entre participantes e vice-versa.
Tabela 1.3 Sumário das vantagens e desvantagens dos delineamentos entre e dentre participantes
D elineam ento Vantagens Desvantagens
Entre participantes ■ Ausência relativa de efeitos práticos e ■ Necessidade de um número menor de

de fadiga participantes
■ Participantes menos sujeitos a se com ■ Grande controle das variáveis de confu
portarem de acordo com os objetivos são entre as condições
do estudo
Dentre participantes ■ Necessidade de um número maior de ■ Aumento da probabilidade de efeitos
participantes práticos e de fadiga
■ Inexistência de muito controle das va ■ Participantes com maior probabilidade
riáveis de confusão entre condições de adivinhar os objetivos do estudo
Atividade 1.4
C o m o vo cê p ro je taria um estu d o p ara in ve stig a r a possível relação e n tre c a fe ín a e h a b ili

d a d e m a te m á tica ?
I | | SPSS para Windows (SPSSPW)
Esta seção fornece uma breve introdução ao SPSS para Windows e explica como entrar
e salvar dados em um arquivo. Explica ainda a diferença na entrada de dados para os deline
amentos entre e dentre participantes.
O básico
Primeiro você deve saber algumas coisas básicas sobre programas. O Windows é uma
interface gráfica que permite ao usuário manipular ícones e informação textual na tela. Mui
tos programas, tais como o SPSS, apresentam diferentes janelas que você poderá manipular
quando necessário.
Quando você roda o SPSS para Windows versões 10, 11 e 12 (SPSSPW), verá uma janela
perguntando o que quer fazer.
Barras e
setas de
rolagem
A primeira decisão que você precisa tomar é se quer abrir um arquivo de dados já existente
ou criar um novo (entrar com novos dados). Para abrir um arquivo existente, selecione a opção
Open an existing data source (Abrir uma fonte de dados já existente) da caixa de diálogo (janela)
What wouldyou like to do? (O que você gostaria de fazer?). Você deve, então, selecionar o arqui
vo de interesse e clicar em OK para continuar. Se quiser inserir dados, então você deve selecionar
a opção Type in data (digitar dados) e clicar em OK. Feito isso, aparecerá a seguinte tela:
Variáveis =
colunas \m\ | | |^ I |r~|! J|3;|l">h'-N
Participantes ■
(casos) = linhas '
Painéis (orelhas):
Data View (Ver
Dados) e Variable
View (Visualizar
Variáveis)
* N. de T. Os autores não falam sobre o ícone X , que fecha a janela ativa e também não mencionam que os botões de reduzir e am
pliar são um só e funcionam como uma chave liga/desliga.
Você pode pensar que a janela ativa é muito pequena para mostrar toda a informação
disponível. É possível aumentar o tamanho da janela ativa clicando nos botões Minimizar, Re
duzir/Ampliar (-, i5 ou □) no canto superior direito da janela ativa. Aqui, o botão - minimiza a
janela ativa; ff reduz uma janela ampliada, e □ aumenta uma janela reduzida. Minimizar a janela
ativa consiste em reduzi-la a um ícone que aparecerá na parte inferior da tela. Se uma janela esti
ver reduzida, você poderá visualizar mais informações se clicar no botão n . Se a janela já estiver
em seu tamanho máximo, então, para se poder ver mais informações, ela deverá ser rolada (para
cima ou para baixo) por meio da barra ou setas situadas no lado direito da janela.
Entrada de dados
Antes de executar qualquer análise, você precisa fornecer os dados. Note que existem
células, que são o encontro das linhas com as colunas. Cada linha de dados que você fornecer
representará os dados de um participante, e cada coluna representará os dados de uma variável.
Por exemplo, suponha que você deseja rodar um estudo que esteja procurando relações da an
siedade estatística com a procrastinação. Digamos que temos os seguintes dados de entrada:
Participantes: P1 P2 P3 P4 P5 P6
Ansiedade estatística: 55 59 48 60 62 50
Procrastinação: 125 132 94 110 140 96
A primeira coisa a fazer é declarar as variáveis no SPSSPW. Para determinar o nome e
demais características das variáveis, é preciso selecionar o painel Variable View (Visualizar
Variáveis) no final esquerdo da tela. A tela mudará para uma na qual você poderá caracterizar
as variáveis do seu arquivo de dados.
Uma
célula
Painéis: Ver
Dados e
Visualizar
Variáveis
Na tela de visualização de variáveis (Variable View), as linhas representam variáveis, e as

colunas algum tipo de formatação da variável. Você precisa fornecer o nome de cada variável
na primeira coluna, denominada de Name (Nome). Clique na primeira linha desta coluna e
digite o nome da variável. Temos duas variáveis para serem declaradas, a ansiedade estatística
e a procrastinação. Digite no nome da primeira variável: statsanxiety. Você precisa levar em

conta as seguintes regras quando quiser nomear variáveis:
■ Não se usa mais do que 16 caracteres. Por exemplo, statsanxiety é válido, mas
statisticsanxiety não.
■ Nas versões anteriores ao SPSS 12, o nome só pode ter até 8 caracteres.
■ Não é possível utilizar marcas de pontuação ou espaços. Por exemplo, statsanxiety é
válido, mas stats anxiety não.
■ Não é preciso se preocupar com letras maiúsculas, pois o SPSSPW converterá todo o
nome para letras minúsculas.
Uma vez que você tenha digitado statsanxiety na primeira célula, clique na próxima cé
lula abaixo e digite o nome da segunda variável. Lembre que ele só pode ter até 16 caracteres
(8 para as versões anteriores ao SPSS 12). Você poderá denominá-laprocrastination. Quando
tiver digitado o nome da segunda variável, a tela deverá ser semelhante à seguinte.
Nomes das
variáveis
As variáveis foram declaradas, então você pode agora entrar com os dados. Para fazer
isso, você precisa selecionar o painel (no fundo esquerdo da tela) Data View (Visualizar Da
dos), obtendo a seguinte tela:
* N. de T. Se quiser ou precisar separar o nome de uma variável, utilize o underscore ( _ ).

Os dados da
ansiedade
estatística
devem ser
digitados
nesta coluna
Os dados da
procrastinação
devem ser
digitados
nesta coluna
Você poderá notar que as duas primeiras colunas estão rotuladas como statsanxiety e
procrastination. Lembre-se que na tela de visualização de dados (Data View) as colunas são
variáveis e as linhas são participantes. Desta forma, todos os dados da ansiedade estatística
(statsanxiety) deverão ser digitados na primeira coluna, e os da variável procrastinação (pro
crastination), na segunda. Vá adiante e entre com os dados apresentados anteriormente. Uma
vez feito isso, a tela deverá ser semelhante à seguinte:
Menu File
(Arquivo)
Você pode visualizar aqui os dados que foram digitados.

Salvando os dados
Após ter fornecido os dados, é uma boa idéia salvá-los em um arquivo. Isso evitará que
tenha de digitá-los novamente caso queira realizar outras análises no futuro. Para salvar os
dados, é necessário colocar o ponteiro do mouse sobre o item de menu File (Arquivo) e clicar
com o botão esquerdo do mouse. O seguinte menu será apresentado.
Selecione a
opção Save As ■
(Salvar Como)
Mova o ponteiro do mouse e clique na opção Save As... (Salvar Como) e então a se
guinte caixa de diálogo irá aparecer. Ela é denominada de caixa de diálogo porque é onde
você diz ao SPSSPW o que ele deve fazer. Digite o nome do arquivo na linha (em branco)
denominada File name (Nome do arquivo) e clique no botão OK. Seus dados estarão salvos
neste arquivo.
Convém lembrar que o nome de um arquivo deve obedecer às seguintes regras:
■ A primeira parte é um nome que faça sentido para você (p. ex., statsanxiety).
■ A segunda parte deve ser sempre SAV para um arquivo do SPSSPW (esta parte é
denominada de extensão do arquivo).
■ A primeira e a segunda parte serão sempre separadas por um ponto.*
Assim, o nome do nosso arquivo de dados será statsanxiety.sav. De fato, você nãodigitou
.sav nem precisará fazê-lo, pois o SPSSPW faz isso automaticamente. Sempre que você visua
lizar um nome de arquivo terminando em .sav, poderá ter uma confiança razoável de que ele é
um arquivo de dados do SPSSPW. Se você esquecer o nome do seu arquivo, procure entre os
que apresentam a extensão .sav.
* N. de T. Variáveis e projeto de pesquisa.

Digite o
nome do
arquivo aqui
Entrando com os dados para os delineamentos

dentre e entre participantes
Descrevemos como fornecer e salvar dados no SPSSPW. No entanto, diferentes de
lineamentos requerem diferentes entradas de dados. A maneira recém descrita é para um
delineamento correlacional. Se você quiser fornecer dados para os delineamentos entre par
ticipantes, então o procedimento é o seguinte. Digamos que você conduziu recentemente o
estudo da caminhada com o cão com um delineamento entre participantes. Suponha que os
dados obtidos para a variável “número de encontros sociais” sejam os seguintes:
Caminhando com o cão: 9 7 10 12 6 8
Caminhando sem o cão: 4 5 3 6 5 1
Neste delineamento, caminhar com e sem o cão é a variável independente, e o número
de encontros sociais, a variável dependente. Quando entrarmos com os dados no SPSSFW,
precisamos determinar uma variável independente e uma variável dependente. A primeira
coisa a ser feita é nomear as variáveis, na tela Variable View (Visualizar Variáveis). Quando
se declarar a variável independente, é necessário prestar atenção, pois é aqui que a maioria
dos erros ocorre. Quando tivermos grupos diferentes de pessoas em cada condição da variá
vel independente, precisamos definir uma variável de agrupamento (grouping variable) no
SPSSPW. Devemos deixar o SPSSPW saber em qual dos dois grupos cada participante está.
Defina a variável conforme a seguinte ilustração:
Clique nas
reticências
Se você deixar as variáveis como definidas pelo software, poderá ter dificuldades para
interpretá-las, uma vez que não haverá rótulos para identificá-las de acordo com as diferentes
condições da VI. Assim, é uma boa idéia detalhar os nomes das condições da VI. Você deve
notar que, quando clica na primeira célula da coluna rotulada como Values (Valores), reticên
cias aparecem. Isso indica que você pode fornecer informações adicionais para esta coluna.
Clique nas reticências e obterá a seguinte caixa de diálogo.
Digite o número
do primeiro
grupo aqui
Digite o nome
do grupo aqui
Clique em Add
(Adicionar) para
confirmar
os detalhes
Temos duas condições para a variável independente, às quais precisamos atribuir núme
ros. Iremos rotular o grupo “caminhando com o cão” de grupo 1 e o grupo “caminhando sem
o cão” como grupo 2 (ou vice-versa). Digite 1 na linha (caixa) Value (Valor) e “caminhando
com o cão” (Walking with a dog) na linha (caixa) Value Label (Rótulo). Feito isso, clique em
Add (Adicionar), e você verá que os detalhes aparecem na última linha (caixa). Agora digite
2 na linha Value e “caminhando sem o cão” (Walking without a dog) na linha Value Label e
clique Add. A caixa de diálogo deverá ser semelhante a esta:
Clique em OK para retornar à tela Data View (Ver Dados). Sempre que desejar que o
SPSSPW saiba os nomes dos grupos, você pode fazer isso adicionando informações na colu
na Values (Valores).
Agora vamos definir as variáveis. Para entrar com os valores reais dos dados, clique no
painel Data View (Visualizar Dados). Quando os dados forem postos na coluna group (gru
po), digite 1 se a pessoa estiver no grupo com o cão e 2 se a pessoa estiver no grupo sem o
cão. Assim, você poderá verificar que a primeira coluna conterá apenas os valores 1 ou 2. Na
segunda coluna, você deverá entrar com o número de encontros sociais de cada pessoa, como
está na sua variável dependente. Você deverá ser capaz, observando a tela de entrada, de ver
que o participante número 4 está no grupo com o cão (grupo 1) e que ele teve 12 encontros
sociais. Também verá que o participante numero 12 está no grupo sem o cão (grupo 2) e que
teve uma caminhada solitária com apenas um encontro.
Variável de
agrupamento
Variável
dependente
Delineamentos dentre participantes

Quando há um delineamento dentre participantes, temos que entrar com os dados de uma
maneira diferente. Se utilizarmos o exemplo anterior, no delineamento dentre participantes
cada pessoa completará a caminhada, tanto na condição com o cão quanto sem o cão. Os
dados para este estudo terão a aparência mostrada na tela seguinte:
Cada pessoa tem

um escore nas
duas condições
Você pode estar se perguntando por que temos de entrar com os dados de forma dife
renciada para cada um dos diferentes delineamentos. É que cada linha da entrada de dados
representa a informação de um participante. Se você tem um delineamento entre participan
tes, precisa informar ao SPSSPW qual o escore de cada participante e a qual grupo pertence.
Quando o delineamento é dentre participantes, cada um atua sobre as duas condições, e desta
forma, se tem dois escores. Você precisa fazer com que o SPSSPW saiba o que ambos estes
escores significam. Em virtude de cada participante atuar nos dois grupos, não será neces
sário informar ao SPSSPW o grupo, por meio de uma variável de agrupamento. Você pode
perceber, assim, a diferença dos delineamentos dentre e entre participantes através da variá
vel de agrupamento. Se esta variável existir, trata-se do delineamento entre participantes.
Você deve notar, a partir do detalhe da tela, que definimos duas variáveis, uma para a
condição com o cão e outra para a condição sem o cão. Ainda, em virtude de não haver a
variável de agrupamento, não temos de atribuir rótulos de grupos para qualquer variável na
tela Variable View (Visualizar Variável). Definir as variáveis para esse tipo de delineamento é,
dessa forma, mais simples do que para o delineamento entre participantes.
Utilizando as facilidades da ajuda (Help) do SPSSPW

É uma boa idéia praticar utilizando as facilidades da ajuda do SPSS para Windows. Você
pode iniciar rodando o tutorial que está disponível para você. O tutorial pode ser iniciado
sempre que se iniciar o SPSSPW. Você pode notar que a primeira opção na primeira caixa de
diálogo que você vê no SPSSPW é rodar o tutorial (Run the tutorial).
Selecione esta
opção para
rodar o tutorial
Você pode acessar o tutorial a qualquer hora durante uma sessão. Basta clicar no menu
Ajuda (Help) e selecionar o tutorial (Tutorial) a partir daí.
Botões de
navegação
Uma vez iniciado o tutorial, você estará na introdução às facilidades da ajuda do SPSSPW.
Você irá notar quatro ícones no canto inferior direito da tela. Estes ícones permitem que você
navegue da forma que desejar em torno dos tópicos do tutorial. O ícone com a lupa fornece
um índice de tópicos. O ícone com a casa leva você aos conteúdos de cada tópico, enquanto os
ícones com as setas à esquerda e à direita levam para as telas anteriores e posteriores, respec
tivamente. Quando você clica no ícone de conteúdo (casa), obtém uma lista de assuntos. Você
deve então clicar no tópico desejado para que o tutorial possa ajudá-lo.
Clique no tópico
para obter um
tutorial sobre ele
;j g Start I ^ g) PJ ^ ” | Bg’ MicrQsQ...! g ] Explorin...| Ij jj Enplorin...| Ü §jUntitled...[ ^$MGI P h | |[^> Tutorial T ã | fí 21:0
Lembre que você pode chamar o tutorial sempre que precisar.
Resumo
Neste primeiro capítulo expusemos os conceitos básicos para um entendimento da pes

quisa e do projeto de pesquisa. Você aprendeu que:
■ Variáveis se diferenciam em termos de precisão. Isto é, elas podem ser:
- Contínuas quando assumem qualquer valor em dado intervalo (p. ex., 10 ou
10,2365)
- Discretas quando assumem apenas certos valores especificados dentro de um de
terminado intervalo (p. ex., 9 ou 10)
- Categóricas quando os valores assumidos são categorias, em vez de valores pura
mente numéricos (p. ex., gênero: masculino ou feminino).
■ Existem três principais delineamentos de pesquisa:
- Delineamentos correlacionais, que examinam as relações entre variáveis e não
apresentam, num sentido estrito, variáveis dependentes ou independentes. Você
não pode inferir causação a partir de correlações.
- Delineamentos experimentais, que envolvem alocação aleatória de participantes
às condições de variável independente.
- Delineamentos quase-experimentais, que envolvem investigar grupos fechados,
tais como homens e mulheres, e, desta forma, não utilizam alocação aleatória de
participantes às condições.
■ Nos experimentos, a variável independente é manipulada pelo pesquisador para veri
ficar como ela afeta a variável dependente.
■ Os delineamentos entre participantes são aqueles nos quais nós temos participantes
diferentes para cada condição da variável independente.
■ Os delineamentos dentre participantes são aqueles nos quais cada participante é ava
liado sob todas as condições da variável independente.
Exercícios para o SPSSPW
As respostas de todos os exercícios e das questões de escolha múltipla podem ser encon
tradas em seção própria ao final do livro.
Exercício 1
A Dra. Gênio realizou um estudo comparando a memorização de adjetivos com a de
substantivos. Ela alocou aleatoriamente 20 participantes a duas condições. Então, apresentou
a um dos grupos de 10 participantes uma lista de 20 adjetivos e ao outro grupo (também com
10 participantes) uma lista de 20 substantivos. Em seguida, solicitou a cada grupo que ten
tasse lembrar o número máximo possível de palavras apresentadas. Ela obteve os seguintes
resultados:
Adjetivos: 10, 6, 7, 9, 11, 9, 8, 6, 9, 8
Substantivos: 12, 13, 16, 15, 9, 7, 14, 12, 11, 13
1. Qual é a variável independente neste estudo?
2. Qual é a variável dependente?
3. Este é um delineamento dentre ou entre participantes?
4. É um projeto experimental, quase-experimental ou correlacional?
5. Entre com os dados no SPSSPW de forma apropriada para o delineamento do expe
rimento e salve os dados em um arquivo.
Exercício 2
Utilizando os dados do exercício 1:
■ Se você entrou com os dados como um delineamento dentre participantes, entre com
os dados agora como um delineamento entre participantes.
■ Se você entrou com os dados como um delineamento entre participantes, entre com
os dados agora como um delineamento dentre participantes.
Salve os dados em um arquivo utilizando um nome diferente do anterior.
QUESTÕES DE MÚLTIPLA ESCOLHA (b) Alocação não-aleatória dos participantes às

condições
1. Qual das seguintes constitui uma variável contínua? (c) Nem variável independente nem variável de
(a) Número de vezes que um escore de 180 é al pendente
cançado em um jogo de dardos (d) Alternativas (a) e (b)
(b) Gênero 9. Qual assertiva descreve um a variável contínua?
(c) Temperatura
(a) Pode assumir certos valores discretos em um
(d) Todas as anteriores
faixa de valores
2. O projeto experimental é caracterizado por: (b) Pode assumir qualquer valor dentro de uma
(a) Menos do que duas condições faixa de escores
(b) Sem controle das condições (c) Pode ser caracterizada por categorias
(c) Alocação aleatória dos participantes às condi (d) Nenhuma das anteriores
ções
10. Quais dos seguintes são problemas associados com
(d) Nenhuma das anteriores
o delineamento dentre participantes?
3. Em um estudo no qual o gênero é a variável a ser (a) Existe uma maior probabilidade de efeitos prá
manipulada, a V I é: ticos e de fadiga
(a) Dentre participantes (b) Os participantes apresentam m aior probabili
(b) Correlacional dade de perceber a natureza do estudo
(c) Entre participantes (c) Não pode ser utilizado com projetos quase-
(d) Nenhuma das anteriores experimentais
(d) Todas as anteriores
4. Qual das seguintes assertivas é verdadeira para o
delineamento correlacional? 11. De acordo com Streiner (2002), qual a eficiência de
(a) Ele não apresenta variável independente nem estudos que dicotomizam variáveis quando compa
variável dependente rados com estudos que não o fazem?
(b) Procura relacionamentos entre variáveis (a) 100%
(c) Não se pode inferir causação a partir de cor (b) 95%
relação (c) 67%
(d) Todas as anteriores (d) 50%
5. Qual das seguintes pode ser considerada um a va 12. Certo pesquisador acabou de conduzir um estudo
riável categórica? correlacional investigando o relacionam ento da
(a) Gênero quantidade de álcool ingerida por fãs do time da
(b) M arca de carro casa antes de um jogo de futebol e o número de
(c) C or do cabelo gols marcados pelo time. Constatou-se que existe
(d) Todas as anteriores um relacionamento entre as duas variáveis. Qual
das seguintes afirmações é válida?
6. O delineamento dentre participantes pode ser:
(a) A quantidade de álcool ingerido está relacio
(a) Tanto quase-experimental quanto experimental
nada com a habilidade do time de fazer gols,
(b) Somente experimental
mas não se pode afirmar que seja a causa dos
(c) Somente quase-experimental
gols marcados
(d) Somente correlacional
(b) A habilidade do time da casa de marcar gols
7. Qual das seguintes declarações é verdadeira para não está relacionada com a quantidade de
experimentos? álcool ingerida, mas com a quantidade de in
(a) A variável independente é manipulada pelo centivo dada pelos fãs que bebem
pesquisador (c) U m aumento na quantidade ingerida de ál
(b) A variável dependente é assumida como de cool causa um aumento no número de gols
pendente sobre a variável independente marcados
(c) Os experimentos são difíceis de serem reali (d) Todas as anteriores
zados
13. Em um projeto dentre participantes com duas con
(d) Alternativas (a) e (b)
dições, se você não utilizar o contrabalanceamento
8. O projeto quase-experimental apresenta: das condições, seu estudo poderá sofrer:
(a) U m a variável independente e um a variável (a) Efeitos de ordem
dependente (b) Efeitos da hora do dia
(c) Falta de participantes um escore sobre o quanto roem as unhas.

(d) Todas as anteriores Após, classificar os participantes como “de
pressivos” e “não-depressivos” com base nos
14. Você conduziu um estudo mostrando que, quanto
resultados do questionário. Podemos verificar,
mais cedo as pessoas levantam, mais tarefas elas
então, se existe ou não diferenças no quanto
conseguem executar. Qual das seguintes conclu
roem as unhas.
sões é válida?
(b) Como a situação (a) acima, mas sem dividir
(a) Não existe necessariamente um a relação os participantes em dois grupos. U tilizar os
causal entre levantar cedo e a quantidade pro escores de depressão obtidos e verificar se
duzida de trabalho
existe um a relação entre roer as unhas e de
(b) Pessoas que levantam cedo precisam trabalhar
pressão.
mais
(c) Este tipo de estudo é impossível de ser execu
(c) Levantar cedo é a causa de mais trabalho ser
tado; portanto não deve ser tentado.
produzido
(d) Nenhuma das anteriores
(d) As alternativas (b) e (c)
18. Qual das seguintes seria a variável independente
15. Com qual dos seguintes projetos (delineamentos)
apropriada em um estudo quase-experimental?
é menos provável que se possa estabelecer relacio
namentos causais entre variáveis? (a) Gênero
(b) Se alguém apresenta ou não distúrbio de an
(a) Projeto experimental
siedade generalizada
(b) Projeto quase-experimental
(c) Projeto correlacional (c) Estudantes versus não-estudantes
(d) Delineamento dentre participantes (d) Todas as anteriores
16. Efeitos de demanda são possíveis variáveis de con 19. Em um delineamento dentre participantes, os efei
fusão nas quais: tos de ordem ocorrem quando:
(a) Os participantes se comportam de acordo com (a) Os participantes ficam cansados nas últimas
o que o pesquisador quer condições
(b) Os participantes apresentam baixo desem pe (b) Os participantes têm o mesmo desempenho
nho, pois estão cansados ou chateados em todas as condições
(c) Os participantes apresentam bom desempenho, (c) Os participantes têm problemas para obter be
pois praticaram as tarefas do experimento bida no bar
(d) Nenhuma das anteriores (d) Nenhuma das anteriores
17. Suponha que você quer conduzir um estudo para 20. Qual dos seguintes problemas está associado com
verificar se pessoas depressivas roem mais as a dicotomização de variáveis contínuas?
unhas do que pessoas não-depressivas. Qual dos (a) Perda de poder experimental
seguintes será a melhor m aneira de proceder? (b) Ocorrência de efeitos espúrios
(a) M edir a depressão dos participantes com um (c) Existência de um a séria perda de informação
questionário e então solicitar que atribuam (d) Todas as anteriores
Referências
AITKEN, M. A personality profile of the student procrastinator. Tese de doutorado não-publicada,

Universidade de Pittsburg. (Dissertation Abstracts International, 43, p. 722-32 A), 1982.
CLARK, L. A., WATSON, D. Tripartite m odel of anxiety and depression: psychom etric evidence and
taxonomic implications. Journal o f Abnorm al Psychology. v. 100, p. 316-36, 1991.
CRUISE, R., CASH, R., BOLTON, D. Development and validation of an instrum ent to measure
statistical anxiety. 1985. Artigo apresentado na reunião anual da Seção de Educação Estatística e
reimpresso nas atas da Associação Americana de Estatística.
DORLING, D. et al. A good place to bury bad news? Hiding the detail in the geography on the Labour
Party’s website. The Political Quarterly. v. 73, p. 476-92, 2002.
EGLOFF, B. HOCK, M. Assessing attention allocation toward threat-related stimuli: a comparison of
the emotional Stroop task and the attentional probe task. Personality and Individual Differences.
v. 35, p. 475-83, 2003.
MAXWELL, S. E., DELANEY, H. D. Bivariate m edian splits and spurious statistical significance.
Psychological Bulletin. v. 113, p. 181-90, 1993.
McNICHOLAS, J., COLLIS, G. M. Dogs as catalysts for social interactions: robustness of the effect.
British Journal o f Psychology. v. 91, p. 61-70, 2000.
SPIELBERGER, C. D. et al. M anual fo r the State-Trait Anxiety Inventory (Form Y). Palo Alto (CA):
Consulting Psychologists Press, 1983.
STREINER, D. L. Breaking up is hard to do: the heartbreak of dichotomizing continuous data.
Canadian Journal o f Psychology. v. 47, p. 262-66, 2002.
WALSH, J. J., UGUMBA-AGW UNOBI, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences. v. 33, p.
239-51, 2002.
Nota
1 Correção do artigo feita pelo Guardian (publicado em 10 de outubro de 2002):
N a nossa reportagem, “O site do partido gira como o 1984 de O rw ell”, página 7, de 8 de

outubro, dissemos: “O w ebm aster do partido é comparado a Winston Smith, o personagem do
livro 1984 de George Orwell que passava o tempo no ministério do abastecimento reescrevendo
a história’’. De fato, Winston Smith trabalhava para o ministério da verdade. Entre suas tarefas,
entretanto, estava o “reajustam ento” dos números do ministério do abastecimento. “N ã o fo i nem
mesmo uma falsificação. Foi meramente a substituição de uma peça absurda p o r o utra” (página
36 da edição da Penguin de 1983).
N o nosso artigo nos referimos ao relatório em discussão como “não-publicado”. D e fato,
ele apareceu na edição de outubro (volume 73, número 4) do Political Quarterly, publicado pela
Blackwells.
Estatística Descritiva
No Capitulo 1, apresentamos alguns fatores importantes de um projeto de pesquisa. Neste

capítulo iremos explicar as principais maneiras de tratar dados coletados por meio de pesquisa
quantitativa. São as estatísticas descritivas. Um passo mportante para qualquer um que esteja
tentando entender a análise estatística é obter uma boa idéia dos conceitos básicos. Por isso,
explicaremos alguns dos conceitos estatísticos fundamentais que servirão de apoio para o enten
dimento de análises complexas apresentadas mais tarde no livro Ao final deste capítulo, você
deverá ter um bom entendimento dos seguintes tópicos.
■ amostras e populações
■ medidas de tendência central (p. ex„ média)
■ técnicas gráficas para descrever os dados (p. ex., o histograma)
■ distribuição normal
■ medidas de variabilidade (p ex., o desvio padrão)
Estes são conceitos importantes que aparecerão sob várias formas ao longo do texto; por
isso, é importante tentar entendê-los. Considere-os como os blocos básicos para a compreensão
conceituai da estatística.
2.1 Amostras e populações
No Capítulo 1. explicam os que estatísticas são essencialm ente maneiras de descrever,

comparar e relacionar variáveis. Quando estas estatísticas forem produzidas, devem os levar
em conta uma diferença importante entre am ostras e populações. Quando psicólogos falam
sobre populações, não estão necessariamente se referindo à população do país ou da cidade.
Hstão, geralmente, se referindo a grupos distintos de pessoas, por exem plo, todos aqueles
com autismo, ou iodos os homens canhotos. Em lermos estatísticos, uma população pode até
m esmo se referir a objetos inanimados, com o, por exem plo, a população dos carros de uma
certa marca.
Um a amostra é sim plesm ente uma seleção de elem entos de uma população (veja F i
gura 2.1). Os pesquisadores utilizam amostras por várias razões, principalm ente porque
são mais baratas, mais rápidas de obler e m ais convenientes para exam inar do que toda
uma população. Imagine que querem os verificar se a ansiedade estatística está relacio
nada com procrastinação, com o Walsh e U gum ba-A gw unobi (2 0 0 2 ) fizeram. Podem os
sim plesm ente medir o nível de ansiedade estatística e de procrastinação de todo m undo
Outra amostra
Uma amostra possível possível de cinco faces
de cinco faces
de faces
Outra amostra
possível de cinco faces
Ilustração de várias amostras do cinco faces retiradas de uma população de faces.
c observar o quanto estão relacionadas entre si. Isso seria, no entanto, caro dem ais. Uma
tonna mais conveniente e selecionar um determinado número de pessoas ao acaso da po
pulação e determinar os seus níveis de ansiedade estatística e procrastinação. Podem os,
então, generalizar o resultado desta amostra para a população. U tilizam os estatística, mais
especificam ente estatística inferencial, para generalizarm os os resultados obtidos de am os
tras para toda a população.
Quando realizamos uma pesquisa, devem os estar seguros de que sabem os qual é a po
pulação estudada e escolher a amostra desta população. E inútil realizar um estudo com uma
amostra de homens se a população inclui os dois sexos. E sem sentido conduzir um estudo
com uma amostra de tarântulas se a população alvo é de zebras.
A habilidade para generalizar resultados de uma amostra para a população é de impor
tância vital em pesquisa. A ssim , e' preciso estar seguro de que qualquer amostra utilizada é
verdadeiramente representativa da população visada. Um exem plo sim ples ilustra alguns dos
problemas. Imagine que pesquisadores querem realizar um estudo para saber se caminhar
com o cão leva a mais encontros sociais do que caminhar sem o cão. Eles decidem se diri
gir ao parque mais próximo e seguir um determinado número de proprietários de cães e de
não-proprietários de cães para contar as interações sociais que tiveram. Os pesquisadores des
cobrem que os que não possuem cão tiveram mais encontros dos que possuem e concluem ,
então, que possuir um cão não é bom para a vida social.
Esta conclusão está correta? De fato. não sabemos a resposta a partir da pesquisa que foi
feita. Ela pode estar certa, mas não se utilizou uma amostra correta sobre a qual se pudesse
basear tal conclusão, isto é, pode haver um problem a de am ostragem . O problema aqui é que
os proprietários de cães seguidos podem ser todos, por exem plo, muito tímidos, e é isso. e
não o fato de possuir o cão, que explica a diferença no número de encontros sociais. Aqui. é
possível que exista o viés do pesquisador, no qual ele inconscientemente utiliza pessoas que
ajudam a confirmar a sua hipótese. Pode ser que sejam questões ligadas à hora do dia em
que as pessoas caminham com seus cães. Por exem plo, pessoas caminhando bem cedo pela
Christine P Dancey & John Reidy
manhã, talvez, estejam com pressa para ir ao trabalho e se tomem m enos propensas a encon
tros sociais Certos tipos de cães influem nas interações sociais (p. ex.. caminhar com um p i
buli) Como pesquisadores, devem os estar cientes dessas possibilidades quando projetamos
„ossa pesquisa de forma a nos assegurarmos de que elas não ocorram. Queremos generalizar
os nossos resultados amostrais para toda a população e queremos evitar problemas co
projeto que possam reduzir nossa possibilidade de fazer isso. M uito dos pontos sutis de um
projeto de pesquisa são os que tentam assegurar que possamos generalizar os resultados. Os
p sm n sa d c L . do exem plo acima. p o d en , é claro, .er ido a m ui,os pau,oes d,te,em es c se
guido munas pessoas em várias ocasiões diferemes. D es,a lo ,ma. es,a,ão ma,s seguros de que
suas amostras representam a população. ..... , ,•
O exem plo anterior ilustrou um ponto importante: a habilidade de generalizar re ultai .
de amostras para populações é dependente de amostras que. realmente, representam a popu-
'aC"Âpresentamos aqui a diferença entre amostras e populações. Você irá verificar, quando
ler livros textos de estatística, que os estatísticos possuem maneiras diferentes de d e s ,r v e r
amostras e populações. Estritamente falando, estalísrtcm descrevem amostras. Dessa fo m a
quando calcular a média de uma amostra você terá obtido uma estatística. Se. no entanto, tor
calculada a média de uma população, você deverá denominá-la de p a ra m e, m Enquanto esta
tísticas descrevem amostras, parâmetros descrevem populações. Assim , a media da populaça >
é um parâmetro, e a média de uma amostra é uma estatística. Esta e uma distinção técnica, e
não deve preocupá-lo demasiado desde que você tenha em mente as diferenças entre tecmcas
estatísticas que descrevem amostras daquelas que descrevem populações. Tipicamente u l i
a m o s estatísticas amostrais para estimar parâmetros populacionais. Mais especificam ente,
devem os utilizar estatísticas descritivas para descrever nossas amostras e a estatística infe
rencia! para generalizar estes resultados para a população.
Atividade 2.1
Se você quer descobrir qual grupo, os fãs de futebol ou de rúgbi, é m enos Inteligente,
qual das seguintes am ostras seria m ais apropriada?
■ Um grupo de pessoas que são tanto fãs de futebol quanto de rúgbi

■ Um a am ostra aleatória de pessoas da população geral
■ Um grupo de fãs de futebol e outro de fãs de rúgbi
■ Um grupo de hom ens e outro de m ulheres
■ Um grupo de estudantes de psicologia
■ Um grupo de chim panzés
2.2 Medidas de tendência central

A primeira e talvez a forma mais comum de estatística descritiva que você vai encontrar
são as medidas de tendência central. Uma medida de tendência central de um conjunto de
dados fornece uma indicação do escore típico deste conjunto. Existem tres diferentes medidas
de tendência central tipicamente utilizadas para descrever nossos dados. Vamos iniciar com a
mais popular delas, a m édia, que também é conhecida com o média aritmética.
2.2.1 Média
A media é facilmente calculada por m eio da soma de todos os valores da amostra e. en
tão. pela div isão pelo número total de valores. A média da amostra (5. 6. 9. 2) será:
5+ 6+9+ 2
----------------- = 5.;>0
4
Com outro exem plo, se tivéssem os o seguinte conjunto de dados 2. 20. 20. 12. 12. 19. 19.
25, 20, poderíamos calcular a média com o segue:
■ Somaríamos todos os valores para obter 149.

■ Dividiríamos, então, a soma por 9 (que é o total de valores da amostra) para obter
uma m edia de 16.56.
2 + 20 + 20 + 12 + 12 + 19 + 25 + 20 ^
-------------------------------------------------- --- 16.56
9
Isso nos dá uma indicação do escore típico da nossa amostra. É bastante difícil sim ples
mente utilizar a média de uma amostra com o uma estimativa da media de uma população.
Nunca estam os certos de quão próximos da média da população está a média da nossa amos
tra. embora existam técnicas que podemos usar com o auxílio (p. ex.. intervalos de confiança,
ver p. 121).
2.2.2 Mediana
A segunda medida de tendência central é a m ediana, oficialmente definida com o o valor
que está no m eio da amostra, isto é. que apresenta o mesmo número de valores acima e abai
xo dela. A mediana é calculada com a ordenação de todos os valores e com a tomada do valor
que está no meio. Utilizando os dados 2. 20. 20. 12. 12. 19. 19. 25, 20 (valores anteriores)
para ilustrar o cálculo da mediana, primeiro ordenamos os dados em ordem crescente e atri
buímos um posto a cada um. Assim:
O escore mediano
Valores: 2 12 12 19 Í9) 20 20 20 25
Postos: 1 2 3 4 5 ) 6 7 8 9
O posto mediano
Você pode ver que os valores foram ordenados (linha de cima) e a cada um loi atribuído
um posto (raiik). Dessa forma, o valor mais baixo tem posto um. o próximo posto dois e as
sim por diante.
Estritamente falando, no entanto, quando tivermos dois ou mais valores iguais (com o no
exem plo), os postos atribuídos a valores iguais devem ser iguais. Assim , os postos dos dados
apresentados devem realmente ser os seguintes:
Christine P. Dancey & John Reidy
Valores: 2 12 12 19 19 20 20 20 25
Postos: 1 2.5 2.5 4.5 4.5 7 7 7 9
Posições dos postos: 1 4 9
A média destes A média destes

dois fornece três fornece
um posto de 2,5 um posto de 7
Você pode verificar que todos os valores iguais possuem o m esm o posto. Atribuímos os
postos, no caso. tomando a média das posições que eles ocupam, com o ilustrado acima.
Para encontrar a mediana, precisamos localizar o escore que está no m eio da lista dos
postos. Temos nove valores, desta forma, o escore do meio é o quinto. A mediana é. assim, o
valor 19. que é o quinto valor da lista ordenada dos valores da amostra.
N o exem plo acima, foi lácil determinar a mediana, pois tínhamos um número impar de
valores. Quando se tem um número ímpar de valores, sempre vai existir um que estará no
meio. Este não é o caso. entretanto, quando existir um número par de valores. Se agregarmos
o valor 26 no conjunto de dados anterior, teremos agora um número par de valores.
Neste caso é preciso

tom ar a m édia destes
dois valores do meio
Valores: 2 12 12 19 26
Postos:
Posições dos postos:

O ponto médio
está entre estes
dois postos
Neste caso a mediana será a média entre os dois centrais, isto é, a média entre os valores
que estão na quinta e na sexta posições. A mediana, neste caso. será: (19 + 20) + 2 - 19.5.
.2.3 Moda
A terceira medida de tendência central é a moda. que é simplesmente o valor mais repetido.
No conjunto de valores apresentado acima para ilustrar a média e a mediana, a moda seria 20,
que é o valor que mais se repete.
O valor do conjunto
que mais se repete é a moda
Atividade 2.2
Determ ine a m édia, a m ediana e a moda dos seguintes conjuntos.
■ 12, 23, 9, 6, 14, 14, 12, 25, 9, 12

■ 1,4,5,6,19,1,5,3,16,12,5,4
■ 32,56,91,16,32,5,14,62,19,12
2.2.4 Qual m edida de tendência central você deve usar?
Descrevem os para você ires diferentes medidas de tendência central, isto c. três medidas
de um valor típico em uma amostra. Uma questão permanece, no entanto: qual destas me
didas você deve utilizar para descrever os seus dados? A resposta a esta questão depende do
conjunto que você tem.
O ponto importante a ser levado em conta quando for escolher uma medida de tendên
cia central é que ela deve dar a você uma boa indicação do valor típico da amostra. Se há
razões para suspeitar que a medida de tendência central que usou não fornece uma boa indi
cação do valor típico do conjunto, então você provavelmente escolheu a m edida errada.
A média é a medida mais freqüentemente utilizada e ê ela que deve ser usada, uma vez.
que você esteja convencido de que ela fornece uma boa idéia do valor típico do conjunto. É a
medida a ser escolhida porque é calculada a partir dos valores reais, e não a partir dos postos,
corno é o caso da mediana c da freqüência de ocorrências, a moda.
Existe um problema com a média, no entanto. Em virtude de utilizar os próprios valores
da amostra, é sensível a valores extremos. Observe a seguinte amostra:
1 2 3 4 5 6 7 8 9 10
A média deste conjunto de dados é 5.5 (assim com o a mediana). Se alterarmos um dos
, valores aumentando-o razoavelmente, obteremos o seguinte conjunto:
1 2 3 4 5 6 7 8 9 20
A média deste conjunto é 6,5. enquanto a mediana permanece 5.5. Se aumentarmos o

último valor, obteremos:
1 2 3 4 5 6 7 8 9 KW)
T em os, agora, uma m édia de 14.5. que não é. obviam ente, uma boa indicação do
valor típico deste conjunto de dados. C om o ex iste o m esm o núm ero de valores em cada
um destes conjuntos e alteramos som ente o maior valor de cada um. a m ediana permane
ce com o 5.5. A mediana é. assim , uma medida de tendência central m elhor para os dois
últim os conjuntos. Este exem plo ilustra a n ecessid ad e de checar os dados para verificar
se existem valores extrem os (irem os introduzir uma maneira de fazer isto. m ais adiante)
antes de decidir que m edida de tendência central utilizar. Na m aioria dos casos. você.
p rovavelm ente, verificará que é aceitável o uso da m édia co m o m edida de tendência
central.
Se você encontrar valores extrem os, então a m édia não deverá ser utilizada, neste
caso o m elhor é utilizar a mediana. A m ediana não é sensível a valores extrem os, com o
o exem p lo m ostrou. Isso ocorre porque ela é o valor do m eio dos dem ais quando estes
são ordenados. O procedim ento para localizar o valor m ediano não depende dos valores
em si. a não ser do fato de colocá-los em ordem. A ssim , o maior valor no n osso exem plo
poderia ser 10. 20. 100 ou 100 m ilhões, e a mediana ainda não se alteraria. E esta in sensi
bilidade a valores extrem os que faz a m ediana útil quando não podem os utilizar a média.
C om o a m oda e sim plesm ente o valor que ocorre com maior freqüência, não envolve
qualquer cálculo ou ordenamento dos dados. Então, ela pode ser utili/.ada com qualquer
tipo de dados. Um dos problemas da média e da mediana é a existência de certos tipos de
dados em que não podem ser usadas. Quando tem os categorias de uma variável, tal com o
ocupação, não faz sentido tentar ordená-las. D essa forma, não podem os utilizar a média
ou a mediana. Se você tem este tipo de dados, não tem outra escolha a não ser a moda.
Entretanto, quando utilizam os a moda. precisam os ter certeza de que ela está realmente
fornecendo uma boa indicação do valor típico. Dê uma olhada nos seguintes conjuntos de
dados:
1 2 2 2 2 2 2 2 3 4 5 6 7 8
1 2 2 3 4 5 6 7 8 9 10 11 12
Você deve ter notado que. no primeiro conjunto de dados, o valor 2 se repete bem mais
do que qualquer outro. A m oda. neste caso. será uma medida de tendência central apropria
da. já que ela e uma indicação razoável do valor típico. No segundo conjunto o valor 2 será
novamente a moda. pois é o \alor que ocorre com maior freqüência. N o entanto, aqui. ela
não será um bom indicador, pois sua freqüência de ocorrência e apenas levem ente superior
ao de qualquer outro. Então, neste caso. a moda não deveria ser escolhida com o medida
de tendência central. Algum as vezes você não terá uma medida de tendência central apro
priada. Em tais situações, você deve aceitar o fato de que a amostra não apresenta um valor
típico.
Atividade 2.3
Que medida de tendência central é mais apropriada para os seguintes conjuntos de dados?
(a) 1 23 2 5 2 6 27 23 2 9 30
(b) 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 50
(c) 1 1 2 3 4 1 2 6 5 8 3 4 5 6 7
(d) 1 101 104 106 111 108 109 2 0 0
2.2.5 M édia da população
A s medidas de tendência central que descrevem os são úteis para dar uma indicação do
valor típico de uma amostra. Suponha que queremos uma indicação do valor típico em uma
população. Podemos, teoricamente, calcular a média da população (um parâmetro) de manei
ra semelhante ao cálculo da média da amostra: obter os valores de todos na população, somar
e div idir a soma pelo tamanho da população. Na prática, entretanto, isto não é. normalmente,
possível. Você poderia imaginar com o seria tentar medir o nível de ansiedade causada pela
estatística e a procrastinação de cada indivíduo no mundo? Portanto, devem os estimar os
parâmetros populacionais a partir das estatísticas amostrais.
Uma forma de estimar a media da população é calcular as médias de várias amostras e.

então. calcular as médias destas médias amostrais. Os estatísticos verificaram que isso forne
ce uma boa aproximação da média populacional.
Por que a média das médias amostrais está próxima da média populacional? Imagine que
uma amostra de pessoas é selecionada ao acaso e seus quoeficientes de inteligência (Qls>
são medidos. Sabe-se que. geralmente, o Ql médio da população é 100. Poderia acontecer,
por acaso, que a amostra contivesse apenas gênios, e o Ql médio encontrado fosse de 150.
claramente superior ao valor da população. Se uma outra amostra fosse selecionada, poderia
acontecer de o Ql m édio ser de 75. novamente distante da média populacional, li evidente, a
partir destes exem plos, que a média da amostra não precisa estar próxima do valor da média
populacional. Entretanto, se calcularmos a media destes dois resultados obteremos uma me
lhor aproximação da m édia populacional:
A média das médias amostrais ( 112,5) é uma melhor aproximação da média da popu
lação (100) do que seriam as médias das amostras individuais (75 e 150). Quando tomamos
várias amostras de mesmo tamanho de uma população, algumas terão médias superiores à da
população, enquanto outras terão valores inferiores. Se calcularmos a média de todas estas
médias, teremos um resultado bem próximo do valor 100. que é a média da população. Essa
tendência da media das m édias amostrais de se igualar ao valor da média da população é
conhecida nos círculos estatísticos com o teorem a central do lim ite. Saber que a média das
médias amostrais fornece uma boa aproximação da média da população é importante para
nos auxiliar a generalizar resultados da amostra para a população.
2.3 Erro amostrai
Antes de ler esta seção, você deve completar a Atividade 2.4.

64 Christine P Dancey & John Reidy
Atividade 2.4
Acima tem-se um diagrama contendo figuras de muitos pandas gigantes. Cada panda
gigante tem um número que indica seu Ql. Para ilustrar os problemas associados com o erro
amostrai, você deve completar os seguintes passos e então ler a seção erro amostrai. Imagine
que esta figura represente a população dos pandas gigantes. O Ql médio desta população é
100. Queremos que você selecione dez amostras ao acaso desta população. Cada amostra
deve conter somente dois pandas. Para fazer isso, sugerimos que você balance um lápis sobre
a figura com os olhos fechados. Com a mão livre, mova o livro para os lados. Quando pronto,
deixe a ponta do lápis atingir a página do livro. Veja qual o panda selecionado (se você atingiu
um espaço em branco entre os pandas selecione o panda que estiver mais próximo do ponto
que o lápis atingiu). Tome nota do Ql do panda selecionado e repita o processo duas vezes
para cada amostra. Você deve repetir este processo dez vezes, de modo a obter dez amostras
retiradas da população de pandas. Entendemos que isso não fornece uma seleção aleatória da
população, mas basta, por ora, para ilustrar o que queremos mostrar.
Desejamos agora que você repita todo o processo, mas, desta vez, selecionando dez pan
das em cada amostra. Uma vez sorteadas as amostras, calcule a média de cada uma das
selecionadas (todas as de dois pandas e todas as de dez pandas).
Você pode agora continuar a ler a seção sobre o erro amostrai.
Consiste em um dos problemas da amostragem o fato de os erros sistemáticos poderem

afetar nossa pesquisa e. com o conseqüência, torná-la difícil de interpretar. Por esse motivo, o
erro devido ao processo de amostragem é. lalve/.. o maior problema que enfrentamos quando
estim am os parâmetros populacionais a partir de estatísticas amostrais. Sempre que selecio
narmos uma amostra de alguma população, irá existir incerteza sobre quão representativa a
amostra é realmente. Assim , se calcularmos uma estatística amostrai, nunca estaremos segu
ros sobre o quanto ela poderá diferir do parâmetro populacional. O grau com que a estatística
amostrai difere do parâmetro populacional equivalente é denominado de erro am ostrai. Por
que existe tal erro e com o podem os minimizá-lo?
O erro amostrai ocorre simplesmente porque não utilizamos todos os membros da popu-
lação-alvo. Uma vez que se usem amostras, sempre se obterá algum grau de erro amostrai.
Por exem plo, suponha que desejamos medir o QI dos pandas gigantes. Se fôssem os a campo
e testássemos todos os pandas existentes 110 mundo, calcularíamos o Q1 médio populacional
diretamente. Teríamos testado toda a população e. desta forma, a média que calculam os seria
a populacional.
Agora, suponha que testamos som ente 9 0 ^ da população. Efetivamente selecionam os
uma amostra. A média que calculamos desta amostra será uma boa estimativa da média popu
lacional. mas ela não será necessariamente a mesma. Em virtude de não termos testado todos
os pandas, provavelmente subestimaremos ou sobreestimaremos a média populacional.
O lato de termos selecionado tantos pandas significa que, por acaso, tem os uma boa
probabilidade de selecionarm os elem entos dos dois extrem os da distribuição. Ou seja. é
provável obter tanto pandas inteligentes quanto não tão inteligentes na nossa amostra. Você
deve ter visto, ao completar a Atividade 2.4. que. quando selecionou amostras contendo dez
pandas, em todas elas havia pandas cujos Q ls estavam abaixo e acim a da média. A ssim ,
com tamanhos amostrais relativamente grandes, nossas amostras terão alta probabilidade
de conter pandas inteligentes e não tão inteligentes. A média amostrai será. então, pro
vavelm ente uma estim ativa bastante boa da m édia populacional. C onseqüentem ente, se
tomarmos muitas destas amostras, o grau de erro amostrai para cada uma será provavel
mente bem baixo.
Digam os agora que tem os pesquisadores com uma verba bem reduzida e. com o con se
qüência. eles podem utili/ar som ente amostras contendo dois pandas. Que efeito terá esta
redução do tamanho da amostra no grau de erro amostrai? Novamente nos referindo à A tivi
dade 2.4. você provavelmente notou que. em algumas das amostras que selecionou, os dois
pandas eram mais inteligentes do que a média populacional. Isso significa d i/er que a sua
média amostrai é uma sobreestimativa da média populacional. Você descobriu, ainda, que em
algumas das amostras os dois pandas eram menos inteligentes do que a média populacional.
Sua média amostrai, neste caso. irá subestimar a média populacional. Com amostras peque
nas é, então, mais provável que na totalidade os ursos sejam ou mais ou m enos inteligentes
do que a média populacional. Em tais casos, a média amostrai não será uma boa estimativa
da média populacional. Dessa forma, leremos um erro amostrai bem maior com as pequenas
amostras.
A medida que se amplia a amostra, aumenta a probabilidade de escolha de pandas que terão
Q1 tanto acima quanto abaixo da média populacional. Também diminui a probabilidade de que
todos os pandas selecionados estejam em um dos extremos da distribuição. Desta forma, dimi
nuirá o grau de erro amostrai. Você deve ter notado da Atividade 2.4 que as médias calculadas
a partir de amostras de dois pandas variavam bastante, com algumas bem diferentes da média
populacional, enquanto que nas de dez pandas as médias amostrais eram. provavelmente, boas
estimativas da média populacional. Assim , em geral, quanto maior for o tamanho da amostra
mais próxima a sua média estará da média populacional.
□ SPSSPW: obtenção de medidas de tendência central
Para obter medidas de tendência central a partir do SPSSPW. você deve entrar com os
dados com o descrito no Capítulo 1 e então clicar no menu A n a lyze (Analisar) (veja figura
abaixo).
<t S » « rt| j a d o q w afctn g SPS«. D... « - 11:40
Quando o menu A nalyze (Analisar) aparecer, clique na opção D escriptive Statistics (Lista-
tíslica Descritiva) e então selecione a opção Explore... (Explorar) do menu final. Você obterá
a seguinte caixa de diálogo.
Existem outras opções para determinar estatísticas descritivas, mas a opção Explore
(Explorar) c a m ais flexível. A opção Explore permite que você acesse um grande leque de
técnicas estatísticas descritivas c é. desta forma, uma opção útil para se utilizar. Você poderá
notar que existem várias opções nesta janela de diálogo, incluindo:
■ lista de variáveis
■ caixa para variáveis dependentes (D ependent List)
m caixa para variáveis de agrupamento (Factor List)
m opções de apresentação (D isplay - em baixo à esquerda)
■ várias opções de botões (S ta tistics — Estatísticas. P lots — Diagramas. O ptions —
O pções)
Para obter medidas de tendência central, mova as variáveis de não-agnipamento para a cai
xa da lista das dependentes (D ependem List), selecionando as variáveis de interesse, e clique
na seta preta ►apontando para a caixa da lista das variáveis dependentes (D ependem List I.
* l i IjsJ
Para ohier as estatísticas descritivas relevantes, selecione a opção Statistics (Estatísticas)

(o botão do m eio da opção D isplav - Mostrar) e clique no botão OK. Feito isso. você obterá
a seguinte saída do SPSSPW:
EXPLORE
Case Processing Summary (Sumário do Processamento cos Casos'
Cases (Casos)
Valid (Válidos) Missino Valore? Omasos) Total (Total)
Percent Percent Percent

N (Percentual) N (Percentual) N (Percentual)
WITHDOG (Com o Cão) 6 50.0% 6 50.0% 12 100.0%

NODOG (Sem o Cão) 6 50.0% 6 50.0% 12 100.0%
Descriptives (Medicias Descritivas)
Statistic Std. Error

(Estatística) (biro Padrão)
WITHDOG Mean (Media) 8 6667 - ^ .8819

(Còm o Cãòí 9 5 % Confidence Lower Bound 6 .3 9 96
Interval for Mean (limite inferior)
Média e
(intervalo de Confiança Upper Bound 10.9337 Mediana
dc 95% pa'a a Média) (Limite Superior)
5% Trimmed Mean (Mèdia interna dc b%) 8 .6 2 96
Median (Mediana) 8 .5 0 0 0 '
Variance (Variância) 4 .6 6 7
Std. Deviation (Desvio Padrão) 2.1602
Minimum (Mínimo) 6.00
Maximum (Máximo) 12.00
Range (Amplitude) 6 00
Interquartile Range (intervalo interquartil) 3 .7 5 00
Skewness (Assimetria) .463 .845
Kurtosis (Curtose) - .3 0 0 1.741
NODOG Mean (Média) 4 .0 0 00 .7303

(Sem o Cão) 95 % Confidence Lower Bound 2.1227
Interval for Mean (Limite inferior)
(Intervalo dc Confiança Upper Bound 5.8773
de 95% para a Média) (Limite Superior)
5% Trimmed Mean (Média Interna de 5%) 4 .0 5 5 6
Median (Mediana) 4 .5 0 0 0
Variance (Varianza) 3 20
Minimum (Mínimo) 1 00
Maximum (Maximo) 6.00
Range (Amplitude) 5.00
Interquartile Rango (Intervalo Interquartil) 2,7500
Skewness (Assimetria) -.9 4 3 .845
Kurtosis (Curtose) 586 1.741
V ocê notará, a partir da saída do SPSSPW , que existem m uitas inform ações apresen-
ladas. N ão se preocupe se não entender muitas delas neste estágio: elas serão explicadas
mais adiante no livro. Por enquanto, você deve perceber que. para as duas variáveis, pode-
se ver a m édia e a mediana. Se desejar a m oda. você deve tentar utilizar o F requencies...
(Freqüências), opção do menu A nalyze... (Analisar), submenu D escrip tive S ta tistic s (E s
tatísticas D escritivas), em vez da opção E xplo re... (Explorar). U m a vez obtida a caixa
dc d iálogos F requencies (Freqüências), abra-a e clique no botão S ta tistic s (Estatísticas).
Selecion e a m oda a partir da próxima caixa de diálogo que irá abrir (veja a tela a seguir):
Selecione o menu
Analyze (Analisar) e
após o subm enu
D escriptive Statistics
(Estatística Descritiva)
■¿Miáj 5 J _ U M &j * :f i t : a g vi»

1 wctvidng 3
_UI
pçtcentí?'Jthr.
f~ Quarie.
I” Oj vortttoi ginjpx
P Dapb r Pwçíi^ít I""”"
r VaàiM are ç»out 'j i t u r t ;
Dijperocn D«
Sid d r * w w I- Mrwmar. T 51
r V w r< e r Ma. rin*
f" Rarcj» r* S C rim»'
» I » f t fH « VifM X '•»oW f /*■- /

SP35Proceiwr nr«*}. _r
/ S ta rt ^ S|*4u F Uro* i q wnft ing SPSS tV-
2.4 Descrição gráfica dos dados
Terminada uma pesquisa, é importante que seus dados sejam analisados. Uma das melho
res formas de fazer isso é por meio da AED (Análise Exploratória de Dados). A AHD consiste,
basicamente, em explorar os dados através de técnicas gráficas. E comum se obter um grande en
tendimento de com o os participantes do estudo se comportaram. A importância de tais técnicas
gráficas foi destacada por Tukey cm 1977. no texto clássico denominado de Análise exploratória
de dados (Explorutory data analysis). Analisar dados graficamente deve ser uma das primeiras
coisas a ser feita. Na próxima seção, mostraremos as principais técnicas para explorar os seus
dados, começando com o histograma de freqüências (.frequency h¡singram). Após. explicaremos
os diagramas de caule e folhas {stem and leaj) e o caixa c bigodes (boxptols).
2.4.1 Histograma de freqüências
O histograma de freqüências é uma forma útil de ilustrar graficamente os dados. Muitas

vezes os pesquisadores estão interessados na freqüência de ocorrência de valores nas am os
tras de dados. Por exem plo, se você coletou informações sobre a profissão das pessoas, pode
estar interessado em descobrir quantos trabalhadores estão em cada uma das categorias dc
emprego. Como ilustração considere o histograma de freqüências para um conjunto de dados
coletado em um estudo de Armitage e Reidy (não-publicado). Para investigar o medo causado
N d í T . John W ildcrT ukc) 1 1915-2000).

pelo sangue, os investigadores solicitaram aos participantes que indicassem, a partir de uma
lista de sete cores, qual a favorita. A Figura 2.2 representa o histograma destes dados. Você
deve ser capaz de ver 11a Figura 2.2 quantas pessoas escolheram o azul com o sua cor favorita
com mais frequência e o branco com o sua cor favorita com menos frequência.
H istogram (Histograma)
Histograma mostrando as freqüências de uma cor que as pessoas escolheram como sua
favorita.
O histograma de freqüências é uma boa forma de inspecionarmos os nossos dados visualmen

te. Muitas vez.es, desejamos saber se existem alguns valores que podem parecer fora de contexto.
O histograma da Figura 2.3 representa valores hipotéticos de um questionário sobre depressão.
Você pode verificar a partir dele que o valor final e' bem maior do que os demais. Dado que o
maior valor desta escala de depressão é somente 63. podemos perceber a partir do histograma que
devemos ter cometido um erro quando registramos os nossos dados. Tais problemas são íáceis
de perceber quando os dados süo postos em gráficos. Você deve. no entanto, estar ciente de que u
interpretação do seu histograma depende dos intervalos particulares que as colunas representam.
O histograma da Figura 2.3 tem colunas representando intervalos de uma unidade.
O histograma de freqüências é também utilizado para descobrir outras características
importantes dos dados. Por exem plo, você pode facilm ente ver qual e o valor modal apenas
procurando pela coluna mais alta. Além disso, o histograma nos dá uma boa idéia de com o os
valores estão espalhados, isto é. de com o eles estão distribuídos. A forma com o os dados es
tão distribuídos é importante, com o você poderá constatar, quando discutirmos a distribuição
norm al, mais adiante, neste capítulo. A distribuição dos dados é também uma consideração
importante 110 uso da estatística inferencia! que será discutida. Podemos ver. a partir do histo
grama dos dados do questionário sobre depressão, que existe uma concentração de valores na
região de 5 a 7 e, ainda, os valores das caudas acima e abaixo destes pontos.
’ N. de T. O SPSSPW utiliza o \a lo r N (m aiúsculo) para representar o tam anho Ja am ostra, enquanto i» autores utilizam o \a lo r n
i m inúsculo!.
6 8 10 12 14 16 18 20 22 2 4 -6 0
5 7 9 11 13 15 17 19 21 23
Depression scores (Escores da depressão)
Figura 2.3
Histograma dos dados do questionário sobre depressão.
0 -4 5 -9 1 0 -1 4 15 19 2 0 -2 4 25 ....... 59 6 0 -6 4
Depression scores (Escores da depressão)
Figura 2.4 Histograma dos dados do questionário sobre depressão agrupados em intervalos de
amplitude 5.
A melhor maneira de gerar um histograma manualmente é. primeiro, ordenar os dados,

com o foi descrito anteriormente no capítulo, ao se determinar a mediana. Simplesmente se
conta o número de vezes que cada valor ocorre - esta será a freqüência de ocorrência de cada
escore. A freqüência e, então, registrada no gráfico, com o mostrado.
Atividade 2.5
(a) Qual é o valor da moda?

(b) Qual é o escore menos freqüente?
(c) Quantas pessoas apresentaram um escore de 5?
(d) Quantas pessoas apresentaram um escore de 2?
2.4.2 Diagrama de caule e folhas
Os diagramas de caule e folhas são semelhantes aos histogramas de freqüências no sen

tido de permitirem que se veja como os valores estão distribuídos. Além disso, eles retêm os
valores das observações individuais. Desenvolvido por Tukey. em 1977. são mais fáceis de
construir manualmente do que um histograma. O diagrama de caule e folhas para os dados
que utilizamos a fim de ilustrar o cálculo da média, mediana e moda (2. 12, 12. 19, 19. 20. 20.
20. 25) é apresentado na Figura 2.5.
C a u le F o lh a s
D ezenas U nidad es
2 --------------- O valor 2
2 2 9 9
0 0 0 5 ------- O valor 25
Exemplo de um diagrama de caule e folhas.

Figura 2.5
* N. de T. John WilderItikev <1915-2000).

Você vê as semelhanças entre histogramas e diagramas de caule e folhas se girar o

diagrama de caule c folhas para o lado. Quando fizer isso, terá uma boa representação da
distribuição dos dados.
Você perceberá, então, no exemplo da Figura 2.5. que os valores foram agrupados em
dezenas: a primeira linha contém os valores de 0 a 9: a próxima, de 10 a 19. e a última linha,
os valores de 20 a 29. Dessa forma, neste caso. o ca u le indica as dezenas (este valor é cha
mado de tam anho (lo caule), e as folhas, as unidades. Você verá que o valor 2 é representado
como 0 na coluna das dezenas (o caule) e 2 na coluna das unidades (a folha), enquanto 25 é
representado como um caule de 2 c uma lolha de 5.
O diagrama de caule e folhas na Figura 2.6 foi construído com base nos seguintes dados:
1. 1.2.2. 2.5. 5.5. 12. 12. 12. 12. 14. 14. 14. 14. 15. 15. 15. 18. 18.24. 24. 24. 24, 24. 24. 25.
25. 25. 25. 25. 25. 25. 28. 28. 28. 28. 28. 28. 28. 32. 32. 33. 33. 33. 33. 34. 34. 34, 34. 34. 34.
35. 35. 35. 35. 35.42.42.42. 43.43.44.
C a u le F o lh a s
0 11222555
1 2222444455588
2 44444455555558888888
3 22333344444455555
4 222334
Diagrama de caule e folhas para um grande conjunto de dados.
Você pode perceber pela Figura 2.6 que o diagrama de caule e folhas fornece uma forma
concisa de apresentar um conjunto grande de dados. Algumas vezes, no entanto, o sistema de
agregar os dados em grupos de dez não é muito informativo. Dê uma olhada na f igura 2.7.
que mostra o diagrama de caule e folhas para os dados da depressão apresentados na forma de
histograma (Figura 2.3) anteriormente.
A Figura 2.7 não nos dá muita informação sobre a distribuição dos valores, a não ser o
fato de que eles sãona maioriainferiores a 20.Um sistema alternativo é juntar os valores em
blocos de cinco (p. ex.. 0-4. 5-9. IO-14.15 -19. etc.) No diagramade caule e folhas da Figura
2.8, a variável depressão está agrupada assim. Isso fornece uma melhor indicação da distri
buição dos valores. Veja que utilizamos um ponto (. i após o caule para representar a primeira
metade do grupo de dez valores (p. ex.. 0-4) e um asterisco (*) para representar a segunda
metade de cada bloco de dez valores (p. ex.. 5-9 1.
C a u le F o lh a s
0 0000022222222333333333555555555555555777777777777799999999
1 000000033333888
2 3
6 4
Diagrama de caule e folhas para os dados de depressão agrupados em blocos de dez.

Estes não seriam apresentados nos

histogramas. São apresentados
j aqui apenas em caráter informativo.
M uito m ais inform ativo sobre a

V a lo re s
form a da distribuição
(B lo co s) (C a u le ) (F o lh a s) / 1
0 -4 0. 0000022222222333333333
5 -9 0* 555555555555555777777777777799999999
1 0 -1 4 1. 000000033333
1 5 -1 9 1* 888
2 0 -2 4 2. 3
6 0 -6 4 6. 4
Figura 2.8 Diagrama de caule e folhas para os dados de depressão agrupados em blocos de dez.
2.4.3 Diagrama de caixa e bigodes
Mesmo que você perceba que existe um valor extremo no exemplo da depressão, o caso
c que muitas vezes valores extremos não são tão óbvios. Tukey (1977). contudo, desenvolveu
uma técnica gráfica denominada de caixa e bigodes (hox phn). que nos fornece uma indica
ção clara dos valores extremos, da mesma forma que o histograma e o diagrama de caule e
folhas informa como os valores estão distribuídos.
Embora você possa utilizar o computador para produzir um diagrama de caixa e bigodes,
iremos descrever como construir um a partir dos dados abaixo, de modo que você saiba como
interpretá-lo (o diagrama para estes dados esiá apresentado na Figura 2.9):
2 20 20 12 12 19 19 25 20
■ Primeiro, encontre o valor mediano como descrito anteriormente. E o valor da quinta
posição (o valor mediano é. neste caso. o 19. após os dados terem sido ordenados).
2 12 12 19 ( ^ K 2 0 ^ 20 20 25
A m ediana é o quinto
valor do conjunto ordenado.
■ Após. calcule os quartis. São os valores que separam o conjunto em quatro partes
iguais . O primeiro quartil deixa 25$ dos valores abaixo dele. e o terceiro quartil.
25% dos valores acima dele. Os quartis 1 e 3 forniam os limites inferior e superior da
caixa (veja Figura 2.9). Para determinar o valor dos quartis, adicionamos 1 à mediana
e então dividimos por 2 (lembrar que a mediana está na quinta posição). Assim:
' N de T. O termo í y j /. i u c bixinhs para httx />/<>/ se explica por 'lukey também ler denom inado e>te diagrama de box and i 1;
: N. de T Os quartis são em núm ero de três. O segundo quartil coincide com a m ediana.
Esta lìnha grossa

representa a mediana
30
\
\
\
V
Valores
20 -
adjacentes
Quartis
_ Bigodes
10 -
Caixa /
N = 9
Dados
Exemplo de um diagrama de caixa e bigodes.

Figura 2.9
Os quartis I e 3 são, portanto, o terceiro valor a partir do fim e o terceiro valor a partir
do início da lista ordenada, que no exemplo são o 20 e o 12. respectivamente.
Quartis
Valores: 8 9
Postos: 20 25
■ A partir dos valores dos quartis I e 3, podemos determinar a amplitude interquartílica

“h". que é a distância entre os dois quartis. O valor do terceiro quartil é 20 e o do
primeiro é 12. portanto h = 8 (20 8).
■ Definimos como um valor extremo aqueles que caem a uma distância maior que uma
vez e meia a distância h contada a partir dos quartis I e 3. Uma vez e meia o valor h.
neste caso. é 12 = 1.5 x 8. Assim, quajqucr valor que esteja abaixo de 12 -12 = 0 ou
acima de 20 + 12 = 32 e' classificado como um valor extremo. Os valores 0 e 32 são
denominados de limites intentos.
m Os valores situados entre os quartis 1 e 3 e os limites internos e que estão mais pró
ximos destes limites são denominados valores adjacentes. No nosso exemplo são os
valores 2 e 25. pois 2 está mais próximo de 0. o limite interno inferior, e 25 está mais
próximo de 32. o limite interno superior. Estes valores são ilusírados por uma barra
transversal em cada um dos bigodes.
■ Qualquer valor extremo (aqueles que ficam fora dos limites internos) são mostrados
no diagrama de caixa e bigodes.
Você podo ver na Figura 2.9 que a amplitude "h" é indicada pelo tamanho da caixa ide 12 ate
20) e que não existem valores extremos. As linhas saindo da caixa são os bigodes e representam a
amplitude dos valores que ficam abaixo do primeiro quartil e acima do terceiro, mas ainda dentro
dos limites internos. Qualquer valor que esteja fora dos limites internos é denominado de valor
extremo ou ainda de atípico (outlier). Você pode ver a partir da Figura 2.9 que não existem valores
fora dos limites internos, que são 0 e 32. Os limites internos não são necessariamente mostrados
no diagrama. O maior e o menor valor entre os limites internos (escores adjacentes 2 e 25) são
indicados no diagrama pelas linhas transversais em cada um dos bigodes.
Se agora adicionarmos o valor 33 ao conjunto de dados ilustrado na Figura 2.9. o dia
grama de caixa e bigodes será semelhante ao mostrado na Figura 2.10. Vocc deve notar que
o valor 10 está destacado. Isso c para nos informar que o décimo valor do nosso conjunto de
dados é um valor extremo (atípico), isto é. ele está fora da cerca interna do valor 32. Podemos
querer dar uma olhada neste valor para saber por que ele é atípico, pois poderia ser resultado
de um erro no registro dos dados.
O diagrama ilustrado na Figura 2.11 representa os dados a partir de escores hipotéticos de
depressão apresentados anteriormente no capítulo. Você vê a partir dele que o valor extremo
40
Valor
o10
atípico
30 -
20 -
10 -
0-
-1 0
N = 10
Dados
Diagrama de caixa e bigodes ilustrando um valor extremo
70
60-
50 -
Valores
40 -
atípicos
30 -
20 -
10 -
0-
-10
N = 75
Depressão
Figura 2.11
Diagrama de caixa e bigodes para um questionário ilustrando vários valores extremos.
óbvio (o escore 64) é representado com o tal. Entretanto, existem valores m enos óbvios que
são extremos, com o os valores 18 e 23. Isso mostra que nem sempre é possível apontar quais
valores são atípicos, e. desta forma, o diagrama dc caixa c bigodes é uma técnica bastante útil
para a exploração dc nossos dados. Você notará que o diagrama apresenta um bigode vindo
do topo da caixa. Isso significa que existem valores que estão acima do quartil superior, mas
dentro do limite interno (o valor 13).
Por que é importante identificar valores extremos? Você deve lembrar que muitas das
técnicas estatísticas discutidas no livro envolvem o cálculo de médias. Relembre que também
foi discutido com o a média é sensível a valores extremos. Assim , devem os nos preocupar se
nossos dados contêm ou não tais valores extremos, para que possamos tirar conclusões ade
quadas das análises estatísticas realizadas.
Estritamente falando, não devem os utilizar a maioria das técnicas estatísticas ínfcren-
ciais deste livro se tivermos valores extremos em nossos dados. N o entanto, existem formas
dc se lidar com tais valores. Se você sc deparar com valores atípicos execute as seguintes
etapas:
■ Verifique se anotou ou digitou corretamente os dados.
■ Verifique sc não existe nada diferente do usual com os valores extremos. Por exem
plo. sc você lembra da pessoa que teve tal resultado ter entendido bem as instruções
do teste, se ela com pletou o questionário de forma adequada, se existe algum motivo
para pensar que ela não tenha completado a tareia de lorma adequada.
- Se houver um bom motivo, então você pode remov er o resultado desta pessoa da
análise. Entretanto, quando o relatório lor elaborado, você deve registiai o fato c
colocar o m otivo da remoção daquele v alor.
■ Se não existir nada de especial com o participante além do tato de ele ter apresenta
do um valor atípico, provavelmente, você deve mantê-lo na análise. E legítimo, no
entanto, ajustar este valor de forma que não seja tão extremo e assim não inlluencic
excessivam ente a média. Por que lazer isso?
- Lembre, se estiver utilizando a média é por que está interessado no valor típico
do grupo. Claramente, um valor extremo não é um valor típico, então é legítimo
ajustá-lo para torná-lo mais de acordo com o resto do conjunto.
- Para fazer isso. ajustamos o valor extremo de modo que seja igual a uma unidade
acima do valor mais alto da amostra, mas que não seja um valor atípico. Desta
forma, o participante ainda será reconhecido com o o valor mais alto do conjunto,
mas a sua influência sobre a média e sobre a análise estatística infercncial será
menor.
- C om o exem plo, vamos nos referir aos escores dc depressão já apresentados (veja
Fieura 2 .11). Suponha que exista apenas um valor extremo nesta amostra (o valor
64) e que ele é um escore válido (com o objetivo de ilustração, vamos ignorar os
dois outros valores atípicos desic conjunto). Para ajustar este resultado, encon
tramos o escorc mais alto que não seja atípico. N este caso. o valor é 13. Vamos
ajustar o escore extremo de modo que ele seja uma unidade apenas inaioi do que
13. Para esse exem plo, então, o v alor ajustado será igual a 14.
■ É claro que. se você fizer tais ajustes no v alor, precisa registrar exatamente o que foi
feito quando for elaborar o relatório da pesquisa, de modo que os leitores saibain que
as análises foram realizadas sobre alguns valores ajustados.
Não temos condições de fornecer aqui uma discussão completa deste assunto, mas você
pode encontrar mais informações cm Tabachniek e Fidell (2003).
Estatística sem Matematica para Psicologia 79
Atividade 2.6
Dado o seguinte diagrama de caixa e bigodes:

(a) Qual é a mediana?
(b) Quantos valores extremos existem?
Exemplo da literatura:
comportamento emocional e síndrome do pânico
E ram que pesquisadores se refiram a diagramas de caixa e bigodes em publicações, embora
presumamos que de falo os considerem anles de utilizar muitas das técnicas estatísticas abordadas
neste li\ ro. Um a exceção e' a publicação recente de Baker e colaboradores. N este artigo os autores
relatam um estudo conduzido para investigar diferenças entre pacientes com síndrome do pânico
; sem a síndrome, utilizado com o controle em seus com portamentos em ocionais. Eles concluem
que os pacientes com a síndrome parecem controlar m ais as em oções do que os que não apre-
'cniam a síndrome. Um a das medidas de controle em ocional utilizadas foi a CECS iC oitrraiild
L m o tio n a l C ontrol Scale. de Walson e Greer. 1973). que avalia o grau em que os respondentes
:entam controlar os sentim entos com o raiva, ansiedade e felicidade. O questionário fornece, ain
da. um escore total que representa o "grau de controle em ocional geral" dos respondentes. Na
'¿.vão de resultados, os autores apresentam um diagrama de caixa e bigodes do escore lolal da
CECS para o grupo com síndrome do pânico e para os dois grupos de controle que eles ulili/aram .
Entretanto, os autores não com entam em qual diagrama está sugerida a distribuição dos escores
CECS destes grupos. O diagrama de caixa e bigodes mostra que a distribuição dos escores CECS
rara os três grupos são bastante semelhantes, mas os pacientes com síndrome do pânico tendem a
v r escores CECS total mais altos. Adicionalm ente, existem alguns escores atípicos ev identes em
um dos grupos-controle.
N. de I. hscala do C ontrole hm ocionai de C ounauld.

80 Christine P. Dancey & John Reldy
SPSSPW: geração de descritivas gráficas

□
Para obter histogramas, diagramas de caule e tolhas e diagramas de caixa e bigodes uti
lizando o SPSSPW. você pode utilizar a caixa de diálogo Explore (Explorar). Proceda com o
já descrito anteriormente para obter as medidas de tendência central. Se quer obter medidas
de tendência central e descritivas gráficas, deve selecionar a opção Boili (Am bos) no canto
inferior direilt) da caixa (opção D isplay). Se. no entanto, você quer som ente as descritivas
gráficas, deve selecionar a opção P lois (Plotar), conlorm e abaixo:
Você deve. então, clicar no botão PIo h (Plotar) para especificar que diagrama você quer.
Surgirá a seguinte janela secundária:
_ j _ j M & J » 1 - r i M c i a i n i '»!■»!
_L-
D«C^®8V»---
r' Facfc» l«veb tojertiei P 0'em-andtea* Selecione a
r Ucperüíri)« 'Lx&tt? opção Histogram
r Non* (Histograma)
r bfeX; ntfh «etf»
i a w O n L*wil *Wh t r-v*n» T« d
tim <t
CI - , -r...
1jJ_ if
SPSStvocwo»«i
^ ^ W p jw itR iú tú S a ta I SF IO w çN r )| j i d o ^ iw ln n q si**.*, <> 11
H istogram (Histograma)
2,5
3 2,0 -
O
0
1 1,5 -
£ 1,0
¡T
1) „
t 0,5 H Desvio p a d rão = 2 ,1 6
M édia = 8 ,7 0
0,0 N = 6
6 ,0 8 ,0 10,0 12,0
W ITH D O G (Com o cáo)
D iag ram a d e cau le-e-fo lh as W ITH D O G (Com o cão)
Diagram a de
Frequency Stem and Leaf
caule e folhas
(Freqüências) (Caule e folhas)
4 .0 0 0 6789
2.00 1 02
Stem w id th (Tamanho do caule) 10.00

Each leaf (Cada folha): 1 case(s) (1 caso [1])
W ITH D O G (Com o cão)
Figura 2.12
Saída do SPSSPW fornecendo o histograma, e os diagramas de caule e folhas e caixa e
bigodes.
A seleção por om issão (d e fa u lt) c para os diagramas de caixa e bigodes e caule e to
lhas. Para obter lambem um histograma, selecione a opção e então clique no botão Continue
(Continue). Você retornará para a janela principal e deverá clicar no botão O K para obter os
gráficos desejados. O resultado será o seguinte:
Você obterá um histograma, seguido de um diagrama de caule e folhas e finalmente dc
um diagrama caixa e bigodes. Apresentamos a saída apenas para a condição com o cão. O
SPSS fornecerá ainda a saída para a condição sem o cão. Você deve notar que o SPSS pode
ser configurado para fornecer intervalos diferentes dos demonstrados. Assim , você precisa
checar qual é o tipo de intervalo que o SPSS apresenta.
2.5 Diagramas de dispersão
Uma técnica útil para examinar o relacionamento entre duas variáveis é fazer um diagra
ma de dispersão (.vcattergrams). Um exemplo de tal tipo de gráfico pode ser visto na Figura
2.13 para as variáveis ansiedade estatística e procrastinação apresentadas no Capítulo 1. Estes
dados são mostrados novamente abaixo:
Escores para a ansiedade estatística: 50 59 48 60 62 55
Escores para a procrastinação: 96 132 94 110 140 125
O diagrama de dispersão coloca uma variável no eixo dos "x" e a outra variável no eixo
dos “y’\ A Figura 2.13 fornece os valores para a procrastinação representados no eixo x e a
ansiedade estatística no eixo y. Ela dá uma boa ilustração de como as duas variáveis estão
relacionadas. A partir do resultado, vemos que. geralmente, a ansiedade estatística aumenta
com a procrastinação. Assim, parece haver um relacionamento entre as duas variáveis. Os
escores parecem estar bcni próximos de uma linha imaginária que vai do canto inferior direito
ao canto superior esquerdo. Chamamos este tipo de resultado de relação positiva.
Suponha que no seu estudo da ansiedade estatística você achou que. à medida que a ansie
dade estatística aumentava, a procrastinação, diminuía. Como você imagina que o diagrama
dc dispersão será? Você constatará sua semelhança com o apresentado na Figura 2.14.
Veja no diagrama de dispersão da Figura 2.14 que. quando a procrastinação aumenta, a
ansiedade estatística decresce. Os escores parecem esiar agrupados em torno de uma linha
imaginária que vai do canto superior esquerdo ao canto inferior direito. Podemos dizer que
temos. aqui. uma relação negativa. Como se pareceria o diagrama de dispersão se não exis
tisse um tipo perceptível de relação entre as duas variáveis? O gráfico apresentado na Figura
2.15 dá uma indicação de como ele poderia ser.
Escore de ansiedade
estatística de 55 e
procrastinação de 125
110 120 130 140 150

Procrastination (Procrastinação)
Figura 2.13 Diagrama de dispersão para os dados da ansiedade estatística e procrastinação

apresentados no Capítulo 1
Padrão de pontos descendentes

quando nos movemos
Figura 2.14 Diagrama de dispersão indicando que um decréscimo na ansiedade estatística corresponde
a um acréscimo na procrastinação.
0 padrão se assemelha
Figura 2.15 Diagrama de dispersão indicando ausência de relacionamento entre ansiedade estatística
e procrastinação.
Note que o arranjo de pontos do diagrama de dispersão ilustrado na Figura 2.15 parece
ser aleatório. Dessa forma, tais diagramas são úteis para se examinar o relacionamento entre
duas variáveis, como será discutido com mais detalhes no Capítulo 5.
Atividade 2.7
Dado o seguinte diagrama de dispersão, qual é a conclusão mais apropriada sobre o rela
cionamento entre o preço do petróleo e a satisfação do motorista?
60 70 80 90 100
Price of petrol (Preço do petróleo)
□ SPSSPW: geração de diagramas de dispersão
Para obter diagramas de dispersão utilizando o SPSSPW. clique no menu Graplis (Gráfi
cos) e então selecione a opção Sçatter... (Dispersão). Você obterá a seguinte janela:
2.6 Erro de amostragem e relacionamento entre variáveis
Você deve lembrar que. anteriormente, explicamos o problema associado com o erro
de amostragem. Comentamos que. em virtude do erro, a média da amostra pode não ser
um bom indicador da média populacional. Você deve notar que o erro de amostragem não
está limitado a circunstâncias em que queremos estimar a média de uma população. Ele
também é uma questão importante quando queremos determinar o relacionamento entre
duas variáveis. Suponha que realizamos um estudo relacionando ansiedade estatística
e procrastinação e que não exista, de lato. relação entre as duas variáveis. A título de
ilustração, vamos supor que temos apenas 50 escores de pessoas na população. Se você
retira duas amostras diferentes desta população, uma contendo somente 3 pessoas e a
outra contendo 20 pessoas, poderemos obter diagramas de dispersão que se assemelham
às l-igura 2.17 (a) e (b). Nesses diagramas pode-se perceber que aparentemente não existe
relacionamento entre as variáveis. Quando a procrastinação aumenta, não existe um pa
drão consistente de variação da ansiedade estatística. Nesse caso. as nossas amostras são
boas representantes da população subjacente.
Se agora selecionarmos mais duas amostras (uma contendo 3 e a outra contendo 20
pessoas), podemos obter os diagramas mostrados nas Figura 2.18 (a) e (b). Nesse caso. no
diagrama com 3 pessoas podemos concluir que é possível um relacionamento negativo en
tre as duas variáveis. Quando a ansiedade estatística diminui, a procrastinação aumenta. Na
amostra com 20 pessoas, entretanto, a sugestão é. novamente, de que não existe relacio
namento aparente entre as variáveis. Você pode ver que uma amostra pequena não reflete
acuradamente o padrão da população, enquanto a maior o faz.
70 -
„rç 60 -
0
3•/1 40 -
c
<
fT 3 0 -
X
c<0
1 20 -
!T3
* 10
0-
20 40 60 80 100
Figura 2.16 Diagramas de dispersão da população de escores de ansiedade estatística e

procrastinação.
„ 70- ^ 70 n
sJ
á 60- 1 60-
2 □
□ &
t 50- s 50- □ D
_
-5 'Z D □
5 40 - § 40- D □
< <
>■ 3 0 - ^30-
Qj
□
o
□
X X
□ □ □
an
KJ
1
= 20-
0
St \S) □
□d
2 10- | 10-
•E «3 □
5 0 □ & 0 □
i i i
20 40 60 80 100 20 40 60 80 100
Procrastination (Procrastinação) Procrastination (Procrastinação)
(a) (b)
Diagrama de dispersão indicando ausência de relacionamento entre ansiedade estatística

Figura 2.17
e procrastinação sugerida pelas amostras de 3 e 20 pessoas.
/0 -r
■E 6 0 - 5 60-
n
50 -
*lo 50-
"b
40- %4 0 -
c
< <
30 - 5» 30 -
X
20 - 1 20-
V/»
10 - '■5 10-
0 (/1
20 40 60 80 100 20 40 60 80 100
Procrastination (Procrastinação) Procrastination (Procrastmaçáo)
(a) (b)
Diagrama de dispersão ilustrando um relacionamento negativo entre ansiedade estatística

Figura 2.18
e procrastinação sugerida pela amostra de 3 pessoas, mas não pela de 20 pessoas
Finalmente, se você selecionar mais duas amostras, poderá obter o padrão ilustrado na
Figura 2.19. Aqui você deverá ser capaz de perceber que a amostra de 3 pessoas não sugere
inferir um relacionamento entre as duas variáveis, mas de 20 pessoas sim. Se observar a
Figura 2.19. perceberá que parece existir um padrão na amostra de 20 pessoas sugerindo
que, quando a procrastinação aumenta, a ansiedade estatística também cresce. Nesse caso.
a amostra maior não representa acuradamente o relacionamento existente na população, ao
passo que a menor sim.
Você deve notar que é muito menos provável de se obter uma situação como a ilustra
da na Figura 2.19 do que nas Figuras 2.17 e 2.18. Como indicado anteriormente, amostras
grandes apresentam uma probabilidade maior de representar corretamente a população em
estudo. Hmbora o cenário da Figura 2.19 seja improvável, pode ocorrer. Então, você dev e ser
cuidadoso ao generalizar os resultados de amostras para populações.
88 C h r s t ne P Dancey & John Reidy
Statistics anxiety (Ansiedade ostatisi« .i)
4U 60 80
Procrastmation (Procrastinação) 40 60 80
(a)
(b)
Figura 2.19
e ProcrTsînaçâoûgeHds p e la ^ -jJ)1p^ssoas^âTn^pela^tte
dados de amostras está sujeita to ' c m » arnioni g*neral,2açao que se P °ssa fazer a partir de
tados de urna amostra refletem o uue o -nm.* ’• a™eme cstaremos certos ^ que os resul-
dispersão ilustraram, os dados amostrais podem nos'e n ^ a ! ^ « ! ? 0 ' C° m° dÌagramas de
valores completamente diferente do padrão d à Z . r Um padrã° de
- — a - b a b .lid a d e de que
Agora apresentamos quatro técnicas úteis mra íhwrrir r.

tão importante fa/er isso? Certamente não e o-in m ■ ‘ h amenlc os dados- Por que é
sam vender cada v e/ mais pacotes sofisticados mas Mm no!' ? ” npa,lhias de sof,w are P1» '
íorma com que os dados se distribuem M niu« i r P q c "’iportante e uni conhecer a
neste livro fa/em suposições sobre com o os 1 °" ? te* estatIst,cos 4 ue <erão apresentados
válidos somente se os s e s ^ ^ M „ d,!?nhuídM - ^ di/er. os testes são
distribuições de que - • *
- u j T , * * ”* * * « * vWa
de testes, tendem a ser normalmente distribuídas’ t o T T n T ™ * * reSU'tud° S
2.20. Em nossa pesquisa, podemos utilizir esJ- ' r " - pJ,etern com as Cllrvas da Figura
forma de distribuição das populações. I: por esserr ° ™ a<,aopara ,ormular hlP(>teses sobre a
nicas estatísticas utilizadas por nós consider.m *” ° " ° 4U,C ‘" UJlas das mais poderosas téc-
amostras são distribuídas normalmente * ^ ^ P° P Ç° eS das quais reliramos nossas
tes « S P0PU,aÇá° - “ ada normal, deve apresentar as se.u in -
■ A população deve ser simétrica em torno da média

■ As caudas encontram o eixo .v no infinito.
■ A população deve ter a forma de sino.
Distribuições normais.
Figura 2.20
Todas as distribuições na Figura 2.20 são normais: embora não sejam exatamente as
mesmas, apresentam as características descritas. Você pode ver que diferem cm termos de
dispersão e na altura no centro. Observe que. se tivermos uma distribuição normal, a média, a
mediana e a moda coincidem. Outra característica importante é ser uma função da sua média
e do seu desvio padrão (explicaremos o desvio padrão mais adiante neste capítulo). O que se
quer dizer é que. uma ve/, conhecidos a média e o desvio padrão, podemos desenhar a curva
por meio de sua fórmula. Não apresentaremos esta fórmula aqui; apenas lembre que qual
quer distribuição normal pode ser desenhada, uma ve/ que se saiba sua média e seu desvio
padrão.
Como já apontamos, muitas variáveis que ocorrem naturalmente se revelam normais quan
do ploiadas. Percebe-se. também, que, quanto mais valores destas variáveis são plotados. mais
elas se assemelham a uma normal. Um exemplo simples pode serv ir como ilustração. Se você
selecionar lü homens e medir suas alturas em polegadas, os histogramas de freqüências lerão a
aparência da Figura 2.21 (a). Está claro que. nesse caso. ela não lembra muito as distribuições
normais ilustradas na Figura 2.20. Se você selecionar mais 10 homens e colocar em um gráfico
todas as 20 alturas em polegadas, a distribuição resultante poderá ser semelhante à da Figura
2.21 (b). que. novamente, não tem muita semelhança com uma curva normal. Você poderá ver.
entretanto, que. à medida que selecionamos mais homens e registramos suas alturas, o histo
grama torna-se cada vez mais aproximado de uma distribuição normal (Figura 2.21 (c)até(e)).
Quando selecionamos 100 homens, pode-se perceber que teremos uma distribuição normal
quase perfeita. Obviamente, "fabricamos" esses dados para servir de exemplo, mas. cm geral,
é o que acontece com muitas variáveis com as quais você lidará.
Nada
parecido com
uma normal
(b) 20 homens
4 ■
60-61 6 4 -6 5 6 8 -6 9 7 2 -7 3 7 6 -7 7 60-61 6 4 -6 5 68 69 72 73 7 6 -7 7
(c) 30 homens
5
Com 30 homens,
a distribuição começa
a parecer normal
Com 100 homens, temos
" finalmente uma distribuição
que é praticamente normal
60 61 64 65 6 8 -6 9 72-73 76 -7 7
Figura 2.21 Histogramas mostrando a progressão para uma distribuição normal à medida que mais
pessoas são adicionadas à amostra.
2.8 Variação ou dispersão de distribuições
Introduzimos as medidas de tendência central, que fornecem uma indicação do valor

típico de uma amostra. Outro aspecto importante de uma amostra ou população de valores
é quão dispersas elas são. Ou explicitando de outra forma, quanta variação existe em uma
amostra ou população.
2.8.1 Amplitude
Uma maneira simples de se ler uma indicação da dispersão dos valores de uma amostra
ou população e' comparar o valor máximo com o mínimo. Esse resultado é conhecido como
amplitude. A amplitude é simplesmente a diferença entro os valores máximo e mínimo. Por
exemplo, a amplitude dos escores de depressão na Figura 2.3 é 64. isto é. 64 menos 0. Nesse
exemplo, o escore mais baixo é 0 e o mais alto. 64. de modo que a amplitude é 64.
Embora a amplitude nos informe sobre a variação total do conjunto, não fornece qual
quer indicação do que ocorre no interior do conjunto. Por exemplo, dê uma olhada nas duas
distribuições na Figura 2.22. Estes histogramas são gerados a partir de dois conjuntos de
dados que têm a mesma média (16) e os mesmos escores mínimos e máximos (5 e 27). Am
bos apresentam, portanto, a mesma amplitude, que é 22 (27 menos 5). Elas são. entretanto,
distribuições totalmente diferentes; os valores da distribuição B estão distribuídos em grande
parte próximos da média, enquanto na distribuição A estão bem mais espalhados. De forma
ideal, precisamos ter uma idéia da variação total de uma distribuição e de quanto os valores
variam em torno da média. Assim, embora a amplitude forneça uma idéia da variação total
dos valores, ela. de fato, não nos dá uma idéia da forma global da distribuição dos valores de
uma amostra.
Histogram (Histograma) Histogram (Histograma)

30
Desvio padrao = 4,81 Desvio padrão = 3,54
Média = 16.0 Média = 16,0
N = 58 N = 58
1.1%)
y (I
10
I
6,0 9,0 12,0 15,0 18,0 21,0 24,0 27,0 9,0 12,0 15,0 18,0 21,0 24,0 27,0
VAR00002 VAR00001
Conjuntos com mesma média e mesmo valor máximo e mínimo, mas que apresentam
Figura 2.22
diferentes distribuições em torno da média.
2.8.2 Desvio padrào

Uma medida mais informativa da variação dos dados e o desvio padrão. Um dos pro
blemas da amplitude é que ela não nos informa o que está ocorrendo com os valores entre o
mínimo e o máximo. O desvio padrão, no entanto, fomcce uma indicação do que ocorre entre
os dois extremos. A razão do desvio padrão poder fazer isto é ele informar o quanto os valores
do conjunto variam em torno da média. O desvio padrão é um conceito muito importante e.
por isso, vale o esforço empreendido para compreendê-lo. Sua importância decorre da utili
zação como base para muitas das técnicas de análise de dados.
92 Christine P. Dancey 8t John Reidy
O desvio padrão é a medida de quanto os valores da nossa amostra variam em torno d

média. Cada valor de uma amostra terá um desvio cm relação à média. Se subtrairmos a média
de cada valor, teremos uma indicação dc quão longe cada um está dela. Assim como ocorre
com qualquer conjunto, podemos então calcular a média dos desvios em relação à média
denominada de média dos desvios. Para fazer isso. devemos somar todos os desvios e dividir
o resultado pelo número de dados do conjunto. Hsse procedimento, entretanto, apresenta um
problema relacionado com a propriedade de a média ser o ponto de equilíbrio ou centro de
gravidade do conjunto. Por isso. a soma de todos os desv ios em torno dela será sempre Ü. não
importa o tipo de conjunto com o qual estejamos trabalhando. Isso está ilustrado abaixo:
M édia
D esvios em
relação à m édia
Se som arm os
estes valores,
iremos obter zero
Esse resultado, então, não será de utilidade para informar como o grupo todo está se com
portando em relação à media. Uma maneira de resolv er o problema é elevar cada um desses
desvios ao quadrado, de modo a eliminar os valores negativos. Feito isso, podemos então
calcular a média dos desvios ao quadrado para obter uma indicação da expansão do conjunto
como um todo. Esse resultado é conhecido como variância. Há um problema com a variância:
baseia-se nos quadrados dos desv ios e. assim, não está expressa na mesma unidade dos dados
originais. Por exemplo, se os nossos valores fossem segundos, a variância seria expressa em
segundos ao quadrado. Para obter uma medida compatível com os valores originais, utilizare
mos a raiz quadrada da variância, que é denominada desvio padrão.
Um exemplo simples ilustra lodo o procedimento. Suponha que temos o seguinte conjun
to de valores coletados de um estudo sobre o número de barras de chocolate consumidas por
semana: 1.4. 5, 6. 9. 11. Para calcular o desvio padrão, procederemos da seguinte forma:
■ Primeiro calculamos a média, que e' 6.
■ Os desvios a partir da média de cada um dos valores são: —5, —2. —I, 0, 3, 5 (se você
somar estes valores, poderá verificar que o resultado é 0):
■ Para eliminar os valores negativos, vamos elev ar cada um destes desvios ao quadrado,
obtendo os seguintes resultados: 25, 4. 1.0. 9. 25.
■ A seguir, é calculada a media destes resultados, que é lü.67, isto é. 64 6. fornecen
do a variância.
■ Finalmente, o desvio padrão é obtido por meio da rai/ quadrada da variância, dando
como resultado o valor 3.27.
O valor de 3.27 do desvio padrão é um indicativo de quão próximo os valores estão d
média do conjunto de dados. Hm geral, você vai verificar que aproximadamente lO'/r dos
dados estão situados em um intervalo de desv io padrão a contar da média. No exemplo acima,
o desvio padrão é 3.27. indicando que a maioria dos valores desta amostra está 3.27 unidades
acima ou abaixo da média. Isto é. aproximadamente 70% dos valores estarão entre 2.73 (6
menos 3.27) e 9.27 (6 mais 3.27). O desvio padrão é útil quando você quer comparar amostras
que apresentam a mesma média. Suponha que tenhamos uma segunda amostra que apresenta
um desvio padrão de 6.14. Se a compararmos com a do exemplo anterior, que apresenta um
desvio padrão de 3.27. pode-se perceber que. no exemplo, os dados estão bem mais próximos
da média do que nesta segunda amostra.
M édia
4 5 (6 ) 9 11 ------Valores originais
D esvios a partir _2 -1 ü 3 5
da m édia
25 4 1 0 9 25 D esvios ao qu ad rad o
Atividade 2.8
Se você tem a variância de um conjunto de valores, como calcularia o desvio padrão?

Qual(is) das seguintes é (são) uma definição razoável de desvio padrão?
(a) 0 desvio padrãoé o valor máximo menos o valor mínimo.
(b) Odesvio padrãoé o total de valores de uma amostra dividido pelonúmero de valores
da amostra.
(c) Odesvio padrãoé uma medida da variação dos valores emtornoda média.
(d) 0 desvio padrãoé a raiz quadrada da variância.
□
SPSSPW: obtenção de medidas de variação
Para obter medidas de variação utilizando o SPSSPW, você deve seguir as instruções
apresentadas anteriormente ao se gerar medidas de tendência central. Se você clicar na caixa
de diálogos Explore (Explorar), como descrito previamente, obterá uma saída semelhante à
apresentada a seguir:
EXPLORE
Case Processing Summary (Sumário do Processamento dos Casos)
Cases (Cdsos)
Valid (Válidos) Missing (Valu'ei Omissos) Total (Total)
Percent Percent Pcrcont

N (Percentual) N (Percentual) N (Percentual)
WITHDOG (tom o Cào) 6 50.0% 6 50.0% 12 100.0%

NODOG (Sem o Cão) 6 50.0% 6 50.0% 12 100.0%
Descriptives iMedidas Descritivas)

(Esta: stica' (erro Padrão)
W ITHDOG Mean (Média) 8 6667 .8819

(Com o Cao) g ^0/o ç onflcjence Lower Bound 6 3996
Interval for Mean (Limite Inferior)
(intervalo de Confiança Upper Bound 10 9337
de 9b% para a Média) (Limite Super.on
5% Trimmed Mean (Média Interna de 5%) 8 .6 2 96
Median (Medina) 8 .5 0 00
Variance (Variância) 4 .6 6 7 ,
Std Deviation (Desvio Padrão) 2 1602 ■
< Variância,
Minimum (Mínimo) 6.00 desvio padrão
e amplitude
Range (Amplitude) 6 .0 0 '

Interquartile Range (Intervalo Intern.lartil) 3 7500
Skewness (Assimetria) 463 .845
Kurtosis (Curtosc) - .3 0 0 1.741
NODOG Mean (Média) 4 .0 0 0 0 .7303

(Sem o Cao, g^0/0 Confidence Lower Bound 2 1227
Interval for Mean (Limite mfenor)
(intervalo de Confiança Upper Bound 5.8773
de 95% para a Méd.a) (limne Superior)
5% Trimmed Mean (Média interna de 5%) 4 .0 5 5 6
Median (Mediana) 4 .5 0 0 0
Variance (Variância) 3.200
Std. Deviation (Desvio Padráo) 1.7889
Minimum (Minimo) 1.00
Maximum (Maximo) 6.00
Range (Amplitude) 500
Interquartile Range (intervalo mterquartih 27500
Kurtosis (Curtosc) .586 1.741
Você pode observar que a saída apresenta os valores da variância, do desvio padrão e da
amplitude.
2.9 Outras características das distribuições
Agora apresentamos as formas de medir o espalhamento das distribuições. Outra manei

ra de as distribuições diferirem é quanto ao formato do modelo ou gráfico: se são mais ou
menos achatadas, ü grau de achatamento ou afunilamento de uma distribuição é conhecido
como curtnse. Se uma distribuição tem o formato de um pico (funil invertido), então ela é dita
leptocúrtica: se e' achatada, phiticúrtica. As distribuições entre os dois extremos são denomi
nadas de mesocúrtieas (ver Figura 2.23).
Você não precisa se preocupar muito com a curtose neste estágio de iniciação na es
tatística. Nós a introduzimos aqui por dois motivos: primeiro para que você tenha lima
boa compreensão das distribuições e de como elas podem ser diferentes: segundo, porque
quando você utiliza o SPSSPW para obter medidas descritivas, vê este tipo de medida
entre as demais. Quando isso acontecer, você saberá ao que elas se referem, quais valores
positivos sugerem que a distribuição é leptocúrtica e quais valores negativos indicam que é
platicúrtica. Um valor zero informa que você tem uma distribuição mesocúrtica.
Platicúrtíca
Figura 2.23
Distribuições não-normais
Embora muitas variáveis sejam aproximadamente normais, quando plotadas muitas

vezes não têm esta forma. As vezes, os desvios de normalidade são conseqüência de erros
amostrais. É importante verificar o formato da distribuição, já que muitas das técnicas estatís
ticas utilizadas neste livro partem do pressuposto de que os dados analisados são distribuídos
normalmente. Você pode conferir a forma de uma distribuição por meio da construção do
histograma. Se verificar que os dados diferem accnluadamente de uma distribuição normal,

então considere a utilização de uma técnica estatística que não precise da suposição da norma
lidade dos dados. Kssas técnicas são denominadas de distribuição livre ou não-param étríca
e serão abordadas no Capítulo 15. Os dois itens seguintes ilustram as maneiras mais comuns
pelas quais a distribuição pode desviar-se de uma normal.
2.10.1 Distribuições assimétricas

Uma das principais causas de desvio da normalidade é a resultante da assimetria. As
distribuições apresentadas na Figura 2.24 são assimétricas. Você pode ver que. quando com
paradas com a normal, não são simétricas. A distribuição que apresenta uma cauda maior para
a direita é dita positivam ente assim étrica (Figura 2.24 (a>). A distribuição que tem uma cauda
maior à esquerda é denominada dc negativam ente assim étrica (Figura 2.24 (b )).
Se uma distribuição apresentar acentuada assimetria, você deve ter muita cautela ao uti
lizar a média como medida de tendência central, p o is os valores das caudas irão distorcer o
valor da média. Hm tais casos, é recomendável utilizar a mediana ou a moda. que serão mais
representativas do valor típico da sua amostra.
Como ocorreu com a curtosc. a saída dada pelo SPSS para as estatísticas descritivas
também fornece uma medida de assimetria. Aqui. um valor positivo sugere uma distribuição
positivamente assimétrica, enquanto um valor negativo sugere uma distribuição negativamen
te assimétrica. Um valor 0 informa que a distribuição é simétrica. Se você observar a saída
mostrada na página 94. você verá um valor de assimetria de 0.46 para a condição "com o
cão”, indicando uma pequena assimetria positiva ou para a direita. Também temos um valor
de -0.94 para a condição “sem o cão", indicando uma cauda relativamente grande para a
Distribuição Distribuição
“ positivamente negativamente —
assimétrica assimétrica
Histogram (Histograma) Histogram (Histograma)
Desvio padrao = 4 ,74 Desvio padrão = 4,74

= fi £ Média = 13,5
Freqüências
2,5 5,0 7,5 10,0 12,5 15,0 ,5 / 5,0 7,5 10,0 12,5 15,0 17,5 20,0
VAR00003 \ VAR000001
Caudas
(a) (b)
Figura 2.24
Distribuições assimetricamente positivas e negativas.
esquerda ou uma distribuição com acentuada assimetria negativa. Valores de assimetria em

tomo de 1 (ou -1) indicam desvios da normalidade tão extremos que muitas das técnicas esta
tísticas apresentadas neste texto não poderão ser utilizadas.
2.10.2 Distribuições bimodais
Ocasionalmente, você pode obter uma distribuição como a representada na Figura 2.25.
E conhecida como uma distribuição bimodal. Esse tipo de distribuição é, claramente, não-
normal. Se você se defrontar com tal tipo de conjunto, é conveniente que os dados sejam
examinados de perto, pois pode existir algum fator que faça os dados se agruparem cm tomo
das duas posições modais. Se nada de diferente estiver ocorrendo, os dados devem ser trata
dos como provenientes de duas populações distintas. Relate que está frente a uma distribuição
bimodal e registre as duas modas.
Um bom exemplo de dados bimodais e' apresentado por Morris e colaboradores (1981). Neste
estudo, eles procuraram relações entre lembranças de resultados de partidas de futebol e conhe
cimento de futebol, medidas por meio de uma prova sobre o assunto. Quando os pesquisadores
examinaram os resultados desta prova, verificaram que era bimodal. Explicou-se o fato pela exis
tência de duas populações distintas de pessoas no estudo: uma formada por entusiastas do futebol
e outra não. Os tas de futebol se agruparam próximos do escore máximo da prova, enquanto os que
não eram lãs se agruparam próximos do escore mínimo, formando uma distribuição bimodal.
Agora mostramos a você como e a aparência de uma distribuição normal e algumas formas
de se desviar da normalidade. Em virtude da importância da distribuição normal na estatística, um
D uas ,
m o das \
/ H istogram \
(Histograma) \
Desvio p adrão = 13,65

M édia = 2 0 ,0
N = 40
15,0 2 0 ,0 2 5 ,0 3 0 .0 3 5 ,0 4 0 ,0
VA R 00004
Distribuição bimodal
Figura 2.25
dos principais objetivos da representação gráfica dos dados é verificar se eles são normalmente
distribuídos. Talvez as melhores técnicas gráficas para verificar se os dados são ou não normal
mente distribuídos sejam os histogramas e os diagramas de caule e folhas. Se você der uma nova
olhada na Figura 2.21 (e), verá o exemplo de um histograma que mostra uma distribuição normal.
Por outro lado. a Figura 2.23 é o exemplo de uma distribuição que apresenta uma assimetria posi
tiva leve. Compare-a com a Figura 2.24 (a) e verá que cias são semelhantes na forma.
Uma das limitações do diagrama de caixa e bigodes é a dificuldade de. algumas vez.es. a
partir dele. verificar se uma distribuição se desvia da normalidade. Como indicação, as Figu
ras 2.26 (a) e (c) fornecem exemplos de distribuições com dados normais e não-normais.
(a) Dados distribuídos norm alm ente
6- ______
_ Bigodes do m esm o
4 ._ tam anho em cada um
_..— dos lados da caixa
2 ■ ------
Dados
(b) D ados com assim etria negativa
6 - -
O lado de cim a
4 ■ da caixa não
apresenta bigode
2 ■
Dados
(c) Dados com distribuição bimodal
8
1
1
2 -
Dados
Figura 2.26 Diagramas de caixa e bigodes ilustrando (a) distribuição normal, (b) com assimetria
negativa c (ç) dados com distribuição bimodal.
A Figura 2.26 (a) foi gerada a partir de dados normalmente distribuídos (1. 2. 2. 3. 3.3. 4.
4 .4 .4 .5 .5 , 5.6. 6. 7). Mostra que a mediana está no centro da caixa e apresenta dois hicodes
de mesmo tamanho. Não existem valores atípicos.
A Figura 2.26 (h) foi gerada a partir de dados negativamente assimétricos (1.2. 3. 3. 3.
4. 4. 4. 5. 5. 5. 5. 5. 5. 5. 5). Mostra que a mediana está deslocada para cima e próxima ao
limite superior da caixa. Não existe bigode saindo do topo da caixa. Este é um exemplo ex
tremo. mas sempre que a mediana estiver mais próxima de um dos lados da caixa, o bigode
daquele lado será mais curto ou não existirá. Então você deve suspeitar dc que possui dados
assimétricos.
Finalmente, a Figura 2.26 (c) foi gerada a partir de dados com distribuição bimodal (1.
2, 2, 3. 3, 3. 3, 3. 4. 4. 5, 5, 5, 5. 5. 6. 6. 7). Surpreendentemente, o diagrama parece exata
mente como o da Figura 2.26 (a) e é um bom exemplo para ilustrar que se deve ter muita
cautela quando se tentar verificar a normalidade dos dados a partir de um diagrama de caixa
e bigodes. Isso mostra por que o histograma e, de certo modo, o diagrama de caule e folhas
fornecem um melhor indicativo de que os dados estão normalmente distribuídos. Felizmente,
dados que apresentam distribuições bimodais não são muito comuns em pesquisa, e. assim,
o diagrama de caixa e bigodes pode fornecer uma indicação razoável dc que os dados estão
normalmente distri buídos.
Atividade 2.9
Quais das seguintes distribuições são normais e quais não são?

100 Christine P. Dancey & John Reídy
experiencia de utilização de computadores e atitudes em relação a eles
Mesmo que todos os pesquisadores que utilizam técnicas estatísticas abordadas neste livro
usassem histogramas, na verdade este recurso poueo aparece em relatórios publicados. Urna
agradável exceção é o artigo recente publicado por Garland e Noyes (2004). Neste esludo, os
pesquisadores examinaram aspectos que melhor prevêem atitudes em relação ao uso de compu
tadores. Concluíram que os questionários atuais que medem a experiência com computadores
são inadequados em termos de previsão das atitudes em relação aos mesmos. Parte do questioná
rio que aplicaram aos estudantes universitários solicitava informações sobre o quanto utilizavam
computadores, ü s autores apresentam as análises destas informações utilizando histogramas.
Argumentam que. em virtude de utilizarem uma amostra relativamente grande, seria mais apro
priado usar histogramas para examinar a distribuição das respostas do que outras medidas mais
sensíveis de distribuição. Sugerem que os anos de uso de computadores declarados pelos partici
pantes é normalmente distribuído, mas com alguma curtose evidente, refletindo um pico entre o
l/ e o 1lhanos. Indicam, ainda, que o número de horas de uso dos computadores é positivamente
assimétrico e com curtose positiva.
□ SPSSPW: geração de curvas normais e histogramas
É bastante útil fazer uso do SPSSPW para mostrar uma distribuição normal sobreposta a
um histograma, de modo a auxiliar a percepção da normalidade dos dados. Infelizmente, não
é possível fazer isso com a caixa de diálogos Explore (Explorar). Para tal. deve-se gerar o his
tograma utilizando o menu Graphs (Gráficos), em vez do menu Analyze (Analisar). Quando
clicar no menu Graplis, notará que existe uma opção para todas as técnicas descritivas que já
mostramos a você:
*UJ X|
Selecione a opção Histogram... (Histograma). Aparecerá a seguinte caixa dc diálogo:
.Iffl xj
Para gerar um histograma com uma curva normal, você deve mover a variável de
interesse para a caixa Vurkible (Variável). Selecione a opção que diz Displax normal
curve (Mostrar curva normal). Quando tiver feito a seleção correta, clique no botão OK
para gerar o histograma. O gráfico resultante conterá a curva normal, como indicado pela
Figura 2.27.
Você pode ver, a partir do histograma, que o conjunto de dados que utilizou está bastante
próximo de uma curva normal.
Desvio p adrao = 3 ,5 4
VAR000001
Figura 2.27 Histograma do 5PSSPW mostrando a distribuição normal.
2.11 Obtenção de estatísticas descritivas
Embora seja uma boa prática examinar a distribuição dos dados, você verá que muitos
pesquisadores não têm o hábito rotineiro de relatar os achados de tais práticas. Tipicamente,
se a distribuição se desvia da normalidade, é uma boa idéia relatar o fato. Se as distribuições
são aproximadamente normais, fica a seu critério fa/er ou não o relato. Registrando ou não
a forma da distribuição dos dados, você deve sempre examiná-la, uma vez que ela desempe
nha um papel importante sobre os tipos de técnicas estatísticas que podem ser utilizados na
análise dos dados.
Se quer mencionar a forma pela qual os dados estão distribuídos, então o exemplo se
guinte é. tahez. o modo de apresentar as estatísticas descritivas. Em um estudo conduzido
por Reidy e Keogh ( I997). pessoas ansiosas e não-ansiosas foram comparadas sobre como
interpretavam informações ambíguas. Fez-se. também, um exame sobre a diferença entre os
gêneros em tais interpretações. Você poderá apresentar as estatísticas descritivas conforme a
seguir:
Estatística sem Matemática para Psicologia 10 3
O estudo foi realizado com 98 estudantes. Os números m édios de interpretações

positivas e negativas foram 10,06 e 7.95. respectivamente. O número de interpretaçõe>
positivas c negativas dados por homens e mulheres foram comparados. A Tabela 2 . 1
mostra as médias e os desvios padrões para estes dois grupos. Os homens tiveram mais
interpretações negativas do que as mulheres e aproximadamente o m esm o número de
interpretações positivas. Os dois gêneros forneceram mais interpretações positivas do
que negativas. Os desvios padrões mostram que os dois grupos apresentam níveis sem e
lhantes de variabilidade em termos de interpretações negativas e positivas. O exame do>
diagramas de caixa e bigodes revelou que as distribuições são aproximadamente normais
e que não existem escores extremos (atípicos).
Tabela 2.1 Número médio de interpretações positivas e negativas apresentadas por homens e
mulheres (o desvio padrão está entre parênteses)
Homens Mulheres
Interpretações positivas 10,20(2,32) 9,91(3,01)

Interpretações negativas 7.27 (2.99) 8.62 (3,551
Resumo
Neste capítulo, mostramos formas de explorar e descrever os dados. Ressaltamos o fato

de que é importante tornar-se familiarizado com os dados utilizando várias técnicas estatísti
cas descritivas e explicamos como usar e interpretar tais técnicas. Assim, você aprendeu:
■ Como calcular médias, medianas e modas, de forma a obter uma indicação do valor
típico de uma amostra (estas são medidas de tendência central).
■ Que erros amostrais ocorrem quando tomamos amostras de populações e que. quanto
maior for a amostra que usarmos, menor será o valor do erro amostrai.
■ Que existem várias técnicas gráficas com a finalidade de auxiliar o entendimento
sobre a distribuição dos dados:
— histogramas de freqüências
— diagramas de caule e folhas
— diagramas de caixa e bigodes (box plot)
— diagramas de dispersão (scuttergrams)
m Como uma distribuição normal se parece e por que ela é importante em estatística.
■ Que existem várias maneiras de os dados que coletamos poderem desviar-se de uma
distribuição normal, incluindo:
— distribuições negativamente assimétricas
— distribuições positivamente assimétricas
— distribuições biniodais
■ Que uma das mais importantes medidas de qualquer distribuição é o grau com que
os valores se dispersam e que uma das principais formas de medir isso é por meio do
desvio padrão.
■ Que o desvio padrão é o grau de variabilidade dos valores de uma distribuição em
torno da média.
Exercício 1
Você recebeu a incumbência de verificar sc a troca das lâmpadas fluorescentes normais
de um escritório por lâmpadas vermelhas aumentará a atenção dos digitadores e diminuirá o
número de erros cometidos por eles. Quando fizer isso encontrará que 20 digitadores dimi
nuíram os números de erros por dia nas seguintes quantidades:
22, 22. 12. 10.42, 19. 20. 19. 20.21.21.20. 30.28.26. 18, 18, 20,21. 19
1. Qual é a VI neste estudo?
2. Qual é a VD neste estudo?
3. Use o SPSSPW para gerar um diagrama de caixa e bigode para os valores acima:
(a) Os dados são normalmente distribuídos?
(b) Existem valores atípicos mostrados pelo diagrama de caixa e bigodes? Se sim.
quais são eles?
(c) Utilizando o SPSSPW, qual é a média do conjunto de valores acima? Qual é o
desvio padrão?
Exercício 2
Um grupo de estudantes do último ano decide descobrir se as aulas da disciplina do
Dr. Boering poderiam ser mais estimulantes. Concluem que a melhor maneira de isso
acontecer ê tomar uma droga alucinógena durante as aulas. Ao tinal do semestre, tez-se
um exame: os estudantes que tomaram a droga durante as aulas obtiveram os seguintes
resultados (%)'.
23. 89. 62. 11. 76. 28.45. 52.71.28
Os estudantes que não tomaram o alucinógeno obtiveram os seguintes resultados:
45. 52. 68. 74. 55. 62. 58. 49. 42. 57
1. Qual é a VI neste estudo?
2. Qual é a VD? A VD é discreta, contínua ou categórica?
3. Use o SPSSPW para obter um histograma para os dois conjuntos de dados e então
responda o seguinte:
(a) Os dois conjuntos de dados são normalmente distribuídos?
(b) Use o SPSSPW para calcular a média e o desvio padrão para os doisconjuntos
de resultados.
Estatística sem Matemática para Psicologia 10 5
(c) A o quadrado da variância

QUESTÕES DE MÚLTIPLA ESCOLHA
(d) À variância dividida pelo núm ero de valores
Qual das seguintes alternativas representa a m e 6. Q ual a relação entre tam anho da am o stra e erro
lhor estim ativa da m édia populacio n al? am ostrai?
(a) A m édia da am ostra (a) Q uanto m aior o tam anho da am ostra, m aior o
i b) A m éd ia de várias m édias am ostrais erro am ostrai
i c) A m oda de várias m édias am ostrais (b) Q uanto m aior o tam anho d a am ostra, m enor o
d) A m ediana de várias m édias am ostrais erro am ostrai
(c) O tam anho da am ostra é igual ao erro am ostrai
I Se você obteve um a am ostra de dados que eram
(d) N enhum a das anteriores
distribuídos de form a ap roxim adam ente norm al c
não apresentavam valores extrem os, que m edida 7. A m oda é:
de tendência central v ocê usaria? (a) A freqüência do v alor m ais com um dividido
iai M oda pelo núm ero total de valores
i b) M ediana (b) O valor do m eio após a o rd en ação de todos os
i c) M édia esco res
idi N en h u m a das anteriores (c) O v a lo r que ocorre com m ais freqüência
? Qual das seguintes m edidas de tendência central (d) A som a de todos os valores d ividida pelo nú
são sensíveis a valores extrem os? m ero de valores
<a ) M oda 8. N o diagram a de caixa c big o d e (boje plot), um va

b) M ediana lor extrem o é caracterizado com o:
ic) M edia (a) O valor situado além da caixa interna
d) N enhum a das anteriores (b) O valor situado entre a caixa interna e o s bi
- D ado o seguinte diagram a, com o você descreveria godes
a distribuição? (c) O valor que está situado entre a caixa intem a
e o valor adjacente
Histograma ld) Um valor que está situado entre os dois bigodes
9. A d istribuição norm al deve possuir qual das se

guintes propriedades?
(a) Form a de sino
(b) Sim etria
(c) A s caudas devem en co n trar o eix o das ab scis
l.n
sas no infinito
(d) T odas as anteriores
10. Se v occ seleciona a o acaso u m a am o stra de 20 pan

I
das (am ostra A) e então seleciona um a o utra dc 3<X)

pandas (am ostra B) e calcula o peso m édio para
cada um a, qual é a m ais provável de fornecer um a
m elh o r estim ativa do peso m édio da população:
(a) A m ostra A
2,5 5,0 7,5 10,0 12,5 15,0 17,5 20,0
(b) A m o stra B
VAR000001 Desvio padrão = 4,74 (c) A m bas fornecerão boas estim ativas d a m édia
Média = 13,5 populacional
N - 20 (d) N enhum a delas fo rnecerá um a boa estim ativa
da m édia populacional
(a) N orm al
11. Q ue tipo de relação é indicada p o r um diagram a
ib) Positivam ente assim étrica
de dispersão (scatiergram ) no qual os pontos se
ic) N egativam ente assim étrica
acum ulam ao redor de um a linha im aginária que
(d) B im odal
vai do canto inferior esquerdo até o to p o do canto
5 O desvio padrão é igual: superior direito?
(a) A variância (a) Positiva
ib) À ra i/q u a d r a d a d a variância (b) N egativa
(e) Bim odal 18. Tendo calculado a variância de um conjunto dc

(d) Plana dados com 12 participantes como 36. qual será o
valor do desvio padrão?
12. Q ual e' a m edia do seguinte conjunto de valores: 5.
7. 10. 12. 18. 20. 2 4 .2 2 , 2 4 ,2 5 ? (a) 36
(b) 1296
(a) 145
te) 6
(b) 17.2
(d) 3
(c) 16.7
(d) 167 19. Quais das seguintes declarações são verdadeiras .’
13. Se você leni um a d istribuição negativam ente assi (a) Parâmetros descrevem amostras, e estatísticas
m étrica. então: descrevem populações
(b) Estatísticas descrevem amostras e populações
(a) A me'dia. a m ediana e a m oda são iguais
(c) Parâmetros descrevem populações, e estatísti
(b) A cauda da direita e estendida
cas descrevem amostras
(e ) A cauda da esquerda é estendida
(d) Alternativas (a) e (b)
20. Dado o seguinte diagrama, como vocc descreveria
14. U m a d istribuição perfeitam ente norm al:
a distribuição?
(a) A presenta form a de sino, e' sim étrica e possui
caudas que se estendem até o infinito Histograma
(b) É som ente aplicável a pessoas norm ais 10 ------------------------------------------------------
(e) Tem m édia, m ediana e m oda iguais
(d) A lternativas (a) e (e)
15. Q uando você tem variáveis categóricas e está sim

plesm ente contando a Ireqüêneia de ocorrência
cm cad a categoria, en tão sua m edida de tendência
central deve ser:
(a) M oda
(b) M ediana
(c > M edia
16. D ado o seguinte conjunto dc dad o s (8. 7 ,9 . 12. 14,

10. 14. 11. 13. 14). quais são os valores da m édia,
m ediana e m oda?
(a) 1 1 .2 :1 1 .5 :1 4
(bi 112: 12: 14
(c) 5: 14
(d) 10: 12; 14
17. Se um a distribuição é descrita com o platicúrtica.

então é: (a) Normal
(b) Positivamente assimétrica
(a) Bem pontiaguda
(ci Negativamente assimétrica
(b) Bem plana
(d| Bimodal
(c) Bim odal
(d) Bem tina
Referências
A R M ITA G E . C .. RHIDY. J. D evelopm ent and validation o f a new m easure o f blood fear (nâo-
publicado).
B A K ER . R. et al. E m otional processing and panic. Behaviour Research anil Therapy v. 42. n. I I . p.
1271-87. N o v em b er 2004.
G A R L A N D . K. J.. N O Y E S. J. M . C o m p u ter experience: a p oor p re d ic to r o f co m puter atitudes.
C o m p u ter in H um an B ehaviour, (aguardando im pressão).
M O RIS. P. E. et al. Football know ledge and the acquisition o f new results. British Journal o f
P sychology, v. 72. p. 479-83. 1981.
RHIDY. J. K E O G H . H. State and trait factors underlying the interpretation o f threai/neutral
hom ophones. A rtigo ap resentado na B ritish P sychological Society C ognitive Section Annual
C onference, 1997.
TA B A C H N IC K . B.. F ID F I.I., I.. S. U sing M ultivariate Statistics. A ddison W esley. 4 ed.. 2003.
TU K EY . J. W. E xploratory D ata A nalysis. R eading (M A ): A ddison-W esley, 1977.
W ALSH. J. J.. U G l M B A -A G W t. N O BI. G. Individual differences in statistics anxiety: the roles o f
perfectionism , procrastination and trail anxiety. Personality and Individual D ifferences, v. 33. p.
2 3 9 -5 1 .2 0 0 2 .
W ATSON. M .. G R E E R . S. D evelopm ent o f a questionnaire m easure o f em otional control. Journal o f
P sychosom atic R esearch, v. 27. p. 299-305. 1983.
Probabilidade, Amostragem e
Distribuições
Panoram a do capítulo
N os ca p ítu lo s a n te rio re s, fo ra m a p re se n ta d o s a sp e c to s im p o rta n te s do d e lin e a m e n to e x

p e rim e n ta l, assim c o m o os p ro cesso s iniciais da a n á lise de d a d o s. N este c a p ítu lo , vo cê será
a p re se n ta d o ao p ro cesso d a a n á lise d e d a d o s. C om base no seu c o n h e c im e n to de a m o stra s e
p o p u la ç õ e s, e xp lica re m o s co m o so m o s c a p a z e s d e g e n e ra liza r e o b te r co n c lu sõ e s a c e rca de um a
p o p u la ç ã o a p a rtir d o s re su lta d o s de a m o stra s. Logo, vo cê e stará se n d o a p re s e n ta d o à e sta tís
tica in fe re n c ia l. A p ó s u m a breve in tro d u ç ã o ao m u n d o das p ro b a b ilid a d e s, m o stra re m o s co m o
p o d em ser u sad a s as d istrib u iç õ e s p ro b a b ilístic a s, assim co m o a d istrib u iç ã o n o rm al p a d rã o para
fa z e r in fe rê n c ia s so b re os d a d o s da a m o s tra . Em re su m o , neste ca p itu lo vo cê a p re n d e rá :
p ro b a b ilid a d e e p ro b a b ilid a d e c o n d ic io n a d a
■ a p lic a ç ã o da p ro b a b ilid a d e à p e sq u isa
■ d istrib u iç ã o n o rm a l p ad rão
■ d istrib u iç õ e s a m o stra is
■ e stim a tiva s por p o n to e p o r in tervalo
i erro p a d rão e in tervalo de c o n fia n ç a
■ d ia g ra m a d e b a rras de erro
3.1 Probabilidade
Para aprender e sta tístic a , é n e c e s s á r io um b o m e n te n d im e n to do c o n c e ito d e p r o b a b ili

dad e. Is so não é tão d ifíc il qu an to p a r e ce , p o is a p ro b a b ilid a d e se fa z p r e se n te no d ia -a -d ia .
T oda vez que so r te a m o s cara ou c o r o a , jo g a m o s um d ad o ou c o m p r a m o s um b ilh e te de lo
teria, e sta m o s lid a n d o c o m p r o b a b ilid a d es. O n o tic iá r io é u m a d as fo n te s m a is c o m u n s de
p rob ab ilid ad es: por e x e m p lo , s e v o c ê e' fu m a n te, é m aior a su a p ro b a b ilid a d e de d e se n v o lv e r
c â n c e r d e pu lm ão. D a m e sm a form a (g o s to m u ito d e sta p ro b a b ilid a d e), s e v o c ê b eb e cerveja
m o d era d a m en te, seu r isco de d o e n ç a c ard íaca é red u zid o .
E s s e s e x e m p lo s d e ix a m c la r o q u e as p r o b a b ilid a d es têm um p ap el im p ortan te na n o ssa
vid a. E n tão v a m o s dar u m a o lh ad a m a is d etalh ad a n o s m e sm o s. S e v o c ê jo g a r cara ou co ro a ,
qual é a p rob ab ilid ad e de dar cara? A p rob ab ilid ad e é de um para d o is se v o c ê lançar a m oed a.
Isso que d izer q u e um em cada d o is a rre m esso s da m o e d a p od e resultar cara. P ro b a b ilid a d es
sá o g e ra lm en te e x p r e s sa s e m form a de n ú m eros d e c im a is, de 0 a l . o n d e 0 s ig n ific a q u e o
e v e n to não a c o n te ce rá , e 1 sig n ific a q u e acon tecerá,
Atividade 3.1
Q u ais destes e ven to s têm p ro b a b ilid a d e igual a 0 (ou m u ito p ró xim o a zero ) e q u a is têm
p ro b a b ilid a d e ig u al a 1 (ou m u ito p ró xim o a 1)?
A n o ite su ce d er ao dia
To d o s os p o lítico s fa la re m a v e rd a d e o te m p o to d o
V o cê a c h a r um c h e q u e d e um m ilh ã o d e reais d e n tre as p á g in a s d e ste livro
O co rre r um in cên d io
■ Escrito re s ad iare m o p razo de en tre g a de m a n u scrito s de livros
Para calcular a probabilidade da ocorrência de um evento, como o lançamento de

uma moeda, simplesmente dividimos o número de ocorrências dos resultados desejados
pelo número total de resultados possíveis. Portanto, no caso de um arremesso da moeda,
existe um resultado desejado (cara), mas dois resultados possíveis (cara ou coroa). A
probabilidade de dar cara e 1/2 (ou 0,5). Probabilidades também podem ser expressas em
termos de percentagens. Esse tipo de formato é geralmente mais familiar e ajuda mais
no entendimento da probabilidade. Logo, a probabilidade de se obter cara quando arre
messada uma moeda é 50%. A probabilidade 0 é anotada como 0%, e a probabilidade 1
como 100%.
Atividade 3.2
E xp resse as se g u in te s p ro b a b ilid a d e s em p e rc e n ta g e n s:
■ 0,25
■ 0,99
■ 1/3
■ 2/10
E xp resse as se g u in te s p ro b a b ilid a d e s em d e cim a is:
■ 1/8
■ 12/20
■ 30%
■ 14%
Vamos agora examinar o jogo de dados. Quando jogamos um dado, qual é a probabilidade
de se obter o número 6? Como temos um resultado desejado (6) c seis resultados possíveis (1,
2, 3, 4, 5 e 6), a probabilidade de se obter um 6 é de 1-4- 6 ou 0,1667. Qual é a probabilidade
de obtermos 1 ou 2? Aqui temos dois resultados desejados (1 ou 2) e seis resultados possíveis,
logo a probabilidade é de 2 -* 6 ou 0,3333.
Tente achar a probabilidade de se obter um número par (a resposta está na seção de Res
postas do livro).
3.1.1 Probabilidades condicionadas
Para a pesquisa em psicologia, é necessário não somente o conhecimento de probabi

lidade. mas também de probabilidade condicionada. A probabilidade condicionada envolve
um evento que depende de outro. Por exemplo, a probabilidade de o Arsenal ganhar a final
da Copa Inglesa, deste ano, pode ser de 70% se o time jogar contra o Enfield Town, mas
pode ser somente de 60% se jogar contra o Manchester United. Essas são probabilidades
condicionadas, pois dependem do time enfrentado pelo Arsenal na final da Copa. Outro
exemplo de probabilidade condicionada é a de alguém comprar esse livro de estatística.
Sabendo que há provavelmente, pelo menos, 99 outros textos no mercado, a probabilidade
de alguém comprar este livro seria de 1/I00 (ou 1%). Se o professor recomendar o livro, a
probabilidade pode mudar para 1/5 (ou 20%). A probabilidade de 1/5 é uma probabilidade
condicionada; é a probabilidade de alguém comprar o livro na dependência da recomen
dação do professor. Mencionamos dois exemplos de probabilidade condicionada no início
deste capítulo. A probabilidade de contrair câncer caso você seja fumante é condicionada,
tanto como a probabilidade de doença cardíaca caso beba uma quantidade moderada de cer
veja. E importante o entendimento de probabilidade condicionada, pois ela será discutida no
Capítulo 4 quando explicarmos o teste de hipóteses.
Atividade 3.3
Q u ais d a s se g u in te s p ro b a b ilid a d e s são c o n d ic io n a d a s?
(a) A p ro b a b ilid a d e de ser a tin g id o por um raio d u ra n te um jo g o d e g o lfe

(b) A p ro b a b ilid a d e de g a n h a r na lo teria
(c) A p ro b a b ilid a d e de g a n h a r u m a m e d a lh a o lím p ica sem tre in a m e n to
(d) A p ro b a b ilid a d e de te r c â n c e r no p u lm ã o caso seja fu m a n te
(e) A p ro b a b ilid a d e de o c o rre r um vô o co m trip u la ç ã o para M a rte no s p ró xim o s 10 an o s
(f) A p ro b a b ilid a d e de d e se n vo lv e r d o e n ça ca rd ía c a caso beba q u a n tid a d e s m o d e rad as
de cerveja
3.1.2 Aplicação da probabilidade na análise de dados: estatística inferencial
A estatística inferencial é uma coleção de técnicas utilizadas para se obterem con

clusões a partir de um conjunto de dados. Uma pesquisa é geralmente conduzida com o
objetivo de extrair conclusões a partir de certas observações, isto é, com o objetivo de fazer
inferências. Os estudos das relações entre ansiedade gerada pelo estudo da estatística e a
procrastinação ou entre fumar cigarros e memória de curto prazo são feitos para entender
mos melhor tais problemas. Do mesmo modo, conduzimos um estudo sobre pessoas que
comem pão de-ló com ketchup às 6h30rnin da manhã apenas para entendermos porque
alguém faria algo tão estranho. Para respondermos tais questões, precisamos obter conclu
sões a partir de nossos dados.
Que conclusões podem ser tiradas da seguinte descrição de eventos?

Em uma tarde agitada no centro de Woverhampton, um homem fo i visto dobrando uma <.
quina e correndo em direção à avenida principal. Ele estava obviam ente com pressa, nem n
importava que estivesse empurrando as pessoas no seu caminho. M omentos depois, uma policiai
também dobrou a esquina correndo em direção à avenida principal.
Uma possível conclusão a ser inferida dessa descrição é que a policial estava tentan
do alcançar o homem e prendê-lo. Na maioria dos casos, esta seria uma dedução razoável.
Entretanto, é possível que a policial estivesse seguindo seu colega à paisana e que ambos
estivessem correndo para a cena de um crime.
Podemos ver como é fácil obtermos conclusões errôneas em nosso dia-a-dia. Esse
mesmo tipo de erro pode acontecer na pesquisa psicológica, pois estamos tentando inferir
conclusões a partir de análises estatísticas. Lembre-se de que, na maioria das vezes, quando
testamos uma amostra de pessoas, estamos testando conclusões sobre a população de onde
a amostra foi extraída. Se quiséssemos descobrir se a ansiedade gerada por estatística está
relacionada à procrastinação, selecionaríamos aleatoriamente uma amostra e obteríamos os
valores dessas duas variáveis. A partir desses dados, faríamos inferências sobre a relação
dessas duas variáveis na população. Para esse fim. usaríamos técnicas de estatística infe-
rencial. Entretanto, existe a possibilidade de obtermos as conclusões equivocadas a partir
de nossas análises estatísticas. Isso acontece porque as técnicas estatísticas que usamo.; sc
fundamentam em probabilidades. Portanto, é importante estar sempre ciente da falibilidade
de tais técnicas.
ansiedade estatística e procrastinação
Walsh e Ugumba-Agwunobi (2002) usaram técnicas de estatística inferencial para avaliar a

relação entre a ansiedade causada pela estatística e a procrastinação. Noventa e três pessoas comple
taram um questionário multidimensional para essa avaliação. Fazendo uso da técnica de estatística
inferencial e do coeficiente de correlação de Pearson, os pesquisadores encontraram relações entre
a procrastinação e três componentes da ansiedade gerada pela estatística: medo de professores de
estatística, medo de pedir ajuda e medo das aulas e dos testes. Essas técnicas de estatística permi
tiram que Walsh e Ugumba-Agwunobi argumentassem que a hipótese de a ansiedade gerada pela
estatística estar relacionada à procrastinação possuía sustentação.
3.2 Distribuição normal padrão
Você já foi apresentado à probabilidade e também, no Capítulo 2, à família das distri

buições conhecidas como distribuições normais. Gostaríamos de prosseguir explicando uma
distribuição ainda mais importante: a distribuição normal padrão (ver Figura 3 .1). Como indica
a Figura 3.1, a distribuição normal padrão é uma distribuição com forma normal, de média 0 e
desvio padrão igual a 1. Devido a essas e outras características, a distribuição normal padrão é
muito útil. Essa distribuição nos permite comparar valores de amostras diferentes, valores de
uma mesma amostra e muito mais.
-3 -2 -1 0 2 3
Distribuição normal padrao.
Para p o d er m o s u tilizar a d istrib u içã o norm al padrão na a n á lise d o s n o s s o s d a d o s, é n e c e s

sário tran sform arm os o s v a lo r e s d as e sta tístic a s a m o stra is e m v a lo re s da norm al padrão. E sse
p r o c e s so é r ea liza d o por m e io da su b tração da m éd ia de cada v alor e en tã o p ela d iv isã o desta
d ife re n ç a p e lo d e s v io padrão. O r esu lta d o o b tid o é d e n o m in a d o de valor z- E le é o n ú m ero de
d e s v io s p a d rõ es a co n ta r da m édia: in d ic a o v alor d e entrada a c im a ou a b a ix o da m é d ia e m
u n id a d es d e d e s v io padrão. S e v o c ê tem um v a l o r ; n e g a tiv o , se u valor e stá a b a ix o da m édia;
se o v a lo r z é p o s itiv o , e n tã o está a c im a da m éd ia. P ortan to, um v alor z ig u a l a 1 in fo rm a qu e
há um d e s v io padrão a c im a da m éd ia da d istrib u ição.
U s a r e m o s um e x e m p lo para e x p lic a r m elh or. A m éd ia para valores de Q1 em te ste s de in
te lig ê n c ia é 1 00, c o m um d e s v io pad rão de 15. S e v o c ê tem um Q1 d e 1 3 5 . se u valor z seria:
15
S ig n if ic a q u e se u Q l e s tá 2 ,3 3 d e s v io s p a d r õ e s a c im a da m éd ia: v o c ê tem u m v a lo r z
d e 2 .3 3 .
U m a v e z c o n v e r tid o s n o s s o s v a lo r e s z, p o d e m o s usar a d istr ib u iç ã o n orm al pad rão de
várias m an eiras. A d istr ib u iç ã o norm al pad rão é um a distribuição de probabilidade. O e n
ca n to d as d istr ib u iç õ e s d e p r o b a b ilid a d e é a e x is tê n c ia de um a a s s o c ia ç ã o c o m ca d a v alor da
d istr ib u iç ã o . S a b e m o s a p r o b a b ilid a d e d e s e le c io n a r a lea to r ia m e n te q u a lq u er v alor da d istr i
b u içã o . A lé m d is s o , s a b e m o s tam b ém a p r o b a b ilid a d e d e s e o b ter u m v a lo r entre q u a isq u er
d o is v a lo r e s da d istr ib u iç ã o , por e x e m p lo , um v alor en tre - 1 e 1. U m a im p ortan te c a r a c te
rística das d istr ib u iç õ e s de p r o b a b ilid a d e é q u e a área a b a ix o da cu rva entre q u a isq u er d o is
p o n to s e s p e c íf ic o s r ep resen ta a p r o b a b ilid a d e d e s e o b te r em v a lo r e s en tre o s d o is p o n to s.
P or e x e m p lo , a p r o b a b ilid a d e d e s e o b te r e m v a lo r e s e n tre - 1 e 1 na d istr ib u iç ã o n orm al
pad rão é d e a p r o x im a d a m e n te 68% (v e r F ig u ra 3 .2 ). Is s o q u er d iz e r q u e 68% da área total
da cu rva n orm al padrão e stá situ ad a en tre -1 e I d e s v io pad rão a con tar da m éd ia . É im p or
tante lem b rar q u e a p r o b a b ilid a d e referid a é a de s e le c io n a r m o s v a lo r e s a lea to r ia m e n te da
d istr ib u iç ã o . L o g o , e x is t e um a p r o b a b ilid a d e d e 68% de se le c io n a r m o s a le a to r ia m e n te um
valor en tre - 1 e 1.
N. de T. A rigor, com o se está falando de uma variável contínua, o que existe é um a probabilidade associada a intervalos da variá
vel. não exatam ente a um valor particular. Por sim plicidade, os autores devem eslar se referindo a esta situação.
1 desvio padrão
a partir da média
68% é a probabilidade de selecionarm os,

ao acaso, um valor entre este dois escores
P e rcen tag em da cu rva n o rm al p a d rã o e n tre -1 e 1 desvio p a d rão
D a m e sm a m aneira, a p r o b a b ilid a d e de se ob ter um valor entre - 1 , 9 6 e 1 ,96 d e s v io pa

drão é de a p r o x im a d a m e n te 95% (ver F igu ra 3 .3 ).
1,96 desvio padrão

a partir da média
95% é a probabilidade de selecionarm os,

ao acaso, um valor entre esses dois escores
Percen tag em da cu rva n o rm al p a d rã o e n t r e - 1 ,9 6 e 1 ,9 6 d esvio p a d rão

Figura 3.3
D e v id o a e s s a s c a ra c ter ística s, p o d e m o s u tiliza r a d istrib u içã o n orm al padrão para e n c o n

trar a p rob ab ilid ad e d e se ob terem v a lo r e i e m q u alq u er in tervalo da d istrib u içã o . P o d e ría m o s
c a lc u la r a p ro b a b ilid a d e d e s e ob ter u m va lo r z de 2 ou a cim a na d istr ib u iç ã o n orm al padrão,
ou p o d er ía m o s achar a p rob ab ilid ad e de se obter um v alor z entre 1 e 2. V o cê notará qu e v a
lores z e x tr e m o s, d ig a m o s, a cim a de 2 e a b a ix o de - 2 , têm um a c h a n c e b em m en o r d e serem
o b tid o s d o q u e v a lo res n o m e io da d istrib u ição. D e v e m o s e n tão c o n c lu ir q u e as áreas da curva
a c im a d e 2 e a b a ix o de -2 sã o p e q u en a s e m c o m p a r a çã o às áreas entre - 1 e 1 (v e r F igu ra 3 .4 ).
V a m o s rela cio n a r e s te fato a e x e m p lo s m a is c o n c r e to s, c o m o altura d e h o m e n s. S e c o n s id e
rarm os v a lo re s a c im a de 2 e a b a ix o de -2 c o m o o s e x tr e m o s de m e d id a s de altura de h o m e n s,
d ig a m o s a c im a de 2 ,0 m ou a b a ix o d e l , 4 m , to rn a -se e v id e n te qu e é m u ito m e n o s p rovável
en co n tra rm o s h o m e n s a c im a ou a b a ix o d e sta s alturas d o q u e h o m e n s entre 1,6 5 m e l,8 3 m .
F e liz m e n te , q u an d o trab alh am os c o m a d istr ib u iç ã o norm al padrão, n ão te m o s q u e c a lc u
lar as áreas so b a curva, isto é , as p ro b a b ilid a d es. E las já foram c a lc u la d a s e c o n v e n ie n te m e n te
c o lo c a d a s em tab elas para o n o s s o u so. N o A p ê n d ic e 1. v o c ê pod erá en con trar a tab ela das
áreas so b a d istr ib u iç ã o norm al padrão.
O utro a sp e c to útil da d istr ib u iç ã o n orm al padrão é p o d e r m o s u tiliz á -la para c a lc u la r a
p o r ç ã o da p o p u la ç ã o q u e teria um va lo r a c im a ou a b a ix o d o se u e sc o r e . N ã o e s q u e ç a q u e,
qu an d o fa la m o s e m p r o p o r ç õ es, e sta m o s n os referin d o à área a b a ix o da curva norm al padrão,
para a qual p r e c isa m o s co n su lta r a tab ela da d istrib u içã o norm al pad rão en con trad a e m m u i
to s livros de e sta tístic a (ver A p ê n d ic e 1). N a F igu ra 3 .5 , p o d e m o s ver q u e o Q l de 135 está a
2 ,3 3 d e s v io s p a d rõ es a c im a da m éd ia . A área n ã o -so m b r ea d a rep resen ta a q u e le s q u e teriam
um e sc o r e m a io r do q u e o seu .
Para d e sc o b r ir q u e p r o p o rçã o da p o p u la ç ã o teria um e sc o r e m e n o r d o q u e o se u , basta
co n su lta r a tab ela da d istr ib u iç ã o norm al padrão. E ssa tab ela é a p resen tad a, g e ra lm en te, em
d ife re n te s fo rm a to s, m as a in fo r m a çã o c o n tid a é e sse n c ia lm e n te a m esm a . A T abela 3.1 apre
sen ta um a parte d o A p ê n d ic e 1.
A área do meio é m aior

do que a dos extrem os
-3 -2 1 0 2 3
0 m eio e os extre m o s da cu rva n o rm al p ad rão .

M édia de 100
Q!
D istrib u iç ã o n o rm al da p ro p o rção da p o p u la ç ã o co m Ql m e n o r ou igual a 1 3 5 (va lo r z

Figura 3.5
d e 2 ,3 3 ).
T ab e la 3.1 Escores e áreas sob a curva normal padrão
Escore z de 2,33 Proporção da curva abaixo do escore
Proporção abaixo tio escore Proporção acima uo escorr
0.9S96 0,0104
0,9898 0.0102
0,9901 0,0099
0,9904 0.0096
0.9906 0.0094
P o d e m o s p erceb er qu e o s v a lo r e s na c o lu n a d e n o m in a d a “P ro p o rçã o a b a ix o do escore"

rep resen tam a área so b a curva a b a ix o de q u alq u er v a lo r z. A tab ela n o s in d ica qu e a propor
ç ã o q u e e stá a b a ix o de seu valor z é 0 ,9 9 0 1 . Is s o s ig n ific a q u e 9 9 , 0 19f da área so b a curva
e s tã o a b a ix o d e s s e e s c o r e . S e v o c ê q u is e s s e sa b er q u e p ro p o r ç ã o da c u rv a e stá a c im a d o
e s c o r e , p o d e s im p le s m e n te subtrair e s s a p r o p o rçã o d e 1 (ou 100% ). N e ste c a so , 0 ,0 0 9 9 da
área da curva e stá a cim a do e sc o r e , o u m e n o s que 1%. E ste valor e stá na T abela 3.1 na co lu n a
“ P rop orção a c im a do e s c o r e ” .
N o te q u e as ta b e la s te n d e m a c o n te r s o m e n te v a lo r e s z p o s itiv o s , q u er d iz er , a q u e le s
q u e s e e n c o n tr a m a c im a da m é d ia . S e v o c ê o b tiv e r u m v a lo r 2 n e g a tiv o , u tiliz e a m e sm a
ta b e la , m as ig n o r e o sin a l n e g a tiv o d o v a lo r z para d e sc o b r ir as áreas a c im a e a b a ix o do
e sc o r e . E n tretan to, c o m o o e sc o r e e stá a b a ix o da m é d ia , a p rop orção a p resen ta d a na c o lu n a
“ P ro p o r ç ã o a b a ix o d o e sc o r e " d e v e se r lid a c o m o p r o p o r ç ã o da cu rva qu e e s tá a c im a do
e s c o r e (F ig u ra 3 .6 ).
G rande porção Grande porção

abaixo do valor z acim a do valor z
Valor z positivo Valor z negativo
P ro p o rçõ es da cu rva a b a ixo de um valo r z p o sitivo e a c im a d e um n eg ativo .

Figura 3.6
D a r e m o s ou tro e x e m p lo para e s c la r e c e r o c á lc u lo d as p r o p o r ç õ e s. D ig a m o s q u e v o c ê
tenha tid o um p é s s im o dia q u an d o fe z o se u teste de Q I e c o n se g u iu um resu lta d o de c o m en te
9 5 p o n to s. Q u e p e r ce n ta g e m da p o p u la ç ã o e stá a b a ix o d o seu e sc o r e ?
P o d e m o s co n v erter seu e sc o r e em um valor c. portanto:
9 5 -1 0 0
- 0 ,3 3
15
P o d e m o s ob servar que agora te m o s um valor c n e g a tiv o . S e c o n su lta r m o s a ta b e la , v e r e

m o s q u e a p ro p o rçã o d e Q Is a b a ix o d o se u é 0 .3 7 0 7 (ou 3 7 ,0 7 % ). A F ig u ra 3 .7 m ostra que
c o m o se u e s c o r e e stá a b a ix o d a m é d ia , a p o r ç ã o m e n o r será a q u ela a b a ix o d o se u e sc o r e .
P ortan to, a ta b ela in fo r m a q u e 3 7 ,0 7 % da p o p u la ç ã o a p r e se n ta e s c o r e s a b a ix o , e 6 2 ,9 3 6/<
a c im a d o seu Q I. E im p ortan te lem b rar q u e , q u a n d o c o n su lta r o A p ê n d ic e 1 para v a lo r e s ;
n e g a tiv o s, a p ro p o rçã o a b a ix o d o seu e s c o r e estará na c o lu n a “ P ro p o rçã o a c im a d o e sc o r e ’
e v ic e -v e r sa .
37,07% estão abaixo M édia de 100
P ro p o rção da p o p u la ç ã o a c im a e a b a ixo de um va lo r de QI de 9 5 .
' Atividade 3.4
Se você tem um valor z negativo, ele se encontra acima ou abaixo da média? Um valor z
negativo significa que a maioria da população tem um escore mais alto ou mais baixo que o
seu?
S.2 1 Comparação de populações
Também podemos utilizar a distribuição normal padrão para comparar diferentes si
tuações. Por exemplo, suponhamos que você esteja indeciso sobre sua futura carreira, mas
saiba que gosta dc fazer cerâmica e levantamento de peso. Você decide fazer um curso em
cada uma destas áreas para avaliar seu desempenho e escolher melhor sua futura carreira.
No fim dos cursos, você descobre que sua nota foi de 64% para cerâmica e de 45% para
levantamento dc peso. Com base nestes resultados, poderíamos justificar sua escolha para
seguir uma carreira como oleiro em vez de um levantador de pesos. Para ter uma idéia
melhor, você precisa se comparar com outros em cada um dos grupos. Você pode desco
brir que é pior em cerâmica em comparação ao resto do grupo do que em levantamento
de pesos. Para fazer tais comparações, você precisa converter seus escores em valores z-
Vamos supor que a média e o desvio padrão para cerâmica são 55% e 9%, respectivamen
te, e para o levantamento de peso 40% e 4%. Seu valor ; para cerâmica seria l , e para o
levantamento de pesos seria 1,25.
6 4 -5 5
9 4
Valor : para cerâmica Valor c para levantamento de peso

Assim, você está um desvio padrão acima da média cm cerâmica e 1,25 desvio padrão
além da médin no levantamento de peso. Portanto, está melhor em levantamento de pesos
do que em cerâmica. Conseqüentemente, deveria escolher o levantamento de peso como
carreira.
Atividade 3.5
Vamos supor que seus aproveitamentos em matemática e inglês sejam 65% e 71%, res
pectivamente. Qual é sua melhor matéria em comparação com outros no seu grupo se as
médias dos grupos e desvios padrões são 60 e 5 (para matemática) e 65 e 7 (para inglês)?
3.3 Aplicação da probabilidade à pesquisa
A n teriorm ente e sc la r ec e u -se que a probabilidade de um even to acon tecer pod e ser expressa
co m o um núm ero d ecim al ou c o m o um a percentagem . Por e x em p lo , quando v o c ê jo g a um dado
vo c ê tem um a probabilidade de 0 .1 6 6 7 (1 6 ,6 7 % ) de obter a face 1. D a m esm a m aneira, se houver
um a probabilidade de 0 .0 5 (ou 5% ) de v o c ê sofrer um acid en te enquanto dirige, aproxim adam en
te um a saída e m cada 2 0 resultaria e m acid en te. Tal probabilidade pod e ser d ep end en te de algu m
outro fator, corno falar no celular enquanto dirige. N e ste caso. d iríam os que a probabilidade de
vo c ê sofrer um acid en te, enquanto dirige o carro e fala no celular, seria de 5%. E ste é um e x em p lo
de probabilidade con d icio n a l. A probabilidade de 5% de v o c ê ter um acid en te enquanto dirige o
carro está con d icion ad a ao fato de dirigir e conversar no celular ao m e sm o tem po.
V ocê d e v e estar p e n sa n d o qu e is s o tud o p arece m u ito se n sa to , m a s o q u e a p rob ab ilid ad e
tem a v er c o m o u s o da e sta tístic a na p e sq u isa ? Em p e sq u isa , n o r m a lm en te g e n e r a liz a m o s
resu lta d o s d e a m o stra s para p o p u la ç õ e s. C o m o d isc u tid o no C a p ítu lo 2 , tod a v e z q u e u tili
za m o s am ostras c o rr em o s r is c o s d e c o m e te r erros (erros de a m o str a g em ). Is so s ig n ific a qu e
não sa b e m o s se o padrão de r esu lta d o s q u e o b tiv e m o s em n o ssa s am ostras r ea lm en te r eflete o
qu e e stá a c o n te c e n d o n as p o p u la ç õ e s o u se é sim p le sm e n te r esu lta d o d o erro de a m o stra g em .
S eria v a n ta jo so p o d er c a lc u la r a p r o b a b ilid a d e de o s v a lo r e s a m o str a is resu lta rem d e erro
d e a m o str a g em . S e e x is t is s e so m e n te u m a p eq u en a p o s s ib ilid a d e d e o erro d e a m o str a g em
p rod u zir o pad rão de r esu lta d o s, p o d er ía m o s c o n c lu ir q u e as am ostras r eflete m acu rad am en te
as p o p u la ç õ e s.
U m a das m aneiras m ais sim p le s de aplicar probab ilidad e à p e sq u isa é estim ar parâm etros
p o p u la c io n a is a partir de e sta tística s am ostrais e ca lcu la r in tervalos de c o n fia n ç a . N a s p r ó x i
m as s e ç õ e s , serão ap resen tad os c o n c e ito s n e c essá rio s para ca lcu la r in tervalos de c o n fia n ç a e
e x p lic a d o por que são im p ortan tes para se obterem c o n c lu s õ e s de p e sq u isa s. D e sc re v e re m o s
as d istrib u ições am ostrais e d esta ca rem o s suas p rincip ais características. E m segu id a, será e x
p licad o c o m o a d istrib u ição am ostrai da m éd ia p od e ser u tilizad a para determ inar a qu alid ade
de n o ssa estim ativa da m éd ia am ostrai, em relação à m éd ia p o p u la c io n a l, por m e io do uso de
intervalos de con fian ça.
3.4 Distribuições amostrais
N o C a p ítu lo 2 , d e m o n s tr o u -se c o m o a m éd ia da am ostra p o d e ser u sad a para e stim a r a

m éd ia da p o p u la ç ã o . A lé m d is s o , v im o s q u e, ao fo rm a rm o s várias am ostras e, a p ó s, c a lc u la r
m o s a m é d ia d as m é d ia s d e ss a s a m o str a s, o r esu lta d o será u m a m e lh o r e stim a tiv a da m éd ia
d a p o p u la ç ã o d o q u e as m é d ia s d as a m o str a s in d iv id u a is . O te o re m a cen tra l d o lim ite d iz
qu e. c o n fo r m e a u m e n ta o ta m a n h o d as a m o stra s s e le c io n a d a s , m a is p r ó x im o da m é d ia da
p o p u la ç ã o e starão às m é d ia s d e ss a s a m ostras. E n tão, qu an to m aior for o tam an h o da am ostra
u tiliza d a , m elh o r será a e stim a tiv a da m é d ia da p o p u la ç ã o .
Q u a n d o v o c ê ap resen ta u m a e sta tístic a am ostrai, c a lc u la d a a partir de tod as as am ostras
p o s s ív e is retiradas de u m a dada p o p u la ç ã o , c o m o um h isto g r a m a de fr eq ü ê n c ia s, d eterm in a
a d istr ib u iç ã o a m o stra i. P ortan to, se v o c ê c a lc u la r as m é d ia s d e m u ita s a m o str a s d e um a
p o p u la ç ã o e s p e c íf ic a , terá traçad o a d istr ib u iç ã o am ostrai da m é d ia . U m a p ro p ried a d e in-
* N. de T. A frase aqui não deve ser tom ada ao pe da letra, pois. de fato. a distribuição am ostrai só e obtida se forem retiradas todus
as am ostras possíveis de um a dada população. A lém disso, a distribuirão am ostra) ú o conjunto dos valores da estatística am ostrai
com as respectivas probabilidades.
teressante das distribuições amostrais é o fato de, se elas são determinadas a partir de um nú
mero bastante grande de amostras, apresentarem uma forma aproximadamente normal. Ale'm
disso, quanto mais amostras forem utilizadas, mais próximo da normal estará a resultante
distribuição amostrai.
Talvez, surpreendentemente, a distribuição amostrai da média seja normal, não obstan
te a forma de distribuição da população. Esta pode ser de alguma maneira assimétrica ou
bimodal ou mesmo uniforme, e. ainda assim, podem existir distribuições amostrais quase
normais.
O exemplo seguinte serve como ilustração. Imagine que, quando você nasceu, alguém co
meçou a jogar um dado e a anotar o resultado. Essa pessoa jogou o dado uma vez a cada dois
segundos por toda sua vida ao longo de 80 anos (algo nada interessante para alguém fazer, mas
vamos lá). Agora, se traçarmos a distribuição de todos os lances do dado (a população de todos
os lances do dado ao longo da sua vida), será semelhante à distribuição da Figura 3.8.
Como cada número do dado tem uma probabilidade igual de acontecer (de l em 6),
espera-se que cada número tenha aparecido com aproximadamente a mesma freqüência ao
longo de sua vida. Portanto, a população de todas as jogadas do dado, durante sua vida, tem
uma distribuição uniforme. Considerando que os números ocorreram com igual freqüência,
então a média da população de jogadas é 3,5. Se escolhermos aleatoriamente cinco amos
tras de dez lances do dado, dessa população, poderíamos obter o seguinte:
1,5. 1, 2, 6. 6, 4, 1, 4, 6 média = 3,6

1,2,2, 2 ,6, 5, 3,3, 6 ,4 média = 3.4
Lances
4, 2. 1. 6, 6. 5. 3. 5. 5. 2 média = 3,9
do dado
3. 5, 2. 4, 2. 2. 1.4. 3. 4 média = 3.0
4. 2, 1. 1, 2, 6. 6, 5. 3. 4 média = 3.4
Média
180 000 000 / __
2 3 4 5 6
Núm ero no dado
H isto g ra m a da d istrib u iç ã o da p o p u la ç ã o de lan ces d e um d a d o .

N o ta -s e q u e as m é d ia s d a s a m o str a s sã o b o a s a p r o x im a ç õ e s da m é d ia 3 ,5 da p o p u la
ç ã o , e m b o r a variem c o n s id e r a v e lm e n te . F n tr eta n to , se a m éd ia d a s m é d ia s fo s s e c a lc u la d a ,
h a v eria u m a a p r o x im a ç ã o , a in d a m e lh o r, da m é d ia da p o p u la ç ã o :
( 3 ,6 + 3 ,4 + 3 ,9 + 3 + 3 ,4 )
= 3 ,4 6
5
V am os agora plotar as m é d ia s das am ostras c o m o u m a d istrib u içã o de fr eq ü ê n c ia s, isto é,

traçar um a a p r o x im a çã o da d istr ib u iç ã o a m ostrai (ver F igu ra 3 .9 ).
3,0 3,1 3,2- 3,3 3,4- 3,5 3,6-3,8-

3,73,9
Médias amostrais dos lances do dado
H isto g ra m a da d istrib u iç ã o d a s m é d ias de cin co a m o stra s de de z lan ces de um d ad o .

Figura 3.9
A F igu ra 3 .9 m ostra que a d istr ib u iç ã o n ão é p lan a c o m o a da p o p u la ç ã o d o s la n c e s do

d ad o. Para m elh o r ilustrar e ste co n tra ste, te m o s q u e c o n stitu ir m ais am ostras de d e z la n c e s do
dad o. O g r á fic o na F igu ra 3 .1 0 é a d istrib u içã o am ostrai d e 100 m éd ia s am ostrais.
E m b ora a p o p u la ç ã o tenha um a d istrib u içã o u n ifo rm e, a d istrib u içã o am ostrai da m éd ia é
a p r o x im a d a m e n te norm al em form ato. E ss e seria o c a so para q u alq u er d istrib u içã o am ostrai
traçada.
2 , 4 - 2,5 2 , 6 - 2,7 2 , 8 - 2,9 3 , 0 - 3 ,1 3 , 2 - 3,3 3 , 4 - 3 ,5 3 , 6 - 3.7 3 , 8 - 3 ,9 4 . 0 - 4.1 4 . 2 - 4.3 4 , 4 - 4,5

M édias am ostrais dos lances do dado
D istrib u ição d a s m éd ias de 1 0 0 a m o stra s de de z lan ces de um d ad o .

Figura 3.10
Atividade 3.6
D ig a m o s q u e vo cê c o n stitu iu 1 0 0 a m o s tra s d ife re n te s d e c ria n ç a s d e 4 a n o s e m ed iu

su a s c a p a c id a d e s p ara le itu ra . Para c a d a a m o s tra , v o c ê c a lc u la a m é d ia e tra ç a a s m é d ia s d e
to d a s a s a m o s tra s c o m o u m h is to g ra m a d e fre q ü ê n c ia s . Q u a l se rá o fo rm a to d e sse h is to
g ra m a ?
3.5 intervalos de confiança e erro padrão
E m b o r a te n h a m o s c o n h e c im e n t o de q u e a m e'dia da a m o str a é u m a a p r o x im a ç ã o da
m e d ia da p o p u la ç ã o , g e r a lm e n te n ã o te m o s m u ita c e r te z a da p r e c is ã o d e sta a p r o x im a ç ã o .
O s in te r v a lo s de c o n fia n ç a p o d e m n o s ajudar n e ssa d ú v id a .
P o r se r a m é d ia d a a m o str a u m v a lo r o u p o n to d e u m a v a r iá v e l, é c o n h e c id a c o m o
estim ativa pontual da m é d ia d a p o p u la ç ã o . A m é d ia d a a m o str a r ep r e se n ta u m p o n to da
v a r iá v e l e p o r e s s e m o tiv o n ã o s a b e m o s se a n o s s a m é d ia a m o str a i é u m a s u b e s tim a ç ã o
ou u m a s o b r e s tim a ç ã o da m é d ia p o p u la c io n a l. A lé m d is s o , n ã o s a b e m o s r e a lm e n te qu al
a p r o x im id a d e d a n o s s a m é d ia da a m o str a c o m a d a p o p u la ç ã o . E n tã o , s e r ia ú til s e ti
v é s s e m o s a lg u m a m a n e ir a d e sa b er a p r o x im a d a m e n te o n d e e s tá a m é d ia d a p o p u la ç ã o .
F e liz m e n te , te m o s u m a m a n eira d e d e s c o b r ir c a lc u la n d o u m in te r v a lo de c o n fia n ç a . O s in
te r v a lo s de c o n fia n ç a para a m é d ia s ã o e s tim a tiv a s in te r v a la r e s para a m é d ia p o p u la c io n a l.
I s to é, e le s n o s fo r n e c e m u m raio d e v a lo r e s e m to r n o da m é d ia a m o str a i (u m in te r v a lo )
d e n tr o d o q u al p o d e m o s c o n sta ta r , c o m d e te r m in a d a c o n fia n ç a , s e e le c o n té m a m é d ia da
p o p u la ç ã o .
P or e x e m p lo , d ig a m o s q u e a p lic á s s e m o s a u m a a m o str a d e p e s s o a s o in v e n tá r io de
d e p r e s s ã o d e B e c k (B D I ) (B e c k et a l., 1 9 6 1 ). O q u e s tio n á r io a v a lia a d e p r e s s ã o , e o s e s
c o r e s p o d e m variar d e 0 a 6 3 . D ig a m o s q u e a m é d ia d a n o s s a a m o str a n o B D I se ja 1 0 .7 2 .
S o m e n t e c o m e s te e x e m p lo n ão te m o s c o m o sa b er a p r o x im id a d e d e s s e r e su lta d o da m é d ia
da p o p u la ç ã o (v e r F ig u ra 3 . 1 1(a )). S e r ia v a n ta jo s o se p u d é s s e m o s dar u m a in d ic a ç ã o da
p r o x im id a d e d e s te n ú m er o à m é d ia da p o p u la ç ã o . P e n s e m o s lo g ic a m e n t e n e ss a situ a ç ã o .
C o m o o m e n o r e s c o r e n o q u e s tio n á r io é 0 , e o m a io r é 6 3 , p o d e m o s ter 100% d e c e r te z a
d e q u e a m é d ia da p o p u la ç ã o e s tá e m a lg u m lu g a r e n tr e e s t e s d o is v a lo r e s (v e r F igu ra
3 .1 1 (b )). E s s e é um in te rv a lo d e c o n f ia n ç a , e m b o r a n ã o se ja m u ito in fo r m a tiv o . P o d e m o s
u sar as c a r a c te r ís tic a s d a s d is tr ib u iç õ e s a m o str a is para e stre ita r e s te in te r v a lo , a p e sa r de
ta m b é m p o d e r m o s e sta r r e d u z in d o a c o n fia n ç a de qu e e le c o n te n h a a m é d ia da p o p u la ç ã o .
G e r a lm e n te fix a m o s in te r v a lo s d e c o n fia n ç a de 9 5 % . V o c ê irá p e r c e b e r q u e , fr e q ü e n te
m e n te . e s t e s in te r v a lo s sã o b e m e s tr e ito s (d e p e n d e n d o d o ta m a n h o da a m o stra u tiliz a d a ).
N o n o s s o e x e m p lo , n o ta -s e q u e e s ta m o s 9 5 % c o n fia n te s d e q u e a m é d ia da p o p u la ç ã o e stá
e n tre 2 ,7 2 e 1 8 .7 2 (v e r F ig u ra 3 .11 ( c )). E s te r e su lta d o é , c o n s id e r a v e lm e n te , m a is p r e c iso
d o q u e afirm ar q u e a m e d ia está en tre 0 e 6 3 . E le n o s fo r n e c e u m a n o ç ã o m a is p r e c is a de
o n d e a m é d ia p o p u la c io n a l p o s sa e sta r em r e la ç ã o à am o stra i.
\ im p ortan te lem b rar q u e, d e v id o ao fa to de e sta r m o s trab alh an d o c o m e stim a tiv a s , não
te m o s ga ra n tia d e q u e o in te rv a lo , d e fa to , e n v o lv a a m é d ia da p o p u la ç ã o . E n tão, d e v e m o s
in d icar, c o m n o s sa c o n fia n ç a , q u e o in te rv a lo c a lc u la d o c o n te m a m é d ia da p o p u la ç ã o . D a í
o term o “ in te rv a lo d e c o n fia n ç a ” .
122 Christine P- Dancey & John Reidy
(a)
A m édia populacional pode estar
em qualquer lugar ao longo desta linha
Média da
am o ;tra
100% de certeza de que a média

populacional está entre estes dois pontos
M édia da
am ostra
95 % de certeza de que a média

populacional está entre estes dois pontos
2,72
Este intervalo depende do

tam anho da am ostra utilizado
Ilu stração da fo rm a pela q u al in te rv alo s de c o n fia n ç a a u xilia m na lo c a liza ç ã o da m édia

Figura 3.11
da p o p u la ç ã o em relação à m éd ia da a m o stra .
Expusemos, anteriormente, que as distribuições amostrais tendem a se comportar nor

malmente. Ale'm disso, afirmou-se. ainda, que a média da distribuição amostrai é uma boa
aproximação da média populacional. Tal conhecimento significa que, independente do forma-
to da população, sempre sabemos qual o formato da distribuição amostrai. Isto é importante,

pois nos dá um bom discernimento sobre a população a partir das estatísticas amostrais.
No Capítulo 2, explicamos que a distribuição normal é uma função de sua média e desvio
padrão. Isso significa que, sabendo o desvio padrão e a média, podemos desenhar qualquer
curva normal. Dado que a distribuição amostrai da média é normal, ela deve, também, ser
uma função de sua média e do desvio padrão. Conseqüentemente, se sabemos a média e o
desvio padrão da distribuição amostrai da média, podemos facilmente obter seu gráfico. Po
demos usar essas informações, como auxílio, para calcular os intervalos de confiança.
Vamos supor que temos a distribuição amostrai da Figura 3 .12. O ponto de interrogação
na figura indica que não sabemos o valor da média da população (média das médias das
amostras). Digamos que constituímos uma amostra e obtemos sua média. Como não sabe
mos a média da população, não podemos ter certeza da localização da média amostrai na
distribuição: pode estar acima, abaixo ou ser exatamente a mesma da média da população
(ver Figura 3.13).
Como resolveremos a difícil questão de identificar a proximidade da média da população
à média da amostra? Em primeiro lugar, precisamos usar a distribuição amostrai da média.
Explicamos previamente duas importantes características da distribuição amostrai da média:
■ Ela é sempre aproximadamente uma distribuição normal.
■ Sua média é uma boa aproximação da média do população.
Essas duas características significam que podemos plotar uma distribuição normal que
contenha uma boa aproximação à média da população. Podemos, então, usar as caracte
rísticas da distribuição normal para fazer uma estimativa da proximidade da nossa média
amostrai à média da população. Vamos considerar a Figura 3 .14 como um exemplo de tal
distribuição amostrai.
D istrib u iç ã o a m o stra i co m m édia d e sc o n h e c id a d a s m é d ias d a s a m o s t r a s .

1 2 4 Christine P. Dancey & John Reidy
A média da am ostra pode estar acim a,

abaixo ou ser igual à média da população
A localização da m édia da am ostra em relação à m édia da p op u lação é d escon h ecid a.
A F igura 3 .1 4 in d ica que a m édia am ostrai se encontra a algu n s d e sv io s padrões acim a ou

ab aixo da m édia da p op u lação. A lém d isso , ao exam in ar a distrib u ição, te m o s co n fia n ça de que
a n ossa m édia am ostrai estará no intervalo entre - 3 e 3 d e sv io s p ad rões, c o m o ocorre c o m a
m aior parte d os valores da d istribu ição. D e fato. se c o n sid era rm o s os valores z da distribu ição
norm al, p o d e m o s calcu lar a probabilidade de e le estar no intervalo entre - 3 e 3 d e sv io s padrões.
-2 -1 2 3
A média da am ostra pode estar acim a,

abaixo ou ser igual à média da população
A m édia da am ostra en con tra-se a certo núm ero d e desvios pad rões acim a ou abaixo da
m édia da pop ulação.
Estatística sem M atem ática para Psicologia 125
que vale 99,74%. Então podemos estar 99,74% certos de que a me'dia amostrai estará entre -3 e
3 desvios padrões. Suponhamos agora, como é comum, que queremos estar 95% certos de que
um intervalo da variável contém a média amostrai. Calculamos a probabilidade novamente, con
siderando as áreas sob a curva normal. Na Seção 3.2 vimos que 95% da área sob a distribuição
normal padrão está entre ■ 1,96 e 1,96 desvio padrão (ver Figura 3.15). Então, podemos ter 95%
de confiança de que a média amostrai pode estar no intervalo entre -1,96 e 1,96 erro padrão.
Para ilustrar, vamos supor que a média amostrai está em algum lugar acima da média da
população. Se desenharmos a distribuição baseada na média amostrai em vez de na média da
população, teremos a situação ilustrada na Figura 3.16.
95% de confiança de que a média da

am ostra encontra-se dentro desta região
95% da área da curva está entre-1,96 e +1,96 desvio padrão.
A curva foi movida para cima com o

propósito de ficar centrada na média amostrai
-3 -2 ? -1 X
í í
Média populacional Média amostrai
Figura 3.16
Localização da média populacional na qual a distribuição é desenhada em torno da
média amostrai.
126 C hristine P. Dancey & John Reidy
P o d e m o s a gora ap licar a m e sm a ló g ic a q u e u s a m o s a p o u c o para p rever o n d e a m éd ia

am ostrai está em r ela çã o à m é d ia da p o p u la ç ã o . P o d e m o s ter bastan te c o n fia n ç a d e q u e a m é
d ia da p o p u la ç ã o está e m a lg u m lugar d entre 1,96 d e s v io pad rão a b a ix o da m é d ia am ostrai.
D a m e sm a m an eira, se a m é d ia a m ostrai e stá a b a ix o da m éd ia da p o p u la ç ã o , p o d e m o s ter
c erteza d e qu e a m éd ia da p o p u la ç ã o e stá a 1 ,96 d e s v io padrão a c im a da m é d ia am ostrai (ver
F ig u ra 3 .1 7 ). C o n se q ü e n te m e n te , p o d e m o s estar cer to s (95% de c o n fia n ç a ) de q u e a m éd ia da
p o p u la ç ã o e stá d entro d a reg iã o a 1 ,9 6 d e s v io padrão a c im a ou a b a ix o da m é d ia am ostrai. E
im p ortan te ter e m m e n te q u e o d e s v io padrão ao qual n o s r efe rim o s aqui é o da d istrib u içã o
a m ostrai, e não o da am ostra. M u n id o s d e ss a in fo r m a çã o , p o d e m o s in d icar a d istâ n c ia entre
a m é d ia am ostrai e a m é d ia da p o p u la ç ã o . T u d o q u e p r e c isa m o s sab er é a m éd ia am ostrai e o
d e s v io pad rão da d istrib u içã o am ostrai.
A curva moveu-se para baixo a fim

de ficar em torno da média amostrai
í í
Média am ostrai Média populacional
Distribuição d esen h a d a em torno da m édia am ostrai q u an d o abaixo da m édia

populacional.
3.5.1 Erro padrão

O d e s v io pad rão da d istr ib u iç ã o am ostrai da m é d ia é u m c o n c e ito im p o r ta n te e é d e
n o m in a d o de erro padrão. O erro pad rão fo r n e c e u m a m e d id a d o grau c o m q u e as m é d ia s
a m o stra is se d e sv ia m da m é d ia d as m é d ia s a m o stra is. D a d o q u e a m é d ia das m é d ia s a m o s
trais é a m é d ia da p o p u la ç ã o , o erro pad rão da m éd ia n os in form a, tam b ém , qual o grau c o m
q u e as m é d ia s am ostrais se afastam da m éd ia p o p u la c io n a l. C o n se q ü e n te m e n te , u m a v e z que
so m o s c a p a z e s de e stim a r o erro pad rão, p o d e m o s usar esta in fo r m a çã o para d e sc o b r ir o q u ão
p r e cisa é n o s sa e stim a tiv a da m éd ia da p o p u la çã o .
O p ro b lem a q u e e n fr en ta m o s aqui é p arecid o c o m o da d is c u s s ã o d o o v o e da g a lin h a . S e
s o u b é s s e m o s o erro pad rão, p o d er ía m o s sab er a p r e c isã o da n o s sa e stim a tiv a da m é d ia da p o
p u lação. E ntretanto, para p o d er m o s c a lc u la r o erro pad rão da m é d ia , tería m o s q u e se le c io n a r
m u ita s am ostras da p o p u la ç ã o e , a p ó s, ca lc u la r o d e s v io padrão d as m é d ia s d e ss a s am ostras.
Estatística sem M atem ática para Psicologia 1 27
Is so n ão é m u ito útil se q u e r e m o s sim p le sm e n te e stim a r a lo c a liz a ç ã o da m é d ia p o p u la c io n a l

e m r ela çã o à me'dia de um a am ostra. F e liz m e n te o s e s ta tís tic o s d e sc o b r ira m qu e p o d e m o s ,
fa c ilm e n te , estim a r o erro padrão u tiliz a n d o a n o s sa am ostra.
C o m o d ito a n teriorm en te, o erro de a m o str a g em e stá rela cio n a d o ao tam an h o da am ostra.
Q u an to m aior o tam an h o d a am ostra, m e n o r o erro am ostrai. A m o stra s m a io res ten d em a ter
m é d ia s que m elh o r e stim a m as m é d ia s da p o p u la ç ã o . S ig n ific a qu e ten d em a não variar tanto
em r ela ç ã o à m éd ia da p o p u la ç ã o q u a n to as m é d ia s d as p e q u e n a s a m o stra s. É im p ortan te
lem brar q u e a m ed id a d o grau d e v ariação da m é d ia é o d e s v io pad rão e q u e o d e s v io padrão
das m é d ia s a m o stra is c c h a m a d o de erro padrão. C o n se q u e n te m e n te , para gran d es am ostras o
erro padrão ten d e a ser m en or do qu e para p e q u en a s am ostras. L o g o , o erro padrão está rela
c io n a d o ao tam anh o da am ostra. P ortanto, para q u alq u er p o p u la ç ã o , qu anto m aior a am ostra
s e le c io n a d a , m e n o r é o erro padrão. P ara n o s sa c o n v e n iê n c ia , c o m p r o v o u -se q u e, dad a u m a
am ostra, se d iv id ir m o s o d e s v io pad rão d e ss a a m o stra p e la raiz qu adrada d o se u ta m an h o,
te re m o s um a e stim a tiv a do erro padrão.
P o d e m o s ca lc u la r a m éd ia am ostrai e o d e s v io padrão de q u alquer am ostra. C o m o sa b e
m o s q u e o erro padrão é a p r o x im a d a m e n te o d e s v io pad rão d iv id id o p e la raiz qu adrada do
tam an h o da am ostra, p o d e m o s tam b ém c a lc u lá -lo . O erro padrao é o d e s v io padrão da d istri
b u içã o a m ostrai da m éd ia. A s ta b ela s de d istr ib u iç ã o norm al in d ic a m q u e 95% d o s e s c o r e s
e stã o entre 1 ,9 6 d e s v io padrão a c im a e a b a ix o da m ed ia. A o a p lica r m o s is s o à d istrib u içã o
am ostrai da m é d ia , p o d e m o s ter 95% de c o n fia n ç a de qu e a m éd ia da d istr ib u iç ã o am ostrai
e stá entre 1 .96 d e s v io padrão da m éd ia am ostrai. P ortan to, a m éd ia da d istrib u içã o am ostrai
d e v e en con trar-se d entro da reg iã o 1 ,96 x o erro padrão e a m éd ia am ostrai. D a d o que a m éd ia
da d istr ib u iç ã o am ostrai da m é d ia é u m a b oa e stim a tiv a da m éd ia p o p u la c io n a l, p o d e m o s
estar 95% c o n fia n te s, tam b ém , d e qu e a m é d ia p o p u la c io n a l estará dentro d o in tervalo que se
en co n tra 1 ,96 v e z e s o erro padrão a lé m d a m é d ia am ostrai.
U m e x e m p lo p o d e ilu strar e s s a situ a ç ã o . S e tiv er m o s o s se g u in te s dado^ a m o str a is de
um e stu d o (2 , 5, 6, 7, 10, 12), p o d e m o s c a lcu la r a m éd ia e o d e s v io padrão, que sã o 7 e 3 ,5 8 ,
r esp e ctiv a m en te. O p rim eiro p a s so é ca lc u la r o erro padrão. L e m b r e-se de que o erro padrão
é sim p le sm e n te o d e s v io pad rão da am ostra d iv id id o pela raiz quadrada d o tam an h o am ostrai.
T e m o s aqui um tam an h o am ostrai d e 6. p ortanto a raiz quadrada é 2 ,4 5 . A o d iv id ir o d e s v io
padrão ( 3 ,5 8 ) por e s s e n ú m ero , te m o s o r esu lta d o de 1.46. U m a e stim a tiv a d o n o s s o erro
padrão é, portanto, 1,46. Para ca lc u la r o in tervalo de c o n fia n ç a de 95% . m u ltip lic a m o s o erro
padrão por 1 ,9 6 e o b te m o s o resu lta d o de 2 ,8 6 . A s sim o in tervalo de c o n fia n ç a , c o m 95% de
p ro b a b ilid a d e, é 7 ± 2 ,8 6 , ou ainda, de 4 ,1 4 a 9 .8 6 (ver F igu ra 3 . 18(a)).
E s s e in te r v a lo de 95% d e c o n fia n ç a te m u m a a m p litu d e m u ito g r a n d e , c o n sid e r a n d o
q u e n o s s o s v a lo r e s variam entre 2 e 12. T rata-se de um in te rv a lo tão g r a n d e p o rq u e a a m o s
tra u tiliz a d a é p e q u en a . Para m e lh o r ilu str a rm o s, v a m o s im a g in a r q u e o b tiv e m o s a m e sm a
m é d ia e d e s v io pad rão c o m u m a a m o str a d e 1 0 0 . N e s s e c a s o . a raiz q u ad rad a d e n o s s a
a m o str a se r ia 10. A o d iv id ir m o s o d e s v io p ad rão ( 3 .5 8 ) por e s t e n ú m er o , o b te r ía m o s um
erro pad rão de 0 .3 5 8 . Para o b ter n o s s o in te rv a lo de c o n fia n ç a de 95 % , m u ltip lic a r ía m o s o
erro pad rão p or 1,9 6 . I s s o s ig n if ic a qu e n o s sa m é d ia p o p u la c io n a l d e v e r ia esta r na r e g iã o
en tre 0 ,7 0 u n id a d e s a c im a e a b a ix o da m é d ia da a m o str a , q u e é 7 . P ortan to, te r ía m o s 95%
d e c o n fia n ç a , d e q u e a m é d ia p o p u la c io n a l e sta ria en tre 6 ,3 0 e 7 ,7 0 . S e r ia u m a a m p litu d e
b em m e n o r d e v a lo re s e daria u m a m e lh o r in d ic a ç ã o de o n d e p o d e r ia estar a m é d ia p o p u la
c io n a l (v e r F igu ra 3 .1 8 (b )).
(a) Am ostra de tam an ho igual a 6 Intervalo de

4,1 4 confiança 9,86
M édia da
am ostra é 7
(b) A m ostra de tam anho igual a 100 Intervalo de

6,3 confiança 7,7
Média da
am ostra é 7
In tervalo s de c o n fia n ç a com a m o stra s de ta m a n h o 6 e 1 0 0 .
P o d e m o s ver, portanto, a im p ortan cia d o tam an h o de n o s sa am ostra q u an d o ten ta m o s e s

tim ar o s p arâm etros da p o p u la ç ã o u tiliz a n d o e sta tístic a s am ostrais. G era lm en te, q u an to m aior
a am ostra, m elh or a e stim a tiv a d o parâm etro,
O resu m o a se g u ir p o d e e x p lic ita r o q u e a ca b a m o s de explicar:
■ A m é d ia am ostrai é u m a e stim a tiv a por pon to, e sua p r o x im id a d e da m éd ia popula

c io n a l é d e sc o n h e c id a .
■ S e c a lc u la r m o s in terv a lo s d e c o n fia n ç a em torno da m éd ia am ostrai, p o d e m o s ter
um a b o a id é ia do q u ã o p róxim a e stá da m é d ia p o p u la c io n a l.
■ Para c a lc u la r m o s in terv a lo s de co n fia n ç a , p r e c isa m o s fazer u so d e d istr ib u iç õ es
am ostrais.
■ Se constituirm os m uitas am ostras da população e plotarm os as m édias das am ostras com o
um histogram a de freqüência, terem os produzido um a distribuição am ostrai da média.
■ D istr ib u iç õ e s a m o stra is ten d em a ter form ato norm al.
■ A m éd ia da d istr ib u iç ã o am ostrai da m é d ia p rod u z um a boa e stim a tiv a da m éd ia p o
p u la cio n a l.
■ O d e s v io padrão da d istrib u içã o am ostrai da m éd ia n os d iz o qu an to as m é d ia s a m o s
trais variam em relação à m é d ia p o p u la c io n a l.
■ O d e sv io padrão da distribu ição am ostrai é ch am ad o de erro padrão e é ap roxim ad a
m en te igual ao d e sv io padrão da am ostra d iv id id o pela raiz quadrada do seu tam anho.
■ S a b e m o s q u e um in terv a lo d e 1 ,9 6 d e s v io padrão da m é d ia c o n té m a c o n ta s 95% d os
v a lo r e s de um a d istrib u içã o norm al padrão.
■ U s a n d o e s s a in fo r m a çã o , p o d e m o s g e n e ra liza r r esu lta d o s para d istr ib u iç õ e s a m o s
trais q u e ten d em a ter u m a form a norm al.
■ P o d e m o s dizer, c o m 95% de c o n fia n ç a , qu e um in terv a lo de .1,96 de v io padrão em
torno d a m éd ia am ostrai c o n té m a m éd ia p o p u la c io n a l.
■ O d e s v io padrão da d istrib u içã o a m ostrai é o erro padrão, e , se o m u ltip lic a r m o s por
1 ,9 6 , te re m o s um in tervalo d e 95% c o n fia n ç a para a m é d ia p o p u la c io n a l.
‘ N. de T. Os autores estão se referindo aqui n distribuições amostrais de médias evidentemente.

Atividade 3.7
0 q u ã o c o n fia n te p o d e m o s e star d e q u e a nossa m édia p o p u la c io n a l está d e n tro de 1 ,9 6

erro p a d rã o d a m éd ia d a a m o s tra 7
D ig a m o s q u e v o c ê se le c io n o u u m a a m o s tra d e 2 0 p e sso a s c o m fo b ia d e a ra n h a s e
o b te v e u m a m e d id a do m e d o q u e se n te m d e sse s in s e to s . O in te rv a lo d e c o n fia n ç a p a ra a
m é d ia é d e 1 ,5 a 5 ,6 . O q u e isso in d ic a ? Se v o c ê tiv e sse s e le c io n a d o u m a a m o s tra d e 2 0 0
p e sso a s co m fo b ia d e a r a n h a s , o in te rv a lo d e c o n fia n ç a se ria m a io r o u m e n o r do q u e o
a n te rio r?
□ SPSSPW: obtenção de intervalos de confiança
É m u ito sim p le s ob ter in terv a lo s d e c o n fia n ç a para a m éd ia c o m o S P S S P W . V o c ê d ev e

seg u ir o c o n s e lh o d ad o a n teriorm en te para té c n ic a s d e sc r itiv a s, se le c io n a n d o a c a ix a d e d iá
lo g o Explore (E xplorar).
Coloque as
variáveis
nesta caixa
Selecione a
opção Statistics
(Estatísticas)
Clique no
botão Statistics
SPSS Processa n ready
(Estatísticas) ► QJ 1|
¡ y Mctosott Word ■E I Ì J Lqatoirg • Chapic<3 jfojUntitled - SPS... 1734
Dependent List (L ista d e p e n d e n te ) e c liq u e

C o lo q u e as v a r iá v e is r elev a n tes no p ain el
na o p ç ã o Display Statistics (M ostra e sta tístic a ). Para garantir q u e a c ria çã o de in terv a lo s de
c o n fia n ç a , v o c ê d ev e c lic a r no b otão Statistics (E sta tístic a s). A se g u in te c a ix a de d iá lo g o será
apresentada.
Verifique se
&\a\a\ E a M I I b=|6| w| >Tlr-| cl- 1-inl o valor correto
está m arcado
I-
goto C- Statistics C Ptojs
« I ■(\ Data View ^ Variable View /

SPSS Process« is leady
“]_iL V
< s i a. i | 23 0 K ^ ! > 3 j y MmosoßW j JjE x p ta n g -C Iliff UniiHed- *»2 MGi FfrcloS [' 1? 35
V ocê d e v e estar aten to a o fato de q u e o S P S S P W está c o n fig u r a d o para gerar in te rv a lo s

d e c o n fia n ç a de 95% por o m is s ã o ( default ). S e q u ise r gerar in te rv a lo s c o m c o n fia n ç a d ife
ren te d e 95 % , d e v e ajustar o p ercen tu al para o d e se ja d o . E n tretanto, g e ra lm en te n ão terá de
fa zer o aju ste, p o is se esp era q u e g e re in te rv a lo s c o m 95% de c o n fia n ç a . U m a v e z q u e tenha
certeza d e q u e se le c io n o u as o p ç õ e s corretas, c liq u e em Continue (C o n tin u e ) s e g u id o de OK
para gerar a saíd a. E is um e x e m p lo de saída:
EXPLORE
Case Processing Summary (Sumário do Processamento de Casos)
Cases (Casos)
Valid (Válidos) Missing (Valores Perdidos) Total

Percent Percent Percent
N N N
(Percentual) (Percentual) (Percentual)
Statsanxiety
6 100.0% 0 .0% 6 100.0%
(Ansiedade Estatística)
Descriptives (Medidas Descritivas)

(Estatística) (Erro Padrão)
Statsanxiety Mean (Média) 55.6667 2.3190
(Ansiedade gô/QConfidence Lower Bound Intervalo de
Estatística) Interval for Mean (Limite Inferior) 4 9 .7 0 5 5 - confiança
(Intervalo de Confiança Upper Bound (49,71 até 61,63)
de 95% para a Média) (Limite Superior) 6 1 .6 2 7 9 -
5% Trimmed Mean (Média Interna de 5%) 55.7407
Median (Mediana) 57.0000
Variance (Variância) 32.267
Minimum (Mínimo) 4 8 .0 0
Range (Amplitude) 14.00
Interquartile Range (Intervalo Interquartil) 11.0000
Kurtosis (Curtose) -1 .8 3 2 1.741
Diagramas de barras de erro
G erar d ia g ra m a s de barras de c it o c o n stitu i u m a b oa m an eira de ap resen tar in te rv a lo s

d c c o n fia n ç a e m p e sq u isa s . A m éd ia é e x ib id a c o m o um p o n to sob re um a lin ha v ertica l, que
rep resen ta o in te rv a lo de c o n fia n ç a . Q u a n to m aior o in tervalo, m a io r a lin ha qu e p a ssa p ela
m éd ia . A F igu ra 3 .1 9 m ostra o s d iagram as d e barras de erro para o s in te rv a lo s de c o n fia n ç a
que a ca b a m o s de calcular.
N a F ig u ra 3 . 19 , é fá c il ver a d ife re n ç a entre o s in te rv a lo s de c o n fia n ç a q u an d o o tam anh o
da am ostra au m en ta de 6 para 100.
Média
A distância entre o
início e o fim das linhas
é igual à am plitude
do intervalo
de confiança
M éd ia s e in te rv alo s de c o n fia n ç a para a m o stra s d e 6 e 1 0 0 .

Figura 3.19
132 Christine P. Oancey & John Reidy
D ig a m o s q u e q u is é s s e m o s d e sc o b r ir se du as m é d ia s p o p u la c io n a is s e d ife r e n c ia m . P o
d e r ía m o s usar in tervalos de c o n fia n ç a para n os guiar. Por e x e m p lo , im a g in e qu e v o c ê queira
d esco b rir se as m en in a s o b tê m m e lh o re s resu lta d o s d o qu e os m e n in o s em te ste s de m a tem á
tica. V o cê ad m in istra u m a prova de m a tem á tica para du as am ostras, um a de m e n in o s e outra
de m e n in a s. D e s s a s du as am ostras, c a lc u la o s in terv a lo s de c o n fia n ç a e o b tém o d iagram a de
barras d e erro da F igu ra 3 .2 0 .
O qu e fazer co m isso ? P o d e m o s ter 95% de c o n fia n ç a de q u e as m é d ia s p o p u la c io n a is e s
tão dentro d o s in te rv a lo s in d ic a d o s n o d iagram a. C o m o e x iste um a c o n sid e r á v e l so b r e p o siç ã o
entre o s d o is in tervalos de c o n fia n ç a , não p o d e m o s ter c erteza d e qu e e x ista d ife re n ç a entre as
m é d ia s p o p u la c io n a is. N ã o p arece provável que haja u m a d ife re n ç a real nas p o p u la ç õ e s, ou
p e lo m e n o s n ão p o d e m o s p erceb er is s o por m e io de n o ssa s am ostras. P o d e ser que m e n in o s
ten h am um a m é d ia p o p u la c io n a l m aior d o que m e n in a s, ou v ic e -v e r sa . P o d e ser ta m b ém que
as m é d ia s p o p u la c io n a is d e m e n in o s e m en in a s se ja m ig u a is. N ã o sa b e r e m o s p e lo s in terv a lo s
de c o n fia n ç a a p resen ta d o s na F ig u ra 3 .2 0 e, portanto, não p o d er e m o s ob ter c o n c lu s õ e s co m
base n e s s e s d ad os.
A g o r a , v a m o s su p o r q u e o b t iv é s s e m o s o s in te r v a lo s d e c o n f ia n ç a m o str a d o s na F ig u
ra 3 .2 1 . Q u a l seria a c o n c lu s ã o ? N e s s e c a s o , p o d e m o s ver q u e o s in te r v a lo s d e c o n f ia n ç a
n ã o s e s o b r e p õ e m . P o d e m o s ter 9 5 % d e c o n fia n ç a d e q u e a m b a s m é d ia s p o p u la c io n a is
e s tã o e n tr e o s in te r v a lo s in d ic a d o s e , p o r ta n to , n ã o se s o b r e p õ e m . I s s o s u g e r e q u e e x is t e
u m a d ife r e n ç a real e n tr e a s m e d ia s p o p u la c io n a is , P a r e c e , p o r ta n to , q u e a s m e n in a s s e
s a e m m e lh o r d o q u e o s m e n in o s e m te s te s d e m a te m á tic a . V o c ê p o d e v e r q u e , e x a m in a n d o
o s in te r v a lo s d e c o n f ia n ç a , o b t e m o s u m a id é ia c la r a d o p a d rã o d o s v a lo r e s d a s m é d ia s
p o p u la c io n a is .
100
50
0
M enino s M eninas
D iag ra m a d e b a rra s de erro da so b re p o siç ã o de in te rv alo s d e c o n fia n ç a para m e n in o s e

m e n in a s em um te ste de m a te m á tica .
D ia g ra m a de b a rras d e erro da n ã o -so b re p o siçã o de in te rv alo s de c o n fia n ç a para

Figura 3.21
m e n in o s e m e n in as em testes de m a te m á tica .
Atividade 3.8
Em qual dos seguintes d iag ram as de b arras de erro existe um a p robabilidad e real de haver d i
ferença entre as pop ulações das quais fo ram retiradas am o stra s dos dois grupos ap resentad o s?
(a) 10 (b) 10
T
1
T T
5- _L - 1
Cheetahs Jaguars Athletes Couch potatos

(leopardos) (jaguares) (atletas) (preguiçosos)
(c) (d) 10
1 1
.
i
People Computers Rich Poor
(pessoas) (computadores) (ricos) (pobres)
I |) SPSSPW: geração de diagramas de barras de erro
Para gerar um d iagram a de barras d e erro c o m o S P S S P W , v o c ê d e v e c lic a r no m enu

Graphs (G rá fico s) e d e p o is s e le c io n a r a o p ç ã o Error Bar... (D ia g r a m a de B arras de Erro). A
se g u in te c a ix a de d iá lo g o s será apresentada:
á-iHial 53| -g I -I fei&i Ml -r11—

11. :|.i.ir.l 4.|<a»l
7 : nodog
Para o wilhdog I nodog |__________ |__________ |_______ |
d elineam ento
dentre
participantes,
selecione estas
te I Dghr» I
duas opções Cancel I
Hdp
ОМпСЫДге -
í '-/renane-, loi Ы c ò iti
Sterili«*! d variable1:
' I 1 f\Daia Vu>wД - .'о к а е м .‘• y n !

SPSSPioc«so» n - t M /
2Г1
g S l.u l| П ^ [ i ► QI r y у [ i | |з д UnIUled- rtGI PWoS | - В И З 1âI & y / Э7
D a c a ix a de d iá lo g o , as o p ç õ e s q u e v o c ê e s c o lh e r d ep en d erã o d o d e lin e a m e n to d o êu e s

tudo. S e tiver u sa d o um d e lin e a m e n to dentre p articip an tes e q u iser com p arar du as (ou m ais)
va r iá v e is, s e le c io n e as o p ç õ e s Simple (S im p le s) e Swiimaries o f separata variables (R e su m o s
d e v a r iá v e is sep arad as). C liq u e e m Define (D e fin ir ), e a se g u in te c a ix a d e d iá lo g o s será apre
sentada:
BS2
¡¿■|H|á>| aa| ч i I M&i *1 ‘í 11—
I ci-i-lr.l ■•[ч>|
7 rodog
wilhdoii I nodog [__________ |__________ |__________ |__________

9 OC
?Õ0"
“ 10 00
£inx Bar; 0* I
1200
8 00 " il 1
eoo И Be«*I
Cancel I
Reprезег*
j Cortrfírice r t e t . ai fa meen
Tempiale ...
Г” Уve chart tpecfcabon; Irom I
■1>|\рлиУ|«»{ VmmtteVmrrTJ |_<J_________

SPSS ProcetKX is teady
- f lS la .l| 2 1 GD К ^ ► GJ Зум.з,г.о1 | jjE n t o » . ||sr, ün».ll . »-MGIPb | -assetiti) / '«
HE/: NUMil
C o loq ue a VD na
caixa Variable
13 wafccond (Variável) e a
walkcond I I/ Í T ' I VI na caixa
1 1 00 90 : Deline Simple F iioi B a r Summaries la i Gioups of Cases
2 1 00 70 C a teg o ry A xis
,------ - Vanabte
3 1 00 100 (Eixo das
4 1 00 120 Q ra
5 1 00 60
Categorias)
6 1 00 80
7 200 40
□
3 200 50
9 200 30
10 200 60 fiats Repeiert
11 200 50
12 200 10
| Confidence nlwval 1« mwn “3
Templale
F U » eh«» ipecAcatiom fiom.
« I ►|\O ata View ^ VariaMe Vtew /

SPSS Processa is ready
| j J ____________________
£
< S 1 » || A •; ► O iyM iooial I lliB U m iil. *?.MOiPh isawotJit /
Você notará que existe uma caixa para a variável dependente (Variable - Variável) e ou
tra para variável de agrupamento (Category Axis - Eixo das categorias). Coloque a variável
dependente na caixa Variable e a variável independente na caixa Category Axis. Clique no
botão OK para gerar o diagrama de barras de erro. Ele deve ser semelhante ao demonstrado
na Figura 3.23.
12
10
?LO 8
a>
T3
cu
= 6
O
0
6
W ITHDOG NODOG
(Com o cachorro) (Sem o cachorro)
GROUP (Grupo)
D ia g ra m a de b a rras d e erro para o e stu d o de p asse io de c a c h o rro co m d e lin e a m e n to

e n tre p a rticip a n te s.
3.8 Intervalos de confiança e outras estatísticas
Ilustramos intervalos de confiança em torno da média para demonstrar o uso dessa

técnica. Você deve notar que não estamos restritos às médias quando trabalhamos com in
tervalos de confiança. Podemos calculá-los para outras estatísticas, incluindo o tamanho
real da diferença entre duas médias, variâncias e coeficientes de correlação. Explicaremos
isso em detalhes nos Capítulos 5 e 6. Caso exista uma estimativa por ponto, normalmente é
possível determinar outra por intervalo.
É importante lembrar que, se você está investigando diferenças entre grupos, o intervalo
de confiança da magnitude da diferença entre os grupos é útil. Se o intervalo de confiança
incluir o zero, sugere a possibilidade de não existir diferença entre os grupos na população.
Isso será explicado com detalhes no Capítulo 6.
processamento emocional e síndrome do pânico
No Capítulo 2, descrevemos o estudo de Baker e colaboradores (2004), que comparava o con
trole emocional de um grupo de pacientes com síndrome do pânico com o de dois grupos de controle
sem síndrome do pânico (um de Londres e outro de Aberdeen). Os pesquisadores concluíram que
pacientes com síndrome do pânico tendiam a controlar mais suas emoções do que os dos grupos de
controle. Nesse artigo, os autores colocam os intervalos de confiança da magnitude da diferença en
tre os grupos no escore total da Escala de Controle Emocional de Courtauds (CECS). Relatam, por
exemplo, que a diferença da média entre o grupo com pânico e o grupo de controle de Aberdeen foi
de 10,2 pontos, com um intervalo de confiança de 95% de 6,0 a 14,3. A diferença da média entre o
grupo com pânico e o grupo controle de Londres foi de 13,4, com um intervalo de confiança de 95%
de 9,9 a 16,8. Finalmente, a diferença de média entre os dois grupos de controle foi de 3,2, com um
intervalo de confiança de 95% de 0,06 a 5,9.
□ SPSSPW: uso do instrutor de resultados (Results Coach)
Agora que você já está acostumado a realizar análises usando o SPSSPW, gostaríamos
de apresentar uma característica muito útil desse programa. Toda vez que estiver com uma
saída do SPSSPW na tela, você pode se valer de um recurso denominado Results Coach (ins
trutor de resultados) que serve de auxílio na interpretação dos resultados de uma análise. Um
dos problemas do SPSSPW é nos fornecer, geralmente, mais informações do que, de fato,
precisamos. Tentar decidir o que é relevante nos resultados apresentados consiste em uma
dificuldade para alunos sem experiência com o programa. O instrutor de resultados pode ser
bastante útil nessas situações.
Para ativar o instrutor de resultados, é necessário ter alguma saída na tela. Iremos demons
trar essa característica com os resultados de uma análise descritiva da variável “ansiedade
estatística” que apresentamos no início do capítulo. Com a tabela Descriptives (descritivas) na
tela, p o sic io n e o cursor em qualquer lugar sobre a tabela e cliq u e no b otao direito do mouse. U m
m enu de o p ç õ e s d eve ser apresentado, c o m o a seguir.
E штшi
Fie Edit V«rw Data Transform Insert Format Analyze £raphs Utfeies Window Helo
tfiBiaiai ч»1 ■I aiM&i <¿í Д М

<■!♦! +I-I ш И tl's m i
Selecione Results
Coach (instrutor
de resultados)
a partir
deste menu
Posicione o
m ouse sobre
a tabela e
clique no
botão direito
í 5tart | . , 5PS5 IZ.Ofoc W rdü...| Hb|UnUled ■5P55 Data . 11 ¿3 Output 1 - SPSS Vi— 1Ü<t ' il Ì ‘' 3-'
V ocê d ev e e n tão clic a r na o p ç ã o Results Coach (instrutor d e r esu ltad os) para ativar o in s
trutor. A p arecerão um e x e m p lo da sa íd a e um a d e sc r iç ã o do c o n te ú d o da tabela. V ocê notará
que no can to inferior direito da tela en con tram -se o s b o tõ es da n avegação que d e sc r ev e m o s no
C ap ítu lo 1 quando m ostram os o s tutoriais. S e clicar na seta à direita, será lev a d o , p a sso a p a sso ,
pela tabela e tera um a breve d esc r iç ã o d o s co n teú d o s. Isso p o d e ser útil para aju d á-lo a d ecid ir
em quais in fo rm a çõ es v o c ê precisa prestar m ais atenção.
Tabela de exem plo

/
ISÜP-' I JOJxJ
Division
Consumer B usiness
Products Products
/ 4309.112 »425.152
95% Confidence Lower Bound $295.906 »397.553
interval for Mean upper Bound »322,319 »452.751
5% Trimmed Mean $299.392 »404.435
Median »289.800 »339,000
3id Deviation 189,537 : ■
Minimum »189.000 »213.000 Breve
Maximum »&97.500 »1,350,000 descrição
Range »508,500 я . 137.000 The Explore Descriplrves table
interquartile Range »77.400 »249.000 provides summary s ta tistic . for . do conteúdo
S kew ness 1 987 continuous numeric variables
1 573 da tabela
Kurtosis 5 267 2 477
Botões de
E xplore D escrip tive S ta tis tic s navegação
J S tart] jg)| Untitled • SPSS Data... | Output 1 - SPSS Vievyci 11^ Tutorial M*roio<t Photo Edtot | « • « < > í IÌ.Q,
V ocè p o d e usar esta característica c o m o ajuda so m e n te co m tab elas que o S P S S P W pro

duz. E sse recurso não fun cionará c o m diagram as c o m o os de barras de erro e o s de d isp ersão.
Para fech a r o instrutor de r esu lta d o s, c liq u e no b o tã o Close Wirtdow (fech a r ja n e la ), que
é o botão .v. Is s o d everá le v á -lo de volta para a tela de saíd a do S P S S P W .
Resumo
N e s s e ca p ítu lo , e x p lic a m o s vários c o n c e ito s im p ortan tes, b a sila res para um e n te n d im e n to

c o m p le to da esta tística . S e n d o m ais e s p e c ífic o s , v o c ê d ev e ter ap ren d id o que:
■ P rob ab ilid ad es p o d em ser rep resen tad as em term os d e ra zõ e s (p. e x ., 1 e m 5), d e c im a is

(0 ,2 ) ou p ercen tagen s (20% ).
■ P ro b a b ilid a d es c o n d ic io n a d a s sã o p ro b a b ilid a d es d e um e v e n to que d e p e n d e da o c o r
rên cia de outro ev en to .
■ P o d e m o s usar a d istrib u içã o n orm al padrão e o s v a lo r e s z para d esco b rir a prop orção
da p o p u la ç ã o que está a cim a ou a b a ix o de um certo valor ou qu e e stá situad a entre
d o is valores.
■ S e c o n s titu ir m o s m u ita s a m o str a s dc u m a p o p u la ç ã o e p lo ta r m o s su a s m é d ia s
c o m o um h isto g r a m a de fr e q ü ê n c ia s , te r e m o s d e te r m in a d o a d istr ib u iç ã o am ostrai
da m e d ia .
■ Q u an to m ais am ostras tiv erm o s e q u an to m a io re s fo r em , m ais p rovável é qu e a d istri
b u iç ã o am ostrai da m é d ia se a p r o x im e de u m a d istrib u içã o norm al, não im p ortan d o a
d istrib u içã o d a p o p u la ça o .
■ O d e s v io pad rão da d istrib u içã o am ostrai da m é d ia é o erro padrão da m e sm a , e e s s e
v alor n os dá um a in d ic a ç ã o de c o m o as m é d ia s d as am ostras variam e m r ela çã o à
m ed ia p o p u la c io n a l.
■ O erro padrão é a p r o x im a d a m e n te igu al ao d e s v io pad rão da am ostra d iv id o p e la raiz
quadrada do tam anh o da am ostra e d e v e ser m u ltip lic a d o por um v a lo r c para p rod u
zir in te rv a lo s de con fian ça.
■ In tervalos de c o n fia n ç a n os d ão um c o n ju n to de v a lo re s no qual p o d e m o s ter 95C
Á de
c o n fia n ç a de qu e c o n te n h a a m éd ia p o p u la c io n a l.
■ P o d e m o s ilustrar c o n v e n ie n te m e n te in te rv a lo s d e c o n fia n ç a u san d o g r á fic o s de barras
d e erro.
Exercício 1
E m u m c o n s u lt ó r io d e c ir u r g ia d e n tá r ia , a e n fe r m e ir a N a s h e r e o Dr. P a y n e d e c id e m
q u e q u e r e m ten tar r ed u z ir o s n ív e is d e a n s ie d a d e d e p a c ie n te s e m tr a ta m e n to . D e c id e m
q u e a m e lh o r m a n e ira d e fa z e r is s o se r ia is o la r a c u s tic a m e n te as sa la s de e sp e r a a fim d e
q u e o s p a c ie n te s q u e a g u a r d a m n ã o p o d e r e m e sc u ta r o s g r ito s d o s p a c ie n t e s s e n d o tra
ta d o s. P ara ter c e r te z a d e q u e as p a r e d e s à p r o v a d e s o m r e a lm e n te r e d u z e m a n s ie d a d e ,
is o la m a c u s tic a m e n te a p e n a s u m a sa la d e e sp e r a e c o m p a r a m c o m a a n s ie d a d e de p a
c ie n te s q u e e sp e r a m na sa la q u e n ã o é a p rova d e so m . P a c ie n te s s ã o c o lo c a d o s n as d u as
sa la s a le a to r ia m e n te q u a n d o c h e g a m e p r e e n c h e m um q u e s tio n á r io e n q u a n to a g u a r d a m .
O questionário fornece um escore baseado em vários aspectos de ansiedade associados à

ida ao dentista: quanto maior o escore, maior o nível de ansiedade. A enfermeira Nasher e
o Dr. Payne esperam que haja uma diferença nos escores de ansiedade entre os pacientes
das duas salas de espera. Abaixo seguem os escores de ansiedade dos pacientes de cada
uma das salas de espera:
Sala com isolamento acústico Sala sem isolamento acústico
12 16
11 26
8 20
4 21
3 19
13 20
10 22
10 18
9 20
11 17
1. Esse é um delineamento entre ou dentre participantes?

2. Coloque os dados da tabela acima no SPSSFW e obtenha as seguintes estatísticas
para cada grupo:
■ a média
■ o desvio padrão
■ o erro padrão
■ intervalos de confiança de 95%
(a) Use SPSSFW para gerar gráficos de barras de erro para cada um dos grupos.
(b) Converta o primeiro escore em cada condição para um valor z-
Exercício 2
O Dr. Doolittle finalmente desistiu da idéia de conversar com animais e decidiu tornar-se
um psicólogo experimenta] de animais. Fie está particularmente interessado em descobrir se os
gatos são ou não mais inteligentes do que os cachorros. Para isso, desenvolve um teste de inte
ligência específico a esse estudo e testa amostras de gatos e cachorros. Foi cuidadoso para não
introduzir qualquer tipo de tendenciosidade no teste e acredita ter criado um teste dissociado
de espécies, que pode ser usado em qualquer espécie. O Dr. Doolittle acredita que haverá uma
diferença entre os escores de gatos e cachorros. Os escores estão na tabela a seguir.
Gatos Cachorros
95 116
100 112
104 102
78 96
130 89
111 124
89 131
1 14 117
102 107
97 1 10
Estatística sem M atem atica para Psicologia 141
1. Q u e tip o de d e lin e a m e n to é e s te estu d o: q u a se -ex p er im en ta l ou ex p e rim en ta l?
2. E um e stu d o en tre ou dentre p articip an tes?
3. C o lo q u e o s d a d o s d a tabela a c im a n o S P S S P W e o b te n h a as se g u in te s e sta tística s

para c a d a grupo:
■ a m éd ia
■ o d e s v io padrão
■ o erro padrão
■ in tervalos d e c o n fia n ç a d e 95%
(a) U s e S P S S P W para gerar g r á fic o s de barras d e erro para cad a u m d o s gru p os.
(b ) C on verta o p rim eiro e sc o r e e m cada c o n d iç ã o para u m v alor z.
•
QUESTÕES DE MÚLTIPLA ESCOLHA 6. Se você tem um a probabilidade de 33%, com o ela

é expressa em decim al?
1. Q ual é o valor da probabilidade 1 em 5 expressa (a) 0,033

com o percentagem ?
(b) 0,33
(c) 0,23
(a) 14% (d) 0,133
(b) 25%
(c) 20% 7. O erro padrão nos inform a:
(d) 32% (a) O grau com que a nossa m édia am ostrai difere
da m édia das m édias am ostrais
2. Q ual é a relação entre tam anho am ostrai e erro
(b) O grau com que nossa m édia am ostrai difere
am ostrai?
da m édia populacional
(a) Q uanto m aior o tam anho am ostrai, m aior o (c) O grau com que o desvio padrão difere da m é
erro am ostrai dia populacional
(b) Q uanto m aior o tam anho am ostrai, m enor o (d) A lternativas (a) e (b)
erro am ostrai
(c) T am anho am ostrai é igual a erro am ostrai 8. Pelo que m ultiplicaríam os o erro padrão para che
(d) N enhum a das respostas está correta garm os a intervalos de confiança de 95% ?
(a) 9^
Se tiverm os um intervalo de 95% de confiança de
(b) R aiz quadrada do tam anho am ostrai
3 ± 2, o que isso significa?
(c) D esvio padrão
(a) A m édia populacional está definitivam ente (d) 1,96
entre I e 5
(b) T em os 95% de certeza de que a m édia p o p u 9. Se você tivesse um valor z de 2,33, significaria que:
lacional está entre 3 e 2 (a) Seu escore está 2,33 desvios padrões acim a
(c) T em os 95% de certeza de que a m édia popu da m édia
lacional está entre 1 e 5 (b) Seu escore está 2,33 desvios padrões abaixo
(d) N enhum a das respostas está correta da m édia
(c) Há um a probabilidade de 2,33 de obter um
4. Q uais são os escores na distribuição norm al p a escore m aior do que o seu escore
drão? (d) H á um a probabilidade de 2,33 de obter um
(a) E scores extrem os escore m enor do que o seu escore
(b) Valores z.
10. Se um evento tem um a probabilidade de 95% de
(c) E scores de desvio padrão
ocorrer, o que isso significa?
(d) A lternativas (b) e (c)
(a) O evento tem a probabilidade de ocorrer 5 ve
5. O erro padrão é: zes a cada 100
(a) A raiz quadrada da m édia (b) O evento tem a probabilidade de ocorrer 95
(b) O quadrado do desvio padrão vezes a cada 100
(c) O desvio padrão dividido pela m édia (c) O evento tem a probabilidade de ocorrer 95
(d) O desvio padrão dividido pela raiz quadrada vezes a cada 95
do núm ero de participantes na am ostra (d) N enhum a das respostas está correta
) I. Qual carreira você deve escolher se seus escores (a) A média amostrai
de levantamento de pesos e cerâmica sào: (b) A média de várias médias amostrais
Levantamento de pesos: escore 52 (c) O desvio padrão
(média amostrai = 55, desvio padrão = 12) (d) O e i T O padrão
Cerâmica: escore 50
16. Obtivemos um desvio padrão de 42 c um tamanho
(média amostrai = 58, desvio padrão = 32)
amostrai de 16 para um grupo de dados. Qual é o
(a) Levantamento de pesos erro padrão'1
(b) Cerâmica
(a) 0,339
(c) Qualquer uma das duas, pois ambas são igual
(b) 2,95
mente boas quando comparadas com suas
respectivas populações (c) 21.68
(d) Nenhuma das duas. pois você é terrível em (d) 10.5
ambas 17. Se você constituir 100 amostras do uma população
1,2. Quais das frases a seguir são verdadeiras quanto à e plotar todas as médias como um histograma de
estatística inferencial? freqüência, você obtém:
(a) Simplesmente descreve nossos dados (a) A distribuição dc médias
(b) E usada para se obterem conclusões dos da ib) Uma distribuição assimétrica
dos amostrais sobre populações (c) A distribuição amostrai
(c) E usada para fazer a psicologia parecer cientí (d) Nenhuma das respostas está correta
fica
18. Dado um erro padrão de 5,2 com uma amostra de
(d) É usada para se obterem conclusões das popu
9, qual é o desvio padrão?
lações sobre amostras
(a) 1,73
13. Se você obtiver um escore de 13 em um ques
(b) 15.6
tionário sobre ansiedade e souber que a média
(c) 46.8
populacional e desvio padrão são 20 e 5, respecti
(d) 0.556
vamente, qual é o seu valor j?
(a) -2,33 19. Para qual das seguintes alternativas você não po
(b) -1 ,4 deria gerar intervalos de confiança?
(c) 1,33 (a) Uma média
(d) 0 (b) Um coeficiente de correlação
14. Se você possui uma população de escores que tem (c.) A diferença da média entre escores
uma distribuição plana (não-normal), então a dis (d) Nenhuma das respostas está correta
tribuição de muitas médias amostrais será: 20. Se você tem uma população negativamente assi
(a) Plana métrica. qual c o formato da distribuição amostrai
(b ) B im o d al das médias daj amostras dessa população?
(c) Negativamente assimétrica
(a) Negativamente assimétrica
(d) Normal
(b) Positivamente assimétrica
15. Qual das seguintes alternativas dá a melhor esti (c) Normal
mativa da média populacional? (d) Não é possível saber
Referências
BAKER, R. et al. Emotional processing and panic. Behaviour Research and Therapy v. 42, n. 11, p.
1271-87, November 2004.
BECK, A. T., et al. An inventory for measuring depression. Archives o f General Psychiatry, v. 4. p.
561-71, 1961.
V\ALSH, J. J., UGUMBA-AGWUNOB1, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences, v. 33, p.
239-51,2002.
Teste de Hipóteses e Significância
4 Estatística
No C a p ítu lo 3 , m o stra m o s a vo cê o uso da in fe rê n cia e sta tístic a . N este c a p ítu lo , irem o s um

p o u co a lé m , a fim de exp licar co m o p o d ern o s a p lic a r no sso c o n h e c im e n to de p ro b a b ilid a d e s e
d istrib u iç õ e s a m o stra is para te sta r h ip ó teses e sta b e le c id a s em no ssas p e sq u isas. E sp e cific a m e n te ,
e xp lica re m o s o se g u in te :
■ a lógica do te ste d e hip ó teses

i a sig n ifica n cia e sta tístic a e c o m o ela se relacio n a co m a p ro b a b ilid a d e
■ c o m o as d istrib u iç õ e s de p ro b a b ilid a d e fo rm a m as bases d o s testes e sta tístic o s
■ o s p ro b le m a s a sso c ia d o s à to m a d a de p ro b a b ilid a d e s co m o base para c o n c lu sõ e s (erros
d o s T ip o s I e II)
■ as h ip ó teses u n ila te ra is e b ila te ra is, e co m o se esco lh e o teste ap ro p ria d o
1.1 Outra forma de aplicar probabilidades à pesquisa: teste de hipóteses
S u p o n h a q u e e ste ja m o s in te re ssa d o s e m ex a m in a r a r ela çã o entre o n ú m ero d e h oras de

e stu d o p or se m a n a e a n ota de u m a prova. P o d e r ía m o s, ta lv e z , p red izer q u e q u a n to m aior o
n ú m ero de h oras de e stu d o se m a n a is, m a io r a n ota na prova. E sta b e le c e r ía m o s, a ss im um a
p r e v isã o a se testar p ela r ea liza ç ã o de um estu d o . N e ste e stu d o , so rtea ría m o s alea to ria m en te
c er to n ú m ero d e e stu d a n te s, r eg istr a ría m o s q u an tas horas por se m a n a estu d a m e v e r ific a
ría m o s se e sta s h oras e s tã o r e la c io n a d a s à n ota da prova. D e a c o r d o c o m a p r e v isã o fe ita ,
e sp e r a ría m o s q u e a p o p u la ç ã o das n otas se a ss e m e lh a ss e à ilustrada na F igu ra 4 .1 . A q u i v o c ê
p o d e verificar q u e e x is te um a te n d ê n c ia in d ic a n d o q u e, q u an d o o n ú m ero de horas de estu d o
a u m en ta , o co rr e o m e sm o c o m a nota. V am os p r e ssu p o r q u e is s o ocorra c o m a p o p u la ç ã o
su b ja c en te. N a r ea liza ç ã o de um a p e sq u isa , as a m o stra s se le c io n a d a s p o d em n ão co n stitu ir
um a rep resen ta çã o acurada d a p o p u la ç ã o - é um d o s p ro b lem a s e n fren tad os. N o C a p ítu lo 2,
e x p lic a m o s q u e, d e v id o ao erro am ostrai, a am ostra p o d e não ser se m elh a n te à p o p u la ç ã o . A
F igu ra 4.1 ilu stra três a m o stra s retirad as da p o p u la ç ã o ap resen tad a na m e sm a figura. V o cê
d e v e notar q u e, m e sm o e x is tin d o u m a r ela çã o p o sitiv a entre as du as variáveis na p o p u la ç ã o ,
d u as d as am ostras n ão r e fle te m is s o . D e fa to , u m a d as a m o stra s su g er e um r e la c io n a m e n to
n e g a tiv o entre as horas estu d a d a s e o d e se m p e n h o na prova (c o m o a u m e n to d as horas e stu
d a d a s, o d e se m p e n h o na prova piora). O utra am ostra su g er e qu e n ão e x is ie r e la c io n a m e n to
a lg u m en tre as d u as v a r iá v e is. A terceira am ostra rep rod u z a p o p u la ç ã o c o rr eta m e n te , su
g e r in d o um r e la c io n a m e n to p o s itiv o en tre as d u a s v a r iá v e is. D e v e - s e notar q u e , e m b o r a a
p o p u la ç ã o ap resen te um r e la cio n a m e n to , a am ostra c o n stitu íd a p o d e n ão r e fle ti-lo .
A m o stra s
Nota na prova
-------1------ 1— “— i-------------------- i-------1--------- j-

0 10 20 30 40 50 60
Horas estudadas por semana
0 10 20 30 40 50 60 70
D ia g ra m a de d isp ersã o d a s possíveis a m o stra s se le cio n a d a s d e u m a p o p u la ç ã o co m um

re la c io n a m e n to p o sitivo e n tre o n ú m e ro de h o ras de e stu d o e a no ta na p ro va.
Dê uma olhada agora na Figura 4.2. Neste exemplo, não existe relacionamento entre
o número de horas de estudo e a nota na prova da população. Novamente, apresentamos
três amostras. Uma vez mais, somente uma das amostras reflete acuradamente a popula
ção. O fato é que. devido ao erro amostrai, as amostras que utilizamos podem não refletir
de forma fiel a população de onde foram retiradas. Para cada população que tivermos,
cada um dos padrões amostrais apresentados terá uma probabilidade maior ou menor de
ocorrer, e o valor desta probabilidade dependerá do tamanho da amostra utilizado. Assim,
A m o stras
Noto na prova
10 20 30 40 50
D iag ra m a de d isp e rsã o das possíveis a m o stra s se le cio n a d a s d e u m a p o p u la çã o sem

Figura 4.2
re la c io n a m e n to e n tre o n ú m ero de h o ras de e stu d o e a nota na p rova.
para a população da Figura 4.1, teremos uma probabilidade maior de observar o padrão
da amostra (c) do que nas amostras (a) e (b), particularmente com valores de tamanho
de amostra razoavelmente grandes. Para a população apresentada na Figura 4.2, teremos
uma probabilidade maior de observar o padrão da amostra (b) do que nas amostras (a) e
(c). Você precisa estar ciente de que, algumas vezes, devido ao erro amostrai, obteremos
padrões nas amostras que não refletem de forma acurada a população de onde as amostras
foram retiradas.
Padrão de valo res na am o stra

100
0 10 20 30 40 50 60 70
De que população
f f é mais provável que a
U - '” amostra tenho sido retirada?
Padrão na p o p u la ça o (a) Padrão na p o p u la ção (b)

Nota na prova
Horas estudadas por semana Horas estudadas por semana
D ia g ra m a d e d isp e rsã o d a s p o ssíveis p o p u la ç õ e s a lte rn a tiv a s q u a n d o um

r e la c io n a m e n to é o b se rva d o na a m o s tra .
Constitui um dos problemas enfrentados quando conduzimos uma pesquisa o fato de

não sabermos qual é o padrão existente na população de interesse. De fato, o motivo de
realizarmos a pesquisa é, em primeiro lugar, determinar este padrão. Estamos tentando ob
ter conclusões sobre a população a partir das amostras. Essencialmente, estamos em uma
situação semelhante à ilustrada na Figura 4.3. Nesta figura, tudo o que está acima da linha
pontilhada tem a ver com o que observamos em nosso estudo, e tudo o que está abaixo da
linha é desconhecido. A partir do padrão que observamos na amostra, precisamos decidir
sobre os possíveis padrões que refletem a população: contudo, apresentamos apenas dois
deles na figura. A partir da amostra, precisamos decidir acerca de como é a população. Aqui
utilizaremos testes estatísticos inferenciais. Efetivamente, o que faremos é observar o padrão
d o s v a lo r e s na am ostra e v e rific a r qu al é o m ais p rovável para a p o p u la ç ã o q u e a fo r n e ce u .

A s sim , dad o o padrão o b ser v a d o na am ostra da F igu ra 4 .3 , p o d e m o s argum entar que o padrão
na p o p u la ç ã o (b ) é m a is p la u sív el d o qu e o ap resen tad o e m (a). Nías F igu ras 4.1 e 4 .2 , c o n tu
d o , as a m o stra s n ã o n e c e ssa r ia m e n te r eflete m de form a acurada a p o p u la ç ã o de o n d e foram
retirad as. A s s im , p r e c isa m o s de a lg u m m e io para avaliar a p r o b a b ilid a d e d e q u e a am ostra
se le c io n a d a seja um retrato fiel da p o p u la çã o .
O s te ste s e sta tístic o s n o s serv irã o d e a u x ílio n esta d e c is ã o , m as is s o oco rre de u m a form a
n ão de to d o in tu itiva. O q u e um teste e s ta tístic o faz é d eterm in ar u m a p ro b a b ilid a d e, d e n o
m in ad a de valor p. E ste valor n os in fo rm a sob re a m aior ou m en or p o ssib ilid a d e de o b term o s
o r esu lta d o d e v id o ao erro a m ostrai c a s o n ã o e x is ta r e la c io n a m e n to entre as v a r iá v e is da
p o p u la ç ã o . Por e x e m p lo , o s v a lo r e s p in fo rm a rã o a p ro b a b ilid a d e de o b te r m o s o padrão de
v a lo res na am ostra da F igu ra 4 .3 na p o p u la ç ã o (a). S e o padrão em n o ssa am ostra é altam en te
im p ro v á v el de ser o b tid o d e v id o ao erro am ostrai na p o p u la ç ã o (a ), en tã o c o n c lu ir e m o s que
p r o v a v e lm e n te e a (b). V ocê d ev e notar qu e esta p r o b a b ilid a d e é , de fa to , c o n d ic io n a d a . É a
p r o b a b ilid a d e de o b te r m o s a n o ssa am ostra se n ão e x is tir r e la c io n a m e n to entre as va riá v eis
na p o p u la ç ã o .
ü te ste d e h ip ó te s e s é v isto m u ita s v e z e s c o m o u m a c o m p e tiç ã o en tre d u as h ip ó te se s:
en tre a n o ssa h ip ó te se d e p e sq u isa (d e q u e e x is te r ela ç ã o entre as h o ra s e stu d a d a s e a nota
na prova) e outra afirm a çã o d e n o m in a d a de hipótese nula (d e q u e não e x is te r e la cio n a m e n to
entre as d u as v a r iá v e is). A s s im , o p r o c e s so d e teste d e h ip ó te s e s se a ss e m e lh a à F ig u ra 4 .3 .
P r e c isa m o s d e c id ir entre a p o p u la ç ã o (a) e (b ). N e sta situ a ç ã o , a p o p u la ç ã o (a) rep resen ta a
p o s sib ilid a d e de a h ip ó te se nula ser verd adeira, e a p o p u la ç ã o (b ), de a h ip ó te se de p e sq u isa
ser verd adeira. O teste e sta tístic o q u e u tiliz a m o s in d ic a qual é a p rob ab ilid ad e de ob servar
m o s o padrão de d a d o s se a h ip ó te se n u la for verd ad eira. N a F igu ra 4 .3 , p r o v a v e lm e n te o
padrão d o s d a d o s a m o stra is teria u m a p r o b a b ilid a d e bastan te b a ix a de ocorrer c o m o c o n s e
q ü ê n c ia do erro am ostrai se o s d ad os fo s s e m retirad os da p o p u la ç ã o (a), na qual n ao e x is te
um r ela cio n a m e n to entre as du as v a riá v eis. D e fa to , e ssa p rob ab ilid ad e é m en o r d o qu e l em
10 0 0 . N e s s e c a so , seria m a is se n sa to c o n c lu ir que o s d a d o s foram retirado.^ de um a p o p u la ç ã o
q u e se ja id ên tica à (b).
A g o r a , v e ja m o s o c e n á r io r ep re se n ta d o p e la F igura 4 .4 . R e le m b r e qu e tud o o q u e está
a c im a da lin h a p o n tilh ad a c o n sta e m n o s s o e stu d o , e tu d o o q u e e stá a b a ix o da lin h a é d e s
c o n h e c id o . A q u i v o c ê d e v e rá ser c a p a z d e ver q u e a a m o str a p a r e c e su g erir a in e x is tê n c ia
d e u m r e la c io n a m e n to a p aren te entre o n ú m er o de h oras de e stu d o e a n ota na prova. In tu i
tiv a m e n te , e sp e r a r ía m o s q u e esta a m o str a tiv e s s e sid o retirad a da p o p u la ç ã o (a) e m v e z da
p o p u la ç ã o (b ). N o e n ta n to , a p e la n d o n o v a m e n te para a 1 igura 4 .1 , v o c ê d e v e se r c a p a z de
v e r q u e, m e s m o q u a n d o não e x is te r e la c io n a m e n to en tre as d u as v a r iá v e is na p o p u la ç ã o ,
te m o s a p o s sib ilid a d e de que um a ocorra na n o s sa am ostra. E ssa a u s ê n c ia de r e la c io n a m e n to
na am ostra se r ia um a c o n s e q ü ê n c ia d o erro am ostrai. D e s ta fo rm a , n o v a m e n te n ó s u tiliz a
r em o s o s testes e s ta tís tic o s in fe r e n c ia is c o m o a u x ílio na e s c o lh a en tre as du as h ip ó te se s: a
nu la, rep resen ta d a p e la p o p u la ç ã o (a ), e a de p e sq u isa , rep resen ta d a p ela p o p u la ç ã o (b ). O
te ste e s t a t ís tic o in fo rm a rá so b re a p r o b a b ilid a d e de o b te r m o s e m n o s sa a m o stra o padrão
ilu str a d o na F ig u ra 4 .4 , c a s o a p o p u la ç ã o se ja s e m e lh a n te ao pad rão m o str a d o e m (a ), isto
é , se a h ip ó te s e nula for verd ad eira. N e s te c a so , há u m a alta p r o b a b ilid a d e de o b ter o padrão
o b s e r v a d o na n o s sa am o stra se a h ip ó te se nu la fo r verd ad eira: e x is te um a p r o b a b ilid a d e de
61 % d e o b te r tal pad rão d e um a p o p u la ç ã o s e m e lh a n te à m ostrad a e m (a). E x iste m outras
q u e s tõ e s , en treta n to , q u e p r e c isa m o s c o n sid e r a r a n tes d e p o d er m o s c h e g a r a um a c o n c lu sã o ,
c o m o , por e x e m p lo , se e x is te m p a rticip a n tes s u fic ie n te s na n o ssa am ostra (v e ja S e ç ã o 4 .9 e
C a p ítu lo 7 ).
Padrão de v a lo res na a m o stra
10 20 30 40 50 60 70
%
De que população
é mais provável que a
amostra tenho sido retirada?
Padrão na p o p u la çã o (a) Padrão na p o p u laçã o (b)

Nota na prova
Horas estudadas por semana Horas estudadas por semana
D ia g ra m a d e d isp e rsã o d a s p o p u la ç õ e s a lte rn a tiv a s su b ja c e n te s q u a n d o não é o b servad o

Figura 4.4
re la c io n a m e n to na a m o stra .
4.2 Hipótese nula
Apresentamos brevemente um conceito importante que precisa de explicações adicionais.

A hipótese nula é muito importante para o processo da testagem de hipóteses. Explicamos an
teriormente que a probabilidade calculada nos testes estatísticos se baseia na hipótese de que
não existe relacionamento entre as duas variáveis na população. Esta suposição é a hipótese
nula. Se a hipótese de pesquisa (às vezes denominada de hipótese experimental ou alterna
tiva) declara que há relacionamento entre as duas variáveis, então a hipótese nula afirma que
não existe relacionamento entre ambas. De forma semelhante, se você está interessado em
comparar grupos de pessoas, e a hipótese de pesquisa declara que há uma diferença entre os
dois grupos, a hipótese nula afirma que não existe diferença entre os dois grupos.
Quando ler publicações sobre psicologia, encontrará autores que sugerem que a hipótese
nula não pode ser rejeitada. Isso simplesmente significa que a probabilidade calculada indica
que manter a hipótese nula é a conclusão mais sensata. Se você ler que o pesquisador rejeitou
a hipótese nula, significa que a probabilidade de obter os resultados encontrados se a hipó
tese nula fosse verdadeira é tão pequena que se toma mais sensato acreditar na hipótese de
pesquisa (alternativa). Como indicamos anteriormente nesta seção, isso ilustra a competição
entre as hipóteses nula e de pesquisa. O fato de essa abordagem de pesquisa ser denominada
Testagem da Hipótese Nula (THN) ou Teste de Significancia da Hipótese Nula (TSHN) refle
te a importância da mesma.
4.3 Lógica dos testes de hipóteses
Se você entendeu a seção anterior, não terá problemas para entender a lógica geral por
trás dos testes de hipóteses, que é a seguinte:
■ formular as hipóteses;
■ medir as variáveis envolvidas e examinar o relacionamento entre elas;
■ calcular a probabilidade de obter tal relacionamento se não existir relação alguma na
população (se a hipótese nula for verdadeira);
■ se esta probabilidade calculada é suficientemente pequena, sugere que o padrão en
contrado é improvável de ter se originado por acaso e, desta forma, provavelmente
reflete um relacionamento genuíno na população.
Colocando de outra forma, se não existe um relacionamento real na população, é impro
vável que você encontre um na sua amostra selecionada aleatoriamente. Desse modo, se você
achar uma relação na amostra, é provável que ela reflita um relacionamento na população, b
importante que você entenda isso. Assim, vá com calma e tenha certeza de que entendeu o
que foi exposto até aqui.
O teste de hipóteses não se limita a investigar o relacionamento entre duas variáveis. Se
você está interessado em estudar diferenças entre grupos, pode também utilizar o teste de
hipóteses. A lógica é mais ou menos a mesma exposta anteriormente. Por exemplo, suponha
que projetamos um ensaio no qual oferecemos aos alunos duas formas de estudo estruturadas,
que se diferenciam apenas na quantidade de horas que precisam estudar. Um grupo estuda
40 horas por semana, enquanto o outro grupo estuda apenas 10 horas por semana (esta é a
variável independente). Vamos supor que os que estudam 40 horas tenham notas mais altas na
prova do que os demais. Esta será nossa hipótese de pesquisa. A hipótese nula corresponderá
à inexistência de diferença entre as médias das notas dos dois grupos. Uma vez coletados os
dados, podemos verificar se existe diferença entre as notas médias dos dois grupos. Se tal
diferença existir, então precisamos determinar a probabilidade de que se origine unicamente
do erro amostrai, isto é, da probabilidade de obtermos uma diferença do tamanho observado
se a hipótese nula for verdadeira. Se esta probabilidade é pequena, faz sentido considerar que
as diferenças se devem à manipulação da variável independente, em vez de unicamente ao
erro amostrai.
Atividade 4.1
A p a rtir dos se g u in te s te stes de hip ó teses, te n te d e te rm in a r a h ip ó tese nula:
Prevê-se q u e exista u m a d ife re n ç a e n tre h o m e n s e m u lh e re s na h a b ilid a d e e sp a c ia l.

Prevê-se q u e a q u a n tid a d e de álco o l co n su m id a esteja re la c io n a d a com o n ú m e ro de
erro s ao v o la n te .
m Prevê-se q u e os te m p o s d e reação sejam d ife re n te s e n tre p a rticip a n te s q u e estão e s
tre ssad o s e a q u e le s q u e estão relaxa d o s.
Prevê-se q u e , q u a n to m ais p ró xim o s e stiverm o s d a s eleiçõ es, m ais m e n tira s o u vire m o s
dos po lítico s.
" 7 j PONTO DE DISCUSSÃO: CRÍTICAS

CONTRA OS T ESTES DE HIPÓTESES
H m bora o tu ¿te de h ip ó te s e s seja a a b o r d a g e m d o m in a n te na p s ic o lo g ia , e x is te a gora

um se n tim e n to c r e sc e n te d e qu e seja in a d eq u a d o e m term o s d e fo r n e c im e n to d e p e r c e p ç õ e s
ú teis das va riá v eis qu e o s p s ic ó lo g o s d e se ja m in vestigar. P or e x e m p lo , ao referir ao te ste de
h ip ó te s e s . L o ftu s ( 1 9 9 1 ) c o lo c a : “T en h o d ific u ld a d e e m im a g in a r um m e io m a is in e fic ie n te
de transitar d o s d ad os para as c o n c lu s õ e s ” . L o ftu s ( 1 9 9 1, 1 9 9 6 ) d e sc r e v e m u ito s p ro b lem a s
a s s o c ia d o s ao uso d o s te ste s d e h ip ó te se s. Q u e re m o s d estacar d o is. S e v o c ê q u er sab er m ais,
e x is te m d u as r efe rê n c ia s n o fim d e ste ca p itu lo .
U m d o s p rin cip ais p ro b lem a s d e sta c a d o s por L o ftu s se r ela cio n a à h ip ó te se nula. Q u an d o
o b se r v a m o s a d ife re n ç a entre du as c o n d iç õ e s , te m o s de c a lc u la r a p ro b a b ilid a d e de o b te r m o s
n o ssa d ife re n ç a por a c a so , se a h ip ó te se nula for verd adeira. L em b re q u e a h ip ó te se nula d e
clara q u e não e x is te d ife r e n ç a entre as d u as c o n d iç õ e s . O p ro b lem a d esta h ip ó te se é qu e em
p o u c o s c a s o s , em q u a lq u er c iê n c ia , n ã o e x is tir ã o d ife r e n ç a s e n tre du as c o n d iç õ e s . É p o u c o
u su al en co n tra r d u as c o is a s qu e seja m e x a ta m e n te ig u a is, m e s m o e m físic a ; d e ss a form a,
basear n o s s o ju lg a m e n to p r o b a b ilístic o e m tal h ip ó te se nu la p o d e ser se r ia m e n te e n g a n o s o .
E ss e é ju sta m e n te o p on to e s s e n c ia l da crítica feita por L o ftu s, e já serve para ilustrar um a das
o b je ç õ e s q u e e le faz.
E is o se g u n d o p r o b le m a d e sta c a d o p or L oftu s: e m b o r a r e g istr e m o s , c o m a lg u m a c o n
fia n ç a , q u e e n c o n tr a m o s um a g e n u ín a d ife r e n ç a entre n o s s a s d u as c o n d iç õ e s e r ela tem o s a
m e d id a d e ss a d ife r e n ç a , o s p s ic ó lo g o s n o r m a lm en te in fo r m a m p o u c o so b re as m é d ia s das
p o p u la ç õ e s d as du as c o n d iç õ e s . L o ftu s argu m en ta q u e o teste de h ip ó te se s n os d e s v ia d e p e n
sa rm o s so b re as m é d ia s p o p u la c io n a is. S u g er e q u e p o d e m o s evitar e s s a arm ad ilh a relatand o
d e form a rotin eira in tervalos de c o n fia n ç a e m n o s s o s rela tó rio s de p e sq u isa .
M e s m o q u e e x is ta m ta is tip o s de c rític a ao p r o c e d im e n to d e testar h ip ó te s e s , is s o não
s ig n ific a q u e tal ab o rd a g em d e v e ser ab an d on ad a c o m p le ta m e n te ; m elh or, d e v e m o s ter um
e n te n d im e n to c o m p le to d o seu sig n ific a d o para p o d er m o s n os b e n e fic ia r d e sta té c n ic a . Isso
é o qu e e sp e r a m o s dar a v o c ê n e ste livro. D e s s a form a, e m c o n ju n to c o m o s te ste s e sta tísti
c o s q u e n os a u x ilia m a testar as h ip ó te s e s (p. e x ., o teste t), v o c ê d e v e , c o m o L o ftu s su g ere,
a crescen ta r e sta tístic a s d e sc r itiv a s e in te rv a lo s d e c o n fia n ç a r o tin eira m e n te . U m a form a útil
d e ap resentar in terv a lo s d e c o n fia n ç a é a g e ra ç ã o de d iagram as de barras de erro e su a apre
se n ta ç ã o em n o s s o s rela tó rio s. M o stra m o s a v o c ê c o m o sã o tais d ia g ra m a s n o C a p ítu lo 3.
Atividade 4.2
Q ual das se g u in te s d e scriçõ es re p rese n ta um bo m su m á rio da lógica por trás dos testos
d e h ip ó teses?
(a) M e d im o s o re la c io n a m e n to e n tre as va riá ve is a p a rtir dos d a d o s de nossa a m o stra . Se

é g ra n d e , deve existir um a relação g e n u ín a na p o p u la ç ã o .
(b) M e d im o s o re la c io n a m e n to e n tre as variáveis a p a rtir d o s d a d o s d e nossa a m o s
tra e c a lc u la m o s a p ro b a b ilid a d e d e q u e tal re la c io n a m e n to se deva a p e n a s ao erro
a m o stra i. Se tal p ro b a b ilid a d e é a lta , c o n c lu ím o s q u e existe u m a relação g e n u ín a na
(c) M e d im o s o re la c io n a m e n to e n tre as va riá ve is a p a rtir d o s d a d o s de nossa a m o stra e
c a lc u la m o s a p ro b a b ilid a d e d e q u e tal re la c io n a m e n to se deva a p e n a s ao erro a m o s
tra i. Se esta p ro b a b ilid a d e é b a ixa, p o d e m o s c o n c lu ir q u e u m a relação g e n u ín a existe
na p o p u la ç ã o .
(d) M e d im o s a d ife re n ç a e n tre as n o ssa s d u a s c o n d iç õ e s e c a lc u la m o s a p ro b a b ilid a d e
d e q u e tal d ife re n ç a se deva a p e n a s a o erro a m o stra i c a so a h ip ó te se n u la seja ver
d a d e ira . Se a p ro b a b ilid a d e é b a ix a , c o n c lu ím o s q u e existe u m a d ife re n ç a real na
4.4 Nível de significância
M u ito s de v o c ê s , n e sta altura, p o d e m estar p e n s a n d o qu e tud o is s o é b om e está b em ,

m as c o m o d e c id im o s q u e a p r o b a b ilid a d e q u e c a lc u la m o s no te ste de h ip ó te s e s é s u f ic ie n
te m e n te p e q u e n a para q u e r e je ite m o s a h ip ó te s e n u la? E ss a é u m a e x c e le n t e p ergu n ta q u e
ain d a n ão tem u m a r esp o sta d e fin itiv a . M u ito s p s ic ó lo g o s e m e s m o m u ito s p e r ió d ic o s r e s
p e itá v e is da área u tiliz a m a c o n v e n ç ã o de qu e urna p r o b a b ilid a d e de 5% é su fic ie n te m e n te
p e q u en a para serv ir c o m o um p on to d e c o rte. C o n sid e r a n d o a h ip ó te se nula verd a d eira , se
a p r o b a b ilid a d e d e u m d a d o e f e it o é m e n o r q u e 5% (0 ,0 5 o u 1 e m 2 0 ) , e n tã o fo r n e c e m o s
u m s u p o n e r a zo á v e l para a n o s sa h ip ó te s e d e p e sq u isa . I s s o s ig n ific a q u e , se v o c ê c o n d u z
o e stu d o 2 0 v e z e s , s o m e n te u m a v e z n e ste s 2 0 e stu d o s um r e la c io n a m e n to (ou d ife r e n ç a )
tão gran d e q u an to a q u e fo i o b ser v a d a ap arecerá por a c a so se a h ip ó te s e nula for verd adeira.
C o m o e sta p r o b a b ilid a d e é b a ix a , p o d e m o s c o n c lu ir c o m r a zo á v el c o n fia n ç a qu e um r e la c io
n a m en to (ou d ife r e n ç a ) real e x is te na p o p u la ç ã o so b in v e stig a ç ã o . A p r o b a b ilid a d e a sso c ia d a
c o m ca d a te ste e s ta tís tic o é c h a m a d a de va lo r p ou alfa ( a ) . Q u a n d o is s o é im p r e s so na
sa íd a do S P S S P W , a p arece c o m o um d e c im a l e. c o m o q u a lq u er p r o b a b ilid a d e e x p r e s sa em
d e c im a l, varia n o in te rv a lo [0; 1].
Em m u ito s p e r ió d ic o s, v o c ê verá o s p e sq u isa d o re s relatand o se u s a c h a d o s c o m o significa
tivos ou não-significativos. S u p o n d o q u e a h ip ó te se nula seja verd adeira e qu e a p rob ab ilid ad e
de se o b ter um e fe ito d e v id o ao erro a m o stra i seja m en o r d o que 5 c/<, en tã o o a ch a d o é d ito
sig n ific a tiv o . S e a p rob ab ilid ad e for m aior d o que 5% , o a c h a d o é d ito n ã o -s ig n ific a tiv o . E ssa
form a de p ensar sob re a a n á lise tem , no en ta n to , d esp ertad o um a boa d o s e de críticas n o s an os
r ec en tes p e la s r a zõ es d isc u tid a s nas p á g in a s 1 5 2 -1 5 3 .
*N. dc T. Os autores não fazem diferença entre as duas situações, mas na verdade o valor/? e' a significância do resultado, enquanto
o valor a e' a significância do teste. As duas probabilidades são, em geral, diferentes.
Atualmente, a abordagem convencional consiste em relatar o valor exato da proba

bilidade de uma dada estatística (o valor p) e deixar de lado a questão de pensar nos
resultados como estatisticamente significativos ou não. Desta forma, quando você for
relatar os resultados de uma análise, apresente o valor da probabilidade associado com a
estatística (valor p). Descrevemos a classificação significativo/não-significativo aqui para
que você possa saber o que significa quando encontrar tal tipo de declaração em artigos
de algum periódico.
Recomendamos que utilize o nível a de 5% como um guia para o que tem sido visto tra
dicionalmente como uma probabilidade aceitável para o erro do Tipo I, isto é, a probabilidade
de se rejeitar a hipótese nula quando é verdadeira. Desse modo, se encontrar um valor p que
seja bem menor do que 5%, terá confiança razoável de que este resultado dá suporte à hipóte
se de pesquisa. Entretanto, você deve relatar o valor p encontrado e avaliar os resultados em
termos de dimensões (veja Capítulo 7) e do diagrama de barras de erro.
Atividade 4.3
S u p o n h a q u e v o c ê c o n d u z iu um e stu d o à p ro c u ra de d ife re n ç a s e n tre h o m e n s e m u

lh eres q u a n to à p re fe rê n c ia por film e s de a ç ã o . Q u a n d o re aliza o e s tu d o , v o c ê e n c o n tra
u m a p ro b a b ilid a d e d e 0 ,0 0 5 de q u e a d ife re n ç a o b s e rv a d a se d e va ao e rro a m o s tra i. Q ual
é a c h a n c e de q u e a fre q ü ê n c ia d e o c o rrê n c ia de ssa d ife re n ç a se deva u n ic a m e n te ao erro
a m o stra i?
(a) 1 em 5 0 0 0 (b) 1 em 2 0 0 0 (c) 1 em 5 0 0 (d) 1 em 2 0 0 (e) 1 em 1 0 0
S u p o n h a ag o ra q u e a p ro b a b ilid a d e é 0 ,0 1 : q u al d a s a lte rn a tiv a s é v e rd a d e ira nessa si

tu a ç ã o ?
4.5 Significancia estatística
Conforme sugerido anteriormente, quando ler um artigo de um periódico de psicologia

ou ouvir um psicólogo eminente (ou não tão eminente) descrevendo suas pesquisas, você vai
ler/ouvir com freqüência a palavra “significativo”:
Níveis de efeitos negativos anteriores à raiva foram taxados como significativamente menores
na situação de dirigir um carro do que na de não dirigir (Parkinson, 2001)
O grupo com síndrome do pânico de fa to apresentou dificuldades de processamento em ocio

nal mais significativas do que o grupo de controle (Baker et a i, 2004)
... e a associação entre o traço de personalidade ansiosa e procrastinação fo i também signifi

cativo (Walsh e Ugamba-Agwunobi, 2002)
O que queremos com tais tipos de declarações? Na linguagem diária, interpretamos a

palavra “significativo” como considerável, crítico ou importante. Isso significa que Parkinson
encontrou uma diferença considerável entre a raiva em situações de dirigir um carro e outras
em que não se está dirigindo? Baker e colaboradores encontraram uma diferença crítica en
tre os grupos de controle e com síndrome do pânico, ou talvez Walsh e Ugamba-Agwunobi
tenham encontrado uma relação importante entre procrastinação e o traço de personalidade
ansiosa? De fato, os pesquisadores não querem necessariamente afirmar isso. Estão meramen-
en q u a n to o se g a n d o c o m urna bem m enor. M e s m o e fe ito s m u ito p e q u e n o s p od erão apresentar

s ig n ific â n c ia e sta tístic a q u a n d o o tam an h o da am ostra for b e m grande.
C o m o p o d e m o s lid ar c o m e s s e p r o b le m a ? A m e lh o r a b o r d a g e m c o n s is te e m o b te r um a
m e d id a d a m a g n itu d e d o e f e it o e x p e r im e n ta l, isto é , o b te r in fo r m a ç ã o so b re o v a lo r do
r e la c io n a m e n to en tre a a n s ie d a d e e s ta tís tic a e a p r o c r a stin a ç ã o . S e v o c ê e stá p r o cu ra n d o
por d ife r e n ç a s e n tre g r u p o s , d e v e rá o b te r u m a m e d id a d o ta m a n h o da d ife r e n ç a e n tre o s
m e s m o s . E ssa d ife r e n ç a é d e n o m in a d a d e magnitude do efeito ou tamanho do efeito. U m a
d e s c r iç ã o m a is d e ta lh a d a d o ta m a n h o d o e f e it o p o d er á ser e n c o n tr a d a no C a p itu lo 7. O
c u r so p r e fe r id o d e a ç ã o q u a n d o se rela ta m as d e sc o b e r ta s da p e sq u isa é d e sc r e v e r o v a lo r
da p r o b a b ilid a d e e o ta m a n h o d o e fe it o . P or e x e m p lo , v o c ê d e v e relatar a p r o b a b ilid a d e
(p .e x ., p = 0 ,0 2 7 ) e o ta m a n h o d o e f e it o (p. e x ., r = 0 ,7 0 . r = 0 ,4 9 e o u ¿ = 0 ,5 0 ). D e s s a
fo r m a , q u a n d o a lg u é m ler a su a p e sq u isa , terá um q u ad ro c o m p le to d o q u e fo i c o n sta ta d o .
V o c ê d e v e ter n o ta d o q u e r é o c o e fic ie n te de c o r r e la ç ã o e in d ic a a fo r ça d o r e la c io n a m e n to
(lin e a r ) en tre d u a s v a r iá v e is (e x p lic a r e m o s is s o e m m a is d e ta lh e s n o p r ó x im o c a p ítu lo ); d
é a m e d id a da m a g n itu d e d o e f e ito u tiliz a d o p o r d ife r e n ç a s e n tre g r u p o s e é e x p lic a d o no
C a p ítu lo 7 . E x is te u m a d is c u s s ã o b astan te a c e s s ív e l so b re as d im e n s õ e s d o e f e ito fo r n e cid a
p or C lark -C arter (2 0 0 3 ).
4.6 Interpretação correta do valor p
h im portante en ten d er que o valor p é um a p rob ab ilid ad e c o n d ic io n a d a . C o n sid e ra -se a

probab ilidad e da oco rrên cia de um ev en to c a so a h ip ó te se nula seja verdadeira. O valor p ob
servad o em q u alq u er saíd a de program a c o m p u ta c io n a l rep resen ta e ssa p rob ab ilid ad e. N ão
representa a p rob ab ilid ad e de que o r ela cio n a m e n to o b serv a d o tenha ocorrid o sim p le sm e n te
por acaso. Indica a p robab ilidad e de o relacion am en to o b servad o ter ocorrid o se a h ip ó te se nula
fo ss e verdadeira. T rata-se de urna prob ab ilid ad e c o n d icio n a d a . E c o n d ic io n a l sob re a h ip ó tese
nula ser verdadeira. U m a boa d isc u ssã o d os problem as ca u sa d o s pela m á interpretação d o que
o v a lo r p representa é fe ita por D racu p (1 9 9 5 ). R e su m im o s o s p rin cip ais p on tos na d isc u ssã o
ab aixo. Se v o c ê qu iser ler a d isc u s sã o origin al, a referên cia é dada no final do cap ítu lo.
PONTO DE DISCUSSÃO: CRÍTICAS

MÁ INTERPRETAÇÃO DO NÍVEL DE SIGNIFICÂNCIA («)
D racu p ( 1 9 9 5 ) fo r n e ce u um a b o a d isc u s sã o d o p r o b le m a , a ss o c ia d o c o m a interp retação

errônea d o s fu n d a m e n to s do teste de h ip ó te se s.
M u ito s estu d a n te s se m e x p e r iê n c ia e m e sta tístic a (e m e s m o a q u ele s c o m a lg u m a ) e q u i
param o n ív el de sig n ific â n c ia ( a ) c o m o verd ad eiro tam an h o do e fe ito ex p e rim en ta l. Q uan to
m e n o r o n ív e l de s ig n ific â n c ia , m a is forte seria, p or e x e m p lo , o r e la c io n a m e n to entre duas
variáveis. Is so não é o que de fa to rep resen ta a significância d e um resu ltad o. O valor a for
n e c e sim p le sm e n te um a in d ic a çã o da p o s sib ilid a d e de se en con trar tal r e la cio n a m e n to c a so a
h ip ó te se n u la seja verdadeira. T a lv ez , de fato, q u anto m ais forte o r ela c io n a m e n to , m ais b aixa
a p ro b a b ilid a d e de qu e e le seja e n c o n tr a d o c a s o a h ip ó te se nula seja verd adeira, m as não s ig
n ific a q u e is s o n e c e ssa r ia m e n te ocorrerá.
Dracup também ressalta o lato de que muitos textos sobre estatística equiparam o valor a
com a probabilidade de que a hipótese nula seja verdadeira. Isso é falso, como Dracup ilustra
claramente: a é a probabilidade de se obter um relacionamento de certa magnitude caso a
hipótese nula seja verdadeira; não é a probabilidade de que esta seja verdadeira.
Uma vez que alguém caia na armadilha de inteipretar a como a probabilidade de que a
hipótese nula seja verdadeira, é relativamente fácil e conveniente sugerir que 1 - a seja a pro
babilidade de a hipótese de pesquisa ser verdadeira. Assim, se fixarmos a no nível tradicional
de 5% e encontrarmos um relacionamento significativo, quem seguir essa interpretação afir
mará que existe uma probabilidade de 95% de a hipótese de pesquisa ser verdadeira. Isso é
falso. De fato, não sabemos qual é a probabilidade de que a hipótese de pesquisa seja verda
deira; nossa probabilidade a é condicionada ao fato de a hipótese nula ser verdadeira, e não
tem nada a ver com a falsidade ou veracidade da hipótese de pesquisa.
Importa relembrar que a explicação sobre relacionamentos entre variáveis também se
aplica à procura por diferenças entre grupos. Assim, o valor p é a probabilidade de se en
contrar diferença entre dois grupos se a hipótese nula é verdadeira (não existe diferença na
população).
Atividade 4.4
Im agine q u e v ocê condu ziu d ois estu d o s sep arad os e en con trou um relacion am ento entre
o ta m a n h o da cabeça e o Ql no estu d o 1 e o ta m a n h o da cab eça e o ta m a n h o d o sa p a to no
e stu d o 2. A probabilidade d e se observar um a relação, por acaso, no estu d o 1 foi calculada
c o m o se n d o 0 ,0 4 , en q u a n to no estu d o 2 esta probabilidade é d e 0 ,0 0 1 . Qual d estes dois re
su ltad os é mais im portante p sicologicam en te?
es Testes estatísticos
Imagine que você está investigando a relação entre o número de horas de estudo e o
desempenho em uma prova. Suponha agora que, quando realizou o estudo, encontrou um
padrão de valores semelhante ao apresentado na Figura 4.3. Como você calcularia a pro
babilidade de que tal relacionamento se devesse ao erro amostrai se a hipótese nula fosse
verdadeira? Aqui precisamos utilizar testes estatísticos inferenciais, tais como o coeficiente
de correlação momento-produto de Pearson (veja Capítulo 5). Se você conduzisse um estudo
para examinar a diferença entre duas condições de uma variável independente, usaria um
teste como o teste-t, a fim de calcular a estatística teste, e a probabilidade seria obtida através
da distribuição t (Student).* No decorrer desta seção esperamos promover um entendimento
conceituai do que os lestes fazem de fato.
Quando olhamos para o relacionamento entre duas variáveis (p. ex. horas de estudo e
resultado em uma prova), somos capazes de calcular uma medida do tamanho ou força do rela-
N. de T. W illiam Sealy G osset ( 1876-1937). conhecido com o Sludeni.

cio n a m en to (isso será abordado co m m ais d etalh es no p róxim o cap ítu lo). Urna v e z que se tenha
urna m edida da força de um r elacion am en to, p recisa m o s encontrar a p robab ilidad e de encontrar
tal r e la cio n a m e n to u n ica m e n te d e v id o ao erro am ostrai. Para ca lcu la r e ssa p rob ab ilid ad e, fa
z e m o s u so das d istr ib u iç õ es de probab ilidad e introduzidas no C a p ítu lo 3 (p. e x ., veja a págin a
11 1 ). F oi dito anteriorm en te q u e a probab ilidad e de se obter qualquer valor de um a distribu ição
é c o n h e c id a - por e x e m p lo , a probab ilidad e de se obter um valor z d e 1,80 ou m aior é so m en te
3,8% . S e pu d erm os con verter a in fo r m a çã o que te m o s sob re a in ten sid ad e do rela cio n a m en to
e m um valor de distrib u ição de prob ab ilid ad e, p od erem os determ inar a probab ilidad e de que tal
valor seja ob tid o por acaso. Isso indicará a p rob ab ilid ad e de se obter o rela cio n a m en to o b serv a
do e m n o s so estu d o d e v id o ao erro am ostrai (por a c a so ), se não existir, d e fato, relacion am en to
na pop ulação. Is so é b asicam en te um teste de h ip ó te se s (sig n ificâ n cia ). A transform ação d os da
d os de n o ssa am ostra em valores de distrib u ição de probab ilidad e p erm ite determ inar qual é a
probab ilidad e de que e ste s d ad os tenham sid o o b tid os inteiram en te por acaso. P o d e m o s utilizar
e ssa probab ilidad e para d ecid ir qual das h ip ó te se s, se a nula ou a ex p erim en tal, é a e sc o lh a m ais
razoável. D e v e -s e en fatizar que as p rob ab ilid ad es c a lc u la d a s se b a seia m na h ip ó te se de que as
n o ssa s am ostras sã o se le c io n a d a s aleatoriam en te da p op u lação.
A F ig u ra 4 .5 m ostra a d istr ib u iç ã o norm al pad rão e ilu stra q u e a p r o b a b ilid a d e d e se
o b ter um v alor n o s e x tr e m o s (c a u d a s) da d istr ib u iç ã o é m u ito p eq u en a . V o c ê d e v e lem b rar
q u e, q u a n d o u tiliz a m o s d istr ib u iç õ e s c o n tín u a s, a área so b a curva rep resen ta a p rob ab ilid ad e.
Q u an to m aior a área a c im a de um va lo r p o s itiv o , m aior será a p r o b a b ilid a d e d e se ob terem
v a lo r e s ig u a is ou su p e rio r es a e le . D e form a se m e lh a n te , q u an to m a io r a área a b a ix o d e um
v a lo r n e g a tiv o , m a io r será a p r o b a b ilid a d e de se o b terem v a lo re s ig u a is ou in fe rio re s a e le.
A s sim , u m a v e z c o n v e r tid o o grau d e r e la c io n a m e n to entre d u as v a r iá v e is e m um va lo r de
d istrib u içã o de p ro b a b ilid a d e, p o d e m o s d eterm inar a p ro b a b ilid a d e de ob ter e ste valor ou um
m aior (ou m en or) por a c a so . S e o s v a lo re s e stã o tanto e m um a ou outra d as r e g iõ e s in d ic a d a s
na F igu ra 4 .5 , p o d e m o s c o n c lu ir q u e tal r e la c io n a m e n to é im p r o v á v el de ter o c o r r id o por
a c a so - isto é , não p od eria ser resu lta d o d o erro am ostrai.
V alores nos extrem os de um a distribuição

possuem baixa probabilidade de ocorrência
D ia g ra m a d o s va lo re s e xtre m o s em u m a d istrib u iç ã o .
É claro que, se estivermos investigando as diferenças entre grupos, podemos utilizar as

distribuições de probabilidade para calcular a probabilidade de encontrar diferenças, dos ta
manhos observados, apenas por fatores casuais, se a hipótese for verdadeira. Em tal caso,
podemos converter a diferença entre os dois grupos de variáveis independentes em um valor
de distribuição de probabilidade. Podemos, então, encontrar a probabilidade de obter tal va
lor devido ao erro amostrai, se não existir diferença na população. Se esta probabilidade é
pequena, não faz sentido propor a inexistência de diferença na população, e a diferença entre
as amostras resulta unicamente do erro amostrai. Faz mais sentido sugerir que a diferença ob
servada representa uma diferença real na população: a diferença é resultado da manipulação
da variável independente.
É importante notar que, quando convertemos nossos dados em um valor de distribuição
de probabilidade, o resultado obtido é denominado de estatística teste. Por exemplo, se es
tamos interessados na diferença entre dois grupos podemos converter nossos dados em um
valor-t (da distribuição t - Student). Esse valor t é a nossa estatística teste. Então, calculamos
a probabilidade de se obter tal valor, ou mais extremos, apenas por fatores casuais; isso re
presenta o valor p.
4.8 Erro do Tipo I
Suponha que tenhamos conduzido uma pesquisa e constatado que. considerando a hipó
tese nula verdadeira, a probabilidade de se encontrar o efeito observado é pequena - como
representado na Figura 4.3. Nesse caso, teríamos confiança de que podemos rejeitar a hipó
tese nula. Suponhamos agora que, na verdade, não exista tal efeito na população e tenhamos
encontrado em um efeito ocorrido apenas por acaso. Cometeremos, obviamente, um erro se
concluirmos que há suporte para nossa predição. Os estatísticos diriam que, se rejeitássemos
a hipótese nula, neste caso, cometeríamos um erro do Tipo I.
Se a significância do teste (a) é 5%, temos uma chance de 1 em 20 de cometer o erro
do Tipo I. Isso ocorre porque o valor a é a probabilidade de se rejeitar a hipótese nula, se
verdadeira. É a probabilidade de se obter um efeito como resultado somente erro amostrai
se a hipótese nula é verdadeira. Argumentamos que, se isso é pequeno o suficiente, então
é improvável que a hipótese nula seja verdadeira. Todavia, como o caso acima ilustra, po
demos estar errados; podemos cometer o erro do Tipo I. Dessa forma, o valor p representa
também a probabilidade de se cometer o erro do Tipo l. Se o valor p for igual a 5%, isso
quer dizer que a probabilidade de se cometer o erro do Tipo I é igual a esse valor caso a
hipótese nula seja rejeitada. Embora a probabilidade seja pequena, é possível que o even
to venha a ocorrer. Podemos relacionar isso à loteria nacional. Existe somente 1 em 14
milhões de possibilidades de você ganhar a loteria se comprar um único bilhete. Mesmo
que a probabilidade de ganho seja minúscula, ainda existe, e é por isso que as pessoas
continuam apostando. Então fique atento: mesmo se encontrar um valor p de 0,001%,
existe ainda uma probabilidade muito pequena de você cometer um erro do Tipo I, caso a
hipótese nula seja rejeitada.
* N. de T. É semeJhanie à mega-sena, só que o loral de números é 49 em vez de 60, assim como o número de combinações possíveis
é 13 983 816 em vez dos 50 063 860 da mega-sena.
Exemplo da literatura: memória

desempenho de pessoas ansiosas e não-ansiosas
U m e x e m p lo de um estu d o n o qual o s p e sq u isa d o re s p o d em ter c o m e tid o um erro do T ip o I é o
de R ich a rd s e F rench ( 19 9 1). N e s te e stu d o , fo i m e d id o o d e se m p e n h o da m e m ó r ia de p e s s o a s a n
s io s a s e n ã o -a n sio sa s para p alavras n eg a tiv a s. C o n sta to u -se qu e e m certo tip o d e tarefa e n v o lv e n d o
a m e m ó r ia , as p e ss o a s a n sio sa s lem braram d e m ais in fo r m a çã o n egativa do qu e as n ã o -a n sio sa s . O s
p e sq u isa d o re s c o n c lu ír a m que e s s a d ife re n ç a n ão fo i d ev id a ao erro am ostrai e qu e era de fato um a
d ife re n ç a g e n u ín a entre as p e ss o a s a n sio sa s e n ã o -a n sio sa s . R e p lic a ç ò e s p o ster io re s d esta p e sq u isa
r ea liza d a p e lo s m e sm o s au tores falh aram , no en ta n to , e m co n firm a r o r esu lta d o in icia l. A s s im , e le s
verificaram q u e o resu lta d o e n c o n tr a d o no e stu d o inicial era esp ú rio: não e x istia u m a d ife r e n ç a real
e n ire as p e sso a s a n sio sa s e n ã o -a n sio sa s q u anto a e ste tipo de tarefa de m em ória.
O s p e sq u isa d o re s c o m ete ra m um erro do T ip o I, porque p r o v a v e lm e n te n ão e x is te u m a d ife r e n
ça real qu an to a lem b ra n ça s de in fo r m a çã o n e g a tiv a entre p e s s o a s a n sio sa s e n ã o -a n sio sa s. Isso não
s ig n ific a d iz er q u e e sta fo i um a p e sq u isa ruim . P e lo con trário, fo i um e stu d o e x c e le n te e serv iu para
m ostrar q u e, c o m o n o s so j u lg a m e n to se b a seia em p r o b a b ilid a d es, e sta m o s a lg u m a s v e z e s a m ercê
d o s fatores ca su a is.
4.8.1 Replicação
S u p o n h a q u e v o c ê r e a liz e um e stu d o e o b se r v e um r ela c io n a m e n to c o m p ro b a b ilid a d e de
o c o rr ên cia a ss o c ia d a à v e ra c id a d e d a h ip ó te se nula de 0 ,0 1 (ou 1 % ). C o m b o a d o s e d e razão,
v o c ê ficaria f e liz em rejeitar a h ip ó te se nula e d izer que e n c o n tr o u su p o rte para a h ip ó te se de
p esq u isa . O q u ão c o n fia n te v o c ê p o d e esta r de qu e e x ista um a r ela çã o g en u ín a na p o p u la ç ã o ?
A resp o sta para e s s a q u e stã o é d ifíc il e , em a lg u n s a sp e c to s, d e p e n d e d o c o n te x to da p esq u isa
realizad a. S e o seu e stu d o fo i o p rim eiro n e ste a ssu n to , e' se n sa to q u e v o c ê trate o s r esu lta d o s
c o m certo grau d e ca u tela . L e m b r e-se : v o c ê está lid a n d o c o m p r o b a b ilid a d es, n ã o c o m cer
te za s. M e s m o q u e o s r esu lta d o s ten h am b a ix a p ro b a b ilid a d e de o c o rr ên cia se a h ip ó te se nula
fo r verd ad eira, e s s a p r o b a b ilid a d e ain d a e x is te . Q u a n d o retira m o s a m o str a s d e p o p u la ç õ e s ,
c a d a u m a é um p o u c o d ife r e n te , e a d ife r e n ç a entre e la s resu lta n o erro am ostrai (tratam os
d is s o a n te r io r m en te no C a p ítu lo 2 ). P o d e ser que v o c ê ten h a sid o azarad o e o pad rão q u e só
a c o n te c e u m a v e z e m 100, d e v id o ao erro a m o stra i, ten h a ju sta m e n te o c o rrid o . V ocê estaria
errado, n e ste c a s o , em rejeitar a h ip ó te se nu la. C o m o d e v e m o s p r o c e d e r n e sta situ a ç ã o ? O
q u e v o c ê d e v e fa z er é r ep lic a r o s r esu lta d o s, r e a liz a n d o ou tro estu d o . S e en con trar o m e sm o
padrão c o m u m a p ro b a b ilid a d e a p r o x im a d a d e o b tê -lo c a so a h ip ó te se nu la seja verd ad eira,
v o c ê p od erá c o n fia r m a is n os r esu lta d o s o b tid o s. A r e p lic a ç ã o é um a d as pedras a n g u la re s da
c iê n c ia . S e v o c ê o b ser v a um fe n ô m e n o u m a v e z , e n tã o p o d e ter sid o por a c a so ; se o o b ser v a
d u as, três ou m ais v e z e s , p o d e estar certo d e q u e é um resu lta d o a u tê n tic o .
4.9 Erro do Tipo II
E x iste um ou tro tip o de erro qu e se p o d e c o m ete r q u an d o se u tiliz a a a b o r d a g e m d o teste

d e h ip ó te se s em um a p esq u isa : erro do T ip o 11. E ste erro c o n s is te e m não rejeitar a h ip ó te se
n u la q u an d o e la é , de fa to , falsa.
S u p o n h a q u e p r e te n d a m o s a v e r ig u a r se e x is t e r e la c io n a m e n to e n tr e a q u a n tid a d e de
á lc o o l c o n s u m id o e a c o o r d e n a ç ã o d e u m a p e s s o a . U m e s tu d o é r e a liz a d o , e v e r if ic a -s e
q u e e x is t e u m a g ra n d e p r o b a b ilid a d e , d ig a m o s 0 ,8 (8 0 % ), d e q u e a r e la ç ã o o b s e r v a d a na
am ostra ten h a o c o r r id o p or a c a so . V o c ê c o n c lu ir á , p o rta n to , q u e n ão e x is te r e la c io n a m e n to
en tre q u a n tid a d e in g e rid a d e á lc o o l e c o o r d e n a ç ã o . E ss a será u m a c o n c lu s ã o correta? O b
v ia m e n te é u m a c o n c lu s ã o in c o rr eta , p o is to d a s as e v id ê n c ia s ap o n ta m o co n trá rio . E sse é
o m o tiv o da e x is tê n c ia d e le is q u e p r o íb e m de d irig ir a p ó s beber. N e s s e c a s o , p o d e m o s ter
c o m e tid o u m erro d o T ip o II, isto é, r e je ita m o s a h ip ó te s e d e p e s q u is a q u a n d o e la é d e fato
v erd ad eira.
O s m e sm o s tip os de erros p o d e m ocorrer q u an d o se in v e stig a m d ife re n ç a s entre gru p os.
S u p o n h a q u e v o c ê e ste ja c o n d u z in d o um e stu d o para v erifica r s e a lg u é m p od e percorrer 100
m etro s n a d a n d o em um a p is c in a m a is ráp id o d o q u e c o rr en d o e m u m a pista d e a tle tism o .
U m a v e z a n a lisa d o s o s d a d o s, v o c ê v e rific a q u e e x is te um a grande p ro b a b ilid a d e, se a h ip ó
te se nula for verd ad eira, d e q u e a d ife r e n ç a o b tid a tenha resu lta d o de erro am ostrai. D e s s a
fo rm a , v o c ê c o n c lu i q u e n ã o e x is te d ife r e n ç a entre o s te m p o s g a sto s para c o m p leta r o s 100
m etros na terra ou na água para a p o p u la ç ã o e m geral. V ocê c o m ete u cla ra m en te, n e ste c a so ,
um erro do T ip o II.
N a s n o ssa s p e sq u isa s, e m virtu de de nu nca esta rm o s 100% c er to s d e qu e p o d e m o s r ejei
tar a h ip ó te se nu la, ou 100% c erto s de q u e p o d e m o s a c e itá -la , te m o s sem p re a p ro b a b ilid a d e
d e c o m e te r a lg u m tip o d e erro. E s s e s erros sã o d o T ip o I ou II. V ocê d e v e lem brar qu e a pro
b ab ilid ad e de se c o m e te r e m erros d o T ip o I é rep resen tad a por a (alfa ). A p ro b a b ilid a d e de se
c o m e te r e m erros d o T ip o II é rep resen tad a por p (b eta).
S e v o c ê se en con trar na situ a ç ã o d escrita, na qu al se c o m e te u u m erro do T ip o II, c o n v é m
se perguntar por q u e, se e x is te u m a d ife r e n ç a real de r e la c io n a m e n to na p o p u la ç ã o , o seu
e stu d o fa lh o u na su a d e te c ç ã o . E x iste m v á rio s m o tiv o s para a o c o rrên cia d e ss e tipo de p r o b le
ma. N o p rim eiro d e le s , por puro a c a so , v o c ê p o d e ter se le c io n a d o p e ss o a s que p o s su e m um a
gra n d e to ler â n c ia ao á lc o o l (o u p e s s o a s q u e r ea lm en te sã o tão rápidas na p isc in a q u an to na
pista). M a is p r o v a v e lm e n te , no en ta n to , v o c ê fe z um e stu d o m al-p ro jeta d o , ou o s ta m an h os
am ostrais foram m u ito p e q u en o s. E s s e s fa to res afetam a c a p a c id a d e da p e sq u isa em detectar
d ife re n ç a s reais na p o p u la ç ã o . A h a b ilid a d e de um e stu d o rejeitar a h ip ó te se nu la q u an d o for,
de fato, fa lsa é d e n o m in a d o poder d o e stu d o , e su a p rob ab ilid ad e é dada por I - |3. T ratarem os
m u ito m ais d o pod er n o C a p ítu lo 7.
Atividade 4.5
Quais das seg u in tes situ ações representam um erro d o Tipo I e quais um erro d o Tipo II?
(a) V ocê verificou, em um estu d o, a existência d e um relacion am ento entre a qu an tid ad e

d e chá ingerida por dia e a q u an tid ad e d e dinheiro g a n h o na loteria. V ocê conclui que,
para ganhar na loteria, d eve beber m uito chá.
(b) V ocê verificou, em um e stu d o , q u e n ã o existe diferença en tre as velo cid a d es d as tar
tarugas e d o s gu ep a rd o s. V ocê conclu i q u e as tartarugas sã o tão rápidas q u a n to o s
gu ep ard os.
(c) V ocê verificou, em um e stu d o , q u e existe um r ela cio n a m en to en tre m o d o d e vida e
renda anual. N o e n ta n to , em virtude d e a prob ab ilid ad e ser d e 0 ,5 , v o c ê conclui q u e
n ão existe r ela cio n a m en to en tre as d u as variáveis,
4.10 Por que estabelecer a = 0,05?
Você pode estar se perguntando por que há um ponto de corte a de 0,05. Quem deter
minou que 0,05 é um valor de corte mais apropriado para rejeitar a hipótese nula do que
um de 0,20 ou de 0,001 ? Embora seja um valor arbitrario, não existe uma razão específica
para adotá-lo. Vamos dar uma olhada nas situações em que estabelecemos a como 0,20
e 0,001, respectivamente. Se definirmos a como 0,20, significa que vamos tolerar um
erro do Tipo I de 1 a cada 5. Isso é um critério de significáncia bastante liberal, pois, em
urna vez a cada cinco, podemos rejeitar a hipótese nula quando, de fato, ela é verdadei
ra. Pelo lado positivo, teremos uma probabilidade bem menor de cometermos o erro do
Tipo II. Isto é, teremos uma menor probabilidade de aceitarmos uma hipótese nula falsa.
Com tal critério liberal de significáncia, geralmente vamos rejeitar a hipótese nula mais
freqüentemente, e, dessa forma, é mais provável rejeitá-la quando for falsa (bem como é
mais provável, também, rejeitá-la quando for verdadeira). Isso significa uma probabilidade
menor de erro do Tipo II.
Muito bem, que tal agora estabelecer o nosso valor a em 0,001? Aqui temos uma pro
babilidade bem menor de cometermos o erro do Tipo I. Teremos uma possibilidade em mil
de rejeitarmos a hipótese nula quando for verdadeira. Esse é um critério de significancia
bastante conservador. Sob essa ótica, isso parece ser algo bom. Não queremos rejeitar incor
retamente a hipótese nula, e, então, por que não sermos bastante conservadores no nível de
significáncia? O problema é que, embora reduzamos a probabilidade de cometermos o erro
do Tipo I, também aumentamos a probabilidade de não rejeitarmos a hipótese nula quando é
falsa. Ampliamos a probabilidade de cometermos o erro do Tipo II. Isso ocorre porque, com
um critério de significáncia tão conservador, existirão poucas possibilidades de rejeitarmos
a hipótese nula. Dessa forma, aumentaremos a probabilidade de não rejeitarmos a hipótese
nula quando falsa.
Quando estabelecermos nosso critério para a significancia, devemos, portanto, fazer uru
balanço entre as possibilidades de cometermos erros dos Tipos I e II. Em muitas situações,
um a de 0,05 fornece o ponto de equilíbrio. Você deve notar que, algumas vezes, existem
outras considerações que determinam o nível em que a significancia deve ser estabelecida.
Se vamos testar um remédio novo, por exemplo, devemos ser muito mais conservadores, pois
as conseqüências de cometermos um erro do Tipo I podem ser bastante sérias. As pessoas
podem estar tomando remédios que apresentem efeitos colaterais perigosos ou que possam
não ser efetivos no tratamento. Outra situação na qual podemos estabelecer diferentes níveis
de significáncia é na condução de várias análises sobre o mesmo conjunto de dados. Isso será
abordado com mais detalhes no Capítulo 9.
4.11 Testes unilaterais e bilaterais
Anteriormente descrevemos um possível estudo sobre a relação entre o número de hora

de estudo semanal com a nota na prova (veja Seção 4.1). Fizemos a previsão (hipotética) de
que, à medida que as horas de estudo aumentam, da mesma forma aumenta a nota na prova.
Fizemos o que se denomina hipótese direcional. Especificamos a direção do relacionamen
to entre as duas variáveis: sugerimos que, aumentando as horas de estudo, a nota da prova
ta m b ém a u m en ta . Is s o é d e n o m in a d o hipótese unilateral ou unicaudal. N e s s e c a s o , e sta m o s

se g u r o s so b re a n atu reza d o r e la c io n a m e n to e p o d e m o s , e n tà o , fa z er u m a p r e v is ã o so b re a
d ir eç ã o d o m e sm o . E n tretan to, e m m u ito s c a s o s na p s ic o lo g ia (c o m o e m ou tras d isc ip lin a s),
n ão e s ta m o s se g u r o s so b re a n atu reza do r e la c io n a m e n to que n o s in te re ssa v erificar. S u p o
nha q u e d e s e je m o s in v e stig a r o r e la c io n a m e n to entre a n sie d a d e e lem b ra n ça s n e g a tiv a s. A s
p e sq u isa s p rév ia s na área lev a m a r e su lta d o s c o n tr a d itó rio s. M o g g e c o la b o r a d o r e s ( 1 9 8 7 )
v iram q u e in d iv íd u o s a n s io s o s se lem b ra m de m e n o s p alavras n e g a tiv a s do que p e s s o a s n ã o -
a n s io s a s, e n q u a n to R e id y e R ich ard s ( 1 9 9 7 ) v e rifica ra m q u e p e s s o a s a n s io s a s te n d e m a se
lem brar de m a is p alavras n e g a tiv a s. E n tão, n ão e sta m o s to ta lm en te se g u r o s so b re a d ireçã o
d o r e la c io n a m e n to entre p e s s o a s a n s io s a s e lem b ra n ça s n e g a tiv a s. D e s s a form a v a m o s e s
ta b e le c e r a p e n a s q u e e x is t e u m a r ela çã o entre as d u as v a r iá v e is se m , no en ta n to , e s p e c ific a r
seu d ir e c io n a m e n to . F a z e n d o tal p r e v is ã o , d e c la r a m o s qu e e x is te um r e la c io n a m e n to , m as
n ã o e sta m o s se g u r o s s e a a n sie d a d e au m en ta q u a n d o a lem b ran ça n egativa a u m e n ta ou d im i
nui. F iz e m o s o q u e é d e n o m in a d o d e previsão bidireeional, m a is c o n h e c id a c o m o hipótese
bilateral on bicaudal. V o c é p o d e estar p e n sa n d o qu e e s s e s sã o te rm o s b izarros para s e a s s o
cia r c o m tal tip o de h ip ó te se s. E sp er a m o s q u e tud o fiq u e c la r o na p r ó x im a e x p lic a ç ã o . Para
e n te n d e r por q u e u tiliz a m o s o s te rm o s hipótese uni e bicaudal, v o c ê p recisa voltar ao qu e se
viu so b re d istr ib u iç õ e s.
A n ter io rm e n te e x p lic a m o s q u e a d istrib u içã o norm al (c o m o outras d istr ib u iç õ e s d e pro
b a b ilid a d e ) p o s su i c a u d a s e m su as e x tr e m id a d e s (v e ja F igu ra 4 .5 ). A p r o b a b ilid a d e de se
o b terem v a lo res d e s s e s e x tr e m o s (d a s c a u d a s) é p e q u e n a q u an d o c om p arad a à o b te n ç ã o de
v a lo res d o m e io da d istrib u içã o (veja F igu ra 4 .6 ). P or e x e m p lo , obter a altura de um h o m em
c o m 2 4 4 cm é alta m en te im p r o v á v e l e e s s e valor estaria na cau d a d ireita (su p erior) da d istri
bu içã o das alturas de to d o s o s h o m en s.
A gora v o c ê p recisa relem brar o qu e se e x p lic o u sob re o s te stes e sta tístic o s. U tiliz a m o s as
d istr ib u iç õ e s de p rob ab ilid ad e c o m o recu rso para c a lc u la r a p rob ab ilid ad e dc um a d ife re n ç a
ou r ela çã o ocorrer e n q u a n to r esu lta d o d e erro am ostrai s e e s s a m e sm a d ife r e n ç a ou r ela çã o
n ão e x is te na p o p u la ç ã o . Para e x e m p lific a r , m o str a m o s c o m o se p o d e u tiliza r a d istrib u içã o
A área do meio da distribuição é bem

m aior do que aquela dos extrem os
V a lo re s nos e xtre m o s (c a u d a s) a p re se n ta m u m a p ro b a b ilid a d e de o c o rrê n cia m e n o r do

Figura 4.6
q u e os do m eio da d istrib u iç ã o .
n orm al padrão n e s s e s c a s o s . D e s ta c a m o s q u e, a p ó s te rm o s tr a n sfo r m a d o n o ssa e sta tístic a

a m ostrai e m um valor da n orm al pad rão, d e te r m in a m o s qual a p r o b a b ilid a d e de se ob ter tal
v a lo r ou outro m ais e x tr e m o c o m o resu lta d o a p en a s do erro am ostrai. S e e s s a p rob ab ilid ad e
é p eq u en a , en tã o p o d e m o s argum entar c o m a lg u m a c o n fia n ç a q u e te m o s um r ela cio n a m e n to
g e n u ín o entre as n o s sa s v a r iá v e is, isto é . o r ela c io n a m e n to não se d e v e a o erro am ostrai.
S e v o c ê o b serv a r a F igu ra 4 .7 , verá qu e in d ic a m o s as áreas na d istr ib u iç ã o nas q u ais a
pro b a b ilid a d e de se ob ter tal v alor é p eq u en a . E s s e s v a lo re s e stã o lo c a liz a d o s n os e x tr e m o s
(ca u d a s) da d istrib u ição.
Q u a n d o u tiliz a m o s o p r o c e s so d e c a lc u la r o e s c o r e r elev a n te da in fo r m a ç ã o a m o stra i,
tra b a lh a m o s c o m a lg u m a m e d id a da in te n sid a d e do r ela c io n a m e n to entre as d u as. S u p o n h a
q u e te n h a m o s d o is e stu d o s, o E stu d o l e o E stu d o 2 , a m b o s inv e stig a n d o o r e la c io n a m e n to
entre a a n sie d a d e e sta tístic a e a p r o c ra stin a çã o (v eja T abela 4 . 1).
N o s d o is e stu d o s, q u er e m o s v erifica r s e a a n sie d a d e e sta tístic a e a p ro cra stin a çã o e stã o
r e la c io n a d a s d e a lg u m a form a. V ocê d e v e n o ta r a partir da tab ela, q u e, em c a d a e stu d o , pa
rec e e x is tir um r e la c io n a m e n to en tre a n sie d a d e c p r o c ra stin a çã o . N o E stu d o 1, o au m en to
d o s v a lo res da a n sie d a d e lev a m ao m e sm o e fe ito na p roerastin açao. N e ste c a s o , q u an d o c a l
c u la m o s o e sc o r e p a d ro n iza d o , o b te m o s p r o v a v e lm e n te u m v alor da cau d a d ireita (su p erior)
da d istrib u içã o (veja F igu ra 4 .7 ). S e . por outro la d o , o s v a lo res da a n sie d a d e au m en tam m as
o s da p ro cra stin a çã o d im in u e m (c o m o no E stu d o 2 ). o e sc o r e p a d ro n iza d o resu ltan te d ev e
estar na cau d a esq u erd a (in ferio r) da d istrib u içã o . E s s e e x e m p lo ilu stra o fato d e a d ir eç ã o do
r e la c io n a m e n to entre as su a s v a r iá v e is d eterm in ar a cau d a da d istr ib u iç ã o na qual o e sc o r e
p a d ron izad o resu ltan te se lo c a liz a .
Q u an d o não p r e v em o s a d ir eç ã o d o r ela c io n a m e n to entre a a n sie d a d e e sta tístic a e a pro
c ra stin a çã o , p rev em o s sim p le sm e n te q u e o e sc o r e c a lc u la d o p o d e estar em q u alq u er um a das
ca u d a s da d istrib u içã o . P ortan to, fa z e m o s u m a p r e v isã o b icau d al. S e , por outro la d o , p r e v e
m o s q u e, à m e d id a q u e o s e s c o r e s de a n sie d a d e a u m e n ta m , o s da p r o c ra stin a çã o tam b ém .
Valores nas caudas

da distribuição
Baixos escores Altos escores

de ansiedade de ansiedade
estatística estatística
associados com associados com
baixos escores de altos escores de
procrastinação procrastinação
resultam em um resultam em um
valor padronizado valor padronizado
nesta cauda nesta cauda
-3 -2 0 2 3
Cauda inferior Cauda \uperior
Ilu stração dos valo re s n as c a u d a s da d istrib u iç ã o .

Tabela 4.1 Dados para a ansiedade estatística e a procrastinação nos Estudos 1 e 2
Estudo 1 Estudo 2
Ansiedade Procrastinação Ansiedade Procrastinação
1 2 I 18
2 4 2 16
3 6 3 14
4 8 4 12
5 10 5 10
6 12 6 8
7 14 7 6
8 16 8 4
9 18 9 2
prevemos que o escore padronizado pertence à cauda direita da distribuição apenas. Isto é,
prevemos a que cauda o escore que calculamos pertence.
Se você faz uma previsão bicaudal, o escore calculado pode pertencer a qualquer uma
das caudas. Suponha agora que convencionamos utilizar o nível de significância de 5% como
nosso ponto de corte para a rejeição da hipótese nula (não recomendamos que você use ta] va
lor: apenas o utilizamos para ilustrar o assunto). Seremos capazes de rejeitar a hipótese nula
somente se existir uma probabilidade de 5% ou menos de obtermos o escore padronizado. A
Figura 4.8 mostra que, em cada cauda, há escores calculados com uma probabilidade de 2,5%
de serem obtidos, isto é, o valor de 5% é dividido entre as duas caudas.
Se fizermos uma previsão unicaudal, então aceitaremos escores em apenas uma das cau
das. Dessa forma, nossa região de 5% de probabilidade está toda em uma única cauda: isto
é. ela não é dividida entre as duas caudas. Isso efetivamente significa que podemos rejeitar a
hipótese nula para um número maior de escores nessa cauda do que no teste bicaudal (veja
Figura 4.9).
As áreas coloridas representam as regiões nas quais p od em ocorrer escores d e h ip ótese

Figura 4.8
bicaudal.
A s áre a s c o lo rid a s rep rese n ta m as reg iõ es nas q u a is p o d em o c o rre r esco res de h ip ó tese
9 u n ic a u d a l.
As Figuras 4.8 e 4.9 ilustram a importância de se estar seguro sobre a realização de

uma previsão unilateral ou bilateral. Nos capítulos seguintes, quando serão descritos os pro
cedimentos dos vários testes estatísticos que utilizam o SPSSPW, você poderá notar que
existe uma opção que permite escolher se as probabilidades (valores p) serão unilaterais ou
bilaterais.
Se, entretanto, você tiver obtido um valor p para um teste bilateral e quiser saber o valor
correspondente para o teste unilateral, tudo o que precisa fazer é dividir pordoiso valor p.
Por exemplo, se você obteve um valor p de 0,03 para um teste bilateral, o valor equivalente
para um teste unilateral será 0,0015. De forma semelhante, se for obtido um valor p para um
teste unilateral, o valor correspondente para o teste bilateral será obtido dobrando-se esse
valor. Observe que o que deve ser dobrado é o valor p e não a estatística teste (p. ex., coefi
ciente de correlação ou um valor t). A estatística teste (evidência amostrai) será a mesma em
qualquer um dos casos para um mesmo conjunto de dados.
Devemos salientar que. embora tenhamos ilustrado a diferença entre previsões unilaterais
e bilaterais com referência ao relacionamento entre variáveis, você pode também ter qualquer
uma das previsões quando investigar diferenças entre condições.
Essencialmente, existem duas formas em que quaisquer duas condições (A e B) podem
diferir, isto é:
■ Condição A apresenta valores mais altos do que a condição B.
■ Condição B apresenta valores mais altos do que a condição A.
Quando feita uma previsão bilateral sobre diferenças entre duas condições, tem e
somente que especificar que existe diferença entre elas. Não precisamos especificar qual
condição terá valores mais altos. Se fizermos uma previsão unilateral, devemos especificar
qual dos cenários acima será mais apropriado, isto é, que condição deverá ter os maiores va
lores. Não pretendemos detalhar esse assunto aqui. pois ele será abordado em profundidade
no Capítulo 6.
* N. de T. Evidentem ente os autores estão referindo-se às distribuições sim étricas, com o a norm al c a / (Studcnt).
Atividade 4.6
Q uais das se g u in tes h ipóteses são u n ila te rais (u n ica u d ais) e q u ais sao b ilaterais (b icau d ais)?
(a) Prevê-se q u e as m u lh e re s a p re se n ta m esco res de e m p ||iâ m ais alto s do q u e os h o

m e n s.
(b) Prevê-se q u e, à m ed id a q u e o sa lário a n u a l a u m e n ta , ta m b é m a u m e n ta o n ú m e ro de
to m a te s c o n su m id o s por se m a n a .
(c) Prevê-se q u e exista relação e n tre o c o m p rim e n to do cab elo d o s h o m e n s e o n ú m e ro de
crim e s c o m e tid o s.
(d) Prevê-se q u e os fã s d e fu te b o l têm um Ql m e n o r do q u e os fã s d e ó p e ra.
(e) Prevê-se q u e exista u m a relação e n tre o n ú m e ro de livros lidos por se m an a e a e xte n
são do v o c a b u lá rio .
4.12 Hipóteses subjacentes ao uso dos testes estatísticos
N a s s e ç õ e s a n te r io r es e e m o u tr o s c a p ítu lo s d o liv r o , in tr o d u z im o s o s c o n c e it o s b á s i
c o s da te sta g e m e sta tístic a . N o restan te d o liv r o , e x p lic a r e m o s um grande n ú m ero de te stes
ap rop riad os para o s v á rio s d e lin e a m e n to s p o s s ív e is de u m a p e sq u isa . N o en tan to, e s s e s te stes
req u erem q u e a lg u m a s h ip ó te se s sejam sa tisfe ita s a n tes qu e e le s p o ssa m ser ap rop riad am en te
a p lica d o s a o s d a d o s am ostrais.
M u ita s d as t é c n ic a s e s ta tís tic a s q u e d e s c r e v e m o s n o liv r o r eq u e r e m a s a tis fa ç ã o de
a lg u m a s c o n d iç õ e s p e la s p o p u la ç õ e s das q u ais o s d a d o s sã o retirad os. Em virtu de de as carac
terística s de u m a p o p u la ç ã o serem d e n o m in a d a s de p arâm etros (v e ja C a p ítu lo 2 ), e s s e s te ste s
fr e q ü e n tem e n te sã o d e n o m in a d o s de testes paramétricos. E m virtude d o s r eq u e rim en to s d e s
se s te ste s , p r e c is a m o s a sseg u ra r q u e o s n o s s o s d a d o s tam b ém sa tisfa ç a m certas h ip ó te s e s
an tes qu e p o s s a m o s ap licar tais té c n ic a s e sta tístic a s. E ssa s h ip ó te se s sã o d escrita s nas se ç õ e s
se g u in te s.
E x iste m té c n ic a s e sta tístic a s q u e n ão elab oram h ip ó te se s sob re o c o m p o r ta m e n to da p o
p u la çã o da qual o s d a d o s sã o retirad os, m as e la s n ã o sã o tão u tiliz a d a s q u an to às té c n ic a s
p aram étricas. Por n ão e x ig ir e m qu e a p o p u la ç ã o sa tisfa ç a certas c o n d iç õ e s , sã o m u itas v e z e s
d e n o m in a d a s de testes de distribuição livre. E ss e s te ste s serão ab ord ad os no C a p ítu lo 15.
H ipóteses subjacentes aos testes paramétricos

1. A p o p u la çã o da qual as am ostras são retiradas d eve ser normalmente distribuída. O s
testes param étricos p ressu p õ em que lid a m o s com d ad os norm alm en te distribu íd os.
E ssen cia lm en te, e ssa su p o siç ã o sig n ifica que se d eve, sem p re, verificar se o s dados
da n ossa am ostra são ap roxim ad am en te n orm ais antes de se d ecid ir pelo u so de um
teste param étrico. Já fa la m o s sob re c o m o fazer isso u tiliza n d o os diagram as de caixa
e b ig o d e s, cau le e fo lh a s e h istogram as. S e v o c ê verificar que o s d ad os se d e sv ia m da
n orm alid ade, é p o s sív e l tran sform á-los, de form a leg ítim a , de m o d o qu e ainda seja
p o ssív e l a u tiliza çã o de um teste param étrico; c o m o isso está além do o b jetiv o deste
texto, v o c ê d e v e con su ltar ou tros m ais avan çad os. H o w e ll ( 2 0 0 2 ) fo r n e ce um panora-
ma muito bom de tais transformações. Para sua informação, as distribuições na Figura

4.10 (a) e (b) são provavelmente próximas da normalidade para que se utilize um teste
paramétrico. Se os seus dados são mais parecidos com as Figuras 4 .10 (c) e (d), você
deve considerar uma transformação de dados.
2. A segunda pressuposição indica que as variâncias das populações devem ser
aproximadamente iguais. Isso é algumas vezes referenciado como a hipótese da
homogeneidade das variâncias. Você deve estar lembrado que, quando explicamos
como calcular o desvio padrão no Capítulo 2, afirmamos que o cálculo da variância
era um dos passos necessários para obtê-lo. Especificamente, informamos que o
desvio padrão é a raiz quadrada da variância. Na prática, não podemos verificar se
nossas populações apresentam a mesma variância e, então, devemos nos assegurar
de que as variâncias de nossas amostras sejam aproximadamente iguais. Você pode
se perguntar: o que quer dizer aproximadamente iguais! Eis a regra prática utiliza
da: se a maior das variâncias não for mais do que três vezes a menor das variâncias,
é possível admitir que tenhamos variâncias aproximadamente iguais. Entendemos
que isso significa o mesmo que afirmar que um homem e uma girafa são aproxima
damente da mesma altura, mas ilustra a flexibilidade envolvida em algumas dessas
suposições. Geralmente a violação desse tipo de suposição não é considerada tão
catastrófica, contanto que você tenha o mesmo número de participantes em cada
uma das condições. Se você tiver amostras de tamanhos diferentes, e a suposição de
(a)
Freq üências
60-61 6 4 -6 5 6 8 -6 9 72-73 7 6 -7 7 60-61 6 4 -6 5 6 8 -6 9 72 -7 3 76-7 7
(d) 10
Freqüências
60-61 6 4 -6 5 6 8 -6 9 72-73 7 6 -7 7 60-61 6 4 -6 5 6 8 -6 9 72 -7 3 76-7 7
Exe m p lo s d e d istrib u iç õ e s q u e p o d em ser c o n sid e ra d a s a p ro x im a d a m e n te n o rm a is - (a)

Figura 4.10
e (b) - e a q u e la s q u e p ro va ve lm e n te não po d em - (c) e (d ).
N. dc T. Do falo existo um teste para verificar isso. O SPPSPW faz essa verificação autom aticam ente, sem pre que se utili/.ar o teste •
para a diferença entre duas médias.
igualdade de variâncias for violada, definitivamente você deve considerar o uso de

um teste de distribuição livre (veja Capítulo 15).
3. A última suposição aponta que não existem escores extremos (outliers). O motivo
dessa suposição é fácil de entender quando você considera que muitos testes para
métricos envolvem o cálculo da média como uma medida de tendência central. Se
você lembrar o que foi explicado no Capítulo 2, verá que a média é bastante sen
sível a valores extremos - quando eles estiverem presentes, é melhor utilizar outra
medida de tendência central. Se os escores extremos distorcem a média, por con
seqüência qualquer teste paramétrico que utilize a média ficará também distorcido.
Assim, devemos nos assegurar de que não existem valores extremos nos dados. Se
você se deparar com valores extremos, deve voltar ao Capítulo 2 para uma discussão
sobre o que deve ser feito com eles.
Dado que existem suposições inerentes ao uso dos testes paramétricos, você pode
rá perguntar-se: por que utilizá-los? Os testes paramétricos são utilizados com freqüência
na pesquisa psicológica porque são os testes mais poderosos. Se existe uma diferença nas
populações, ou um relacionamento entre duas variáveis, os testes paramétricos têm maior
probabilidade de detectá-las, desde que as suposições para a sua utilização sejam satisfei
tas. Os testes paramétricos são mais poderosos porque usam mais informações dos dados.
Suas fórmulas envolvem o cálculo de médias, desvios padrões e alguma medida do erro dn
variância (isso será explicado nos capítulos pertinentes). Os testes de distribuição livre ou
não-paramétricos se baseiam em postos ou freqüências de ocorrência dos dados em vez dos
próprios dados. Em virtude de seu maior poder, os testes paramétricos são os preferidos, con
tanto que as restrições ao seu uso não sejam extremamente violadas.
Neste e nos capítulos anteriores, explicamos os conceiios básicos importantes para um
bom entendimento dos testes estatísticos utilizados com maior freqüência. Além disso, apre
sentamos várias técnicas descritivas e alguns conselhos sobre como utilizá-las. O parágrafo
anterior também apresentou alguns critérios para a escolha entre as várias técnicas estatísticas
inferenciais. Antes de você estudar os testes estatísticos propriamente ditos, seria, talvez, uma
boa idéia revisar todas essas considerações. Para tanto, vamos apresentá-las aqui na forma
de um sumário. A Figura 4.11 fornece uma ilustração aproximada da forma como o projeto
pode afetar a escolha da estatística. Deve-se enfatizar que este diagrama de fluxo representa
uma visão geral dos assuntos abordados nos capítulos precedentes e deve ser utilizado como
tal. Sempre que você tiver dúvidas sobre qual teste pode aplicar de forma legítima aos seus
dados, recomendamos que utilize o diagrama em conjunto com as orientações apresentadas
previamente.
Quantas variáveis você tem?
Duas M ais de duas
Você está procurando por Você está pro cu rand o por

diferenças entre co n diçõ es ou diferenças entre co n diçõ es ou
relacio nam entos entre variáveis? relacio nam entos entre variáveis?
D iferenças Relacionam entos Relacionamentos D iferenças

\ / ' "W.
Você tem um Você q u er determ inar Voce está interessado na Você tem m ais de uma
delineam en to entre ) ou equação de regressão ou na variável dep end en te (VD)?
—
SPSSPW: conselheiro estatístico (Statistics Coach)
□l
Outra característica útil do SPSSPW é o conselheiro estatístico. Você pode utilizá-lo em
vez da Figura 4.11, para verificar que tipo de análise deveria estar fazendo em seus dados.
Você inicia o conselheiro estatístico por meio do menu Ajuda [Help).
\ДUnlrtted SPSSDataEd.ltx ЦПD[

Fie £A View ß a la liaraforrtt А лв^ге Qiaphs UhUie; W ndow Hefc
Tofics
® |B |a |H j M i 1 f c |& | « m r - |s |.± .|i
Iuiofial
13 a l l e i n SPSS Hoffie Раде
before*! | aftersl I I I I
i i : ¿yrtax Guòc »
1 2 00 2 00 Abou*
2 300 5 00 Registe« Produci
3 1 00 600
A 00 2 00
5 1 00 1 00
6 2 00 2 00
7 1 00 300
8 00 1 00
9 300 200
10 00 3 00
11 1 00 400
12 1 00 2 00
г
ta View \ Variable V e w / • I ■
SPSS Pioc*MOí « ready
ja SM I Щ К ^ Ц ► И ■ jy M t.f J ll j j ü n l i l l . . rd O JW l I ^ M ,c ,o :c t I- S B W í J T S I s / 11«
Clique no Statistics Coach (Conselheiro Estatístico). Uma vez iniciado, será apresentada
uma tela solicitando o que você quer fazer. Haverá várias opções à disposição, tais como
Summarize (Resumir), Describe or present data (Descrever ou apresentar dados) e Compare
groupsfor significam differences (Comparar grupos para diferenças significativas).
E xem p lo s de sa íd as do SPSSPW O pções para esco lh a
}p S tatistics C oach ¡U S *1
W h at do yo u w ant to d o ?
S a le s
r Sum m arize, describe, or prese n t data
volum e E ast
Low 49
Medium 42 r Look at variance and distribution of data
Hign 29
Total 120
;-q r C reate CLAP report cubes
Std I - f» C om pare groups for significant differences

Division Mean Deviation
C onsum er
1309.112 189.537
Products
Identify significant relationships betw een
B u sin e ss
$425.152 5203,366 variables
Products
t df ( 2-taiied) Lower Upper
Equal » a n am e'j i f* Identify groups of similar c a s e s
•7 1 388 000 *148.293 183.787
a s su m e d
Equal variances
-7 5 299 000 -1146 578 -$85.502
not a s s u m e d
Identify nroups of similar variables Botões de
naveg ação
M ore E xo m ples Help I B a c k \ N e .t | C ancel |
r1
< S t o l| r¡ ► 0 I m u n ii I a n .J c IS g M , : | « jM r .l |[ S la l S 3 ® S № 1 3 ÍÍ > II 4
No lado esquerdo da tela, são apresentados exemplos de saídas do SPSS. Na parte infe
rior direita da tela, existem vários botões para navegação por meio do conselheiro estatístico.
Uma vez feita a escolha, clique no botão Next (Seguinte). Aparecerão mais algumas opções
relacionadas com o que fazer. Como exemplo, selecionamos a opção Compare groups fo r
significant differences (Comparar grupos para diferenças significativas).
Selecione a
opção
relevante
“ Std Error
Mean Sid Oeviaiion Mean
Sales
Revenue 5371.893 «171.311
T »51 value = 350000

95% Confidence Clique em Next
Interval of the Difference
t (2-tailed) □inference Lower Upper
(Seguinte) para
2 524 012 »21.893 14.838 138.948 ir à próxim a tela
M ore Exam ples H elp I Back | N eri | C ancel |
JB5K ..I I _ 4 !J K ^ O ► a jyM C T I I [jjO ulo IsS M iíc , | « M a || y .l .l . ig H W a if .. 11 V.

Você deve então responder as questões relevantes apresentadas na tela. Após cada con
junto de opções clique no botão Next (Seguinte) para ir à próxima tela. À medida que você
executa as escolhas, pode notar que os exemplos de saída do SPSSPW no painel esquerdo da
tela se alteram para refletir as escolhas feitas.
fp Statistics Coach
Mow m a n y g ro u p s oi v a r ia b le s do yo u w a i l :
e
lo c o m p a ie ?
One group or variable com pared to a known

value
I Two groups or variables
C Three or m ore groups
t-test for Equ ality oi Means

95% Confidence
interval of the Difference
Sio
(2-lailed) Differente Lower Upper
Equal
vanances 000 •$116,040 $148.293 -$85,787
a ssu m ed
Equal
variances not 000 $116.040 $146.578 -$95,502
I assu m e d
M ore Exam ples H elp I Back I Next | Cancel |
3BS»a-t| J ¡ :J i* ^ y » ! I [ g U r .J I [¿ O Ja I 5 g lfa o I » -M a | | '¿ S I * . • i g B J W 'S Í J i ' 1147
Ij? S ta tu lic i Coach
H ow a r e y o u i d a ta o rg a n iz e d ?
B u sin e ss Products
One continuous, numeric dependent variable
onsum er Products divided into two unrelated groups
C onsum er P roducts $262.800I : Two continuous, numeric variables that

B usine s s Products represent related data
Std Sid Error
Division Mean Deviation Mean
Consum er
$309.1 12 $89,537 $6.692
F'OdUCtS
Business
$425.152 $203.366 $14.000
Products
t test for Equality of Means
95% Confidence
interval of the Difference
(2-taiied) Difference Lower Upper
000 $116.040 $148.293 -$83.787
000 $116.040 $146.578 •$85.502
M ore Exam ples Help I B ac k |[TÑlexi | Cancel |
►CD lãjüoul le a p « I II Slot ,
Haverá uma série dessas telas para cada lipo de análise que você pode querer fazer. Vá
respondendo as questões e clicando no botão Next (Seguinte) até que apareça uma tela com o
botão Finish (Final) em vez do botão Next (Seguinte).
Iff S ta ta tic i Coach I Jnl *l|ül

W h ich in d e p e n d e n t s a m p le s te s t do y ou
w a n t?
Sid Std Error ", T est that a ssu m e s data a re normally distnbuted
Division Mean Deviation Mean within groups
Consum er
$309.112 $89.537 $6.692
Products Test thai d oes not a ssu m e data are normally
B usiness distributed
$425.152 $203.366 514,000
Products
l-test for Equality of Means

95% Confidence
internai o rm e Oiirerence
Sig
(2-tailed) Difference Lowei Upper
Equal
variances 000 $116,040 $148.293 $83.787
assu m ed
Equal
van ances not 000 $116.040 -$146.578 •$35.502
assu m ed
M ore Exam ples Help I B oc k [I Finish | Cancel |
J B S IJ .1 1 y w .- io I [B|UnMI I I Il -i'S iM ...
Uma vez feita sua última seleção, clique no botão Finish (Final). O SPSSPW sairá do
conselheiro estatístico e retornará para a janela de dados (Data screen). Você notará que o
programa selecionou o teste relevante a partir dos menus. Haverá uma caixa de diálogos aber
ta para o teste que precisa. Também estará disponível uma janela aberta de ajuda que contém
informações relacionadas a esse teste em particular. Por exemplo, neste caso, aparecerá uma
caixa de diálogos do teste t (veja Capítulo 6). Então, você pode rodar a:, análises relevantes
nos seus dados.
Retorno à tela Jan ela de aju d a fo rn ece n d o

d a d o s do SPSSPW d e talh es d e co m o realizar o teste
Taí ÉiüSSCTwIi -JS J_ x J
jjB lai F-31 H -I MC?| «| -Tiri a s i n i

13 alt« it
beforest I aflersf |___________ |___________ |___________ |______

W ~ -r
To O b tain a n In d e p e n d e n t- S a m p le s
Test
Caixa de
#> Before S ia Trek fbefo j e d Variables) From lhe m enus choose
diálo go para Alter Si« Trek, [aitati]
Analyze
o teste Com pare Means
a Be«* independent-Sam pies T T est
de in teresse
Canee
Select one or m ore continuous, numeric test
Help variables A s e p a r a te ! lest is computed for each
vanabie
Select a dicnotomous grouping variable (a

categoncal variable that divides c a s e s into two
groups)
Click Defww ‘iioups and specrfvthe values o f

the grouping vanabie that define the two groups
The grouping vanabie can be a string

Jll
1 I - f\l>at* View \ VariaMe Vtow /

SPSS Processo» is icady
I jlL
J j 2 PÇ ^ D ► I ¡jgjUrJitl I [jjO i/p I á S M oo I «¡»MSI IU 'H o laawpiaiii n *8
Resumo
Neste capítulo, avançamos no terreno da estatística inferencial e estabelecemos as fun

dações finais para você enfrentar as técnicas estatísticas inferenciais mais freqüentemente
utilizadas na psicologia. Você aprendeu que:
■ Há uma lógica por trás dos testes de hipóteses e significância estatística.
■ A hipótese nula representa o contrário da hipótese experimental.
■ Podemos utilizar as distribuições de probabilidade para verificar as chances de que os
efeitos em nossa pesquisa sejam oriundos de erro amostrai, caso a hipótese nula seja
verdadeira.
■ Embora os testes de hipóteses constituam os principais métodos de pesquisa eni
psicologia, existe em sentimento crescente de que apresentam limitações no estabe
lecimento de conclusões significativas a partir dos dados.
■ Como resultado disso, sugerimos várias formas de suplementar os resultados de um
teste de hipóteses com estatísticas mais significativas, como, por exemplo, o tamanho
do efeito e os intervalos de confiança.
■ Nos testes de hipóteses, existem dois tipos de erros (erros dos Tipos I e II) que podem
ser cometidos quando obtemos conclusões a partir dos dados:
- Erro do Tipo 1 é rejeitar a hipótese nula quanuo verdadeira.
- Erro do Tipo II é aceitar a hipótese nula quando falsa.
■ Podem ser feitas predições unidirecionais (unilaterais) e não-direcionais (bilaterais)
e como elas estão relacionadas com as distribuições de probabilidade.
- Predições bilaterais são aquelas nas quais prevemos uma diferença entre duas
condições (ou relacionamento entre duas variáveis), mas não especificamos a di
reção da diferença (ou relacionamento).
- Predições unilaterais são aquelas nas quais especificamos a direção de uma dife
rença ou relacionamento.
Esperamos que a esta altura você tenha um bom conhecimento conceituai das abordagens
descritiva e inferencial para analisar um conjunto de dados. Nos capítulos restantes, com
exceção do Capítulo 7, descreveremos testes estatísticos específicos com mais detalhes. No
entanto, você deve sempre ter em mente quando ler esses capítulos que tais testes se funda
mentam nos conceitos introduzidos nos capítulos iniciais.
Exercício 1
A p r o fe sso r a Y o b e stá in te re ssa d a na v io lê n c ia dc m a ssa durante as partidas de fu te b o l.
E la p en sa qu e a v io lê n c ia do gru p o é resu lta d o d o s a ss e n to s d e sc o n fo r tá v e is do e stá d io . Por
isso , Yob m o d ific a d o is e stá d io s d ife r e n te s na Inglaterra. Em um e stá d io c o lo c a a ss e n to s b em
ap ertad os e d e sc o n fo r tá v e is. N o outro, in sta la a sse n to s c o n fo r tá v e is, c o m m u ito e sp a ç o para
as p ern as e e n tre o s a ss e n to s a d ja c e n tes. A p r o fe sso r a o r g a n iz a u m a c o m p e tiç ã o , de m o d o
q u e um c lu b e jo g u e m etad e das partidas e m u m e stá d io e a outra m eta d e no outro e stá d io . Ela
a co m p a n h a um gru p o de d o z e fãs a d o le s c e n te s a g r e s s iv o s e g r o sse ir o s d o c lu b e e registra o
n ú m ero d e v e z e s q u e cad a um é p reso o u e x p u ls o d o e stá d io . P revê q u e o nú m ero de p r isõ e s
e e x p u ls õ e s será m aior no e stá d io q u e a p resen ta o s a ss e n to s m a is d e sc o n fo r tá v e is e ob tém o s
d a d o s da T ab ela 4 .2 .
T a b e la 4.2 Número de ocorrências envolvendo os 12 jovens em cada um dos estádios
Adolescente Estádio desconfortável Estádio confortável
I 8 3
5 2
3 4 4
4 6 6
5 4 2
6 8 1
7 9 6
8 10 3
9 7 4
10 8 1
11 6 4
12 7 3
1. Este é um delineamento entre ou dentre participantes?

2. Que tipo de variável a professora Yob mediu, discreta ou contínua?
3. (a) Qual é variável independente?
(b) Qual é variável dependente?
4. Este é um teste unilateral ou bilateral?
5. Qual é a hipótese nula?
6. Insira os dados no SPSSPW e faça o seguinte para cada condição:
■ Diagrama de barras de erro
■ Média
■ Desvio padrão
■ Erro padrão
■ Intervalos de confiança de 95%
7. Converta o primeiro escore de cada condição em um escore padronizado (valor c).
Exercício 2
O doutor Pedante é apaixonado por linguagem e, particularmente, não gosta do in

finitivo dividido (p. ex., corajosamente ir onde nenhum homem esteve antes contém um
infinitivo dividido e ir corajosamente onde nenhum homem esteve antes não contém). Ele
culpa a popularidade da série Jornada nas Estrelas nos anos de 1970 pela proliferação do
infinitivo dividido nas publicações que relatam pesquisas. Dessa forma, ele selecionou 12
psicólogos que publicaram pesquisas em periódicos, antes e depois que a série Jornada
nas Estrelas fosse apresentada na televisão pela primeira vez. Ele avaliou as últimas 20
publicações de cada pesquisador, antes e depois que a série foi televisionada, e contou o
número de infinitivos divididos utilizados. Previu que o número de infinitivos divididos
seria maior nas publicações feitas após a série ter tornado-se popular na televisão e obteve
os dados da Tabela 4.3.
' N. de T. Na língua inglesa, isso faz sentido, pois o exem plo dado [lo holdly go where no man has gane before ) seria uni infinitivo
dividido, isto é. o advérbio está entre o lo e o verbo go. Já em to go holdly where no num has gone before o advérbio está depois do
verbo. Esse tipo de construção não existe na língua portuguesa.
Tabela 4.3 Número de infinitivos divididos utilizados por pesquisadores antes e depois da serie
Jornada nas Estrelas
Pesquisador Antes de Jornada nas Estrelas Depois de Jornada nas Estreii. ■
1
2
3
4
5
6
7
8
9
10
11
12
1. Este é um delineamento entre ou dentre participantes?

2. Que tipo de variável o professor Pedante mediu: categórica, discreta ou contínua?
3. (a) Qual é variável independente?
(b) Qual e' variável dependente?
4. Este é um teste unilateral ou bilateral?
5. Qual é a hipótese nula?
6. Insira os dados no SPSSPW e faça o seguinte para cada condição:
Diagrama dc barras para o erro
Média
Desvio padrão
Erro padrão
Intervalos de confiança de 95%
7. Converta o primeiro escore de cada condição em um escore padronizado (valor z).
QUESTÕES DE MÚLTIPLA ESCOLHA (a) Desprezível

(b) a
(c) P
1. Ura erro do Tipo II ocorre quando:
(d) Nenhuma das alternativas
(a) A hipótese nuia não é rejeitada quando de
veria ter sido 8. Se você obtém o valorp bilateral de 0.02, o v alo rp
(h) A hipótese nula é rejeitada quando deveria ter unilateral equivalente será:
sido (a) 0 ,0 1
(c) A hipótese nula é rejeitada quando nâo deve (b) 0.04
ria ter sido (c) 0,02
(d) A hipótese nula não é rejenada quando não (d) 0,40
deveria ter sido
9. Se prevemos que existe uma diferença entre as
2. Qual a base ou a lógica dos teste i estatísticos infe- condições A e B, fazemos:
renciais? (a) Uma previsão unilateral
(a) Determinar a probabilidade de se obter um (b) Uma previsão bilateral
efeito devido ao erro amostrai quando a hipó (c) Uma previsão nula
tese nula é verdadeira (d) Alternativas (b) e (c)
(b) Determinar a probabilidade de obter um efei
10. Se você obtém um a de 4%, o que isso significa?
to devido ao erro amostrai quando a hipótese
nula e' falsa (a) A probabilidade de que a hipótese nula seja
(c) Determinar a probabilidade de se cometer um verdadeira é 4%
erro do Tipo II (b) A probabilidade de que a hipótese nula seja
(d) Todas as alternativas falsa e 49f
(c) A probabilidade de se obter o efeito por erro
3. Se você obtém uni valor-p unilateral igual a 0,02, o amostrai se a hipótese nula for verdadeira é 4%
valor-p bilateral equivalente é: (d) Todas as alternativas
(a) 0 ,0 1
11. Se você prevê que não existe diferença entre as
(b) 0.04
condições A e B, qual é a hipótese nula?
(c) 0,02
(d) 0,40 (a) A condição A será maior do que a condição B
(bl A condição B será maior do que a condição A
4. Se você prevê que duas variáveis A e B estão rela (c) A condição A está relacionada à condição B
cionadas. qual é a hipótese nula? (d) Não existirá diferença entre as condições A e B
(a) Que existe relacionamento entre A e B
12. Se rejeitarmos a hipótese nula quando verdadeira:
(b) Que A será maior que B
(c) Que não existe diferença entre A e B (a) Cometeremos um erro do Tipo I
(d) Nenhuma das alternativas (b) Cometeremos um erro do Tipo II
(c) Realizaremos um progresso científico
5. O poder de um experimento é: (d) Alternativas (b) e (c)
(a) a
13. Quais das seguintes são hipóteses concernentes ao
(b) A habilidade de o pesquisador rejeitar a hipó
uso dos testes paramétricos?
tese nula quando é, de fato, falsa
(c) A sensibilidade dos participantes à manipula (a) Os dados devem estar norm alm ente distri
ção experimental buídos
(d) Todas as alternativas (b) As amostras testadas devem ler aproxim ada
mente as mesmas variâncias
6. Quando prevemos que a condição A é maior que a (c) Não devemos ter valores extremos
condição B. fazemos: (d) Todas as alternativas
(a) Uma previsão unilateral 14. Um erro do Tipo II significa:
(b) Uma previsão bilateral
(a) Que rejeitamos a hipótese nula quando ver
(c) Uma previsão unidirecional
dadeira
(d) Alternativas (a) e (c)
(b) Que aceitamos a hipótese experimental quan
7. A probabilidade de que um efeito surja devido do falsa
ao erro am ostrai caso a hipótese nula seja verda (c) Que aceitamos a hipótese nula quando falsa
deira é: (d) Nenhuma das alternativas
15. Unia pesquisadora conduziu um estudo sobre tem (c) É mais tácil se obterem resultados significati
pos de reação com 20 participantes em cada uma vos com esse a
das duas condições. Ela constatou que a variân (d) Alternativas (a) e (b)
cia da primeira condição é de 2 segundos, e a da
18. Quando convertemos nossos dados em um valor
segunda, de 14 segundos. Qual das seguintes afir
de uma distribuição de probabilidade, como é de
mações é verdadeira?
nominado o resultado obtido?
(a) Ela não deve utilizar um teste paramétrico
(a) Significativo
porque a condição da homogeneidade das va
(b) Não-significativo
riâncias não está satisfeita
(c) Estatística teste
(b) Ela satisfez todos os requisitos para o uso de
(d) Poder do estudo
um teste paramétrico
(c) Ela não tem homogeneidade de variâncias, 19. Imagine que conduzimos dois estudos. No estudo A.
mas ainda assim pode utilizar um teste pa temos 1000 participantes e obtemos um valor p de
ramétrico, pois possui amostras do mesmo 0,01, enquanto no estudo B temos apenas 20 partici
tamanho pantes e um valor p de 0,05. Em qual desses estudos
íd) Nenhuma das alternativas existe o maior efeito?
(a) Estudo A
¡6. Como representamos o poder de um teste?
(b) Estudo B
(a) a te) O efeito é o mesmo nos dois estudos
(b) p (d) Não podemos responder a questão com base
(c) I - a nas informações dadas
id) l - p
20. Se você constata em um estudo que o valor p e
Porque normalmente utilizamos uma significância 0,05, qual é a probabilidade de que a hipótese al
de 0.05? ternativa seja verdadeira?
(a) É um nível tradicional utilizado pela maioria (a) 0,05
dos psicólogos (b) I menos 0,05
(b) Esse valor representa um bom balanceamento (c) Não podemos determinar a probabilidade de
entre a possibilidade de se cometerem erros que a hipótese alternativa seja verdadeira
dos Tipos I e II (d) Nenhuma das alternativas
Referências
BAKER, R. et a). Emotional processing and panic. Behaviour Research and Therapy v. 42, n. 11. p.
1271-87, November 2004.
CLARK-CARTER, D. Effect size: the missing piece o f the jigsaw. The Psychologist, v. 16, p. 636-38.
2003.
DRACUP, C. Hypothesis testing - what it really is. The Psychologist, v. 8, p. 359-62, 1995.
HOWELL, D. C. Statistical Methods for Psychology. 5“ ed. W adsworth, 2002,
LOFTUS, G. R. On the tyranny of hypothesis testing in the social sciences. Contemporary
Psychology, v. 36, n. 2, p. 102-05. 1991.
LOFTUS, G. R. Psychology will be a much better science when we change the way we analyze data.
Current Directions in Psychological Science, v. 5, p. 161-71, 1996.
MOGG. K., MATHEWS, A., WEINMAN, J. M emory bias in clinical anxiety. Journal o f Abnormal
Psychology, v. 96, p. 94-8, 1987.
PARKINSON, B. Anger on and off the road. British Journal o f Psychology, v. 92. p. 507-26, 2001.
REIDY, J., RICHARDS, A. A memory bias for threat in high-trait anxiety. Personality and Individual
Differences, v. 23, p. 653-63, 1997.
RICHARDS, A., FRENCH, C. C. Effects of encoding and anxiety on implicit and explicit memory
performance. Personality and Individual Differences, v. 12. p. 131-09. 1991.
WALSH, J. J., UGUMBA-AGW UNOBI, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences, v. 33. p
239-51,2002.
Análise de Correlação:
5 o rde Pearson
Nos p rim e iro s q u a tro c a p ítu lo s, a p re s e n ta m o s a e stru tu ra básica n ecessária p ara e n te n d e r as

a n á lise s e sta tístic a s c o n tid a s no re sta n te do livro. É im p o rta n te q u e vo cê te n h a e n te n d id o tod os
os c o n c e ito s a p re se n ta d o s nos ca p ítu lo s a n te rio re s. Para ve rifica r seu c o n h e c im e n to , v o c ê pode
reso lve r as a tiv id a d e s e q u e stõ e s d e m ú ltip la e sco lh a p re se n te s no fin a l de cad a c a p ítu lo . Se a ch ar
q u e existe alg o q u e a in d a não e n te n d e u , v a le a p e n a vo lta r ao c a p ítu lo em q u e stã o e te r certeza
d e q u e c o m p re e n d e u o c o n c e ito c o m p le ta m e n te . U rna vez c o n fia n te d e q u e d o m in a to d o s os
co n c e ito s, e stará p ro n to para lid a r co m as a n á lise s e sta tístic a s m ais e xig e n te s a p re s e n ta d a s de
a g o ra em d ia n te . Ter re a lm e n te e n te n d id o o s c o n c e ito s a n te rio re s fa c ilita rá seu p e rcu rso peio
re sta n te do livro . Nos p rim e iro s q u a tro c a p ítu lo s, vo cê foi a p re se n ta d o à idéia d e o b se rva r as
relaçõ es e n tre va riá ve is, c o m o , por e xe m p lo , e n tre h o ras d e e stu d o e d e se m p e n h o em e xa m e s
O s p sicó lo g o s m u ita s ve ze s p ro c u ra m sa b e r se e xiste um re la c io n a m e n to sig n ifica tiv o ou um a
asso c ia ç ã o e n tre d u a s va riá ve is. Esse é o a s su n to do p re se n te c a p ítu lo .
V o cê p recisará te r um e n te n d im e n to do se g u in te :
h ip ó teses uni e b icau d al (C a p ítu lo 4 )

sig n ifica n cia e sta tístic a (C a p ítu lo 4)
in te rv alo s d e c o n fia n ç a (C a p ítu lo 3)
N este c a p ítu lo , d iscu tire m o s m a n e ira s p e las q u a is p o d em o s a n a lisa r relacionamentos ou a s

sociações e n tre v a riá v e is. No c a p ítu lo an te rio r, fa la m o s so b re o re la c io n a m e n to e n tre te m p o de
e stu d o e d e se m p e n h o em e xa m e s. Para d e sc o b rirm o s se tal re la c io n a m e n to existe, to m a m c s
um n ú m e ro de a lu n o s e re g istra m o s q u a n ta s h o ras por u n id a d e de te m p o (p . e x ., por se m an a
eles p assam e s tu d a n d o e d e p o is m e d im o s seu d e se m p e n h o no s e xa m e s. T iv e m o s, e n tã o , d o i;
c o n ju n to s de d a d o s (ou d u as v a riá ve is). A n á lise s de c o rre la ç ã o nos d ã o u m a m ed id a d a re laçãc
e n tre eles. No C a p ítu lo 4 , su g e rim o s q u e so m o s c a p a ze s d e c a lc u la r a m ed id a da fo rça desse
re la c io n a m e n to : a a n á lise d e c o rre la ç ã o no s dá ta l m ed id a.
N este c a p ítu lo , d iscu tire m o s o se g u in te :
■ a n á lise e relato d e e stu d o s u sa n d o a n á lise d e c o rre la ç ã o

■ r - u m ta m a n h o do efeito n atu ral
> lim ite s d e c o n fia n ç a em to rn o d e r
5.1 Correlações bívariadas
Denominamos o relacionamento entre duas variáveis de correlação bivaríada. Se as dua>

variáveis são associadas, dizemos que são correlacionadas (correlacionadas). Isso significa
que co-variam: quando os valores em uma variável mudam, valores na outra variável também
mudam, de maneira previsível. Em outras palavras, as duas variáveis não são independentes.
: 1.1 Obtenção de conclusões a partir da análise de correlação

Um relacionamento correlacionai não pode ser considerado como se sugerisse causalida
de. Lembre-se de que, no Capítulo 1, informamos que você não pode sugerir causalidade com
correlações. Se uma associação significante existe entre duas variáveis, não quer dizer que .v
cause y ou, alternadamente, que y cause x. Considere o seguinte exempJo. Já se demonstrou
que existe um relacionamento positivo significante entre os salários de pastores presbiteria
nos em Massachusetts e o preço de rum em Havana. Nesse caso, é obviamente inapropriado
argumentar que uma variável causa a outra. Como Huff f 1973), que providenciou esse exem
plo, observou, não é necessário inferir causalidade, pois a explicação mais óbvia é que ambas
as figuras estejam crescendo devido a um terceiro fator - o aumento mundial nos preços de
praticamente tudo!
Portanto, às vezes duas variáveis são relacionadas estatisticamente, mas não existe uma
real associação entre elas. Os resultados significantes refletem a influência de uma terceira
variável.
E também possível produzir uma correlação significativa completamente espúria entre
duas variáveis na ausência de uma terceira que influencie as outras duas. Por exemplo, em
uma ocasião pedimos aos nossos alunos que fizessem uma análise de correlação de algumas
variáveis. Quando fazemos isso no computador, é muito fácil cometer o erro de incluir variá
veis que não são relevantes. Um de nossos alunos incluiu "número de participantes” com as
outras variáveis, erroneamente. Mostrou-nos que "número de participantes" tinha uma alta
correlação positiva com auto-estima, uma das variáveis. E importante, portanto, ter em mente
a possibilidade de que um relacionamento demonstrado por uma análise de correlação pode
ser espúrio.
O exame de relacionamentos entre variáveis pode incluir os seguintes passos:
1. Inspeção dos diagramas de dispersão (ver a seguir).
2. Teste estatístico chamado r de Pearson, que nos mostra a magnitude e o grau de
relacionamento e a probabilidade de tal relacionamento ocorrer devido ao erro
amostrai, dado que a hipótese nula seja verdadeira.
3. Limites de confiança em torno do teste estatístico r, quando apropriado.
5,1.2 Objetivos da análise de correlação

O propósito, portanto, de se fazer uma análise de correlação é descobrir se existe um
relacionamento entre as variáveis, que é improvável de acontecer devido ao erro amostrai
(considerando a hipótese nula verdadeira). A hipótese nula é de que não existe relaciona
mento real entre as duas variáveis. Entretanto, essa não é a única informação que a análise de
correlação oferece. Ela também nos permite determinar:
■ A direção do relacionamento - se é positivo, negativo ou zero.
■ A força ou magnitude do relacionamento entre as duas variáveis - o teste estatístico,
chamado de coeficiente de correlação, varia de 0 (nenhuma relação entre as variá
veis) a 1 (relação perfeita entre as variáveis).
Esses dois pontos são discutidos em mais detalhes a seguir.
180 Christíne P. Dancey & John Reldy
5.1.3 Direção do relacionamento

Positivo
Valores altos em uma variável (que chamamos de .v) tendem a ser associados com valores
altos na outra variável (que chamamos de y). Ao contrario, valores baixos na variável x ten
dem a ser associados com valores baixos na variável y.
Negativo
Valores altos em uma variável são associados com valores baixos na outra variável.
Zero
Relacionamentos zero são aqueles nos quais não existe um relacionamento linear (linha
reta) entre as duas variáveis (o que queremos dizer com o termo relacionamento linear” será
explicado mais tarde. Agora, vamos supor que a ausência de um relacionamento linear signi
fica a ausência de relacionamento entre as duas variáveis).
Agora pense na direção dos relacionamentos dos exemplos mencionados.
Número de horas de estudo e desempenho em exames

Era de se esperar que o número de horas de estudo tivesse uin relacionamento positivo
com desempenho em exames - quanto mais tempo um aluno passa estudando, melhor o de
sempenho.
Idade de motorista e acidentes de carro

A idade do motorista é associada a acidentes de carro, mas dessa vez o relacionamento é
negativo. Lawon c colaboradores (1997) descobriu que ambos o sexo e a idade do motorista
estavam correlacionados com a taxa de acidentes, tendo jovens do sexo masculino maior
probabilidade de sofrer um acidente.
5.1.4 Relacionamentos positivos perfeitos
Já se mencionou que, em relacionamentos positivos, valores altos numa variável são as
sociados a valores altos na outra, e vice-versa. Podemos observar esse relacionamento ao
plotarmos os valores em um gráfico chamado diagrama de dispersão (scattcrplot). Quando
executamos uma correlação bivariada, temos dois conjuntos de valores (escores). Quando
plotamos os valores em um diagrama de dispersão, designamos uma variável ao eixo horizon
tal - esse é chamado de x. Designamos a outra variável ao eixo vertical - chamado de v. Não
importa qual variável designamos ao x e qual ao y.
Para construir um diagrama de dispersão, tomamos o valor de cada pessoa nos eixos x e
y e os plotamos para onde os dois se encontram. Cada ponto representa dois valores (.* e v).
Você foi apresentado à construção de diagramas de dispersão (usando o SPSSPW) na Seção
5 do Capítulo 2, mas aqui vamos considerar mais detalhes.
Um relacionamento positivo perfeito é demonstrado no diagrama de dispersão da Figura

5 .1. É aquele no qual todos os pontos do diagrama encontram-se em linha reta. For exemplo,
pense na sua idade plotada contra a idade da sua irmã (é claro que esse não é um exemplo
realista. Ninguém iria realmente querer correlacionar a sua idade com a da irmã - é somente
um exemplo). No exemplo a seguir, consideramos que sua irmã é quatro anos mais velha do
que você. Designamos a idade da sua irmã ao eixo vertical (y) e sua idade ao eixo horizontal
( a ) e para cada par de idades colocamos um ponto no diagrama de dispersão. Deve ser óbvio
que o relacionamento é positivo: quando você envelhece, sua irmã também envelhece. O re
lacionamento também deve ser perfeito: para cada ano que você envelhece, sua irmã também
envelhece um ano.
E importante entender que o exemplo mostra que você não pode inferir causalidade quan
do executa a correlação. O aumento da sua idade não causa o aumento da idade de sua irma,
nem o envelhecimento dela. causa o seu!
Valor d e x = 12,
Valor de y = 16
(dois valores, mas
somente um ponto)
o
x>
Q uan do você
tinha 12 anos, sua
irmã tinha 16
Sua idade
Figura 5.1 Sua idade e da sua irmã.
5.1.5 Relacionamentos positivos imperfeitos

Vamos imaginar que temos um número de alunos, os quais avaliamos em testes de QI e
notas percentuais em um exame. Queremos determinar se existe um relacionamento entre QI
e notas em exames. Isso não significa que o QI causa as notas nos exames dos alunos, nem
que as notas nos exames afetam os Qls de alguma maneira. Um QI alto ou baixo e notas altas
ou baixas poderiam ter sido causadas por vários fatores - cursos preparatórios, prática em
testes de QI e motivação são alguns.
Decidimos designar os valores de QI ao eixo vertical (y) e as notas dos exames ao eixo hori
zontal (a ). Cada aluno tem dois escores, um de QI e uma nota de exame. Entretanto, cada aluno
contribui com somente um ponto no diagrama de dispersão, como é possível ver na Figura 5.2.
O diagrama nos mostra que Q!s altos tendem a ser associados com notas altas em exames,
e Qls baixos, a notas baixas. Nesse caso a correlação não é perfeita. Entretanto, a tendência
está presente, e isso é o que importa. Embora os pontos não eslejam em linha reta, ainda é um
relacionamento lineai' positivo, pois formam um padrão visível, do canto inferior da esquerda
ao canto superior da direita.
140 -i
130 -
120
O
110
100 -
90 ■
10 20 30 40 50
Notas na prova
D ia g ra m a de d isp ersã o do Ql e n o tas em u m a a p ro v a .

Figura 5.2
------
Atividade 5.1
Tente p e n sa r em a lg u n s re la c io n a m e n to s p o sitivo s b iva riad o s. O s se u s e xe m p lo s tê m a

p ro b a b ilid a d e d e serem p o sitivo s? D iscu ta se u s exe m p lo s co m o u tro s. V o cê c o n c o rd a q u e seus
exe m p lo s se jam b o n s?
5.1.6 Relacionamentos negativos perfeitos
Novamente, devido ao fato de configurarem um relacionamento perfeito, os pontos no

diagrama de dispersão formam uma linha reta. Cada vez que .v aumenta, y diminui um deter
minado vaior de forma constante.
10-1
2 -
0 I I I I I |-------1-------1-------1------- r~
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Dinheiro (R$)
G rá fic o do re la c io n a m e n to e n tre b a rra s de c h o c o la te na m á q u in a e a q u a n tia de

Figura 5.3
d in h e iro d e p o sita d a nela
Imagine uma máquina de vendas de chocolate, no qual cada barra de chocolate custa
50 centavos de libra. No início do dia, um representante coloca dez barras de chocolate na
máquina. Levando em consideração que ela funciona como deveria (quer dizer, nenhum cho
colate fica preso, a máquina aceita o dinheiro, devolve o troco correto, etc.: bem. talvez seja
pouco realista, mas vamos acreditar), cuda vez que alguém coloca 50 centavos de libra, a
barra de chocolate é ejetada, e uma a menos fica na máquina.
Como se pode ver, com um relacionamento linear negativo perfeito, os pontos ainda for
mam uma linha reta, mas dessa vez vão do canto superior esquerdo ao canto inferior direito.
5.1.7 Relacionamentos negativos imperfeitos

Com um relacionamento linear negativo imperfeito, os pontos não compõem uma linha
reta, mas ainda formam um padrão visível, do canto superior esquerdo em direção ao canto
inferior direito. Digamos que tivéssemos coletado dados de presença aos jogos de críquete
e ocorrência de chuva. O diagrama de dispersão resultante pode parecer algo como o da
Figura 5.4.
Geralmente a tendência é que a presença em jogos de críquete seja menor quando chove
mais.
40 -|
-C
J.
fU
XJ”
c
<D
£ 20-
Q_
10 H----------- 1----------- 1----------- 1----------- 1----------- 1----------- 1----------- 1

0 2 4 6 8 10 1? 14
Precipitação (cm por mês)
D ia g ra m a d e d isp e rsã o d e p resen ça em jo g o s de c ríq u e te e p re c ip ita çã o .
5.1.8 Relacionamentos não-lineares

Note que. se um relacionamento não é significativo estatisticamente, pode não ser apro
priado inferir que não existe relacionamento entre as duas variáveis. Isso se deve ao fato de.
como mencionado anteriormente, a análise de correlação testar para ver se existe um relacio
namento linear.
Alguns relacionamentos não são lineares. Um exemplo de tal relacionamento é aquele en
tre excitação e desempenho. Embora antecipássemos que certo nível de excitação melhoraria
o desempenho esportivo, excesso de excitação poderia levar a um detrimento do desempenho.
Tal relacionamento é descrito pela Lei de Yerkes-Dodson (Yerkes e Dodson. 1908). Essa lei
prevê um relacionamento curvilíneo invertido entre excitação e desempenho. Com baixos

níveis de excitação, o desempenho (p. ex., desempenho atlético) é menor do que quando o
nível de excitação está um pouco mais alto. Existe um nível de excitação '‘ótimo", no qual o
desempenho é o mais alto. Além desse nível, a excitação, na verdade, diminui o desempenho.
Isso pode ser representado como mostra a Figura 5.5.
O mesmo relacionamento pode ser representado pelo diagrama de dispersão da Figura
5.6. que mostra um relacionamento curvilíneo, no qual x aumenta com y até certo ponto e
então diminui. O que queremos mostrar é que, sem dúvida, existe um relacionamento entre
x e y, mas o coeficiente de correlação não é significativo estatisticamente, pois não há um
relacionamento linear (linha reta). Por esse motivo, você deve sempre verificar o diagrama
de dispersão antes de realizar sua análise, para ter certeza de que as variáveis não são rela
cionadas dessa maneira, pois, se o forem, não faz sentido utilizar as técnicas descritas neste
capítulo.
Nível de excitaçao
H ip ó tese do U in ve rtid o (Lei de Y e rk es-D o d so n , 1 9 0 8 ).

Figura 5.5
14 -
12 -
10 -
y 8-
6 -
4 -
2
0 10 12
Figura 5.6 D ia g ra m a de d isp e rsã o de um re la c io n a m e n to c u rvilín e o e n tre x e y .

Atividade 5.2
60 000 -|
50 000 -
-T
O 40 000 -
=3
o 30 000 -
^ 20 000 -
10 000 -
0 i i i i
0 10 000 20 000 30 000 40 000
Salário inicial
Q ual é a c o n c lu sã o m ais se n sa ta ?
A c o rre la ç ã o e n tre sa lá rio inicial e sa lá rio atu al é:
(a) N egativa
(b ) Positiva
(c) Zero
5 1.9 Força ou magnitude do relacionamento

O grau de um relacionamento linear entre duas variáveis e' medido por uma estatística
chamada coeficiente de correlação, também conhecido como r, que varia entro 0 e -1 e de
0 a 1. De fato, existem vários tipos de coeficientes de correlação: os mais utilizados são o
r de Pearson (em nome de Karl Pearson que criou o teste) e o p de Spearman (rj e o V de
Cramer são os dois mencionados apenas de passagem). O nome completo do r de Pearson é
coeficiente dc correlação momento-produto; é um teste paramétrico e será apresentado nesse
capítulo. Você deve se lembrar da página 155 do Capítulo 4, na qual se explicou que, para se
usar um tesle paramétrico, temos de satisfazer cenas suposições. A suposição mais impor
tante é a de que os dados são provenientes de uma população normalmente distribuída. Se
você tem um grande número de participantes, essa suposição será provavelmente satisfeita.
Se você tem motivos para crer que esse não é o caso, deve usar o equivalente não-paramétri-
co do r de Pearson, chamado de p de Spearman (ver Capítulo 15).
Na Figura 5.1, o relacionamento é representado por +1: sinal de mais porque o relaciona
mento é positivo e 1 porque o relacionamento é perfeito. Na Figura 5.3, o relacionamento é
1: menos, pois o relacionamento é negativo, e 1, pois o relacionamento é perfeito.
Lembre-se: +1 = relacionamento positivo perfeito
-1 = relacionamento negativo perfeito
O diagrama na Figura 5.7 mostra os vários graus dos coeficientes de correlação.
Perfeito +1 -1
.-0,9 - 0,9
Forte +0,8 ■0,8
+0,7 0,7
+0,6 -0 ,6
M oderado +0,5 -0 ,5
+0,4 -0 ,4
■:0,3 -0,3
Fraco +0,2 - 0 ,2
+0,1 -0,1
Zero 0
In te n sid a d e do re la c io n a m e n to d e c o e ficie n te s d e c o rre la ç ã o p o sitivo s e n eg ativo s.
O d iagram a da F igura 5 .7 dá a id é ia de q u e - l é tão forte q u a n to + 1 . S ó p orq u e o rela

c io n a m e n to é n e g a tiv o n ã o sig n ific a q u e seja m e n o s im p ortan te ou m e n o s forte d o q u e um
r e la c io n a m e n to p o s itiv o . C o m o já d ito a n te r io r m en te, um r e la c io n a m e n to p o s itiv o s im p le s
m e n te sig n ific a q u e a lto s v a lo r e s de x te n d e m a se rela cio n a r c o m a lto s v a lo r e s de v, e b a ix o s
v a lo res d e x te n d e m a se r ela cio n a r c o m b a ix o s v a lo re s de v. Já e m u m r e la c io n a m e n to n e g a
tivo, altos v a lo re s de x te n d e m a se r ela cio n a r c o m b a ix o s v a lo res d e v.
P o d e -s e ob servar q u e d e sig n a m o s ró tu lo s v erb ais a n ú m ero s - sã o so m e n te g u ia s. U m a
c o rrela çã o de 0 ,9 é forte. O b v ia m en te, q u anto m ais p róxim o a 1 (+ ou -) está um c o e fic ie n te
de c o rr ela ç ã o , m a is forte é o r e la cio n a m e n to . Q u an to m ais p r ó x im o a 0 (q u e s ig n ific a a au
sê n c ia d e r ela c io n a m e n to ), m a is fraca é a co rrela çã o . C o r re la çõ e s de 0 ,4 a 0 ,5 s ã o m oderadas.
O c o e fic ie n te de co rr ela ç ã o m e d e a p ro x im id a d e d o s p o n to s.
Atividade 5.3
U m c o e fic ie n te de c o rre la ç ã o de + 0 ,2 é co n sid e ra d o :
(a) Z ero (b) Fraco (c) M o d e ra d o (d) Forte
O s d ia g ra m a s d e d isp er sã o das F igu ras 5 .8 e 5 .9 d ã o um a id é ia d o sig n ific a d o d o c o e f i

c ie n te d e co rrela çã o . A F igu ra 5 .8 m ostra qu e e x is te u m a a ss o c ia ç ã o p o sitiv a m od erad a entre
idad e e c o n h e c im e n to s g erais.
2 0 -i
10 ■
10 20 30 40 50 60 70
Idade
Figura 5.8 D ia g ra m a de d isp ersã o da c o rre la ç ã o e n tre id a d e e c o n h e c im e n to s g e ra is n u m a a m o stra

d e e stu d a n te s (n = 1 4 3 ; r = 0 ,4 4 ).
10
30 40 50 60 70 80 90
Necessidade de cognição
D iag ra m a de d isp ersã o da c o rre la ç ã o e n tre n e ce ssid a d e de c o g n iç ã o e im p e d im e n to

Figura 5.9
co g n itivo (n = 1 4 3 ; r = - 0 ,2 1 ) .
Existe uma variação entre o quanto as pessoas gostam de raciocinar e resolver problemas.
Psicólogos criaram uma escala para medir esse constructo, que é chamado de necessidade de
cognição (Cacioppo e Petty. 1982). As pessoas que gostam de resolver problemas terão uma
necessidade de cognição mais alta do que aquelas que não gostam. Além do mais. algumas pes
soas evitam atividades de resolução de problemas, demonstrando um impedimento cognitivo.
A correlação entre necessidade de cognição e impedimento cognitivo em uma amostra de
estudantes demonstra que existe uma associação negativa fraca entre ambos (ver Figura 5.9).
Se a correlação é zero, os pontos podem parecer aleatórios, e não existe um padrão dis-
cernível. Portanto, não há um relacionamento entre x e y.
A Figura 5.10 mostra que não existe uma associação entre reavaliação positiva e neces
sidade de cognição.
Dados correlacionando (n = 11, r - +0,68) faltar a escola e ser caçoado por outros são
apresentados na Figura 5.11. Existe um relacionamento positivo moderado entre faltar a es
cola e ser caçoado.
Existe uma associação positiva forte entre ser caçoado e sentir-se diferente dos outro"-
(/? — 11; r - +0,85) (ver Figura 5.12).
10 -
o-
10 “1------------ 1------------ 1------------ 1------------ 1------------ 1------------ 1

30 40 50 60 70 80 90
N ecessidade de cognição
R e la c io n a m e n to ze ro e n tre re a va lia ç ã o positiva e n e ce ssid a d e d e c o g n iç ã o em um a

Figura S.10
a m o stra d e e stu d a n te s (n = 1 4 3 ; r = - 0 ,0 1 ).
12 -i
11 -
10 -
ro
O 9 -
u
Q)
rc. 8 -
m
fU /-
6-
5-
------------ f rN
Kj-
Ser oacoado
Figura 5.11 C o rrelação e n tre ser caço ad o por o u tro s e fa lta r a escola (n = 1 1 ; r = + 0 ,8 5 ),
10 -
a;
c
<u
JD 8 -
t5
a>
<v
IS )
4 -
10 12
Caço ado
Figura 5.12 C o rre la ç ã o e n tre se r c a ç o a d o e se n tir-se d ife re n te d o s o u tro s ( n = 1 1 ; r = + 0 ,8 5 ) .

bstatística sem Matemática para Psicologia 189
Atividade 5.4
O b serve os se g u in te s d ia g ra m a s de d isp e rsã o . A p e n a s e xa m in a n d o os d ia g ra m a s, p ense

se c o n se g u e d ize r:
(a) A d ire ç ã o do re la c io n a m e n to (p o sitivo , n eg ativo ou zero )

(b) A m a g n itu d e do re la c io n a m e n to (p e rfe ito , fo rte , fra co ou ze ro )
À s ve ze s é difícil sa b e r - é aq u i q u e um te ste e statístico co m o o r de Pearson se to rn a útil!
(a) 8 0 -|
70 -
60 -
O 50-
ro
f 40 '
LU
30 -
20 -
10 -|-------------------------------- 1-------------------------------- T-----------------T--------------------------------T-------------------------------------1

20 30 40 50 60 70
IBS-M S1 total
(b) 60
50 -
40
30
20 -
1 o H----- 1-------------------1-------------------1-------------------1------------------ 1-------------------1

10 20 30 40 50 60 70
TR-Ig no rado
B n-MS ( Irritable Bou el Symiróme - Misconcepiion Scale). Escala de concepções errôneas sobre a síndrom e do intestino irritável.
Pense nessa questão. Ir a igreja faz com que você não fique grávida?
Cerca de 118.000 adolescentes engravidam p o r ano. e metade de todos os pais solteiros tem
menos que 25 anos. O Reino Unido tem a taxa de divórcio mais alta da Europa e o m aior número
de adolescentes grávidas, embora a taxa de g r a v i d e na adolescência em outros países esteja
crescendo rapidamente. O único motivo detectado peta estatística está relacionado à igreja. A
freqüência com que as pessoas vão à igreja começou a diminuir no Reino Unido antes dos outros
países. Em todo os lugares onde a freqüência ci igreja diminui, aumenta a quantidade de divórcios
e pais solteims. (Polly Toynb.ee. Radio Time. 20-26 de março de 1993)
Vamos dar novamente uma olhada em um relacionamento perfeito (Figura 5.13).
Escore da
Sharm ini
120
100
80 -
60
40
20 -
10 20 30
Teste 1
R e la c io n a m e n to lin e a r p e rfeito .
Figura 5.13
Imagine que essa figura representa o relacionamento perfeito entre os escores em dois
testes. Teste 1 e Teste 2. O fato de essa ser uma correlação perfeita significa que a posição
relativa dos participantes é exatamente a mesma para cada teste. Quer dizer, se Sharmini tem
o melhor escore no Teste 1 (no exemplo acima é 23), também terá o melhor escore no Teste
2 (130). O contrário também é verdade: o participante com o menor escore no Teste 1 terá o
menor escore no Teste 2.
Como dito anteriormente, relacionamentos perfeitos são raros, mas o mesmo raciocínio
se aplica aos relacionamentos imperfeitos. Para calcular o coeficiente de correlação, é neces
sário relacionar a posição relativa de cada participante em uma variável à sua posição relativa
na segunda variável.
EXEMPLO: TEMPERATURA E VENDA DE SORVETES
Vamos imaginar que fizemos uma análise correlacionai entre o número de sorvetes
de casquinha comprados em uma camionete estacionada cm frente a sua universidade e a
temperatura. Perguntamos ao vendedor, chamado Vendemuito, quantas casquinhas foram
vendidas em cada dia. Coletamos os dados durante um período de 20 dias. Agora precisa
mos saber se o número de sorvetes vendidos varia com a temperatura. Prevemos que, de
acordo com leitura prévia, a venda de sorvete aumentaria com o aumento da temperatura.
Essa é uma hipótese unilateral. Os dados são apresentados na Tabela 5.1.
Agora fica fácil ver como plotar um diagrama de dispersão à mão, embora possa ser
tedioso quando temos muitos escores. Naturalmente, o SPSSPW faz esse trabalho melhor
do que nós! Instruções de como obter diagramas de dispersão foram dadas na página 82
do Capítulo 2.
Podemos ver no diagrama da Figura 5.14 que a temperatura e o número de sorvetes de
casquinha vendidos estão relacionados. Obviamente, não é uma correlação perleita, mas
basta olhar os dados para vermos uma correlação posjtiva.
T a b e la 5.1 Dados dos números de sorvetes de casquinha vendidos em dias com d iferente.
temperaturas
Sorvetes vendidos Tem peratura Sorvetes vendidos Tem peratura
1000 26 550 14
950 600 19
870 700 21
890 20 750 22
886 19 800 22
900 21 850 24
560 17 950 22
550 16 1050 26
400 12 1000 26
500 13 J000 26
1100 -1
1000 -
O) 900 -
a;
> 800 -
o
a > 700 -
o
03
T5 600 -
c
> 500 -
400 -
300 -
10 12 14 16 18 20 22 24 26 28
Temperatura
D ia g ra m a de d isp e rsã o dos d a d o s d e v e n d a de so rve te d e c a sq u in h a

192 Christine P, Dancey & John Reidy
SPSSPW: correlações bivariadas - o rd e Pearson
Agora queremos saber o valor do coeficiente de correlação e a probabilidade associada,

portanto vamos ao SPSSPW. Nossos dados já foram colocados no SPSSFW, então agora sele
cionamos Analyze, Correlate, Bi varia te (Analisar, Correlacionar, Bivariação).
üfeí-lHxia
Fte i<3t View D Iiflntlvm Arvtfr* üuptv. UMoes HeC
:[ü n rss r
SPSS Pkw** m» n
É3lá -WÊ» 31! Vi»» i?''

gffPoQox^MaJ I Í^Yah«<M<i N | 'gM : -oftWonj | C'»ip | C^'*r2ic rç | t n-TOCdM-iJ. . •i
Aparece a seguinte caixa de diálogo.
¡JlHIal bí! I I I fclüH Ml -rir I r is ii .1 --UI

i <«cr*am I I*ito I
■*! Coloque as
variáveis de in
teresse da caixa
da esquerda
aqui
I £•• ■r.-JM-g iw .. I | [fc ic« c i» — t«v- SPSS

Mude ambas as variáveis do lado esquerdo para o lado direito. Tenha certeza de que as
opções Pearson e One-tailrd (unicaudal) foram selecionadas. Depois, clique em UK. Serão
obtidos os resultados.
Observemos a saída do SPS3PW. Os resultados importantes para os seus relatórios são
os seguintes:
■ O coeficiente de correlação (r) mostra o grau em que nossas variáveis se relacionam
umas com as outras e cm qual direção.
■ O nível de probabilidade associada fornece a probabilidade de nosso coeficiente de
correlação se dar por erro amostrai, desde que a hipótese nula seja considerada ver
dadeira.
Os resultados são apresentados em forma de uma matriz. A matriz é simplesmente um
conjunto de números disposta em fileiras e colunas. A matriz de correlação e um exemplo de
uma matriz quadrada simétrica. Você deve notar que cada variável está em perfeita correlação
com ela mesma (ou então algo está errado). Além disso, você deve notar que os resultados
aparecem duas vezes: cada metade da matriz c uma imagem dela mesma. Isso quer dizer que
você tem de olhar somente uma metade (na diagonal). O SPSSPW também fornece o número
de pares para cada variável. Você pode ver na saída a seguir que o ponto no qual a variável
“SORVETE” encontra a variável “TEMPERATURA” fornece as informações que precisa
mos. A primeira linha nos fornece o coeficiente de correlação - o padrão é fornecer esse
coeficiente correto até dois decimais. O nível de significância adquirido é dado na segunda
linha, e a terceira confirma quantos pares temos na análise. Lembre que, quando o SPSSPW
mostra uma fileira de zeros, mude o último zero para 1 e use o sinal < (p. ex. p < 0,001, n =
20). Observe que nosso coeficiente de correlação é positivo: quando a temperatura aumenta,
aumenta também a venda de sorvetes.
O co eficiente de co rrelação é dad o na célula na qual

"sorvete" en co ntra "tem p eratu ra", p. ex. r = + 0 ,8 9
Correlations (Correlações)
ice cream (sorvete) temp (ten/peratura)
Pearson Correlation
Ice cream (sorvete) 1 .0 0 0 ' .8931
(Correlação de Pearson)
Sig. (2-tailed)
f .0 0 0
(Sig. Bilateral)
N 20
20
Pearson Correlation
.8931 1.000
temp (temperatura) Sig. (2-tailed)

.000
(Sig. Bilateral)
N 20
________ .
Sig. = Significância
Esse é o nível d e sig nificância ating ido. Lem bre-se de, qu an d o o SPSSPW fornecer uma
fileira de zero s, m udar o últim o zero para "1 "e usar o sinal < (p. ex., p < 0,0 0 1)
Esses resultados indicam que as vendas de sorvete têm um forte relacionamento positivo
com a temperatura. Podemos relatar a análise da seguinte forma:
O relacionamento entre vendas de sorvete e temperatura ambiente é positivo e forte (/■= +0,89, p
< 0.001). Portanto, quando a temperatura auinema, aumenta também a venda de sorvetes.
Isso é tudo o que podemos explicar no momento, mas você verá, à medida que o capítulo
avançar, que há mais a ensinar sobre esse assunto.
Atividade 5.5
V eja a se g u in te saíd a do SP SS P W :
Motivation (Motivação) Hours (Horas) Age (Idade)

Motivation Pearson Correlation
(Motivação) (Correlação de Pearson) 1.000 .8801 -.0 1 1 0
Sig. (2-tailed)
.000 .811
Sig. (Bilateral)
N 474 474 474

Pearson Correlation
Hours (Horas) .8801 1.000 -.1 4 5 9
Sig. (2-tailed)
Siq. (Bilateral) .000 .001
N 474 474 474

Pearson Correlation
Age (idade) (Correlação de Pearson) - 0 .1 1 0 -.1 4 5 9 1.000
Sig. (2-tailed)
Sig. (Bilateral) .811 .001
N 474 474 474
Q ual é a a sso c ia ç ã o m ais fo rte ?
(a) H oras e m o tiva ç ã o

(b) Id ad e e m o tivação
(c) Id ad e e h o ras tra b a lh a d a s
5.1.10 Explicação da variância do coeficiente de correlação
O coeficiente de correlação (r) é uma proporção entre a covariancia (variância comparti

lhada pelas duas variáveis) e uma medida das variações separadas.
Agora você já deve ter uma boa idéia do que significa um coeficiente de correlação.
Por exemplo, se disséssemos que duas variáveis são associadas a 0.9. você provavelmente
poderia desenhar um diagrama de dispersão. Da mesma maneira, se pedíssemos para dese
nhar um diagrama de dispersão representando uma associação de 0,1, você provavelmente o
faria muito bem. Entretanto, existe outra maneira de visualizar o que o coeficiente significa:
uma maneira que será muito útil mais tarde, quando começarmos a trabalhar com análise de
regressão. Vamos tomar como exemplo o número de horas de sol e temperatura (exemplo de
Alt, 1990). Essas duas variáveis são associadas positivamente: quanto mais horas de sol, mais
alta a temperatura. Quando duas variáveis são correlacionadas, dizemos que compartilham
variância. Por exemplo, os seguintes círculos representam horas de sol e temperatura.
Desenhamos os círculos, representando sol e temperatura, como se fossem independentes,

mas eles não o são. pois compartilham variância. Quanta variância exatamente comparti
lham? A estatística teste, um coeficiente de correlação, fornecerá essa resposta. Explicamos
que o coeficiente de correlação vai de 0 a + l ou de 0 a - 1. Ao elevar ao quadrado o coefi
ciente de correlação, você verifica quanta variância, em termos percentuais, as duas variáveis
compartilham. Veja a Tabela 5.2.
Tabela 5.2 Tabela demonstrativa do relacionamento entre correlações e correlações ao quadrado
Correlação (/•) Correlação ao quadrado (r ) Variância
0.0 0.0 0.00

0.1 o.r 0.01 (19c)
0.2 0.2’ 0.04 (4%)
0.3 0.3’ 0.09 (99c)
0.4 0.4- 0,16(16%)
0.5 0.52 0,25 (257r)
0,6 0.6 0.36(36%)
0,7 0.7: 0,49 (49%)
0.8 0.8’ 0,64 (64%)
0.9 0.9: 0,81 (81%)
1,0 1.0: 1.0(100%)
Lembre que correlações negativas ao quadrado fornecem uma resposta positiva. Por exemplo.
-0,4 ao quadrado (-0,4 x -0,4) = 0,16. Portanto, 16% da variância foi explicada pela correlação
de - 0,4, da mesma maneira que seria se a correlação fosse +0.4. Se você tem uma correlação de
0,9, explicou 81% da variância. Um diagrama de Venn deixará isso mais claro. Se duas variáveis
tivessem uma correlação perfeita, não seriam independentes, e os dois círculos parax e v estariam
um em cima do outro, exatamente como se houvessem duas moedas empilhadas:
O
As duas variáveis teriam uma correlação de +1,00, e toda a variância nos escores de uma
variável seria explicada pela variância nos escores da outra variável. Por exemplo, podemos
supor que horas de sol e temperatura têm um escore de correlação de 0,9 (81%).' Os dois
círculos aparecem da seguinte forma:
ic exemplo é de Alt (1990).

Se 81% da variância é compartilhada entre as duas variáveis, sobram 19% da variância:

isso é o que conhecemos por variância exclusiva: 9.5% é exclusiva do sol, e 9,5% é exclusiva
da temperatura. Se a variância compartilhada é significantemente mais alta que as variâncias
exclusivas, o r terá um valor alto. Se as variâncias exclusivas forem significantemente mais
altas que a variância compartilhada, o valor de r será baixo.
medida de variância compartilhada

medida das variâncias exclusivas
A parte sombreada (81%) é a variância que compartilham. Em outras palavras, 81%- da

variabilidade no número de horas de sol pode ser explicado pela variabilidade na temperatura.
Da mesma forma, 81% da variabilidade na temperatura pode ser explicada pela variabilidade
no número de horas de sol: 19% não é explicado, quer dizer, a variância nos escores deve-se
a outros fatores também.
Atividade 5.6
Observe o diagrama de dispersão abaixo:
7 -i
6 -
I
? 5
4 -
3-
2 —i—
2,5 3,0 3,5 4,0 4,5 5,0
SATIG
Qual é a conclusão mais sensata? As duas variáveis mostram uma:

(d) Correlação positiva moderada
(b) Correlação negativa moderada
(c) Correlação negativa forte
(d) Correlação zero
Vamos tomar como exemplo o caso de ocorrência de chuva e presença em jogos de

críquete. Esperaríamos um relacionamento negativo: quanto mais chuva, menos pessoas pre
sentes. Vamos supor que o relacionamento é -0,3. Isso significa que 9% (- 0.3 x -0,3 = +0,09
da variância foi explicada (ver Figura 5 .15).
Como outro exemplo (ver Figura 5.10), vamos supor que medimos e pesamos uma
turma de crianças e que a altura e o peso têm uma correlação de 0,7. Quanto da variância
foi explicada? Multiplicamos 0,7 por 0.7 = 0.49 (49%): isso significa que praticamen-
D ia g ra m a ilu stra n d o a q u a n tia d e va riâ n c ia c o m p a rtilh a d a e n tre d u a s variáve is.

Figura 5.15
Os valores
O u tra ilu stra çã o d e va riâ n c ia c o m p a rtilh a d a .
te metade da variância nos escores de altura pode ser explicada pela variância em peso.
Contrariamente, quase metade da variância em peso pode ser explicada em referência à
variância em altura.
E claro que isso também significa que 51% da variância não é explicada, quer dizer,
51% é explicada por outros fatores, como idade, genética ou elementos do ambiente. O
coeficiente de correlação pode sempre ser elevado ao quadrado para se obter a variância
explicada (r ao quadrado). Da mesma maneira, se você sabe o r , pode usar o botão da raiz
quadrada na sua calculadora ¡>ara obter o coeficientc de correlação, o r (embora isso não lhe
diga a direção do relacionamento). Você deve entender, então, que a correlação de 0,4 não
é duas vezes mais forte que a correlação de 0,2. A correlação de 0,4 significa que 16% da
variância foi explicada, enquanto a de 0,2 significa que somente 4% foi explicada. Portanto,
a correlação de 0,4 é, na verdade, quatro vezes mais forte que a correlação de 0,2. Um co
eficiente de correlação é uma boa medida do tamanho do efeito e pode sempre ser elevado
ao quadrado para ver quanto da variância dos escores numa variável pode ser explicada em
referência a outra variável.
Atividade 5.7
Q u a n d o vo cê e stu d a o grau d e sig n ifica n cia d e um c o e ficie n te d e c o rre la ç ã o , é im p o rta n te

p restar a te n ç ã o :
(a) A o nivel d e sig n ificá n cia

(b) A o v a lo r do c o e fic ie n te d e co rre la çã o
(c) A m b a s (a) e (b)
(d) N em (a) nem (b)
Existe uma correlação (talvez fictícia!) entre a quantidade de sorvete ingerido e o sentimen
to de grande felicidade (+0,85). Quanto da variação nos escores da felicidade pode ser explicado
pela quantidade de sorvete ingerido? Quanto da variação permanece sem explicação?
5.1.11 Significancia estatística e importância psicológica

No passado, algumas pessoas estavam mais preocupadas com a “significáncia” do que
com o tamanho da correlação ou a quantia de variância explicada. Às vezes as pessoas afirma
vam que tinham uma correlação altamente significativa: lembravam o valor probabilistico (p.
ex.. 0,005), mas esqueciam o tamanho da correlação. O valor da probabilidade significa muito
pouco se r não é relatado. O coeficiente de correlação indica o nível de relacionamento das va
riáveis, e o valor probabilistico é a probabilidade de aquele valor ocorrer por erro amostrai.
Portanto, quando reportar seus estudos, relate o coeficiente de correlação e pense se o r
é significativo para seu estudo, assim como o valor probabilistico. Não use somente o valor
probabilistico. Lembre-se: significancia estatística não equivale necessariamente à signifi
cancia psicológica (ver Capítulos 4 e 7 para mais informações).
Í \ T 1 EXEMPLO: REVISITANDO SORVETES E TEMPERATURA

* 1 ----------------------------------------------------------------------
Agora que você já sabe sobre variância explicada, podemos ajustar a parte textual de
seus resultados para incluí-la. A análise pode ser a seguinte:
A venda de sorvete de casquinha estava fortem ente associada à temperatura: quando a
temperatura aumenta, aumenta também a venda de sorvetes. O r de 0,89 mostrou que 79% da
variância em vendas de sorvete se explicava pela variância na temperatura. O nível de probabi
lidade associado de 0.001 mostrou que é improvável que o resultado tenha ocorrido por erro na
amostra, considerando a hipótese nula com o verdadeira.
Atividade 5.8
O b serve o se g u in te d ia q ra m a de d isp e rsã o :
1,6 -
cü
< 14-
^< i1,2-> -I-
1,0 -
0,8
3,5 4,0 4,5 5,0 5,5 6,0 6,5
AGREEAB
Ele d e m o n stra q u e as variáveis in d icam u m a:
(a) A sso c ia ç ã o n eg ativa fo rte

(b) A sso c ia ç ã o po sitiva m o d erad a
(c) A s so c ia ç ã o n e g ativa m o d e rad a
EXEMPLO: FUNÇÃO COGNITIVA

EM PESSOAS COM DOENÇAS CRÔNICAS
Fez-se um estudo no qual correlações entre variáveis de medidas cognitivas e do

enças foram obtidas. As medidas foram as seguintes: QI (de desempenho e verbal),
escore de Stroop," duração da doença em anos e medida de depressão. As hipóteses
foram bilaterais. Setenta participantes providenciaram os dados, e os resultados estão
na Tabela 5.3.
A primeira fileira indica os valores de r; a segunda Jinha fornece os valores de probabi
lidade associados, e a terceira aponta o número de participantes em cada condição.
' O tradicional teste de Stroop envolve palavras com significado de cores (vermelho, azul, amarelo, verde) escritas tanto numa cor
congruente (p. ex.. a palavra vermelho escrita em tinta vermelha) como numa cor incongruente (p. ex., a palavra vermelho escrita
em tinta azul). Os participantes geralmente demoram mais para nomear as coros na situação incongruente. A diferença do tempo de
reação entre as duas condições fornece o escore Stroop relatado nesse estudo.
Atividade 5.7
Q u a n d o v o cê e stu d a o g rau d e sig n ifica n cia de um co e ficie n te d e c o rre la ç ã o , é im p o rta n te

p re sta r a te n ç ã o :
(a) A o nível d e sig n ifica n cia

(b) A o va lo r do c o e fic ie n te d e co rre la ç ã o
(c) A m b a s (a) e (b)
(d) N em (a) nem (b)
Existe uma correlação (talvez fictícia!) entre a quantidade de sorvete ingerido e o sentimen
to de grande felicidade (+0,85). Quanto da variação nos escores da felicidade pode ser explicado
pela quantidade de sorvete ingerido? Quanto da variação permanece sem explicação?
5.1.11 Significância estatística e importância psicológica

No passado, algumas pessoas estavam mais preocupadas com a “significância” do que
com o tamanho da correlação ou a quantia de variância explicada. As vezes as pessoas afirma
vam que tinham uma correlação altamente significativa: lembravam o valor probabilistico (p.
ex.. 0,005), mas esqueciam o tamanho da correlação. O valor da probabilidade significa muito
pouco se r não é relatado. O coeficiente de correlação indica o nível de relacionamento das va
riáveis, e o valor probabilistico é a probabilidade de aquele valor ocorrer por erro amostrai.
Portanto, quando reportar seus estudos, relate o coeficiente de correlação e pense se o r
é significativo para seu estudo, assim como o valor probabilistico. Não use somente o valor
probabilistico. Lembre-se: significância estatística não equivale necessariamente à signifi
cância psicológica (ver Capítulos 4 e 7 para mais informações).
(v T ") EXEMPLO: REVISITANDO SORVETES E TEMPERATURA

*|
Agora que você já sabe sobre variância explicada, podemos ajustar a parte textual de
seus resultados para incluí-la. A análise pode ser a seguinte:
A venda de sorvete de casquinha estava fortem ente associada à temperatura: quando a
temperatura aumenta, aumenta também a venda de sorvetes. O r de 0,89 mostrou que 79% da
variância em vendas de sorvete se explicava pela variância na temperatura. O nível de probabi
lidade associado de 0.001 mostrou que é improvável que o resultado tenha ocorrido por erro na
amostra, considerando a hipótese nula com o verdadeira.
Atividade 5.8
O b serve o se g u in te d ia g ra m a de d isp e rsã o :
1,8 1
1, 6 -
CO
<
LU
1 '4 -
LU
< 1,2 -
\—
1,0 -
0,8 -I--------- 1--------- 1--------- 1--------- 1--------- 1--------- 1

3,5 4,0 4,5 5,0 5,5 6,0 6,5
AG REEAB
Ele d e m o n stra q u e as va riá ve is in d ica m u m a:
(a) A sso c ia ç ã o n eg ativa fo rte

(b) A s so c ia ç ã o po sitiva m o d e rad a
(c) A sso c ia ç ã o n e g ativa m o d e rad a
^ “1 EXEMPLO: FUNÇÃO COGNITIVA

# | EM PESSOAS COM DOENÇAS CRÔNICAS
Fez-se um estudo no qual correlações entre variáveis de medidas cognitivas e do

enças foram obtidas. As medidas foram as seguintes: QI (de desempenho e verbal),
escore de Stroop,~ duração da doença em anos e medida de depressão. As hipóteses
foram bilaterais. Setenta participantes providenciaram os dados, e os resultados estão
na Tabela 5.3.
A primeira fileira indica os valores de r; a segunda linha fornece os valores de probabi
lidade associados, e a terceira aponta o número de participantes em cada condição.
O tradicional tesle de Stroop envolve palavras com significado de cores (vermelho, azul, amarelo, verde) escritas tanto numa cor
congruente (p. ex.. a palavra vermelho escrita em tinta vermelha) com o numa cor incongruente (p. ex., a palavra vermelho escrita
em tinta azul). Os participantes geralmente demoram mais para nomear as cores na situação incongruente. A diferença do lempo de
reação entre as duas condições fornece o escore Stroop relatado nesse estudo.
Tabela 5.3
Correlações
duration of
performance iq illness in
verbal iq (QI de years (duração da depression
(QI verbal) desempenho) doença em anos) stroop (depressão)
verbal iq Pearson Correlation
{QI verbal) (Correlação de Pearsòn) 1 0.615 -0 .1 7 5 -0.227 -0.32 7
Sig. (2-tailed) 006

0.000 0.148 0.059
(Sig. Bilateral)
N 70 70 70 70 70
performance iq Pearson Correlation
0.615 1 0.043 -0.231 -0 .0 9 4
(QI de desempenho) (Correlação de Pearson)
Sig. (2-tailed) 0.000 0.724 0.055 0.438
(Sig. Bilateral)
N 70 70 70 70 70
duration of illness Pearson Correlation

in years (duração (Correlação de Pearson) -0 .1 7 5 0.043 1 0,217 0.398
da doença em anos)
Sig. (2-tailed)
(Sig. Bilateral) 0.148 0.724 0.072 0.001
N 70 70 70 70 70
Pearson Correlation
stroop -0.22 7 -0.231 0.217 1 0.274
Sig. (2-tailed) 0.059 0.055 0.072 0.022
(Sig. Bilateral)
N 70 70 70 70 70
depression Pearson Correlation
-0.32 7 -0 .0 9 4 0.398 0.274 1
(depressão) (Correlação de Pearson)
Sig. (2-tailed)
(Sig. Bilateral) 0.006 0.438 0.001 0.022
N 70 70 70 70 70
Sig. = Significance
O relatório pode ser escrito assim:

Como esperado, o Q1 verbal e o QI de desem penho tiveram um relacionam ento positivo
forte, e uma correlação moderada foi encontrada entre duração da doença e depressão. Entretan
to, o mais interessante foi descobrir que a depressão estava relacionada ao QI verbal (r = -0,33,
p = 0,006), mas não ao QI de desem penho (r = -0 ,0 9 , p = 0,44). A depressão também estava
relacionada à medida de Stroop - quanto mais deprimido o paciente, mais incongruentes os seus
escores (r = 0,27. p = 0,022).
Você pode obter uma matriz de diagramas de dispersão com o SPSSPW (ver Figura
5.17). Em um primeiro olhar, pode parecer confuso. Entretanto, c interpretado da mesma
maneira que a tabela correlacionai acima.
É preciso olhar somente para uma metade da matriz, pois uma é igual à outra. O
diagrama de dispersão para quaisquer duas variáveis é mostrado no quadrado no qual se
encontram. Siga uma linha vertical imaginária para cima de ‘ duração de doença”e siga
uma linha imaginária horizontal de "QI verbal". E isso resultará em um dragrama de dis
persão que plota “duração de doença” contra "QI verbal”.
■Wh . y 1' 'K r ' nQ

Ql verbal
*•
Ql de
desempenho O i.
Duração
da doença
a jL k M ' ' -,
Depressão
Stroop
D ia g ra m a de d isp ersã o de m a trize s para a s variáveis co g n iç ã o e d o e n ça.
□ SPSSPW: obtenção uma matriz de diagramas de dispersão
Para se obter matrizes, abra seu arquivo de dados e selecione Graphs (Gráficos), Scatter
(Dispersão).
U jJ
E» l - P- m
iB â ' . ■
I »Uootl I tetd I iln>î3 I

«oc
»oc
0900
ecoo 4C0C >er?
«oo
58 00 »43 2>IX
5900 É 48 XS7
;400
U iJü
3000
30 00
9flH '
96 00
“W OT
11400
47 CO
••oo
»00
K00 X 00 11900 :?cc
won
XX
<UQ0
ro o 1C 00
«.IX
C4 0C KCC to; oo :oo 900 xco
. V IXCC
n D tu* Cü
64 00 9" 00
W B u I ÌO S -. ? 1
Depois, selecione Matrix (Matriz), Define (Definir).
VQá ■ w -I. r . t '

1aojet
_____ 1
QtOllp« 1 •9*
46 00
1 «
IC4 00
1 P')
124 00
I NM
200
•tHMflI 1 «n*p? 1
1239 23»
re»ri 1 «•nop3
J4X 1» 60
J _____ L
■!
: t CD 43 0C 8100 118 DO - HOT 20 E 6® 991
im III 4*11) U5 a i .. : ?Hf 19IV- i m •j ••
4 1 CO 56 00 104 oc 106® 1100 9 i£ 26 50 6® 17 34
_____ 5 IIX) U)U) 1U2U0 Ito ® ¿r re, 1C ¿9 A 76 4 i® Ai4-
' 6 ' CO 50 00 117 00 115 00 500 927 ' ' 25 14®
■ '0 0 4500 r-x »00 ’X 555 1' 37 7® Selecione
a 1 LU *>IJU U i (II 11« tu 15111 14 i JWitt 7- 1« l*>HI
? >CO 38 oc SS X toc oc : 90 357 2643 29® 17 06 Matrix (M atriz)
I CD 10000 .0 13 12
__ n ICO ff/ 98 00 110 00 —
12 * CD 20 00 106 00 108 X _ _ 1“ C I ---------
— -— r *55
__ 1: »UI Hl <IJ n il'll 11h <11 E L.
H M in Min
14 ' CO 6600 66 00 93 00 1399
__ l i >00
1 rn
x t»
•■onri
«JOJ
Tfifin
11WUU
1141-10
,
0.*K»/
S|■■ H*.
H tt
Á63
— 17 <00 20 00 98 00 119 00 96Í
______ 22 VIII A lll r'1 III W III i ■4 <1 ■ .11 r
1 19 •oo 69 00 10300 109 00 xoo 12 T4 5® 11 18
______- i uu XI UU '‘j uu y jju JUU 1U39 J1 l- 21 X J 1 uu
21 1iY> 4«;nri wn iT mm 61» ■2 34 V V vino 1905
22 100 40 00 9000 94 00 6® 1082 23 76 12® 1294
Ì III mu ft/ Hi Ill'll*) no n ■« 1*.M li*, il
1 -JíA 100
1 uu
37 00
4JUU
” 100
LU uu
142 00
w®
t ir o
JU uu
989
u
1654
IU 1J
4X
’•5M
665
9®
1 2;■6* 1 00 54 00 «7 00 1»rr >(T) 9® 19 r *-® •’ 4’
100 45 00
47 (Tl
114 00 ta x 15® '1 89 27 99 e® 16 ®
701 1?1 ITI i l rn -9'/i 7 2f. IP 17 .T !X HI 91
200 53 00 96 00 101 oo 26 OC 568 25 19 19® 1651
30 200 2000 64 00 97® 6® 1037 12 02 10® 105
• T ■¡\Uala Wrw / - . ,p , -/ •
Pr<nrM*jr o >»•}.
Mude as variáveis que você deseja incluir do lado esquerdo da caixa de diálogo para <
lado direito usando o botão ►.Clique em OK.
a ja
fc B « r r'- n -I. n ¡ %
yoopi I »9» I «iq I I |>«l» I snoops I «roctf I I «ltoop3 I

_L ‘
*¿0 0 124 00 »239
48® 118® 800 1101 20 92
3?® 1'5 00 6 00 996 1963
68 00
6000
9900
jet»
57 00
S9 00
2000
e i®
As variáveis
£6 00
30 00
que você
30 00 deseja incluir
*0 0
»00 '_.ao movidas
№®
3000 da caixa
da esquerda
Ml 00 >100 para cá
84 CO ■Ti00 30 00 826
€4 00
45 CO
9200 105 00 200 990
■il DO 1500 11 39
¡2100 132 00 2900
58 OD *>00 <0100 26 CO
20® 64 00 9? 00 600
Isso fornecerá as matrizes.

í v r i EXEMPLO: Ql E NOTAS DE TESTES
Se você fizer uma análise correlacionai de diversas variáveis, obterá uma saída como a
abaixo, que está no formato de uma matriz correlacionai:
Correlações
m ath em at sco re 1 sco re 1 sco re 1
IQ (Ql) (matemática) (escore 1) (escore 1) (escore 1)
Pearson Correlation
IQ (Qi) (Correlação de Pearson) 1.000 .5741 .0641 .0 1 4 3 .1 4 2 8
Sig. (2-tailed)
.002 .383 .4 7 4 .253
(Sig. Bilateral)
N 24 24 24 24 24
mathemat Pearson Correlation
(matemática) (Correlação de Pearson) .5741 1.000 .0 5 9 8 .0281 .2502
Sig. (2-taíled)
.002 .391 .448 .119
(Sig, Bilateral)
N 24 24 24 24 24
score 1 Pearson Correlation
(escore 1) (Correlação de Pearson) .0641 .0598 1.000 .9952 - .2 1 5 3
Sig. (2-tailed) .383 .391 .000 .156

(Sig. Bilateral)
N 24 24 24 24 24
(escore 2) (Correlação de Pearson) .0143 .0281 .9952 1.000 .2188
Sig. (2-tailed) .474 .448 .000 .152

(Siq Bilateral)
N 24 24 24 24 24
(escore 3) (Correlação de Pearson) -.1 4 2 8 -.2502 -.2153 -.2 18 8 1.000
Sig. (2-tailed) .119
.253 .156 .156
(Sig. Bilateral)
N 24 24 24 24 24
Sig. = Significancia
Embora tenhamos correlacionado cinco variáveis umas com as outras, temos somente
dez correlações para analisar. Isso ocorre porque ignoramos as correlações das diagonais:
essas são r - 1,00, e cada variável tem uma correlação perfeita com ela mesma. Além
disso, cada metade é uma imagem da outra; portanto, precisamos observar somente uma
metade. Colocamos a metade de cima em negrito para facilitar a visualização.
A saída mostra o coeficiente de correlação r e a probabilidade de este ocorrer por erro
amostrai, supondo que a hipótese nula seja verdadeira. Também informa o número de pares
de observações.
Nesse exemplo, os escores de matemática têm uma associação positiva com QI (r =
0,57). E uma correlação moderada, mas a associação tem uma probabilidade exata de p =
0,002: existe somente uma pequena chance (0.2%) de que essa correlação tenha ocorrido
por erro amostrai. O número de observações foi de 24.
Se você considerar a primeira fileira de cima da matriz, verá que os escores 1. 2 e
3 têm coeficientes de correlação que são aproximadamente zero. Isso significa que não
existe um relacionamento linear entre as variáveis, e isso é confirmado pelos valores de
probabilidade.
Observe agora o ponto no qual o escore 1 encontra o escore 2. Você constatará que
existe um relacionamento forte, quase perfeito, entre eles, demonstrando que esses dois
escores devem estar medindo uma habilidade parecida (r = 0,9952). O nível de probabili
dade associado (p < 0,001) mostra que é improvável que esse valor seja resultado apenas do
erro amostrai, supondo que a hipótese nula seja verdadeira. O SPSSPW calcula os valores
p até um certo número de decimais após a vírgula (o usuário pode mudar esses parâmetros
para que os valores sejam apresentados com quatro decimais como acima (r = 0,9952) ou
com três decimais (r = 0,995) ou qualquer outro valor. O mesmo funciona com valores p.
(Lembre-se de que, quando o SPSSPW fornece p , como p = 0,000. você precisa mudar o
último zero para o número 1. e usar o sinal de menor: p < 0,001).
5.1.12 Intervalo de confiança para r

Rosnow e Rosenthal (1996) dão o procedimento para construir limite, cie confiança de
95% (bilateral p = 0,05) para r. As informações que seguem se baseiam em seu texto:
1. Consulte uma tabela para transformar r em Zr de Fisher (ver página 602) do Apên
dice 2).
2. Multiplique por 1,96.
3. Ache o limite inferior do intervalo de confiança subtraindo o resultado em 2 acima
do valor encontrado em J.
4. Ache o limite superior do intervalo de confiança adicionando o resultado em 2 aei
ma do valor encontrado em 1.
5. Consulte uma tabela similar para transformar os valores inferior e superior de Zr
novamente em valores r.
í\j EXEMPLO
*
Vamos tentar esse processo para um coeficiente de correlação de +0,29 em uma análise
com 133 pessoas: r = 0,29. n = 133.
1. Consultamos a tabeja. que mostra um r de 0,29 convertido em um Z. de 0,299.
2. Multiplicamos l/\[\3 0 por 1.96. Ponanto, multiplicamos 1/11 40 por 1.96. Isto
é, multiplicamos 0,0877 por 1,96 = 0,1719.
3. Diminuímos 0,1719 de 0,299 = 0,1271: esse é o limite inferior Zr.
4. Adicionamos 0,1719 a 0,299 = 0,4709: esse é o limite superior Zr.
5. Convertemos os números em 3 e 4 para r (de Zr). Consultando as tabelas, há:
Zr = 0.1271 —> r= 0,126 (limite inferior do intervalo de confiança pra r).
Zr = 0.4709 —> r = 0,440 (limite superior do intervalo de confiança pra r).
Embora o coeficiente de correlação amostrai seja +0,29, temos 95% de confiança de
que o verdadeiro coeficiente de correlação populacional está entre 0.126 e 0,440.
A té agora fa la m o s so b re a co rr ela ç a o entre du as v a r iá v e is, se m levar outras v a r iá v e is em

c o n sid e r a ç ã o . E sse tip o dc c o rrela çã o e' c h a m a d o de correlação de ordem zero.
5.2 Correlações de primeira e segunda ordens
V am os lem brar d o n o sso e x em p lo n o qual altura e p e so são altam en te c o rrela cio n a d o s em

crianças. Se pararm os um m inuto para pensar, verem os que idade é correlacion ada i am bas e ssa s
variáveis. P od eríam os fazer um a análise correlacion ai n essas três variáveis para confirm ar isso.
Correlações
Heigh (Altura) Weight (Peso) Age (Idade)

Pearson Correlation
Heigh (Altura) 1.000 0 .8 3 4 0 .9 7 0
Sig. (1 -tailed) 0.001 0 .000
(Sig. Unilateral)
N 10 10 10
Pearson Correlation
Weigh (Peso) 0.834 1.000 0 .8 0 2
Sig. (1-tailed)
0.001 0.003
(Sig. Unilateral)
N 10 10 10
Pearson Correlation
Age (Idade) (Correlação de Pearson) 0.970 0.802 1.000
Sig. (1-tailed)
0.000 0.003
(Sig. Unilateral)
N 10 10 10
**Correlação é significativa no nível 0,01 unilateral.

Sig. = Significáncia
C o lo c a m o s e m n egrito o s três c o e fic ie n t e s de c o n c la ç ã o . P o d e -s e ver q u e a:, iris variá

v e is e stã o fo r te m e n te rela cio n a d a s u m as c o m as outras.
S e q u ise r m o s d e sc o b r ir a a s s o c ia ç ã o entre altura e p e s o sem o e fe ito da id a d e, tería m o s
d e achar u m a am ostra de cria n ç a s qu e n asceram no m e s m o dia. S e is s o n ão fo s s e p o s s ív e l,
p o d er ía m o s n os d e sfa z er do e fe ito da id a d e, r em o v e n d o su a in flu ê n c ia por m e io s e sta tístic o s.
Is so é c o n h e c id o c o m o m a n u ten çã o da id a d e c o n sta n te. C o r r e la c io n a m o s altura e p e s o en
q u anto n o s d e s fa z e m o s do e fe ito da id ad e; r, en tão, in d ic a ria a c o rrela çã o e n tr e altura e idade
q u an d o a in flu ê n c ia d esta é rem o v id a .
P o d e m o s e x p lic a r is s o c o n c e itu a lm e n te ao o b ser v a r m o s c ír c u lo s de v ariân cia q u e c o in
c id e m . N o se g u in te d iagram a, p o d e -s e ver q u e o r e la c io n a m e n to entre altura e p e so (c ô m a
in flu ê n c ia da id ad e) é +b.
Isso significa a correlação total entre altura e peso. Entretanto, parte do relacionamento
entre essas variáveis se dá devido à idade - a parte representada somente por b. Se a influên
cia da idade fosse removida (a área b). a correlação entre altura e peso seria reduzida, pois
seria representada somente por a. Isso é uma correlação parcial: uma correlação entre duas
variáveis, com a influência de uma (nesse caso) removida. '
□ SPSSPW: correlações parciais - rd e Pearson
Com o SPSSPW, é fácil remover a influência de uma variável. As instruções são as se
guintes. Depois de colocaros dados, escolhaAnalyze (Analisar), Corre/ate (Correlacionar).
PartiaI (Parcial).
A seguinte caixa de diálogo é obtida.

<surt| ÍT£ UMiè !¡3;5*

JS í JI jag UnúleU SHVSO<l< _ ^• &*•« -:a
Colocamos altura e peso na caixa Variables (Variáveis) da direita e a variável que deseja
mos fixar (nesse caso, idade) na caixa Controlling fo r (Controladas).
Seria útil saber o valor do coeficiente de correlação para idade e peso sem o controle
da variável idade para podermos comparar os dois. Para efetuar isso, selecionamos Options
(Opções). Onde obtemos a seguinte caixa de diálogo. Marque Zero-order correlations (Cor
relações de ordem zero) e pressione Continue (Continue).
Lembre-se de
clicar nessa caixa
•*
■íEêro
ff I , l v ~. [lyunMlHd S t ip a la S - ::- .
Isso nos traz de volta à caixa de diálogo Partiul Corrclations (Correlaçoes Parciais), na
qual você pode clicar em OK.
Isso significa a correlação total entre altura e peso. Entretanto, parte do relacionamento
entre essas variáveis se dá devido à idade - a parte representada somente por b. Se a influên
cia da idade fosse removida (a área b). a correlação entre altura e peso seria reduzida, pois
seria representada somente por a. Isso é uma correlação parcial: uma correlação entre duas
variáveis, com a influência de uma (nesse caso) removida. ’'
□ SPSSPW: correlações parciais - rd e Pearson
Com o SPSSPW, é fácil remover a influência de uma variável. As instruções são as se
guintes. Depois de colocar os dados, escolha Analyze (Analisar), Correlate (Correlacionar),
Partial (Parcial).
Fk Edt vcw Doio Tigrehyi* t u Cmjo»u IMan Wnfo»
A seguinte caixa de diálogo é obtida.
Essa não c um a explicação m atem ática, m as sim conceituai. Portanto, a precisão m atem ática é perdida em lavor do entendim ento
conceituai. A fórm ula real para calcular correlações parciais c dada por r* = a/(a + altura) ou a/(a + peso).
B — ir.TI ' T " f i i f u i - ■ .- ..il i»
PsCa JJ3» i:j

£ 3 '- -' ________ | r ; . -” y - p n ^ -’ . -'-X-- HÛláUln] .1",'. O,'.. ' 1■- I — -- : -í tíj
C o lo c a m o s altura e p e so na c a ix a Variables ( V ariá veis) da d ireita e a variável qu e d e se ja

m o s fix a r (n e s s e c a so , .idade) na c a ix a Controlling for (C o n tro la d a s).
S eria útil sab ei o va lo r d o c o e f ic ie n te de c o r r e la ç ã o para id ad e e p e s o sem o c o n tr o le
da variá v el id ad e para p o d e r m o s com p arar o s d o is. Para e fetu a r is s o , s e le c io n a m o s Options
(O p ç õ e s ). O n d e o b te m o s a se g u in te c a ix a de d iá lo g o . M arq ue Zero-order correlations (C or
r e la ç õ e s de ord em zero) e p r e ssio n e Continue (C o n tin u e ).
*»-1 s e a jj a •=*
ff, - - Md____________ r r j " IJ ’ .- i y ’-'1 ’ • : ~V - llmUntÉlwl SPSS Daln rj ‘ ^
Is so n o s traz de v o lta à c a ix a de d iá lo g o Partial Correlations (C o r r e la ç õ e s P a rc ia is), na

qual v o c ê p o d e c lic a r e m OK.
As correlações de ordem zero são mostradas primeiro:
Partial Correlation Coeficients

(Coeficientes de Correlações Parciais) Relacionam ento entre as variáveis sem o
Zero Order Partials controle de qualquer outra variável
(Parciais de Ordem Zero)
Height (Altura) Weight (Peso) Age (Idade)

Height Pearson Correlation
(Altura) (Correlação de Pearson) 1.000 .8 3 3 9 .9 6 9 5
Sig. (1 -tailed)
.002 ' . .001
(Siq. Unilateral)
N 0 8 8 A correlação entre
Weight Pearson Correlation altura e peso sem
(Peso) (Correlação de Pearson) .8339 1.000 .8 0 2 0
o controle de outras
Sig. (1 -tailed) variáveis é forte: 0,84
(Siq. Unilateral) .002 .0 0 6
N 8 0 8
Age Pearson Correlation

(Idade) (Correlação de Pearson) .9695 .8020 1.000
Sig. (1-tailed)
.001 .006 0
(Siq Unilateral)
N 8 8 0
Essa tabela é exatamente igual a da página 205, exceto porque o programa foi rotulado de
tabela Zero Order Pa rtials (Parciais de Ordem Zero).' Ela nos dá o relacionamento entre as
variáveis, com o controle das demais.
A saída entào informa a correlação entre altura e peso, com controle da variável idade:
Partial Correlation Coeficients ,

(Coeficientes de Correlações Parciais) Isso indica que as correlações na
Control of Age _____________ ______ _____________ tabela são parciais a idade foi controlada
(Controle para: Idade) "*
Heigh Weight
(Altura) (Peso)
A correlação entre altura e peso
Heigh Pearson Correlation
1.000 .3 8 5 3 - é agora apenas 0 ,3 9 (por que
(Altura) (Correlação de Pearson)
a idade foi controlada)
Sig. (2-taíled)
.3 0 6
(Siq. Bilateral)
N 0 8
Weight Pearson Correlation

.3853 1.000
(Peso) (Correlação de Pearson)
(Sig. Bilateral)
Podemos ver que a correlação entre altura e idade foi reduzida de 0,83 para 0,39 (corri
gido para dois decimais após a vírgula). Portanto, nessa amostra pequena, verificamos que a
associação entre altura e peso se dava parcialmente devido à idade. Se a correlação de 0,83
não tivesse sido reduzida quando excluímos a variável idade, sugeriria que a associação entre
altura e peso não era afetada pela variável idade.
Nesse caso, controlamos (excluímos) somente uma variável, portanto chamamos de cor
relação de primeira ordem. Se excluirmos os efeitos de duas variáveis, estaremos fazendo
uma correlação de segunda ordem, e assim por diante.
1Aqui os núm eros são dados com quatro decimais.

C o m o o program a (a fó r m u la ) fa z isso ? B a sic a m e n te , e le c o rr e la c io n a id ad e c o m altura.

E ntão c o r r ela c io n a id ad e c o m p e so . E ss e s r esu lta d o s sã o “ r e m o v id o s” da co rr ela ç ã o altura e
p e so . E sse p r o c e s so r em o v e a in flu ê n c ia da id ad e d o c o e fic ie n te de correlação.
Atividade 5.9
O b serve os se g u in te s re su lta d o s o b tid o s de um e stu d o fe ito por D an ce y e c o la b o ra d o re s.

( 2002 ):
Partial Correlation Coefficients (Coeficientes de Correlações Parciais)
Zero Order Partijls (Parciais de Ordem Zero)
Total Illness
Intrusiveness
Total QOL5 Total Stigma (Incapacidade Total
(CQV Total) (Estigma Total) Causada pela Doença)
Total QOL Pearson Correlation
(CQV Total) (Correlação de Pearson) 1.000 .4983 -.7161
Sig. (1-tailed)
.000 .000
(Sig. Unilateral)
N 117 117 117
Total Stigma Pearson Correlation
(Estigma Total) (Correlação de Pearson) -.4 9 8 3 1.000 .4930

.000
(Sig, Unilateral)
N 117 117 117
Total Illness Pearson Correlation 1.000

-.7161 .4930
Intrusiveness (Correlação de Pearson)
(Incapacidade Total Sig. (1-tailed)
Causada pela Doença) .000 .000
(Sig. Unilateral)
N 117 117 117
Partial Correlation Coefficients (Coeficientes de Correlaçoes Parciais)

Controlling fo r... Total Illness Instrusiveness (Controle da Incapacidade Total Causada pela Doença)
Total QOL (CQV Total) Total Stigma (Estigma Total)

Total QOL Pearson Correlation
1.000 -.2391
(CQV Total) (Correlação de Pearson)
Sig. (1-tailed)
.005
(Sig. Unilateral)
N 117 117
Total Stigma Pearson Correlation
(Estigma Total) -.2391 1.000
Sig. (1-tailed)
(Sig. Unilateral) .005
N 117 117
(a) Q ual é a co rre la çã o de ord em ze ro e n tre C Q V e o e stig m a?

(b) Q u al é o va lo r da co rre la ç ã o e n tre C Q V e e stig m a com a in c a p a c id a d e ca u sa d a pela
d o e n ça e xclu íd a?
(c) O q u e vo cê p o d e c o n c lu ir d isso ?
* N. de T. C om prom etim ento da Q ualidade de Vida (C om prom isses Q uality o f Live).

Exemplo da literatura: memória e vocabulário
Muitos pesquisadores utilizam coeficientes de correlação para relatar seus estudos, e artigos
científicos geralmente incluem matrizes correlacionais para o leitor interpretar. Temos aconselhado
você a relatar valores de probabilidade exatos, mas às vezes os autores não o fazem: relatam ou
o p < ou p > como intervalos. Michas e Henry (1994) testaram 24 meninos e 24 meninas (idade
média de 5,6 anos) por meio de várias medidas. O estudo investigou se duas variáveis de memória
fonológica, lapsos de repetição e lapsos de memória estavam relacionadas ao vocabulário adquiri
do. A Tabela 5.4 contém as correlações entre todas as medidas iniciais tanto quanto as medidas de
aprendizagem de palavras.
Note que os pesquisadores nos deram somente metade da matriz de correlação completa. Como
já dito, não precisamos ver as diagonais (todas serão r - 1,00); precisamos somente da metade da
matriz. Note também que qualquer correlação com * depois dos números é improvável de ter acon
tecido devido ao erro amostrai, tendo a hipótese nula como verdadeira (usando um valor de critério
de 5%), e qualquer correlação com ** após o número é improvável de ter acontecido devido ao erro
amostrai (usando um critério de 1%). Não nos foram dados os valores de probabilidade exatos;
portanto, não sabemos se a correlação entre idade e lapsos de repetição, por exemplo (0,332*), teve
uma probabilidade associada de 0,049 ou 0,02. Isso é importante? Teremos que ler a discussão crí
tica da página 155 para nos decidirmos.
E importante lembrar que os pesquisadores nos deram os valores de r corretos até três decimais.
Nem todos os estudos fazem isso; alguns relatam os números corretos somente com duas casas
decimais após o ponto.
T a b e la 5.4 Matriz de correlações momento-produto de Pearson
S p a tia l Non-word M em o ry W o rd W o rd c o m W o rd
M e m o ry R e p e titio n Span p r o d u c tio n p re h e n s io n D efin itio n
(M emória (Lapsos de ( Lapsus de V o cab u lary (Produção (Compreensão (Definição
espacial) repetição) memória) (Vocabulário) de palavras) de palavras) de palavras)
Age (Idade) 0.049 0.332* 0.158 0.183 -0.023 -0.062 0.169

Memory Spatial
0.185 0.1 14 0.211 0.200 0.111 0.150
(Memória espacial)
Non-word repetition
0.626** 0.484** 0.303* 0.278 0.391**
(Lapsos dc repetição)
Memory span
0.476** 0.448** 0.291 0.347*
(Lapsos dc memória)
Vocabulary
0.279 0.378* 0.376*
(Vocabulário)
Word Production
0.496** 0.479**
(Produção de palavras)
Word comprehension
(Compreensão de palavras) 0.489**
*p <0.05; **¿7 «0.01.

crenças de saúde e dor nas costas
Harkapaa e colaboradores (2000) estudaram o otimismo quanto à saúde e as crenças de con

trole para ver se conseguiriam prever tratamentos bem-sucedidos para pessoas com dor nas costas.
Como parte do estudo, fizeram correlações entre as variáveis, reproduzidas na Tabela 5.5.
Tabela 5.5 Intercorrelações (/' de Pearson) de valores básicos de idade, sexo. índice de capacidade funcional
iICF) e variáveis preditoras (otimismo quanto à saúde, três medidas de lócus de controle e depressão)
H e a lth o p tim is m
(O tim ism o O th e rs L O C In te rn a i L O C C hance LO C D e p r e s s io n
q u a n to à saú d e) (O u tro s L O C ) (L O C in tern o s) (L O C casuais) (D ep ressão )
Age (Idade) -Ü.23 0.JS -0.23 0.1 1 0.10

Sex (Sexo) Ü.02 0.06 -0.04 -0.01 0.08
FCI (ICF) 0.29 - 0 .15 0.15 -0.1 1 -0.35
Health optimism
- -0.34 0.51 -0.27 -0.20
(Otimismo quanto ii saúde)
Others LOC
0.34 - 0.13 0.43 0.38
1Outros LOC)
Internai LOC
0.51 0.1' - 0.05 -0.09
i LOC internos)
Chance LOC
0.2/ 0. !3 0.05 - 0.-9
i Í.OC casuais)
Depression
1Depressão) 0.20 0.38 -0.09 0.29 _
FCI (Functional Capacity Index) (ICF (índice de capacidade funcional)); LOC (Lócus Of Control) (LOC (lócus de controle)).
/• > 0,208, p < 0.Ü l : /• > 0 ,159, p < 0,05.
estigma, incapacidade causada por doença e
qualidade de vida na síndrome do intestino irritável
Nesse artigo (Dancey et al., 2002), probabilidades exatas foram dadas quando possíveis. En
tretanto, como você já aprendeu, às vezes o SPSSPW imprime uma fileira de zeros (.p = 0.000), e a
convenção é mudar o último zero para 1 e usar o sinal de menor (p < 0,001). Fez-se isso aqui.
A Tabela 5.6 é uma parte dos resultados dados nesse artigo.
Observe a correlação entre incapacidade causada por doença no papel social c qualidade de
vida das mulheres: r = -0,51. Quando a incapacidade causada por doença aumenta no aspecto
social, a qualidade de vida diminui. Essa é uma correlação moderada. Entretanto, se excluirmos a
variância devido à severidade dos sintomas, a correlação diminui (para-0,37). Isso significa que
parte da relação entre incapacidade causada por doença com respeito ao papel social se devia na
verdade à severidade dos sintomas.
Tabela 5.6 Correlações completas e parciais entre intrusão da doença e subesealas do questionário de
qualidade de vida relatado por sexo (correlações parciais controladas pelo total da severidade dos sintomas)
M e n (H om ens) W o m e n (M u lh eres)
V ariáveis F u ll (Total) P a r t i a l (P arcial) F u l l (Total) P a r t i a l (P arcial)
S o c ia l R o le
-0.64 (p < 0.001) -0.58 (p < 0.001 ) -0,51 (p < 0.001) -0.37 (p = 0.002)
( Papel so cial)
S le e p iS o n oi -0.36 (p = 0.004) -0.25 (p = 0.035) -0.30 ( p < 0.001) -0.15 (p = 0.13)
P h j s ic a l R o le
-0.55 (p < 0.001) -0.52 (p <0.001 ) -0.49 (p < 0.001 ) -0.35 (p < 0.001 )
(Papel físico)
Mental Health
0.70 (p < 0.001) -0.65 (p < 0.001 ) -0.50 (p < 0.001) -0.38 (p < 0.00) )
(Saúde mental)
Energy (Energia) -0.54 (p < 0.001) -0.48 (p< 0.001) -0.51 ( p < 0.001) -0.38 (p< 0.001)
*F.xistem 13 itens na escala de incapacidade causada por doença; reproduzimos apenas 5 aqui.
Atividade 5.10
Pense sobre o significado d o s o p o sto s d o s coeficientes d e correlação (crenças de saú d e e dor

nas costas). O qu e você pode dizer sobre o tam anh o e o significado das várias correlações?
5.3 Padrões de correlações
Você deve ser capaz de observar quais padrões de correlação ocorrem em uma matriz de
correlações. Por exemplo, analise a seguinte situação:
Variáveis que se relacionam

Variáveis que uma com a outra,
se relacionam mas não com as demais
Correlações
relationship family other social satisfied had

with spouse re ationships relationships felt sad with life . cryir g spells
(relacionamento (reU cionamentos (outros relaciona (sentir-se (satisfeito [ter crises
com a esposa) familiares) mentos sociais) triste) com a vida) )e choro)
relationship with spouse
1.000 0.672 0.547 0.321 0.500 0.119
(relacionamento com a esposa) < >
family relationships
1.000 0 .6 8 9 0.236 0.508 0.072
(relacionamentos familiares)
other social relationships V 1.000 0.165 0.5 8 4 -0.010
(outros relacionamentos sociais)
felt sad (sentir-se triste) 1.000 0.224 0.442
satisfied with life
1.000 - 0 .1 17
(satisfeito com a vida)
had crying spells
1.000
(ter crises de choro)
Se você observar cuidadosamente, verá que as variáveis que compartilham a maior parte
da variância umas com as outras estão relacionadas à qualidade de vida, satisfação com os
relacionamentos e com a vida. Esse é um padrão que emerge dos dados. Essas variáveis estão
correlacionadas umas com as outras, formando um grupo “natural”. As outras duas variáveis,
sentir-se triste e ter acessos de choro, também estão correlacionadas entre si (0,442), mas não
com as demais variáveis, demonstrando um segundo padrão. Dessas seis variáveis, podemos
distinguir dois padrões distintos. Obviamente, nesse exemplo, com poucas variáveis, fica
relativamente fácil distinguir os padrões.
Psicólogos desenvolvendo ou verificando as propriedades de questionários fazem uô
desse tipo de "padronização” para agrupar variáveis. Isso é útil quando, por exemplo, um
questionário foi desenvolvido para medir aspectos diferentes de, digamos, personalidade ou
qualidade de vida. No exemplo, as variáveis no primeiro grupo são questões que constituem
uma subescala de um questionário de qualidade de vida. Um questionário pode incluir ques
tões relacionadas à vida familiar (isto é, uma subescala) e outras relacionadas à situação
financeira e talvez vida sexual. O questionário de qualidade de vida consiste em várias subes-
calas diferentes.
O uso de padrões de correlações para verificar agrupamentos de perguntas dá uma maior
confiança nos questionários elaborados por psicólogos. Obviamente eles não olham somente
para as matrizes correlacionais. Eles usam uma técnica chamada de Análise Fatorial, que
efetivamente faz a mesma coisa. Só que melhor! Isso é discutido com mais detalhes no
Capítulo 12.
Resumo
■ Se duas variáveis são correlacionadas, então não são independentes: quando os esco
res de uma variável mudam, os escores da outra variável tambem mudam, de maneira
previsível.
■ Correlações podem ser positivas (valores altos de x tendem a ser associados a valores
altos de )\ tanto como valores baixos de x tendem a ser associados a valores baixos de
y), negativas (valores altos de x são associados a valores baixos de y) ou zero (ausên
cia de relacionamento linear).
■ Coeficientes de correlação variam de -1 (relacionamento negativo perfeito), passan
do por zero, até +1 (relacionamento positivo perfeito).
■ O r de Pearson é um coeficiente de correlação paramétrico; r é o efeito natural. Pode
ser elevado ao quadrado para se ter uma medida da variância explicada, expressa
como percentagem.
■ Limites de confiança podem ser construídos em torno do r de Pearson. Se o r da
amostra é 0,5. e os limites de confiança são 0,4 a 0,6 (limites de 95%), você pode ter
95% de confiança de que, na população, r será encontrado no intervalo 0,4 a 0,6.
■ Analisar padrões de correlações dentro de uma matriz pode nos mostrai- quais variá
veis “ficam juntas”, e isso é importante na psicometria.
Coloque os seguintes dados no SPSSPW:
Sumário de casos
lllness intrusiveness
QOL (CQV*) (Incapacidade causada pela doença) STIGMA (Estigma)
1 48.00 5.00 26.00
2 99.00 1.00 30.00
3 78.00 2.00 23.00
4 47.00 4.00 43.00
5 87.00 3.00 48.00
6 68.00 2.00 20.00
7 94.00 1.00 39,00
8 66.00 6.00 40.00
9 70.00 3.00 25.00
10 67.00 3.00 28.00
11 62.00 4.00 64.00
12 85.00 2.00 33.00
13 78.00 2.00 33.00
14 87.00 3.00 34.00
15 53.00 7.00 73.00
16 79.00 1.00 20.00
17 62.00 5.00 37.00
18 79.00 6.00 20.00
19 83.00 2.00 40.00
20 86.00 2.00 21.00
Total N 20 20 20
Analise os dados:
J. Obtenha uma correlação de ordem zero entre estigma e CQV.
2. Obtenha uma correlação entre estigma e CQV, mantendo constante os efeitos da
incapacidade causada por doença. Use uma hipótese unilateral.
3. Pense sobre a direção e magnitude dos coeficientes de correlação. O que você con
clui dessa análise?
N. de T. C om prom eti m ento da Q ualidade de V ida ( Compromissos Qualiiy ofU vc).

QUESTÕES DE MÚLTIPLA ESCOLHA 5. Qual é o ntvel de significância atingido para rela

ções familiares e humor ?
Se 36% da variância nos valores dc y foi explicada (a) p < 0 ,0 0 1

pelos valores de .v. quanta variância não foi expli (b) p = 0.011
cada? (c) /7 = 0.912
ia) 64% (d) /}<0,01
ib) 36% 6. Se você obtém um coeficiente de correlação de
(c) 6% 0,5, quanta variância não foi explicada?
(d) 0.6%
(a) 25%
I. Se duas variáveis são completam ente independen (b) 50%
tes. a correlação entre elas é: (c) 75%
ia) -O.l (d) Nenhuma das alternativas
(b) -1,00
7. Alguém que fez uma análise correlacionai encon
(c) +1,00
trou um efeito de 64%. Qual é o valor de r obtido?
(d) Zero
(a) +0,8
questões 3 a 5 referem-se aos seguintes resultados: (b) -0 .8
age mood quality of family relationships
(idade) (humor) life (QV) (relacionamentos familiares)
age (idade) Pearson Correlation
1.000 -0.011 -0.093 -0.106
Sig. (2-tailed) 0.912 0.332 0.264
(Sig. bilateral)
N 113 112 111 112
Pearson Correlation
mood (humor) -0.011 1.000 0.463 -0.328
Sig. (2-tailed) 0.912 0.000 0.000
(Sig. bilateral)
N 112 118 115 117
Pearson Correlation
q u a lity o f life (QV)
(Correlação de Pearson) -0,093 0.463 1.000 -0.598
Sig. (2-tailed)
0.332 0.000 0.000
(Sig. bilateral)
N 111 115 116 115
family relationships Pearson Correlation
(relacionamentos familiares) (Correlação de Pearson) -0.106 -0.328 -0.598 1.000
Sig. (2-tailed) 0.264 0.000 0.000

(Sig. bilateral)
N 112 117 115 118
3. Das variáveis abaixo, quais demonstram o relacio (.c) 0,8. mas não podemos concluir se o valor é
namento mais forte: positivo ou negativo
(a) QV e relações familiares (d) +0.64
(b) QV e idade 8. Se você obtém um coeficiente de correlação de
(c) humor e QV 0,4. quanta variância não é explicada?
(d) humor e idade
(a) 16%
4. Qual é a correlação mais fraca? (b) 40V'
(a) QV e idade (c) 84%
(b) humor e idade (d) Nenhuma das alternativas
(c) relações fam iliares e idade
(d) relações familiares e humor
9. Tempo gasto trabalhando na frente do computador Qual é a resposta mais sensata? As variáveis mos
e visão ruim têm uma correlação negativa. O que tram uma correlação de:
você deve concluir? (a) +1,00
(a) Pessoas com a visão ruim têm maior probabi (b) -1,00
lidade de passar longas horas trabalhando na (c) +0,7
frente do computador (d) -0.7
(b) Trabalhar por longas horas pode causar danos Obser\'e o seguinte diagrama de dispersão:
à visão
(c) Um tipo específico de personalidade pode ter
maior probabilidade de ter a visão ruim e de 181
trabalhar longas horas na frente do com puta
Ifc. -
dor 14 -
o
(d) Qualquer uma das alternativas, pois correla <
OL 1/ -
ção não significa causalidade t—
íSl 10 -
1n
10. Observe o seguinte diagrama de dispersão: 8-
6-
140 i 4-
10 12
130 AG E
120
Qual é a resposta mais sensata'.' As variáveis m os
110 tram uma correlação de:
100 H
(a) -1 ,0
(b) -0,1
90 (c) +1,00
10 20 30 40 50 (d) +0,1
MATHEM AT
Questões 12 e 13 estão relacionadas à seguinte tabela
de resultados:
relationship family other social satisfied had crying

with spouse relationships relationships felt sad with life spells
(relacionamento (relacionamentos (outros relaciona (sentir-se (satisfeito (ter crises
com a esposa) familiares) mentos sociais) triste) com a vida) de choro)
relationship 1.000 0.672 0.547 0.321 0.500 0.119
with spouse
(relacionamento
com a esposa)
family 1,000 0.689 0.236 0.508 0.072
relationships
(relacionamentos
familiares)
other social 1.000 0.165 0.584 -0.010
relationships
(outros relaciona
mentos sociais)
felt sad (sentir-se 1.000 0.224 0.442
triste)
satisfied with 1.000 -0.117
life (satisfeito
com a vida)
had crying 1.000
spells (ter crises
de choro)
2. Das seguintes variáveis, quais mostram o relacio (a) 5%

namento mais forte? (b) 50%
(a) relacionamentos familiares e relacionamento (c) 25%
com a esposa (d) Nenhum a das alternativas
lb) satisfeito com a vida e relacionamentos fami
15. l ’m pesquisador deseja investigar o relacio
liares
nam ento entre m otivação e desem penho em
(c) relacionamentos familiares e outros relacio
exames. Entretanto, ele tem motivos para acre
namentos sociai:>
ditar que o QI influencia essas variáveis e decide
(d) sentir-se triste e ter acessos de choro
obter correlações parciais. Qual das seguintes
: Qual correlação e' a mais fraca? opções é a mais sensata? Fie deve fazer um a cor
(a) relacionamentos familiares c relacionamento relação entre:
com a esposa (a) Motivação e QI, controlando a variável de
(b) relacionamentos familiares e outros relacio sempenho em exames
namentos sociais (b) Motivação e desempenho em exames, contro
,c) relacionamentos familiares e ter acessos de lando a variável QI
choro (c) QI e desempenho em exames, controlando a
(d) satisfeito com a vida e ter acessos de choro variável motivação
(d) Nenhuma das alternativas é sensata
Uma correlação de - 0.5 foi obtida entre altura e
peso para um grupo de crianças. Quanto da variân Questões 16 e 17 referem-se à seguinte matriz. A s célu
cia em altura pode ser explicada pela variável peso, las foram nomeadas:
em percentagem?
Célula a1
Sintom as
d5S§ ih
nrP
Depressão ssr
Ba
cí
Incapacidade
Diagram a de
dispersão
relacionado
a sintom as
e depressão Crenças
intrínsecas
Crenças
extrínsecas
16. Qual célula está relacionada ao diagrama de disper 19. Se um coeficiente de correlação tem um valor de
são entre crenças intrínsecas e crenças extrínsecas? probabilidade associada de 0,02, então:
(a.) dl Ca) Nossa hipótese é obviamente verdadeira
(b) d2 (b) Nossos resultados são importantes
(c) d? (c) Existe uma chance de somente 2% de que
(d) d4 nossos resultados tenham ocorrido por erro
amostrai, se considerarmos a hipótese nula
17. A célula c3 está relacionada a:
verdadeira
ía) Incapacidade e crenças intrínsecas (d) Existe uma chance de somente 2% de que
(b) Incapacidade e crenças extrínsecas nossos resultados estejam corretos
(c) Incapacidade e sintomas
(d ) Depressão e sintomas 20. O SPSSPW imprime o seguinte: p = 0,000. Como
isso deve ser relatado?
18. Um relacionamento positivo significa que:
(a) p < 0,001
(a) Um relacionamento importante existe (b) p< 0,0001
(b) Quando valores em x aumentam, valores em y (c) p > 0,001
diminuem (d) p > 0.0001
(c) Quando valores em \ aumentam, valores em y
também aumentam
(d) Valores altos são freqüentes em a e y
Referências
ALT, M. Exploring Hyperspace. McGraw -Hill, 1990

CACIOPPO, J. T., PETTY. R. E. The need for cognition. Journal o f Personality and Social
Psychology, v. 42. p. 116-31.
DANCEY, C. P. et al. Perceived stigma, illness intrusiveness and quality of life in men and women
with irritable bowel syndrome. Psychology, Health & Medicine, v. n. 4, p. 381-95, 2002.
HARKAPAA, K., JARVIKOSKI, A., ESTANDER, A. Health optimism and control beliefs as
predictors for treatment outcome of a multimodal back treatment program. Psychology & Health.
v. 12,n. l , p. 123-34,2000.
HUFF, D. How to Lie with Statistics. London: Penguin, 1973.
LAWTON, R., et al. Predicting road traffic accidents: the role of social deviance and violations.
British Journal o f Psychology, v. 88, p. 249-62, 1997..
MICHAS, I. C., HENRY. L, A. The link between phonological memory and vocabulary acquisition.
British Journal of Developmental Psychology, v. 12, n. 2, p. 147-63, 1994.
ROSNOW, R. L., ROSENTHAL, R. Computing contrasts, effect sizes and cournernulls on other
people’s published data: general procedures for research consumers. Psychological Methods, v. 1.
n. 4, p. 331-40, 1996.
YERKES, R. M., DODSON. J. D. The relation o f strength of stimulus to rapidity o f habit-formation.
Journal o f Comparative Neurology and Psychology, v. 18, p. 459 82, 1908.
C Análise de Diferenças entre Duas
” Condições: o Teste t
Nos capítulos anteriores, você foi apresentado á observação de como os valores de uma
variável se relacionam com os de outra variável, e para essa análise aprendeu sobre o teste pa
ramétrico denominado de r de Pearson. Neste capítulo, você irá considerar as diferenças entre
valores em duas condições. Por exemplo, você poderia comparar a habilidade de memória de
nessoas com ou sem fobia de aranhas para ver se há diferença. Tal delineamento é chamado de
entre participantes, independente ou não-relacionado, pois um grupo de participantes fornece
os valores em uma condição, e um grupo diferente de participantes fornece os valores em outra
condição diferente. Por um outro lado, um grupo de participantes pode participar das duas
condições, por exemplo, aprendendo tanto as palavras de alta frequência quanto as de baixa
•requência. Estudamos, então, o número de palavras lembradas. Esse estudo é chamado de den
tre participantes, medidas repetidas ou relacionado, pois a mesma amostra de pessoas participa
das duas condições. Neste capítulo, vamos discutir as análises de duas condições usando o teste
paramétrico chamado teste t. Estamos interessados nas diferenças entre os dois grupos, mais
especificamente na diferença entre a media dos dois grupos. Mostraremos como analisar os da
dos desse tipo de delineamento Como o teste t é um teste paramétrico, você deve lembrar que
os seus dados devem satisfazer as suposições dos testes paramétricos, isto é, os dados devem
ser retirados de uma população com uma distribuição normal Temos a tendência de supor que
esse é o caso quando os dados da amostra satisfazem esta condição Se você tem motivos para
acreditar que não é o caso, então precisa utilizar o equivalente não-paramétrico do testo t que
é descrito no Capítulo 15.
Para entender os testes apresentados neste capítulo, você precisa de um conhecimento dos
seguintes conceitos:
■ média, desvio padrão e erro padrão (Capítulo 2)

■ valores 2 e distribuição normal (Capitulo 3)
■ suposições que formam a base do usode testes paramétricos (Capítulo 4)
■ distribuições de probabilidade como a distribuição t (Capitulo 4)
■ hipóteses unilaterais e bilaterais (Capítulo 4)
» significância estatística (Capítulo 4)
■ intervalos de confiança (Capítulo 3)
16. Qual célula está relacionada ao diagrama de disper 19. Se um coeficiente de correlação tem um valor
são entre crenças intrínsecas e crenças extrínsecas? probabilidade associada dc 0.02. então:
(a) dl (a) Nossa hipótese é obviamente verdadeira
tb) d2 (b) Nossos resultados são importantes
(c) d3 (c) Existe uma chance de somente 29f de u_
(d) d4 nossos resultados tenham ocorrido por e_
amostrai, se considerarmos a hipótese r.
17. A célula c3 está relacionada a: verdadeira
(a) Incapacidade e crenças intrínsecas (d) Existe uma chance de somente 2% de
(b) Incapacidade e crenças extrínsecas nossos resultados estejam corretos
(c ) Incapacidade e sintomas
(dl Depressão e sintomas 20. O SPSSPW imprime o seguinte: /> = 0.000. C<:
isso deve ser relatado?
18. Um relacionamento positivo significa que:
(a) /><0.001
ia) Um relacionamento importante existe (b) p <0.0001
(b i Quando valores em .r aumentam, valores cm y (c) /»>0.001
diminuem (d) />>0.0001
(c) Quando valores em x aumentam, valores cm y
também aumentam
(d) Valores altos são freqüentes em x e y
Referências
ALT, M. Exploring Hyperspace. McGraw-Hill. 1990.

CACIOPPO. J. T„ PETTY. R. E. The need for cognition. Journal of Personality and Social
Psychology, v. 42. p. 116-31.
DANCEY, C. P. et al. Perceived stigma, illness intrusiveness and quality of life in men and women
with irritable bowel syndrome. Psychology, Health & Medicine, v. 7, n. 4. p. 381-95, 2002.
HARKAPAA. K.. JARVIKOSKI. A.. ESTANDER. A. Health optimism and control beliefs as
predictors for treatment outcome of a multimodal back treatment program. Psychology & H,
v. 12. n. 1, p. 123-34.2000.
HUFF D. How to Lie with Statistics. London; Penguin, 1973.
LAWTON. R.. et al. Predicting road traffic accidents: the role of social deviance and violations.
British Journal of Psychology, v. 88, p. 249-62. 1997..
MICHAS. I. C.. HENRY. L. A. The link between phonological memory and vocabulary acquisitu
British Journal of Developmental Psychology, v. 12, n. 2. p. 147-63. 1994.
ROSNOW. R. I... ROSENTHAL. R. Computing contrasts, effect sizes and counlemulls on other
people's published data: general procedures for research consumers. Psychological Method',
n. 4, p. 331-40, 1996.
YERKES. R. M., DODSON. J. D. The relation of strength of stimulus to rapidity of habit-formau
Journal of Comparative Neurology and Psychology, v. 18. p. 459-82. 1908.
A análise de duas condições inclui:

1. Estatística descritiva, tal como médias e medianas, desvios padrões; intervalo _
confiança em torno da média de ambos os grupos separadamente, em que is>-
apropriado: ilustrações gráficas, como os diagramas de caixa e bigodes e de h_~.
de erro.
2. Tamanho cio efeito, medida do grau no qual diferenças de uma variável dependt -
são atribuídas à variável independente.
3. Limites de confiança em torno da diferença entre as medias.
4. Testes inferenciais —testes t que descobrem quão provável é que a diferença er
as condições possa ser atribuída ao erro amostrai, considerando que a hipótese :
seja verdadeira.
6.1.1 Análise de diferenças entre dois grupos independentes

Vinte e quatro pessoas foram envolvidas em um experimento para determinar se o ba',
lho de fundo (música, batida de portas, pessoas fazendo café, etc.) afeta a memória de cur
prazo (lembrar dc palavras). Metade da amostra foi alocada aleatoriamente à condição '.
rulho e metade para a condição sem barulho. Os participantes na condição barulho tentar _
memorizar urna lista de 20 palavras em dois minutos, enquanto escutavam, com fones _
ouvido, um barulho pré-gravado. Os outros participantes utilizaram também fones de ou\
mas sem o barulho, enquanto tentavam memorizar as mesmas palavras e no mesmo temr-
Imediatamente depois, foram testados para ver quantas palavras lembravam. O número ;
palavras lembradas por cada pessoa em cada uma das condições está na Tabela 6 .1.
T ab e la 6.1 D ados brutos para condições com barulho e sem barulho
Com barulho Sem barulho
5.00 15.00
10.00 9.00
6.00 16.00
6.00 15.00
7.00 16.00
.V00 18,00
6.00 17.00
9.(X) 13.00
5,00 11.00
10.(X) I2.IX)
11.(X) 13,(X)
9.<X) I I . (X)
1 = 87* £ = 166
X = 7Jf X - 13.8
DP = 2.5' DP = 2,8
J I representa o total da coluna

1 X representa a média
DP representa o desvio padrão
Estatísticas descritivas para o delineamento de dois grupos
A primeira coisa a fazer é obter as estatísticas descriiivas por m eio do procedimento

Explore (Explore) no SPSSPW (ver página 68). Você pode entender melhor os dados obser
vando ilustrações gráficas, com o os diagramas de caixa e bigodes e/ou histogramas. Resumos
estatísticos, com o as médias, os desvios padrões e intervalos de confiança, estão disponíveis
no SPSSPW. que apresenta os resultados em forma de tabelas (essas estatísticas também são
apresentadas com o parte da saída na análise dos dados através do teste r).
Você pode ver na Tabela 6.2 que as médias diferem na direção esperada. Os participantes
na condição sem barulho lembraram uma média de 13,8 palavras, enquanto os na condição
com barulho lembraram uma média de 7.3 palavras. As pessoas na condição com barulho
mostraram maior variabilidade, com o indicado pelos desvios padrões.
Tabela 6.2 Média, desvio padrão e limites de confiança de 95% para condições com barulho e seni
barulho
X Desvio padrão IC d e 9 5 % X Desvio padrão I C d e 95%
7-3 -5 5 .7 - 8 .8 13.8 2.8 1 2 ,1 -1 5 .6
Intervalo de confiança para a média
A s m édias que você obteve por sua amostra são estimativas por ponto. Essas médias
amostrais constituem as melhores estimativas das m edias populacionais. Se. entretanto, re
pelíssem os o experimento muitas vezes, veríamos que a média varia de experimento para
experimento. Por exemplo, a média da amostra para a condição sem barulho é 13.8. Se repe
tíssemos o experimento, poderíamos obter uma média da amostra de 13.3. Se o experimento
fosse repetido muitas vezes, a melhor estimativa da média populacional seria a média de to
das as médias amostrais. Deve ser óbvio, no entanto, que nossa estimativa pode ser um pouco
diferente da verdadeira diferença média na população: portanto, seria melhor, em vez de dar
uma estimativa por ponto, fornecer um intervalo de valores. Seria mais realista.
O intervalo é limitado por um valor inferior (12.1 nesse caso) e um valor superior (15.6.
no exem plo). Esses valores são denominados de limites de confiança, e os valores entre esses
limites, de intervalo de confiança. Você já viu isso no Capítulo 3. Os limites de confiança nos
indicam o quanto podemos estar confiantes de que o intervalo contém a média populacional.
Por que os limites de confiança são importantes? Quando conduzim os experimentos ou
estudos, queremos ser capazes de generalizar os resultados para a população. Também que
remos que nossos leitores tenham uma idéia com pleta e correia dos resultados. Embora a
média amostrai da condição com barulho seja 7.3. informar ao leitor que “temos 9 5 % de
confiança de que nossa média populacional está entre 5.7 e 8.8" fornece mais informação e é
mais realista do que simplesmente informar a média amostrai. Intervalos de confiança estão
sendo fornecidos cada vez mais em artigos científicos, e. portanto, é importante que você os
entenda bem.
6.1.4 Intervalos de confiança entre as condições com barulho e sem barulho

Para a condição com barulho, estimamos (com 95% de confiança) que o intervalo de 5.*
c 8.8 contém a média populacional. Isso pode ser representado graficamente, como ilustrad
pela Figura 6.1.
Figura 6.1 Limites de confiança de 95% para as condições com barulho e sem barulho.
6.1.5 Medida do efeito
Podemos também obter a média de uma para outra, a fim de verificar o quanto difere
7 .3 - 13,8 = -6,5
Esse valor, por si só, informa muito pouco. Se padronizarmos, será muito mais úti
valor bruto (valor original) é convertido em um valor;. O valor - é um valor padronizado
fornece uma medida do efeito, que é facilmente entendível. Essa medida do efeito é der
nada de d e mede o quanto duas médias diferem, em termos de desvios padrões. É cala.,
da seguinte forma:
média dos desvios
Isso significa que subtraímos uma média da outra (não importa qual é qual —itinr ■
sinal) e dividimos a diferença pelo desvio padrão da média.
Passo 1: calcular o desvio padrão da média
desvio padrão da condição 1+ desvio padrão da condição 2 2.5+ 2,8 _
Passo 2: calcular d
X - x. 7 .3 -1 3 .8 „
---------;--— — = ------------- = 2.45
média dos desvios 2,65
Nesse caso. nossas medias diferem cm 2,45 desvios padrões. Esse é um efeito muito
grande, que não e' freqüentemente encontrado em pesquisas psicológicas.
0 tamanho do efeito
ü tamanho do efeito, d, é expresso em desvios padrões. Imagine a curva normal:
Os valores z são padronizados para que a media seja zero e o desvio padrão seja 1. Pode-
se ver que. se as medias diferissem por 0 ,1, iriam diferir por somente um décimo do desvio
padrão. Esse é um número muito pequeno na nossa escala de 0 a 3. Se as médias diferissem
em 3 desvios padrões, seria considerado muito em uma escala de 0 a 3. Não existe uma regra
segura e rápida sobre o que constitui um efeito pequeno ou grande. Cohen (1988) apresenta
a seguinte recomendação:
Tamanho do efeito d Percentagem de sobreposição (%)
Pequeno 0,2 85
Médio 0.5 67
Grande 0.8 53
Quando existe uma diferença pequena entre os grupos, os valores coincidem substancial
mente. Os valores para os grupos podem ser plotados separadamente; por exemplo, os valores
para a condição com barulho podem ser plotados e tendem a ter uma distribuição normal. Os
valores para a condição sem barulho podem também ser plotados e tendem a ter. da mesma
forma, uma distribuição normal. Se existe pouca diferença entre eles. as distribuições têm
grande sobreposição.
Se existe uma grande diferença entre os dois grupos, as distribuições ficam mais separada
É o que queremos dizer por percentagem de sobreposição. Kssa medida do efeito pem:
que possamos interpretar resultados de maneira significativa. A extensão exata da sobrcpi
ção é dada na tabela abaixo:
d Percentagem de soi
0.1 92
0.2 85
0.3 79
0.4 73
0.5 67
0.6 62
0.7 57
0.8 53
0.9 4H
1.0 45
t.l 42
1,2 37
1,3 35
1.4 32
1.5 29
O tamanho do efeito é discutido também no Capítulo 7.
Atividade 6.1
Calcule o tamanho do efeito de um teste de dois grupos usando os seguintes números:

■ Grupo 1: média = 50, desvio padrão = 10
■ Grupo 2: média = 70, desvio padrão - 5
6.1.7 Estatística inferendal: o teste t

O teste r é usado quando temos duas condições. Avalia se existe uma diferença signr .
liva entre as médias das duas condições.
O teste t independente e' usado quando os participantes tomam parte em apenas uma de
duas condições, isto é, um delineamento independente, entre participantes ou não relaciona
do. Um teste /, para dados relacionados ou emparelhados, é utilizado quando os participantes
tomam parte de ambas as condições, isto é. um delineamento relacionado, dentre participan
tes ou de medidas repetidas.
O leste t foi criado por William Sealey Gosset em 1908. Gossett trabalhava para a cerveja
ria Guinness, cujos cientistas não podiam publicar os resultados de seus trabalhos científicos.
Gossett publicou seus resultados usando o novo leste sob o nome de S tu d en t (Estudante),
motivo pelo qual você verá. em livros de estatística, referências ao t de Student.
Observe novamente os dados brutos para as condições com barulho e sem barulho (Tabe
la 6.3). A primeira coisa que você deve notar é que os valores dos participantes variam dentro
das condições. Na condição com barulho, os valores variam de 3 a I I. Na condição sem
barulho, os valores variam de 9 a 18 (essa variabilidade dentre participantes pode ser vista
como variância dentro de cada coluna). Você deve lembrar, do Capítulo 2. que o desvio pa
drão c uma medida da variabilidade - quanto maior for o desvio padrão maior a variabilidade
dos valores dentro de cada condição. Os valores dos participantes diferem, também, entre as
condições. Você pode ver que os valores na condição sem barulho, no geral, são mais altos
do que os valores na condição com barulho - as médias confirmam nossa experiência visual
com os dados. Essa é a variância entre participantes e pode ser vista como a variância entre
as colunas.
Queremos saber se as diferenças entre as médias dos grupos são grandes o suficiente
para podermos concluir que as diferenças ocorrem somente devido à influência da variável
independente - quer dizer, pela manipulação das condições com barulho e sem barulho. Con
seguiremos isso fazendo alguns cálculos com os dados. A fórmula para o teste t (não dada
aqui) resulta numa estatística teste, que chamamos de “t”. O teste t é basicamente o quociente
da medida da variância entre os grupos pela variância dentro dos grupos. Quanto maior a va
riância entre os grupos (colunas), comparada com a variância dentre os grupos (linhas), maior
será o valor da estatística t.
Uma vez calculado o valor t. podemos (melhor, o computador pode) achar a probabi
lidade de obter tal valor por acaso (devido ao erro amostrai), considerando a hipótese nula
verdadeira.
Tabela 6.3 Dados brutos para as condições de com barulho e sem barulho
COM BARULHO SEM BARULHO
5.(X) 15.00
lO.(X) 9.(X)
6.<X) 16.00
6.00 15.00
7.00 16.00
3.00 18.00
6.00 17.00
9.00 13.00
5.00 11.00
10.00 12.00
11.00 13.00
9.00 11.00
1 = 87 1 = 166
X = 7.3 X = 13.8
DP = 2.5 DP = 2,8
226 C hristine P Dancey & John Reidy
Se não existissem diferenças entre a condição com barulho e a condição sem barulh
qual seria a probabilidade de achar tal valor para r?
Se não existem reais diferenças entre as condições com barulho e sem barulho e tirás-r
mos várias amostras, a maior parte das diferenças estaria em tomo do valor zero (as média
das condições com barulho e sem barulho seriam praticamente iguais). Às vezes, entretâ
to. encontramos um valor maior que zero (talvez, por exemplo, participantes na condiçl
com barulho se saíssem melhor do que os participantes na condição sem barulho). Às veze
encontramos uma diferença grande. Essas diferenças são geralmente aleatórias, existem -
mente porque usamos amostras diferentes a cada vez - dizemos que ocorrem devido ao er
amostrai. As diferenças que podemos encontrar se considerarmos várias amostras podem 'í
plotadas como mostra a Figura 6.2 (é outro exemplo de distribuição amostrai).
Se não existe diferença, dc fato, entre as médias no nosso experimento, seria mais pr
vável que o valor t estivesse na área central do que em uma das “caudas" da distribui».'
amostrai. Sabemos, por meio do teorema do limite central, que a maior parte dos valor:
obtidos estará na região central (ver página 113). Seria raro (mas possível) encontrar
valor t nas caudas, como representado acima, se conduzirmos 100 experimentos repetie
sobre as condições com barulho e sem barulho, usando amostras diferentes. Em uma peque-
percentagem de experimentos, encontraríamos um valor t que estaria nos extremos da di>-
buição. Sc na prática, obtivermos um valor t que se encontra em uma das caudas, concluín.
scr improvável que ele tenha ocorrido somente devido ao erro amostrai Podemos col<x
um número nessa "improbabilidade" também. Cada valor t obtido vem com um nível ex_
dc probabilidade associada. Se. por exemplo, nosso valor t tem um nível de probabilid^_
associada de 0,03.' podemos dizer que, considerando a hipótese nula verdadeira, um
t como o obtido em nosso experimento tem a probabilidade de ter ocorrido em .3 ocas
de 100. Portanto, concluímos que existe uma diferença entre condições que não podem
explicadas por erro amostrai. Como você já viu no Capítulo 4, isso é o que queremos d:~-
por "significância estatística", o que não quer dizer necessariamente que nossos resulta,;
são psicologicamente importantes ou que encontramos um grande efeito. Temos de levar i
consideração as estatísticas descritivas e qualquer medida de efeito, intervalos de confiar.,
etc.. que também calculamos.
y a '"'»e das
lo 0
0 0 x
D istrib u iç ã o a m o stra i.
Psicólogos geralmcntc chamam nivel de significancia atingid» l NSAj. Usaremosesses termos intcrcambiavelmente nesse i;
-^ Atividade 6.2
%
O que o teste t independente examina?
(a) A diferença entre os valores da mediana para cada condição

(b) As diferenças entre as variâncias para cada condição
(c) As diferenças entre os valores das médias para cada condição
* Saída para o teste t independente
Hm nosso experimento, a variável dependente é o número de palavras lembradas corre

tamente. e a variável independente é barulho (condição com barulho ou sem barulho). Todos
os bons pacotes de programas computacionais, como o SPSSPW, darão as seguintes infor
mações:
■ As médias das duas condições e as diferenças entre elas: o que você deseja saber é
se a diferença entre as duas médias é grande o suficiente para ser importante (não so
mente a "significancia estatística", que informa a probabilidade de a estatística teste
ser obtida quando a hipótese nula for verdadeira).
■ Intervalos de confiança: o SPSSPW, usando o procedimento teste r. fornece os limites
de confiança para a diferença entre as médias." A diferença entre as médias amostrais é
uma estimativa por ponto. Essa diferença das médias amostrais é a melhor estimativ a
da diferença das médias populacionais. Se. entretanto, repetirmos nosso experimen
to muitas vezes, veremos que a diferença varia de experimento para experimento. A
melhor estimativa da média populacional seria a média de todas essas diferenças de
médias. Claramente, é melhor fornecer uma estimativa por intervalo, como explicado
anteriormente. Limites de confiança nos fornecem o quanto está confiante de que a
diferença da média populacional encontra-se em certo intervalo. É uma estimativa
por intervalo para a população (não somente para a amostra).
■ Valor t: quanto maior o valor t. maior a probabilidade de que a diferença entre os gru
pos não resulte do erro amostrai. Um valor negativo é tão importante quanto um valor
positivo. A direção positiva ou negativa dependerá de como os grupos tenham sido
codificados. Por exemplo, chamamos a Condição I de com barulho e a Condição 2
de sem barulho. Obviamente, isso foi uma decisão arbitrária, pois poderíamos ter
feito ao contrário, o que resultaria no mesmo valor absoluto de r. mas com um sinal
diferente (positivo ou negativo).
■ Valor p: é a probabilidade de o valor t obtido ter ocorrido devido à variabilidade amos
trai ou erro, sendo a hipótese nula verdadeira. Isso significa que o valor t obtido está
em uma área da curva incomum. isto é, não seria esperado que tal valor estivesse,
aleatoriamente, nessa região. O valor p é a probabilidade de isso ter ocorrido devido ao
erro amostrai. Por exemplo, p = 0.001 significa que existe somente uma chance em mil
de esse resultado ter ocorrido por erro amostrai, sendo a hipótese nula verdadeira.
■ Grau de liberdade (gl): para a maioria dos propósitos e testes (mas não todos), os graus
de liberdade aproximadamente se equiparam ao tamanho da amostra. Para um teste t
relacionado, o grau de liberdade e' sempre um a menos que o número de participantes.
C filais im portante relatar o intervalo de co n fia rç a para a diferença entre as m íd ias d o que relatar os intervalos para a s duas m&liás
separadam ente.
Para um teste t independente, os graus de liberdade são (»1 —1) + (n - I),' portanto r .
uma amostra de 20 (10 participantes em cada grupo).,?/ = 18 (p.e. 9 + 9) . Para
delineamento dentre participantes com uma amostra de 20 o #/ = 19. Os graus de
berdade devem sempre ser considerados em relatórios ou projetos de laboratório, ju ';
com o valor r, o valor p e os limites de confiança para a diferença entre as média>
grau de liberdade é geralmente escrito entre parênteses, por exemplo: /(87) = 0.78.
significa que o valor 1 foi 0,78 para um grau de liberdade igual a 87.
■ Desvios padrões: fornece a variabilidade das amostras envolvidas no teste (ver p—
na 90).
■ Erro padrão da media (epm): é utilizado no cálculo dos intervalos de confiança 1
página 126).
Grau de liberdade
Esse e um termo matemático geralmente usado nas fórmulas dos testes estatísticos. Existe
definições matemáticas que não são úteis para muitos psicólogos e outras que sim. como, por exem
plo. a do grau de liberdade, que se refere ao número de valores individuais que podem variar (serer
livremente alterados) no cálculo da variância da amostra. Alguns exemplos podem ajudar a ilustr_-
o conceito. Por exemplo, se pedirmos que escolha dois números quaisquer, sem restrições, há d.
graus de liberdade. Agora, se solicitarmos que escolha dois números cuja soma seja 10. então. u í t _
vez escolhido o primeiro número, por exemplo, o 7, o outro não será mais livre, pois você necessa
riamente deve escolher o 3 para que a soma seja 10. Neste caso. você dispõe de apenas um grau úz
liberdade.
Vamos examinar um exemplo que não envolva matemática. Imagine que você é o anfitrião d;
um jantar importante e que precisa alocar 10 pessoas em uma mesa. O conhecimento de onde
primeiros nove irão sentar irá determinar onde a décima pessoa senta. Assim você tem liberdade óz
decidir onde as primeiras nove pessoas irão sentar, mas o lugar da decima estará automaticamente
determinado pela posição das primeiras nove (o gl é, neste caso. 10 - 1 = 9). Agora imagine qu;
você c o anfitrião de uma janta à moda antiga, na qual você tem cinco mulheres e cinco homen^.
precisa colocar cada mulher ao lado de um homem. Nesse caso, sabendo onde os primeiros quatr
pares sentam (oito pessoas), resulta que os lugares do último par (um homem e uma mulher)estarã
determinados, isto é . o g = 10 —2 = 8).
Isso acontece porque, como visto no exemplo do jantar, temos a liberdade de variar todos e
números exceto um quando formos estimar a variância da população, pois um dos valores estar,
automaticamente determinado pelo conhecimento do valor da média da amostra, isto é. para p
dermos calcular a variância amostrai, precisamos ter calculado primeiramente a média amostrai
Portanto, o conhecimento da média da amostra retira um grau de liberdade no cálculo da variânc:.
dessa mesma amostra.
E claro que os psicólogos estão geralmente ocupados com sua profissão, e não freqüentar
jantares. Portanto, uma maneira mais útil de pensar sobre o grau de liberdade é considerá-lo
número de observações feitas menos o número de parâmetros estimados. Quando calculam* -
testes estatísticos, geralmente temos de estimar parâmetros. Uma vez que no teste t temos de
Mií o núm ero de participantes cm cada grupo.

* N. de T. O s autores estão considerando apenas o caso em que os tam anhos am ostrais são iguais, o q ue não ó obrigatório p.
teste 1 independente.
Tiar a media para podermos calcular a variância da amostra, perdemos um grau dc liberdade.
' :>>o é que dividimos a variância por n - I em vez de n. Quanto mais parâmetros forem estima-
maior será a redução do grau de liberdade. O gl é resultado tanto do número de participantes
i vidos na análise quanto do número de variáveis. Não e fácil encontrar um livro de estatística
. -c explique bem o que é o grau de liberdade ou que mostre sua relevância. O Dr. Chong Ho Yu
■ece uma das melhores explicações do grau de liberdade que já vimos, mas boa parte se baseia
conceitos que você irá aprender no Capítulo 11. então falaremos mais sobre o grau de liberdade
-ido chegarmos lá. Se você deseja ver e ouvir o tulorial do Dr. Chong Ho Yu sobre o grau de
x-rdade na Internet, o endereço do site é dado no final deste capítulo (Yu. 2003).
Atividade 6.3
Às vezes é fácil ficar confuso quando os psicólogos usam vários nomes diferentes para a
mesma coisa. Quais são os nomes alternativos para um delineamento dentre participantes?
Quais são os nomes alternativos para um delineamento entre participantes?
‘9 Suposições que devem ser satisfeitas no uso do teste t

O teste t é um teste puramétrico, o que significa que certas condições sobre a distribuição
dos dados precisam ser válidas; por exemplo, os dados devem ser retirados de uma população
de valores normalmente distribuída. Supomos que esse é o caso se nossos valores amostrais
são normalmente distribuídos. Você pode ver se os seus dados são assimétricos examinando
o histograma. No passado, para poder realizar um leste r. você seria advertido para utilizar
somente dados intervalares. Entretanto, há muitos anos os psicólogos têm usado testes / para
a análise de dados obtidos por meio de escalas do tipo Likert (nas quais variáveis podem ter
sido avaliadas em uma escala de. digamos. 1 a 7).
O teste i se baseia na distribuição normal. Portanto, consideramos que os valores de nossos
grupos, ou condições, são normalmente distribuídos. Quanto maior a amostra utilizada, maior
a probabilidade de se obterem dados normais. Desde que os dados tenham uma distribuição
aproximadamente normal, você não precisa se preocupar: mas se eles são extremamente assi
métricos, então será necessária a utilização de um teste não-paramétrico (ver Capítulo 15).
Nesse estágio, recomendamos uma olhada rápida nos histogramas de cada variável (eles po
dem ser obtidos com o auxílio do procedimento Frequencies (Freqüências) do SPSSPW). Você
deve lazer isso com cada grupo separadamente. As Figuras 6.3 a 6.6 servem como diretrizes.
Lembre que. quando usamos o teste t. comparamos uma diferença de médias. Se nossos
dados são assimétricos a média pode não ser a melhor medida da tendência central.
No passado, os psicólogos eram aconselhados a aplicar um teste t somente quando as
variâncias entre os dois grupos estivessem próximas. A razão disso é que ao calcularmos
parte da lórmula (para o teste /). é feita a média das variâncias dos dois grupos envolvidos.
Se as variâncias forem muito desiguais, então o resultado obtido não será representativo de
nenhuma das duas condições. O SPSSPW. entretanto, usa um método modificado de calcular
o valor t. no caso de as variâncias serem significativamente desiguais, que permite sobrepor
esta restrição.
A ssim e tria le ve m e n te p o sitiva.

Figura 6.3
A ssim e tria le ve m e n te n e g ativ a.

Figura 6.4
Figura 6.5 A ssim e tria fo rte m e n te p o sitiva.
Figura 6.6 Assim etria fo rtem ente negativa

Quando temos um número de participantes diferente nos dois grupos, pode ser enganoso
obter uma média simples das duas variâncias, pois seria atribuir pesos iguais aos dois grupos,
quando de fato um grupo tem um número maior de participantes. Nesse caso, deve-se utilizar
a média ponderada. A média ponderada das variâncias amostrais (denominada de estimativa
combinada da variância populacional) é usada para obter uma estimativa mais precisa da
variância da população.
Se os dados apresentarem uma forte assimetria e você tem um número pequeno de parti
cipantes, convém considerar o uso de um teste não-paramétrico (ver Capítulo 15). Os testes
não-paramétricos não necessitam da suposição de normalidade.
10 0 teste f para amostras independentes

Vainos usar o nosso exemplo do experimento com barulho e sem barulho para examinar
as instruções de saída do SPSSPW de um teste t para amostras independentes.
SPSSPW: para um teste t independente
Abra seu arquivo de dados. Primeiro deve montar um arquivo próprio para delineamentos
independentes. Você aprendeu a fazer isso na seção do SPSSPW do Capítulo 1; então, por
favor, refira-se a essa seção.
FI» íá t Yww Afufen Giaph: UtdUei

Rogati
,rJ r*íal
u fe I i
LnMr Mc«» ** r
s Corclito
Qegreznon Pved-Samcto; T Test
Qr»W*>âN<JVA
600 Ctecaiy
700 Qata R m x io t
Ver S cjte
Ncnpaametnc Terti
T m Sa««
900 Sur vivai
LCD Myfhote Rcx>c»«e
Mtiuig Vdue A r u 4 y u :
I I CO
900 ir°
2 00
900 200
1600
200
J uu
2 00
i300_ :oo^
« I > K o«44 variatM v » w y 14Í. J
|ki*õer*iert Safreki T tes»
33 t______
<si-i| I 3’MciT.tfiW I laMnaiUní j| pjch«p06_i ‘J.3-Í « O 1513
Isso abre a caixa de diálogos Independent-Samples T Test (Teste i para amostras indepe-
dentes), como segue:
a rs
^ iÜ M * 1 - 1 I M&| MH ir I jj.i.ir.1 - * w
C o lo q u e a variável
d e p e n d e n te na esq u erd a
na lista Test V ariable (Variável
Teste) clica n d o so b re ela e
u tiliza n d o o b o tão > .
Mova a variável independente

da esquerda para a caixa Grouping
Variable (Variável de Agrupam ento
e clique em seguida no botão
D efine G roups (Definir Grupos)
--------1------
ÍEmrnv,-« I f 15 WrZfjfUf» ||stìch««_i | »¡J'^ oc<> '51?
Aparece a caixa de diálogo Define Groups (Definir Grupos).

Você precisa dar o valor que atribuiu a cada grupo. Por exemplo, se codificou o grupo
das mulheres como "0" e o dos homens como “ 1". então sexo (0. 1) é o formato correto. Em
nosso exemplo, entretanto, nossos grupos foram designados como 1 e 2.
Clique em Continue (Continuar). Essa ação o leva de volta à caixa de diálogo anterior:
então você pode clicar em Options (Opções), que o levará à seguinte caixa de opções. E aqui
que você pode mudar o nível de confiança, de 95% para 90%. por exemplo.
Clique em Continue (Continuar) e após em OK.
-Ul»l
*13111 s _ i _ 1 tl& J Mj £ 1 £ | U M 3 Pressione
Continue
(Continuar)
* ■ -«!»»- « l. :V -i|»:r -¿¡»i M -ri-.-T X l

g M c n .n » - - I «O 152C
Os resultados aparecerão na janela de saída. A maioria das saídas fornece muito mais
informação do que você realmente precisa e pode parecer uma confusão de números. Entre
tanto. você aprenderá a selecionar o que realmente importa para o seu experimento ou estudo.
Algumas partes da saída simplesmente dirão o que você já sabe! Por exemplo, na primeira
seção da saída abaixo obtemos:
■ o nome das duas condições
■ o número de casos em cada condição
■ a média em cada condição
■ o desvio padrão e o erro padrão da média das duas condições
As informações mencionadas podem ser vistas rapidamente, pois já as conhecemos. Uma
vez que sabemos o que ignorar, nossa saída será fácil de ler. Essas são as estatísticas de grupo
que aparecem em primeiro lugar na saída:
Group Statistics (Estatísticas dos grupos)

Noise and no noise Mean Standard Deviation Std. Error Mean
(com barulho e sem barulho) N (Média) (Desvio Padrão) (Erro Padrão da Média)
SCORE 2.4909 .7191
(Escore) noise (com barulho) 12 7.25 00
no noise (sem barulho) 1Z 13.8333 2.75 79 .7961
Na próxima seção da saída, encontra-se o que realmente nos interessa.

independent Samples Tost (Teste para Amostras ndependentes)

Levene's Test t-test for Equality of Means
for Equality (Teste t para a Igualdade de Medias1
of Variances
(Teste de
levene para
a Igualdade
de Variâncias)
F Sig. T Df (gl) Sig. Mean Std. Error 95% Confidence
(2-tailed) Difference Difference Interval of the
(Sig. (Diferença (£rro Difference
Bilateral) das Médias) Padrão da (IC de 95%
Diferença) para a Diferença:
SCORE Equal Varian 177 678 -6 137 22 .000 -6 .5 8 3 3 1.0728 8.8082 -4.3585
(Escore) ces Assumed
(igualdade de
Variâncias
Assumida)
Equal Varian /
/ -6.137 21.776
/
/.000
\
- 6 .5 8 3 Í 1.0728 -8.8095 -4.3572
ces Not Assu
med (Igualda
de rie Variâncias
Sig.
Não-assumida)
Significancia
\
Isso mostra que não existem diferenças Geralmente relatamos Essa é a
significativas entre as variâncias probabilidades exatas. Quando diferença
p = 0,678, portanto usamos a parte o SPSSPW imprime uma fileira entre as
da saida chamada de equal variances de zeros, entretanto, mude médias
assumed (suposição de variâncias iguais), o último número para 1, e use
como indicado pelo SPSSPW o sinal p <. Portanto, p < 0,001.
Uma das coisas que você notará é que o SPSSPW usa um leste chamado de teste C;
Levene para a igualdade de variâncias (Levene's Test fo r EquaUty o f Variances). É usa,;
para verificar se as duas condições têm variâncias iguais. Quando duas ou mais conc
Çôes apresentam variâncias iguais, lemos a denominada "homogeneidade de variância'
Alguns testes estatísticos, como o teste t. supõem que as variâncias enire os grupos
amostras são iguais. O teste de Levene pode ser usado para verificar essa suposição,
tesie t. realizado pelo SPSSPW. fornece dois conjuntos de resultados - um para usar quti
do satisfazemos a suposição (p. ex., as variâncias são iguais) e um para usar quando n.
conseguimos satisfazer a suposição (p. ex., as variâncias são diferentes). O leste de L.e\e:
nos fornece um valor F. que você ainda não aprendeu, mas é um teste parecido com o r.
fato quando o gl = 1. r = |- ou I = sJF . Portanto, sc / = 3. você sabe que isso é igual a u-
valor F de 9. Você aprenderá a estatística F mais tarde, no Capítulo 9.
O leste de Levene é um teste de homogeneidade de variâncias que não depende da suposk_
de normalidade. Quando estamos decidindo se satisfazemos ou não a suposição de variánc:
iguais, precisamos olhar para o valor p dado ao lado do valor F. Para sermos consistentes o
a convenção tradicional, devemos concluir que nossas variâncias são diferentes (d esig u ais ¡
nosso valor p é menor que 0,05. Se o valor /; é maior que 0.05. admitimos que as variâncias
aproximadamente iguais. O SPSSPW usa o critério de p < 0.05 para decidir se as variâncias v
iguais. Obviamente, essa decisão é sujeita às mesmas restrições delineadas no Capítulo 4 ptr.
teste de hipóteses. Para deixar mais simples, usaremos o critério do SPSSPW, como explicad.
Os resultados podem ser relatados como segue:
O s participantes na con d ição com barulho lem braram de m enos palavras ír(22) = 7.3. d o
p adrão = 2.5) do que os participantes na con d ição sem barulho (r(22) = 23.X. DP = 2 .8 ). A d ifere:..
\ ili- I . How ard I-cvene ( I ^ I-4—2<K)3 ), professor em érito do Departamento de Biologia do Instituto Politecnico da Virginia B L ..
burs. VA Estados Unidos.
de m édias entre as condições foi de 6,58, que c um grande efeito (</ = 2.45): o intervalo de c o n fia n
ça de 959c para a diferença e stim ad a das m édias populacionais é 4.36 a X.X 1. O tesie r independente
revelou que. se a h ipótese nula fo sse verdadeira, tal resultado seria im provável (/(22) = 6.14: /> <
0.001). P ortanto, conclui-se que escu tar b a rulho afeta a m em ória de curto prazo, pelo m enos q u a n
to à lem brança de palavras.
EXEMPLO: NECESSIDADE DE COGNIÇÃO
Algumas pessoas passam bastante tempo engajadas na resolução de problemas, en

quanto outras não. Existem grandes diferenças individuais na tendência de pessoas se
engajarem c gostarem de atividades cognitivas. Essa dimensão da diferença individual é
chamada de necessidade de cognição. Na seguinte seção da saída, homens e mulheres fo
ram comparados nessa dimensão. Há muito mais homens no estudo do que mulheres. Não
só as médias são parecidas, como também o desvio padrão e o erro padrão da média.
Men and Women Std. Error Std. Error Mean

j f í
(Homens e Mulheres) N (Desvio Padráo) (Erro Padrão da Médâ)
NECESCOG Mon (Homens) 440 62 4886 9.942 .474
Women (Mulheres) 290 63.1586 8.4 8 4 498
Aqui está a próxima seção da saída:
Independent Samples Test (Teste de Amostras Independentes)

for Equality of (Teste l para a Igualdade de Médias)
Variances (Teste
de Leveny para
a igualdade
de Variâncias)
F Sig. t df (gl) Síg. Mean Std Error 95%
(2-tailed) Difference Difference Confidence
(Sig. (Diferença (Frro Interval of the
Bilateral) das Padrão da Difference (ic
Medias) Diferença) de 95% para
a Diferença)
MECES Equal -9 4 728 .346 -.6 7 0 0 .710 -2 .0 6 4 .724
COG Variances
Assumed
(Assumida a
laua'dade de
Variâncias)
Equal 14.577 .000 -.9 7 631.39 .330 -.6 70 0 688 -2.02 0 680
Variances
Not Assumed
(Igualdade
Be Variâncias
\
Não-assumida) /
Sig. Significancia
As variâncias aqui são significativam ente

diferentes, isto é, nâo são iguais, portanto P = 0,33, então existe uma chance de 33 % de
usam os a linha das variâncias náo-homo- que esses resultados se devam unicam ente ao
gêneas (equal variances n o t assum ed) erro amostrai se a hipótese nula for verdadeira.
Você pode ver que a diferença de média entre as condições é de 0.67. As variâncias
entre os dois grupos são significativamente diferentes, por isso utilizamos a linha das vari
âncias supostamente diferentes (equal vuriances noi assumed). Isso mostra um valor r de
-0,97. O intervalo de confiança indica que estamos 95% confiantes de que o intervalo de
2,02 a 0.68 contenha a diferença das médias populacionais, em outras palavras um limite
muito amplo. O intervalo de confiança inclui o zero. o que significa que, se repetirmos o
estudo com uma amostra diferente, as mulheres podem exibir valores mais altos do que
os homens (como nesse caso. no qual a diferença de média é —0.67). os homens podem
exibir valores mais altos que as mulheres, ou pode não haver diferença alguma (zero). Ob
viamente, isso não é bom o suficiente, e temos de concluir que os grupos não diferem em
necessidade de cognição. Afirmamos isso devido ao baixo valor t (0.97) e o nível de signi-
ficância associado p = 0,33. Isso quer dizer que. sendo a hipótese nula verdadeira, temos
uma chance de 33% de obter um valor t de 0,97.
CUIDADO!
Lembre-se de que um sinal negativo quando obtemos / é equivalente a um sinal posi

tivo. Quer dizer, um / de, digamos, -5 é equivalente a um valor de +5.
fatores psicológicos e doenças coronarianas
Ketterer e colaboradores (1996) observaram fatores psicossociais e doenças coronari ana-

Apresentaram uma tabela comparativa entre pacientes que completaram 0 estudo e outros que de
xaram de completar. Os testes t comparam esses dois grupos nas variáveis listadas na Tabela 6.4 C
resultados são apresentados como médias e desvios padrões.
Essa tabela de resultados é muito útil. pois em único lugar temos as médias para ambo<
grupos (e os desvios padrões), o que nos permite ver a direção da diferença. Além disso, fome. ;
probabilidades exatas, que oferecem muito mais informação do que um simples "não-significa:
vo (você verá mais tarde que alguns autores não relatam níveis de probabilidade exatos, aper..
informam se os resultados foram significativos ou não. Entretanto, com o advento de bons pa.
tes estatísticos, você poderá relatar níveis de probabilidade exatos). A variável que diferenc
os grupos em um nível significativo íoi educação (cm anos). Podemos ver pelas médias que
participantes que completaram o estudo tinham um nível de escolarização mais alto (em tenr
de número de anos) do que os participantes que não completaram o estudo. Entretanto, os d
grupos não apresentaram diferenças significativas em nenhuma das outras variáveis. Embora .
tenhamos os efeitos, podemos calculá-los, pois temos todas as informações necessárias. Por . .
não tentar?4
Você p«xlii conferir *eus cálculos com os nossos, na página 572.

. abela 6.4 Médias, desvios padrões e valores de probabilidade para participantes no estudo de Keuerer e
.íboradores (19%)
Compliant participants In = 175) Non-eompliant participants

iParticipantes até o (Participantes que
fini do estudo (n = 175)) abandonaram in = 187)) P
- ie iUlude) 58.0 (10.6) 58.9(11.8) 0.435
Education (in years)
^¿ucaâo cm anos i 13.7(2.8) 12.613.3) 0 .0 0 1
F¿ck-years of smoking
' anuais fumados) 42.9(43.6) 49.0(44.4) 0.191
- 'iirs of cxcrcise (per week)
i >rjs de exenncio - por semana) 2.414.5) 2.1 (4.3) 0.530
_ilieine (Calcina) 3.3 (3.9) 3.5 (3.7) 0.668
- oy Mass Index
- Jiee lie massa corporal) 19.2(2.61 19.3(3.3) 0.582
- coohol (drinks per day)
A-lcool - drinques por ilia) 0.5 (1.4) 0.7 (2.2) 0.373
: 1.11 Teste f relacionado

O leste t relacionado também é conhecido como o teste t pareado. Esses termos são inter-
cambiáveis. Como explicado na página 220. o tesle t relacionado é usado quando os mesmos
participantes tomam parte de ambas as condições. A fórmula para esse teste é parecida com a do
teste t independente. Entretanto, o teste t relacionado é mais sensível. Isso ocorre porque cada
participante toma parte nas duas condições, c, portanto pode ser testado contra ele mesmo. Se
tivermos 20 pessoas cm um delineamento relacionado (as mesmas 20 pessoas em ambas as con
dições). precisaríamos de 40 em um delineamento não-relacionado (20 em cada condição). Desse
modo a fórmula para o leste r relacionado leva em consideração o fato de que estamos usando os
mesmos participantes. Se você comparar um teste t relacionado com um independente que use o
mesmo conjunto de dados, descobrirá que o teste t relacionado fornece o resultado com um valor
de probabilidade associada mais alta. pois a comparação dos participantes consigo mesmos reduz
a variância dentre participantes, levando a um valor mais alto de t.
Imagine que você quer descobrir se tipos diferentes de visualização ajudam no controle
da dor. Para simplificar, vamos supor que existem dois tipos de visualização:
■ lmagine-se realizando um teste t muito excitante (condição estatística).
■ Imagine-se deitado em uma praia ensolarada, bebendo aperitivos (condição praia).
Os participantes sentam c são levados pela visualização, enquanto suas mãos são colo
cadas em água quase a ponto de congelar. Embora não tenhamos tentado isso. temos certeza
de que deve ser muito dolorido. A variável dependente é o número de segundos que nossos
participantes agüentam ficar com as mãos dentro da água. Agora, como estamos conduzindo
esse estudo com um delineamento dentre participantes (pois é mais sensível), não podemos
simplesmente colocar os participanLes em uma condição, e depois noutra (isso pode levar
a efeitos de ordem, ou pode ser que ninguém retorne para a segunda condição). Portanto,
metade dos participantes participa da condição A e depois da B. e metade dos participantes
participa da B e depois da A (ver contrabalanceamento no Capítulo l ). Algumas pessoas po
dem pensar que nossa hipótese é unilateral porque visualizar-se deitado na praia ensolarada
ajudaria mais no controle da dor do que pensar em estatística. Entretanto, aconselhamos a
determinar se sua hipótese é unilateral ou bilateral com base em pesquisas prévias, não só
baseado em uma opinião! Como não existe pesquisa feita com esse tópico (que saibamos),
vamos formular uma hipótese bilateral. Os dados estão na Tabela 6.5.
Tabela 6.5 Tempo (em segundos) que as mãos foram mantidas dentro da água em cada condição
Participante Condição estatística Condição praia
1 5 7
-}
7 15
3 6
4 fi 7
5 10 12
6 4 n
7 7 10
X 8 14
9 8 13
10 15 7
□ SPSSPW: delineamento de medidas repetidas para duas

amostras: teste tpareado
Abra seu arquivo de dados. Escolha Puivcd-Scimples I Test (Tcsic t para amostras emp_
relhadas) do menu Compare Means (Compare Médias).
•* C# ■'í— i'S: luouiw ■u i , 1 •*•»*»• hc*
* rr,.. . . . . :j*rjvirt
Para selecionar o par de variáveis:

1. Clique na primeira variável.
2. Clique na segunda variável.
3. Clique ein ►para deslocar o par.
li1.riMj.j:1!1a — — p b t -v •~sjf.
*«»■1 U tjJ» * 3‘iS »1»"
Clique em Options (Opções). Se desejar (ver acima), clique em Continue (Continuar)

dentro da caixa de diálogo. Seus resultados aparecerão na janela de saída.
Em primeiro lugar, obtemos as estatísticas de grupo. Isso nos fornece as estatísticas des
critivas usuais: a média, o número de participantes, o desvio padrão c o erro padrão da média.
Paired Samples Statistics (Estatística dai Amostras Pareadas)
Standard Deviation Std. Error Mear

Mean (Media) N (Desvio Padrão) (Erro Padrão da Méai.í
Pair 1 (Par 1) STATISTI
7 .30 00 10 3.40 10 1.0755
(Estatística)
BEACH 10.3000 10 3 3350 1.0546
(Praia)
A próxima seção da saída fornece a correlação entre as duas condições:
Paired Sampies Correlations (Correlações entre as Amostras Pareadas)
N Correlation (Correlação) Sig. (Significancia
Pair 1 (Par 1) STATISTI & BEACH

10 .070 .849
(Praia e Estatística)
Isso indica que não existe um relacionamento entre os valores na condição praia e
valores na condição estatística (/- = 0,07, que é realmente muito fraco).
Então, chegamos às estatísticas das amostras emparelhadas:
Paired Samples Test (Teste das Amostras Pareadas)
Paired Differences (Diferença Pareada)
95% Confidence
Std. Error Interval of the
Std. Mean Difference (1C de 9S% Sic
Deviation (Erro para a Diferença) (2-tailec
Mean (Desvio Padrão df (S.g
(Média) Padrão) Lower Upper
da Média) t (gl) Bilaters
V (Inferior) (Superior)
Pair 1 STATISTI BEACH
(Par 1) (Praia estatística) -3 .0 0 0 0 N 45947 1.4530 -.2 8 7 6.287 2 06 9 .069
A diferença entre a O intervalo de confiança mostra p = 0,07
média da condição que temos 95% de certeza de
praia 10,3 e a que o intervalo de -0,287 a
condição estatística 6,287 contém a diferença das
7,3 é 3 médias populacionais
Embora possamos constatar que os participantes na condição praia realmente mantiverar

suas mãos na água quase congelada por mais tempo (média = 10.3 segundos em contraste corr
a média da condição estatística de 7.3 segundos), a análise resultou em um valor i de 2,06. corr
um nível de probabilidade associada de 0.069. O intervalo de confiança é amplo (podeivk
di/er. com 95' v de confiança que o intervalo dc -0,287 a 6,827 contém a verdadeira difereik _
das médias populacionais). Isso significa que não podemos ter muita certeza, ao repetirmos
estudo, de que a visualização da praia daria um resultado melhor. Portanto, temos de conclu;-
que não existem evidências que sugiram que esse tipo de visualização afete o controle da dor
Parte da análise pode ser assim:
E m bora se p o ssa ver que os particip an tes na c o n d ição praia m antiveram suas m ãos na á g u .
quasc congelada por u m a m édia de 10.3 segundos, enquanto a m édia da c ondição e statística foi 7..-
segundos, os lim ites de confiança de 9 5 r/c nos m ostram que. se rep etíssem o s o experim ento, a d i
ferença das m édias p opulacionais entre as co n d içõ es estaria em algum ponto entre -0 .2 8 7 e 6 ,2 8 “
Portanto, não podem os ter certeza de que. na população, a visualização da praia teria um m elhor
resultado lt(9) - 2,06: p = 0,07).
EXEMPLO: 0 Ql VERBAL E 0 DE DESEMPENHO DE

j f c J PESSOAS QUE SOFREM DE DOENÇAS CRÔNICAS
Um estudo foi conduzido comparando o QI Verbal (QIV) c o Ql de desempenho (QID)

de pessoas que estão sofrendo de doenças crônicas. Em uma população normal, espera-se
que as duas medidas sejam similares. A média populacional de Ql é 100.
O SPSSPW fornece uma correlação entre as duas condições:
Pai red Samples Correlations (Correlações de Amostras Pareadas)
Correlation
N (Correlação) Sig.
Pair 1 (Par 1 ) Verbal IQ & Performance IQ
(Ql verbal e Ql de Desempenho) 40 .680 .000
Como seria esperado, existe um relacionamento forte positivo entre as duas medidas
de QI. I.embre-se de verificar a primeira parte da saída que confirma quantos pares você
tem como também os nomes das variáveis.
Paired Samples Statistics (Estatística dai Amostras Pareadas)
Std. Deviation Std. Error Mean

Mean (Média) N (Desvio Padrão) (Erro-Padrão da Média)
Pair 1 Verbal IQ (Qi Verbal) 94 .8 75 0 40 12.03880 1.90350
(Par 1) Performance IQ
(Ql de Desempenho) 109.1000 40 12.86777 2.03 45 7
Podemos ver imediatamente que o Ql verbal do grupo é mais baixo que o QI de de
sempenho.
- ; "íd Samples Test (Teste das Amostras Pareadas)
95% Confidence
Interval of the
Std Std. Error Difference (1C de 95% Sig.
Deviation Mean (Erro para a Diferença) (2-tailed)
Mean (Desvio Padrão (Sig
Lower Upper
(Média) Padrão) da Média) (Inferior) (Superior) t df (gl) Bilateral)
I ,1 Verbal IQ & Perfor-
. mance IQ (Ql Verbal -14.2250 9.98842 1.57931 -17.4195 -11 .0 30 5 -9 .0 0 7 39 000
e Ql de Desempenho)
- : - Significancia
Nesse caso. a diferença em pares da média amostrai (entre QI verbal e de desempenho)

é 14.23. Hm relação à diferença da média populacional, temos 95c7c de confiança de que o
valor está entre 11.03 e 17.42.
t (39) = -9.01 tem um valor p associado de p < 0.001. que significa que. sendo a hipó
tese nula verdadeira, tal valor teria ocorrido menos de uma vez em 1000 vezes. Isso é tão
improvável, que concluímos que as diferenças entre o Ql verbal e de desempenho do grupo
não devem ter ocorrido por erro amostrai.
Atividade 6.4
Observe a seguinte impressão, relacionada às duas próximas questões.
Group Statistics (Estatísticas dos Grupos)
Condition Mean Std. Deviation Std Error Mean

(Condição) N (Média) (Desvio Padrão) (Erru Padtão da Média)
Memória Coni 10 15.6000 5.621 .1778
Con2 10 23.9 00 0 11.130 3 .5 2 0
Paired Samples Correlations (Correlações de Amostras Pareadas)
Correlation
Pair 1 (Pari) Coni and Con2 (Comi e Com2) 10 .786 .007
Sig. Significancia
Paired Samples Test (Teste de Amostras Pareadas)
95% Confidence
Interval of the
Std. Std. Error Difference (1C de 95% Sig
Deviation Mean (Erro para a Diferença) (2-tailed)
Mean (Desvio Padrão Sig
Lower Upper
(Média) Padrão) da Média) t df (gl) Bilateral
(Inferior) (Superior)
Pair 1 , _ -
(pa r j ) C o ni e Con2 -8 .3 0 0 0 7.558 2.390 -1 3 .7 0 7 -2 893 - 3 .4 7 9 .007
1. O valor da estatística teste é:

(a) 0,007
(b) -8,30
(c) -3,47
2. A diferença entre as médias das condições 1 e 2 é:

(a) -8,3
(b) 7,558
(c) 2,390
Exemplo da literatura: controle

percebido e sofrimento após agressáo sexual
Fra/ier (2003) coletou dados dc mulheres que sofreram agressão sexual séria, em quatro pontos
.pós a agressão. Os dados forneceram informações relacionadas à maneira como crenças sobre
. rntrole e sofrimento mudam com o tempo após a agressão. Essas estatísticas descritivas:
2 semanas 2 meses 6 meses 12 meses

(n = 88) (n = 98) (n = 89) (« = 92)
Desvio Desvio Desvio Desvio

Variável padrão padrão padrão padrão
>ninile
•.jioculpa comportamenlal .'.54 1.18 3.37 1.07 3.07 1.14 2.88 1.10
j|p a ao Estuprador 3.85 0.95 3.65 1.15 3.73 1.16 3.47 1.21
■miróle sobre a recuperação 3.74 0.77 3.93 0.71 3.91 0.79 4.03 0.78
- >ntrole Futuro 4.07 0.63 4.23 0.64 4.13 0.72 4.12 0.64
- jutra i não) probabilidade 2.40 0.76 2.63 0.84 2.72 0.75 2.81 0.75
Je agressão
irimtnu)
'■'iedade 2,31 0.85 1.78 0.98 1.52 1.01 1.29 0.96
•epressão 104 0.98 1.64 1.03 1.50 1.02 U S 0.94
- "tilidadc 1.58 0.90 1.44 0,96 1.31 1.04 1.03 0.88
> mínenlo 2.00 0.74 1.63 0.85 1.45 0.92 1.17 0.82
Os autores dizem que:

Culpa do estuprador fo i mais comum que auto-culpa coinportamenial, com efeitos pequenos no p e
ríodo de duas semanas, \( 8 7 ) - - 0 ,7 8 , p = 0,08. d = 0.19. e dois meses. 1(94) - -0 .8 0 . p = 0.07. d = 0.19,
e efeitos médios para o período de seis meses, U84) = 4,61. p < 0.001, d = 0,50, e doze meses, US9) =
—1.50. p < 0,0001. d = 0,48. após a agressão. De acordo com as convenções de Cohen (1992) para tama
nho do efeito de testes t, 0.20 é um efeito pequeno. 0,50 é um efeito médio, e 0,80 é um efeito grande.
Note que os autores conduziram quatro testes t emparelhados. Quer dizer, compararam índices
; auloculpa comportamenlal com índices de culpa do estuprador em quatro pontos do tempo. A
■' meira comparação foi feita duas semanas após a agressão. Embora as participantes avaliassem
. je os estupradores tinham mais culpa do que cias mesmas, a diferença entre as duas variáveis
pequena - o efeito e' dado como 0,19, que é, como os autores nos disseram, um efeito fraco.
À diferença entre as duas variáveis de culpa nesse ponto de tempo tem um nível de probabilidade
"ociada de 0.08. Um segundo teste i foi conduzido com as mesmas variáveis dois meses após a
. ; _essão - esse efeito também foi fraco. Seis meses mais tarde. entretanto, quando se fez um tercei-
teste t. a diferença entre as condições se tomou mais acentuada. As duas condições aqui diferiram
■ r metade do desvio padrão. No quarto ponto de tempo, a diferença foi parecida.
Teste múltiplo
Se você conduzir vários testes dentro de um estudo ou experimento, algumas das suas análise'
inferenciais resultarão em baixos níveis dc probabilidade associada (p. ex., 0.001) simplesmente
por erro amostrai. Para permitir isso. recomendamos que interprete seus resultados com esse co
nhecimento em mente. A maneira mais fácil de fazer isso é div idir 0.05 (a tradicional variável de
criterio para significancia) pelo número de testes que você conduz (em qualquer estudo) e depoi'
interpretar os níveis de probabilidade associada (NPA) de acordo.
Então, se você realizar três testes l no seu experimento:
NPA = ^ ^ = 0,0167
3
Qualquer NPA > 0,0167 pode ter ocorrido por erro amostrai. Lembre-se, entretanto, de que
interpretar níveis de significancia é só uma parte da informação que contribui para a interpretará»
dos resultados. Existem também os efeitos e intervalos de confiança.
Resumo
■ Limites de confiança permitem que você deduza com um certo grau de confiante
(geralmente 95%) que um determinado intervalo contem a media populacional (ou •
diferença entre médias).
■ d, o tamanho do efeito, fornece a magnitude ou diferença entre duas médias indepc'
dentes, expressa em desvios padrões.
■ Testes t permitem avaliar a probabilidade de se obterem por erro amostrai as di:;
renças observadas entre dois grupos: por exemplo. p = 0,03 significa que. se r.
repetíssemos o experimento 100 vezes, usando amostras diferentes sem supor j
ferenças reais entre condições, esperaríamos encontrar o padrão de resultados ir.
vezes, somente devido ao erro amostrai.
■ Testes I são próprios para dados retirados de uma população normal, são testes par_
métricos.
Vinte crianças em idade escolar (10 meninos e 10 meninas) foram examinadas nas >.
guintes variáveis: número de episódios de doenças no período de um ano. desempenho em
teste no início do ano e desempenho em um teste similar no fim do ano. Coloque os seguin;.
dados no SPSSPW e designe os meninos como Grupo 1 e as meninas como Grupo 2.
Grupo Episódios de doença Teste no inicio do ano Teste no fim do ano
1 24 13 16
• 20 16 20
1 8 7 18
1 30 35
1 5 5 5
1 24 io |5
1 0 9 10
1 8 15 24
1 20 18 30
1 24 20 27
2 7 18 17
2 30 14 io
2 2 20 20
10 9 10
2 18 13 9
2 9 13 16
2 20 10 I
2 10 16 14
2 15 5 6
2 8 7 14
Suponha que os dados são retirados de uma população normalmente distribuída.

1. Realize um teste í independente entre meninos e meninas em episódios de doença e
no teste de fim de ano.
2. Calcule o tamanho do efeito, d, quando apropriado.
3. Imagine que seu amigo não entende a saída que você obteve nem tem conhecimento
sobre tamanho do efeito ou intervalos de confiança. Escreva alguns parágrafos ex
plicando o significado dos resultados para seu amigo.
4. Real i/e um teste t de medidas repetidas para o desempenho no teste do início do ano
e no teste do fim do ano. Forneça uma explicação, por escrito, do significado de seus
resultados para seu amigo. A previsão é de que o grupo tenha melhor desempenho
no fim do ano.
QUESTÕES DE MÚLTIPLA ESCOLHA (a) Um teste t para grupos independentes

(b) Um teste t de m edidas relacionadas
(c) O teste de L evene
1. O grau de liberdade, para uma análise dc teste I inde
(d) N enhum a d as alternativas
pendente. com 20 participantes em cada condição, c:
(a) 38 5. A suposição m ais im portante que tem os que -.
(b) 20 fazer q uando usam os um teste r é:
(c) 40 (a) A variância d o s valores deve ser m ínim a
(d) 68 (b i O s valores devem ser retirados de um a p r
lação com distribuição norm al
2. Para ura teste t pareado cora 4 0 participantes, o
(c) As condições devem ter m edias iguais
grau dc liberdade correto é:
(d) Todas as alternativas estão corretas
(a) 20
(b) 39 6. Q uanto m ais alto o valor r. m ais provável c qu-. .
(c) 38 diferenças entre grupos:
(d) N enhum a das alternativas (a) Sejam resultado de erro am ostra!
(b) N ão sejam resultado de erro am ostrai
3. Para um teste t independente, com 15 participantes
(c) Sejam parecidas
em cada condição, o grau de liberdade e:
(dl N enhum a das alternativas
(a) 28
(b> 14 7. Um v alor t de - 5 e:
(c) 30 (a) M enos im portante que um valor de +5
(d) 15 (b) M ais im portante que um valor de +5
(c) E quivalente a um valor de +5
4. C) nível dc ansiedade de cera alunos foi testado
(d) M enos significativo que um v alor de +5
antes e depois de um a sessão dc terapia para a n sie
dade. O s valores foram retirados de um a população A s questões S a ¡0 referem-se ci seguinte tabela ih
com d istribuição norm al. Q ual teste estatístico se stdtados:
ria m ais apropriado?
Estatísticas do Grupo
Std Deviation Std. Error Mean

SEX (Sexo) N Mean i Média) (Desvio padráo) (Erro Padrão da Média)
total of stigma
(estigma total) 1.00 62 33.8710 12.1149 1.5386
2.00 53 34.8302 13.0586 1.7937
Independent Samples Test (Testi.' para Amostras independentes)
levene's Test for t-test for Equality of Means

Equality of Va-
(Teste r para a Igualdade de Mediasi
nances (Teste de
1eveno pata a igual
dade de Vanáncias)
95% Confidence
Interval of the
Std Error Difference
Sig. Mean Difference (ic de 95% para
(2-tailed) Difference (Erro a Diferença)
(Sig (Diferença Padrão da Upper
F Sig. r Df (gl) Lower
Bilateral) das Médias) Diferença) (inferior) (Superior;
tota' of Equal variances
0 755 0 387 -0.408 113 0.684 -0.9592 2.3493 -5 6136 3.6951
stigma assumed
iestiOTTia (assum na a igua;-
total) risoe tie variant. ias)
Egual Variances -0.406 107 199 0.686 -0.9592 2.3637 5 6439 3.7255
Not Assumed
(Igualdade de
Variâncias
Não-assumida)
Sic). = Significânoa
-. diferença enlre as m édias dos grupos é: 14. N um a saída do SPSSPW . se p = 0. 000. você dev e
i 0.41 relatá-lo com o:
- 0.69 (a) /> = 0.000
. 0.96 (b) /> = 0.000!
4 0.76 < c) p < 0 .0 0 1
variâncias dos d o is grupos são: (d) p < 0.0001
- Indeterm inadas 15. E m um leste t in d ep e n d en te , você u sa ria a p arte

' D esiguais d a saíd a equal variances not as sume d (v a riâ n
- Iguais c ias n ã o -h o m o g ê n e a s) q u a n d o o te ste de L evene
- Assim étricas está:
vjue você pode c o n clu ir dos resultados? (a) A cim a de um dado critério de significancia
N ão existem diferenças significativas ou dife (p. cx../> > 0,05)
renças im portantes em re os dois grupos (b) A baixo de um dado c ritério de significancia
■ F xiste urna d iferença significativa, m as que (p. ex../> < 0,05)
não é im portante ( c ) Q uando os núm eros de participantes são d e si
Existe um a diferença im portante entre os dois guais nas duas condições
grupos, m as não é significativa (d) Q uando há dados assim étricos
- E xistem diferenças significativas e diferenças
16. Para um d elineam ento dentre participantes que uti
im portantes entre os grupos
liza 20 pessoas, o grau de liberdade é:
-m an h o do efeito para grupos independentes. </. (a) 20
d e ser calculado por: (b i 38
_ i m édia I - m édia 2) / m edia dos desvios pa (c) 19
drões (d) 40
i m edia 1 + m édia 2) / m édia dos desvios pa
17. O teste de L evene é:
drões
. i m édia I - m édia 2) / erro padrão d a m édia ( a ) U m teste de heterogeneidade que depende da
i m édia I + m edia 2) / erro padrão da m édia suposição de norm alidade
(b | U m teste de hom ogeneidade que depende da
: ' lim ites de confiança de 95% em torno da di-
suposição de norm alidade
rrença das m édias (em um teste I) sã o 10,5 c 13.0.
(c) U m teste de heterogeneidade que não dep en
-demos c o n clu ir que, se repetirm os o estudo cem
de d a suposição de norm alidade
;z e s . então:
(d) U m teste de hom ogeneidade de variâncias que
- N ossos resultados serão estatisticam ente sig não depende da suposição de norm al idade
nificativos 5 v e/es
N ossos resultados serão estatisticam ente sig L eia a seguinte passagem de um a seção de resultados
nificativos 95 vezes de um artigo científico (R atcliff et al.. 2003) e responda
. Em 9 5 'r das v e /e s a diferença das m édias p o a questão 18:
pulacionais estará entre 10,5 e 13.00: 5% das
A s m u d an ç as nos v a lo re s d a s m ed ias em to d o s
vezes a diferença das m édias populacionais
os restes e n tre O n d a 4 e O n d a 5 fo ram sig n ifi
estará fora desse lim ite
cativ o s com base n u m teste r p a re a d o (to d o s os
- Em das v e /e s a diferença das m édias p o
valo res p < 0 .0 0 1 . com e x ce çã o de M M S E . p =
pulacionais estará entre 10.5 e 13.00: em 9 5 íí
0 .0 1 2 : a p re n d iz a d o de p a la v ras em listas, le m
das v e /e s a d iferença das m edias p o p u lacio
nais estará fora d esse Jimite bran ça re ta rd ad a , p = 0.0 0 9 : n o m e a n d o B oston.
/> = 0 .0 1 9 ).
: um a análise que usa um teste / não-relaciona-
- você encontra o seguinte resultado: 18. P or que "todos os valores p "estão relatados com o
p < 0.001. q u an d o as outras variáveis ciladas foram
. 'te de L evene para Igualdade de Variâncias:
relatadas com valores de probabilidade exatos?
F - Ò.15 p = 0,58
(a) O s pesquisadores não conseguiram descobrir
• ■m ostra que as variâncias dos grupos são: os valores de probabdidade exatos
- D issim ilares (b) () nível de significancia em seu p ro g ram a de
Sim ilares estatística c alculou p = 0.000
. E xatam ente as m esm as (c) As variáveis citadas não são significativas
: Indeterm inadas (d) Todas as alternativas estão corretas
As questões 19 e 20 se referem ci seguinte tabela:
Independent Samples Test (Teste para Amostras Independentes)
Levene's Test T-test for Equality of Means

for Equality (Teste l para a igualdade de Medias
of Variances
Teste de Levene
para a Igualdade
de Variâncias)
95 % Confidence
Std. Interval of
Error the Difference
Differen (IC de 95% para
Sig. Mean
(2-tailed) Difference ce (Erro-p a Diferença)
(Sig. (Diferença Padrão da Lower Upper
Sig. t Df (gl) Bilateral) das Médias) Diferença) (Inferior) (Superio'
Equal 0 113 0.738 0.923 106 0.358 0.5258 0,56951 -0.60327 1.65494
Total of Serious
variances
economic con
assumed
sequences (Con
(Assumida a
sequências eco
igualdade de
nómicas serias)
variâncias)
Equal 0.882 16.607 0.391 0.5258 0.59644 -0.73481 1.78649
variances
not assumed
(igualdade
de variâncias
não-assumida)
Sig - Significance
19. Q ual fileira o p esquisador usaria para interpretar 20. G en eralizando para a população, qual é o sinal c
os resultados do teste t independente? esperaríam os do valor f?
(a) A fileira de variâncias iguais (a) Positivo
(b) A fileira de variâncias d esiguais (b) N egativo
(c) P oderia ser tanto positivo com o negativo
Referências
C O H E N . J. Statistical Power fo r Behavioral Sciences, N ew York: A cadem ic P ress. 1988. 2"‘1ed.

C O H E N , J. A pow er prim er. Psychological Bulletin, v. 112. p. 155-9. 1992.
FR A Z IE R . P. A. Perceived control and distress follow ing sexual assault: a longitudinal test o f a new
m odel. Journal o f Personality and Social Psychology. 84. n. 6. p. 1257-69, 2003.
K E T E R E R . M . W. et ai. D enial o f depression as an independent correlate o f coronary artery disease
Journal o f Health Psychology, v. 1. n. 1. p. 93-105. 1996.
RATCLIFF. G. et al. T racking cognitive functioning over tim e: ten-year longitudinal data from a
co m m unity-based study. Applied Neuropsychology . v. 10, n. 2. p. 89-95. 2003.
Y U . C. H.. HO . W. J.. S T O C K F O R D . S. U sing m ultim edia to visualize the concepts o f degree o f
freedom , pcrfcct-fitting, and over-fitting. Joint Statistical M eetings, A ugust 2 0 0 1, A tlanta (GA
YU. C. H. Illustrating degrees o f freedom in m ultim edia. D isponível em: h ttp://seam onkey.ed.asu.
edu/~alex/pub/dl7defauli.htm [acesso em 10 de m arço de 2004].
Questões de Significância
Nos ú ltim o s d ois c a p ítu lo s, vo cê ap re n d e u não só a d e scre ver e a n a lisa r os re la c io n a m e n to s

e n tre v a riá ve is, m as ta m b é m a a n a lisa r as d ife re n ç a s e n tre d u as co n d iç õ e s. N esses c a p ítu lo s,
p ro c u ra m o s e n c o ra já -lo a u sa r m éto d o s d e a n á lise d ife re n te s para o b te r um se n tid o d o s d a d o s
e o fe re c e r ao s se u s leito res (g e ra lm e n te os p ro fe sso re s q u e ava lia m o seu tra b a lh o ) o q u ad ro
m ais c o m p le to po ssível. P o rtan to , p ro c u ra m o s in cen tivá-lo a d e scre ver se u s d a d o s por m eio de
ilu stra çõ e s g rá fic a s, m e d id as de te n d ê n cia ce n tra l e v a riâ n c ia ; o fe re c e m o s um m é to d o sim p les,
pelo q u al v o cê p o d e c a lc u la r o e fe ito , e a p re se n ta m o s o s in te rv alo s de c o n fia n ç a (IC ). F in a lm e n te ,
ta m b é m o e n c o ra ja m o s a re la ta r o nível d e sig n ific â n c ia o b se rvad o (N SO ).
N este c a p ítu lo , tra ta re m o s os c o n c e ito s m e n c io n a d o s co m m a io r p ro fu n d id a d e . D iscu tiré
m o s as q u e stõ e s q u e c e rca m o relato d e níveis d e p ro b a b ilid a d e e a p re se n ta re m o s um c o n ce ito
no vo - o c o n c e ito d e poder. O p o d er é a h a b ilid a d e de d e te cta r um e fe ito sig n ific a tiv o , q u a n d o
existe. É a h a b ilid a d e q u e um te ste tem de rejeitar a h ip ó te se nuia c o rre ta m e n te . É im p o rta n te
e n te n d e r ta is q u e stõ e s a n te s de c o n d u z ir se u s p ró p rio s e xp e rim e n to s e e stu d o s, p o r esse m otivo
as a p re s e n ta m o s ag o ra .
N este c a p ítu lo , vo cê a p re n d e rá so b re :
■ re la c io n a m e n to e n tre poder, e fe ito e níveis de p ro b a b ilid a d e

■ fa to re s q u e in flu e n cia m o p od er
> q u e stõ e s acerca do uso d e níveis de sig n ificâ n cia de critério
Para q u e possa e n ten d er as q u e stõ e s d iscu tid a s n este c a p ítu lo , vo cê precisará ter c o m p re e n
d id o a a n á lise co rre lacio n ai (C a p ítu lo 5) e as an á lises de d ife re n ça s e n tre do is g ru p o s com uso do
teste f (C a p ítu lo 6 ).
As questões 19 e 20 se referem à seguinte tabela:

for Equality (Teste t para a Igualdade de Médias)
of Variances
(Teste de Levene
para a Igualdade
de Variâncias)
95% Confidence
Std. Interval of
Error the Difference
Sig. Mean Differen (IC de 95% para
(2-tailed) Difference ce (Erro-p a Diferença)
(Sig. (Diferença Padrao da Lower Upper
F Sig. t Df (gl) Bilateral) das Médias) Diferença) (Inferior) (Superior)
Equal 0.113 0.738 0.923 106 0.358 0.5258 0.56951 -0.60327 1.65494
Total of Serious
variances
economic con
assumed
sequences (Con
(Assumida a
seqüências eco
igualdade de
nômicas sérias)
variâncias)
Equal 0.882 16.607 0.391 0.5258 0.59644 -0.73481 1.78649
variances
not assumed
(igualdade
de variâncias
não-assumida)
19. Qual fileira o pesquisador usaria para interpretar 20. Generalizando para a população, qual é o sinal que
os resultados do teste t independente? esperaríamos do valor /"?
(a) A fileira de variâncias iguais (a) Positivo
(b) A fileira de variâncias desiguais (b) Negativo
(c) Poderia ser tanto positivo como negativo
Referências
COHEN, J. Statistical Power fo r Behavioral Sciences. New York: Academic Press, 1988. 2 "ed.
COHEN, J. A power primer. Psychological Bulletin, v. 112, p. 155-9. 1992.
FRAZIER, R A. Perceived control and distress following sexual assault: a longitudinal test of a new
model. Journal o f Personality and Social Psychology, v. 84, n. 6, p. 1257-69, 2003.
KETERER. M. W. et al. Denial o f depression as an independent correlate of coronary artery disease.
Journal o f Health Psychology, v. 1, n. l,p . 93-105, 1990.
RATCLIFF. G. et al. Tracking cognitive functioning over time: ten-year longitudinal data from a
comm unity-based study. Applied Neuropsychology, v. 10, n. 2, p. 89-95, 2003.
YU. C. H.. HO. W. J , STOCKFORD. S. Using multimedia to visualize the concepts o f degree of
freedom, perfect-fitting, and over-fitting. Joint Statistical Meetings, August 2001, Atlanta (GA).
YU, C. H. Illustrating degrees of freedom in multimedia. Disponível em: http://seamonkey.ed.asu.
edu/~aiex/pub/df/default.htm [acesso em 10 de março de 2004].
7.1 Critérios de significancia
Como mencionado anteriormente, foi comum. por muitos anos, a prática de relatar os
níveis de probabilidade como < 0,05 ou > 0,05. Essa convenção surgiu, em parte, porque
antes do advento dos poderosos pacotes computacionais, como o SPSSFW, não era possível
determinar a probabilidade exata com facilidade. Todavia, existem bons motivos para que a
probabilidade exata deva ser relatada sempre.
Por exemplo, imagine que você conduz um experimento, o analisa e obtém um valor de
probabilidade associada de 0,049. Subseqüentemente, decide replicar esse experimento, mas
dessa vez obtém um nível de probabilidade de 0,051. Relatar o primeiro estudo como “signi
ficativo” a um nível de 0,05 e o segundo estudo como '‘não-significativo” a um nível de 0,05 é
enganoso, em especial porque quando você conduz um estudo, existe sempre certa quantida
de de erro (ver Capítulo 4). Se c o n d u z ir o experimento novamente, você pode obter u m vaior
de probabilidade associada de 0 ,0 6 ou 0,04. Da mesma maneira, como H o w ell (2002) nota.
seria razoável tratar 0,051 e 0,75 como igualmente não-significatívos, sendo maiores d e 0,05'.’
A lém disso, devem 0,049 e 0 .0 0 0 0 i se r considerados igualmente sig n ific a tiv o s, re latad o s
ambos como p < 0,05?
Outro problema associado à abordagem > 0,05/< 0,05 é sua tendência a levar a uma
visão ortodoxa na qual o ponto de corte 0 05 c tido como uma regra que nunca deve ser
quebrada. Conseqüentemente, as pessoas tendem a pensar que se um resultado está abaixo
desse limite, deve ser importante e. se está acima desse limite, não é de interesse algum. O
problema é que esse ponto de corte deve ser entendido simplesmente como um guia, e não
como uma regra fixa, pois ter significancia estatística nem sempre significa ter importância.
Isso acontece porque o tamanho da amostra afeta a significancia estatística, como veremos
mais tarde. Embora valores p exatos forneçam mais informação do que o relato de < 0.05 ou
> 0,05, a convenção de usar critérios de valores de probabilidade tem seus adeptos, muitos
dos quais acreditam que o método convencional de relatar valores p fornece um padrão
comum para avaliar alegações estatísticas. Entretanto, como Rosnow e Rosenthal (1989)
disseram:
Com certeza De: ; ama o 0,06 tanto quanto o 0.05.
O nível de probabilidade exato permite que o leitor saiba a probabilidade de os resultados

terem sido obtidor por erro amostrai, tomando a hipótese nula como verdadeira. O nível de
probabilidade é uma parte da informação a ser considerada na interpretação dos resultados.
Não estamos discorrendo contra o relato de valores de probabilidade! Macdonald (1997)
argumenta:
Os dados devem ser vistos como provas a serem usadas em argumentos da psicologia, e a
significancia estatística é somente uma medida da sua qualidade. Ela impede que o pesquisador
obtenha algo em seus achados que poderia ter sido obtido por acaso.
O debate relacionado ao uso de níveis de probabilidade exatos ou de critérios de signi-
ficância é somente uma pequena parte da controvérsia relacionada ao lugar que os testes de
hipóteses assumem na psicologia. A controvérsia não é nova - existe hâ mais de 40 anos, e
psicólogos e estatísticos eminentes podem ser encontrados em ambos os lados do debate.
Existem muito.-., artigos científicos relacionados a esse tópico 3e você quiser mais informa
ções, sugerimos que leia Kranz (1999) ou Nickerson (2000).
I Atividade 7.1
I. O p r o b l e m a
O h ! O f é g ra n d e , e o p é p e q u en o
E p o r isso no s o rg u lh a m o s
O q u e sig n ifica nós n ão p o n d e ra m o s
A p e n a s a h ip ó te se n u la rejeita m o s
O u o q u i-q u a d ra d o é g ra n d e , e o p q u a se nulo
R esu ltad o s c o m o esse servem bem
E se fo r p reciso u m a e le ição ?
N ão se p re o c u p e , e sta m o s a m il!
A m e n sa g e m a p re n d e m o s bem !
S ig n ific â n c ia ! Já sei de cor!
II. A s i m p l i c a ç õ e s
A m o ral da nossa p e q u e n a histó ria í1
Q u e nós m o rta is so m o s frá g e is
M a s, q u a n d o o b te m o s um p p ró xim o d e ze ro ,
T o rn a m o s-n o s heróis co m g ló ria .
M as a v is a m , e n tã o , c u id a d o , a m o rte!
Po d em o s n ó s, ta lv e z , e vita r nossa so rte?
S u b stitu in d o esse d e sejo pela rejeição d a h ip ó te se nula
R e la ta n d o do ta m a n h o do efeito o p o rte .
Isso p o d e não no s g a ra n tir a g ló ria
M as pelo m e n o s co n ta -se u m a histó ria
Q u e é ju s to o tip o de e n c a n to
Q u e fa z a v a n ç a r o nosso c a m p o .
(R o b e rt R o se n th a l, 1 9 9 1 )
po ' q u e vo cê acha q u e Rosenthal escreveu esse p o e m a? 0 q u e ele está te n ta n d o nos d izer?
Tamanho do efeito
Você aprendeu, nos Capítulos 5 e 6, maneiras de calcular o tamanho do efeito. O tamanho

do efeito é a magnitude da diferença entre condições ou o poder de um relacionamento. Exis
tem maneiras diferentes de calculá-lo. No Capítulo 5, você aprendeu sobre um tamanho do
efeito natural (um coeficiente de correlação); no Capítulo 6, sobre como calcular o tamanho
da diferença entre médias, em termos de desvios padrões (d). Quer dizer, as médias se dife
renciaram por quantos desvios padrões? Lembre-se de como é fácil calcular d:
-V —X,
média dos desvios padrões
Como mencionamos acima, d é a distância entre as duas médias em termos de desvios

padrões. Se existe uma área grande sobreposta entre os dois grupos, o efeito será relativamen
te pequeno: se existe uma área pequena sobreposta, o efeito será relativamente grande.
A s v ezes, o e fe ito é fác il de c a lc u la r (c o m o no c a so co m d u a s c o n d iç õ e s); o u tra s, pode

se r m ais difícil. E n tre ta n to , re late o e fe ito q u a n d o puder. A s vezes, os p sic ó lo g o s sa b em o
efe ito qu e p ro c u ra m c o m b ase em tra b a lh o s p ié v io s na área. C o m o a p re n d e m o s no ú ltim o
c a p ítu lo , os esta tístic o s nos d eram re c o m e n d a ç õ e s (le m b re -se ■ re c o m e n d a ç õ e s, n ão reg ras)
so b re o qu e co n stitu i um e fe ito ''p e q u e n o ” ou u m e fe ito "g ra n d e H ssas são as re c o m e n d a
ções d e se n v o lv id a s p o r C o h en (1988):
Tamanho do efeito d Percentagem de sobreposição
Pequeno 0.20 85
Medio 0,50 67
Grandi1 0.80 53
E x istem o u tra s m e d id a s d o e fe ito q u e se rão a p re s e n ta d a s m a is ad ia n te . E n tre ta n to , d é

b astan te u tilizad o , e n tã o é im p o rta n te q u e você e n te n d a c o m o c a lc u lá -lo e in terp re tá-lo .
3 Poder
À s v ezes, vo cê e sc u ta rá p esso as d iz e n d o c o isas d o tip o “ o teste t é m ais p o d e ro so q u e o de

M a n n -W h itn e y ” , ou ‘ testes d e m ed id as re p e tid a s têm m ais p o d e r” , m as o q u e isso re a lm e n te
sig n ifica? P o d e r c o n siste n a h a b ilid a d e de d e te c ta r u m e fe ito sig n ificativ o , q u a n d o ex isten te,
e você a p re n d e u q u e p o r “e fe ito " e n te n d e -se a d ife re n ç a e n tre m éd ias ou o re la c io n a m e n to
en tre v ariáveis. O p o d e r é a h a b ilid a d e q u e um te ste tem de a c h a r esse efeito . Tam bém , pode
se r d e sc rito c o m o a h a b ilid a d e de re je ita r a h ip ó te se n u la q u a n d o falsa. É m e d id o em um a
e scala d e 0 a + 1 , na qual 0 = sem p o d e r a lg u m . Se o seu teste n ão tiv er poder, será in c a p a z de
d e te c ta r u m a d iferen ç a e n tre m é d ia s ou u m re la c io n a m e n to e n tre v ariáv eis; 0 ,1 , 0 ,2 e 0,3 são
b aix o s valores d e p o d e r; 0 ,8 e 0 ,9 são alto s v alo res d e poder.
O q u e os n ú m e ro s 0 ,1 , 0 ,2 , etc. sig n ific a m ?
s 0.1 sig n ifica q u e você tem so m e n te u m a c h a n c e de 10% de ac h a r um e fe iio , se algum

ex iste, isso é inútil. V ocê co n se g u e se im a g in a r c o n d u z in d o um e stu d o (q u e cu sta
d in h e iro e te m p o !) sa b e n d o q u e te ria tal p ro b a b ilid a d e de e n c o n tra r u m efeito ?
■ 0,7 sig n ifica q u e você tem u m a c h a n c e de 7 0 % de e n c o n tra r um efe ito , se a lg u m e x is
te. P o rtan to , você tem u m a boa c h a n c e de e n c o n trá -lo . V aleria a p en a g a sta r d in h eiro
nesse estu d o .
■ 0,9 sig n ific a q u e você tem 9 0 % de c h an c e d e e n c o n tra r u m efeito . Isso raram en te
a c o n te c e em p e sq u isa s na p sico lo g ia.
O b serv a-se q u e , se o seu p o d e r é 0 ,5 , há so m e n te um a c h a n ce d e 5 0 :5 0 d e e n c o n tra r um

efe ito , se e x is tir a lg u m , o q u e n ão é b o m o su ficien te.
V ocê p o d e o b s e r v a r q u e d e v e m o s d e s c o b r ir n o ss o n ív e l d e p o d e r a n tes d e c o n d u z ir
um e x p e rim e n to o u e stu d o , p o is n ã o h á m u ito se n tid o e m re a liz a r to d o um tra b a lh o e não
c h e g a r a n ad a. p e rc e b e n d o q u e tín h a m o s so m e n te u m a c h a n c e m u ito p e q u e n a de e n c o n tra r
um efeito .
1 A tabela que fornece a percentagem de área sobreposta para valores d de 0.1 a 0.5 foi dada no Capítulo 6. página 224
7.4 Fatores que influenciam o poder
■ O ta m a n h o d o e fe ito e sp era d o
■ O n ível d e crité rio de sig n ific a n c ia (p. ex., o v alo r d o nivel de sig n ific a n c ia n o qual
você e stá p re p a rad o a a c e ita r q u e os re su lta d o s p ro v a v elm e n te n ã o seja m re su lta n te s
de e rro am o strai)
■ O n ú m e ro de p a rtic ip a n te s no e stu d o
■ O tip o de teste e sta tístic o u sad o
■ S e o d e lin e a m e n to d o e stu d o é e n tre p a rtic ip a n te s o u d e n tre p a rtic ip a n te s
■ S e a h ip ó te se é uni ou bicau d ai
7.4.1 Tamanho do efeito

P ara c a lc u la rm o s o v a lo r d o p o d er, é n e c e ss á rio te rm o s u m a id é ia d o e fe ito p ro c u ra d o .
C o m o você o b té m e s s a in fo rm a ç ã o a n te s m e sm o de c o n d u /ir o e stu d o ou e x p e rim e n to ? Se
já ex iste p e sq u isa na área, você p o d e v e rific a r artigo;, c ie n tífic o s e te n ta r d e sc o b rir os e feito s
en c o n tra d o s p e lo s p e sq u isa d o re s. À s v e ze s, o s au to re s te rã o fo rn e c id o o s e fe ito s; o u tra s v e
zes, v o cê tem d e c a lc u lá -lo s. P e sq u isa s j á re a liz a d a s são um bom g u ia p a ra d e sc o b rir o e fe ito
q ue p o d e se r e n c o n tra d o . Se n ão e x iste p e sq u isa na á re a (im p ro v áv e l), você p o d e re c o rre r aos
v alo res d e C o h e n (1 9 8 8 ). N a p sic o lo g ia , e fe ito s p e q u e n o s a m é d io s são m ais p ro v á v e is do
que g ran d es efeito s.
U m efe ito g ra n d e se rá m a is fácil de d e te c ta r d o q u e um e fe ito p e q u e n o . E p re c iso m ais
p o d e r p a ra e n c o n tra r e fe ito s p eq u e n o s.
7.4.2 Critério de significancia

O crité rio de sig n ific a n c ia in d ica o n ível aceitáv el de p ro b a b ilid a d e d e q u e os re su lta d o s
ten h am o c o rrid o p o r e rro a m o stra i. D ig a m o s q u e B etty B eech d ec id e se r ra z o a v e lm e n te e stri
ta e so m en te c o n sid e ra rá in te rp re ta r os seu s re su lta d o s se o nível de p ro b a b ilid a d e asso c iad a
fo r 0 ,0 2 . Se o seu nível de sig n ific â n c ia a ss o c ia d a n ão a tin g ir esse n ív el, e la in te rp re ta rá
q u a lq u e r e fe ito c o m o “p ro v a v e lm e n te te n d o o c o rrid o p o r e rro a m o s tra i” . Isso sig n ific a q u e
o seu re su lta d o será in te rp re ta d o so m en te se e stiv e r na c a u d a da d istrib u iç ã o d e m o n stra d a na
F ig u ra 7.1.
p = 0 .0 2
D istrib u iç ã o n o rm a l, m o stra n d o a áre a so b a c u rva .

Figura 7.1
A dam A sh, e n tre ta n to , d e c id e (p o r m o tiv o s q u e só e le sab e) q u e in te rp re ta rá seu s re s u l

tad o s se o n ível de p ro b a b ilid a d e a ss o c ia d a fo r 0 ,1 6 . S e o n ível d e sig n ific â n c ia a ss o c ia d a
não a tin g ir o nível p ro p o sto , in te rp re ta rá o re su lta d o c o m o “ p ro v a v e lm e n te o c o rrid o p o r erro

a m o stra i". Isso sig n ific a q u e o re s u lta d o será in te rp re tad o se e stiv e r na c a u d a da d istrib u iç ã o
d e m o n stra d a na F ig u ra 7.2.
p = 0 . 1 6
D istrib u iç ã o n o rm a l, m o stra n d o a área sob a c u rva .
D eve se r ev id e n te q u e A d am A sh tem u m a c h an c e m u ito m ais alta de e n c o n tra r u m e fe i

to. p o is foi bem m ais flexível em seu crité rio .
Q u an d o p sic ó lo g o s p re c isa m u sa r u m c rité rio de sig n ific â n cia , fazem a e sc o lh a co m m u i
to c u id ad o . N o rm a lm e n te , o c ritério v aria d e 0,01 a 0 ,0 5 , p o d e n d o c h e g a r a 0 ,1 0 , d e p e n d e n d o
do tip o de e x p e rim e n to ou e stu d o c o n d u z id o .
Atividade 7.2
Um poder d e 0,7 significa q u e o p esq u isad o r tem :
(a) 49% d e ch an ce d e en c o n trar um efeito

(b) 7% d e ch an ce d e en co n trar um efeito
(c) 70% d e ch an ce d e en co n trar um efeito
7.4.3 Número de participantes
Q u a n to m a io r a a m o stra , m a io r é o poder. Você já p o d e te r e sc u ta d o q u e , se tiv e r u m a

am o stra g ra n d e , terá u m a ch a n cc m a io r de o b te r u m re su lta d o e sta tistic a m e n te sig n ificativ o .
Isso p arece estra n h o , p o is o fato d e d e c la ra rm o s um re su lta d o c o m o “ e sta tistic a m e n te sig n i
ficativ o " ou não p a re c e d e p e n d e r d o ta m a n h o d a a m o stra. E sse é, o b v ia m e n te , o p ro b le m a
de d e p e n d e r d e m a is d e v alo res d e p ro b a b ilid a d e asso c ia d o s em v ez d e d e p e n d e r d e e fe ito s e
in terv alo s de c o n fia n ç a .
P o d e m o s e n te n d e r is so m e lh o r u sa n d o u m e x e m p lo . D ig a m o s q u e e sta m o s o b se rv a n d o
as d ife re n ç a s e n tre os g ru p o s co m b aru lh o e sem b aru lh o nos e x e m p lo s d o C a p ítu lo 6, u sa n d o
c in c o p articip an te s.
" Hipótese unicaudal

Group Statistics (Estatísticas do Grupo)
noise and no noise Mean Std. Error Mean Std. Error

N
(com barulho e sem-barulho) (Média) (Erro Padrão da Média) (Erro Padrão)
SCORE noise 2 9.5000 0.707 0.50 0

(ESCORE) (com barulho)
no noise 3 13.6667 3.786 2.18 6

(sem barulho)

for Equality (Teste t para a Igualdade de Medias)
of Variances
(Teste de Levene
para a Igualdade
de Variâncias)
F Sig. t Df Sig. Mean Std. Error 95% Confidence

(gl) (2-tailed) Difference Difference Interval of the
(Sig. (Diferença (Erro Padrão Difference
Bilateral) das Médias) da Diferença) (IC de 95% para
a Diferença)
SCORE Equal 5.660 0.098 -1.46 3 0.239 -4.1667 2.846 -13.225 4.892
(ESCORE) variances
assumed
(igualdade de
variâncias
assumida)
Equal variances - 1 .86 2.20 0.192 -4.1667 2.242 -13.012 4.678

not assumed
(Igualdade de
variâncias não
assumida)
. .. ....
E x istem tão po u co s p articip an tes nesse e stu d o que, em b o ra p areça e x istir um a boa d ife re n
ça en tre as m édias (4,17 na d ireção e sp e ra d a), esta p o d e ter sid o c a u sa d a p o r e rro am o strai.
F az sen tid o p e n sa r q u e, se re p etísse m o s esse e stu d o co m o u tro s cin c o p artic ip a n te s, p o d eriam
ser e n c o n trad o s valo res to ta lm e n te d ife re n te s a p en as p o r acaso . C o n se q ü e n te m e n te , v o cê tem
q u e e n c o n tra r u m a d ife re n ç a m u ito m a io r e n tre os g ru p o s c o m esse n ú m e ro de p a rtic ip a n tes
p ara que os seu s in terv alo s de c o n fian ç a sejam m ais e stre ito s e o v alo r d a p ro b a b ilid a d e a s
so ciad o seja m ais b aix o . Se u sa sse um n ú m ero g ran d e de p a rtic ip a n te s em c a d a g ru p o , veria
que o teste é d ecla ra d o c o m o “e sta tistic a m en te sig n ificativ o ” com u m a d ife re n ç a m e n o r en tre
grupos. N o e x em p lo p resen te, o in terv alo de co n fia n ç a é grande. E sp e ra -se que a d iferen ç a da
m ed ia p o p u la c io n a l (co m 9 5 % de c o n fia n ça ) p o ssa se r e n c o n tra d a e n tre 13,225 e + 4 ,8 9 2 .
Isso sig n ifica q u e esta m o s co n fia n te s d e q u e, se o e x p e rim e n to fo sse rep etid o , a m éd ia d o g ru
po da c o n d içã o com b a m lh o pode ser m a io r que a d a c o n d iç ã o sem baru lh o , ou a co n d içã o sem
b aru lh o p o d e se r m a io r q u e a co n d iç ã o co m b aru lh o , ou p o d e m ser iguais. Isso se a sse m e lh a a
c o n fiar qu e o tem p o estará b o m , ru im ou neu tro am an h ã . N ão nos é m u ito útil. Com tão poucos
participantes, temos um poder baixo - se um efeito existe, não temos muita probabilidade de
encontrá-lo, pois qualquer efeito pode ter ocorrido por erro amostrai.
V am os re p e tir o e stu d o , m as d esta v ez u sa n d o 2 1 6 p artic ip a n te s.
Group Statistics (Estatísticas do Grupo)
noise and no noise N Mean Std. Error Std. Error Mean

(com barulho e sem barulho) (Média) (Erro Padrão) (Erro Padrão da Média)
SCORE noise 110 9.1364 3.355 0.320

(ESCORE) (com barulho)
no noise 106 12.9623 3.570 0.347

(sem barulho)

for Equality (Teste t para a Igualdade de Médias)
of Variances
(Teste de Levene
para a Igualdade
de Variâncias)
F Sig. t Df Sig. Mean Std. Error 95% Confidence

(gl) (2-tailed) Difference Difference Interval of the
(Sig. (Diferença (Erro Padrão Difference
Bilateral) das Médias) da Diferença) (IC de 95% para
a Diferença!
SCORE Equal 1.024 0.313 -8.12 214 0.000 -3.8259 0.471 -4.755 -2.897
(ESCORE) variances
assumed
(Igualdade de
variâncias
assumida)
Equal variances -8.11 211.92 0.000 -3.8259 0.472 -4.756 -2.896

not assumed
(Igualdade de
variâncias
não-assumida)
D essa v ez, a d ife re n ç a en tre as m é d ia s é, na verd ad e, m en o r: -3 ,8 2 . E n tretan to , o uso de

tan to s p artic ip a n te s sig n ifica q u e te m o s u m a c e rte za m aio r de q u e o re su lta d o n ão aco n teceu
p o r a caso ou p o r erro a m o stra i. Se re p e tísse m o s o e stu d o co m o u tras 2 1 6 p e sso as, e staría m o s
m u ito m ais c o n fia n te s na o b te n ç ã o d e re s u lta d o s se m e lh a n te s. D e ssa v ez os in te rv a lo s de
c o n fia n ç a nos m o stra m q u e e sta m o s m ais co n fia n te s, q u e a d ife re n ç a se e n c o n tra e n tre 4.8
e 2,9 (le m b re -se de q u e, se a m b o s os sin a is fo rem n eg ativ o s, p o d e m o s ig n o rá -lo s). A ssim ,
tem o s 9 5 % de c o n fia n ç a de q u e os n ú m e ro s p a ra a p o p u la ç ã o da c o n d iç ã o sem b a ru lh o serão
sig n ific a tiv a m e n te m ais a lto s d o q u e o s d a c o n d iç ã o co m b aru lh o . Com um núm ero m aior
de participantes, tem os uma chance m aior de d etectar um efeito significativo; estam os mais
certos de que o efeito se deve a algo além do erro amostrai.
E n tretan to , note q u e n o sso re su lta d o se to rn a “m ais sig n ifica tiv o ” se an a lisa m o s som ente
o nível de sig n ific a n c ia. Ele re a lm e n te se to rno u m ais sig n ificativ o , e m b o ra a d iferen ç a das
m éd ias seja m e n o r? A resp o sta é não. T em o s m ais c o n fia n ç a na n o ssa c a p a c id a d e de fa z e r

g e n e ra liz a ç õ e s p e rtin e n te s à p o p u la ç ã o u sa n d o um n ú m ero m aio r d e p a rtic ip a n te s, m as, de
alg u m a m an eira, en c o n trar u m a d iie ie n ç a co m um n ú m ero m en o r de p a rticip an tes cau sa m aior
im p ressão , p o is é m ais difícil a c h a r um efeito com um n ú m ero p eq u en o d e p a rticip an tes. O b
v iam en te, o uso de cin co p artic ip a n te s, c o m o no n o sso p rim eiro exem p lo , n ão só é irreal co m o
não é útil - não p o d e m o s g en eralizar, e o uso de tão p o u co s p artic ip a n te s sig n ifica q u e n o sso s
re su lta d o s têm u m a c h a n c e m a io r d e serem o b tid o s so m e n te p o r erro am o strai. D e m o n stra r
q ue a sig n ific â n c ia e sta tístic a d e p e n d e d o ta m a n h o d a a m o stra é im p o rta n te , pois d e m o n stra
q u e a sig n ificân cia e sta tística não é igual à im p o rtâ n c ia p rática ou p sico ló g ica. P o rtan to eio o
m otivo de p re c isa r de outras, m an eiras d e a v a lia r a im p o rtân c ia d o estu d o - c o m o o efeito e os
in terv alo s de confiança.
Atividade 7.3
O p e sq u isa d o r c o n d u z e xp e rim e n to co m um n ú m e ro alto d e p a rticip a n te s e p o d er d e 0 ,9 .

Ele não e n c o n tra um e fe ito . Q ual é a c o n c lu sã o m ais se n sa ta ?
(a) E xiste um e fe ito , m as não existiu p o d er su fic ie n te para e n c o n trá -lo .

(b) Existiu p o d er su fic ie n te para e n c o n tra r um e fe ito , p o rta n to , p a rece provável q u e não
e xiste um efeito .
7.4.4 Tipos de testes estatísticos

T estes p a ra m é tric o s sã o m ais p o d e ro s o s d o q u e o s n â o -p a ra m é tric o s , d e sd e q u e se sa
tisfa ç a m as su p o siç õ e s. P o rta n to , um te ste t tem u m a p ro b a b ilid a d e m a io r d e e n c o n tra r um
efe ito do q ue o seu eq u iv a le n te n ã o -p a ra m é íric o (v er ( 'a p ítu lo 15), d e sd e q u e v o cê sa tisfa ça
as su p o siç õ e s de um teste p aram é iric o .
7.4.5 Delineamento
O s d e lin e a m e n to s de m e d id a s re p e tid as a u m e n ta m o p o d e r p o rq u e re d u z e m a v a ria b ili
dad e d e n tre p a rtic ip a n te s, p o is c ad a p a rtic ip a n te a tu a c o m o o seu p ró p rio co n tro le. C o n sid ere
a u tiliz a ç ã o de um d e lin e a m e n to de m e d id a s re p etid a s em vez de u m d e lin e a m e n to in d e p e n
d e n te se m p re q u e puder.
7.4.6 Teste unicaudal ou bicaudal

Sc um teste u n ilateral é a d e q u a d o , u se-o . A s h ip ó te se s b ila terais re q u e rem u m a a m o stra
m a io r do q u e as u n ila te rais p ara p o d er c o m p e n s a r a p erd a de poder.
7.5 Cálculo do poder
O nivel de p o d e r real (p. ex ., 0 ,7 ) p a ra um e stu d o ou e x p e rim e n to e sp e c ífic o p o d e se:

c a lc u la d o pelo:
1. n úm ero de p a rtic ip a n te s n o e stu d o ;
2. tam an h o d o efe ito d e se ja d o ;
3. crite rio d e sig n ific a n c ia (p. ex. p = 0 ,1 0 );
D ig am o s q u e v o cê d e c id a c o n d u z ir u m e stu d o de am o stra s in d e p e n d e n te s p a ra se r a n a li

sad o p o r um teste t e n tre p a rtic ip a n te s (b ilateral). E stá p en sa n d o ern re a liz a r o e stu d o co m dez
p articip an tes em cad a g ru p o e p ro cu ra n d o u m tam a n h o d e e fe ito m e'dio. C o m o c o n h e ce as o p
çõ es ( 1), (2) e (3 ), p o d e c a lc u la r o poder. E sse cá lc u lo não p re c isa ser feito m a n u alm e n te , unía
v ez q ue e x iste m p ro g ra m a s d e c o m p u ta d o r o u ta b e las em liv ro s q u e p o d e m fa zê -lo (p.ex..
S tev en s, 20 0 2 ). P a ra o e x e m p lo , c o m o e x iste m so m e n te 10 p a rtic ip a n te s em c a d a g ru p o , há
urna c h an ce de m en o s d e 20 % de e n c o n tra r um efe ito , .ê tal ex iste. C o m esse co n h ec im e n to ,
a n tes de c o n d u z ir o e stu d o , você p o d e, se p o ssív el, a u m e n ta r o n ú m e ro de p a rtic ip a n te s. Para
te r urna b o a c h a n c e de e n c o n tra r um e fe ito (p. ex ., p o d e r = 0 ,7 ), se rã o n e c e ss á rio s d e 100
p a rtic ip a n te s (5 0 e m c ad a g ru p o ) p ara n o sso estudo.
D e o u tro la d o , se em um e stu d o n ão se c a lc u la o p o d er e se e n c o n tra u m e fe ito sig n ifi
cativ o , é o b v io q u e h av ia p o d e r su fic ie n te . S e n ão h o u v e sse p o d e r su fic ie n te , n ã o te ria sido
e n c o n tra d o um e fe ito . P o rta n to , d ep o is do e x p e rim e n to , o c o n h e c im e n to do p o d er é m ais im
p o rtan te q u an d o n ão se en c o n tra u m e fe ito , p ois não se p o d e ter c e rte z a de q u e (a) realm en te
n ão e x istia um e fe ito , ou de q u e (b) e x istia um e fe ito , m as não h av ia p o d e r su fic ie n te p ara
en co n trá-lo .
C á lc u lo s de p o d er para to d o s os tip o s de testes e sta tístic o s p o d e m se r e n c o n tra d o s em
H ow ell (2002). Q u an to m ais co m p le x a a an álise esta tístic a , m ais c o m p le x o s serão os cálcu lo s
p a ra se e n c o n tra r o poder. C á lc u lo s m a n u ais estão se to rn an d o ra ro s co m o a d v e n to de bons
p aco tes e statístic o s, e sp e c ia lm e n te de alg u n s p ro g ra m a s on-line.
7.5.1 Determinação do número de participantes necessários

D e aco rd o c o m o q u e v im o s, se v o cê sab e (a) o nível de p o d e r q u e d e se ja, (b) o tam a n h o
do e feito e (c) um c rité rio de sig n ific â n c ia , p o d e rá d e te rm in a r (d j q u a n to s p a rtic ip a n te s serão
n e c e ssá rio s p ara o e stu d o ou e x p e rim e n to q u e p re te n d e realizar. D e fato, o c o n h e c im e n to de
três de q u a lq u e r um d esse s q u atro p a râ m e tro s p e rm ite q u e você c a lc u le o q u arto . E n tre ta n
to, os a lu n o s p re c is a m , co m m ais fre q ü ê n c ia , c a lc u la r o n ú m e ro de p a rtic ip a n te s p a ra um
d e te rm in a d o estu d o . P o d e -s e p e n sa r q u e a m e lh o r id é ia é e s q u e c e r to d o s e sse s c á lc u lo s e
c o n d u z ir o e stu d o co m o m a io r n ú m e ro d e p a rtic ip a n te s p o ssív e l, m as n o rm a lm e n te esse
não é o caso . M u itas v e z e s n ã o se ria p o ssív e l fin a n c ia r o e stu d o , o u tra s v e z e s os seu s p a r
tic ip a n te s são u m a m in o ria na p o p u la ç ã o (p. ex., c ria n ç a s co m d a n o s c e re b ra is ou p e sso a s
c o m p ro b le m a s d e saú d e in c o m u n s). N e sse s c a so s, to rn a -se m u ito d ifícil e stu d a r um g ran d e
n ú m ero de p a rtic ip an tes.
D e q u a lq u e r m a n e ira, p or q u e e stu d a r um g ra n d e n ú m e ro de p a rtic ip a n te s q u a n d o n ã o e'

n e c e ssá rio ? D esde que se te n h a um n ú m e ro su fic ie n te de p a rtic ip a n te s em re la ç ão ao poder,
não é p re c iso m ais. Im a g in e u m a p esso a q u e te n h a e sc u ta d o q u e “ a m o stra s m a io re s e q u iv a
lem a m a io r p o d e r" e re so lv e e stu d a r 2 m il p a rtic ip a n te s. N e sse c a so . u m efe ito m in ú sc u lo
será d e c la ra d o e sta tistic a m e n te sig n ific a tiv o co m u m p - 0 ,0 0 0 1 . E sse é u m c a so de sig ni-
fic â n c ia e sta tís tic a , m as se m s ig n ific a n c ia p rática. N e sse s c a so s, um e fe ito m u ito p eq u e n o
(u m a p e q u e n a d ife re n ç a e n tre m é d ia s o u um re la c io n a m e n to fra c o e n tre v ariáv eis) terá um
n ível de p ro b a b ilid a d e a sso c iad a b aixo. P o r isso, v o c ê p rec isa o b se rv a r as m ed id a s d o s efeito s
e in te rv a lo s de co n fia n ç a , ta n to q u a n to os níveis d e p ro b a b ilid ad e .
O s c á lc u lo s d o p o d e r d a d o s e m H o w e ll (2 0 0 2 ), p o r e x e m p lo , p e rm itiria m q u e você
d e te rm in a s s e q u a n to s p a rtic ip a n te s sã o n e c e s s á rio s p a ra v á rio s tip o s d e a n á lise s e s ta tís ti
c as. E n tre ta n to , u m a m a n e ira m a is fá c il, se d e c id ir c a lc u la r à m ã o , é c o n s u lta r K ra e m e r e
T h ie m a n (1 9 8 7 ), q u e m o s tra m c o m o c a lc u la r o n ú m e ro d e p a rtic ip a n te s n e c e s s á rio s p a ra
v ário s tip o s d e a n á lise s. D e o u tro la d o , os p ro g ra m a s q u e c a lc u la m p o d e r e sta tístic o , c o m o
PA SS ou G P O W E R , n ã o a p re s e n ta m p ro b le m a s . S e v o c ê tem a c e ss o a In te rn e t, e n tã o é
c a p a z d e e n c o n tra r in fo rm a ç ã o so b re tip o s d ife re n te s de p a c o te s de p o d e r, alg u n s d o s q u a is
p o d e m se r b a ix a d o s sem n e n h u m c u sto , e o u tro s p o d e m se r u sa d o s on-line. A lg u n s te x to s
e sta tístic o s (c o m o S te v e n s. 2 0 0 2 ) fo rn e c e m ta b e la s d e p o d e r ú teis. O S P S S P W fo rn e c e v a
lo res d e p o d e r p a ra a lg u n s te stes: p o r e x e m p lo , o te ste A N O V A fa to ria l (q u e v o cê a p re n d e rá
no C a p ítu lo 9) in c lu i u m a e s tim a tiv a d e p o d er. T o d a v ia , em o u tro s c a so s , v o cê p ro v a v e l
m en te p re c isa rá u sa r um p ro g ra m a c o m o o PA S S ou G P O W E R ou u m c a lc u la d o r d e p o d e r
on-line. P a ra a q u e le s q u e g o s ta m d e c a lc u la r à m ã o , v e ja m H o w e ll (2 0 0 2 ) ou K ra e m e r e
T h ie m a n (1 9 8 7 ).
7.5.2 Importância do poder quando nenhum efeito é encontrado

C o m o m e n c io n a m o s, o p o d e r é e s p e c ia lm e n te im p o rta n te q u a n d o o e fe ito e n c o n tra d o é
p e q u e n o ou in e x iste n te , p o is n ã o se c o n se g u e te r c e rte z a d e q u e re a lm e n te e x iste um e fe ito
e n ão se p o d e e n c o n trá -lo . P o rta n to , q u a n d o são o b tid o s e fe ito s p e q u e n o s, é p re c iso re la ta r
o nível de p o d e r q u e h av ia . A o re la ta r o s re s u lta d o s q u e n ão têm sig n ific â n c ia e s ta tístic a ,
alg u n s p sic ó lo g o s re v e la m q u a n to s p a rtic ip a n te s se ria m n e c e ss á rio s p a ra se e n c o n tra r um
e fe ito . E m caso s nos q u a is o n ú m e ro de p a rtic ip a n te s n e c e ss á rio s p a ra se e n c o n tra r um e fe i
to é re a lm e n te e n o rm e (n a m a io ria d o s c a so s n ão se ria raz o á v e l e s p e ra r q u e os p s ic ó lo g o s
e stu d a sse m m ilh a re s d e p a rtic ip a n te s), fic a im p líc ito : o e fe ito é tão p e q u e n o q u e realm ente
não existe um efeito.
Atividade 7.4
Use um m e ca n ism o de bu sca na In te rn e t para e n c o n tra r a lg u n s p ro g ra m a s q u e c a lcu la m

o p o d er q u e p o ssam ser b a ixa d o s ou e n tã o u tiliz a d o s on-line.
Tabela 7.1 Uma com paração de médias para quatro grupos obstétricos em oito variáveis dependentes (Maclean et al., 2000, por permissão de Taylor e Francis Ltda,
www.tandf.co.uk/journals)
Tipo de parto
Parto vaginal Parto vaginal Parto instrumental Cesariana de

espontâneo induzido (fórceps e episiotomia) emergência
(n = 10) (n = 10) (n = 10) (n = 10)
n2
IC de IC de IC de IC de Probabili (tamanho
Variáveis Dependentes Média 95% Média 95% Média 95% Média 95% Razão F dade F do eleito)
1 Autopercepção do risco de ■'1,30 0.62-1.98 hl,30 0.95-1,65 '"'4,20 3,64—4.76 1.50 1.12-188 *39.65 0.001 0,77
ferimentos graves (0,95) (0.48) (0,79) (0,53)
2 Satisfação com o alívio da 2.30 1,29-3,1 2,70 1,34-3,46 4,00 3,25-4,75 1,50 0,89-2.11 *8.77 0,001 0,42
dor durante o parto (1,42) (1,06) (1,50) (0,85)
OC
CJ
0.35
«n
3 Nível de sofrimento durante *6,56 0,001
‘f
■'2.20 1,26-3,14 h2,30 1.62-2,98 * 4 ,2 0 3.64^1.76 ‘ 2.60
o parto relatado pela paciente (1.32) (1,95) (0,79) (1.43)
4 Apoio social: número de 3,60 1,59-5.60 3,80 1,51 -6.08 0,00 0,00-000 2,50 0,15—4.84 4.25 0,01 0.06
familiares que vivem em um (2,79) (3.19) (0,00) (3,27)
raio de cinco milhas
5 Emoções depressivas 3,20 1,13-5,27 6,90 4.73-9.07 4,20 2,27-6,13 3.70 2.12-5,28 3.66 0.02 0,23
(HAD) (2,90) (3,03) (2,70) (2.21)
6 Ansiedade (HAD)* 6,80 3.12 10,48 6.60 3,73-9.47 7,10 4,70-9,50 4,60 2.52-6.68 0,83 0.49 0.07
(5,14) (4.01) (3,35) (2,91)
7 Reação de evitaçâo (IES )** 4,60 -0,95-10.15 5,90 3.05 875 7,00 2.69-11.51 3,80 1,70-5.90 0.66 0,58 0,05
(7,76) (3,98) (6,02) (2.94)
X Reação de intrusão (IES) 8,00 2.07-13,93 7,10 3,62-10,58 11,30 6.09-16,51 7,90 1.66-14,14 0,63 0,60 0.05
(8,29) (4.86) (7.29) (8.72)
Notas: médias com um sobrescrito em comum são significativamente diferentes em um teste Scheffé: razões F com asterisco são significativas em p < 0.0063: o procedimento Bonferro-
ni (onde p = 0.05/N-dos-testes, isto é. 8 aqui, são de Dunn, 1961) foi utilizado.
■■ N. de T. HAD (Hospital Anxiery and Depression) é um questionário (escala) para m edir a depressão e a ansiedade d e pacientes, hospitalizados
** N. de T. IES I lmpact of Evcm Sculc) c um questionário u tili/ad o para m edir a sensação dc intrusão e evitação.
terapia cognitiva e síndrome do intestino irritável
V o llm er e B la n c h a rd (1 9 9 8 ) d e sig n a ra m p a c ie n te s co m a sín d ro m e do in te stin o irritáv el a três
c o n d içõ e s de tratam en to : te ra p ia c o g n itiv a de g ru p o (T C G ), te ra p ia c o g n itiv a in d iv id u a l (T C I) e um
g ru p o de c o n tro le fo rm a d o p o r p a cie n te s em lista d e e sp e ra (C L E ). N a c o n d iç ã o T C G , h a v ia so m e n
te 3 a 5 p ac ie n tes, e a d u ra ç ã o d o tra ta m e n to foi de 10 sem an as. E le s c o m p a ra m os g ru p o s p o r m eio
de várias m ed id as (p. ex., re d u ç ã o de sin to m a s). F e z - se u m a d a s c o m p a ra ç õ e s e n tre as c o n d iç õ e s
T C G e T C I. C a lc u lo u -se o ta m a n h o do e fe ito , q u e era p eq u en o . O s p e sq u isa d o re s re la ta ra m esses
re su lta d o s e os in terp re taram d a seg u in te m an eira:
A ... comparação das condições TCG e TCI não foi significativa [F( 1,21) = 0,11, p = 0,75].3 O tamanho
do efeito para essa comparação indicou que 4% da variância é explicada pelas condições de tratamento. Uma
equação foi gerada para encontrar o tamanho da amostra necessário para se obter urna diferença significativa
entre os grupos tratados. Com um poder estatístico de 0,80 e um nível de significância de 0,05, seriam ne
cessários 1158 pacientes para se obter uma diferença significativa entre as condições TCG e TCI. Portanto,
parece que os dois tratamentos ativos foram equivalentes em eficácia para todos óS propósitos práticos.
V ollm er e B lanchard po ssu íam to d as as in fo rm a ç õ e s n ecessárias p ara en co n tra r o n ú m ero de p a r

ticip an tes que p recisariam a fim de terem u m a b o a ch an ce (8 0 % ) de o b ter u m efeito . E les tinham :
■ o c ritério de sig n ific â n c ia (0 ,0 5 )

g o nível de p o d e r d e se ja d o (8 0 % )
■ o tam an h o do e feito (4 % )
P o rtan to , p u d eram ca lc u la r (e m b o ra não ten h am re la ta d o co m o ) o n ú m ero de p a rtic ip a n te s n e

c e ssá rio s p ara se o b te r um efeito . O fato de p re c isa re m de m ais de 1 100 p a rtic ip a n te s p a ra o b terem
u m a ch a n c e de 80% d e e n c o n tra re m u m efe ito d e m o n s tra o q u ão p e q u e n o este é - tão p eq u e n o ,
c o n c lu e m , que p ode se r n eg h g e n eiá v e l.
7.6 Intervalos de confiança
im a g in e q ue você p eça a a lg u m a s p e ss o a s p ara e stim a re m q u a n to s a lu n o s e stão no p ri

m eiro an o de um c u rso de p s ic o lo g ia típ ic o de g ra d u a ç ã o . A re s p o sta fre q ü e n te s e ria alg o
c o m o “ 140 m ais ou m en o s 5". E m o u tras p alav ras, essas p e sso as p ro d u z iria m u m a estim ativ a
p o r p o n to e o u tra p o r in terv alo . O n ú m e ro 140 é a m e lh o r estim ativ a q u e têm (i.e., u m a e sti
m ativa p o r p o n to ), e "m a is ou m en o s 5 " é u m a te n ta tiv a de fo rn e c e r u m raio d e n tro d o qual
tem c e rteza de qu e o n ú m e ro c o rre to se e n c o n tra (i. e.. u m a e stim ativ a p o r interv alo ).
O e x e m p lo m o stra q u e os teste s p a ra m é tric o s g e ra lm e n te im p lic a m o c á lc u lo de e s ti
m ativ as p o r p o n to da m é d ia e d a v a riâ n c ia p o p u la c io n a is. A s m éd ias a m o stra is o b tid a s são
estim a tiv a s p o r p o n to das m é d ia s p o p u la c io n a is . T o d av ia, ca so se re p e tisse o e x p e rim e n to ,
é im provável qu e se o b te s se m e x a ta m e n te as m esm a s m é d ia s a m o stra is, e isso , é c la ro , sig
n ifica q ue as e stim a tiv as p o d e ria m ser um p o u co d ife re n te s das m éd ias p o p u la c io n a is reais.
P o rta n to , seria útil o b te r u m a e stim a tiv a p o r m te rv alo na qual n o ssa s m éd ias p o p u la c io n a is
p u d e sse m se e n c o n tra r co m ra zo á v e l c o n fia n ç a . Isso é o q u e os in te rv a lo s de c o n fia n ç a em
to m o da m éd ia, d isp o n ív e is so b o co m a n d o E xplore (E x p lo ra r) no S P S S P W , fo rn e c e m (os
in terv alo s de c o n fia n ç a fo ram a p re se n ta d o s no C a p ítu lo 3, p ág in a 121 ).
F é uma estatística que você aprenderá no Capítulo 9.

N o C ap ítu lo 5 , você ap ren d eu q u e os in terv alo s d e c o n fian ç a p o d e ria m ser co n stru íd o s em

to rn o d o r de P earso n . N 0 C a p ítu lo 6. v iu q u e p o d e riam ser c o n stru íd o s e m to rn o d e m édias
(p ara o teste t in d e p en d e n te) e e m to rn o da d ife re n ç a e n tre m éd ias (p ara 0 teste t rela c io n a d o ).
N 0 C a p ítu lo 11. v o cê v erá q u e p o d em o s c o n stru ir in terv a lo s de co n fia n ç a em to rn o de linhas
d e re g ressão . P ara a lg u n s testes e sta tístic o s, nos q u a is o S P S S P W n ão fo rn ec e in te rv a lo s de
co n fia n ç a , não é fácil c alc u lá -lo s. S u g e rim o s que, nesse e stág io , você n ã o se p re o c u p e m uito
q u a n d o p e rc e b e r q u e n ão c o n se g u e c a lc u lá -lo s. T o d av ia, re la te -o s se m p re q u e p u d e r - serão
m u ito in fo rm ativ o s p ara os se u s leito res.
O b v ia m e n te , u m in te rv a lo d e c o n fia n ç a e s trito é m u ito m a is ú til d o q u e u m am p lo .
Q u a n to m ais p o d e r o seu te s te tiv er (c o m o d is c u tid o ), m a is e s trito s o s seu s in te rv a lo s de
c o n fia n ç a serão.
respostas emocionais de mulheres a tipos de parto
M aclean e c o la b o ra d o re s (2 0 0 0 ) c o m p a ra ra m q u atro g ru p o s de m u lh eres: a q u e la s q u e tiveram
filhos p o r parto vaginal esp o n tân e o , parto v ag in al in d u zid o , p arto v a g in al in stru m e n ta l ou cesarian a.
H av ia 10 p artic ip a n te s em c a d a g ru p o . As m u lh e re s fo ram c o m p a ra d a s em 8 v ariáv eis in d e p e n d e n
tes p o r u m a série d e an álises d e v a riâ n c ia de u m fator. N ão é co m u m e n c o n tra r um artig o p u b licad o
no q u al ten h am sido in c o rp o ra d o s to d o s os p o n to s m e n c io n ad o s q u e c o n sid e ra m o s d e b o a p rática.
C o m o você v erá na T abela 7 .1 . os a u to res fo rn ec e m m éd ias, lim ites de c o n fia n ç a , v alo res d e p ro b a
b ilid ad e ex ato s e u m a m e d id a do e fe ito ( r f ). V ocê n o tará q u e u tiliz a ra m um c rité rio de sig n ific ân c ia
c o n tra o q u a l c o m p a ra r as p ro b a b ilid a d e o b tid a s. E les n o s d e ra m in fo rm a ç õ e s c o m p le ta s so b re a
m a n e ira na q ual 0 v a lo r d o c rité rio (p < 0 ,0 0 6 3 ) foi d e te rm in a d o . A ta b e la e stá re p ro d u z id a p o r
c o m p le to - um m o d elo p a ra a b o a prática!
Resumo
■ E x iste um g ra n d e n ú m ero d e q u estõ es a se re m c o n sid e ra d a s q u a n d o estiv e r p ro je ta n

d o e c o n d u z in d o seu s p ró p rio s e stu d o s e e x p e rim e n to s. S ão elas: p o d er, ta m a n h o do
efe ito , v alo r d e p ro b a b ilid a d e , n ú m e ro de p a rtic ip a n te s, tipo de d e lin e a m e n to e teste
estatístico .
■ O p o d e r é a h a b ilid a d e q u e um te ste e sta tístic o te m de a c h a r u m e fe ito significativ o ,
q u a n d o tal ex iste. O p o d e r e stá e m u m a e sc a la d e 0 (se m p o d e r) a té 1,0 (100% ).
P o rtan to , u m p o d e r de 0,5 sig n ifica q u e há 5 0 % de c h a n c e de e n c o n tra r u m efeito
sig n ificativ o , q u a n d o tal existe.
■ É im portante co n sid erar tais questões antes de co n d u zir seu estu d o ou ex perim ento, para
que p o ssa m ax im izar suas ch an ces de en co n trar um efeito. Q uanto ao custo, não vale
a pena co n d u zir um estudo que tem p oucas chances de en co n trar um efeito significati
vo. Isso significa que você deve p en sar cuidadosam ente sobre seu d elin eam en to - por
exem plo, se é um delin eam en to independente ou com m edidas repetidas - e 0 núm ero de
p articipantes p otenciais 110 estudo.
■ É im p o rta n te re la ta r os e fe ito s e in terv alo s de c o n fian ç a se m p re q u e puder.
QUESTÕES DE MÚLTIPLA ESCOLHA 6. O efeito é:

(a) A magnitude da diferença entre condições
1. Quanto mais estreitos forem os intervalos de con (b) O poder do relacionamento ou associação
fiança: (c) Ambas as alternativas estão corretas
(d) Nenhuma das alternativas está correta
(a) M aior a confiança nos resultados
(b) M enos se pode depender dos resultados 7. As médias amostrais são:
(c) M aior a chance de os resultados Lerem ocorri (a) Estimativas por ponto de médias amostrais
do por erro amostrai (b) Estimativas por intervalo das médias popula
(d) Nenhuma das alternativas cionais
2. A significancia estatística: (c) Estim ativas por intervalo das m édias am os
trais
(a) Está diretamente associada à importância psi
(dj Estimativas por ponto das médias populacio
cológica nais
(b) Não significa necessariamente que os resulta
dos são psicologicamente significativos 8. Considerando todas as coisas iguais, quanto mais
(c) Depende do tamanho du amostra poder tem um teste estatístico:
(d) Alternativas (b) e (c) (a) Mais largos são os intervalos de confiança
3. f .'onsiderando todas as outras questões como iguais, (b) M aior é a probabilidade de o intervalo de con
os delineamentos de medidas repetidas: fiança incluir o zero
(c) Mair; estreito é o intervalo de confiança
(a) Têm exatamente o mesmo poder que os deli (d) M enor o tamanho da amostra
neamentos independentes
(b) Geralmente têm menos poder que os delinea 9. O poder pode ser calculado pelo conhecimento do:
mentos independentes (a) Teste estatístico, tipo de delineamento e efeito
(c) Geralmente têm mais poder que os delinea (b) Teste estatístico, nível de significância de cri
mentos independentes tério e efeito
(d) Nenhuma das alternativas acima esta corretas (c) Nível de significancia de critério, efeito e tipo
4. Considerando todas as coisas iguais: de delineamento
(d) Nível de significância de critério, efeito e ta
(a) Quanto maior a amostra, menor o poder manho da amostra
(b) Quanto maior a amostra, maior o poder
(c) O tamanho da amostra não está relacionado 10. O nível de poder de 0,3 significa:
ao poder (a) Que ha uma chance de 30% de detectar um
(d) Quanto maior a amostra, mais difícil fica de efeito
determinar o poder (b) Que há uma chance de 49% de detectar um
5. O poder é a habilidade de detectar: efeito
(c) Que há uma chance de 70% de detectar um
(a) Um efeito de significancia estatística, quando efeito
tal existe (d) Que há uma chance de 0,7% de detectar um
(b) Um efeito de im portância psicológica, quan efeito
do tal existe
(c) Alternativas (a) e (b) 11. Observe a seguinte ,aída para um teste / indepen
(d) Defeitos de delineamento dente:
ndependent Samples Test (Teste para Amostras independentes)
Levene's Test for t-test for Equality of Means

Equality of Variances (Teste t para a Igualdade de Médias)
(Teste de Levene para a
Igualdade de Variâncias)
95% Confidence
Interval of the
Difference
(IC de 95% para
Sig. Mean Std. Error a Diferença)
(2-tailed)
Df (Sig. (Diferença (Erro Padrão Lower Upper
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superior)
SCORE Equal variances - 6 807 38 0.000 -27.7000 4.0692 -35.9377 -19.4623

(ESCORE) assumed
(Igualdade de
variâncias
assumida)
Equal variances 34.863 0.000 -6.807 19.000 0.000 -27.7000 4.0692 -36.2169 -19.1831
not assumed
(Igualdade de
variâncias
não-assumida)
Podemos ter 95% de confiança de que: Qual é a conclusão mais sensata? Estam os 95%
(a) A diferença da média populacional é 27,7 confiantes de que a linha de regressão populacio
(b) A média populacional estará entre 19,18 e nal seria:
36,2] (a) Positiva (+0.30)
(c) A média populacional estará entre 19,46 e (b) Zero
35,93 (c) Negativa ( - 0,2)
(d) Os resultados serão importantes (d) Entre - 0,2 e +0,7
12. Um pesquisador encontrou um coeficiente de 13. Observe a seguinte saída de uma análise de teste. I
correlação de r = +0,30, IC(95% ) = - 0 ,2 - (+0,7). em pares:
Paired Sample Statistics (Estatísticas de Amostras Emparelhadas)
Mean N Std. Error Std. Error Mean

(Média) (Erro Padrão) (Erro Padrão da Média)
Pair 1 congruent-errors 7.500E-02 80 0.2651 2.963E-02

(Par!) (erros congruentes)
neutral-errors 0.2250 80 0.7111 7.951 E-02

(erros neutros)
Paired Sample Statistics (Estatísticas de Amostras Emparelhadas)
N Correlation Sig.
(Correlação)
Pair 1 congruent-errors & neutral-errors 80 ■0.024 0.836

(Par 1) (erros congruentes e erros neutros)
95% Confidence
Paired Differences Interval of the df
(Diferenças Emparelhadas) Difference t Sig.
(gl)
(IC de 95% para
Mean Std. Std. Error a Diferença)
(Média) Deviation Mean (Erro
(Erro Padrão) Padrão da Média)
Lower Upper
(Inferior) (Superior)
Pair 1 congruent-errors & neutral-errors -0.1500 0.7647 8.550E-02 -0.3202 0.02 -1.754 79 0.083
(Par 1) (erros congruentes e erros neutros)
Qual é a resposta mais sensata? 16. Quais sao as chances de encontrar um efeito (se
(a) A diferença da m édia da am ostra é -0,15, e existente) quando o poder é 0,6?
lemos 95% de confiança de que a diferença (a) 50:50
da média da população estará entre -0 ,3 2 e (b )60:40
0,02 (c) 40:60
(b) A diferença da média da am ostra é 0,76, e (d) 60:60
tem os 95% de confiança de que a diferença 17. Os intervalos de confiança em lorno de um valor
da m édia da população estará entre -0 ,3 2 e de média nos fornecem;
0,02 (a) Um raio dentro do qual a média populacional
(c) A diferença da média da am ostra é -0 ,1 5 , e provavelmente será encontrada
tem os 95% de confiança de que a diferença (b) Um raio dentro do qual a média amostrai pro
da média da população estará entre -0 ,1 5 e vavelmente será encontrada
0,17 (c) Uma estimativa por ponto da média popula
(d) Os resultados são importantes cional
(d) Uma estimativa por ponto da média amostrai
14. i; mais importante saber o poder de um estudo
quando: 18. Quando o seu teste estatístico se torna mais pode
roso, o seu intervalo de confiança se torna:
(a) O estudo tem um número grande de partici
pantes e é estatisticamente significativo (a) Mais largo
(b) O estudo tem um número grande de partici (b) Mais estreito
pantes e não é estatisticamente significativo (c) Não faz diferença alguma
(c) O estudo tem um número pequeno de partici 19. Se d = 0,89, o efeito é:
pantes e é estatisticamente significativo
(a) Zero
(d) O estudo tem um número pequeno de partici (b) Fraco
pantes e não é estatisticamente significativo (c) Moderado
15. Em relação a efeitos grandes, efeitos pequenos (d) Forte
são: 20. Quando o conhecimento do poder é mais impor
(a) Mais fáceis de detectar tante?
(b) Mais difíceis de detectar (a) Quando você encontra um efeito
(c) Tão fáceis de detectar quanto os grandes (b) Quando você não encontra um efeito
(d) Tão difíceis de detectar quanto os grandes (c) Não faz diferença alguma
Referências
DCOHEN, J. Statistical Power Analysis fo r the Behavioral Sciences. New York: Academic Press,
1988. 2'lJedn.
DUNN, D. J. Multiple comparisons among means. Journal o f the American Statistical Association, v.
56. p. 562-64, 1961.
HOWELL. D. C. Statistical Methods fo r Psychology. Boston: PWS-Kent, 2002. 5th edn.
KRAEMER, H. C.. THIEM AN, S. How Many Subjects? London: Sage, 1987.
KRANTZ. D. H. The null hypothesis testing controversy in psychology. Journal o f the American
Statistical Association, v. 94, p. 1372-81, 1999.
MacDONALD, R. On statistical testing in psychology. BritishJournal o f psychology. V. 88, p. 333-47,1997
MacLEAN, L. I. McDERMOTT, M. R., MAY, C. P. Method of delivery and subjective distress:
women’s emotional responses to childbirth practices. Journal o f Reproductive and Infant
Psychology, v. 18, n. 2, p. 153-62, 2000.
NICKERSON, R. S. Null hypothesis significance testing: a review of an old and continuing
controversy. Psychological Methods, v. 5, n. 2, p. 241-301, 2000.
ROSENTHAL, R. Cumulating psychology: an appreciation o f Donald T. Campbell. Psychological
Science, v. 2, n. 2, p. 213, 217-21, 1991.
ROSNOW, R. L., ROSENTHAL, R. Statistical procedures and the justification o f knowledge in
psychological science. American Psychologist, v. 44, n. 10, 1276-84, 1989.
STEVENS, J. Applied M ultivariate Statistics for the Social Sciences. New Jersey: Lawrence Erlbaum
Associates. 2002, 4lh edn.
VOLLMER, A. BLANCHARD, E. B. Controled comparison of individual versus group cognitive
therapy for irritable bowel syndrome. Behavior Therapy, v. 29, p. 19-33.
Medidas de Associação
No Capítulo 5, você aprendeu como analisar o relacionamento entre duas variáveis utilizan
do o coeficiente r de Pearson. Esse valor é útil para fornecer uma idéia do grau de associação
entre duas variáveis contínuas. Você viu como representar tal relacionamento por meio dos dia
gramas de dispersão. Aprendeu o que é um coeficiente de correlação e que r é um tamanho
do efeito natural. Neste capítulo, mais uma vez abordaremos relacionamentos, ou associações:
atentaremos para a análise do relacionamento entre variáveis categóricas por meio do %2ou o
qui-quadrado.
Você aprendeu sobre estas variáveis no Capítulo 1. Se, por exemplo, classificarmos pessoas
com base na cor da blusa ou camisa que estão usando, trata-se de uma classificação em catego
rias. Da mesma forma, se classificarmos pessoas por grupos étnicos, religião ou por país no qual
vivem, estaremos fazendo julgamentos categóricos. Não faz sentido ordená-las numericamente.
Neste capítulo, você aprenderá a:
analisar a associação entre duas variáveis categóricas;
registrar outra medida do efeito (o V de Cramer);
■ relatar os resultados de tais análises.
A análise do relacionamento entre variáveis categóricas inclui os seguintes tópicos:
contagem da freqüência sob a forma de uma tabela - isso será explicado mais adiante;
Testes inferenciais que indicam se o relacionamento entre as variáveis pode ter ocorrido
devido a erro amostrai, considerando que a hipótese nula seja verdadeira;
o tamanho do efeito: (qui-quadrado) pode ser convertido em uma estatística denomi
nada V de Cramer - isso é interpretado da mesma forma que qualquer outro coeficiente
de correlação. Felizmente, pode ser obtido com o SPSSPW.
8.1 Freqüências (dados categóricos)
O s testes u tiliz a d o s até a g o ra e n v o lv e ra m c á lc u lo s so b ie c o n ju n to s de v a lo re s o b tid o s

a p a rtir de p a rtic ip a n te s. A lg u m as v ezes, e n tre ta n to , ha dad o s c a te g ó ric o s (isto é, d a d o s na
fo rm a de fre q ü ên cia s). P o r e x e m p lo , im a g in e q u e p e rg u n te m o s a um a am o stra de fa z e n d eiro s
(na re a lid a d e 544 d eles) q u al das q u a tro fig u ra s p re fe re m p ara ilu stra r u m a c a m p a n h a d o tipo
“ salv e o n o sso bacon". S im p le sm e n te re g istra re m o s q u a n to s p re ferem a F ig u ra I , a F ig u ra 2,
etc. O s d a d o s serão ap e n a s u m a c o n ta g e m (ou fre q ü ê n cia s). A T ab ela 8.1 m o stra um ex e m p lo
de resu ltad o s p o ssív eis.
Tabela 8.1 Número de fazendeiros expressando preferências por figuras de suínos
Figura 1 Figura 2 Figura 3 Figura 4
!% &
150 220 60 114
C o n sta ta -se q u e m u ito s fa z e n d e iro s p re fe re m a F ig u ra 2. E ssas são fre q ü ê n c ia s de o c o r

rê n c ia e não faz se n tid o fo rn e c e r q u a lq u e r o u tra e sta tístic a d escritiv a.
O e x e m p lo é c o n h e c id o c o m o %“ d e u m a v ariáv el, p o r q u e te m o s ap en a s u m a variável.
E ssa variável é o “ tip o de su ín o ” e a p re se n ta q u atro níveis (F ig u ra s 1 a 4).
N e ste c a so c a d a p a rtic ip a n te só p o d e c o n trib u ir c o m u m v a lo r (c o n ta g e m ) - se você
p re fe re a F ig u ra 2, não p o d e se r c o n ta d o e m n e n h u m a o u tra c a te g o ria . D a d o s c a te g ó ric o s
sig n ificam p e rte n c e r a u m a ú n ic a c a te g o ria e n e n h u m p a rtic ip a n te p o d e p e rte n c e r a m a is de
u m a c ate g o ria. Isso faz sen tid o . Se e stiv e rm o s falan d o so b re relig ião , ou g ru p o s étn ic o s, p or
e x em p lo , e u m a p e sso a é c la ssific a d a c o m o c a tó lic a , n ão p o d erá se r c la ssific a d a a in d a co m o
p e rte n c e n te ao ex é rc ito da salv ação .
C o m a c o n ta g e m d e fre q ü ê n c ia s, o s v alo res n ão são e sc o re s: são o n ú m e ro d e p a rtic i
p an tes cla ssific a d o s em d e te rm in a d a c a te g o ria , e o x é p a rtic u la rm e n te a p ro p ria d o p a ra tais
dados. E u m a m ed id a de re lac io n am en to ou asso c ia ç ão , d ese n v o lv id a p o r Karl P ea rso n (1 8 5 7
1936) em 1900. P e rm ite -n o s v e rific a r se as fre q ü ên c ia s q u e o b le m o s q u a n d o in d a g a m o s aos
p articip an tes a q u e c a te g o ria p e rte n c e m são sig n ific a tiv am e n te d ife re n te s d as fre q ü ê n c ia s que
p o d em o s e sp e ra r p o r a c a s o .1 Isso será c la ssific a d o a seguir.
A s m ed id as de a sso c ia ç ã o q u e d isc u tire m o s n este cap ítu lo são as seg u in tes:
a % de um a variável (teste de a d e rê n cia ) - u tiliz ad o q u a n d o há u m a ú n ica v ariável,

c o m o no ex e m p lo m en c io n ad o .
■ Teste x" de independência: 2 x 2 - u tiliz a d o q u a n d o se p ro c u ra u m a a ss o c ia ç ã o
e n tre d u a s v a riá v e is c o m d o is n ív e is (p. ex ., a a s s o c ia ç ã o e n tre in g e rir b e b id a s
a lc o ó lic a s [b e b e d o r/a b stê m io ] e fu m a r [fu m a n te /n ã o -fu m a n te ]), p o r isso o c o m
p le m e n to 2 x 2 .
■ Teste XJ de independência: r x 2 - u tiliza d o q u an d o se p ro c u ra u m a a sso c ia ç ã o entre
d u as variáv eis, na q ual u m a a p re se n ta d ois níveis (fu m a n te /n ã o -fu m a n te ), e a outra,
m ais de d ois níveis (b eb errão , b e b e d o r m o d erad o e ab stêm io ). A d en o m in aç ã o é r x 2
p o rq u e e x iste m v árias lin h as, m as ap en as du as co lu n as.
1O teste x pode ser entendido como um teste de associação ou de dilcrença* entre categorias - depende da forma como o problema
é colocado.
Atividade 8.1
Em um te ste de a s so c ia ç ã o para o re la c io n a m e n to e n tre d u a s ou m ais v a riá v e is, o d e li

n e a m e n to é:
(a) De m e d id as rep etid as

(b) E n tre p a rticip a n te s
(c) C o rrelacio n ai
8.2 Variável %2 ou teste de aderência
E sse te ste n o s p e rm ite d e s c o b rir se um c o n ju n to dc fre q ü ê n c ia s o b se rv a d a s d ife re de

u m o u tro c o n ju n to d e fre q ü ê n c ia s e sp e ra d a s. N o rm a lm e n te as fre q ü ê n c ia s são a q u e la s q u e
e n c o n tra ría m o s se a h ip ó te se n u la fo sse v e rd a d e ira , m as, c a so q u e ira m o s, p o d em o s c o m p a ra r
as fre q ü ê n c ia s o b serv a d as co m q u a lq u e r c o n ju n to d e fre q ü ên c ia s: v e rific a re m o s en tã o q u ã o
boa é a a d e rê n c ia e n tre elas. O s d e ta lh e s de c o m o fa z e r isso p o d em se r e n c o n tra d o s na p ág in a
271. N esse c aso , te m o s u m a ú n ic a variável. O s c á lc u lo s p a ra tal c a so p e rm ite m q u e se e n te n
d am os fu n d am e n to s d a ta b e la X 2 x 2 e d a s ta b ela s r x c.
í\j EXEMPLO: PREFERÊNCIA POR CHOCOLATE

*1
E m u m a a m o stra , 110 p e sso a s fo ra m so lic ita d a s a m a n ife sta r su as p re fe rê n c ia s com
re s p e ito a c h o c o la te s. O n ú m e ro de p e sso a s q u e e sc o lh e u e n tre q u a tro m arc as d ife re n te s
está na T abela 8.2.
Q u e re m o s v e rific a r se a lg u m as m a rc as (ou u m a m a rc a) são p re fe rid a s em d etrim en to
d e outras. Se não são, d ev em o s e sp e ra r a p ro x im a d a m e n te o m e sm o n ú m e ro de p e sso a s em
c ad a categ o ria. C o m c e rtez a , não h a v erá e x a ta m e n te o m e sm o n ú m e ro de p a rtic ip a n te s em
c a d a c a te g o ria , m as o s n ú m e ro s d ev em te r u m a d is trib u iç ã o co m ra zo áv el p ro x im id a d e .
H á o u tra fo rm a de e x p lic a r isso: se a h ip ó te se n u la é v e rd a d e ira e a lg u m a s m arcas não são
p re fe rid a s, to d as dev em e sta r ig u a lm e n te re p re se n ta d a s.
E sp e ra m o s a p ro x im a d a m e n te o m e s m o n ú m e ro d e p e ss o a s e m c a d a c a te g o ria se a
h ip ó tese n ula fo r v e rd ad eira.
Tabela 8.2 Preferências por marcas de chocolate
Chocolate A Chocolate B Chocolate C Chocolate D
20 60 10 20
2 0 + 6 0 + 10 + 2 0 = 110 p e s s o a s n o to ia l
E x istem 110 p e sso a s e 4 cate g o ria s. Se a h ip ó te se n u la é v e rd a d e ira , d e v em o s e sp era r

I 10/4 em c ad a c ate g o ria. A ssim :
110/4 = 27,5
S e os q u atro tip o s d e c h o c o la te têm ig u al p o p u la rid a d e , d e v em o s e sp e ra r a p ro x im a d a

m ente o m esm o n ú m ero de p e sso as em c a d a c a te g o ria (claro que é im p o ssív el te rm o s 27,5
p e sso a s, m as, p ara o p ro p ó s ito d o c á lc u lo da e sta tístic a teste, n ão ire m o s n o s p re o c u p a r
co m esse tipo de d etalh e).
A s co n ta g e n s e n c o n tra d a s em c a d a c a te g o ria são d e n o m in a d a s freq ü ên cia s o b serva
das. Se a h ip ó tese n u la fo r v erd ad e ira (to d as as m arc as são ig u alm en te p o p u la re s), d ev em o s
e n c o n tra r as freqüências esperadas.
O X c o m p a ra as fre q ü ê n c ia s o b se rv a d a s co m as e sp era d a s. S e to d a s as m a rc a s d e c h o
c o late são ig u a lm e n te p o p u la re s, as fre q ü ê n c ia s o b se rv a d a s não d ev e rã o d ife rir m u ito das
esp erad as. Se, p o r o u tro lado, as fre q ü ê n c ia s e sp e ra d a s d iferem b a sta n te das o b se rv a d a s, é
provável q ue nem to d as as m arc as te n h a m a m e sm a p re fe rê n c ia . Isso é n o rm a lm e n te difícil
d e ser ju lg a d o se c o n sid e ra m o s a p e n a s os d ad o s. A d is trib u iç ã o d o s d a d o s d e p re fe rê n c ia
p o r c h o c o la te estã o lista d o s n a T ab ela 8.3, q u e m o stra a fo rm a co m u m de a p rese n ta ç ã o dos
dad o s p ara u m a an álise p elo % .
Tabela 8.3 Freqüências observadas e esperadas de pessoas que preferem diferentes marcas de
chocolate
Freqüências Chocolate A Chocolate B Chocolate C Chocolate D
Observadas 20 60 10 20
Esperadas 27,5 27,5 27,5 27,5
Atividade 8.2
O q u e há de errad o na ta b e la ? P e rg u n to u -se a 1 0 0 p essoas q u al seria o g a to m ais bo n ito

das fig u ra s a s e g u ir A s fre q ü ê n cia s o b se rva d a s estão listad a s ab aixo .
-C
< 4
50 25
Í 15
È
10
r
10
8.2.1 Como descobrir se freqüências observadas e esperadas são similares?

1. E n co n tre as fre q ü ên c ia s esp e ra d a s a p a rtir das fre q ü ê n c ia s o b serv ad as:
Observadas Esperadas = Diferença
20 27.5 = -7.5
60 27.5 = 32,5
10 27,5 = -17.5
20 27.5 = -7.5
1 10 110
Ig n o ra m o s o sin al (m ais ou m en o s) p o rq u e e sta m o s in te re ssa d o s no v a lo r a b so lu to das

d ife re n ç a s (de fato , ele v a n d o os v a lo re s ao q u a d ra d o , c o m o no p asso 2, ire m o s e lim in a r os
valores negativos).
2. E le v a r cad a d ife re n ç a ao q u ad rad o :
- 7 . 5 : = 56,25
3 2 ,5: = 1056,25
- 1 7 ,5 2 = 306.25
- 7 ,5 : = 56,25
3. D iv id a esse s re su lta d o s p or u m a m ed id a de v a ria b ilid a d e (isso é se m e lh a n te ao que

aco n te ce no teste t ou no r d e P earso n ). N este caso , a m e d id a da v a ria b ilid a d e c o r
re sp o n d e às fre q ü ê n c ia s e sp e ra d a s (27,5).
5 6 ,2 5
= 2 ,0 5
2 7 ,5
1 056.25
38.41
2 7 ,5
3 0 6 .2 5
= 11.14
2 7 .5
5 6 ,2 5
= 2 .0 5
2 7 ,5 '
4. E sses q u o c ie n te s são en tã o so m a d o s p a ra fo rn ecer:
T otal = 53,65
E n tã o , o yj é 5 3 ,6 5 (53,7).
O g rau de lib e rd a d e (gl) e' igual ao n ú m e ro de c a te g o ria s e n v o lv id a s n o te ste m e n o s 1,

A ssim , g l = 4 - 1 = 3 . P re cisa m o s sa b e r d isso p ara p o d e rm o s c o m p a ra r esse re su lta d o co m o
valor tcó rico (a d istrib u iç ã o de p ro b a b ilid a d e x", cu jo p arâm e tro é o g l) d o e v e rific a r q u ão
provável de o co rre r seria, p or acaso , o valo r e n c o n tra d o ou m ais ex trem o .
A ssim , o v alo r c a lc u la d o ou e n c o n tra d o e' 5 3 ,6 5 . q u e é co m p a ra d o co m o v a lo r que seria
e sp erad o (te ó ric o ) p a ra u m y j c o m 3 g ra u s d e lib erd a d e , se a h ip ó te se n u la fo sse v erd a d eira
(isto é, se to d as as m a rca s fo s se m ig u a lm e n te p re fe rid a s). N ão p rec isa m o s fa z e r essa c o m p a
ração p o rq u e o p a c o te e sta tístic o a faz a u to m a tic a m e n te .
SPSSPW: %2 de uma variável
Se você d isp u se r d o s d a d o s em u m a ta b e la d e fre q ü ê n c ia s, c o m o n o e x e m p lo m e n c io n a

do, os m e sm o s p o d e m se r fo rn e cid o s ao S P S S P W d a m an eira a seguir.
IL'lSlalO b Ijil-dlulJiZilul
- S P S S D a ta E d ito r B E I E3
File Edit Yiew Qata Iranstorm ônalyre graphs dirties window tjeip
IН им йз| i i Ь |Ы « I rlr I U lllr .l vl^l
1 chocolot 1
chocolat freq I I I I I I —
1I 1 00 20 00
2 2 00 60 00
3■ “ 3 00 10 00 ■
'
4 4 00 20 00" " .........
« I > КData View (Vanable Vi - | _________ I

S P S S Pro cesso r is ready
,-iflS la r t| 1ДУ Microsoft Word - с | Exploring - С \stat |||jp [o n H v a rch isq u n r fffj Outpuil - S P S S Vi | 0 14:46
S em p re q u e se e n tra r com os d a d o s d e ssa fo rm a e se e x e c u ta r o d e v e-se p o n d e ra r os

caso s p e la s fre q ü ê n c ia s. Isso é n e c e ss á rio p a ra in fo rm a r ao softw are q u e os d a d o s são fre
q ü ê n c ia s em v ez de d a d o s b ru to s. P o d e -se fa z e r c o m o ilu strad o a seguir.
H Offi ce [ 3 0 1 S T 4 U U I« I iL 'ie la lo l 1j U ld U lQ l u l
ы
sa \t -SPSS
Ш] o n e v a r c h is q u u re D a lo E d ito r Í
M*.l
Fi le Edit Viev- | ? Щ | Transform AnaJyre ¡¿raphs Utilities ^Vindow {Help
в?[а|а|аз| Dglme D ates

Insert Уап аЫ е
-I rj.l.inl \\Ъ \
1 chocolel [nsert C a se
G o to C a se
ChOi
Sfirt C a se s
T ransp o se
Merge Files
Aggregate
Orthogonal Design
Spirt Eile
Select C o s e s
[ f\ D a ta V ie w ( V a r ia b le V i e w / j j J ______________________ | jJ '
Weight C a s e s S P S S P to cesso r is ready
¿ 8 S ta rt [ \jy Microsoft Word - c | ^ Explonng - C \stet ||üi)| n n e v n r r h is q u a r. fijü u tp u tl - S P S S Vi | 0 14 49

E sse p ro c e d im e n to ab re a caix a de d iá lo g o s Weight Cases (P o n d e ra r C aso s), a seguir.
-|g|x|
F iIp E d il V ie w Q nin Transform £nnty,-ß Q raphs U iiIiUp -1. W indow H elp
tflHialsal i ifaifei M i-rli-icl-i-irj

1 ■W e ig h t C a s e s □ Verifique se
_ •S cho culai
r D o not weight c a s e s OK 1 m arcou a caixa
- f* h e ig h t c a s e s b y B a s le 1 Weight cases by
- (-------- , fr e q u e n c y V e n a b le
B e set
(Ponderar casos
< I f * lH I
_ Cancel
por). Mova a
H elp J
variável
- Current Status W eight c a s e s b y treq
-
freqüências para
a caixa Frequency
Variable (Variável
Freqüência)
Z E O \ D a t a V ie w ( V a r i a b l e V i e w / I jl L
S P S S P r o c e sso r is read y
„(0 S t u r i j LlV ‘‘ " • I • . ' ' , — ii n e v u r r h iN H u o r J < «»r. ■■ | ” ' O ' : '
M ova fre q (fre q ü ê n c ia s ) da c a ix a e sq u e rd a p a ra a c a ix a Frequency Variable (V ariável

F re q ü ê n c ia ) c lic a n d o no b o tão ►. C liq u e em OK. A g o ra c liq u e em A nalyze (A n a lisa r), Non-
param etric tests (T estes n â o -p a ra m é tric o s) e Chi-Square (Q u i-q u a d ra d o ), c o m o a seguir.
U U Ie l l|J ls | a |o | v .U U b 0 l0 |u |
FTTg o n e v a rch is q u a re .s a v - S P S S D a ta Ed itor j
F ie £ d il V iew D a ta Transform G ra p h s ytililies W indow H elp
R e c o ils ►
=1& J J *
D gscnptrve Statistics »
Custom I a b l e s *
Co m p are W e ans *
freq
G e n eral L in ea; M odel *
1
1 1
1 1 H
00 20 Correlate ►
2 00 60 B e g re ss io n »
3 00 10 Lfig linear »
4 00 20 C la ssify ►
_ 1
Q a ta R eduction ►
S cg Je ►
Nonparam etric T e s t s M Chi-Sq uare
T im e S e n e s ► Binom ial
Survival » Buns
Multiple R e s p o n s e * 1-S am p le K-S.
M issing y a lu e A n aly sis 2 Independent S a m p le s
& Independent S a m p le s
2 R e late d S a m p le s
K R e la te d S a m p le s
I I\ D a ta Vi e w ( V a r i a b l e V i e w / | <I
Chi-Sq uare S P S S P ro c e sso r is re a d y
■itC S to rt [ ¿ y M icrosoft W ord - c | Exploring - C.\stof |[|^}| o n e v a r c h is q u a r ... ¡Outpull -SPSSVi... I i J s E O H:56
Será ab erta a c a ix a de d iá lo g o s Chi-Square (Q u i-q u a d ra d o ), c o m o na figura.
'|ss U I4 I aiU I B 1 lU lflla lo k Ы - л Ы Ш в Ы
Eile E d il V iew Q ata Transform A n aly ze Q rap h s ütihües Vtfndow tJelp
tfiaia|8ül I |ь|с?|м|-гНП-1-1П »|<ai

1 choco lat 1
• Chi-Squ ore T e s i
El
Ie s » V a riab le U si
♦г
Help
E x p e cted R a n g e E x p e cted V a lu e s
(• Q ei from d a le f* All catego ries equal
С U s e sp ecified fange C V a lu e s
Eâct
Üphons
[ |\ D a t a V ie w ( V a r i a b l e V i e w /
S P S S P ro c e sso r is rea d y
¿ f i S ta rt! Microsoft Word - c I _ jQ Exploring - Costed J | ^ ] o n e v a r c h is q u a r ... f s j Output! - S P S S Vi | 14 5 '
(T iq u e em O ptions (O p ç õ e s) se d e se ja r e en tã o em OK. O s re su lta d o s d ev erão a p a re c e r

na ja n e la de saída.
8 . 2.2 Saída para o %2 de uma variável
Para o x de u m a v ariá v el, é im p o rta n te re g istra r o valo r da e sta tístic a teste, os g rau s de
liberdade e a p ro b a b ilid a d e a sso cia d a . N o e n tan to , a p rim e ira se ção d a saíd a do x co n firm a
n o sso s c á lc u lo s n a S e ç ão 8.2.1.
CHOCOIAT (CHOCOLATE)
Observed N (N Observado) Expected N (N Esperado) Residual (Residuos)
Ì 20 27.5 -7 .5
2 60 27.5 32.5
3 10 27.5 -1 7 .5
4 20 27.5 -7 .5
Total 110
A seg u n d a se ç ã o d a sa íd a fo rn ec e as e sta tístic a s d o teste:
Test Statistics (Estatísticas do Teste)
CHOCOLAT (CHOCOLATE) p <0,0001 significa que, supondo que a

hipótese nula seja verdadeira, nosso valor
Chl-Square (Quí-Quadrado) 53 .6 36a do x 2 tem uma chance em 10.000 de ter
ocorrido por acaso: em outras palavras,
df (gl) 3
isso é bastante improvável!
Asymp. Sig.2
.0000 '
(Signifícância Assintótíca)
a. 0 cells (.0% ) have expected frequencies less than 5.

(a. 0 células [0,0%] têm freqüências esperadas menores que 5.)
The minimum expected cell frequency is 27,5.
(A freqüência esperada minima da célula é 27,5.)
O s re su lta d o s p o d em se r re la tad o s d a seg u in te fo rm a:
O valor do x de 53.6 com grau de liberdade de 3 foi encontrado, e a probabilidade associada é

0 ,0 0 0 1. Isso significa que, se a hipótese nula é verdadeira, tal valor raramente vai ocorrer (cerca de
um a vez em 10 mil). Dessa forma, nós podemos aceitar que existe uma diferença significativa entre
as freqüências observadas e as esperadas e concluir que as marcas de chocolate não apresentam o
mesmo grau de preferência. A tabela a seguir mostra que mais pessoas preferem o chocolate B (60)
a qualquer outra marca.
Freqüências Chocolate A Chocolate B Chocolate C Chocolate D
Observadas 20 60 10 20
Esperadas 27.5 27.5 27.5 27.5
E m b o ra n o ssa s c o n c lu sõ e s sejam q u e as p esso as p re fe re m alg u m as m arca s a o u tra s (nem

to d as as m a rc as são ig u a lm e n te p o p u la re s), p o d e m o s a firm a r m ais d o q u e isso: p e la ta b e la se
vêem q u ais são as m a rc a s p re fe rid a s - ou seja, p o d em o s in d ic a r a d ire ç ã o da d ife re n ça , isto e,
q ue o c h o c o la te B é a m arca p red ileta.
Atividade 8.3
O te ste d e aderência é co nhecido tam b é m com o:
(a) x 2 r x c
(b) x 2 d e um a variável
(c) x 2 2 x 2
(d) N enhum a das alternativas acim a
O SPSS fornece agora dois tipos de (estes de signifícância para tabelas cruzadas e dois testes não-param étricos. A signifícância as-
sintóiica se fundam enta em grandes am ostras. U tiliza-se signifícância exata quando o conjunto de dados e' pequeno, desbalanceado
ou não atende à suposição de norm alidade.
8.2.3 Comparação de freqüências observadas com qualquer conjunto de

freqüências esperadas
A lg u m a s v e z e s q u e re m o s c o m p a ra r as fre q ü ê n c ia s o b se rv a d a s co m um c o n ju n to p a rti
c u la r de fre q ü ê n c ia s e sp e ra d a s. P o r e x e m p lo , os p e s q u is a d o re s d e s c o b rira m q u e a s p e sso a s
c a n h o ta s têm m a io r p re d is p o s iç ã o d e a p re s e n ta r a d o e n ç a d a in fla m a ç ã o in te s tin a l (D II).
A p re v a lê n c ia d o s c a n h o to s é m a is a lta d o q u e se ria a e s p e ra d a e m u m a a m o s tra . V am o s
su p o r q u e 150 p e ss o a s c o m e ss e tip o d e d o e n ç a fo ra m te s ta d a s. E n c o n tra ra m -s e os s e g u in
tes d a d o s:
Canhotos Destros
Observadas 120 30
Esperadas sob a hipótese nula 75 75
S e v o cê s im p le sm e n te d iv id ir 150 p o r 2 p a ra e n c o n tra r as fre q ü ê n c ia ? e sp e ra d a s so b a

h ip ó tese n u la , deve a c h a r o v a lo r 75. T o rn a -se a p a re n te q u e não e sp e ra m o s a e x is tê n c ia do
m esm o n ú m e ro d e p e ss o a s d e stra s e c a n h o ta s na p o p u la ç ã o , p o rq u e sa b e m o s q u e e x iste m
m u ito m e n o s c a n h o to s d o q u e d e stro s. A s fre q ü ê n c ia s e sp e ra d a s re a is são as q u e c o n h e c e
m o s p o r p e sq u isa s a n te rio re s. H á a in d a u m a d ife re n ç a e n tre se x o s p a ra a te n d ê n c ia d e ser
c a n h o to . A p re v a lê n c ia de c a n h o to s é b em m a io r e n tre o s h o m e n s d o q u e e n tre as m u lh eres.
Isso sig n ific a q u e h o m e n s e m u lh e re s n ão p o d e m s e r in c lu íd o s ju n to s em u m ú n ic o gru p o .
A p ro x im a d a m e n te 10% d as m u lh eres são c an h o ta s.
D ecid im o s v erific ar a e x istê n c ia d e u m a m a io r p re v a lên c ia d e c a n h o ta s e n tre as m u lh eres
com a sín d ro m e d o in te stin o irritáv el (S il) d o q u e e n tre as q u e a p re se n ta m DTI. U m q u e s
tio n á rio foi re sp o n d id o p o r 317 m u lh eres. V erifico u -se q u e 2 6 8 era m d e stra s e 4 9 can h o tas.
C o m o esp e ra m o s que 90 % das m u lh e re s se jam d e stra s, e sp e ram o s qu e 285.3 d as p e rte n c e n
tes a am o stra esteja m n esta situ a ç ã o (9 0 % de 317 = 2 8 5 ,3 ). Isso sig n ific a q u e v a m o s e sp erar
q u e 3 1.7 sejam c an h o ta s (3 1 7 = 2 8 5 ,3 = 3 1 7 )
Canhotas Destras
n n
Observadas 268 49
Esperadas 285,3 3 1,7
R ealm en te a p en as 268 eram d estra s isso re p re se n ta 84,5% d o to tal 3 1 7. A s 4 9 can h o ta s

re p resen tam 15,5% d o to tal, e m vez d o s 10% esp e rad o s.
’| |] SPSSPW: %2 de uma variável, utilizando freqüências diferentes

> das esperadas sob a hipótese nula
A bra o arq u iv o d e d ad o s, se le c io n e D ata (D a d o s) e Weight Cases (P o n d e re C aso s):
f n w n c lr i.u ii SPSS Dalo tdilur

Trirrfof» AíJN.-» 4Kt'.
[JJJ
, cy r* :*♦»
' Y«Ut* r « : r- C t l F . * 4>
! r*<*> 1 i i i i i i ■ i i i -
t-ilCmwv 1 00 X 6 00
1 00 49 00
' »
- . . *
.„ c
Mnt Cm«
•I • |\Uü<d View X
Ow.
<
■ • /
..tKZSsSÈ H_____ o_ asa
S e rá a b erta abre a ca ix a de d iá lo g o s Weight Cases (P o n d ere C aso s).

M arq u e a o p çã o Weight cases by (P o n d e re c a so s p o r) e m o v a a v ariáv el frequency (fre

q ü ên cia ) d a e sq u e rd a p a ra a d ireita. Isso o lev ará d e v o lta ao a rq u iv o de d a d o s o rig in al.
S e le c io n e Analyze (A n a lisa r). Non-paramelric tests (T estes n ã o -p a ra m é tric o s ) e Chi-
Zquare (Q u i-q u ad rad o ):
jM J
■| • |\üa»aVwvt ^ t ->«w/
¿ÉÊ2- * h jjj_ «U M
S erá a b erta a ca ix a de d iá lo g o s Chi-SquareTest (T este Q u i-q u a d ra d o ).
w — « aa
A variável !3Krtf
teste hand
(m ão) é
m ovida para
esta posição
■ I » [\P ala V»w /, 1 • it • . tr, ]
ÉfiÊELÍ-®
C e rtifiq u e -se de q u e a v ariáv el c o rre ta (n e ste c a so hand - m ão ) é m o v im e n ta d a d a e s

q u e rd a p a ra o c a m p o Test Variable List (L ista de V ariáv eis d o T este). E m Expected Values
(V alores E sp e ra d o s), v o cê p o d e e sc o lh e r AU categories equal (T odas as cate g o ria s ig u ais - é o
pad rão ) ou Values (V alores - sig n ific a q u e os v alo res e sp e ra d o s serão fo rn ec id o s). N e ste caso,
d ig ite as fre q ü ê n c ia s e sp e ra d a s d a p rim e ira c a te g o ria (m ão d ireita ou d e stro s), q u e é 2 8 5 ,3 .
E n tão , c liq u e em Add (A d ic io n a r):
i H á ", ■ t i» H f r‘- □ n -y Q>

3
D ig ite a fre q ü ê n c ia e sp e ra d a d a se g u n d a c a te g o ria (c a n h o to s), q u e é 3 1 ,7 , e c liq u e em

Add (A d icio n ar):
HS&QQESSSOEZHHIHHiHHHIHHHHHHHflHflflBHMHHHHHHBEI
í H i 3) •- k r? M . *T r**i EZ3;itin; *
F in alm en te, c liq u e em OK.
to ~ noa
Cãf a <9 Bi • i= & « -T r'_ C n , 3>
J ______ I I______ L i i
I*íiV*ubi* UM Cl. i
-------------------
«•■und
dl £ * '"
C<rc<> 1
í■C+Xrj f» fll
• 5«Hica4»r» ' Al M ií
_H *J
I------
i ______ '
fa * í :
-----------*’ fot***
—
• 1 ' NPaUView X -J-JO t "t- /

SPSSP*tA*»wr *-*Wr
s fa f a f Q u it e i. » ' » ^ iOwfc. k ><r«id ,|V y ; - 3 > W iPo w n
E sse p ro c e d im e n to d is p o n ib iliz a rá a se g u in te saída:
HAND (MÃO)
Observed N Expected N Residual

(N observado) (N esperado) (Resíduos)
right (direita) 268 285.3 -1 7 .3
left (esquerda) 49 31.7 17.3
Total 317
HAND (MÄO)
Chi-Square (Qui-Quadrado*) 10.490

df (grau de liberdade) 1
Asymp. Sig. .001
(Significancia Assintótica)
a. 0 cells (.0% ) have expected frequencies less than 5.

(a. 0 células [0,0%] apresentam valores esperados menores do que 5.)
The minimum expected cell frequency is 3 1 .7.
(A frequência mínima esperada de uma célula é de 31.7.)
Isso m o stra qu e e x iste u m a d ife re n ç a sig n ific a tiv a e n tre as fre q ü ê n c ia s o b se rv a d a s e a

e sp erad as.
8.3 Teste %2 para independência: 2 x 2
O x ' perm ite que se descubra se existe u m relacio n am en to ou associação entre duas variáveis
categ óricas (p. ex., a asso ciação entre fum ar [fu m an te/n ão -fu m an te] e o h áb ito de b eber [bebe
d o r/ab stêm io ]). E sses são dad o s c a te g ó rico s p o rq u e não estam o s p erg u n ta n d o so b re q u an to s
cigarros as pessoas fum am ou quanta b ebida alcoólica consom em . E stam o s apenas pergu n tan d o
se elas fum am ou bebem . Tal d elin eam en to será sem elh an te ao da T abela 8.4.
E sse tip o d e tabela de contingência é d e n o m in a d a 2 x 2 p o rq u e ex iste m d u as lin h a s e
d u as co lu n as.
Tabela 8.4 Tabela de contingência 2 x 2
Bebe Não bebe
Fuma
Não fuma
Psi l EXEMPLO: ASSOCIAÇÃO ENTRE FUMAR E BEBER

* /
____
E x iste um re la c io n a m e n to e n tre o h áb ito de fu m a r e o de b e b e r e n tre os e stu d a n te s? Se
n ão ex iste u m a a sso c ia ç ã o sig n ificativ a, c o n c lu ire m o s q u e as v a riáv eis são in d e p e n d e n te s
(é po ssív el p e rg u n ta r a c a d a e stu d a n te q u a n to s cig arro s fu m am p o r sem a n a e q u a n ta s u n i
d ad es de álco o l b eb em n este m esm o p e río d o . N e sse c aso , p o d e m o s u tiliz a r o r de P e a rso n ,
p o is tere m o s d ad o s co n tín u o s). Você sim p le sm e n te fo rm u la as se g u in te s q u estõ es:
A ) Q u a n to s de v o cês fu m am e b eb em ?
B ) Q u a n to s fu m am , m as não b e b em ?
C ) Q u a n to s não fu m a m , m as b eb em ?
D ) Q u a n to s não fu m a m nem b eb em ?
Você não terá d a d o s in te rv a lares ou o rd in ais. O b te rá fre q ü ê n c ia s, ou seja. o n ú m e ro de

estu d a n te s em c a d a g ru p o . A g o ra p o d e m o s m ed ir a a sso cia çã o , p o is tem o s d ad o s c a te g ó ri
c o s, fre q ü ê n c ia s. E sta m o s c o n sid e ra n d o fu m a r e b e b e r d ad o s c a te g ó ric o s, não v e rific a m o s
q u a n to s c ig a rro s fu m a m ou q u a n to d e álco o l c o n so m e m . S im p le sm e n te p e rg u n ta m o s em
q u al das q u a tro c a te g o ria is se en q u a d ram .
Você p o d e re p re se n ta r e sses re su lta d o s em u m a ta b ela 2 x 2 . Im ag in e que te n h a feito
tais p erg u n ta s a 1 10 e stu d a n te s. C ad a e stu d a n te esta rá em a p en a s um g ru p o . T em o s q u atro
g ru p o s. P o d em o s c o n ta r o n ú m ero de e stu d a n te s d e c a d a g ru p o e m o n ta r u m a ta b e la (T a
bela 8.5). C a d a “ c a ix a " e' d en o m in a d a u m a célula. C o d ific a m o s os g ru p o s em : (1) aq u eles
q u e b eb e m , (2 ) a q u e le s q u e n ã o b eb em ; (1) a q u e le s q u e fu m a m , (2 ) a q u e le s q u e n ão fu
m am . P o d e m o s, e n tre ta n to , fac ilm en te u tiliz a r q u a lq u e r o u tra c o d ific a ç ão ; n ão p re c isa m o s
u tilizar o 1 e o 2 co m o có d ig o s. À s v ezes os p sicó lo g o s u tiliz am 0 e 1.
T abela 8.5 Tabela de contingência 2 x 2 codificada com rótulos
Fuma (código 1) Não fuma (código 2)
Bebe (código 1) 50 (A) 1 5 (0

Não bebe (código 2) 20 (B) 25 (D)
O p tam o s p o r id e n tific a r as célu las c o m letras. A c é lu la A é a dos que fu m a m e b eb em ;

a célu la D . a do s q u e n ão b eb em n em fu m am . A ssim :
G ru p o 1: 5 0 (célu la A)
G ru p o 2: 2 0 (célu la B)
G ru p o 3: 15 (c é lu la C)
G ru p o 4: 25 (célu la D)
O s d ad o s p o d e m se r e sc rito s co rn o na T ab ela 8.6.
T abela 8.6 Dados tabelados com códigos
Fuma Bebe Freqüências
1 i 50
1 2 20
2 1 15
2 2 25
A ssim , na c a te g o ria 1 (dos que fu m am ) co m a c a te g o ria 1 (d o s q u e b eb e m ), e x is te m 50

e stu d an tes. Isso é re p re se n ta d o cm u m a ta b ela d e c o n tin g ê n c ia 2 x 2 , c o m o a c é lu la A.
O b serv e q u e n e n h u m p artic ip a n te p o d e e sta r e m m ais de u m a cclu la. isso é im portan
te. A s c a te g o ria s são m u tu a m e n te e x clu siv as.
Atividade 8.4
D ecida se as se g u in te s situ a ç õ e s são m ais a d e q u a d a s para o uso d o %2 ou do r de Pearson.

C o n sid e re o re la c io n a m e n to en tre:
(a) A ltu ra (cm ) e peso (kg)

(b) D istân cia p e rco rrid a (m etro s) e te m p o gasto (m in u to s e se g u n d o s)
(c) Form a física de um a pessoa e sua o c u p a ç ã o (p ro fissio n a l, a d m in is tra tiv a , m a n u a l)
(d) T a m a n h o do d e dos das m ão s e ta m a n h o d o s d e d o s dos pés (cm )
(e) U so d a m ão (d e stro /ca n h o to ) e h a b ilid a d e esp acial (e x ce le n te , m é d ia , fra ca )
8.3.1 Fundamentação do qui-quadrado 2 x 2

O te ste c a lc u la as fre q ü ê n c ia s e sp era d a s n as célu las. E m o u tras p alav ras, em u m a am o stra
de 1 10 e stu d a n te s, c a lc u la -se q u a n to s se e sp e ra e n c o n tra r em c a d a célu la, c aso . de fato , não
e x ista re la c io n a m e n to e n tre fu m a r e b e b e r (a h ip ó tese n u la é v e rd ad e ira).
A s fre q ü ê n c ia s e sp e ra d a s p a ra c a d a c é lu la são c a lc u la d a s de u m a fo rm a se m e lh a n te ao x '
de u m a v ariá v e l, e m b o ra , p o r te rm o s um n ú m e ro d ife re n te de p esso a s q u e fu m a m e b eb em , as
freq ü ên c ia s e sp e ra d a s nas c é lu las sejam d ife re n te s.
O v a lo r d o X re su lta n te é c o m p a ra d o co m o v alo r e sp e ra d o se a h ip ó te se n u la fo sse v er
d a d e ira (se n ã o e x istisse a ss o c ia ç ã o e n tre a s d u as v ariáv eis). O p a c o te c o m p u ta c io n a l c a lc u la
o v a lo r - é o sig n ific a d o d o v alo r d a p ro b a b ilid a d e - q u e é a p ro b a b ilid a d e d o v a lo r d o x~ Que
você obtev e te r su rg id o , a ssu m in d o q u e a h ip ó te se n u la seja v e rd ad eira.
A s fre q ü ê n c ia s lista d a s n ão são re a lista s. H á m a is c h a n c e de se o b te r os v a lo re s d a T a
bela 8.7.
O p ro b le m a é que o yj tem u m a re striçã o : você não p ode ter m en o s d o q u e 2 5 % d as c é
lu las (n esse c aso , 2 5 % de 4 = 1) co m fre q ü ê n c ia s esperadas m en o res d o q u e 5. N ão p o d e m o s
afirm ar, a p e n a s o lh an d o p a ra a tab ela, se esta h ip ó te se é o u não satisfe ita . O S P S S P W a lertará
p ara esse p ro b le m a e p ro sse g u irá , c a lc u la n d o o teste da p ro b a b ilid a d e e x a ta de F ish e r (ain d a
b em , p o is os c á lc u lo s são tra b a lh o so s). O te ste de F ish er, e n tre ta n to , só é ad e q u a d o p a ra ta
b elas 2 x 2 .
E sse teste p o d e se r u tiliz a d o , em v ez d o y , q u a n d o a h ip ó te se fo r v io lad a, p o rq u e a sua
fó rm u la n ão é sen sív el a p eq u e n a s fre q ü ê n c ia s esp era d a s.
T ab e la 8.7 Tabela de contingência 2 x 2

Fuma Não fuma
Atividade 8.5
Se você quer testar a hipótese de que os estudantes preferem o chocolate Galaxy em vez
do Mars, Milky Way ou Star, que tipo de análise seria mais apropriada?
(a) Teste de independência %2 2 x 2
(b) Teste de independência %2 2 x 4
(c) x2 de uma variável
□ SPSSPW: X2 2 X 2
P o n d ere os caso s se g u in d o as m esm a s in stru ç õ e s d ad as para o % de u m a variáv el. E n tão

esco lh a: A nalyze (A n alisar), D escriptive Statistics (E sta tístic a D esc ritiv a ) e Crosstabs (T abu
lação cru zad a):
F I Office C 2 0 E iL IS la lo k -lj|.-d iy u i0 |u l
HE] twobytwuchisquorn s i tv - S P S S D a ta Editor - If il X I
File Edit V ie w Q ata Transform Q ra p h s Utilities W indow H elp
R epo rts > 1

inalai щ\ F re q u en c ie s
Custom T a b le s ► Q escrip tives
dnnk C o m p ere M ea n s
G en eral L inear M odel
►
►
Explore
Q rosstab s
I 00
C orrelate >
1 00 E e g r e s s io n ►
2 00 Laglm ear ►
2 00 C la ssily ►
Q a ta R eduction ►
S c a le *
Nonparam etnc T e s t s »
T im e S e n e s »
S urvival *
Multiple R e s p o n s e ►
M issing V a lu e A n aly sis
[ |\ D a t a V ie w { V a r i a b l e V i e w / j < I
C ro ssto b s S P S S P ro c e sso r is rea d y
S ta r t I Ц У M icio^ùB Word - с | Exploring - С у-п.м J|[--| tw o b y t w u c h is q ... f u l Output! - S P S S Vi | 1501
S erá ab e rta a seg u in te c a ix a de d iálo g o s.
-Jlalalnk-UUNiiilaliul |
ЕЗв £dit V ie w Q a la Ira n sfo rm A n a lyze G ra p h s Utilities ^¿indow tJelp
M o v a clrink (b e b e r) p a ra a c a ix a d e n o m in a d a row (lin h a ) e sm oke p a ra a d e n o m in a d a

colum ns (c o lu n a s). C liq u e e m S ta tistics (E s ta tís tic a s ). A p a re c e rá a se g u in te c a ix a d e d iá
lo g o s.
liffla l^ jfe U U lB l i| .j| a l a | o | .-M.^1 jdlialBU-il
E lle £drt ^ le w Eí®t® Iran sto rm A n atyre jjr a p h s Utilities \£¿'mdow Help
b»|BW I 531 1 | M&l Ml »rlr’-l C lo ln i r»

№
C ro s slo b s Statistics
El
W C hi-sq uaie r Correlations
Nominal Ordinal
r CQnirngency coefficient r fia m m a

H elp
17 Phi a nd C rom ér's V r S o m ers* d
M arque a
T J.am bde l~ K endall's tau-b
estatística
r U ncertainly coelticieni r Ken dall's tau-ç
desejada
Nominal b y Interval £0ppa
P £ ia f~ R isk
r ycN em a;
r F Co chrjjn's and M antel-H aenszel statistics
r F~
« 1» 1\ Data Vi Ejjact Statistics C e lls
H B S ta iti Iff W o id - C I E -p lo n n q - C '■; r~ ||[T t']tw fih y tw o ch isq . . Oulpull - S F~ S S V i | \m J O 15 05
V ocê p o d e e s c o lh e r a e s ta tís tic a d e s e ja d a m a rc a n d o C hi-Square (Q u i-q u a d ra d o ) e

C ra m er’s V (V de C ram er, na o p ç ão Phi and C ram er's V).
C liq u e em C ontinue (C o n tin u a r). V ocê re to rn a rá à c a ix a de d iá lo g o an terio r. S e q u e r
m o s tra r o s co n te ú d o s d as cé lu la s, c liq u e em Cells (C é lu las). A p a re c e rá o seg u in te.
Iarla|-iite>|jj|2fl|g| lL-;|g|aloM-jUlij|:JlelU
- |g |* l
ñ le £dit V iew Q ota Transform A n aly ze g ra p h s Utilities W indow Help
|g |H |a lE}| I I 0?I M| -Tiri d - l l n l *I<3>1
Aparecerão
as frequências
observadas
e esperadas
~| [\ D a t a Vi
¡¡fi S ta r t I fly M icxosottWo. | Exploring - C [[¡rn-jtwobytwot: ttfl Output! - S P |

C liq u e nas o p ç õ e s q u e d ese ja . Você p o d e e sc o lh e r u m a ta b ela c o m as fre q ü ê n c ia s o b se r

v ad as e e sp e ra d a s, ou co m os p e rc e n tu a is p o r lin h as e c o lu n a s ou to tal. C liq u e e m Continue
(C o n tin u a r). D e v o lta à c a ix a de d iá lo g o s Crosstabs (T ab u la ção c ru z a d a ), c liq u e e m OK. A
sa íd a d e v e rá a p a re c e r na jan ela d e re su lta d o s. A s fre q ü ê n c ia s o b se rv a d a s e e sp e ra d a s são
ap re se n ta d a s a seguir.
DRINK X SMOKE Crosstabulation (Tabulação Cruzada de BEBER x FUMAR)
SMOKE (FUMAR)
smoke don't smoke

Total
(fumam) (não fumam)
DRINK drink Count (Observado) 60 34 94
(BEBER) (bebem)
Expected Count (Esperado) 61.1 32.9 94.0
don't drink Count (Observado) 5 1 6

(não bebem)
Total Count (Observado) 65 35 100
Isso in d ica q u e n ão re sp e ita m o s u m a d as c o n d iç õ e s d o q u i-q u a d ra d o - a d e q u e não se

dev e ter m ais d o q u e 25 % d a s c é lu la s co m fre q ü ê n c ia s e sp e ra d a s m e n o re s d o q u e 5. T em os
d u as c é lu la s n e sta situ a ç ã o . N esse c a so , p ro v a v elm e n te p re c isa m o s a u m e n ta r o ta m a n h o da
am o stra. Você d e v e rá in c lu ir m ais p a rtic ip a n te s n o e stu d o para c o n to rn a r o p ro b lem a.
8.3.2 Saída para o qui-quadrado 2 x 2
A saíd a d o X fo rn e c e rá in fo rm a ç õ e s su p e rio re s as su a s n e c e ssid a d e s; a ssim , c o m o no<

testes a n te rio re s, v o cê a p re n d e rá a s e le c io n a r o q u e é im p o rta n te . A p rim e ira p arte d a saída
re p ro d u z a ta b e la 2 x 2. D ê u m a rá p id a o lh ad a n ela p a ra v erific a r se e stá c o rreta.
Estatística yj'
O S P S S P W a p re se n ta v árias lin h a s de esta tístic a s. E n tre ta n to , você p re c isa d a p rim eira
d elas. E d e n o m in a d a de Pecirson, e você p re c isa re g istra r o v alo r do o n ú m ero de g ra u s de
lib erd ad e e o nível d e p ro b a b ilid a d e asso ciad o .
1/ de Cramer
É u m a m ed id a d o e fe ito u tiliz a d o p ara testes de asso c iaç ã o . É u m c o e fic ie n te d e c o rre la

ção , in te rp re ta d o d a m e sm a fo rm a q u e o r d e P earso n .
E sta sa íd a u tiliza os se g u in te s dad o s:
■ 50 p e sso a s q u e fu m a m e b eb em
■ 15 qu e b e b e m , m as não fu m am
■ 20 p esso as q u e fu m a m , m as não b eb em
■ 25 p esso as q u e n ão fu m am nem b e b e m
A p rim e ira se ç ã o d a saíd a c o n firm a as c a te g o ria s e as fre q ü ê n c ias.
TABULAÇÃO CRUZADA: FUMAR X BEBER
Count (Contagem)
do you smoke?
(você fuma?) Total
yes (sim) no (não)

do you drink?
yes (sim) 50 15 65
(você bebe?)
no (não) 20 25 45
Total 70 40 110
A p ró x im a seçao da sa íd a fo rn e c e as e sta tístic a s do teste.
/ X2 = 12,12
Chi-Square Tests (Testes Qui-Quadrado)
Asymp. Sig. Exact Sig. Exact Sig.

(2-sided) (2-sided) (1-sided)
Value (Significancia (Significancia (Significancia
(Valor)^ (gl) Assíntótica Bilateral) Exata Bilateral) Exata Unilateral)
Pearso n C h i-Sq u are

1 2 .1 2 1 5 1 .0 0 0
(Qui-quadrado de Pearson)
Continuity Correction3
10.759 1 .001
(Correção de Continuidade3)
Likelihood Ration -
12.153 .000
(Razão de Verossimilhança)
Fisher's Exact Test

.001 .001
(Teste Exato de Fisher)
Linear-by-Linear Association
12.011 1 .001
(Associação Linear por Linear)
N of Valid Cases
110
(N dos Casos Válidos)
a. Computed only for 2 x 2 table. (Calculado somente para tabelas 2 x 2 .)

b. 0 cells (.0% ) have expected count less than 5. The minimum expected count is 16.36.
(0 células [0,0%] apresentam valores esperados menores do que 5. O valor mínimo esperado é 16,36.)
A lin h a em n e g rito é a q u e nos in teressa. V ocê p re c isa le r a lin h a do Q ui-quadrado d r Pe

arson, a q u e e stá em d esta q u e . O valor d o % é 12.12; o g ra u de lib erd ad e (gl) é 1, e o v alo r p
< 0,0 0 1 . P o rtan to , a p ro b a b ilid a d e d e se o b te r tal v alo r é tão re m o ta q u a n to 1 em 1000. D essa
form a, p o d e -se c o n c lu ir q u e e x iste u m a a sso c ia ç ã o e n tre fu m a r e b e b er e n tre os estu d a n te s.
A saíd a ta m b é m fo m e c e o V de C ra m er: m o stra um tam a n h o d o e fe ito d e 0 ,3 3 . S e e le
v arm o s esse re su lta d o ao q u a d ra d o , o b te re m o s 0 ,1 0 8 9 . A ssim , a p ro x im a d a m e n te 11% da
v ariação na co n ta g e m d as fre q ü ê n c ia s dos q u e fu m a m p o d e ser e x p lic a d a p elo s q u e beb em .
Symmetric Measures (Medidas Simétricas)

Asymp. Std. Error1 Approx. Tb Approx. Sig
Value (Sig. Assintótica (Sig. Exata (Sig.
(Valor) Bilateral) Bilateral) Aproximada)
Nominal by Nomina!
Phi .332 .000
(Nomina! versus Nomina!)
C ram er's V
.332 .000
(V d e C ram er)
Interval by Interval Pearson's R

.332 .092 3.657 ,000c
(Intervalo versus Intervalo) (R de Pearson)
Ordinal by Ordinal Spearman Correlation
.332 .092 3.657 .ooo-
(Ordinal versus Ordinal) (Correlação de Spearman)
N of Valid Cases
110
(N dos casos Válidos)
a. Not assuming the nuil hypothesis. (Desconsiderando a hipótese nula.)
b. Using the asymptotic standard error assuming the nuil hypothesis. (Utilizando o erro padrão assintótico e considerando a hipótese nula
c. Based on normal approximation. (Com base na aproximação normal.)
N o re la tó rio as fre q ü ê n c ia s p o d e m ser a p re s e n ta d a s na fo rm a de u m a ta b e la de d u p L

en trad a (cru z a d a ) 2 x 2 e a in d a co m valo r do yj, g ra u s de lib e rd a d e e o v alo r p.
O re la tó rio p o d e ser o seg u in te:
L'ma análise com o % foi executada para descobrir se existe uma relação significativa entr;
os hábitos de fumar e beber entre estudantes universitarios. O valor do x foi de 12,12 com uir_
probabilidade associada (valor-p) de menos de 0,001 para um grau de Uberdade de 1, mostrand
que tal relacionamento é bastante improvável apenas como resultado do erro amostra! (ao acaso). O
V de Cramer obtído foi de 0,33 aproximadamente 11% das variações das freqüências dos fumante ■
podem ser explicados pelas variações das freqüências dos que bebem. Assim, é possível conclu -
que existe uma relação entre os hábitos de fum ar e beber.
Você violou as condições do x ?

C aso tenha v io lad o as co n d içõ es de %2, o teste d a p ro b ab ilid ad e ex ata de F ish er aparecer,
nos seus resu ltad o s, e a lin h a Celis with expectedfrequency < 5 (célu las com freq ü ên cias esp e
radas m enores do que 5) in fo rm ará a p e rcen tag em de freq ü ên cias esp e ra d a s m en o res d o que 5
N esse caso , em v ez d e re la ta r os valo res do p a rá g rafo m e n c io n a d o , d ev e re la ta r a p ro b a
b ilid ad e ex ata de F is h e r (p. ex., p ro b a b ilid a d e e x a ta de F is h e r = 0 ,6 6 ). O teste d e F ish e r n i
tem um valor c o m o o teste t o u o A p ró x im a saíd a m o stra o q u e se p o d e e sp e ra r se h o u \e ‘
m aís do qu e 2 5 % d as c é lu la s c o m fre q ü ê n c ia s e sp e ra d a s m e n o res d o q u e 5.
A p rim eira se ção d a saíd a a p rese n ta as categorias, e os v alo res d as freq ü ên cias.
TABULAÇÃO CRUZADA: FUMAR x BEBER
Count (Contagem)
do you smoke
(você fuma?) Total
yes (sim) no (não)

do you drink?
yes (sim) 60 34 94
(você bebe?)
no (não) 5 1 6
Total 65 35 100
CUIDADO!
V ocê n ã o p o d e d iz e r q u a n ta s p e ss o a s p e rte n c e rã o a c a d a c a te g o ria q u a n d o in ic ia o

estu d o . A ssim , p re cisa o b te r m ais p a rtic ip a n te s p a ra se a ss e g u ra r d e q u e terá o su fic ien te
em c a d a célu la.
O v a lo r d o y j é se m p re p o s itiv o (p o rq u e u m n ú m e ro ao q u a d ra d o é s e m p re p o s i
tiv o ).
E n q u an to o nú m ero de graus de lib erd ad e é ap ro x im a d a m e n te o n ú m ero de particip an tes
em m u itas an álises e sta tístic a s, isso n ão o co rre n o pois o g ra u de lib e rd a d e é calc u la d o
pelo n ú m e ro de lin h as m en o s 1 ( r - 1) m u ltip lic a d o p e lo n ú m e ro d e c o lu n a s m en o s 1 (c
- 1). N e sse caso , v o cê p o d e v erific a r q u e u m a ta b e la x~ 2 x 2 se m p re te rá u m gl= 1, p ois
( r - l) .( c - 1) = ( 2 - 1).(2- 1)= 1.
Atividade 8.6
O V de C ra m e r é:
(a) U m a m e d id a de d iferen ça
(b) U m c o e ficie n te d e co rre la ç ã o
(c) U m a e sta tístic a e q u iv a le n te ao te ste da p ro b a b ilid a d e exata d e Fisher
(d) U m c o e ficie n te de va ria çã o
8.4 Teste de independência %2: r x c
O que a co n tece se liouver m a is do que d o is n ív e is ? É p e rf e ita m e n te p o s s ív e l h a \ r -

m a is lin h a s e c o lu n a s . A in d a tra ta -s e d e d u a s v a riá v e is c a te g ó ric a s , m as d e s s a v ez c
m a is c a te g o ria s p a ra e s c o lh e rm o s . O y j p o d e m a n e ja r e s s a s itu a ç ã o fa c ilm e n te . Vam
su p o r q u e a in d a te m o s o e x e m p lo d a re la ç ã o e n tr e fu m a r e b e b e r, a g o ra c o m trê s n í ' :
de fu m a n te s: os q u e fu m a m m u ito , o s q u e fu m a m p o u c o e os q u e n ã o fu m a m . P o d e r
ter ta m b é m a q u e le s q u e b e b e m m u ito , os q u e b e b e m c o m m o d e ra ç ã o e os q u e n ã o b e b ;^
(v eja T a b e la 8.8 ).
E ssa é u m a ta b e la d e c o n tin g ê n c ia 3 x 3 , p o r ra z o e s ó b v ia s . O s c á lc u lo s são fez
e x a ta m e n te d a m e s m a fo rm a d e s c rita , p a ra as ta b e la s 2 x 2 , p o ré m o g ra u d e lib e rd a e :
d ife re n te .
Tabela 8.S Tabela de contingência 3 x 3
Fumam muito Fumam pouco Não fumam
Bebem muito
Bebem moderadamente
Não bebem
L em b re -se: g l = (r - 1 ) .( r - I )
A ssim : 2 x 2 = 4
T am b ém é p o ssív el te rm o s m ais de três níveis (p. ex., 6 x 4 ou 7 x 3), m as a in terp re ta çã o ,

n esses c a so s, to rn a -se p ro b le m á tic a . N ã o q u e re m o s a p e n a s d iz e r q u e e x iste u m “re la c io n a
m e n to sig n ific a tiv o e n tre as v a riá v e is A e B ” . Q u e re m o s ta m b é m se r c a p a z e s de d iz e r alg o
so b re a direção d e sse re la c io n a m e n to . P o r e x e m p lo , no e x e m p lo de fu m a r versus b eb er, o b
se rv am o s, p o r m e io d o e x a m e das c é lu la s, q u e o re la c io n a m e n to sig n ific a tiv o e n tre fu m a r e
b e b e r é positivo. Q u a n d o te m o s g ra n d e s ta b e la s d e c o n tin g ê n c ia , p o d e se r d ifíc il p e rc e b e r
to d o s os p o ssív e is re la c io n am e n to s.
A in d a, p a ra q u e a e sta tístic a teste se ja c o n fiá v e l, re le m b re :
■ N ão m ais do que 2 5 % d as célu las p o d em ter freq ü ê n c ia s esp e ra d a s m en o res do q u e 5.

■ N e n h u m a c é lu la p o d e ser ze ro (se isso o c o rre r e' n ec e ssá rio a g re g a r célu la s; n o e n
tan to , a lg u m as v ezes isso não será p o ssív el p o r n ã o p o ssu íre m v alo res su fic ie n te s em
co m u m ).
Você p ode e sta r se p e rg u n ta n d o o p o rq u ê d e ssas re striç õ e s. Isso o c o rre em ra z ã o de e sta r

m o s a ss u m in d o q u e as n o ssa s a m o stra s são p ro v e n ie n te s de p o p u la ç õ e s n o rm a is. S e o v alo r
e sp e ra d o d e u m a c é lu la é m u ito p e q u e n o , é p o u c o p ro v áv el q u e e ste ja m o s re tira n d o a m o stras
de p o p u la ç õ e s n o rm ais. A n o ssa e sta tístic a te ste n ão será co n fiá v e l a m e n o s q u e e ssas h ip ó
teses este ja m satisfeitas.
C ertifique-se de que cad a p articip an te tenha sido co n tad o em apenas u m a das células. L em
bre-se de que é n ecessário que os participantes em cad a célu la sejam in d ep en d en tes - obviam ente
isso não vai aco n te cer se fo re m os m esm os. A ssim , um m esm o p articip an te só p ode resp o n d er
u m a única vez. O total das freqüências nas células deve ser igual ao núm ero de p articipantes.
N ão e x is te n e n h u m a ra z ã o p e la q u a l o teste X n ã o p o ss a se r u tiliz a d o co m v a riá v e is
q u a n tita tiv a s - é ju s ta m e n te co m d a d o s q u a n tita tiv o s q u e o u tro s teste s, tais c o m o os p a ra m é
trico s, são m ais p o d e ro so s.
Atividade 8.7
V e rd a d e iro ou fa lso :
(a) x 2 p recisa d e um m esm o n ú m e ro d e p a rticip a n te s em to d a s as cé lu la s

(b) C ad a p a rtic ip a n te d e ve c o n trib u ir co m cad a célula
(c) V o cê d e ve te r m e n o s de 5 0 % d a s c é lu la s co m u m a fre q ü ê n cia e sp erad a m e n o r do q u e
5 p ara p o d er u tiliz a r o x'
(d) O m e sm o p a rtic ip a n te p o d e se r c o n ta d o em m ais d e u m a célu la
8.4.1 %2: teste uni ou bilateral?

E x iste um d eb a te en tre os e sta tístic o s so b re a u tiliz a ç ã o de testes u n ilate ra is ou bilaterais.
Você não vai e rra r se u tiliz a r u m te ste b ila te ra l p o rq u e , nesse caso , te rá u m a p ro b a b ilid a d e
m e n o r de d e c la ra r q u e um re su lta d o é significativo. A lg u m a s p esso a s d e fe n d e m q u e sem p re
dev em o s u tiliz a r h ip ó tese s b ila tera is q u a n d o u sa m o s o % ■O p ró p rio teste, e n tre ta n to , é u n ila
teral: o v a lo r do X será sem p re o m esm o se os v alo res forem sem e lh an tes a esses:
15 40 36 15
ou esses
36 22 22 40
com o esses
22 36 40 22
ou esses
40 15 15 36
A d istrib u iç ão a m o stra i d o y j é sem p re positiv a. Isso o co rre p o rq u e q u a lq u e r v alo r elevadc

ao q u ad rad o é p o sitiv o . Isso é o q u e q u e re m o s a firm a r q u a n d o d iz e m o s q u e o p rò p rio teste é
un ilateral: fo rn ece so m en te valo res p o sitiv o s - é im p o ssív el o b te r u m v alo r x negativo.
E n tre ta n to , a hipótese p o d e se r b ila te ra l (e x iste u m a a sso c ia ç ã o , m as v o cê não p revê a
su a d ireção ) ou , m ais p ro v áv el, u n ila te ra l (v o cê p rev ê a d ireç ã o d a asso c ia ç ã o , p. ex., fu m a re
c â n c e r estão re la c io n a d o s de u m a fo rm a positiv a, ou a m arca de c h o c o la te A é a p re fe rid a nc
X de u m a variável). N o e n ta n to , testes u n ila te ra is d ev e m ser fo rm u la d o s co m b ase em te o ria '
p rév ias - não p o rq u e v o cê a c h a q u e o c h o c o la te A é m e lh o r do q u e os o u tro s. A lg u n s acharn
q ue se u tiliz a rm o s u m te ste u n ila te ra l e o re la c io n a m e n to e n c o n tra d o fo r o c o n trá rio d o p re
v isto, en tã o tere m o s "n o s p e rd id o ” , m as, é c la ro , esse é o caso de q u a lq u e r p re v isã o unilateral
(v eja C a p ítu lo 4, p á g in a 160 p ara m ais d eta lh e s).
Se tiv erm o s u m a ra z ã o p a ra e sp e c ific a rm o s a d ire ç ã o d a a sso c iaç ã o , é v álid a a u tilizaçã
de um te ste de h ip ó te se s u n ila te ra l, m as v o cê deve d e c id ir antes d e e x e c u ta r a a n á lise ( d e \;
p e n sa r c u id a d o sa m e n te se a h ip ó te se é u n i ou b ilateral antes de o e stu d o se r feito ).
classe social e tranqüilizantes
B ish e c o la b o ra d o re s (1 9 9 6 ) q u e ria m sa b e r se a c lasse so cial e stá a sso c ia d a à fre q ü ê n c ia d o uso

de tra n q ü ili/.an tes. F oram c la s sific a d o s , q u a n to à c la s se so c ia l, u m g ru p o d e p esso a s q u e tentava
re d u z ir o uso de tra n q ü iliz a n te s e o u tro q u e não. O s re su lta d o s são ap re se n ta d o s n a T ab ela 8.9.
C o m o se d e p re e n d e a p a rtir d a T a b e la 8.9, u m g ra n d e p e rc e n tu a l d o g ru p o q u e n ã o esta v a
re d u z in d o a q u a n tid a d e de tra n q ü iliz a n te s e ra d a c la s s e tra b a lh a d o ra . U m a a n á lis e p e lo y j, no
e n ta n to , m o stra q u e a p ro b a b ilid a d e d e o b te rm o s u m %' d e 0 ,18. d a d o q u e a h ip ó te se n u la é v e rd a
d e ira (n ã o e x is te a ss o c ia ç ã o ), é m a io r do q u e se ria a c e itá v el. E e n tã o n ã o se a c e ita q u e e x is ta um
re la c io n a m e n to sig n ific a tiv o e n tre o u so d e tra n q ü iliz a n te s e a c la s se so c ial. B ish e c o la b o ra d o re s
n ão fo rn e c e ra m o v a lo r d a p ro b a b ilid a d e a ss o c ia d a p a ra o %2 de 0,18 e n c o n tra d o , m as v o c ê p ode
c a lc u lá -lo .
T ab e la 8.1> Resultados do estudo de Bish e colaboradores ( i {)90)
Redução Nâo-redurão
dos tranqüilizantes dos tranqüilizantes
Classe média 9 (5 3 % ) 5(38 % )

Classe trabalhadora 8 (4 7 % ) 8(62% )
X = 0 .1S (nao sismilicalivo)
A lg u m a s v ezes na lite ra tu ra e n c o n tra m o s p e sq u isa d o re s q u e u tiliz a m a c o rre ç ã o de

c o n tin u id a d e dc Y ates*. E sse é u m p e q u e n o a ju s ta m e n to na fó rm u la u tiliz a d a q u a n d o te
m o s p e q u e n a s fre q ü ê n c ia s e sp e ra d a s em u m a ta b e la 2 x 2. N o fin al d o s a n o s d e 1980,
os p sic ó lo g o s fo ra m ro tin e ira m e n te a v isa d o s p a ra u tiliz a r a c o rre ç ã o de Y ates. m as a g o ra
m u ito s ach a m q u e isso n ão é razo áv el ta m p o u c o n e c e ss á rio (v eja H o w e ll, 2 0 0 2 , p ara um
d eb a te so b re o a ssu n to ). V ocê p o d e rá n o ta r q u e, n a s saíd as d o S P S S P W (v eja p ág in a 2 8 7
8), ta m b é m é a p re se n ta d o o v a lo r d o x c o ra a c o rre ç ã o de c o n tin u id a d e . R e c o m e n d a m o s
q u e, de in ício , você n ão se p reo c u p e co m tal c o rre ç ão . N o te , e n tre ta n to , q u e a lg u n s artig o s
de p e rió d ic o s u tiliz am a c o rre ç ã o de c o n tin u id a d e d e Y ates.
Exemplo da literatura: representação familiar

em episódios de relacionamentos de pacientes bulímicos
B e n n in g h o v e n e c o la b o ra d o re s (2 0 0 3 ) e stu d a ra m as fo rm a s p e la q u a is p a c ie n te s q u e so fre m
de b u lim ia n e rv o s a d ife re m d e o u tro s p a c ie n te s em p s ic o te ra p ia e de p a rtic ip a n te s em c o n tro le
n ã o -c lín ic o em te rm o s d as fo rm a s de p e rc e b e re m o re la c io n a m e n to fa m ilia r a tu a l e p a ssa d o . É
im p o rta n te m o s tra r q u e tais g ru p o s n ã o d ife re m em v a riá v e is d e m o g rá fic a s - a ssim , q u a lq u e r d ife
re n ç a n as v ariáv eis d e in teresse (n esse c aso , a p e rc e p ç ã o d o re la c io n a m e n to ) n ão deve se r a trib u íd a
а, p o r ex e m p lo , id ad e ou status p ro fissio n a l. B e n n in g h o v e n e c o la b o ra d o re s se p re o c u p a ra m co m
a a s s o c ia ç ã o e n tre os d ife re n te s g ru p o s em te rm o s d e status p ro fiss io n a l. R e la ta ra m o re su lta d o
c o m o na T ab ela 8.10. É um y£ 3 x 4. O g ra u d e lib e rd a d e é (n - 1).(/? - 2 ) q u e é (3 - 1).(4 - 1) =
б. O x = 3,5 tem u m a p ro b a b ilid a d e a ss o c ia d a de 0 ,7 4 4 . D esse m o d o , n ão ex iste u m a asso c ia ç ã o
en tre os três g ru p o s e o status p ro fissio n al.
T ab e la 8.10 G rupos por status profissional: freqüências e estatísticas do X
Status profissional Bulimia Controle clínico Sein controle clínico Teste x
Trabalhadores 18 28 15 r = 3.5
Estagiários 12 11 10 gl = 3.5
Estudantes uni\.jr. itários 71 56 75 p = 0.744
Donas de casa 0 6 ü
* N. de T. Frank Yates (1902-1994).

Resumo
■ P ara a an álise d o re la c io n a m e n to e n tre v ariáv eis c a te g ó ric as, o y j é a e sta tístic a infe-
ren cial ap ro p ria d a .
■ O x de u m a v ariáv el (ou teste de a d e rê n c ia ) tem u m a v ariá v el c o m v ário s níveis. O
teste m o stra se as freq ü ê n c ias n as c é lu la s são sig n ific a tiv am en te d ife re n te s d as que
e sp e ra m o s, co n sid e ra n d o a h ip ó te se n u la v erd ad eira.
■ O teste y~ d e in d e p e n d ê n c ia m o stra se ex iste u m a asso c ia ç ã o sig n ificativ a e n tre du as
variáveis (co m d o is ou m ais níveis). A e sta tístic a teste é o re su lta d o d e um cálc u lo
m o stra n d o o g rau de d ife re n ç a e n tre as fre q ü ê n c ia s o b se rv a d a s nas c é lu la s e as e s p e
rad as. c o n sid e ra n d o a h ip ó te se n u la v e rd a d e ira (isso é, sem h a v er re la c io n am en to ).
■ O y~ tem alg u m as restrições (v er página 281). Se violadas, p ara u m a tabela 2 x 2 o teste
exato de F ish er pode ser executado. Isso é feito auto m aticam en te no SPSSPW .
■ O z * p o d e se r c o n v e rtid o n o V d e C ra m e r (u m c o e fic ien te d e c o rre la ç ã o ) d e m o d o a
fo rn e c e r u m a m e d id a d o efeito . Isso é e x e c u ta d o a u to m a tic a m e n te p elo S P S S P W .
Exercício 1
U tilize os d ad o s de B ish e c o la b o ra d o re s (1 9 9 6 ) d a p á g in a 29 3 e e x e c u te u m teste y 2 2 x

2 no S P S S P W . O q u e você n o ta so b re a a n á lise e x e c u ta d a ?
Exercício 2
E x ecu te u m a a n á lise 2 x 2 no seu p ac o te c o m p u ta c io n a l.
Fumante Não-fumante
B eb ed o r
A b slêm io
E x iste um rela c io n a m e n to en tre b e b e r e fu m a r na sua sala de a u la?
1. Q ual é o v alo r d o x~?

2. Q ual é o v a lo r d a p ro b a b ilid a d e ?
3. O q u e os re su lta d o s estã o lhe in fo rm a n d o ?
Exercício 3
T rin ta e três p e ss o a s re c e b e ra m u m q u e stio n á rio so b re su a s p re fe rê n c ia s p o r an im ais:

ra to s, aran h as, m o rc eg o s ou c o b ras. E is os re su ltad o s:
Ratos A ranhas Morcegos Cobras
10 X II 4
1. Q u a is são as fre q ü ê n c ia s e sp e ra d a s p ara as q u a tro c é lu la s9
2. Q u al é o v alo r do %"?
3. Q u al é o v alo r d a p ro b a b ilid a d e ?
4. O q u e se p o d e c o n c lu ir d esses resu lta d o s?
Exercício 4
E x ecu te um teste x n o s seg u in te s dad o s:
Fumante Não-fumante
Bebedor 70 32
Abslemio 7 I
R eg istre os re su lta d o s e e x p liq u e o q u e sig n ific am .
PONTO DE DISCUSSÃO: ^ OU TESTE 77
O b serv e os se g u in tes re c o rte s de jo rn a is e d e cid a e m cad a ca so o que deve se r u tilizad o :

um %' ou um teste /.
A: E x iste u m a p o ssib ilid a d e de c h u v a n as q u in ta s-fe ira s
Do Professor MJ
Senhor, NP (correspondência de 24 de julh o / tenta explicar a descoberta de GN (correspon
dência de 22 de julho) de que quinta-feira é o dia mais chuvoso da semana. Nenhuma explicação
é necessária. A variação dos números para os sete dias ê puramente casual como qualquer esta
tístico pode assegurar.
O número total de dias com chuva para iodos os sete dias é 938,9, com uma média cle 134,13.
F.sta média é um valor esperado para cada dia se a chuva fo r igualmente distribuída sobre os sete
dias. Um teste qui-quadrado pode ser utilizado para comparar os sete valores observados com os
esperados. O qui-quadrado resultante de 1,28 para 6 graus de liberdade é muito pequeno para
dem onstrar uma diferença significativa dos valores esperados. De. falo, o ocaso produzirá esta
diferença pelo menos 95 vezes em cada 100.
Sinceramente
B: O dia m ais c h u v o so d a sem a n a c o lo c a d o em teste
Do Sr. AF
Senhor, parece impertinente que um simples graduado critique a sua correspondência, mas
seguramente o professor M J utilizou o teste estatístico errado em sua correspondência (de 27 de
julho). O teste qui-quadrado é utilizado para testar freqüências de ocorrência. Neste caso, lemos
dados intervalares, e o leste t é que deve ser utilizado, requerendo o conhecimento do desvio p a
drão dos conjuntos de dados. Afora isso, os resultados provavelmente serão semelhantes.
No meu ponto de vista, quinta feira é o dia mais cluivoso como é o primeiro dia de um cam
peonato. Os selecionadores utilizam esta informação para escolher quatro lançadores rápidos qiu
provam ser totalmente inadequados para os restantes quatro dias secos .
Sinceramente
QUESTÕES DE MÚLTIPLA ESCOLHA 2. O V de Cram er é:

(a) Um sinal de vitória feito depois de calculado
I. O teste exato de bisher é utilizado quando: o teste estatístico dc Cramer
(a) Os cálculos do / são muito complicados (b) Uma medida do efeito baseada em escores pa
(b) Há mais de 25% das células com freqüências dronizados
esperadas menores do que 5 em um delinea (c) Uma medida de correlação do eleito converti
mento 2 x 2 da para X
(c) Há mais de 25% das células com freqüências (d) Uma medida de diferenças
esperadas menores do que 5 cm uma tabela de
contingência 3 x 2 /Uv questões 3 a 5 se relacionam com a seguinte
(d) Há dados não-categóricos saída:
TABELA CRUZADA DE DIA DA SEM ANA x SEXO
Count (Contagem)
SEX (SEXO) Total

men (homens) women (mulheres)
day of week tuesday am 21 210 231
(dia da semana) (terça de manhã)
wednesday am 43 127 170
(quarta de manhã)
evening 25 99 124
(vespertino)
Total 89 436 525
Asymp. Sig. (2-sided)

Value (Valor) df (grau de liberdade) (Sig. Assintótica Bilateral)
Pearson Chi-Square
19.450a 2 0.000
(Qui-Quadrado de Pearson)
Likelihood Ration
20.208 2 0.000
10.429 1 0.001
(Associação Linear versus Linear)
N dos Casos Válidos 525
Sig. = Significance
a. 0 cells (.0% ) have expected count less than 5. The minimum expected count is 21.02.
(a. 0 células (0,0%) apresentam menos do que valores esperados. 0 valor mínimo esperado é 21.02)
* N. de T. O texto está se referindo ao jogo de críquete.

3. Quantas mulheres e^tão no grupo das q u a rta ò de 6. 290 pessoas são questionadas sobre qual refri
manhã? gerante de cola preferem . O s resultados são os
(a) 127 seguintes:
(b) 43
(c) 99
(d) 210 Coca-Cola Pepsi Pepsi
Coca-Cola Pepsi
Light Twist Light
4. O x de Pearson apresenta uma probabilidade as
sociada de: 6_ 83 77 6 57
(a) <0,001
(b) 0,00004
(c) 0,00124 Q uais são as freqüências esperadas para as célu
(d) Nenhuma delas las?
(a )57
5. O número de pessoas na aná!i;,e é:
(b) 58
(a) 231 (c) 290
(b) 170
(c) 124
(d) 525 7. Observe a seguinte saída:

Value (Valor) df (graus de liberdade) (Sig. Assíntótica Bilateral)
Pearson Chi-Square
14.3212 1 0 .00050
Likelihood Ratio
14.3722 1 0.00 00 4
14.3521 1 0.00005
O y j tem uma probabilidade associada de:

(a) 0,00005
(b) 0,00004
(c) 0,00200
(d) 0,00050
8. Observe a seguinte tabela:
Statistics Child development Psychobiology Cognitive Psychology

(Estatísticas) (Desenvolvimento da criança) (Psícobíologia) (Psicologia Cognitiva)
observed
72 31 15 50
(observado)
expected
(esperada)
Qual é o valor das freqüências esperadas?

(a) 32
(b) 50
(c ) 42
(d) 25
9. Uma variável % é também denominada: 14. O valor do V de Cramer é:

(a) Teste de aderência (a) 0,05
(b) Teste de independência yj (b) 0,008
(c) x] 4 x 2 (c) 0.099
(d) x:2 x 2 (d) 0,010
10. O valor do x~ sefá sempre: 15. Observe a seguinte tabela de contingência 2 x 2 .
(a) Positivo construída a partir de 150 participantes:
(b) Negativo
(c) A lto
(d) Depende da situação Bebe chá Bebe café
11. A correção de Yaies é utilizada algumas vezes por Sente-se ótimo 70 50

pesquisadores quando: Sente-se péssimo 30 80
(a) O valor das células é enorme
(b) O valor das células é pequeno
(c) Os dados são analisados a partir de uma tabela Existe algo errado com os valores referidos. Na ta
de contingência 2 x 2 bela. os números nas células devem:
(d) Alternativas (b) e (c)
(a) Totalizar 150
A.s questões de 12 a / 4 se referem à .seguinte saída par (b) Totalizar 100
cial, resultado de uma análise X sobre associação entre (c) Ser iguais
a forma do corpo e o tipo de esporte praticado: (d) Ser analisados por um x 4 x 3

Value (Valor) df (graus de liberdade) (Sig. Assintótica Bilateral)
Pearson Chi-Square
2 2 :3 0 5 -' 9 0.00796
Likelihood Ratio 21.516 9 0.01055

12.162 1 0.00 04 9
N of Valid Cases
525
(N dos Casos Válidos)
Sig.= Significância
a. 0 ceils (.0% ) have expected count less than 5. The minimum expected count is 21.02.
a (0 células (0,0%) apresentam valores esperados menores do que 5. A contagem mínima esperada e de 2 1.02).
Cramer's V (V de Cramer) 0.09943 0.00796
a. Not assuming the null hypothesis, (a. Não assumindo a hipótese nula.)
b. Using the assymptotic standard error assuming the null hypothesis,
(b. Utilizando o erro paorão assintótico assumindo a hipótese nula.)
12. O valor do x é: 16. Pergunta-se a 450 pessoas quais dos 5 tipos de

(a) 12,162 figuras de pássaros escolheriam para colocar em
(b) 21,516 uma campanha “parem todas as guerras” . O resul
(c) 22,305 tado é o seguinte:
(d) 525
13. O valor do x ' tem um nível de probabilidade de:

(a) 0,0004
(b) 0,05
(c) 0,01055
(d) 0,00796
Quais são as freqüências esperadas para as células? (a) Tabela de contingência 2 x 2

(a) 79 (b) Tabela de contingência 3 x 2
(b) 97 (c) Tabela do qui-quadrado 1 x 2
(c) 485 (d) Tabela do qui-quadrado 2 x 2
(d) 5 19. O objetivo geral da utilização de um a análise %
17. Para acharmos o tamanho do efeito após realizar 2 x 2 é descobrir se:
uma análise pelo x <devemos: (a) Existe uma associação significativa entre duas
(a) Converter o V de Cramer para o X variáveis categóricas
(b) Converter o x para o V de Cramer (b) Existe uma associação entre duas variáveis
(c) Elevar o valor do %' ao quadrado contínuas
(d) Converter o y j para o Z de Fisher (c) Dois grupos de participantes diferem em duas
variáveis
) 8. Observe a seguinte tabela. (d) Nenhuma das alternativas
20. Se você está executando uma análise x 4 x 4 e

Ansioso Não-ansioso descobre que as hipóteses não estão satisfeitas,
precisa:
Péssimo emprego 210 150
Ótimo emprego 62 52 (a) Executar um teste exato de Fisher
(b) Verificar se é possível agrupar categorias
(c) Verificar se é possível aplicar um teste t
Ela é denominada de: (d) Desistir da análise
Referências
BENNINGHOVEN, D. et al. Family representantion in relationship episodes of patients with a
diagnosis of bulimia nervosa. Psychology & Psychotherapy v. 76. n. 3, p. 323-36. 2003.
BISH, A. et al. The role of coping strategies in protecting individuals against long-term tranquilizer
use. British Journal o f Medical Psychology, v. 69, n. 2, p. 101-15. 1996.
HOWELL, D. C. Statistical Methods fo r Psychology. Boston: PWS-Kent. 2002, 5 ‘ed.
Análise de Diferenças entre Três ou
Mais Condições: ANOVA de um Fatc
Nos ca p ítu lo s a n te rio re s, vo cê a p re n d e u a c o m p a ra r d u as c o n d iç õ e s e a a n a lisa r re la : : *

m e n to s e n tre d u a s variáve is. C o m o p a rte d e ssa s a n á lise s, a p re n d e u a re lata r ta m a n h o s de e_T :
in te rv a lo s d e c o n fia n ç a e níveis d e sig n ifica n cia o b tid o s. A g o ra possui to d o s os recu rso s n e :- _
rios para e xe cu ta r a n á lise s m ais c o m p le xa s - a a n á lise de três ou m ais co n d iç õ e s. V erifico u : : -
c o m p a ra r d u a s c o n d iç õ e s (no C a p ítu lo 6) e a c o m p a ra ç ã o de três ou m ais é u m a exten são a : .
Em vez do te ste f para d u a s co n d iç õ e s, u sa m o s a A N O V A (p a ra trê s ou m ais c o n d iç õ e s). A -
V A é o te ste p a ra m é tric o e q u iv a le n te ao te ste f, para trê s ou m ais g ru p o s. A N O V A é um a c r :
para Anaiysis o f Varíance (A n á lise d e V a riâ n c ia ). C o m o o c o rre co m o te ste f, é n ecessário a : ; -
c e rta s c o n d iç õ e s para se e xe cu ta r u m a a n á lise d e v a riâ n c ia . V o cê re co n h e ce rá co n d iç õ e s c :
tra b a lh o co m o te ste t.
O s valo re s devem ser re tirad o s d e u m a p o p u la ç ã o com d istrib u iç ã o n o rm a l. C o r :
rare m o s isso caso os valo re s a m o stra is te n h a m u m a d istrib u iç ã o n o rm a l: q u a n to ~
p a rticip a n te s fizerem p a rte do e stu d o , m a io r será a p ro b a b ilid a d e d e q u e a d is t r ic .
seja n o rm al (veja C a p ítu lo 2, p á g in a 6 2 ).
D eve hav er h o m o g e n e id a d e da va riâ n c ia - as v a riâ n c ia s devem se r sim ila re s e n tre o s : -
ren tes g ru p o s. O S P S S P W te sta essa c o n d iç ã o . No caso da A N O V A in d e p e n d e n te , o ' t
é o d e Le v e n e *; p ara a A N O V A de m e d id as rep etid as, é o da ra zã o m á xim a .
Na a n á lise de m ed id as rep etid as, e xiste u m a restrição a d icio n a l, a da e sfe ric id a c e '
e n ta n to , há um a ju ste u tiliza d o q u a n d o essa c o n d içã o fo r v io la d a . Esse a ju sta m e n to e
n o m in a d o de e (ép silo n ) d e G reen h o u se-G eisse r, ro tin e ira m e n te fo rn e c id o pelo SPSS -
A A N O V A é re la tiv a m e n te ro b u sta no q u e d iz resp eito a essas co n d içõ e s. Pequenas vic -

(p. ox., há d a d o s n o rm a lm e n te d istrib u íd o s, um m esm o n ú m e ro d e valo res em to d as as cono c i
m as as v a riâ n c ia s não são ig u ais) não im p ed e m q u e se sig a a d ia n te (a A N O V A d e n tre p a rtic ip a _ -
n ão é ro b u sta q u a n to à v io lação da e sfe ric id a d e ; assim , o va lo r da estatística F deve ser aju ; *¿ :
para levar isso em c o n ta ). Se há um p e q u en o n ú m e ro de p a rticip a n te s, os d a d o s são a s s im e r :
e existe um n ú m e ro d ife re n te de valo res em cad a c o n d iç ã o , deve-se co n sid e ra r a e xe cu ção de . - .
A N O V A n ã o -p a ra m é trica , a p re se n ta d a no C a p ítu lo 15. .
N este ca p ítu lo vo cê irá:
■ G a n h a r um c o n h e c im e n to c o n c e itu a i do q u e sig n ifica a a n á lise d e v a riâ n c ia

■ A p re n d e r c o m o a n a lis a r d a d o s co m uso de A N O V A p a ra m é tric a
■ A p re n d e r so b re u m a m ed id a g lo b al d e efeito (t j2 p a rcial)
■ A p re n d e r c o m o a p re s e n ta r g ra fic a m e n te os resu ltad o s
A s a n á lise s de três ou m ais c o n d iç õ e s in clu i:
■ E statísticas d e scritivas, tais co m o m éd ias, intervalo s de c o n fia n ç a q u a n d o a p ro p riad o -

d ia n a , desvios p a d rõ es; ilu straçõ e s g rá fic a s, tais c o m o os d ia g ra m a s de caixa e b ig o a e :
* Howard Levene (1914-2003).

T a m a n h o do efeito - a m a g n itu d e da d ife re n ç a e n tre d u as co n d iç õ e s, d e n o m in a d a d, e

u m a m ed id a de e fe ito g lo b al ou r| p a rcial.
Testes In fe re n cia is - o te ste e sta tístic o d e n o m in a d o d e A n á lise d e V a riâ n c ia (ANOVA)
a va lia q u ã o p ro váve l é q u e q u a lq u e r d ife re n ç a e n tre d u a s c o n d iç õ e s se deva a erro
a m o stra i
*1 Visualização do delineamento
É fá c il v is u a liz a r u m a a n á lise d as d ife re n ç a s e n tre três ou m a is g ru p o s p ela seg u in te

re p re sen tação .
Tabela 9.1 Participantes independentes (entre grupos)

Três níveis (ou condições)
Al A2 ^ 3 de um fato r (Fator A)
PI PI I P2I
P2 PI 2 P22
PIO ’0 P30
Isso é d en o m in a d o d e lin e a m e n to de u m a c la ssific a ç ã o , p o rq u e tem o s u m fa to r - F a to r A.

O fator p o ssu i três níveis: A l , A 2 e A 3. P o d em o s a firm a r q u e c um d e lin e a m e n to e n tre g ru p o s
p o rq u e cad a p a rtic ip a n te a p a re c e so m e n te em u m n ível - p o r e x e m p lo , o p a rtic ip a n te 1 (P I )
a p arece so m e n te so b a c o n d iç ã o A 1.
A T ab ela 9.2 é tam b ém d elin e am e n to de u m fa to r1p o rq u e ex iste so m en te um (d en o m in ad o
de A). O fato r A tem três níveis ou co n d iç õ e s ( Al , A 2 e A 3). Você p o d e d iz e r q u e este d e li
n e am e n to é de m ed id as rep e tid a s p o rq u e cad a p artic ip a n te tem um v alo r sob cad a nível - por
ex em p lo , PI ap arece sob A l , A 2 c A 3, assim c o m o o^ p a rtic ip a n tes P2 a PIO.
Tabela 9.2 M edidas repetidas (dentre participantes)
Al A2 A3
PI P ll P2I
P2 P 12 P22
PIO PIO PIO
' A lgum as vezes o delineam ento de m edidas repetidas de um fator é confundido com o de dois fatores. Isso ocorre porque a repetição
dos participantes sobre todas as condições é tam bém denom inada de fator.
A A NOVA procura verificar se e x iste m d ife re n ç a s n a s m edias dos grupos. Faz isso de -
term inando a m edia g e r a t e verificando o quão diferente cada m edia individual é da médu.
ge ral.
E x istem clois tip o s d e A N O VA :
1. A N O V A in d e p e n d e n te (u tiliz a d a q u a n d o os p a rtic ip a n te s são a v aliad o s em som ente

u m a de v árias c o n d iç õ e s, isto é, u m d e lin e a m e n to in d e p e n d e n te o u e n tre p a rtic i
p an tes).
2. A N O V A re la c io n a d a (u tiliz a d a q u a n d o os p a rtic ip a n te s são a v aliad o s so b to d as a '

co n d iç õ e s, isto é, u m d e lin e a m e n to d e n tre p articip an tes).
A ANO VA relacionada ou independente testa se existe um a diferença significativa entn

algum a ou todas as m édias das condições, com parando-as com a m édia global.
A A N O V A é um te ste t g e n e ra liz a d o p a ra m ais d e d o is g ru p o s , e. p o r isso , ex iste u n u
relação d ire ta e n tre eles: d e fato, se você u tiliz a a A N O V A em d u as c o n d iç õ e s, os resu ltad o -
se rã o e q u iv ale n tes a o s q u e seriam o b tid o s p e lo teste t.
9.2 Significado da análise de variância
A A n á lise de V ariân cia (A N O V A ), c o m o o n o m e su g ere, a n a lisa as d ife re n te s fo n tes d :

v ariação q ue p o d e m o c o rre r em u m co n ju n to d e v alo res. O b se rv e os v alo res d a T ab ela 9.3.
V ocê p e rc e b e q u e os v a lo re s n ão v ariam na p rim e ira c o n d iç ã o . A v a riâ n c ia é m aio r n_
se g u n d a c o n d iç ã o e a in d a m a io r na terceira.
9.2.1 Variância entre grupos

A A N O V A p ro c u ra p o r d ife re n ç a s e n tre as m é d ia s d o s g ru p o s. Q u a n d o a s m é d ias sã
bem d ife re n te s, e x iste u m alto g rau d e v aria ç ão e n tre as c o n d içõ e s. Se não e x iste m diferença
entre as m éd ia s d o s g ru p o s, não ex iste variação .
E sse tip o de v a ria çã o é d e n o m in a d o variação entre grupos - p o r e x e m p lo , p o d e-se vt
qu e na T ab ela 9.3 as m é d ia s v ariam d e 9 até 22,2.
Tabela 9.3 E scores de participantes em três condições
Al A2 A3
9 15 21 >
9 15 25
9 16 17 Variação dentro do terceiro
9 15 22 grupo (de 17 até 26)
9 16 26
X =9 X = 15.4 X = 22.2 „
Variação entre os grupos (de 9 até 22,2)
' A m édia geral c a media das dem ais médias - por exem plo. (Ml + M2 + M3)/3.
A s v ariaçõ es e n tre g ru p o s su rg em de:
B Efeitos dos tratamentos: q u a n d o e x e c u ta m o s u m e x p e rim e n to ou e stu d o , e sta m o s

p ro cu ran d o verificar se as d ife re n ç a s en tre as m é d ia s são g ran d e s o su ficien te p ara
serem de im p o rtâ n c ia e se esta s d ife re n ç a s refletem a m a n ip u la ç ã o e x p e rim e n ta l. A s
d ife re n ç a s q ue refletem a m a n ip u la ç ã o e x p e rim e n ta l são d e n o m in a d a s de e fe ito s dos
tratam en to s.
B Diferenças individuais: c a d a p a rtic ip a n te é d ife re n te ; c a d a p a rtic ip a n te se c o m p o rta
de m o d o d iferen te , m e sm o q u a n d o e n fre n ta u m a tarefa. E m b o ra a lo q u e m o s p a rti
c ip an tes ao acaso a c a d a u m a d as c o n d iç õ e s, a lg u m a s v ezes p o d e m o s verificar, p o r
e x em p lo , q u e e x iste m p a rtic ip a n te s m ais m o tiv a d o s e m u m a c o n d iç ã o ou q u e têm
m ais p rá tic a n a q u e la situ a ç ã o e sp ecífica. A ssim , os g ru p o s v ariam d e v id o às d ife re n
ças in d iv id u ais e n tre os p artic ip a n te s.
■ Erro experim ental: m u ito s e x p e rim en to s não são p erfe ito s. A s v ezes, o e x p e rim e n ta
d o r falha ao d a r a to d o s os p a rtic ip a n te s as m esm a s in stru ç õ e s; às v ezes, p o d e h av er
v a riaçõ es nas co n d iç õ e s e m q u e u m a ta re fa é d e se m p e n h a d a . E m o u tra s situ a ç õ e s, o
e q u ip a m e n to u tiliz a d o p o d e fa lh a r ou n ão ter o m esm o d e se m p e n h o d o s d e m ais, etc.
D ife re n ç a s d e v id a s a e sse s tip o s d e fa lh as c o n trib u e m p a ra a v aria b ilid ad e .
A v a riâ n c ia entre grupos p o d e ser p e n sa d a c o m o u m a v a ria ç ã o entre as colunas. N os

e sc o re s m e n c io n a d o s, ex iste u m a v aria ç ã o e n tre as c o lu n as.
2 Variância dentro dos grupos

O u tra fonte de v a riâ n c ia são as d ife re n ç a s ou v a riaçõ es d e n tro dos g ru p o s. Isso p o d e ser
p e n sa d o c o m o a v a ria ç ã o dentro d a s c o lu n a s. V ocê p o d e v e r p e lo s e sc o re s re fe rid o s q u e a
c o n d iç ã o 1, A l , n ão tem v a riaç ã o in te rn a; to d o s os p a rtic ip a n te s tiv eram o m e sm o d e se m p e
n ho, isto é, 9. A co n d iç ã o 2, A 2, te m u m a p e q u e n a v aria ç ã o . A c o n d iç ã o 3. A 3. a p re s e n ta u m a
v a ria ç ã o b em m aior. C o n stru ím o s e sse s e sc o re s c o m o o b je tiv o d e ilu stra r a v a ria çã o - não
q u e re m o s e x e c u ta r u m a A N O V A em d a d o s c o m o esses p o rq u e u m a das c o n d iç õ e s d a A N O
VA (v eja d ep o is) é q ue as v a riân cias d e c ad a g ru p o sejam igu ais. Isso o c o rre p o rq u e a fó rm u la
p ara a A N O V A to m a as v a riân c ia s de c a d a g ru p o e c a lc u la u m a m édia. S o m e n te te rá se n tid o
u tiliz a r tal m é d ia se o s g ru p o s tiv erem v a riaç õ es se m e lh an tes.
A s v ariaçõ es d e n tro dos g ru p o s su rg em de:
■ Diferenças individuais: em c a d a c o n d iç ã o , m esm o q u e os p a rtic ip a n te s te n h a m a

m esm a tarefa, ain d a vão a p re s e n ta r e sc o re s d ife re n te s. Isso o co rre em v irtu d e de
os p a rtic ip a n te s d ife rire m e n tre eles, isto é, p o ss u íre m h a b ilid a d e s e c o n h e c im e n to s
em d ife re n te s n ív eis, Q 1 e p e rso n a lid a d e d iv ersas, a ssim p o r d ian te. C a d a g ru p o ou
c o n d iç ã o dev e a p re s e n ta r v a ria b ilid a d e . A ssim , os e sc o re s na c o n d iç ã o 1, A l, n ão são
realistas.
■ Erro experimental: já foi e x p lic a d o a n te rio rm en te.
.3 Decomposição da variância
C o m o vo cê sabe, o o b jetiv o da A N O V A é d e sc o b rir se ex istem d ife re n ç a s e n tre as m é d ias
de g ru p o s, e isso é fe ito p e lo c á lc u lo in icial da m é d ia g eral, p ro c u ra n d o v e rific a r o q u a n to
c ad a m éd ia in d iv id u al d ifere d a m é d ia g eral. A v erific a ç ã o d e ssa s d ife re n ç a s é feita p o r m eio
da partição da variância , c o m o e x p lic a d o a seguir. A v a ria b ilid a d e nos e sc o re s, tan to d en tro
do s g ru p o s q u a n to e n tre os g ru p o s, re p re se n ta a v a riân cia total. E x istem d u as fo n tes q u e de-
term in am essa v a ria b ilid a d e Lotai: as in flu ê n c ia s e n tre o:> g ru p o s e d en tro dos g ru p o s. O q u .
a A N O V A faz e p a rtic io n a r e ssa v a ria b ilid a d e to ta l em d u as c o m p o n e n te s. P a ra fa zer isso . -
p re c iso e stim a r p or q u a n ta v a ria b ilid a d e c a d a u m a d essa s c o m p o n e n te s é resp o n sáv el.
□ Variância entre os grupos

□ Variância Total
□ Variância dentro dos grupos
1. P rim eiro , a A N O V A c a lc u la a m éd ia p ara c a d a um d o s três gru p o s.
2. E n tã o e la c a lc u la a m é d ia g eral (as três m é d ia s são so m a d a s e d iv id id a s p o r três).
3. P ara c a d a g ru p o se p a ra d a m e n te , a v ariação total d e c a d a p a rtic ip a n te em re la ç ã o _

m éd ia do g ru p o é c a lc u la d a. E ssa é a variância dentro dos grupos.
4. F in a lm e n te , a v ariação d a m éd ia de c a d a g ru p o em rela ç ão à m éd ia g eral é c a lc u la

da. E ssa é a variância entre os grupos.
C o m o você p o d e ver, e sse s c á lc u lo s en v o lv e m a m é d ia g eral. P o r e x e m p lo , a v ariância

total de um g ru p o d escrev e a d istâ n cia entre a m éd ia g eral e o v alo r m ais d istan te (veja F ig u ra
9.1). A v ariân c ia to tal p ode ser p a rtic io n a d a na v ariâ n c ia d ev id o à d ife re n ç a e n tre as m é d ia '
d o s g ru p o s (v ariâ n c ia e n tre os g ru p o s) e n a v ariân cia d ev id o ao e rro c a su a l, isto é, e la não e
m an ip u lad a pelo p e sq u isad o r (v a riâ n c ia d en tre p a rtic ip a n te s ou v ariâ n c ia d en tro dos g ru p o s i.
Isso é feito para cad a um dos grupos. A p ro x im ad am en te, o cálcu lo final envolve encontrar
a m édia das v ariân cias dentro dos três grupos, a v ariância en tre os g rupos e a variância total. A
estatística F é a razão da variância entre os g rupos pela v ariância dentro dos grupos.
V ariân cia e n tre os g ru p o s / v a riâ n c ia d e n tro d o s g ru p o s = ra z ã o F
C o m o j á d isse m o s an tes, o teste F a p re se n ta u m a re la ç ã o co m o teste t. De. fato, quand»

tiv erm o s a p en as d u as co n d içõ e s: f = F.
Variância do Média
global Variância do
Grupo 1
Grupo 2
Média 1 Média 2 Média 3
Variância dentro
do grupos
Projeto d e três g ru p o s m o stra n d o a d e co m p o siçã o da va riâ n c ia e a d is tâ n c ia da m édia

g lo b al.
N. de T. Os autores estão supondo uma ANOVA balanceada, isto é. todos os grupos com o mesmo tamanho.
Q u a n d o c o n d u z im o s u m e x p e rim e n to , e sp e ra m o s q u e a v a riâ n c ia d en tro d o s g ru p o s -eja

m ín im a p o rq u e assim a ra z ã o F será g ra n d e . Q u a n d o a v a riâ n c ia e n tre or, g ru p o s é bem m aio r
d o q ue a v a riân cia d e n tro d o s g ru p o s, o v a lo r F ta m b ém é g ra n d e , e a p ro b a b ilid a d e ue o b tè-lo
p o r e rro am o stra i, p eq u en a.
N a F ig u ra 9.1, você p o d e v er q u e ex iste um u g ra n d e so b re p o siç ã o e n tre o-, g ru p o s 2 e 3.
su g e rin d o q u e n ão d ife re m m u ito e n tre si. O g ru p o I, e n tre ta n to , n ão m o stra s o b re p o siç ã o
c o m os g ru p o s 2 e 3. A lin h a c in z a é a m é d ia gcrul (u m a a d iç ã o d as três m édia:, d iv id id a p o r
três). A d is trib u iç ã o d o s v a lo re s à e sq u e rd a é d o g ru p o 1. A v a riâ n c ia to ta l p a ra e.,te g ru p o
c o m e ç a no lim ite in fe rio r d a d is trib u iç ã o e te rm in a na m é d ia g eral. Isso p o d e se r d iv id id o
(p artid o ) na v a riân c ia e n tre os g ru p o s (d a m é d ia d o g ru p o 1 até a m é d ia g eral) c na v ariâ n c ia
d en tro dos g ru p o s (d o s lim ites d a d istrib u iç ã o ate a m é d ia d o g rupo).
Você deve v e rific ar q u e as v a riâ n cia s to ta is p a ra os g ru p o s 2 e 3 são p eq u en as. A s d istâ n
cias das m éd ias in d iv id u a is dos g ru p o s 2 e 3 p a ra a m éd ia g eral (a v ariâ n cia e n tre g ru p o s) sào
bem m en o res do que a d istâ n c ia d a m é d ia d o g ru p o J p a ra a m éd ia g eral.
N a F ig u ra 9.2, você p o d e ver que ex iste um a g ran d e so b rep o siçã o e n tre os três g ru p o s e
que n enh um a das m éd ias in d iv id u ais está longe da m édia geral. O efeito é p equeno.
N a F ig u ra 9.3, você p o d e ver q u e ex iste u m a á re a b e m m e n o r d e so b re p o siç ã o e q u e as
m éd ias dos g ru p o s in d iv id u a is esta o m ais d ista n te s da m éd ia g eral. O e fe ito é g ran d e.
Q u a n to m aio r a v ariân cia e n tre g ru p o s em re laç ã o à v ariâ n c ia m éd ia d e n tro dos g ru p o s,
m aio r é a ra z ã o F. Isso nos m o stra q u e u m a (ou m ais) das m é d ia s dos g ru p o s é sig n ifica tiv a
m ente d ife re n te d a m éd ia g eral. N ão nos in fo rm a q u e m é d ia d ife re sig n ificativ am en te, o que
re q u e r testes ad icio n ais.
Variação entre
cada grupo
Variação dentro
de cada grupo
M édias dos três grupos
R ep re se n ta çã o e sq u e m á tica d e um p e q u e n o efeito na A N O V A d e um fator.

306 Chnstine P. Dancey & John Reidy
D iferen ças e n tre

os três g rup os
M édias dos três grupos
R ep resen ta çã o e sq u e m á tica d e um g ra n d e e fe ito na A N O V A d e um fato r.

Figura 9.3
C o n sid e re um p ro jeto q u e a p re se n ta q u a tro co n d iç õ e s in d e p e n d e n te s. Pense em alg u m a

razão para os esco res nas d ive rsas co n d iç õ e s se re m d ife re n te s e n tre si. C o n sid e re , e n tã o , a l
g u n s m o tivo s pelos q u a is os p a rticip a n te s p od em v a ria r d e n tro d e cad a g ru p o .
Í n T I EXEMPLO: ÁLCOOL E HABILIDADE DE DIRIGIR
T rin ta c se is p e ss o a s p a rtic ip a ra m de u m e x p e rim e n to p a ra d e s c o b r ir o s e fe ito s do

á lc o o l n a h a b ilid a d e d e d irig ir. F o ra m a le a to ria m e n te a ss o c ia d o s a trê s c o n d iç õ e s: p la
c e b o (se m á lc o o l), p o u c o álco o l e m u ito álc o o l. A b e b id a n ã o -a lc o ó lic a p a re c ia e tinha
o m esm o g o sto q u e as d e m a is. O s p a rtic ip a n te s fo ra m p e sa d o s e to m a ra m a q u a n tid a d e
a p ro p ria d a d e b e b id a . A ssim , o d e lin e a m e n to é in d e p e n d e n te (e n tre p a rtic ip a n te s). U m a
h o ra a p ó s te re m b e b id o , os p a rtic ip a n te s d irig ira m em u m sim u la d o r p o r 10 m in u to s, e o
n ú m e ro d e e rro s c o m e tid o s fo i a u to m a tic a m e n te re g istra d o p o r u m c o m p u ta d o r. O s dado>
e stã o n a T ab ela 9.4.
T ab e la 9.4 Dados em três condições de ingestão de álcool
Placebo Pouco álcool Muito álcool
5 5 8
¡0 7 10
7 9 8
3 8 9
5 2 11
7 5 15
11 6 7
i 6 11
3 4 8
5 4 8
6 8 17
6 10 11
X = 70J I = 74.00 1 = 123.00
X = 5,83b *= 6,17 X= 10,25
DP = 2.69 DP = 2.33 DP = 3.05
'X = Total
bX = Média
SPSSPW: execução da ANOVA de uma classificação

Z )
E ntre c o m o s d a d o s d e fo r m a u su a l. S e le c io n e Analyze (A n a lisa r ), Compare Means.

(C o m p a re médias) e One-Way ANOVA (A N O V A de um fator).
O f llc e 1вг1аЫ
I 0.и Ы й ; II
n n e w n y a lc o h o l a n o v a d o c - S P S S D a t a Editor
File £d it V iew Q ata Transform I A n aly ze ¡¿ra p h s Utilities
Reßorts
c s |H |a |gg| I I МЫ w D escrip tive S tatistics
1 group Custom T a b le s
group score И
Means
g e n e r a l L inear M odel O n e-S am p le T T e s t
1 00 5
Correlate In depen dent-Sam ples I T e s t
2 00 10 J e g re ss io n
B E a ire d -S a m p le s T Test.
3 00 7
о
Loghnear
S
4 00 C la ssify
D a ta R eduction
5 00 5
S c a le
6 00 7
hjonpatem etric T ests
7 00 11 T jm e S e r ie s
8 00 2 ;S urvival
9 00 3 Multiple R e s p o n s e
г M issing \¿alue A n aly sis
10 00
11 00 6 00
12 00 6 00
13 1 00 5 00
14 1 00 7 00
15 ’ 1 00 9 00
I - I ► [\D ata V iew .\Vanable View / lL J a T 1
O ne-W ay A N O V A S P S S P r o c e sso r is re a d y
-"¡fiStartl ¿ y f i a o s oft W ord onp .w fjy tilc o h .. Output! - S P S S Vi | J .J Find F ile s nam ed |
S erá aberta a se g u in te c a ix a d e d iá lo g o s.
н!Гй Ш M u r lä s liiK l- ijU lIS I IIJ-IS Ia lO K ы и 1 ы 1 3 1 0 |и |

à - Is lx l
F ile £dit V ie w Q eta Transform A n a lyze Q raphs Utilities. W indow Help
0 escore da
variável depen a |a |a |s}| I I ь|&| и| -rii' I Ш -lnl
dente é movido
da caixa situada
à esquerda
para a lista
de variáveis
dependentes
situada à direita
A variável de
agrupamento
é movida da
caixa situada à
esquerda para
] [\ D a t a V i e w ( V a r i a b l e V ie w ? "
Factor (Fator),
S P S S P ro c e sso r is read y
à direita
jifi S tu rt I [jy Microsoft W o r d - с o n e w a y _ a !c o h ... fijjjj Output! - S P S S V i I Find F ile s n am ed . | S g -( - O
S e v o c ê d e se ja te stes post hoc, c liq u e no b otão Post Hoc ( e s s e s te ste s se r ã o e x p lic a c

na p á g in a 3 1 1 ).
iMrlaljLtfál-uUlel |р|д|а|а|^Ы --лЫ 11|аЫ

Щ —
_ »
File £dit View Qata Transform Analyze grap hs Utilities Vtfndow Help
I Ö|H|Ö| ®3| 1 1M 6I Ml Г | г - | a a slr .l <*|<Э|

1 group 0
Я O n e -W a y A N O V A : P o s t H o c M ultiple C o m p a r is o n s f I. I- ^
1
2 Equal Variances Assum ed
3 Г LSD P S -Ñ -K Г Weller-Duncan -*
Г Jukey
Г T ufce ys-b Г Dunngtt
M arque o Г Quncan
Г tlo ch b e rg 's G T 2
teste
l~ G ab riel
desejado
E q u a l V a ria n c e s Noi A ssu m e d
Г* T a m h a n e 's T 2 Г Dunnett's T 2 I- G fim es-H ow ell Г Dunnett's С
Sign ificance leve l | 05

12
H elp
I К D a ta V ie w (Variable View/ "LlL J

S P S S P r o c e sso r is read y
;;fi S ta r t I [ffi Microsoft W ord - с [|j§g) o n e w a y ^ e lc o h ... 1 3 Output! - S P S S Vi . | Find. F ile s n am ed | Q i

Marque o teste que você deseja e clique em Continue (Continuar). Clique em Options
(Opções) se desejar as estatística., descritivas para cada condição.
1ДМД| -Ы-^ЫШвЫ
File £dit View Qa'a Transform Analyze G raphs Utilities Window Help
e s a l a i sal | | м е н <ц| -rir-l c u -ir .l -*m
O n e - W a y A N O V A O p tio n s
ET
A qui Stansbcs
Descriptive Qescnpirve E a ste
(Descritivas) Г tiom o geneiiyo b/ajiance .
foi m a r c a d o
Г fcjeans plot
Missing V alues
Exclude c a s e s flnatysis by analysis
f' Exd u d e c a s e s ¡istwise
[ 3 Z j \ Data View (Vanable Vievif

S P S S Pro ce sso r is ready
j®S ta rtj ¿ y M igoson Wotd - с ||fg¿|O f>Ew py_olcoh ^ Oulputi - S P S S Vi | ^ Find F iles named ■А-l О
Clique em Continue (Continuar) e, depois, em OK. Os resultados aparecerão na janela de

saída (Output window).
9.3 Estatísticas descritivas

ШШЛ
A opção de estatísticas descritivas fornece o desvio padrão e os limites de confiança em
torno da média. Veja Tabela 9.5.
As médias parecem ser diferentes, as variâncias são semelhantes. Vamos observar as médias
colocadas em um gráfico, com os intervalos de confiança em torno delas, conforme a Figura 9.4.
Embora as médias do grupo que usou placebo (5,83) e do grupo com baixo consumo de
álcool (6,17) ejam levemente diferentes, os intervalos de confiança apresentam grande sobre
posição. Assim, qualquer diferença entre as médias pode ser atribuída ao erro amostrai. Ainda
mais, os limites de confiança para o grupo do placebo informam que temos uma probabilidade
de 95% de que a média populacional possa ser encontrada entre 4,12 e 7,54; os limites de con
fiança para o baixo consumo de álcool informam que existe uma confiança de 95% de que a
média populacional para esse grupo esteja entre 4,69 e 7,65. Assim, se executarmos novamen
te o experimento com uma amostra diferente, podemos encontrar as mesmas médias!
T a b e la 9.5 Esiatísticas descritivas e lim ites de confiança para as três condições de álcool
Placebo Pouco álcool M uito álcool
5,83 6,17 10,25

Desvio padrão 2,69 2,33 3,05
Intervalo de confiança 4,12 7,54 4,69 7,65 8,31 - 12.19
14 1
12 -
10 -
8 -
6 -
Lim ites de 4 ‘
co nfiança
de 95 % 2 _____ -------- 1--------------------- 1--------------------- 1---------------------
N = 12 12 12
M uito álcool Pouco álcool Placebo
Lim ites d e c o n fia n ç a de 9 5 % em to rn o d a s m éd ias.

Figura 9.4
A média para o grupo de alto consumo de álcool é bem maior do que as outras duas. *
mais importante, o intervalo de confiança desse grupo não apresenta valores em comum -
os outros dois grupos. Assim, podemos verificar que qualquer efeito está entre o gmpo de _
consumo de álcool e os outros dois grupos.
O teste estatístico para a ANOVA independente de uma classificação é como segue:
Grupo é a linha de interesse, pois mostra as estatísticas entre os grupos. Nossa análise mostra que
F(2, 33) = 9,92, p < 0,001. Lembre-se do Capítulo 5, no qual explícou-se que o coeficiente de
correlação podia ser elevado ao quadrado para mostrar a percentagem das variações de uma das
variáveis responsáveis pelas variações na outra variávet. O r|2 parcial é um coeficiente de correlação
que já é um quadrado. Assim, nesse caso podemos simplesmente ler o seu valor na coluna relativa
ao ri2 . A interpretação do r|2 parcial, nessa ANOVA, indica que 37,5% da variação na habilidade de
dirigir se deve à condição alcoólica do participante.
Tests of Between-Subjects Effects (Testes dos Efeitos sntre Sujeitos)

Dependent Variable: driving ability score (Variável dependente: Escore da Habilidade de Dirigir)\
Type III Sum f Mean Square

Squares (Soma dos (Quadrados
/ Df
Souce (Fonte) Quadrados do Tipo III) /(g l) Médios) F Sig. N
Corrected Model
(Modelo co'r,gidoi 145.167a ' 2 72.583 9.915 0.000 \ 0 3 -:
/
Intercept (interceptoi 1 9 80 .2 50 / 1 1980.250 270.500 0.00 0 \o .ss-
G RO U P (Grupo) 1 4 5 .1 6 7 2 7 2 .5 8 3 9 .9 1 5 0 .0 0 0 о. 375
E rro r (Erro) 2 4 1 .5 8 3 33 7.321
Total 2 3 6 7 .0 0 0 \ 36
Corrected Total
386.75 0
(Total corrigido) \ 35
a. R Squared = .375 (Adjusted R Squared = .^37) (a. R2 ajustado = 0 ,3 7 5 (R2 ajustado = 0 ,3 3 7 ))
A linha Erro contém os valores relacionados à variação dentre participantes.

Teste de Igualdade das variâncias de Levene' ^

Variável dependente: escore da habilidade de dirigir M ostra que as variâncias dos três grupos
não são sig nificativam ente diferentes,
F df 1 df2 Sig.
asíim está satisfeita a hipótese
.215 2 33 .808 da hom ogeneidade das variâncias
Testa a hipótese nula de que variâncias dos erros sáo iguais entre os grupos
a. Projeto: Interceptor- GRUPO
Em artigos de periódicos, você verá que o valor F (9,9), os graus de liberdade (2,33) e a
probabilidade associada (aqui p < 0,001) estão sempre presentes no texto. É útil relatar o valor
global das diferenças entre os grupos. O SPSSPW calcula automaticamente o r¡? parcial no pro
cedimento da ANOVA. Aqui esse valor e' igual a 0,375. Assim, 37,5% da variação nos valores
na habilidade de dirigir podem ser creditados à quantidade de álcool consumida.
Temos agora uma pequena quantidade de informação sobre os efeitos do álcool nos erros
ao dirigir. Embora pareça que as diferenças entre os grupos seja entre a alta quantidade de
álcool e os outros grupos (em vez de entre placebo e pouco álcool), a ANOVA não executa
essas comparações. Apenas nos informa que existe uma diferença entre algumas (ou todas)
as condições, mas é só até esse ponto que chega. Podemos, entretanto, executar testes adicio
nais para confirmar nossa impressão de que as diferenças existentes são entre o grupo de alto
consumo de álcool e os demais.
O procedimento de comparações múltiplas é utilizado para verificar que média de grupo
difere das médias de outros grupos.
9.4 Comparações planejadas
Os pesquisadores normalmente podem predizer qual média irá diferir de outras médias, e
muitas vezes as comparações são planejadas antecipadamente. Estas comparações são em geral
executadas depois que a razão F tenha mostrado que existem diferenças significativas entre duas
ou mais das médias. Embora existam testes que realizam as comparações, recomendamos que
você as faça utilizando o teste /, por ser bem conhecido.
9.5 Controle para múltiplos testes
Freqüentemente os pesquisadores querem fazer várias comparações depois de executarem

a ANOVA de um fator. Caso faça comparações múltiplas, então, como exposto na página 244,
você aumentará a probabilidade de erro do Tipo I. Para poder considerar múltiplos testes, você
precisa ser mais criterioso para declarar um resultado como estatisticamente significativo. Uma
forma de controlar o erro Tipo I quando se realizam múltiplos testes é dividir uma probabili
dade aceitável (p. ex„ 0,05) pelo número de comparações que deseja fazer. Assim, se decidir
fazer três comparações dois a dois, deverá dividir 0.05 por 3. O cálculo fornece um valor d:
0,016. Será aceito corno estatisticamente significativo um resultado com uma probabilidade
que for igual ou menor do que esse valor. Isso evitará o aumento do erro do Tipo I.
9.6 Testes post hoc
Algumas vezes os pesquisadores exploram diferenças entre os vários conjuntos de me

dias sem tê-las explicado em bases teóricas. Existem muitos testes post hoc disponíve:-
Variam de acordo com o poder e a habilidade de se produzir um erro do Tipo I, isto ;
diferem na extensão em que são liberais ou conservadores (estes termos foram explicad
no Capítulo 4, página 160). Quando executa testes post hoc utilizando o SPSSPW, v<x:
não precisa adequá-los ao erro do Tipo I (como explicado no parágrafo anterior) porque
testes disponíveis já foram formulados para levai' isso em conta. Quando tiver de fazer l~
grande número de comparações, deve escolher um teste post que seja mais conservad- ■
Esse teste é o das diferenças honestamente significativas (DHS) de Tukey. Um teste q_:
tende a ser mais liberal é o das diferenças menos significativas (DMS). Uma discussi
completa sobre esses testes não é de abrangência deste livro. Os interessados podem c c
sul.tar Howeii (2002) ou procurar na Internet.
Se. em vez de um pacote estatístico, executarmos o DHS de Tukey nos dados da pesqu
sobre álcool, obteremos o seguinte quadro:
Multiple comparisons (Comparações Múltiplas)

Dependent variable: SCORE (Escore da Variável Dependente)
Tukey HSD (DHS de Tukey)
Mean Difference Std. Error 95% confidence

(Diferenças de (Erro interval (IC
médias) padrão) Sig. de 95% )
(1) condition (J) condition Lower Bound Upper Bourc
(condição 1) (condição J) (Limite Inferior) (Limite Superic I
low alcohol -.3 3 3 3 -3 .0 4 3 8 2.377- I
placebo 1.1046 .951
(pouco álcool)
híg h alco ho l
-4 .4 1 6 7 * 1 .1 0 4 6 .001 - 7 .1 2 7 1 - 1 .7 0 6 2
(muito álcool)
low a lco ho l
placebo .3333 1.1046 .951 -2.3771 3.043£ I
(pouco álcool)
hígh a lco ho l
- 4 .0 8 3 3 * 1 .1 0 4 6 .002 - 6 .7 9 3 8 - 1 .3 7 2 S
(muito álcool)
high alcohol 7.127-
placebo 4 .41 67 * 1.1046 .001 1.7062
(muito álcool)
low alcohol
4 .08 33 * 1.1046 .002 1.3729 6 .7 9 3 :
(pouco álcool)
*The mean difference is significant at the .05 level (*As diferenças entre as médias são significativas no nível de : : .
Sig. = Significance
Isso mostra que existe uma diferença estatisticamente significativa entre os gru:
que consumiram placebo e altas doses de álcool, bem como entre grupos que consu~
ram baixas e altas quantidades de álcool (em negrito na tabela). Obviamente, não e.\
diferenças entre os grupos que consumiram placebo e pouco álcool. Agora você p .
calcular o tamanho do efeito, d, para as diferenças entre as duas condições, exatamente
mesma forma que fez para o teste t (veja página 2 2 2 ) . Apenas para lembrá-lo, a fórrr.. .
e a seguinte:
média da condição 1 - média da condição 2 5,83 —10,25

média dos desvios padrões média dos desvios padrões
- 4 ,4 2
média dos desvios padrões
Assim, para as condições I e 3, o tamanho do efeito é:
média dos desvios padrões =

2
Ignorar o sinal
tamanho do efeito = — - - - = 1,54
2,87
Desse modo, as médias das condições placebo e muito álcool diferem por 1,54 desvios
padrões e isso é estatisticamente significativo. Se você calcular o tamanho do efeito para as
condições de pouco e muito álcool, encontrará também uma diferença de 1,54. Os cálculos
do tamanho do eleito para os grupos que consumiram placebo e pouco álcool leva a um valor
de 0,135. Assim, essas condições diferem por aproximadamente 1/7 de um desvio padrão. Tal
diferença pode ser creditada ao erro amostrai. Agora temos muitas informações para elaborar
o relatório. A análise pode ser escrita da seguinte forma:
Estatísticas descritivas (Tabela X)3 mostram que mais erros são cometidos na condição de alto
consumo de álcool do que nas outras duas condições. A análise de variância de um fator mostrou que
qualquer diferença entre condições é improvável de ter ocorrido apenas por erro de amostragem,
considerando a hipótese nula seja verdadeira. F(2, 33) = 9,92 e p < 0,001 representam um tama
nho do efeito (iy parcial) de 0,375, mostrando que aproximadamente 38% da variação nos erros de
direção podem ser creditados aos diferentes níveis de álcool. Um teste posi hoc (Newman-Keuls)
confirmou que as diferenças entre as condições 1 e 3. e 2 e 3 (ambas com d = 1.54) tem baixa proba
bilidade de terem ocorrido apenas por erro amostrai. Não se observou diferença significativa entre as
condições pouco álcool e placebo (d = 0,14)
Atividade 9.2
No cálculo do tam anh o do efeito entre duas con d ições na ANOVA de uma classificação,
você ob tém um tam anh o do efeito (d) de 0 ,4 9 0 . Concluiu-se que as m édias diferem por:
(a) A p roxim adam ente m eta d e d o desvio padrão

(b) A p roxim adam ente um quarto d o desvio padrão
(c) 4 ,9 desvios padrões
(d) N enh um a das alternativas
' Vocc deve remeter seus leitores à tabela na qual esião as estaiísticas descritivas.
hábitos alimentares e a síndrome do intestino irritável
E ss e é u m e stu d o so b re h á b ito s a lim e n ta r es e a sín d ro m e d o in te stin o irritável ( S il) . A l g u n a s

p e ss o a s p e n sa m q u e e x is te um a r ela çã o entre d istu rb io s a lim e n ta r es (ta is c o m o b u lim ia e an orexia
e a S U . E x iste m a lg u m a s p e sq u isa s q u e in d ic a m a c o e x is tê n c ia de d istu rb io s a lim e n ta r es e da d o
e n ç a d o in te stin o in fla m a d o ( D I I. de sin to m a s sim ila r e s a S i l , m a s c o tn c a u sa s c o n h e c id a s ). U m
q u estio n á rio que m ostra a e x te n sã o qu e um a p e ss o a apresenta de d istu rb io a lim e n ta r é d e n o m in a d o
de teste de h áb itos alim en tares (T H A ). S u llív a n e co la b o ra d o re s ( 1 9 9 7 ) ap licaram um T H A a quatro
g r u p o s d istin to s: p e s s o a s c o tn S U . c o m d istu rb io alim en tar, c o m D1I e se m q u alq u er d istu rb io. A
T abela 9 .6 m ostra os resu ltad os.
Tabela 9 6 Tabcla de rebultados por Sulivan e colaboradores ( 1997)
Grupo Contagem Escore Médio IC de 95% para a média
SII 48 16.67 1 5.6- fS,7

Distúrbio alimentai 32 56," 18.'- 64,8
DII 31 10,4 8 .0 - 12,9
Controles 28 0.6 7 ,2 - 12,0
P o d e -se p erceb er d e im e d ia to q u e, c o m o e sp e r a d o , as p e s s o a s c o m d istu rb io alim entar

o b tiveram v a lo res m u ito m a is a lto s do q u e q u alq u er outro gru p o no T H A . D e fato, se e s s e nã.
fo s s e o c a so , não seria um teste vá lid o .
O s in te rv a lo s d e c o n fia n ç a m ostram que o grupo c o m a d o e n ç a in flam atória do intestin.
e 0 g ru p o de c o n tr o le s e so b r e p õ e , in d ic a n d o qu e n ão e x is te m d ife r e n ç a s im p ortan tes entre
e s s e s d o is g ru p o s n o T H A . O gru p o c o m S U , en tretan to, não so m e n te tem a m é d ia am ostrai
m a is alta do q u e e s s e s d o is g r u p o s, c o m o tam b ém o in terv a lo de c o n fia n ç a n ão s e so b re p õ e ^
e le s , su g er in d o qu e q u alq u er d ife re n ç a (d e sc o n ta d o o gru p o do d istú rb io alim en tar) será entre
o s g ru p os c o m SII e D II gru p o de c o n tr o le . O in tervalo de c o n fia n ç a para o gru p o de distú rb k
alim en tar n ão se so b re p õ e a n en h u m d o s o u tro s gru p os.
S u lliv a n e c o la b o r a d o r e s relataram o se g u in te : “ Q u a n d o o s qu atro g r u p o s foram c o m
parados u tiliz a n d o A N O V A (F = 9 3 ,7 2 1 7 ) e um teste de c o m p a r a ç õ e s m ú ltip la s u tiliza n d o a
d ife r e n ç a m e n o s sig n ific a tiv a (D M S T c o m um a sig n ific a n c ia de 5 9 c , tanto o gru p o de distúr
b io a lim en tar qu an to o gru p o da SII tiveram um e sc o r e T H A sig n ific a tiv a m e n te m a is alto do
qu e o s g r u p o s c o m DII e de c o n tr o le ” .
O DM S c um dos testes post hoc disponíveis no SPSSPW .

desempenho cognitivo e uso do ecstasy
Dr. Parrot e colegas (Parrot et al., 1998) executaram um estudo sobre desempenho cognitivo com
usuários ocasionais de ecstasy. Trabalhos anteriores mostraram déficit de memória em usuários de
ecstasy. Parrot e colaboradores verificaram o desempenho em uma tarefa (velocidade de resposta,
‘empo de reação, tempo para a escolha, vigilância numérica e lembrança de palavras) em três grupos
de jovens: 10 usuários regulares, 10 usuários novos e 10 de um grupo de controle que nunca tomou
a droga. Os pesquisadores analisaram os dados com a ANOVA de um fator e o teste de Duncan.' So
mente duas das tarefas cognitivas geraram um efeito significativo: lembrança imediata de palavras
e lembrança retardada de palavras, como na Tabela 9.7.
As comparações por Duncan mostraram que a diferença entre os grupos de controle e novos usu
ários, bem como entre o grupo-controle e os usuários regulares, tanto na lembrança imediata quanto
retardada de palavras, não podiam ser atribuídas ao erro amostrai, considerando a hipótese nula ver
dadeira. No entanto, a pequena diferença entre os grupos de usuários novos e de usuários regulares
?ode ter sido obtida em virtude de erro amostrai (sabemos disso porque Parrot e colaboradores não
7orneceram o nível de significância para essa comparação; assim, estamos presumindo que ela seja
não-significativa). Parece que uma diminuição cognitiva pode ocorrer em usuários de ecstasy.
Tabela 9.7 Tabela de resultados por Sullivan e colaboradores (1997)
Novos
Controle Controle Usuários
Efeitos de X X X
Controle - Novos Usuários grupo na Novos Usuários Usuários

não-usuários usuários regulares ANOVA usuários regulares regulares
Lembrança imediata 8.2 1.6 5.3 1,1 6.5 1.3 p <0.001 /><0.01 p < 0.05
de palavras
Lembrança retardada 6.9 1.6 4.6 1.0 5.1 1,4 P < 0.01 p < 0.01 /><0,0!
de palavras
9.7 ANOVA de medidas repetidas
A ANOVA de medidas repetidas consiste em medir um grupo de participantes em todas

as condições. Você lembrará que, para o delineamento independente, dividimos a variância
em duas partes:
■ Variância entre grupos
■ Variância dentro dos grupos
Quando executarmos um delineamento de medidas repetidas, podemos dividir a variân
cia dentro dos grupos da seguinte forma:
1. Variabilidade devido a diferenças individuais
2. Variabilidade devido ao erro aleatório
□ Variância entre grupos

□ Variância por diferenças indivíduai1.
□ Variância residual
Outro tipo dc toste de comparação posi hoc.

Podemos medir (1) porque, no delineamento de medidas repetida:,, cada participante é

testado sob todas as condições. Dessa forma, podemos comparar o resultado global de cada
participante (a soma dos escores em todas as condições) com os escores globais dos demais
participantes.
Você provavelmente lembrará que a razão F para o delineamento de grupos independen
tes é o seguinte quociente:
variância entre gaipos
variância dentro dos grupos
A variância entre grupos é composta dos efeitos dos tratamentos, das diferenças indivi
duais e do erro experimental. No delineamento de medidas repetidas não existe variação entre
grupos devido a diferenças individuais, pois cada participante em cada grupo é único e o mes
mo. A fórmula para o cálculo do F no delineamento de medidas repetidas leva em consideração
o fato de que cada participante é o mesmo em cada condição. A variação devida a diierença>
individuais (que podemos medir) é removida tanto do numerador quanto do denominador d,,
equação. Isso tende a fornecer um teste estatístico mais sensível c com mais poder:
variância entre os grupos
F = -----------------------------------------------------------------------------
variância dentro dos grupos - diferenças individuais
Vamos agora imaginar uma situação na qual executamos novamente o experimenu

com a dosagem de álcool como delineamento de medidas repetidas. Isso significa que n
mesma pessoa executará a tarefa nas três condições (placebo, pouco álcool, muito álcool
Não faria sentido para uma pessoa fazer os três testes em um único dia - cada participante
poderia ser testado, por exemplo, na segunda-feira durante três semanas. Para evitar efeito'
de prática ou ordem, as condições devem ser contrabalançadas. Esse é um delineament.
mais poderoso do que o experimento entre participantes, pois cada participante serve cornc
seu próprio controle. Vamos considerar que os resultados, no entanto, são os mesmos (ve;.
Tabela 9.8).
T abela 9.8 Dados dos participantes sob três condições alcoólicas
eipante Placebo Pouco álcool Muito ál
1 5 5 8
2 10 7 10
3 7 9 8
4 3 8 9
5 5 2 11
6 7 5 15
7 11 6 7
8 2 6 11
9 3 4 8
10 5 4 8
11 6 8 17
12 6 10 11
I 70 74 123
A análise inicia da mesma forma que o experimento entre participantes com as estati'
cas descritivas e ilustrações gráficas.
I l ] SPSSPW: instruções para a ANOVA de medidas repetidas
Escolha o menu Analyze (Analisar), depois General Linear Model. (Modelo Linear Ge
ral) e Repeated Measures (Medidas Repetidas).
ss S P S S D u l a E d it o r
File £d it V ie w Q e ta Transform Analyse Ig ra p h s ytilm es W indow H elp
miniai siL I li=li:?lw Re co rte

D escrip tive Statistics
1 p lo ceb o 1
Custom I o b l e s
C o m p a re M eans
placebo lowalc .
G e n e ra l L inear M odel Univariate Escolha General
5.00 Correlate Multivariote Linear Model e
10 0 0 7 {Reg ressio n B e p e a te d M e a su re s
7 00 9 Laglm ear
Repeated
V a ria n c e Com ponents.
3 00 3 C la ssify Measures
5 00 '2 D a ta R eduction
(Modelo Linear
S c a le
7 00 5 Geral e Medidas
N onparam etnc T e s ts
11 00 C T im e S e r ie s Repetidas)
2 00 6 Survival
3 00 4 Multiple R e s p o n s e
M issin g V a lu e A n a lysis
10 5 00 4 __
6 00 8 00 17 00
6 00 10 00 11 00
~T l\ Data View (Variable View / |_<J________________ | jJ

S P S S P r o c e sso r is r e a d y
L4i f l S ta r t | Microsoft W o r d - c ||jp |re p Q B le d A N O V . [^¡J Oulputl - S P S S Vi | ^ Find F ile s nom ed | O 1 9 - r-
Aparecerá a seguinte caixa de diálogos.
iij-ieig]ioK-M.jiiaizjiBiij|__________________ I
E 'le Ed it V ie w Q a ta Jra n sio rm A n a lyze G ra p h s Utilities W indow fclelp
Mude para
urn nome
apropriado (p.
ex., "álcool")
3 níveis
Mude o “Fator l " para ura nome adequado - neste caso vamos chamá lo de alcohol (ál
cool) - e insira o número de níveis. Como temos placebo, baixo e alto consumo, o número de
níveis é igual a três. Então, pressione o botão Add (Adicionar). Clique em Define (Definir).
-.'i-uKF-' II. IjÕ k |Q| I -I j|'ju l3 IO lu l
• R e p e a te d M e a su re s
Eile E d il
Belale i hiQh *]cc>hol [higlnie-] W ilbin -Sub ieds V a n o b le s (alcohol)
1 p le ceb
Os níveis são
m ovidos em
ordem, da
esquerda para
Q eNxeen-Subiects F a c to r s ) a caixa Within-
□ S ub jects Varia
bles (Variáveis
dentre Sujeitos)
£o va riates.
CD
COQtíOSlS P o s l t jo c Sove
••sf-ssRaeg«or isi&say
ii f l S l B r t j f l y f /:a o so H W o r d -c . ||[;n ^ rn p B n te riA N O V ..- f g j O u tp u fl- S F S s - | F n . j f- n;.m ed | ¿ ¿ - ¿ O 1^ -5-
Mova as variáveis que estão à esquerda, uma de cada vez, para a caixa Within-SubjeL t
Vciríables (Variáveis dentre Sujeitos) à direita. No exemplo, placebo é movido primeiro para a
posição número I; low (baixo) é movida para a segunda posição, e high (alto), para a terceira
Isso representa os três níveis. Então, pressione Options (Opções).
(Ignore os botões Between-Subjects Factor(s) e Covariates, pois não nos interessam ne*--
sa análise.)
Será abeita a seguinte caixa de diálogos.
- 0 ^ 5 Ll d? M f [• S t r , * <è
. I i - i . J - i i . l i
Médias seráo
m ostradas
na snida
Bonforroní
selecionado
-
SPSS o rwJ.
Verifique se você marcou o botão Compare main effects (Comparar efeitos principais).
Terá então uma e s c o lh a de três testes: LSD , Bonferroni ou Sidak. Sugerimos a utilização d o
teste de Bonferroni. qu e faz a correção para o número de testes pareados que você está execu
tando (veja lestes m ú ltip lo s na página 244).
Você pode então verificar as opções que você determinou. Você solicitou descritivas,
tamanho do efeito, médias e poder. Os intervalos de confiança são fornecidos automatica
mente. Pressione Continue (Continuar). O programa retornará à caixa de diálogos Rcpetead
Measures (Medidas Repetidas) da ANOVA. Pressione OK. Os resultados estarão impressos
na janela de saída.
9.7.1 Esfericidade
Na ANOVA, partimos do pressuposto de que todas as condições são independentes. No
delineamento de medidas repetidas, entretanto, utilizamos os mesmos participantes em cada
uma das condições, o que significa que deve existir alguma correlação entre as condições.
Se você possui três condições, existem três correlações bivariadas: condições J versus 2, 2
versus 3 e 1 versus 3. Nós supomos que e sta s três correlações seja m similares. A s s im , a ssu
mimos que todas as covariâncias são similares. A suposição de esfericidade é válida quando
a variância da diferença entre as médias estimadas para um par de grupos é a mesma de qual
quer outro par. Como a satisfação dessa suposição é improvável e violações da esfericidade
são prejudiciais à acurácia da ANOVA, recomendamos que você interprete rotineiramente a
linha Greenhouse-Geiser da saída do SPSSPW. Em outras palavras, é melhor assumir que a
suposição não foi satisfeita. O Greenhouse-Geiser trabalha (como você pode ver no próximo
item) ajustando os graus de liberdade. Essa correção na fórmula faz o nosso teste mais rigo
roso, de modo que, se a hipótese de esfericidade foi violada, há uma possibilidade menor dc
não aumentar o erro do Tipo I.
9.7.2 Saídas da ANOVA

Colocamos em negrito a linha de interesse. Os graus de liberdade parecem estranhos
na saída do SPSSPW, uma ve/ que são fornecidos com várias casas depois da vírgula. Os
graus de liberdade em vez de serem apresentados como 2 e 22 (como na linha da suposição
de esfericidade satisfeita) são apresentados como 1,833 e 20,164. Não utilize tal precisão
quando for relatar os graus de liberdade e tiver utilizado a linha do Greenhouse-Geiser',
arredonde os resultados para valores inteiros, nesse caso, 2 e 20. Aqui você vê que F =
10,83 e p = 0,001. O tamanho do efeito arredondado para cima é 50%. Desta forma, 50% da
variação nas medidas dos valores da habilidade de dirigir podem ser creditadas às diferentes
quantidades de álcool ingeridas.
Test of Within-Subjects Effects , _

(Teste dos efeitos dentre sujeitos) ^se a linha Greenhouse-Geisser
Measure: M EA SU R E1 (Medida: Medida 1) I
Type III Sum Mean
of Squares (Soma Square
dos Quadrados (Quanrado
Source (Fonte) do Tipo III) df (gl) da Inèdia) F Sig. n2
ALCOHOL Sphericity Assumed 145.167 2 72.583 10.826 .001 .496

(Esfericidade
(Álcool) Assumida)
G re e n h o u se - 1 4 5 .1 6 7 1 .8 3 3 7 9 .1 9 4 1 0 .8 2 6 .001 .4 9 6
G e isse r
Huynh-Feldt 145.167 2.000 72.583 10.826 .001 .496

Lower Bound
145.167 1.000 145.167 10.826 .007 .496
(Limite Inferior)
Error Sphericity Assumed 147.500 22 6.705
(ALCOHOL) (Esfericidade
Erro (Álcool) Assumida)
Greenhouse- 147.500 20.164 7.135

Geisser
Huynh-Feldt 147.500 22.000 6.705

Lower Bound
147.500 11.000 13.409
(Limite Inferior)
Note que F (2,20) = 10,83, p = 0.001
9.7.3 Testes post-hoc
Esta é a saída obtida com a opção Compare main effects (Comparar efeitos principais),
utilizando Bonferroni.
Estimates (Estimativas)
Measure: MEASURE ! (Medida: Medida^D
95% confidence interval

(Intervalo de Confiança de 95%)
Std. Error Lower Bound Upper Bound
FACTOR1 (Fator 1) Mean (Média) (Erro Padrão) (Limite Inferior) (Limite Superior)
1 5.833 .777 4.123 7.543

2 6.167 .672 4.687 7.646
3 10.250 .880 8.313 12.187
A tabela acima mostra o valor da média para as condições mais os limites de um intervalo
de confiança de 95%.
Estatística sem M atem ática paro Psicologia 321
Pairwise C om parisons (Comparações aos Pares)

Measure: M EA SU R E1 (Medida: Medida 1)
95% Confidence Interval for

Mean
Difference3 (Intervalo de Con
Difference (I - J) fiança de 95% para a Diferença)
(1) FACTOR 1 (J) FACTOR1 (Diferenças Std. Error
Lower Bound Upper Bound
(Fator 1111) (Fator 1[J]) das Médias) (Erro Padrão) Sig.3 (Superior)
(Inferior)
1 2 -.3 3 3 .924 1.000 -2 .9 3 9 2.272

3 - 4 .4 1 7 * 1.196 .011 -7 .7 9 0 -1 .0 4 3
2 1 .333 .924 1.000 -2 .2 7 2 2.939

3 - 4 .0 8 3 * 1.033 .007 -6 .9 9 7 -1 .1 7 0
3 1 4.41 7* 1.196 .011 1.043 7.790

2 4.08 3* 1.033 .007 1.170 6.997
Based on estimated marginal means. (Baseado nas médias marginais estimadas.)

* The mean dífference is significant at the .05 levei. (A diferença entre as médias é significativa no nível de 5%.)
a. Adjustment for multiple comparisons: Bonferroni. (Ajustado para comparações múltiplas: Bonferroni.)
A tabela compara cada condição com qualquer outra, fornecendo a diferença das médias
entre cada par, o erro padrão, o valor da probabilidade e os limites de um intervalo de 959c de
confiança em torno da diferença das médias.
A primeira linha compara 1 (placebo) com 2 (pouco álcool). A diferença entre as médias
é 0,333. Isso não é estatisticamente significativo por qualquer critério. Esta linha compara
ainda o nível 1 (placebo) com o nível 3 (muito álcool). A diferença aqui é de 4,417. e o nível
de probabilidade associado e 0,011. Continue e interprete o restante da tabela você mesmo.
Atividade 9.3
Pense so b re o q u e os lim ites do in tervalo d e c o n fia n ç a e stão In fo rm a n d o . C o m o você

e xp lica ria o sig n ific a d o de um in tervalo d e c o n fia n ç a d a d ife re n ç a e n tre as m é d ias para um
a m ig o q u e n ão te n h a e n te n d id o a sa íd a ?
O relatório é semelhante ao da ANOVA de grupos independentes. Dessa vez, entretanto,

podemos constatar:
Uma ANOVA de medidas repetidas foi executada. As hipóteses de normalidade, hom ogenei
dade da variância e esfericidade foram satisfeitas. Os resultados mostraram ser improvável que as
diferenças entre as condiçòes tenham se originado somente em virtude do erro amostrai (F(2, 22)
= 10,83 c o m p = 0,001); um tamanho do efeito global de 0,496 (T f parcial) mostrou que aproxim a
damente 50% da variação nos erros cometidos ao dirigir podem ser creditados aos diferentes níveis
de álcool. Comparações emparelhadas mostraram que a diferença entre as condições de placebo e
pouco álcool foi mínima (1%), enquanto a diferença entre as condições de pouco e muito álcool foi
grande ( T f parcial de 59%); F( 1, 11) = 15,6, p = 0,002. Pode-se concluir que os participantes que
consumiram muito álcool cometeram mais erros ao dirigir do que quando consum iram placebo. O
intervalo de confiança mostrou que a diferença entre as médias populacionais tem probabilidade de
95% de ser encontrada no intervalo 1,78 a 7,05.
confiança e acurácia de testemunhas oculares
Kebbell e colaboradores (1996) executaram dois experimentos sobre confiança e acurácia de

testemunhas oculares. Alguns estudos constataram que testemunhas (de acidentes e outros inci
dentes) eram mais acuradas em seus relatos quando estavam absolutamente certas de que tinham
lembrado os eventos corretamente do que quando não tinham certeza. Outros pesquisadores, en
tretanto, verificaram que existe uma pequena correlação entre acurácia e confiança. Kebbell e
colaboradores argumentaram qu.e os pesquisadores não prestaram muita atenção à dificuldade do
item - por exemplo, é muito mais fácil lembrar que, em um determinado incidente, a pessoa era
homem ou mulher do que a cor do cabelo.
Kebbell e colaboradores fizeram dois experimentos que mediam o quão confiante os parti
cipantes estavam em relembrar informações sobre um pequeno filme em vídeo e quão acurada
eram. Primeiro estabeleceram uma escala de itens que classificaram como fáceis, médios ou difí
ceis. A primeira parle do estudo é que nos interessa aqui. Como declararam no artigo, a pergunta
"‘que música a mulher estava cantando?” era fácil; “o que tinha no prato ao lado do aparelho de
TV?” era média, e “o que tinha atrás do vidro de pimenta localizado na cozinha?” era difícil. Os
pesquisadores precisavam estar seguros de que tinham categorizados os itens corretamente, pois
não teria utilidade classificar a pergunta “que música a mulher estava cantando?” como fácil se
nenhum participante pudesse lembrá-la. Dessa forma, os participantes deviam lembrar as ques
tões fáceis mais acuradamente do que as classificadas como difíceis, se os itens tivessem sido
categorizados corretamente.
A variável dependente é o número de respostas corretas em cada uma das três categorias. A
variável independente é a dificuldade do item com três níveis (fácil, médio, difícil). Isso pode ser
representado como na Tabela 9.9.
O teste estatístico mais apropriado é, pois, a ANOVA de um fator com medidas repetidas, que
Kebbell e colaboradores utilizaram. Os pesquisadores fizeram alguns testes adicionais e relataram
o seguinte:
A ANOVA de uma classificação com medidas repetidas mostrou um efeito significativo quanto ao
nível de dificuldade da questão sobre o número de respostas corretas (F(2, 88) = 591.37, p < 0,0001. Os
testes adicionais (p < 0,005) confirmaram que essas diferenças estavam na direção apropriada; as questões
fáceis tinham uma probabilidade maior de acertos do que as médias, e estas do que as difíceis. Isso nova
mente validou as categorias de dificuldade dos itens.
Tabela 9.9 Ilustração do delineamento utilizado por Kebbel e colaboradores (1996)
Fácil Médio Difícil
PI PI PI
P2 P2 P2
P3 P3 P3
P. P. P.
Estatístíca sem M atem ática para Psicologia 323
Resumo
■ A ANOVA permite testar diferenças entre três ou mais condições.

■ A ANOVA é apropriada para dados extraídos de populações normais; é um teste pa
ramétrico.
■ A ANOVA fornece a chance de se obter uma diferença entre algumas ou todas as
condições por erro de amostragem.
■ Testespost hoc mostram as condições que diferem de forma significativa de qualquer
outra condição.
■ O iy parcial é um coeficiente de correlação que pode ser utilizado como uma medida
do efeito na ANOVA. Ele nos permite saber, em termos percentuais, quanta variância
nos valores da variável dependente pode ser atribuída à variável independente.
Exercício 1
Entre com os dados da Tabela 9.10 no SPSS. Faça a análise com o uso da One Way (que está
no menu Compare Meam - Comparar Médias) e obtenha os resultados. Faça um teste post hoc.
Copie as partes importantes da saída. Interprete os resultados em termos do experimento.
Na universidade local, os estudantes foram alocados aleatoriamente a um de três grupos
para a realização de um trabalho de laboratório - um grupo matutino, um vespertino e um notur
no. Ao final da sessão, eles responderam a um questionário para verificar o quanto lembravam
do que haviam feito. Existem diferenças entre os grupos? Se existirem, qual a direção':’
Tabela 9.10 Dados dos grupos de laboratório da manhã, tarde e noite
Manhã Tarde Noite
PI 15 PI 1 14 P21 13
P2 10 P12 13 P22 12
P3 14 P13 15 P23 11
P4 15 PI4 14 P24 I 1
P5 17 PI5 16 P25 14
P6 13 PI6 15 P26 11
P7 13 P17 15 P27 10
PH 19 PIS 18 P2K 9
P9 16 PI9 19 P29 8
PIO 16 P20 13 P30 10
Exercício 2
Existem evidências indicando que fumar maconha leva à perda de memória de curto
prazo e à redução da habilidade na execução de tarefas simples. Sete estudantes fumantes
que normalmente não consomem maconha foram solicitados a responder questões difíceis
de aritmética sob quatro condições diferentes. Na condição 1, fumaram uma mistura de ervas
que pensavam ser maconha. Na condição 2, fumaram uma pequena quantidade de maconha,
ampliada para uma média e grande quantidade nas condições 3 e 4 respectivamente. Os estu-
dantes foram solicitados a fumar sozinhos. Para evitar efeitos de prática, foram feitos quatro
testes diferentes, todos com o mesmo grau de dificuldade. Para evitar os efeitos de ordem e
fadiga, foi contrabalanceada a ordem de aplicação dos testes. Os resultados são os seguintes.
Número do participante Condição 1 Condição 2 Condição 3 Condição 4
i 19 16 8 7
"> 14 8 8 11
3 18 17 6 3
4 15 16 17 5
5 11 14 16 7
6 12 10 9 8
7 11 9 5 11
Entre com os dados no SPSSPW e execute uma ANOVA de medidas repetidas. Relate os
resultados de maneira apropriada.
---------------------------------------------------------------------------- •
QUESTÕES DE MÚLTIPLA ESCOLHA se isso se devia ao estilo de ensinar do professor ou

ao conteúdo das aulas, que apresentavam algumas
1. A ANOVA paramétrica e independente de um fator diferenças. Para seu projeto de final de curso, Ali
é uma generalização do: ce convenceu três professores de estatística a dar a
mesma aula (os dois anteriores mais o prof. P. D.
(a) Teste / emparelhado
Caju), mas com seus estilos de ensino habituais.
(b) Teste I independente
Estudantes do 1“ ano foram alocados aleatoria
(O X2 mente a três aulas de urna hora cada. No final das
(d) rd c P carso n
aulas, foram avaliados sobre o conteúdo apren
A s questões 2 a -!- se baseiam na seguinte informação: dido (CONHECIM ENTO) e sobre o gosto pela
Alice, unia estudarue do 3" ano, notou que ela e aula (ENCANTAMENTO). Alice enlão utilizou a
seus amigos aprendiam mais estatística quando as ANOVA de um fator para analisar os resultados.
sistiam aula com a Madame Pecan do que com o Essa é a saída fornecida pelo SPSSPW para o EN
professor A. Mendoin. Não conseguiam determinar CANTAMENTO:
ANOVA
ENJOYMENT (ENCANTAMENTO)
Sum of Squares Mean Square
(Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Between Groups
(Entre Grupos) 94.4308 2 47.2154 .4893 .6141
Within Groups
13798.1240 143 96.4904
(Dentro dos Grupos)
Total (Total) 13892.5548 145
Descriptives (Descritivas)
Mean (Mèdia)
1.00 62.9063
2.00 61.2041
3.00 62.9091
2. Qual é a conclusão mais apropriada? QuaJ é a c o n c l u s ã o m a i s a d e q u a d a ?

(a) Existem diferenças significativas entre os três (a) E x i s t e m d i f e r e n ç a s s ig n if icativ as e n tre os
grupos de estudantes quanto ao ENCANTA três g r u p o s d e e s t u d a n t e s q u a n t o ao C O N H E
MENTO C I M E N T O ; e s p e c i f i c a m e n t e , o g r u p o do
(b) Existem diferenças importantes entre os três p r o f e s s o r P. D. C a ju a p r e n d e u m a i s d o qu e os
grupos, mas não são significativas o u t r o s do is g r u p o s
(c) Não existem diferenças importantes ou esta (b) E x is t e m d iferen ç as significativas en tre os três
tísticas entre os três grupos g r u p o s q u a n t o ao C O N H E C I M E N T O : e s p e c i
(d) Nenhuma conclusão pode ser obtida fic a m e n te , o g r u p o d a m a d a m e P e c a n a p ren d eu
m ais do q u e o g r u p o d o p r o fe s s o r A. M e n d o i n
3. A seguinte tabela também faz parte da saída do (c) E x is t e m d i f e re n ç a s sig n ificativ as e n tre os três
SPSSPW: grupos quanto ao C O N H E C IM E N T O ; espe
cificam ente, o grupo do professor A. M endoin
Test of Homogeneity of Variances a p r e n d e u m a i s d o q u e o s o u tr o s d o is g r u p o s
(Teste de Homogeneidade das Variâncias) (d) N ã o e x is te m d i f e r e n ç a s sign ificativ as e n t r e os
três g r u p o s q u a n t o ao C O N H E C I M E N T O
Levene Statistic
(Estatística de Levene) df1 (gli) df2 (gl2) Sig. 5. O v a lo r 1 é o r e s u l t a d o da:
1.3343 2 143 0.267
(a) V a r ia n c ia d e n tr o d o s g r u p o s / v a r i â n c i a en tre
Sig. = Significância os grupos
(b) V a r iâ n c ia e n tre os g r u p o s / v a r i â n c i a d e n tr o
d os g r u p o s
O que voeê pode concluir?
(c) V ariân cia en tr e os g r u p o s x v a r i â n c i a d e n tr o
(a) A s v a r i â n c i a s d o s g r u p o s são s i g n if ic a tiv a dos grupos
m e n t e d if e re n te s (d) V a r iâ n c ia en tr e o s g r u p o s v ariân cia d e m r o
(b) As v ariân cias d o s g r u p o s sã o sim i l a r e s dos grupos
(c) A s v a r iâ n c ia s sã o h e t e r o g ê n e a s
6. \ r e l a ç ã o e n tre a es tatís tica F e a t é d a d a por:
(a) r’ = F
4. A q u i e s t ã o os r e s u l t a d o s p a r a o q u e s t io n á r i o s o b r e (b) F2 = t
C O N H E C I M E N T O q u e os e s t u d a n t e s c o m p l e t a (c) t = E
r a m a p ó s a au la d e u m a ho ra. (d) f3 = t
ANOVA
KNOWLEDGE (CONHECIMENTO)
Sum f Squares Mean Square
Between Groups
1 10.3100 2 55 .1 55 0 5.3557 .0057
(Entre grupos)
W ithin Groups
1482 .9 68 9 144 10.2984
(Dentro dos grupos)
Total (Total) 1593.2789 146
Descrlptives (Descritivas) 7. O professor A. M endoin está exam inando a

KNOWLEDGE (CONHECIMENTO)
diferença entre os escores dos três grupos de
Mean (Média) participantes. Se os grupos m ostram hom ogenei
dade das variâncias, quer dizer que as variâncias
dos grupos:
1 A. Mendoin 10.5781 (a) São semelhantes
2 Pecan 10.0408 (b) Não são semelhantes
(c) São exatamente as mesmas
3 Caju 12.3235
(d) São totalmente diferentes
8. Diferenças entre grupos, que resulnm de nossa (a) A ANOVA de um fator

manipulação experimental são denominadas de: (b) O teste t
(a) Diferenças individuais (c) O rd e P e a rs o n
(b) Efeitos dos tratamentos (d) Depende da situação
(c) Erro experimental (e) A ANOVA de medidas repetidas
(d) Efeitos dentre participantes 12. A hipótese de esfericidade significa que:
9. O senhor Nozes está pensando se deve utilizar uní (a) As variâncias de todas as amostras devem ser
delineamento relacionado ou não-relacionado para similares
um de seus estudos. Como já visto, existem van (b) As variâncias dos escores de diferenças po
tagens e desvantagens em ambos. Ele tem quatro pulacionais devem ser os mesmos para dua^
condições. Se em um delineamento relacionado uti condições quaisquer
lizar 10 participantes, quantos precisaria para um (c) As variâncias dos escores de todas as diferen
delineamento não-relacionado? ças populacionais devem ser similares
(d) As variâncias de todas as amostras não devem
(a) 40
ser similares
(b) 20
(c) 10 13. Se. em uma análise de variância, você obtém um
(d) 100 eta parcial de 0.52, quanto das variações nos es
cores da variável dependente pode ser atribuído a
10. Diferenças individuais dentro de cada grupo de variável independente?
participantes são denominadas de:
(a) 9%
(a) Efeitos do tratamento (b) 52%
(b) Erro entre participantes (c) 25%
(c) Erro dentre participantes (d) 27%
(d) V ícios individuais
14. O cálculo de quanto da variância total se deve ao erro
1 1 . 0 Dr. F. D. Caju aloca aleatoriamente cada um dos em uma manipulação experimental é denominado:
96 participantes a cada uma de quatro condições.
(a) Cálculo da variância
Como é muito consciencioso, inspeciona meti
(b) Partição da variância
culosamente os histogramas e outras estatísticas
(c) Produção da variância
descritivas e verifica que os dados estão distri
(d) Resumo da variância
buídos normalmente. Para analisar as diferenças
entres as quatro condições, o teste mais apropriado 15. A seguinte saída está relacionada a um teste pcs:
a ser utilizado é: hoc, após a ANOVA de um fator:
Multiple comparisons (Comparações múltiplas)

Dependent Variable: Current Salary (Variável Dependente: Saléno Corrente)
Tu key HSD (DM5 de Tukey)
Mean Difference 95% Confidence

(l-J) Diferenças Std. Error Interval (Intervalo de
das Médias (l-J) (Erro Padrão) Sig. Confiança de 95%)
(1) Employment (J) Employment
Category Category Lower Upper
(1) Tipo de trabalho (J) Tipo de trabalho (Limite (Inferior)) (Limite (Superior))
Clerical
Custodial (Limpeza) -$3,100.35 $2,023.76 0.276 -$7 ,8 43 .4 4 $1,642.74
(Administrativo)
Manager (Gerência) -$ 3 6 ,1 3 9 .2 6 * $1,228.35 0 .0 0 0 -$3 9,01 8.15 -$3 3,26 0.37
Clerical
Custodial (Limpeza) $3,100.35 $2,023.76 0.276 -$ 1 ,6 4 2 .7 4 $7,843.44
(Administrativo)
Manager (Gerência) -$3 3,03 8.91* $2,244.41 0. 0 0 0 -$ 3 8,29 9.13 -$2 7 ,7 7 8 .6 9
Clerical
$36,139.26* $1,228.35 0. 0 0 0 $33,260.37 $39,018.15
(Administrativo)
Manager (Gerência) Custodial (Limpeza) $33,038.91* $2,244.41 0.000 $27,778.69 $38,299.13
* The mean difference is significant at the .05 level. (* A diferença entre as médias e significativa no nive! de 5%.)
Sig. = Significance
Que grupos diferem significativamente um do outro? Qual é a afirmação mais adequada?

(a) Somente as ocupações administrativas e de A diferença entre as condições é representada por:
limpeza (a): F(2, 12) = 7,82, p = 0,007
(b) Somente de limpeza e de gerência (h) F(l , 6) = 7,82. p = 0.030
(c) Apenas de gerência e administrativas tc) F(2. 12) = 7,82. p = 0.030
(d) Ocupações de gerência e administrativas mais (d) F(l, 6) = 7 ,8 2 .p = 0,031
gerência e limpeza
17, Qual é a resposta mais apropriada? O tamanho do
16. Examine a seguinte saída, que está relacionada efeito é:
com uma ANOVA de medidas repetidas com tres
(a) 5,7%
condições. Suponha que a esfericidade foi violada.
(b) 57%
(c ) 0,57%
íd) 5%
est of W ithin-Subjects Effects (Teste dos Efeitos Dentre Sujeitos)

Veasure: M EASURE1 (Medida: Medida l)
Type III Sum of Mean Squared

Squares (Soma dos (Quadrado
Source (Fonte) Quadrados do Tipo III! df (gl) da Média F Slg. rp Parcial
FACTOR 1 Sphericity Assumed

(Esfericidade assumida) 542.857 2 271,429 7.821 0.007 0.566
Fator 1)
Greenhouse-Geisser 542.857 1.024 529.947 7.821 0.030 0.566
Huynh-Feldt 542.857 1.039 522.395 7.821 0.029 0.566
Lower-bound
(Limite inferior) 542.857 1.000 542.857 7.821 0.031 0.566
Error Sphericity Assumed

416.476 12 34.706
(FACTOR1) (Esfericidade assumida)
Erro - Fator 1) Greenhouse-Geisser 416.476 6.46 67.762
Huynh-Feldt 416.476 6.235 66.796
Lower-bound
(Limite inferior) 416.476 6,000 69.413
i g. = Significância
Âs' questões 18 a 20 estão relacionadas à saída abaixo,

que mostra uma ANOVA de medidas repetidas com irês
níveis. Considere qitt a esfericidade foi violada.
Test of W ithin-Subjects Effects (Teste dos Efeitos dentre Sujeitos)

Measure: M EA SU R E1 (Medida: M edidaJ)
Type III Sum of Mean Squaref

Squares (Soma dos (Quadrado
Source (Fonte) Quadrados doTipo III) df (gl) da Média) F Sig.
COND Sphericity Assumed

(Esfericidade Assumida) 521.238 2 260.619 5.624 0.019
Greenhouse-Geisser 521.238 1.073 485.94 0 5.624 0.051
Huynh-Feldt 521.238 1.118 466.251 5.624 0.049
Lower-Bound
(Limite Inferior) 521.238 1.000 521.238 5.624 0.055
Error Sphericity Assumed

(Esfericidade Assumida) 556.095 12 46.341
(COND)
Greenhouse-Geisser 556.095 6.436 86.406
Huynh-Feldt 556.095 6.708 82.905
Lower-Bound
(Limite Inferior) 556.095 6.000 92.683
Pairwise com parisons (Comparações Pareadas)

Measure: MEASURE_1 (Medida: Medida_l)
95% Confidence Interval

for Difference (Intervalo de
Mean
Confiança de 95% para a Diferença)
Difference I—J)
(Diferenças das Std. Error Lower Bound Upper Bound
(1) COND (J) COND Médias (l-J)) (Erro Padrão) Sig.a (Limite Inferior) (Limite Superior)
1 2 -1 1 .8 5 7 3.738 0.058 - 2 4 .1 4 6 0.431

3 - 3 .4 2 9 1.494 0.184 - 8 .3 3 9 1.482
2 1 11.857 3.738 0.058 -0,431 24.146

3 8.429 4.849 0.339 -7 .5 1 4 24.371
3 1 3.429 1.494 0.184 - 1 .482 8.339

2 -8 .4 2 9 4.84 9 0.399 -24.371 7.514
Based on estimated marginal means (Baseado em estimativas das médias marginais)

a. Adjustment for multiple comparisons: Bonferroni (a. Ajustamento para comparações múltiplas: Bonferroni.)
18. Qual é a sentença mais adequada? 20. Considerando que a hipótese nula seja verdadeira.
(a) F(2, 12) = 5.62, p =0,020 a diferença entre as condições 1 e 2 tem:
(b) F( 1.6) = 5,62, p =0,050 (a) 5% de chance de surgir como conseqüência
(c) F(2, 12) = 5,62, p =0,049 do erro amostrai
(d) F( 1,6) = 5,62, p =0,055 (b) 6% de chance de surgir conio conseqüência
do erro amostrai
19. Qual das seguintes condições mostra a maior dife
(c) 19% de chance de surgir corno conseqüência
rença?
do erro amostrai
(a) 1 e 2 (d) 20% de chance de surgir como conseqüênc:_
(b) 2 e 3 do erro amostrai
(c) I e 4
(d) São idênticas
Referências
HOWELL, D. C. Statistical Methods fo r Psychology. Boston: PWS-Kent, 2002. 5"' edn.

KEBBELL, M. R.. WAGSTAI F, G. F , COVEY. .1. A.. The influence o f item difficulty on the
relationship between eyewitness confidence and accuracy. British Journal o f Psychology, v. 87. p.
653-63, 1996.
PARROT A. C. at al. Cognitive performance in recreational users of MDMA or "ecstasy” : evidence
for memory deficits. Journal o f Psychopharmacology, v. 12, n. I, p. 79-83, 1998.
SULLIVAN, G. et al. Eating attitudes and the Irritable Bowel Syndrome. G eneral Hospital P sychiatn.
v. 19, p. 62-4, 1997.
* Análise de Variância com
*" Mais de uma Variável Independente
No C a p ítu lo 9 , in tro d u zim o s u m dos te stes e sta tístic o s m ais u tiliz a d o s na p sico lo g ia a tu a l
m e n te , a a n á lise de va riâ n c ia (A N O V A ). N este ca p ítu lo p re te n d e m o s:
■ E n sin a r u m a e xte n sã o da A N O V A , u m a c la ss ific a ç ã o q u e inclui d u a s ou m ais variáveis

in d e p e n d e n te s
- a p rim e ira A N O V A terá d u a s va riá ve is in d e p e n d e n te s e n tre p a rticip a n te s
- a se g u n d a A N O V A terá d u as va riá ve is in d e p e n d e n te s d e n tre p a rticip a n te s
- a te rceira terá u m a variável in d e p e n d e n te e n tre e um a d e n tre p a rticip a n te s
■ Explicar, com to d o s os d e lin e a m e n to s, c o m o a v a riâ n c ia é a lo ca d a e n tre as várias c o n d i
çõ es e co m o p o d em o s ava lia r o grau de in te ra çã o e n tre as variáveis in d e p e n d e n te s
Ilu stra r co m o p o d e m o s d e co m p o r os efeito s de in te ra çã o p ara e n c o n tra r p re c isa m e n te
c o m o u m a variável in d e p e n d e n te in te ra g e com a o u tra - tal a n á lise é d e n o m in a d a efeito
sim p les
10.1 Introdução
N o C a p ítu lo 9 . e x p lic a m o s c o m o p o d e m o s u tiliza r a A N O V A para testar d ife r e n ç a s entre

g ru p os q u an d o le m o s m ais d o qu e du as c o n d iç õ e s d e variável in d ep en d e n te. U m d o s a sp e c to s
m ais ú te is da A N O V A é perm itir a n alisar o s e fe ito s d e du as ou m a is v a r iá v e is in d ep en d e n tes
sob re u m a variável d ep e n d en te (V D ) e m um a a n á lise. A lé m d iss o , p o d e m o s u tiliz a r a A N O V A
para verificai' se e x is te um e fe ito d e in teração das du as va riá v eis na variável d e p e n d en te, isto
é , s e u m a v a r iá v e l in d ep en d e n te p o d e c o m p o r ta r -se d e form a d ife r e n te nas d u as c o n d iç õ e s
da se g u n d a v a riá v el in d e p e n d e n te . D e v e -s e notar q u e a A N O V A não e stá restrita a ap en as
du as v a r iá v e is in d ep en d e n tes. V ocê p o d e, se desejar, ter três ou m a is v a r iá v e is in d ep en d e n tes.
E n tretan to, q u a n to m a is v a r iá v e is in d e p e n d e n te s , m a is d ifíc il s e torna interpretar q u alq u er
e f e it o de in terativid ad e q u e p o ssa e x is tir entre e la s. U m a v e z d e m o n stra d o c o m o interpretar
in te ra ç õ es, v o c ê p erceb erá o q u ão d ifíc il é fa z ê -lo se h ou ver m u itas va riá v eis in d ep en d e n tes.
U m e x e m p lo sim p le s d e v e ilustrar o q u e a A N O V A fa torial o fe r e c e . S u p o n h a qu e c o n
d u z im o s um e stu d o para in v e stig a r o e fe ito do á lc o o l e da c a fe ín a na h a b ilid a d e de dirigir.
P o d e m o s fa zer várias p r e v is õ e s para e s s e ex p erim en to :
1. A lto s n ív e is de á lc o o l d im in u em a c a p a c id a d e de dirigir.
2. A lto s n ív e is de c a fe ín a p o d em m elh orar a h a b ilid a d e de d irigir d e v id o ao e fe ito e s

tim u lan te.
3. Dada a antiga premissa de que o café auxilia a mantermo-nos alertas, podemos pre
ver que um aumento de cafeína reduz a influência do álcool na habilidade de dirigir.
As duas primeiras previsões são denominadas de efeitos principais. Referem-se ac
efeito global de cada uma das variáveis independentes sobre a variável dependente: o
efeito total do álcool na habilidade de dirigir, não importando a quantidade de cafeína
ingerida, e o efeito total da cafeína na habilidade de dirigir, a despeito da quantidade de
álcool consumida. A terceira hipótese, que prevê uma relação entre álcool e cafeína que
pode alterar a habilidade de dirigir, é denominada de interação entre as duas variáveis
independentes. Assim, temos três previsões nesse estudo, e a ANOVA permite testar toda^
em uma única análise.
10.2 Fontes de variação
Como o nome do teste sugere, utilizamos a ANOVA para analisar todas as possívei-
fontes de variação no estudo. Quando mensuramos os participantes em alguma variá\e.
dependente, temos variações nos escores. Algumas dessas variações são atribuídas à va
riável independente; algumas, ao efeito de interação entre as variáveis independentes.
algumas outras, em conseqüência de erros. O propósito da ANOVA é tentar identificar
quanto da variação total nos escores pode ser atribuída a cada um desses fatores (ve _
Figura 10.1). A Figura 10.1 mostra que, quando temos duas variáveis independentes. _
variação na variável dependente pode ser atribuída às duas variáveis separadamente e _
interação entre elas. Qualquer variação não-atribuída a um desses fatores é denominada d;
variação devida ao erro.
No Capítulo 9, explicamos que a ANOVA de um fator mostra o grau pelo qual a varia
ção entre condições é maior do que a variação dentre ou dentro das condições. Explicam-
que, se a variação entre condições for consideravelmente maior do que a variação dentro d_-
condições, conclui-se que as diferenças entre grupos não se deve ao erro amostrai. Sugerim>
que, em tal situação, a diferença entre grupos pode provavelmente ser atribuída à manipuL-
ção da variável independente. A lógica de analisar mais de uma variável e semelhante à c .
ANOVA de um fator. Essencialmente, dividimos (ou particionamos) a variância total n_
representadas pelas duas variáveis em separado e na interação entre elas. Então, comparam
essas fontes de variância com as da variância dentre (dentro) as condições (ou erro). Es',
análises permitem verificar a possibilidade de que um efeito em particular tenha ocorric
apenas devido ao erro amostrai.
Interação
VI2
Figura 10.1 D ia g ra m a de pizza so b re as fo n te s de v a ria ç ã o na variável d e p e n d e n te p ara um estude

co m d u a s variáveis in d e p e n d e n te s.
Sugerimos anteriormente que a ANOVA permite analisar mais do que duas variáveis in
dependentes em uma única análise. Na Figura 10.2, você pode verificar como seria dividida
a variação se tivéssemos três variáveis independentes. Fica aparente, a partir deste diagrama,
que existem bem mais fontes de variação a se identificar. De fato, com a adição de uma única
variável independente dobramos o número de fontes de variação que precisamos analisar.
Assim, a complexidade da análise cresce dramaticamente quando incluímos mais variáveis
independentes (compare as Figuras ÍO.I e 10.2 com o diagrama de pizza da Seção 9.2.3).
Em tais delineamentos, torna-se muito mais difícil interpretar as interações entre todas as va
riáveis independentes. Assim, para aqueles que estão pensando em realizar um experimento
sobre os efeitos de idade, gênero, classe social, ansiedade e inteligência na habilidade de
praticar rapei e analisar os dados utilizando uma ANOVA. é melhor repensar a idéia. Tal aná
lise é complicada e seria muito difícil de interpretar. Existem formas melhores de se analisar
tais dados, por exemplo por meio de regressão múltipla (veja Capítulo l ]). embora existam
problemas mesmo fazendo isso.
Devemos ressaltar que a partição da variância ilustrada nas Figuras 10 .1 e 10.2 representa
o caso de um delineamento entre participantes apenas. Quando tivermos qualquer variável
independente dentre participantes na análise, as coisas ficam um pouco mais complicadas.
Falaremos desse delineamento mais adiante neste capítulo.
Erro VI1
Interação 1 e 2
VI3
Figura 10.2
Diagrama de pizza sobre as várias fontes de variação na variável dependente para um
estudo com três variáveis independentes.
Atividade 10.1
Veja se você pode descobrir as várias fontes de variância quando tiver quatro variáveis
independentes (variáveis A, B, C e D).
10.3 Delineamentos apropriados para uma ANOVA fatorial
Existem vários delineamentos apropriados para uma ANOVA fatorial. A característica

principal de tais projetos é apresentarem apenas uma variável dependente e duas ou mais va
riáveis independentes. Neste capítulo explicaremos as características de três tipos de ANOVA
fatorial:
■ Duas variáveis independentes entre participantes

■ Duas variáveis independentes dentre participantes
■ Duas variáveis independentes entre participantes e uma variável independente dentre
participante
Todas as análises descritas neste capítulo têm variáveis independentes com duas condi
ções. Por exemplo, no estudo de álcool com cafeína mencionado anteriormente, podemos ter
duas condições de álcool (sem álcool e alto nível de álcool) e duas condições de cafeína (sem
cafeína e com alto nível de cafeína). Se esse estudo for um delineamento completo entre
participantes, a alocação dos participantes às condições será algo semelhante ao ilustrado
na Tabela 10.1.
Tabela 10.1 Alocação de participantes às condiçoes em um projeto entre participantes
Sem álcool Com álcool
Sem cafeína PI P4
P2 P5
P3 P6
Com cafeína P7 PIO

PP. P ll
P9 P 12
Podemos conduzir esse mesmo estudo por meio de um delineamento totalmente dentre
participantes. Em tal estudo, cada participante deverá tomar parte em todas as quatro condi
ções (veja Tabela 10.2).
Tabela 10.2 Alocação de participantes às condições em um projeto entre participantes
Sem calcina PI PI
P? P2
P3 P3
Com cafeína PI Hl
P2 P2
P3 P3
finalmente, podemos ter uma variável independente, digamos o álcool, como a variável
entre participantes e a outra, cafeína, como a variável dentre participante. A alocação dos
participantes às condições cm tal estudo é ilustrada na Tabela 10.3.
Tabela 10.3 A locação do participantes às condições em um projeto entre participantes (com álcool
sem álcool) e uni dentre participantes (com cafeína/sem cafeína)
Sem álcool Com álcoc
Sem cafeína PI P4
P2 P5
P3 P6
Com cafeína PI P4
P2 P5
P3 P6
10.4 Terminologia da ANOVA
Seguindo a literatura, vemos os projetos da ANOVA expressos como uma ANOVA 2 x 2

ou uma ANOVA 3 x 4 ou talvez uma ANOVA 3 x 2 x 2 .
Tal terminologia simplesmente informa quantas variáveis independentes foram usadas e
quantas condições existem em cada uma.
■ No primeiro exemplo, existem d u as variáveis in d ep en d e n tes, cada uma com duas
condições.
■ No segundo exemplo, existem duas variáveis independentes, uma com três condições
e a outra com quatro.
■ No último exemplo, existem três variáveis independentes, uma com três condições e
duas com duas condições.
Duas Vis, cada uma com duas condições
\ \
2 x 2 ANOVA
_ Duas Vis, um? com três
. i x 4 AINUVA e 0Ufra com q Uatro condições
3 x 2 x 2 ANOVA
\ \ ' ' ' \

Três Vis, duas com duas e uma com três condições
Como você descreveria a seguinte análise: uma ANOVA 4 x 4 x 2 x 2 x 2 x 5 x 6 ? A

resposta oficial para a questão é que temos sete variáveis independentes, uma com seis con
dições, uma com cinco condições, duas com quatro condições e três com duas condições.
Entretanto, descreveríamos tal análise como uma loucura porque seria extremamente difí
cil interpretar uma interação entre todas essas variáveis independentes. Lembre, explicamos
que o aumento do número de variáveis independentes aumenta dramaticamente o número de
fontes de variação no projeto. É talvez por essa razão que raramente nos deparamos com um
trabalho publicado no qual mais do que três variáveis independentes foram analisadas por
meio de uma ANOVA.
Devemos notar, ainda, que, com muitas variáveis independentes em uma ANOVA, testa
mos muitos efeitos diferentes contra muitas hipóteses nulas diferentes. Assim, devemos ter
em mente a grande probabilidade de cometer um erro do Tipo I. Um exemplo pode ajudar a
entender isso. Suponha que você conduziu um estudo com quatro variáveis independentes (A.
B. C e D). Se executou uma ANOVA com esses dados, testou 15 efeitos diferentes contra as
respectivas hipóteses nulas (efeitos principais de A, B, C e D mais 11 interações entre essas
variáveis independentes). Fazendo isso, você aumentou drasticamente a taxa de erro de con
junto. ampliando, assim, a probabilidade de se cometer o erro do Tipo I. Devemos, portanto,
apelar para o bom-senso quando decidimos analisar dados de pesquisas complicadas.
Atividade 10.2
Descreva as se g u in te s análises
(a) Uma ANOVA 6 x 2

(b) Um a ANOVA 3 x 3 x 3
(c) Um a ANOVA 4 x 2 x 4 x 2
(d) Uma ANOVA 2 x 2 x 2 x 2 x 2
10.5 Duas variáveis independentes entre participantes
Vamos voltar ao experimento já delineado anteriormente envolvendo níveis de álcool e

cafeína quanto à habilidade de dirigir. Álguns dados artificiais do experimento são apresen
tados na Tabela 10.4.
10.5.1 Análise inicial
Como foi feito com a ANOVA de um fator, é preciso rodar alguns procedimentos de
análise exploratória de dados para verificar se as hipóteses da ANOVA estão satisfeitas. Al
gumas análises estatísticas iniciais (média, desvio padrão e intervalos de confiança de 95%)
são apresentadas nos dados da Tabela 10.4. Podemos ver, a partir dessas análises, que existem
poucos erros de direção na condição sem álcool e sem cafeína (média = 5,75) e muitos erros
na condição com álcool e sem cafeína (média = 21,25). As médias para as condições sem
álcool e sem cafeína e com álcool e com cafeína estão entre esses dois extremos (médias de
7.92 e 9,00, respectivamente). Podemos ver também que os desvios padrões para todas as
condições são bem semelhantes e estar razoavelmente confiantes de que a hipótese de homo
geneidade da variância não foi violada com esses dados.
O próximo estágio da nossa análise exploratória de dados deve envolver a obtenção de
algumas representações gráficas a fim de determinar se os dados estão ou não normalmente
distribuídos. Podemos verificar isso por meio de histogramas, diagramas de caule e folhas e
diagramas de dispersão. Vamos considerar que geramos esses diagramas e estamos satisfeitos
com a inexistência de violações das hipóteses relacionadas ao uso de testes paramétricos
(lembre: a ANOVA é um teste desse tipo). Assim, podemos continuar a análise dos dados
utilizando a ANOVA.
Tabela 10.4 Número de erros com etidos ao dirigir por cada participante em quatro situações (sem
álcool e sem cafeína, com álcool e sem cafeína, sem álcool e com cafeína, e. com álcool e com cafeína)
Sem cafeína 4 2 28 19
9 II 22 16
10 11 21 25
8 10 27 17
6 3 21 19
11 10 20 20
X = 7.92 '; DP = 3,32X = 2 1,25; DP = 3.72
IC de 95%: 5.81 - 10.02 IC de 95%: 18,89 - 23.61
Com cafeína 8 6 5 11
4 3 6 8
9 0 14 10
0 S 8 II
8 9 14 8
6 8 5 8
X = 5,75; DP = 3,28 X = 9,00; DP = 3,07
IC de 95%: 3.67 -7.82 IC de 95%: 7.05- 10,95
X = média
Atividade 10.3
C o m re fe rê n cia à Tabela 1 0 .4 , fo rn e ç a a su a in te rp re ta ç ã o d o s in te rv alo s de c o n fia n ç a
10.5.2 Fontes de variação

Como isolamos as fontes de variação quando existe um delineamento completamente
entre grupos? Se você olhar para as predições, poderá ver que já identificamos três possíveis
fontes de variação:
1. O efeito principal devido ao álcool
2. O efeito principal devido à cafeína
3. A interação entre esses dois fatores
Existem outras fontes de variação? Se você pensar no Capítulo 9, deve lembrar que, para
o delineamento de um fator entre participantes, existiam duas fontes de variação: entre os
grupos e dentro dos grupos (ou erro). Isto é, temos uma variação dev ido ao fator entre os gru
pos e outra devida às diferenças entre os participantes dentro de cada condição. Nos projetos
de duas variáveis independentes, devemos ainda levar em consideração as variâncias entre os
participantes e dentro de cada condição. Conseqüentemente, corno no projeto de um fator,
temos uma fonte de variação adiciona! relacionada com a variação dentro dos grupos ou erro.
Nesse caso, temos as seguintes fontes de variação:
■ Variação devido ao efeito do álcool na habilidade de dirigir (efeitoprincipal doálcool)
■ Variação devido ao efeito da cafeína nahabilidade de dirigir(efeito principal da ca
feína)
■ Variação devido à interação entre esses dois fatores

■ Variação devido à diferença entre os participantes dentro de cada condição (variação
do erro)
Quando você executa uma ANOVA apenas entre grupos. obte'm uina saída do SPSSPW
semelhante à expressa a seguir para os dados de álcool e cafeína.
Se observar esses resultados, notará que temos a mesma informação ao lado de cada en
trada. como a ANOVA apresentada no Capítulo 9. Para cada fonte de variância, temos a soma
dos quadrados, o grau de liberdade (gl). os quadrados médios, o valor F e o valor p (signifi-
cância do resultado). Você deve lembrar que. para calcular o valor F, dividimos os quadrados
médios de cada variância relacionada às variáveis independentes pelo quadrado médio do
erro. Lembre que, no Capítulo 9, explicamos que o quadrado medio é simplesmente uma me
dida da variância. Assim, nessa análise você pode notar que, para o efeito principal do álcool
quando dividimos o quadrado médio (825,02) pelo termo erro (1.26), obtemos a estatística
F. que vale, neste caso, 73,27. Você pode, ainda, ver que o efeito principal da cafeína tem um
valor F associado de 58,38 (623,52 + 1 1,26) e para a interação existe um valor F associado de
27,09 (305,02-r 11,26)
ANÁLISE DE VARIÂNCIA UNIVARIADA
Between-Subjects Factors (Fator entre Sujeitos)
Value Label
(Legenda) N
alcohol 1.00 No alcohol 24
(álcool) (Sem álcool)
2.00 Alcohol 24
(Com álcool)
caffeine 1.00 No caffeine 24
(cafeína) (Sem cafeína)
2.00 Caffeine 24
(Com cafeína)
Tests of Between-Subjects Effects (Testes dos Efeitos entre Sujeitos)

Dependent Variable: Driving Errors (Variável Dependente: Erros ao Dirigir)
Type III Sum of Squares Mean Square

(Soma dos Quadrado df (Quadrados Partial r)2
Source (Fonte) do Tipo III) (gl) Médios) F Sig. (<12 parcial)
Corrected Model
1753.562a 3 584.521 51.914 000 .780
(Modelo Corrigido)
Intercept (Intercepto) 5786.021 1 5786.021 513.880 .000 921
alcohol (álcool) 825.021 1 825.021 73.274 .000 .625
caffeine (cafeína) 623.521 1 623.521 55.377 .000 .557
alcohol*caffeine 305.021 1 305.021 27.090 .000 .381
(álcool*cafema)
Error (Erro) 495.417 44 11.259
Total 8035.000 48
Corrected Total 2248.979 47
(Total Corrigido)
a. R Squared = .780 (Adjusted R Squared = .765) (R2 = 0,780 [R2 ajustado = 0,765))
* The row that includes the asterisk is for the interaction. (* A linha que inclui o asterisco é de interação.)
Sig. Significancia
Você pode perceber a partir das tabelas de saída, que temos uma probabilidade de 0 .0 0 0
associadas aos eleitos principais tanto do álcool quanto da cafeína e tambe'm com a interação
(lembre que um valor p = 0 ,0 0 0 no SPSSPW significa que p < 0 , 0 0 1 ). Isso nos informa que, se
a hipótese nula fosse verdadeira, seria altamente improvável se obterem os efeitos principais e
a interaçao observaria. (> que isso tudo significa? E sempre uma boa idéia tentar entender o que
aconteceu nesse projeto experimental complexo ilustrando as médias graficamente. Com base
nas recomendações de I.oftus (1 9 9 6 ), geramos um diagrama de barras de erro para os dados
desse exemplo, apresentado na Figura 10.3. Você deve perceber que o SPSSPW não apresenta
linhas sólidas para ligar os pares de médias. Fomos nós que as incluímos como ajuda para um
melhor entendimento da natureza da interação entre as duas variáveis independentes.
A linha supenor na Figura 10.3 representa a habilidade de dirigir sem cafeína, e a de baixo,
com cafeína. Podemos imediatamente perceber, a partir desse gráfico, que o efeito principal
devido à cafeína parece indicar que a habilidade de dirigir é melhor quando tomamos uma dose
de cafeína (lembre-se de que esses dados são inventados, não tente fazer isso em casa). Exis
tem mais eixos de direção na condição sem cafeína (linha superior) do que na condição com
cafeína (linha inferior). Os pontos nos finais à direita nas duas linhas representam a condição
com álcool, e os dois à esquerda, a condição sem álcool. Podemos ver aqui, embora isso não
seja tão óbvio (desenhamos gráficos com linhas para que isso se tome mais óbvio, veja Figura
10.4), que existem mais erros ao dirigir quando existe a ingestão de álcool do que o contrário.
Talvez a melhor maneira de visualizar os efeitos principais quando existe um número igual de
participantes em cada grupo seja marcar um ponto no meio de cada linha para o efeito principal
da cafeína (veja Figura 10.4). A diferença vertical entre esses dois pontos representa a diferença
real entre as médias das condições com cafeína e sem cafeína, ignorando a variável indepen
dente álcool. Isso representa o efeito principal da variável independente cafeína. Para a variável
independente álcool, você deve marcar um ponto no meio dos dois finais das linhas à direita
e o mesmo para as linhas à esquerda. A diferença vertical entre esses dois pontos representa a
diferença real entre as condições com consumo de álcool e sem consumo de álcool, ignorando
a variável independente cafeína. Isso representa o efeito principal da variável independente
Cafeína
5 Sem cafeína
Com cafeína
Álcool
Figura 10.3
Diagrama de barras de erro para as condições com álcool/sem álcool e com cafeína/sem
cafeína.
G rá fic o de linha so b re o p rin cip al efeito e n tre c a fe ín a e á lc o o l.

Figura 10.4
álcool. Lembre-se de que você pode utilizar essa técnica visual simples somente quando tiver
amostras do mesmo tamanho. Se houver um número diferente de participantes em cada grupo,
terá que calcular as médias dos efeitos principais e representá-las no gráfico.
Como interpretamos a interação? Se você tem uma interação significativa, poderá à prin
cípio interpretá-la graficamente. A Figura 10.5 mostra que a diferença entre as duas condiçõe^
da cafeína sem álcool é muito menor do que a com álcool. Parece que a cafeína exerce utr
grande efeito moderado na condição com álcool. A interpretação alternativa indica que, quan
do não existe cafeína (observe a diferença vertical entre os dois finais direitos das linhas), c
álcool exerce um efeito prejudicial bem maior na habilidade de dirigir do que quando existe
cafeína (diferença entre os finais esquerdos das duas linhas). Essas são duas formas válida'
de se interpretar os dados e constatar essencialmente a mesma coisa.
30 n----------------------------------------------------------------------------------
Diferença entre as
Diferença entre as
° 20
duas condições
de cafeína
com álcool
10 -
♦ Sem cafeína
Com cafeína
G rá fic o de linha so b re a in te ra çã o e n tre as variáveis in d e p e n d e n te s c a fe ín a e álco o l.

Figura 10.5
10.5.3 Interações entre variáveis
Uma das regras de ouro da ANOVA é que, uma vez encontrada uma interação significati
va, você deve seguir adiante para explorá-la em maior profundidade. O que significa ter uma
interação entre duas variáveis? Se há duas variáveis e cada uma apresenta duas condições,
uma interação ocorre quando uma variável se comporta de forma diferente em cada condição
da outra variável. Por exemplo, sugerimos anteriormente que a cafeína tinha um efeito nas
duas condições de álcool. Entretanto, a cafeína apresenta um efeito bem maior quando existe
álcool no organismo do que quando não existe. Um exemplo da literatura é o achado de que
pessoas altamente ansiosas tendem a dirigir a atenção a estímulos negativos do ambiente,
enquanto as pessoas não-ansiosas prestam menos atenção a esses estímulos (Mogg e Bradley,
1999). Aqui existe uma interação entre as variáveis ansiedade e atenção. Uma forma conve
niente de verificar se existe interação entre duas variáveis é gerar gráficos de linhas. Observe
as ilustrações da Figura 10.6.
A Figura 10.6 mostra que, quando não existe interação entre duas variáveis, as linhas
que representam a variável cafeína são paralelas. Quando observarmos tais linhas paralelas,
podemos estar seguros de que não existe interação entre duas variáveis. O que as linhas para
lelas indicam? Se você comparar as condições com e sem álcool nos três exemplos dados na
Figura 10.6, deverá constatar que há mais erros ao volante quando os motoristas não tomaram
cafeína do que quando tomaram. Há os mesmos padrões de resultados nas duas condições de
álcool, mas tomar cafeína resulta em menos erros ao volante.
Número médio de erros ao volante
♦ Sem cafeína
Com cafeína
(a) (b) (c)
Figura 10.6 Gráfico da falta de interação entre variáveis.
Como uma interação aparece no formato de gráfico? Dê uma olhada nos gráficos da
Figura 10.7.
Os gráficos na Figura 10.7 ilustram os vários padrões de linhas que sugerem a existência
de interação. A principal característica a ser notada em cada gráfico da Figura 10.7 é que as
duas linhas não são paralelas. Observando cada um dos gráficos, podemos ver que existem
diferentes padrões em cada uma das condições de álcool. No gráfico (a), podemos notar
que, na condição sem álcool, existem mais erros ao volante com cafeína do que sem ela. Na
condição com álcool, entretanto, encontramos um padrão inverso: mais erros sem cafeína.
No gráfico (b). não se observam diferenças reais entre as condições com e sem cafeína na
condição sem álcool, enquanto na condição com álcool a cafeína aumenta o número de erros
ao volante. O gráfico (c) montra o oposto do (b), isto é, não existem diferenças na condição
com álcool, e a cafeína aumenta os erros na condição sem álcool. Observando o gráfico (d),
pode-se ver que nas duas condições, com e sem álcool, tomar cafeína aumenta o número
de erros. Entretanto, o gráfico mostra que existe um impacto maior da cafeína nos erros ao
volante na condição com álcool. O gráfico (e) mostra o efeito oposto, um grande impacto da
cafeína na condição sem álcool.
Nùm ero m èdio de erros ao volante
(a) (b) (c) ♦ Sem cafeína

Com cafeína
(d) (e)
G rá fic o d o s p a d rõ e s d e lin h a s d e in te ra çã o .
Figura 10.7
Você d e v e ter em mente que não é possível, apenas p e lo exame d o s gráficos, constatar
se a interação é ou não significativa entre as variáveis independentes. Os gráficos de linhas
fornecem um indicativo da interação. Para saber se ela existe, é necessário consultar a tabela
da ANOVA. Assim, os gráficos devem ser utilizados em associação com a tabela da ANOVA
para entender os padrões encontrados.
10.5.4 Interpretação do efeito principal quando existem interações significativas

Você deve ser cuidadoso ao interpretar os efeitos principais quando houver interações
significativas. Os efeitos devem ser interpretados somente se fizerem sentido ou forem in
teressantes no contexto da pesquisa sendo conduzida. Se não tiverem sentido ou não forem
interessantes, será melhor se concentrar na interação. Existem dificuldades para os pesquisa
dores na interpretação de efeitos principais significativos na presença de interações também
significativas. Por exemplo, o gráfico na Figura 10.7 (b) sugere que não existe um efeito da
cafeína na condição se m álcool. Na condição c o m álcool, entretanto, a cafeína tem um efeito
prejudicial sobre a habilidade de dirigir. Não existe um efeito evidente da cafeína em todas
as condições. Assim, v o c ê deve ser cauteloso ao interpretar o efeito principal. Para que exis
tisse u m efeito global da cafeína, ela deveria exercer influência na habilidade de dirigir nas
duas condições de álcool. O gráfico deveria ser mais parecido com o da Figura 10.7 (d). Se
simplesmente confiássemos na saída do SPSSPW, concluiríamos que existe um efeito global
das duas variáveis independentes, quando, de fato, se a Figura 10.7 (b) fosse a verdadeira, não
o teríamos. Assim, é importante examinar as ilu str a çõ e s gráficas dos resultados bem como a
saída do SPSSPW. Citando Howell (2002):
Um dos pom os a enfati armos nas discussões dos efeitos simples é que o pesquisador deve
exam inar os setts dados cuidadosamente. Plotcir os dados e analisar o significado é importante,
talvez a parte mais importante de uma análise apropriada de qualquer conjunto de dados.
Atividade 10.4
Q ual d o s se g u in te s g ráfico s su gere um a in te ra çã o e q u al não?
Núm ero m édio de erros ao volante
(a) (b) (c)
10.5.5 Efeitos simples
Os vários cenários demonstrados destacam a importância de ilustrar graficamente os

dados como auxílio para se entender o que está acontecendo com os efeitos principais e
as interações. Se você obteve uma interação significativa, precisa descobrir o que real
mente está acontecendo em cada uma das suas condições. Pode-se fazer isso pela análise
dos efeitos simples (algumas vezes denominados de efeitos principais simples). Um efeito
simples é a diferença entre duas condições quaisquer de uma variável independente em
uma condição da outra variável independente. Assim, devemos analisar a diferença entre
as condições com e sem cafeína na condição sem álcool. Isso seria a análise de um efeito
simples. Normalmente, já teremos feito uma previsão sobre como essas células irão se
comportar e podemos utilizar essas previsões como guia para saber que análises de efeitos
simples devemos executar. A análise dos efeitos simples é equivalente a testes f, mas envol
ve o cálculo dos valores I . Você pode utilizar o SPSSPW para calculá-los. Entretanto, para
explicarmos como fazer isso, é preciso falar sobre a linguagem do SPSSPW.1Tal tarefa está
além dos objetivos deste texto, assim, recomendamos que simplesmente use o SPSSPW a
fim de calcu'ar os testes t para os efeitos simples desejados. Para os dados apresentados na
Tabela 10.4 (a análise inicial entre participantes que apresentamos neste capítulo), os testes
t para os efeitos simples são como os seguintes:
Você pode utilizar o m étodo recom endado por Howell (2002). Isso envolve rodar ANOVAs de um fator separadas para cada efeito
sim ples e recalcular os valores F utilizando o erro quadrado m édio da análise original no lugar dos calculados para os efeitos sim
ples. Veja H owell (2002) para detalhes de com o proceder.
TESTE T
GRUPO DO ÁLCOOL = SEM ÁLCOOL
Group Statistics1(Estatísticas dos Grupos )
Caffeine Std. Deviation Std. Error Mean

(Com cafeína) N Mean (Média) (Desvio Padrão) (Erro Padrão da Média)
Driving errors No caffeine 12 7.9167 3.31548 0.95710
(Erros ao dmgir (Sem cafeína)
Caffeine 12 5.7500 3.27872 0.94648
(Com cafeína)
a. alcgroup = No alcohol (álcool = Sem álcool)
Independent Samples Test' (Teste para Amostras independentes")
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test for Equality of Means
de Variâncias) (Teste t para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95=:
Sig. Mean Std. Error
para a Diferença)
(2-tailed) Difference Difference
Df (Sig. (Diferença (Erro Padrão Lower Uppe'
F Sig. t (gi) Bilateral) das Médias) da Diferença) (Inferior) (Supenot
Driving Equal variances 0.027 0 872 1.610 22 0.122 2.16667 1.34606 -0.62488 4.958
errors assumed (igualdade
(Erros ao de variâncias assumida)
volante) Equa| varjances not 1.610 21.997 0.122 2.16667 1.34606 -0.62490 4.95S
assumed (Igualdade
d e variâncias não-
assum ida)
(G rupo d o álcool = Sem álcool)

A saída acima fornece o teste do primeiro efeito simples. Testa a diferença entre a>
condições com cafeína e sem cafeína somente na condição sem álcool. As médias que esta
comparando são indicadas na Figura 10.8 (a) pela seta. O teste t nos diz que a diferença entre
as condições com cafeína e sem cafeína na situação sem álcool tem um valor t associado de
t(22) - 1,61, p = 0 ,12, que é não-significativo.
A segunda análise de um efeito simples é apresentada a seguir:
GRUPO DO ÁLCOOL = ÁLCOOL
Group Statistics" (Estatísticas dos Grupos")
Caffeine Std. Deviation Std. Error Mean

(Com cafeína) N Mean (Média) (Desvio Padrão) (Erro Padrão da Média)
Driving errors No caffeine 12 21.2500 3.72 03 4 1.07397
(Erros ao volante) (Sem cafeína)
Caffeine 12 9.0000 3.07482 0.88763
(Com cafeina)
a. alcgroup alcohol (álcool C om álcool)

'dependent Samples Test (Teste para Amostras Independentes3)
Levene's Test
for Equality of
Variances
(Teste de Levene
de Variâncias) (Teste f para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95%
para a Diferença)
Df (Sig (Diferença (Erro Padrão Lower Upper
F Sig. t (gl) Bilaterali das Médias) da Diferença) (Inferior) (Superior)
Driving Equal variances 0.173 0.682 8.792 22 0.000 12.25000 1.39330 9.360 15.140
; rrors assumed (Igualdade
E'ros ao de variâncias assumida)
jiante) Equa| variances not 8.792 21.25 0.000 12.25000 1.39330 9.355 15.145
assumed (Igualdade
de variâncias não-
assumida)
jpo do álcool = Com álcool)

. - Significancia
Sem álcool Com álcool Sem álcool Com álcool

ALCGROUP ALCGROUP
(a) (b)
Sem álcool Com álcool Sem álcool Com álcool

ALCGROUP ALCGROUP
(c) (d)
G rá fic o d e b a rra s de erro do te ste de vá rio s efeito s sim p les.

Figura 10.8
Esse teste t nos mostra que, na condição com álcool, existe uma diferença significativa
entre duas condições da cafeína. Os detalhes relevantes são t(22) = 8,79, p < 0,001. Essa
análise é ilustrada na Figura 10.8 (b). Colocamos que o valorp é menor do que 0,001 porque
o SPSSPW mostrou um valor p de 0,000. Isso significa que o valor p real é menor do que
0,001, mas o SPSSPW não consegue mostrar. Assim, não podemos apresentar p exato como
o aconselhamos a fazer nos relatos dos resultados. Quando isso acontecer nas suas análises,
relate o valor p como fizemos antes.
O teste da diferença entre as duas condições alcoólicas na presença ou não de cafeína
é apresentado somente na saída a seguir. Esse teste t examina as duas médias ilustradas n^
Figura 10.8 (c).
TESTE T
CONDIÇÀO CAFEÍNA = SEM CAFEÍNA
Group Statistics4 (Estatísticas dos Grupos'1)
Alcohol Std. Deviation Std. Error Mean

(Com álcool) N Mean (Média) (Desvio Padrão) (Erro Padrão da Média)
Driving errors No alcohol 12 7.9167 3.31548 0.95710
(Erros ao volante) (Sem álcool)
Alcohol 12 21.2500 3.72034 1.07397
(Com álcool)
a. alcgroup - No alcohol (a. cafeína ■

=Sem cafeína)
Independent Samples Test1’ (Teste para Amostras Independentes3)
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test tor Equality of Means
de Variâncias) (Teste f para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95:
para a Diferença)
Df (Sig. (Diferença (Erro Padrão Lower Uppe-
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superic-
Driving Equal variances 0.005 0.945 -9 .2 6 9 22 0.000 -13.3333 1.43856 -16.317 -10.350
errors assumed (igualdade
(Erros ao de variâncias assumida)
volante) Equa| variances not -9.269 21.714 0.000 13.33333 1.43856 16.319 -10.348
assumed (Igualdade
assumida)
a. cafgroup = (Sem cafeína)

A saída mostra que existe uma diferença significativa entre as duas condições envolven
do álcool na presença ou não de cafeína. Os detalhes relevantes são: t(22) = 9,27, p < 0,001.
A análise final do efeito simples é apresentada a seguir. Este teste l examina a diferença
entre as duas condições de álcool na condição cafeína (veja Figura 10.8 (d)). A análise sugere
que existe uma diferença significativa ente as duas condições de presença ou não de álcool.
Os detalhes relevantes são: t(22) - 2,51, p = 0,02.
CAFEÍNA = CAFEÍNA
Group Statistics3 (Estatísticas dos Grupos3)
Alcohol Std. Deviation Std. Error Mean

(Com álcool) N Mean (Média) (Desvio Padrão) (Erro Padrão da Média)
Driving errors No alcohol 12 5.7500 3.27872 0.94 64 8
(Erros ao volante) (Sem álcool)
Alcohol 12 9.0000 3.07482 0.88763
(Com álcool)
a. cafgroup = caffeine (a. cafgroup = Com cafeína)
ndependent Samples Test* Oeste para Amostras lndependentesa)
Levene's Test
for Equality of
Variances
(Teste de Levene
de Variâncias) (Teste í para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de
95% a Diferença)
Df (Sig. (Diferença (Erro Padrão Lower Upper
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superior)
Driving Equal variances 0.059 0.810 -2.505 22 0.020 -3.25000 1.29758 -5.941 -0.5590
errors assumed (Igualdade
Erros ao de variâncias assumida)
volante) Equal variances not -2.505 21.910 0.020 -3.25000 1.29758 -5.942 -0.5583
assumed (Igualdade
assumida)
a. cafgroup = caffeine (a. cafgroup - Com cafeína)

Você deve ser capaz de observar que existe um efeito do álcool nas duas condições de
cafeína que não é provável ocorrer apenas devido ao erro amostra], dada a hipótese nula como
verdadeira. Essas análises confirmam que, nesse caso, existe um efeito principal genuíno da
variável independente álcool. Não se trata de efeito espúrio causado pela interação entre as
duas variáveis independentes. E um efeito principal genuíno, pois o álcool tem um efeito
significativo nas duas condições da variável cafeína. Para a variável independente cafeína, no
entanto, você deve ser capaz de constatar que existe somente um efeito significativo na con
dição com álcool. Isso indica que devemos ser cautelosos sobre o efeito principal observado
acerca da cafeína. Em virtude de não existir um efeito da cafeína na condição sem álcool,
não podemos declarar que a cafeína, no geral, afeta a habilidade de dirigir. A cafeína pare
ce somente surtir efeito quando os participantes também ingeriram álcool. Esses resultados
mostram, claramente, a importância de se investigar qualquer interação significativa quando
tivermos obtido efeitos principais significativos.
Na prática você deve ser cuidadoso quando conduzir análise de efeitos simples, pois,
quanto mais efeitos simples forem calculados, maior será a taxa de erro de conjunto. No
Capítulo 9, explicamos que a taxa de erro de conjunto (familywise error rate) está relacio
nada à taxa de erro global que se tem ao conduzir muitas análises. Ao se realizar um número
elevado de análises, existe um aumento da probabilidade de se cometer o erro do Tipo I, e
você deve ser seletivo nas análises dos efeitos simples que forem realizadas. ( íeralmente.
quando um experimento de ANOVA fatorial é realizado, você terá feito alguma espécie
de previsão (como fizemos) sobre os efeitos interativos das duas variáveis independentes.
Você deve utilizar essas previsões para guiá-lo na escolha das análises dos efeitos simples
que precisam ser realizadas. Tais análises são geralmente denominadas de comparações
planejadas ou a priori. Quando as comparações são post hoc, ou você está fazendo muita'
comparações, ou precisa fazer alguns ajustes no nível de significância a (veja a seção sobre
testes post hoc no Capítulo 9). Como examinamos todos os possíveis efeitos simples na
saída do SPSSPW apresentada, o nível de significância deve ser estabelecido em 0,0125.
isto é, 0.05 H- 4. Quando fizermos isso. constataremos que o efeito simples do álcool na
condição com cafeína não é significativo (p = 0.02), e, assim, esta diferença será atribuída
ao erro amostrai.
Atividade 10.5
Qual das se g u in te s a firm a tiv a s d e scre ve um e feito sim p les?
(a) D iferen ça e n tre m a sc a r c h icle te s e não m a sc a r c h icle te s e n q u a n to fala

(b) D ife re n ça g lo b al e n tre os b e b ed o res e n ão -b e b e d o re s de chá
(c) O s e fe ito s do b a ru lh o so m e n te na prova d e m a te m á tica
(d) O s efeito s de u m a te ra p ia de c o m p o rta m e n to co g n itivo nas resp o stas ao m ed o d e todo
o grup o de p a rticip a n te s

O cálculo do tamanho do efeito é semelhante ao casoda ANOVA de um fator descrito nc
Capítulo 9. Como dito previamente, existem várias medidasdo tamanho do efeito nos delinea
mentos da ANOVA; entretanto, o SPSSPW apresenta o eta parcial ao quadrado (r| parcial).
único que será abordado aqui.
O T]" parcial e facilmente solicitado ao SPSSPW tanto no delineamento entre partici
pantes quanto no dentre participantes. Você deve notar, a partir da saída, que a estimativa di
r f parcial não chega a um. porque é, de fato, o quociente da soma dos quadrados (SQ) d*: -
efeitos (tratamentos) dividida pelo efeito da soma dos quadrados dos efeitos (tratamentos
somada com a soma dos quadrados do erro (dentro):
■ ■, SQ _
q parcial = -
SQ*..' SQ
Para o efeito principal do álcool, o r) parcial (0,625) calculado é de:

825,021
q2 parcial =
825,021 + 495,417
Todos os detalhes do r)2 parcial dados na saída da ANOVA na página 336 são calculad.
de uma maneira semelhante. Essas análises nos informam que 62,5% da variação nos err>
ao volante podem ser creditados a nossa manipulação da variável independente álcool. O r '
parcial é útil como uma medida global de magnitude do efeito. Se, no entanto, você estiver in
teressado na magnitude da diferença entre duas condições (o tamanho de um efeito simples),
pode utilizar o d, como sugerido no Capítulo 9.
10.5.7 Escrita das análises
Quando você tiver realizado a análise, os resultados podem ser relatados da seguinte forma:
As médias e os intervalos de confiança de 95C A para o número de erros ao volante nas condi
ções com e sem álcool e com e sem cafeína são apresentados na Figura 10.9. Sugerem que existe
uma diferença considerável no desempenho ao volante entre as condições com e sem cafeína quan
do os participantes ingeriram álcool, mas não necessariamente quando não beberam. Isso indica
que, nas duas condições de cafeína, o álcool tem um efeito prejudicial no desempenho ao volante.
Existe a possibilidade de uma interação entre as duas variáveis independentes, mas não está claro,
a partir dos valores, quão grande seria essa interação.
O número de erros ao volante foi estudado por meio de uma ANOVA entre partici
pantes com dois fatores de álcool (com e sem) e dois de cafeína (com e sem). A análise
revelou que os efeitos principais devidos aos fatores de álcool (F (l, 44) - 73,27, p <
0.001) e cafeína (F (l. 44). 55,38, p < 0.001) e a interação entre eles (F (l, 44) = 27,09,
p 0,001. r f parcial = 0.38) são improváveis de terem ocorrido somente devido ao erro
amostrai. Isso sugere que são cometidos mais erros ao volante quando álcool é ingerido
do que quando não (médias de 15,13 e 6.83, respectivamente, com r f parcial = 0.63).
Além disso, 63% da variação global dos erros ao volante foram atribuídos à influência
da variável independente álcool. O efeito principal da cafeína indica que existem menos
erros ao volante quando cafeína é consumida do que quando não (médias de 7,38 e 14.58.
Cafeína
í . Sem cafeína
Com cafeína
Álcool
Figura 10.9 Gráfico de barras de erro com médias e intervalos de confiança de 95% para o número
de erros ao volante nas condições com/sem álcool e com/sem cafeína.
348 Christine P. Dancey & John P>eidy
respectivamente, ry parcial = 0,56). Assim, 56% da variância se deve à manipulação da

variável independente cafeína. Finalmente, a interação entre álcool e cafeína foi conside
rável e representa 38% da variância total. Essa interação foi adicionalmente investigada
por meio do uso de testes /. Dado que existem quatro testes de efeitos simples, o critério
de sigmficáncia foi ajustado para 0,0125. As análises mostraram que o efeito da cafeína
na condição com álcool foi tal que é improvável que se deva ao erro amostrai (/(22) =
8,79. p < 0,001, d = 3.61). Não se encontrou um efeito significativo da cafeína na condi
ção sem álcool (/(22) = 1,61, p — 0,1221, d = 0,66). O efeito do álcool na condição com
cafeína também é improvável de ter ocorrido por erro amostrai (/(22) = 9,27, p < 0,001.
d = 3,79). Entretanto, não se verificou efeito da variável independente álcool na condição
com cafeína (/(22) = 2,51» p = 0,02, d = 1 02).
preconceito e diferença de gênero
Ekehammare colaboradores (2003) examinaram diferenças de gênero no preconceito implícito.
Nesse estudo, deram a homens e mulheres a tarefa de reconhecer rostos de suecos e de emigrantes
suecos. Então, determinaram o quanto essa tarefa influenciou o grau atribuído ao caráter de uma
pessoa descrita em uma história. Estavam interessados no grau de influência que a apresentação do
rosto da pessoa teve na atribuição de caráter negativo na seguinte história:
No estudo os pesquisadores utilizaram unia ÀMOVA 2 (rostos: suecos versus em igrantes suecos)x2
( gênero do participante: homem versus m ulher/ para analisar as respostas em relação ao carater na
história. Não encontraram efeitos principais significativos da variável independente rostos (F( 1, 3 9 1
= 0,94, p = 0,34), sugerindo que no geral não existe diferença no grau do caráter quando os partici
pantes são previam ente expostos a rostos de suecos e de em igrantes suecos. No entanto, fo i encontrado
uma interação significativa entre as variáveis independentes rostos e gênero (F(l , 39) = 5,63, p =
0,02). Realizaram uma análise post hoc dessa interação usando o teste LD S de Fisher e verificaran,
que mostraram às m ulheres uma negativiclade m aior em relação ao caráter do que os hom ens quando
expostas as fotografia s dos em igrantes, m as não com as dos suecos, sugerindo um grande preconceito
im plícito entre as mulheres.
Os detalhes estatísticos podem ser encontrados em Ekehammar e colaboradores. Você pode ver
que eles apresentaram os valores p reais em vez de simplesmente afirmar que o valor p foi maior ou
menor do que 0,05.
Atividade 10.6
Q u a is d a s se g u in te s m e d id a s de m a g n itu d e do e fe ito sa o a p ro p ria d a s para u tiliz a ç ã o com

a ANOVA?
(a) d
(b) r2
(c) r |2 p a rd a l
□ SPSSPW: análise de dois fatores entre participantes
Determinaçao das variáveis
Como em todas as análises, a primeira coisa que você precisa fazer é entrar com os da
dos. A maneira de fazer isso é ilustrada abaixo:
B K tk
F E d í v» w Data Transform Analyze Graphs Utàfoes Wmdov* Help
BilOiâl ail « •I M D ?I Ml f l r l C l- I- I n
1 alegrou» i1
alcaiouD V cafqroup | drjverrs | 1 1 1 1
> * 100/^ 400
y 100 900
1CCi^/ i00 1000
Duas variáveis z' ' 100 800
^ 5 100 100 600
de grupo e 100 100 1100
uma dependente.
S i 100 100 200
8 1oo 100 1100
9 100 100 1100
10 100 100 1000
11 100 100 300
12 1oo 100 1000
13 100 200 800
14 100 200 400
15 100 200 900
16 100 200 00
17 1oo 200 800
18 100 200 600
19 100 200 600
20 I00 200 300
21 1oo 2CC 00
22 100 200 800
<1»|\r».il.i VI«* K i H<1 .. i
S PS S P ro c «« * tsready
1 S ta r l | 1tUalcohol caffeine BG an_ ^ frtoosoft Photo Edtor >•- < <?S)<. L i
Lembre-se de que, quando for organizar um banco de dados para uma análise para
duas variáveis independentes entre dois grupos, você precisará determinar duas variáveis de
agrupamento contendo os números que representam os grupos aos quais os participantes
pertencem. Assim, se o participante 15 está no grupo sem álcool/com cafeína, terá um "1"
na coluna alegroup (grupo do álcool) e um “2” na coluna cafgroup (grupo da cafeína). Al
guém no grupo com álcool/sem cafeína terá um "2" na coluna alegroup e um “ 1” na coluna
vafgroup, e quem estiver no grupo com álcool/com cafeína terá um "2" nas duas colunas. A
terceira variável que vai precisar determinar é para a variável dependente, que conterá os va
lores de cada uma das pessoas, nesse caso, o número de erros cometidos ao volante.
Obtenção de estatísticas descritivas para cada grupo de participantes

A parte inicial da análise será obter as estatísticas descritivas para cada grupo de par
ticipantes. Temos quatro grupos de participantes, mas não se trata de um procedimento
imediato. Para fazer isso, precisamos dividir nosso arquivo de dados em duas partes, uma
contendo todos os dados da condição sem álcool e a outra contendo os da condição com
álcool. Feito isso, temos que rodar o procedimento de estatísticas descritivas com os dados
de erros ao volante para cada uma das condições da cafeína. O SPSSPW fornecerá as es
tatísticas descritivas para cada uma das condições da cafeína de cada uma das duas partes
em que o arquivo de dados foi dividido, isto é, para as condições com e sem álcool. Dessa
maneira podemos obter todas as estatísticas descritivas para cada um dos quatro grupos de
participantes.
O primeiro passo, portanto, é solicitar que o SPSSPW divida o arquivo em duas partes.
Você pode fazer isso clicando na opção Data (Dados), em Split File (Dividir Dados).
EESSm
Fie E<V ■ с У» Transform Analyze Graphs U til« Window Hdp
ШШШ JâJjsJ
Q i a j l it Oefne Variabte Properties...
----->-----1-----* - Copy Data Properties... ■ 11 ;l-t-inl 'VIÎ
1 afcgroup Define Dates...
■ÜCQ i i i i 1 I u
1
2
3 S o r te « « ...
4 Transpose...
5
Merge Fies »
6
Aggregate .
7
Identfy erpicate Cases...
8
9
Setect '.ases...
10
Wetf* Cases...
11
12 100 1 00 10 00
13 100 2 00 8 00
14 100 200 40 0
15 100 2 00 9 00
16 1 00 2 00 00
17 100 2 00 8 00
18 1 00 20 0 60 0
19 1 CO 2 00 6 00
20 loo :go 300
21 1 00 20 0 00
22 1 »XI J 00 8 00
4
< I » |\ P j i4 Vie* X Vertette View / ■ i« i i лi
SPSS Processor »ready
1 S ta rt) I alcohol roffrine BG an... ^ Ntarosoft PhotoEdtor •- ii»Q u*i
Feito isso, será aberta a seguinte caixa de diálogos.
-1*1X1
a=la|a| 51 ^ 1_J fcifej «I £ 1Ü a-x-lnl :*M
Selecione essa _L-
o pção e m ova i? calpouo Ana^re al case», do no» create group»
*> Onvmg eiroii [<*ivetuj f ' Compare gioups
a variável
C' Üigani» oulpU by group*
dlcgroup Groups Bated on
para esta caixa.

ш
f* Soit the lie by groupng variable:

Í" Fie к акеаф toiled
Curiert Slalus Anatyui by group* is ой
1 1Л1 l.«J — ЭТВ---------

16 1 00 200 00
17 1 00 2 00 80 0
18 1 OCl 200 600
19 1 00 200 6.00
20 1 00 200 300
21 1 00 200 QO
22 i 00 200 800
■I > l\n .r t.i V ie * X Variatole View /
SPSS Processor «ready
■ir*
/ S ta rt j f ijjjj alcohol caffeine BG on... ^ Mtaosoft Photo Edrtc» “- í-b¿Q 11:«
t'statística sem M atem ática para Psicologia 351
Você precisará selecionar a opção Organize output by qroups (Organize a saída por
grupos) e mover a variável álcool (alcohol) para a caixa (Jroups based on (Grupos basea
dos em). Feito isso, clique no botão OK. O arquivo estará agora efetivamente dividido
em dois, para a condição sem álcool e para a condição com álcool. Qualquer análise que
realize agora será executada nos dois arquivos separadamente. Assim, o próximo passo é
fazer com que o SPSSPW produza as estatísticas descritivas. Você precisa trabalhar com
u caixa de diálogos Analyze (Analisar), Descriptive Statislics (Estatísticas Descritivas),
Explore (Explorar).
J S tartj ) ijpl alcohol caflrio r BG an... ^ Microsoft Photo Ecfco» « * ^ ^ í j ) 1! :
Quando o SPSSPW executar essas análises, produzirá dois conjuntos de estatísticas des
critivas, uma para a condição sem álcool e outra para a condição com álcool. Dessa forma,
você terá obtido as estatísticas descritivas (incluindo diagramas de caixa e bigodes e histogra
mas) para todos os quatro grupos envolvidos no estudo.
Quando tiver obtido as estatísticas descritivas para cada um dos quatro grupos, poderá
realizar a ANOVA nos dados. Você precisará solicitar ao SPSSPW para reagrupar os dados
que foram previamente divididos. Se não fizer isso, verá que o software tentará executar a
análise nas duas partes do arquivo separadamente, o que estaria incorreto. Dessa forma, você
precisa deixar o SPSSPW saber que se deve utilizar todos os dados juntos na execução da
ANOVA. Para fazer isso, é preciso voltar ao menu Data (Dados), Split File (Dividir Dados),
e selecionar a opção Analyze ali cases, do not create groups (Analisar todos os casos, não
criar grupos).
SEEK
Selecione a
e jH je i 51 n L J fcJU «1 £ 1 0 П 1М З opção Analyze
ali cases
(A nalisar todos
r’~ Analyse al caies. do no« create gicn*» Г 5Г os casos)
Compare groups
f~ Organee output by groups
Rese»
•> afcgro^j Cancel
□ Help
P
r ■
Cioeni Slaiui Qipare* oUfni by alcgmf)
ГЗ - -ro u ’ ?uu
16 1 00 2 00 00
17 1 CD 200 800
18 1 00 200 600
19 1 00 200 6cc
20 1 00 200 300
21 1 00 200 00
22 1 00 200 800
« 1 > |\0 .it.i View X Va»lefcfe V«-./ /
SPSS Processor «ready
ir 1
st irt tTi' alcohol caffeine BG < l... ^ Microsoft Photo Ed*of “ * * *4i<» i itQ, им
Execução da ANOVA
Para que o SPSSPW execute a ANOVA, você precisa selecionar as opções General L
near Models (Modelos Lineares Geralizados), Univariate (Univariada), do menu Anal):
(Analisar).
jäi*i
g^lBiai sal Mova a VD
e as Vis para
estes locais
Clique no
botão Options
(Opções)
17 OK I Paste I Reset | Cancel I Hdp |

18
19 1 00 200 600
20 1 00 200 300
21 1 00 200 00
22 1 00 200 800
"1-iL
SPSS Processor e ready SpfcHeOn
ii S tart) I Дй alcohol caffeine BG an... ^ Nfccrosoft Photo Edtc* <<• **.$)<» '-fc.0, и «
Com a caixa de diálogos llnivariate (Univariada) na tela, mova a variável dependente

e as variáveis independentes para os locais apropriados. Se você quer informações sobre o
tamanho do efeito para cada um dos efeitos principais e para a interação, deve clicar no botão
Options (Opções). Fazendo isso, obterá a seguinte caixa de diálogos.
a
•1 -r.l r» lfrl
Selecione
Estimates
o f effe ct size
(Estim ativas
do tam anho
do efeito)
\P [ T : c' * :-y • :. ■^-yoçer^#^'fri*:

' E erf um l í t e t e ■>-. levai pio»
r Obser«<ddom>
P Pararne»* esb»a»e P LacádM
P Confetti coeftc*"' ma»m r Generai ettrsatole Kjn«cn
SignAcano* teveí | (ñ Confident «ervafe a»e 9>*
I Corrfrup I Canc«l
2 00
SPSS Processor is ready SpÉt FieO n
i Start I I ( ¡ | akohul caffeine BG an... ^ MKrosoft Photo Edtor ‘ i «y X
Selecione a opção Fstimates qfeffect size (Estimativas do tamanho do efeito) e clique no

botão Continue (Continuar) para retornar à caixa de diálogos principal da ANOVA. Você deve
notar que, se selecionar a opção Descriplives Stalistics (Estatísticas Descritivas), o SPSSPW
apresentará médias e desvios padrões como parte da saída da ANOVA (e você não precisa
dividir o arquivo para isso). Clique no botão OK, e a análise será realizada. Você obterá uma
saída que é semelhante àquelas mostradas na análise original anterior (veja página 336).
Para investigar os efeitos simples, você precisa executar os testes /. No entanto, isso não
é um procedimento direto como os testes t simples na variável dependente entre dois grupos
em cada uma das variáveis independentes. Lembre na análise dos efeitos simples, estamos
procurando os efeitos de uma das variáveis independentes em uma condição da outra variável
independente. Assim, os primeiros dois testes t que realizaremos procuram diferenças entre
as duas condições de álcool nas condições sem cafeína e com cafeína. Portanto, precisamos
informar ao SPSSPW que queremos dividir o arquivo em duas partes novamente. Dessa vez
devemos dividi-lo com base na variável cafeína e preparar a caixa de diálogos Data (Dados),
Split File (Dividir Arquivo), da seguinte maneira.
за- JffJx J
в*|Я|#| H -I £=lС?I «I -rír'i El-X-lnl
il
•> dcgioup ^ Ала^ге a i cases, do not cteate gnx^jj
« Orivng tnot'. [dnveifs] C Compare groups
(• Otgaree output by gioups
Groups Based on____
Ш
(• Soft ihe lie by дгскдод vaiiables
Г Fie is already sorted
Current Status Oiдалее output by aicgroup
~ ra 1 üu ■ z uu
16 1 00 200 00
17 1 00 200 800
16 1 00 200 60 0
19 1.00 200 60 0
20 1 00 20 0 30 0
21 1 00 2.00 00
22 1 00 20 0 80 0
■ 1 > l\D .rta View ^ Verlebte View / J 21^
SPSS Processor isready Spit П в On
J S ta rt) I ;itili alcohol c affeine BG an... ^ Microsoft Photo Editor « ?•«.<)<» í iàQ, И:«
Feito isso, clique no botão OK. e o arquivo será dividido novamente. Você pode rod_-
o teste t independente com álcool como variável independente e erros ao volante corr
variável dependente. O SPSSPW conduzirá testes t para as condições com cafeína e s e r
cafeína.
Você precisará realizar mais testes t para examinar as diferenças entre as condiçõe
com e sem cafeína em cada uma das condições da variável independente álcool. Precisar -
retornar à caixa de diálogos Data (Dados), Split Eile (Dividir Arquivo) e mover a variá\r
álcool para a caixa Groups Based on (Grupos com base em) em vez da variável cafeír._
Feito isso, poderá realizar o teste t independente com a cafeína como variável independe-
te, e erros ao volante como variável dependente sob as duas condições da variável álcoo
Lembre-se, quando você tiver terminado a análise dos efeitos simples, deve informar _
SPSSPW para reagrupar novamente o arquivo dividido, de modo que qualquer análise sub';
qiiente necessária possa ser feita sobre todos os dados.
Geração dos diagramas de barras de erro

Para gerar o diagrama de barras de erros apropriado, selecione a opçao Error Bar... (D:.
grama de Erro) do menu Graphs (Gráficos). Você obterá a seguinte caixa de diálogos.
-1*1*1
m i n i a i 5 J j _ ] _ J fcjfe j Mj HTJfrj E l í j n j ^ |rg |
cafqroup I drrverrs _L
1 1 001 1 00 400
2 1.00 1 00 900
3 1 00 I 00 10 00
4 1 00 1 00 80 0
5 1 00 1 00 60 0 xj
6 1 00 1 00 11 00
Petr« I
7 1 00 1 00 2 00 5 vd(4b Selecione
8 1 00 1 00 11 00 Cancel I
Clustered
9 1 00 1 00 11 00 Clwrtwed
Hcfc I
10 1 00 1 OCi 10 00 (Agrupado)
II 1 00 1 00 300 Data n Chart Ate
12 1 00 1 00 10.00 <• Summar** 1« groups oí cate*
e Summaries
13 1 00 200 80 0 Summaries o» separale variables for groups of
14 1 00 200 400
15 1 00
cases
200 9 00
16 1 CO 200 00 (Sumário pra
17 1 00 200 800
grupos d e casos)
I8 i aD 200 6 00
19 1 00 200 6.00
20 1 00 20 0 300
21 1 00 200 00
22 1 rei ?o o 80 0
■I » |\[).k.i Vif?/, h Var-st*» v > * /
SPSS Processor e ready
/ S ta rt| _ / Chapter 10 I^ Mcjosc/t Photo Edtor 11 5® a*t °hol caffeine BG a ' qjt&A ¡M7
Você precisará selecionar a opção Clustered (Agrupado) e Summaries fo r groups o f ca

ses (Sumário para grupos de casos) e clicar no botão Define (Definir)- Aparecerá uma caixa
de diálogos semelhante a mostrada a seguir. Mova a variável erros ao volante para a caixa
Vuriable (Variável), a variável atçgroup (grupo do álcool) para caixa Category Axis (Eixo das
categoriais) e a variável cafgmup (grupo da cafeína) para a caixa Define Clusters by (Definir
Agrupamentos por). Clique no botão OK para gerar o diagrama requerido. Você obterá um
diagrama semelhante ao representado na Figura 10.3 (mas sem as linhas sólidas conectando
as barras de erros).
..ü
Mova as variáveis
para os locais
adequados
10.6 Duas variáveis dentre participantes
Mostramos como a ANOVA pode manejar duas variáveis entre participantes e a interação
entre elas em uma análise. Agora vamos apresentar o caso de duas variáveis dentre partici
pantes. Permaneceremos com o mesmo estudo e os mesmos dados utilizados para o exemplo
das variáveis entre participantes, de modo que possamos destacar as diferenças entre os doi>
tipos de delineamentos. A distribuição agora é mostrada na Tabela 10.5. Compare isso com o
delineamento apenas entre participantes anterior (Tabela 10.4).
Você deve ser capaz de ver que temos 12 participantes tomando parte do estudo, mas
cada pessoa contribuiu com um escore em cada uma das células da tabela, isto é, cada um
deles tomou parte em cada uma das quatro condições. Obviamente, isso é difícil de ser exe
cutado em uma única ocasião, e, assim, é necessário que os participantes sejam examinado-
em quatro oportunidades diferentes.
Tabela 10.5 I listribuições dos escores das condições em um projeto dentre participantes
Participantes Sem cafeína Com cafeína Sem cafeína Com cafeína
1 4 8 28 5
2 9 4 22 6
3 10 9 21 14
4 8 0 27 8
5 6 8 21 14
6 11 6 20 5
7 2 6 19 11
8 11 3 16 8
9 11 0 25 10
10 10 8 17 11
11 3 9 19 8
12 10 8 20 8
Temos os mesmos dados utilizados na análise anterior (entre participantes), o que signi
fica que as hipóteses necessárias para a utilização de um teste paramétrico também se fazern
necessárias nesse caso. Você deve notar, no entanto, que isso só ocorre porque temos apena-
duas condições para cada uma das nossas variáveis independentes. Se tivermos mais do que
duas condições em qualquer uma das variáveis independentes dentre participantes, precisare
mos checar também se os dados não violam a hipótese adicional de esfericidade, consultando
o teste de Mauchley na saída (tabela) da ANOVA. Lembre: explicamos que essa é a hipóte.-;
adicional necessária quando o delineamento é dentre participantes (veja Capítulo 9).
10 .6.1 Fontes da variância
Quando conduzimos uma ANOVA, estamos tentando identificar as possíveis fonte-

de variação em nossos dados. Se você repensar o que foi dito a respeito quando se tra
tou do delineamento completamente entre participantes, irá verificar que a variância que
ocorre devido à s d ife r e n ç a s in d iv id u a is dentro de cada c o n d iç ã o fo i classificada como

variância do erro. Q u a n d o tç m ò s um delineamento dentre participantes, existe uma fo n te
de variação c o n sta n te devido ao u s o dos mesmos participantes em cada condição (isso foi
explicado no C a p ítu lo 9). Lm v irtu d e d e ss a fonte constante de variação, podemos retirá-la
da variância do erro, r e d u z in d o , a s s im , o termo erro (algumas vezes denominado de par
cializar). Poi q u e p r e c is a m o s p a r c ia liz a r os efeitos dos sujeitos do termo erro? Quando
temos um delineamento d en tre participantes, uma das hipóteses dos testes estatísticos (um
que não abordamos por se tratar de fórmulas) é que os dados de cada condição devem
ser independentes das demais condições. Por isso esse tipo de delineamento é denomi
nado de “independente” . Isso simplesmente indica que as condições não devem estar
correlacionadas. Essa é uma hipótese razoável para tais tipos de delineamentos. Não é, no
entanto, razoável para um delineamento dentre participantes. Em tais situações, as con
dições tendem a estar correlacionadas. Por exemplo, aqueles participantes que têm um
bom desempenho no teste de direção na condição sem álcool e sem cafeína tendem a ter
um bom desempenho comparado aos outros nas demais condições. De forma semelhante,
aqueles que tendem a ter um desempenho fraco em uma condição tendem a manter esse
desempenho nas demais condições. Isso pode não ser verdadeiro para todos os estudos,
mas é certamente para a maioria. Dessa forma, a hipótese de independência de condições
não se verifica para esse tipo de delineamento.
Como podemos resolver tal problema? A resposta e' remover os efeitos regulares dos
participantes ao longo das condições. Se isso for feito, as condições serão efetivamente in
dependentes umas das outras, e a análise poderá continuar. Uma característica útil dessa
manipulação estatística é tender a reduzir também o termo erro. Isso significa que. na maio
ria dos casos, o quadrado médio do efeito é comparado com um quadrado médio menor do
erro do que seria o equivalente para uma análise entre participantes. A conseqüência é que
freqüentemente a análise realizada por meio de um delineamento dentre participantes é mais
poderosa do que a equivalente entre participantes.
Você notará que, na saída da análise dentre participantes, existem mais entradas do que
para uma análise totalmente dentre participantes. Isso ocorre simplesmente porque testa
mos cada efeito principal e a interação contra o próprio termo erro. No delineamento dentre
participantes, em virtude de termos os mesmos participantes em todas as condições, há a
possibilidade de calcularmos o grau de erro associado com cada efeito, enquanto no delinea
mento entre participantes podemos calcular somente o erro total.
MODELO LINEAR GERAL
W ith in -S u b je c ts F a cto rs (Fator Dentre Sujeitos)

Measure: M EA SU R E1 (Medida: Medida_1)
alcohol (com álcool) caffeine (com cafeína) Variável dependente
1 1 noaicnocaff
2 noalccaff
2 1 alcnocaff
2 alccaff
Multivariate Testsh (Testes Multivariados")
Partial Eta
Value Hypothesis df Error df Squared
Effect (Efeito) (Valor) F (gl da Hipótese) (gl do Erro) Sig. (r|2 Parcial)
alcohol (Álcool) Pillai's Trace 0.882 82.331a 1.000 1 1 .000 0.0 0 0 0.882
(Traço de Pillai)
Wilks' Lambda 0.118 82.331a 1.000 1 1.000 0.0 0 0 0.882
(Lambda de Wilks)
Hotelling's Trace 7.485 82.331a 1.000 1 1.000 0.0 00 0.882
(Traço de Hotelling)
Roy's Largest Root 7.485 82.331a 1.000 11 .000 0.0 00 0.882
(Maior Raiz de Roy)
caffeine (Cafeína) Pillai's Trace 0.767 36.150a 1.000 11.000 0.0 0 0 0.767
(Traço de Pillai)
Wilks' Lambda 0.233 36.150a 1.000 11.00 0 0.0 0 0 0.767
(Lambda de Wilks)
Hotelling's Trace 3.286 36.150a 1.000 1 1.000 0.0 0 0 0.767
Roy's Largest Root 3.286 36.150a 1.000 11 .0 00 0.000 0.767
(Maior Raiz de Roy)
alcohol * caffeine Pillai's Trace 0.696 25.184a 1.000 1 1 .000 0.0 00 0.696
(álcool * cafeína) (Traço de Pillai)
Wilks' Lambda 0.304 25.184" 1.000 11 .0 00 0.0 00 0.696
(Lambda de Wilks)
Hotelling's Trace 2.289 25.184a 1.000 11 .0 00 0.0 00 0.696
Roy's Largest Root 2.289 25.184a 1.000 11 .000 0 .0 0 0 0.696
(Maior Raiz de Roy)
a. Exact statistic (a. Estatística exata)

b. Design: intercept (b. Projeto: Intercepto)
Within Subjects Design: alcoholt caffeine + alcohol*caffeine (Projeto: dentre sujeitos - álcool Lcafeina + élcool*cafeina)
M au ch ly's Test o f S p h e ricity 15 (Teste de Esfericidade de Mauchlyb)

Measure: MEASURE_1 (Medida: Medida_1)
Aprox. Epsilon3
Chi-Square
Within Subjects Effect W de (Qui-Quadrado df Greenhouse- Lower-bounc
(Efeito Dentre Sujeitos) Mauchly Aproximado) (gl) Sig. Geisser Huynh-Feldt (Limite ifiter,c
alcohol (Álcool) 1.000 0 .0 0 0 0 1.000 1.000 I.OO: I

caffeine (Cafeina) 1.000 0.0 0 0 0 1.000 1.000 1.000
alcohol*caffeine (Álcool*cafeina) 1.000 0.0 00 0 1.000 1.000 1.000
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is
proportional to an identity matrix (Testa a hipótese nula de que a matriz de covariancia dos erros da variável dependente transform 5 : -
e ortonormalizada é proporciona! a urna matriz de identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table (a. Pode ser utilizado para ajustar os graus de liberdade para o teste de significancia pondera .■
:
Testes corrigidos são mostrados na tabela dos efeitos dos testes dentre sujeitos.)
b. Design: intercept (Projeto: Intercepto) Within Subjects Design: alcohol + caffeine + alcohol*caffeine
(b. Projeto: dentre sujeitos-álcool^cafeina +áicool'cafeina.)
Test o f W ithin-Subjects E ffe cts (Teste dos Efeitos Dentre Sujeitos)

Vleasure: M EASURE1 (Medida: Medida!)
Type III Sumo Mean

f Squares (Soma Squaref Partial Eta
dos Quadrado df (Quadrado Squared
Source (Fonte) do Tipo III) (gl) da Média) F Sig. (ti2 Parcial)
alcohol (álcool) Sphericity Assumed 825.021 1 825.021 82.331 0.000 0.882
(Esfericidade assumida)
Huynh-Feldt 825.021 1.000 825.021 82.331 0.000 0.882
Lower-bound 825.021 1.000 825.021 82.331 0.000 0.882
(Limite inferior)
Error - alcohol Sphericity Assumed 110.229 11 10.021
(Erro álcool) (Esfericidade assumida)
Greenhouse-Geisser 110.229 1 1.000 10.021
Huynh-Feldt 110.229 11.000 10.021
Lower-bound 110.229 1 1.000 10.021
(Limite inferior)
caffeine (cafeína) Sphericity Assumed 623.521 1 623.521 36.150 0.000 0.767
Huynh-Feldt 623.521 1.000 623.521 36.150 0.000 0.767
Lower-bound 623.521 1.000 623.521 36.150 0.000 0.767
(Limite inferior)
Error - caffeine Sphericity Assumed 189.729 17.248
(Erro cafeína) (Esfericidade assumida)
Greenhouse-Geisser 189.729 11.000 ¡7.24 8
Huynh-Feldt 189.729 11.000 17.248
Lower-bound 189.729 11.000 17.248
(Límite inferior)
alcohol*caffeíne Sphericity Assumed 305.021 1 305.021 25.184 0.000 0.696
(álcool*cafeína) (Esfericidade assumida)
Huynh-Feldt 305.021 1.000 305.021 25.184 0.000 0.696
Lower-bound 305.021 1.000 305.021 25.184 0.000 0.696
(Limite inferior)
Error - alcohol * caffeine Sphericity Assumed 133.229 11 12.112
(Erroálcool * cafeína) (Esfericidade assumida)
Huynh-Feldt 133.229 11.000 12.112
Lower-bound 133.229 11.000 12.112
(Límite inferior)
Test of W ithin-S ub jects C o n trasts (Teste dos Contrastes Dentre Sujeitos)

Measure: MEASURE ! (Medida: Medida 1)
Type III Sumo of Mean

Squares (Soma Squared Partial Eta
alcohol caffeine dos Quadrados df (Quadrado Squared
Source (Fonte) (álcool) (cafeína) do Tipo III) <90 da Média) F Sig. (rç2 parcial)
alcohol (álcool) Linear 825.021 1 825.021 82.331 0.000 0.882

Error (alcohol) (Erro - álcool) Linear 110.229 11 10.021
caffeine (cafeína) Linear 623.521 1 623,521 36.150 0.000 0.767
Error - caffeine (Erro - cafeína) Linear 189.729 11 17.248

alcohol*caffeine (álcool*cafeína) Linear Linear 305.021 1 305.021 25.184 0.000 0.696
Error (alcohol * caffeine) Linear Linear 133.229 11 12.112
(Erro - álcool * cafeína)
Test o f W ith in -S u b je c ts E ffe c ts (Teste dos Efeitos Dentre Sujeitos)

Measure: MEASURE_1 (Medida: M edidaJ)
Transformed Variable: Average (Variável transformada: média)
Type III Sum of Partial Eta

Squares (Soma dos df Mean Squared Squared
Source (Fonte) Quadrados do Tipo III) (gl) (Quadrado da Média) F Sig. (r|2 Parcial)
Intercept 5786.021 1 5786.021 1022.772 0.000 0 989
(Intercepto)
Error (Erro) 62.229 11 5.657
Atividade 10.7
Com o é o t i7 p arcial c a lcu la d o para cad a efeito na saíd a a c im a ?
Essencialmente, em um projeto dentre participantes, a ANOVA analisa cada efeito prin

cipal como se fosse a ANOVA de uma classificação. Dessa forma, calcula a quantidade total
de variação associada com cada efeito principal (isso inclui todas as fontes de variação, in
clusive a do eixo). A ANOVA subtrai, desta variação global, a variabilidade que pode ser
atribuída ao efeito principal e a quantidade de variabilidade que pode ser atribuída ao efeito
dos participantes. A variação restante é a variância que não pode ser explicada, ou seja, o ter
mo erro. Esse é exatamente o mesmo procedimento explicado no Capítulo 9 para a ANOVA
dentre participantes de um fator.
A maneira de calcular a interação é semelhante à explicada para a ANOVA entre par
ticipantes anteriormente. Depois de calculados os efeitos principais e os seus termos erros,
restará algum efeito que pode ser atribuído à interação com o seu termo erro. Uma vez cal
culada a soma dos quadrados para a própria interação e para o seu termo erro, podemos
calcular a razão F. Como resultado dos cálculos necessários para a ANOVA totalmente dentre
participantes, você notará que na saída existe um termo erro separado para efeito principal e
para a interação.
Para podermos calcular o valor F no delineamento dentre participantes, temos que dividir
a variância atribuída a cada efeito (média dos quadrados dos efeitos) pela variância do erro
(média dos quadrados dos erros) que foi calculada para lal efeito. Assim, da saída, você pode
verificar que o valor F para o efeito principal do álcool é:
825,021 •v- 10,021 = 82.331
Você notará, ainda, na saída oferecida, que o número total de graus de liberdade foi re
duzido dos 44 no delineamento entre participantes para 11 neste caso. A razão disso é que
temos agora apenas 12 participantes, enquanto na situação anterior existiam 48 (12 em cada
condição).

O mesmo conselho sobre os gráficos dos dados no delineamento entre participantes é
aplicável a este caso. Temos os mesmos dados utilizados no delineamento entre participantes,
assim você deve consultar a Figura J0.3 para o diagrama de barras de erro desses dados. Os
cálculos para os efeitos simples devem ser guiados pelas instruções já fornecidas neste ca
pítulo, essencialmente equivalentes aos cálculos dos efeitos simples do delineamento entre
participantes. No entanto, temos que utilizar o teste / para amostras relacionadas em vez do
teste para amostras independentes. Os resultados dessas análises são apresentados a seguir:
TESTE T
Paired Samples Statistics (Estatísticas para Amostras Emparelhadas)
Std. Error
Mean Std. Deviation Mean (Erro
(Média) N (Desvio Padrão) Padrão da Média)
Pair 1 No alcohol no caffeine 7.9167 12 3.31548 0.95 71 0
(Pari) (Sem álcool e sem cafeína)
No alcohol caffeine 5.7500 12 3.27872 0.94648
(Sem álcool e com cafeína)
Pair 2 Alcohol no caffeine 21.2500 12 3.72034 : 07397
(Par 2) (Com álcool e sem cafeína)
Alcohol caffeine 9.00 00 12 3.07482 0.88763
(Com álcool e com cafeína)
Pair 3 No alcohol no caffeine 7.9167 12 3.31548 0.95 71 0
(Par 3) (Sem álcool e sem cafeína)
Alcohol no caffeine 21.2500 12 3.72034 1.07397
(Com álcool e sem cafeína)
Pair 4 No alcohol caffeine 5.7500 12 3.27872 0.94648
(Par 4) (Sem álcool e com cafeína)
Alcohol caffeine 9.COOO 12 3.07482 C .88763
(Com álcool e com cafeína)
Paired Samples Correlations (Correlações das Amostras Emparelhadas)
Correlation
Pair 1 No alcohol no caffeine & 12 -0 .3 5 3 0.260
(Par 1) No alcohol caffeine
(sem a Icool e sem cafeína &
(sem a'cooi e com cafema)
Pair 2 Alcohol no caffeine & 12 -0 .2 6 2 0.410
(Par 2) Alcohol caffeine
(com aicoo e sem cafeína &
ice."' alcoo e com cafeína)
Pair 3 No alcohol no caffeine & 12 -0 .1 5 3 0.635
(Par 3) Alcohol no caffeine
(sem a cool e sem cafeína &
com álcool e sem cafeína)
Pair 4 No alcohol caffeine & 12 0.225 0.481
(sem álcool e com cafeína &
com álcool e com cafeína)
Paired Samples Tests (Testes das Amostras Emparelhadas)
Paired Differences (Diferenças Emparelhadas)
95% Confidence
Interval of the
Difference (IC de
Std. Std. Error 95% para a Diferença)
Mean Sig. (2-tailed)
Mean (Desvio (Erro Padrão Lower Upper df (Sig.
(Média) Padrão) da Média) (Inferior) (Superior) t (gl) Bilateral)
Pair 1 No alcohol no caffeine - 2.16667 J. / -¿I 1.56589 -1.280 5.61317 1.384 11 0.194
(Par 1) No alcohol caffeine
(sem álcool e sem cafeína -
(sem álcool e com cafeína)
Pair 2 Alcohol no caffeine - 12.250 5.41253 1.56246 8.8110 15.689 7.840 11 0.000
(com álcool e sem cafeína -
(com álcool e com cafeína)
Pair 3 No alcohol no caffeine - -13.333 5.34846 1.54397 -16.73 -9.9351 -8.636 11 0.000
(Par 3) Alcohol no caffeine
(sem álcool e sem cafeína -
com álcool e sem cafeína)
Pair 4 No alcohol caffeine - -3.2500 3.95716 1.14233 -5.76 4 -0.73574 -2.845 11 0.016
(sem álcool e com cafeína -
com álcool e com cafeína)
Pode-se inferir a partir das saídas acima que:

■ O efeito simples das condições da cafeína sem álcool (ver Figura 10.8 (a)) tem um
valor t associado de ?(11) = 1,38. p = 0,194
■ O efeito das condições da cafeína com álcool (ver Figura 10.8 (b)) tem um valor t
associado de /(1 1) = 7.84, p = 0.00 J
■ O efeito simples das condições da cafeína sem álcool (ver Figura 10.8 (c)) tem um
valor t associado de /(11) = 8.64. p = 0,001
■ O efeito simples das condições da cafeína sem álcool (verFigura10.8 (d)) temum
valor t associado de /(11) = 2.85. p = 0.016
Essas análises informam que. com exceção de duas condições da cafeína na condição sem
álcool, as diferenças entre os pares de me'dia são tais que é altamente improvável de terem
ocorrido apenas por erro amostrai, se a hipótese nula é verdadeira. No entanto, se utilizarmos
um critério de significancia mais conservador de 0.0125 (0,05 +• 4). teríamos de admitir que o
efeito simples final não é significativo, embora esteja muito perto de ser.
E importante reconhecer que, para delineamentos que incluem fatores dentre partici
pantes, a análise dos efeitos simples pode ser complicada. A explicação para isso está além
dos objetivos deste texto; assim, por ora, é suficiente que você entenda o que são os efeitos
simples. Você deve também iicar atento para não realizar muitas análises em um conjunto de
dados, a fim de manter baixo o erro conjunto. Se você quer descobrir mais sobre a determina
ção dos termos erro para efeitos simples no delineamento dentre participantes, consulte um
dos textos sugeridos no final deste capítulo.

A medida do tamanho do efeito mais apropriada para um delineamento dentre partici
pantes e' novamente o rp parcial. Você pode verificar a partir da saída da página 359 que o
r f parcial para o efeito principal da variável álcool é 0.88. para o efeito principal da variável
cafeína é 0,77 e para a interação vale 0,70.
10.6.4 Relato das análises

O relatório das análises desse caso é igual ao do exemplo do delineamento entre partici
pantes feito anteriormente neste capítulo. Tudo o que você vai precisar alterar é a descrição
do projeto da ANOVA, assim:
O número de erros ao volante foi analisado com uma ANOVA de medidas repetidas com dois
fatores de álcool dentre participantes (com versus sem álcool) e cafeína (com versus sem cafeína)...
O restante do relato será o mesmo, exceto pela alteração dos valores F, p e /.
graus de atratividade de formatos de corpos de mulheres
U m e stu d o relatad o por F o re ste ll e co la b o ra d o re s (2 0 0 4 ) in v e stig o u o s graus de atrativid ad e de

d ife r e n te s form as de c o rp o s fe m in in o s. O s p e sq u isa d o r e s ap resen taram a o s p articip an tes d e se n h o s
de p e ss o a s c o m d ife re n te s p e so s e ra zõ e s cin tu ra-q u ad ril (C Q ).' E x istia m três d ife re n te s ca teg o r ia s
de p e so s ( le v e s , m o d e r a d o s e p e sa d o s) e c in c o d ife re n te s ra zõ e s C Q varian do de 0 ,5 até 0 ,9 . P e s q u i
sas a n teriores m ostraram q u e m u lh eres ten d em a achar form as c o m C Q de 0 ,7 as m ais atrativas.
A taxa de atratividade fo i analisada utilizando uma ANOVA de medidas repetidas (dentre parti
cipantes) com peso corporal e CQ como variáveis independentes. A variável dependente fo i a taxa de
atratividade dada pelos participantes. A análise revelou efeitos principais significativos tanto do peso
(F(2. 41) = / 1,70, p < 0,005) quanto da razão CQ (F(4, 39) = 29,92, p < 0,001). Foi encontrada ainda
uma interação significativa entre as variáveis independentes (F(8, 35) = 45,50, P k 0.001). Os pesquisa
dores investigaram essa interação utilizando um teste dc B onfem im i que comparou vários CQ para peso
corporal separadamente. Descobriram que, para todos os pesos, as mulheres com uma taxa de CQ ten
dendo a 0,7 foram consideradas as mais atrativas. Entretanto, para pesos moderados¡ um grande leque
de CQ foram considerados atrativos quando comparados com corpos de form as leves ou pesadas.
j p SPSSPW: ANOVA dentre participantes com dois fatores
Hm um d e lin e a m e n to c o m p le ta m e n te d entre p a r ticip a n tes, te m o s q u atro e s c o r e s p ar-

cada p e ss o a e p r e cisa m o s d e fin ir quatro va riá v eis no arquivo de d a d o s.
' Waist-to-Hip Ratios (WJHRs).

Digitados os dados, clique no menu Analyze (Analisar) e em seguida em General Linear

Mode! (Modelo Linear Geral) e, após, em Repeated Measures (Medidas Repetidas):
Dal« Transform Analyze Graphs Utéties Wmdow Help
i^ ia iâ i^ i i 1M Reports
Descnptive Statist«
1 noafcnocafl 4 Tables
Compare Means
noalcnocaff] noalccaf
Urwanate...
4 00| 8C
1
2 9 00 4C
MKedModete MAivanate .
Correlate
3 10 00 9C Regression
4 8 00 C Variance Components...
LogSnear
5 6 00 8C Classify
6 11 00 6CC
6 Data Reduction
7 2 00 6C Sede
8 11 00 3C Nonpaiaroetnc Tests
9 Time Senes
11 00 c
Survival
10 10 CO 8C
Multiple Response
11 3 00 9C Mesng Value Analysis..
12 1000 8C Complex Samples
< I 1 |\[>jl.i Viirw. Variable View f ~ IjiL

Repeated Measures SPSS Processor is ready
1 Start I Mrrosoit Photo Edio» I 'ral ale cafT WG anova - S... ' ^ j Q , 11:49
Selecionado Repeated Measures (Medidas Repetidas), aparecerá a seguinte caixu de

diálogo. Isso deve ser familiar a você, já que é o mesmo procedimento da ANOVA dentre
participantes de uma classificação.
Dê um nom e
1 noalcnocall 4
para cada noalcnocaflj noalccaff 1 alcnocaff 1 alccaff | _L J_____ L JU 1
variável e o 2800 5 00
núm ero de J C IO O
Wühn-Sutoiecl Fado»Name |ca/ler* | Defñe |
condições e *8 00
Numòei ol Lávete
600 8 00 Rese<
cliq ue em
11 00 600' 20*
afcoW2l Cancel
A d d (A d icio nar) 200 6 CO
para co n firm ar 11Õ0 300 Help
11 00 "XI
10 00 600
300 900
10 co 8 00
~LiL
SPSS Processor is ready
1 S tart] ^ Microsoft Pho>o E:d*or 11ijg| ale caff WG a no va - S...
Quando atribuir nomes às variáveis dentre participantes, deverá lembrar de qual no
meou primeiro, pois isso c importante quando definir cada variável na caixa de diálogo
seguinte.
O SPSSPW fornece um lem brete da ordem

na qual você nom eou as variáveis
jsjxj
=i&|m| -rir-i g - i- ir i '*№
1 noalcnceafl
I R epeated M e m u r»
fioaicnocafli
Wíh»vSub(ecii Vanattes I«lcohoix«llene|
1-
. EH3EE1E5
900
rwaícnocaHII 1)
10oo OJ nojfccaft{1 2)
B et« I
soo alcr>ocalH21)
60 0 Cancd |
U 00 □ Hetp I
2 G0
11CO
11CO
10 CO
Be»waen-Svfctectt Faciorfs)
30 0
10 00 tu
tu
ConlHMtt | Ptots | PoaHoc... | Save | OpQon; |
■I ■[\f».m vicrt / Varwtte .>v. J "1_lL v r1

'SPSS Processo» isready
/ Start | ^ Mcrosoft Photo Edtor i 7T .ilr c .iff WG <inova - S... . « 'O Q 11:50
Quando você move variáveis de uma caixa para outra, precisa fazê-lo na ordem correta
Esse é o motivo pelo qual precisa lembrar da ordem em que definiu as variáveis na caixa de
diálogos anterior. Na caixa de diálogos Within-Subjects Variables (Variáveis dentre Sujeitos
você pode ver que cada entrada tem um código de dois dígitos, por exemplo, (1, 2). Esi-e
código informa que a entrada em particular representa a primeira condição da variável I e _
segunda condição da variável 2. Lembre: definimos álcool como a primeira variável e cafeúh
como a segunda. Se você acha que não lembra a ordem em que nomeou as variáveis, o SPSS
PW fornece uma dica próximo ao topo da caixa de diálogo. Conseqüentemente, cada códip
representa as seguintes condições:
■ (1,1) = sem álcool/ sem cafeína
■ (1,2) = sem álcool/ com cafeína
■ (2, 1) = com álcool/ sem cafeína
■ (2. 2) = com álcool/ com cafeína
Portanto, as variáveis precisam ser movidas para o local específico na caixa Withir-
Subjects Variables (Variáveis dentre Sujeitos). Quando você tiver movido todas as variáve:-
relevantes para o local apropriado clique no botão Options (Opções) e marque a opção Efft
Size (Tamanho do Efeito), como feito com o delineamento entre participantes anterior. Clique
no botão Continue (Continuar) e no botão OK para executar a análise. Você deve ser apresen
tado a saídas semelhantes às anteriores.
A análise dos efeitos simples é um pouco mais complicada do que no delineamento an
terior. Nesse caso, não precisamos solicitar que o SPSSPW divida o arquivo porque cada
participante forneceu valores para todas as condições. Assim, simplesmente temos de informa:
ao software quais variáveis devem fazer parte de cada teste I (lembre-se de que estamos utili
zando o teste I para amostras relacionadas). Se quisermos examinar a diferença entre os grupos
com e sem á lco o l na condição sem cafeína, devemos executar um teste t relacionado nas variá
veis sem álcool e sem cafeína, bem como com álcool e sem cafeína. Se quisermos examinar as
diferenças entre as condições com e sem cafeína na condição com álcool, devemos realizar um
teste l com as variáveis com álcool e sem cafeína, e com álcool e com cafeína.
10.7 Uma variável entre e outra dentre participantes
O último delineamento abordado neste capítulo é uma mistura dos delineamentos en
tre e dentre participantes. Tal análise é muitas vezes denominada de ANOVA subdividida
(split-plot ANOVAI). Continuaremos com o exemplo álcool/cafeína/direção, mas dessa vez
vamos considerar que a variável independente álcool é um fator dentre participantes, e a
variável independente cafeína será tomada como um fator entre participantes. A alocação
dos participantes às condições e seus escores na habilidade de dirigir estão apresentados
na Tabela 10.6.
Como estamos utilizando os mesmos dados que as análises anteriores, podemos inferir
que as suposições necessárias foram satisfeitas. Novamente, esse é o caso porque temos
apenas duas condições na variável independente dentre participantes. Se tivéssemos mais
do que duas condições, precisaríamos nos assegurar de que a hipótese de esfericidade é
verdadeira.
C orno feito com as duas ANOVAs anteriores, a primeira coisa com que devemos nos pre
ocupar são as possíveis fontes de variação nesse delineamento subdividido. Você poderá ver
pela saída da análise que a variável independente entre participantes tem seu próprio termo
erro. A análise de uma variável independente entre participantes é semelhante a realizar uma
ANOVA de um fator, ignorando a variável independente entre p articip an tes.
Tabela 10.6 Distribuição dos escores às condições num delineamento de parcelas subdivididas (.split-plot)
Participantes Sem cafeína Com cafeína Participantes Sem cafeína Com cafeína
1 4 13 28 5
2 9 14 22 6
3 10 15 21 14
4 X 16 27 8
5 6 17 21 14
6 11 18 20 5
7 2 19 19 11
8 II 20 16 8
9 II 21 25 10
10 10 22 17 11
11 3 23 19 8
12 10 24 20 S
MODELO LINEAR GERAL
W ith in -S u b je c ts Fa cto rs (Fatores Dentre Sujeitos)

Med¡da-Medida-1
Dependent Variable
cafgroup (Variável Dependente)
1 nocaffeine (sem cafeína)
2 caffeine (com cafeína)
Within-Subjects Factors (Fatores Dentre Sujeitos)
Value Label (Rótulo) N
alcgroup 1.00 No alcohol (Sem álcool) 12

2.00 Alcohol (Com álcool) 12
Multivariate Testsb (Testes Multivariados0)

Partial Eta
Value Hypothesis df Error df Squarec
Efeito (Valor) F (gl da Hipótese) (gl do Erro) Sig. (r\2 Parcia
cafgroup Pillai's Trace 0.659 42.474“ 1.000 22,000 0.000 0.659

(Traço de Pillai)
Wilks' Lambda 0.341 42.474 1.000 22.000 0.000 0.659
(Lambda de Wilks)
Hotelling's Trace 1.931 42.474'* 1.000 22.000 0.000 0.659
Roy's Largest Root 1.931 42.474“ 1.000 22.000 0.000 0.659
(Maior raiz de Roy)
Cafgroup*alcgroup Pillai's Trace 0.486 20.778" 1.000 22.000 0.000 0.48c

(Traço de Pillai)
Wilks' Lambda 0.514 20.778'’ 1.000 22.000 0.000 0.48c
(Lambda de Wilks)
Hotelling's Trace 0.944 20.778» 1.000 22.000 0.000 0.4 8 Í
Roy's Largest Root 0.944 20.778' 1.000 22.000 0.000 0.48c
(Maior raiz de Roy)

b. Design: intercept+alcgroup (b. Projeto: Intercepto + alcgroup)
Within Subjects Design: cafgroup (Projeto: Dentre Sujeitos - cafgroup)
M auchly's Test o f Sp h e ricity b (Teste de E sfericid ad e de M auchlyb)

Measure: M EASURE1 (Medida: Medida_1)
Epsilon"
Aprox. Chi-Square
Within Subjects Effect Mauchly's W (Qui-Quadrado df Greenhouse- Lower- bou no
(Efeito Dentre Sujeitos) (W de Mauchly) Aproximado) (gl) Sig. Geisser Huynh-Feldt (Limite Infenc'
cafgroup 1.000 0.000 0 1.000 1.000 1.000 :
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is proport'C'
to an identity matrix (Testa a hipótese nula de que a matriz de covariâncía dos erros da variável dependente transformada e ortonormaliza:.-
proporcional a uma matriz de identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected test are displayed in the Tests :
Within-Subjects Effects table (a. Pode ser utilizado para ajustar os graus de liberdade para o teste de significance ponderado. Testes corriç :
são mostrados na tabela dos efeitos dos testes dentre sujeitos.)
b. Design: intercept+alcgroup (b. Projeto: Intercepto+alcgroup)
Within Subjects Design: cafgroup (Projeto: dentre sujeitos-cafgroup)
Sig. - Significância
Test o f W ithin-S ub jects E ffe cts (Teste dos Efeitos Dentre Sujeitos)
Measure: MEASURE_1 (Medida: Medida 1)
Mean
Type III Sum of Squared Partial Eta
Squares (Soma dos df (Quadrado Squared
Source (Fonte) Quadrados do Tipo III) (gl) da Média) F Sig. (ri2 Parcial)
cafgroup Sphericity Assumed 623.521 1 623.521 42.474 0.000 0.659
Huynh-Feldt 623.521 1.000 623.521 42.474 0.000 0.659
Lower-bound 623.521 1.000 623.521 42.474 0.000 0.659
(Limite inferior)
cafgroup*alcgroup Sphericity Assumed 305.021 1 305.021 20.778 0.000 0.486
Huynh-Feldt 305.021 1.000 305.021 20.778 0.000 0.486
Lower-bound 305.021 1.000 305.021 20.778 0.000 0.486
(Limite inferior)
Error(cafgroup) Sphericity Assumed 322.958 22 14.680
(Erro (cafgroup)) (Esfericidade assumida)
Huynh-Feldt 322.958 22.000 14.680
Lower-bound 322.958 22.000 14.680
(Limite inferior)
Test of W ithin-Subjects C o n trasts (Teste dos Contrastes Dentre Sujeitos)

Measure: M EASURE1 (Medida: Medida_1)
Mean
Source (Fonte) cafgroup Quadrados do Tipo III) (gl) da Média» F Sig. (p2 Parcial)
cafgroup Linear 623.521 1 623.521 42.474 0.000 0.659
cafgroup*alcgroup Linear 305.021 1 305.021 20.778 0.000 0.486
Error(cafgroup) Linear 322.958 22 14.680
(Erro (cafgroup))
Test o f W ith in -S u b je c ts E ffe c ts (Teste dos Efeitos Dentre Sujeitos)

Measure: MEASURE_1 (Medida: Medida 1)
Transformed Variable: Average (Variável Transformada: média)
Mean
Source (Fonte) Quadrados do Tipo III) (gl) da Média) F Sig. (ri2 Parcial)
intercept (Intercepto) 5786.021 1 5786.021 738.106 0.000 0.971
alegroup 825.021 1 825.021 105.245 0.000 0.827
Error (Erro) 172.458 22 7.839
A parte d a A N O V A dentre p articipan tes é d iv id id a e m três: o e fe ito p rin cip al da c a feín a ,

a in teração entre o s fa to re s á lc o o l e c a fe ín a e o term o erro para e sta parte da a n á lise . A s sim ,
no d e lin e a m e n to das p arcelas d iv id id a s ( split-plot design), te m o s um term o erro para a parte
dentre p articip an tes da a n á lise e um te im o erro para a parte da a n á lise entre p articip an tes. A
in te ra ç ã o entre á lc o o l (entre p a r ticip a n tes) c c a fe ín a (den tre p a r ticip a n tes) é parte da saíd a
dentre p a rticip a n tes porqu e tem um c o m p o n e n te dentre p a n ic ip a n te s . Isto é, um d o s term o s
de in teração (c a fe ín a ) é dentre p articip an tes.
V o cê p o d e ver, a partir da sa íd a d a A N O V A su b d iv id id a a n te r io r m en te, q u e o efe:'

p rin cip al d o fator á lc o o l tem um v alor F d e 1 0 5 ,2 5 (8 2 5 ,0 2 7 ,8 4 ) c o m um a probab ilidac±
a sso c ia d a d ep < 0 .0 0 1 , O e fe ito p rin cip a l d o fator c a fe ín a tem um v alor F d e 4 2 ,4 7 (6 2 3 .5 2 -
1 4 ,6 8 ) c o m um a p ro b a b ilid a d e a ss o c ia d a de p < 0 , 0 0 1 .
A a n á lise d o s e fe ito s sim p le s é se m e lh a n te à d escrita a n teriorm en te para o d e lin ea m e r

den tre e entre p articip a n tes. M a is um a v e z , v o c ê d e v e esta r c ie n te do^ p ro b lem a s c o m a ta -
d e erro d e c o n ju n to e de q u e, e m q u alq u er d e lin e a m e n to c o m fatores d entre p a r tic ip a n te s :
term o s erro não sã o sim p le s. C o m o n o s e x e m p lo s a n teriores, v o c ê d e v e ex a m in a r se u s efei:
t. O s te ste s t para e s s e s d a d o s e stã o a p r e se n ta d o s a seguir. N o te c _ :
s im p le s u tiliz a n d o te ste s
no d e lin e a m e n to su b d iv id id o , e m virtu d e de te rm o s v a r iá v e is d o s tip o s en tre e dentre. \< .
p recisará u tiliza r tanto o te ste l in d ep e n d e n te q u an to o r ela cio n a d o .
TESTE T
GRUPO DO ÁLCOOL = SEM ÁLCOOL
Paired Samples Statistics3 (Estatísticas das Amostras em Pares8)

Std. Error Mean
Std. Deviation (Erro Padrão
Média N (Desvio Padrão) da Média)
Pair 1 No caffeine 7.9167 12 3.31548 0.95710
(Part) (Sem cafeína)
Caffeine 5.7500 12 3.27872 0.94648
(Com cafeína)
a. alegroup = No alcohol (a. alcgroup = Sem álcool)
Paired Samples Correlations3 (Correlações de Amostras em Pares3)
N Correlação Sig.
Pair 1 No caffeine & Caffeine 12 -0 .3 5 3 0.260

(Par 1) (Sem cafeina/com cafeína)
a. alcgroup = No alcohol (a. alcgroup = no álcool)
Sig. - Significancia
Paired Samples Test3 (Teste para Amostras*)
Paired Differences (Diferenças em Pares)
95% Confidence
Interval of the
Difference (FC de
Deviation Mean Erro Sig. <2--
Mean (Desvio (Padrão Lower Upper df (Sign ■
(Média) Padrão) da Média) (Inferior) (Superior) t (gl)
Pair 1 No caffeine & Caffeine 2.167 5.42441 1.56589 1.27984 5.61317 1.384 11
(Par 1) (Sem cafeína/Com cafeína)
a. alcgroup = No alcohol (a. alcgroup = Sem álcool)

GRUPO DO ÁLCOOL = ÁLCOOL
Paired Samples Statistics“ (Estatísticas das Amostras em Pares1)
Std. Error Mean

Std. Deviation (Erro Padrão
Média N (Desvio Padrão) da Média)
Pair 1 No caffeine 21.2500 12 3.72034 1.07397
(P ari) (Sem cafeína)
Caffeine 9.00 00 12 3.07482 0.88763
(Com cafeína)
a. alcgroup = Alcohol (a. alcgroup = Com álcool)
Paired Samples Correlations'1(Correlações de Amostras em Paresa)
N Correlaçao Sig.
Pair 1 No caffeine & Caffeine 12 -0 .2 6 2 0.410

(P ari) (Sem cafeína/com cafeína)
a. alcgroup = Alcohol (a. alcgroup = Com álcool)

-’aired Samples Test4 (Teste para Amostras em Pares")
Paired Differences (Diferenças em Pares)
95% Confidence
Interval of the
Deference 1C de
Deviation Mean Erro Sig. (2-tailed)
Mean (Desvio (Padrão Lower Upper df (Significancia
(Média) Padrão) da Mèdia) (Inferior) 1 (Superior) t (90 Bilateral)
Pair 1 No caffeine & Caffeine 12.250 5.41253 1.56246 8.8110 15.689 7.840 11 0.000
Par 1) (Sem cafeina/Com cafeína)
3. alcgroup = Alcohol (a. alcgroup = Com álcool)
TESTE T
Group Statistics (Estatísticas dos Grupos)
Standard Std. Error Mean

Mean Deviation (Erro Padrão
alcgroup N (Média) (Desvio Padrão) da Média)
No caffeine No alcohol 12 7.9167 3 .31 54 8 0.95 71 0
(Sem cafeína) (Sem álcool)
Alcohol 12 21.2500 3.72034 1.07397
(Com álcool)
Com caffeine No alcohol 12 5.7500 3.27872 0.94 64 8
(Com cafeína) (Sem álcool)
Alcohol 12 9.0000 3.07482 0.88763
(Com álcool)
Independent Samples Test* (Teste para Amostras Independentes)
Levene's Test
for Equality of
Variances
(Teste de Levene
de Variâncias) (Teste ( para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (1C de 95%
para a Diferença)
df (Sig. (Diferença (Erro Padrão Lower Uppe-
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superior'
No Equal variances 0.005 0.945 -9.269 22 0.000 -13.33333 1.43856 -16.317 -10.350
caffeine assumed (Igualdade
(Sem de variâncias assumida)
cafeína) £qua| varjances n0( -9.269 21.714 0.000 -13.33333 1.43856 -16.319 -10.348
assumed (Igualdade
assumída)
ç om Equal variances 0.059 0.810 -2.505 22 0.020 -3.25000 1.29758 -5.94101 -0.55899
caffeine assumed (Igualdade
(Com de variâncias assumida)
cafeína) Equal variances not -2.505 21.910 0.020 -3.25000 1.29758 -5.94166 -0.5583-
assumed (Igualdade
assumida)
E ss e s te ste s t rev ela m que:
a O e fe ito das c o n d iç õ e s c o m /s e m c a fe ín a c o m a c o n d iç ã o se m á lc o o l tem u m valo:

/■(11)= 1,38, p = 0 ,1 9 (veja F igura 10.8 (a)).
■ O e fe ito da c o n d iç ã o c o m /s e m c a fe ín a a ss o c ia d o à c o n d iç ã o c o m á lc o o l tem um v a i . :
t( 11) = 7 ,8 4 , p < 0 ,0 0 1 (v e ja F igu ra 10.8 (b)).
■ O e fe ito da c o n d iç ã o c o m /s e m á lc o o l c o m a c o n d iç ã o se m c a fe ín a te m um vai -
f ( l 1) = 9 ,2 7 , p < 0 ,0 0 1 (v e ja F igu ra 10.8 (c )).
■ O e fe ito da c o n d iç ã o c o m /s e m á lc o o l c o m a c o n d iç ã o c o m c a fe ín a tem um vai -
/( 1 1 ) = 2,5 I , p = 0 .0 2 (v e ja F igu ra 10.8 (d )).
C o m o te m o s o s m e sm o s d a d o s d o s d o is e x e m p lo s a n teriores, n ão é su rp resa qu e todc

e s s e s te ste s / ten h a m um pad rão se m e lh a n te a o s o b se r v a d o s p r e v ia m e n te . E x iste m e fe it
s ig n if ic a tiv o s da v a r iá v e l in d e p e n d e n te c a fe ín a na c o n d iç ã o c o m á lc o o l e da variá v el ir
d e p e n d e n te á lc o o l na c o n d iç ã o c a fe ín a , O s o u tr o s e f e it o s s im p le s n ã o s ã o sig n ific a tiv i
c o n sid e r a n d o que n o s s o c ritér io dc s ig n ific â n c ia ten h a sid o aju sta d o para 0 ,0 1 2 5 a fim
levar e m c o n ta o s m ú ltip lo s testes.
A m e d id a d o tam an h o d o e fe ito para e s s e d e lin e a m e n to é n o v a m e n te o r| parcial. Yc*.;

p od e ver p e la s sa íd a s da págin a 3 6 9 qu e o r| parcial para o e fe ito p rin cip al d o á lc o o l é O .v
da c a fe ín a é 0 ,6 6 e o da in tera çã o é 0 ,4 9 .
Atividade 10.8
Calcule d para o s quatro e feito s sim ples das com p arações referidas.
10.7.3 Relato das análises
U rela tó rio para a A N O V A su b d iv id id a é se m e lh a n te ao do d e lin e a m e n to entre p a r tici

p an tes j á ap resen tad o. T u d o de qu e se n e c e ssita é m ud ar a d e sc r iç ã o d o projeto da A N O V A e
a form a de d e sc r ev e r o s te ste s t. V ocê p o d erá d e sc r ev e r e s s e tip o de d e lin e a m e n to assim :
() número de erros de direção foi analisado com uma ANOVA subdividida com o grupo álcool
(com álcool versus sem álcool) como o fator entre participantes e o grupo cafeína (com cafeína
versus sem cafeína) como o fator dentre participantes
diferenças entre os gêneros na literatura de mapas
U m e stu d o r elatad o p or M a cF a d d en e c o la b o r a d o r e s ( 2 0 0 3 ) in v e stig o u d ife r e n ç a s de g ê n e ro
na leitura d e m apas e no fo r n e c im e n to de in str u ç õ e s c o m b a se n e s s e s m ap as. N e s s a p e sq u isa um
m apa fo i ap resen ta d o em u m a tela de com p u tad or, e o s p articip an tes foram so lic ita d o s a encontrar
a rota de um lugar para o u tro n o m apa (p. e x ., de um a e s c o la para o aero p o rto ). O s p a rticip a n tes
tin h am d o is m in u to s para en con trar o ca m in h o : p recisa v a m , en tã o , e sc re v er in str u ç õ e s em um p a
p el d e m o d o que outra p e ss o a p u d e sse en con trar o c a m in h o d o p o n to d e partida até o d e stin o . O s
p e sq u isa d o re s m ed iram o s p a itic ip a n te s por m e io de um “ c o n tr o le para o s o lh o s" a fim de verificar
s e e x istia m d ife re n ç a s sob re a form a c o m o h o m e n s e m u lh e r es v a sc u lh a v a m o m apa. T am b ém e x a
m inaram as in str u ç õ e s escrita s para verificar d ife r e n ç a s de g ên ero .
F e z -s e o e x a m e d o s m apas co m A N O V A 2 x 2 . c o m g ê n e ro c o m o um a variável in d ep en d e n te e n
tre p articip an tes e p o n to s de fix a ç ã o d o olhar (p o n to s de referên cia da cid a d e ou leg e n d a s de b ú sso la )
c o m o u m a variável in d e p e n d e n te dentre p articip an tes. A variável d e p e n d en te fo i o te m p o m é d io
g a sto de fo c a liz a ç ã o do p on to de referên cia ou das m arcas da b ú sso la . O s p esq u isa d o res encontraram
um e fe ito princip al sig n ific a tiv o d o s p o n to s de " fix a çã o do olhar" (F( 1 . 4 2 ) = 150 4 , 2 2 0 , p < 0 ,0 0 1 ).
D e sc o b r ira m que os p articip an tes se concen traram sig n ifica tiv a m e n te m ais n o s p o n to s de referên cia
d o q u e nas le g e n d a s da b ú ssola. N ã o se verificaram e fe ito s p rin cip ais de g ê n e ro nem sig n ific a n c ia de
in teração. O s autores não relataram o s valores F e p para o e fe ito princip al ou interação.
A a n á lise das in stru ções dadas p e lo s participantes foi projetada para com parar h om en s e m ulheres
quanto ao núm ero de p o n to s de referên cia e de d ir e ç õ e s norte, su l, leste ou o e ste. E ss e s d ad os foram
c o n v e rtid o s em e sc o r e s z e an a lisa d o s por um a A N O V A 2 x 2 , co m gên ero c o m o um a variável in d e
p end en te entre participan tes e estratégias de d ireção (p on tos de referên cia versus legen d as da b ú ssola)
c o m o variável in d ep en d en te dentre participan tes. N ã o se verificou um e fe ito principal sig n ifica tiv o de
g ên ero (o s autores não forneceram o s valores F e p). N o entanto, fo i con statad o um a interação sig n i
ficativa entre gên ero e estratégias de d ireção ( F ( l , 4 2 ) = 4 .4 5 8 . p = 0 ,0 2 1 ). E ssa interação fo i segu id a
com testes t p ost hoc que m ostraram que o s h o m e n s fizeram m ais referên cias a p o n to s da b ú ssola do
p = 0 ,0 0 6 ). O s autores não registraram os d etalh es d os outros testen t
que as m u lh eres (/(4 3 ) = 2 .6 9 9 ,
realizad os. T am bém não relataram d eta lh es d o s e fe ito s prin cip ais das estratégias de direção.
V ocê d ev e notar, a partir d is s o , q u e o s autores têm um a te n d ê n c ia de d e ix a r de relatar o s d e ta
lh e s das e sta tístic a s n ã o -s ig n ific a tiv a s . A c o n s e lh a m o s qu e v o c ê relate to d o s o s d e ta lh e s q u a n d o for
registrar as a n á lise s realiza d as.
SPSSPW: ANOVA com um fator entre participantes e

□
um dentre participantes
O arquivo de d a d o s para um projeto d e A N O V A su b d iv id id a é , se m su rp resa, um a com b -

n ação d o s d e lin e a m e n to s en tre e den tre p articip an tes. P r e c isa m o s determ in ar um a variável c .
agru p am en to para o lator entre p a rticip a n tes c o m /s e m á lc o o l e d u as v a r iá v e is rep resen tan c
as du as c o n d iç õ e s d o fator dentre p articip an tes c o m /s e m c a feín a .
Pfc Ed» vm i Data Transferí» Analyze Graphs UMöes WWow Hefc>
S3! •> ■I ь | й | m i - r i r ' i

I ÑCp&J Is«**" ’ i
alCQIOUD I nocaffeine | caffeine 1 I I 1 I 1 -
1 1ooI 400 800
2 100 900 4 00
3 1 00 Ю00 900
4 1 00 8UQ 00
5 1 00 600 800
6 1 00 11 00 600
7 1X 200 600
6 1 00 11 00 3 00
9 ICC 11 00 00
10 1 00 1000 800
11 1 00 300 900
12 1 00 10 00 8 00
13 200 26 00 500
14 200 22 00 500
15 200 21 00 1400
16 200 27 00 800
17 200 21 00 1400
18 200 20 00 500
19 200 19 00 11 00
20 200 16.00 B00
21 2 00 25 00 10 00
22 200 1700 н ю *
■I • |\D-»u V ie * X Variable View / | j J _______________________________ |
Select Ceses SPSS Processa в ready
1 Start] ^ »Vrosctt Photo Edt or 11 caff alcohol «put ptet —*'• 1ISB1
C liq u e em Analyze (A n a lisa r ), General Linear Mudei (M o d e lo L in ear G era l) e R epeatt.

Measures (M e d id a s R e p e tid a s) para e x ecu ta r a a n á lise . D e s s a v e z v o c ê p recisa d eterm in ai
a penas um a variável dentre p articip an tes u tiliza n d o a prim eira c a ix a d e d iá lo g o s.
EJ! Mbii*i mm
ui. ’|пи:п I nocaffeifie I caffems I _L
W*hn-Sii*aö Feda Narae

Numbet ЫLevel*
Cancel I
:*»
200
2 DO 21 OC'
:X 20 00 5 UT-
2 00 1900 I I rjo
200 1600 900
200 2 600 10 00
200 17 00 'il 00
ЗИ\ !•>* X V.VlHH гг SPSS Processor e ready
1 Start I ^M crosoft Photo Edto | [gg саЯ alcohol tptt plot ... > < ] C i 1I152
Clique no botão Define (Definir) e determine as variáveis.
tflBiái sai «i -I md?i wjT F l ci-1-ir.i ^m\

1 . a*:group
r Sidri I ^ WcroioñPhotoEd»or —ca» .ikohol cplit plot.. 11:53
Quando você tiver determinado as variáveis, clique no botão Options (Opções) para se
lecionar a análise do tamanho do efeito e clique no botão OK para que esta comece. A saída
deve ser semelhante a uma já mostrada a você.
Quando for investigar os efeitos simples, precisa ler em mente que uma das variáveis é entre
participantes (nesse caso a variável alc). Assim, se quiser examinar as diferenças entre as condi
ções com e sem cafeína em cada uma das condições alcoólicas, você precisa instruir o SPSSPVV a
dividir o arquivo utilizando a variável álcool (Data - Dados. Splii File - Dividir arquivo). Expli
camos como fazer isso anteriormente, no capítulo. Você pode conduzir os testes i relacionados nas
variáveis nocafft caff. Se quiser examinar as diferenças entre as condições com e sem álcool, não
precisará dividir o arquivo, mas rodar um teste t independente com alc como variável indepen
dente e caff como variável dependente. E válido reiterar aqui que você deve ter cuidado quando
utilizar a opção de dividir o arquivo (Split File). E preciso lembrar de juntar novamente o arquivo
uma vez feita a análise necessária, de modo que qualquer análise adicional seja feita sobre todos
os dados. Assim, deve-se fazer isso antes de se rodarem os testes t independentes.
Resumo
Neste capítulo explicamos:

■ A ANOVA fatoria) como uma extensão da ANOVA de um fator, explicada no Capí
tulo 9.
■ Como analisar os dados de um estudo que inclui duas ou mais variáveis independen
tes utilizando a ANOVA fatorial.
■ As fontes de variação para os seguintes delineamentos:
- duas variáveis entre participantes
- duas variáveis dentre participantes
- uma variável entre participantes e uma dentre participantes (ANOVA subdividida).
■ C o m o e xam in ar a in teração entre du as variáveis in d ep e n d e n te s u tilizan d o:

diagram a dc harras de erros
- g r á fic o s dc linhas
- a n á lise s d o s e fe ito s sim p le s,
■ C o m o o S P S S P W f o r n e c e o r f p arcial e n q u a n to u m a m e d id a d o ta m a n h o do e f e i
to na A N O V A fa to ria l e q u e i s s o é s im p le s m e n te a razã o d o e f e it o da s o m a do>
q u a d r a d o s d iv id id a p e lo e f e it o da so m a d o s q u a d r a d o s m a is a s o m a d o s q u a d ra d o s
d o s erros.
■ Q u e q u an d o te m o s um d e lin e a m e n to c o m p le ta m e n te dentre p articip an tes, o e fe iu
p rin cip al e a in teração lèm o s se u s próp rios term os erro.
■ Q u e as a n á lise s a priori e post hoc d o s e fe ito s sim p le s p o d em se r fe ita s c o m te stes t.
■ Q ue, quando c o n d u zim o s m ais do que um a com p a ra çã o post hoc (ou a priori ), d ev e
m o s ajustar o nível de sig n ificâ n cia , d iv id in d o -o p elo nú m ero de co m p a r a çõ e s feitas.
Exercício 1
U m a p e sq u isa d o ra , Dra. B od , e stá in te re ssa d a em ex a m in a r se a h a b ilid a d e a c a d ê m u .
d e c lin o u n o s ú ltim o s 2 0 an os. E la d e c id e com p arar o d e se m p e n h o de um a am ostra de e s tu
d an tes de n ív el A , q u e fize ra m o s e x a m e s em 1 9 9 7 , c o m um a am o stra d o s qu e fizeram esê
m e sm o e x a m e em 197 7 . C ad a estu d a n te fo i su b m e tid o a um a prova de in g lê s e a um a de m_-
tem ática. C o m o form a de assegu rar q u e o s e x a m e s foram a v a lia d o s c o m o s m e sm o s eritérk
ela e m p r e g o u e x a m in a d o r e s para reavaliar as n o ta s o b tid a s por cada e stu d a n te e m cada u ~
d o s an os. A s n o v a s n otas atrib uídas a cada e stu d an te e m m a tem á tica e in g les e stã o na tabe^
abaixo:
Estudantes de 1977 Estudantes de 1997
emàtica Inglês Matemática Inglês
67 62 67 63
52 7Ì 49 6^
45 41 48 42
58 51 61 52
59 62 51 51
81 59 55 54
61 65 51 55
55 57 49 52
60 58 53 51
57 60 56 48
51 63 51 50
60 61 50 52
1. Q u e tipo de d e lin e a m e n to 6 e s s e estu d o ?

2. Q u a is sã o as variáveis d e p e n d e n te s e in d ep en d e n tes?
3. Entre com os dados no SPSSPW e execute uma ANOVA.

4. Quais são os valores F e as probabilidades associadas a cada efeito principal e à
interação?
5. Existem efeitos que não podem ser atribuídos ao erro amostrai? Se sim, quais são
eles?
6. Qual dos efeitos acima apresenta a maior magnitude do efeito?
Exercício 2
Uma pesquisadora, Dra. Kid, está interessada em saber se meninos e meninas diferem
na habilidade de perceber cores. Ela acha que as meninas são melhores do que os meninos
na percepção de cores desde bem pequenas. Por conseguinte, testa dois grupos de idades
diferentes (5 e 11 anos) por meio de um teste padrão de percepção de cores e compara o de
sempenho (notas até 10) de meninos e meninas. Os dados são apresentados abaixo:
5 anos 11 anos
Meninos M eninas Meninos M eninas
4 6 ..i O
3 5 2 9
4 6 3 9
5 4 4 8
9 6 7 7
1 7 5 10
0 8 4 9
2 6 3 10
3 5 2 8
3 4 2 6
4 6 4 9
5 3 5 8
1. Que tipo de delineamento é esse estudo?

2. Quais são as variáveis dependentes e independentes?
3. Entre com os dados no SPSSPW e execute uma ANOVA.
4. Quais são os valores F e as probabilidades associadas a cada efeito principal e à
interação?
5. Existem efeitos que não podem ser atribuídos ao erro amostrai? Se sim, quais são
eles?
6. Qual é a magnitude dos eleitos para os efeitos principais e a interação?
7. Conduza uma análise dos efeitos simples para verificar se existe uma melhoria na
percepção de cores com a idade pelos meninos e faça o mesmo com as meninas.
QUESTÕES DE MÚLTIPLA ESCOLHA (c) Variâncias atribuídas às duas variáveis inde

pendentes, à interação entre as duas variávei'
1. Como você descreveria uma ANOVA 2 x 2 x 4'7 independentes e ao erro
(a) Uma variável independente com três condições
(b) Uma variável independente com quatro con 4. O ry e:
dições e uma variável independente com duas (a) Uma medida da magnitude da probabilidade
condições de que os efeitos se devem ao erro amostrai
(c) Uma variável independente com quatro condi (b) Uma medida da magnitude do efeito utilizada
ções e duas variáveis independentes com duas com a ANOVA
condições (e) Uma organização terrorista de esquerda
(d) Uma variável independente com 10 condiçoes (d) Alternativas (a) e (b)
2. A ANOVA é útil para: 5. Quando diagramas de barras de erros são gerado-
(a) Retirar os efeitos individuais dos fatores de para um estudo com duas variáveis independentes,
uma variável independente cada uma com duas condições, que combinação c;
(b) Analisar dados de pesquisa com mais do que opções você deve selecionar no SPSSPW ?
uma variável independenle e uma variável de (a) Simple (Simples) mais Summaríes o f group
pendente o jca ses (Sumário dos grupos de casos)
(c) Analisar dados correlacionados (b) Simple (Simples) mais Summaríes o f separa:-,
(d) Todas as alternativas variables (Sumário de variáveis separadas)
3. Quais são as várias fontes da variância em uma (c) Chtstered (Agrupado) mais Summaríes <
ANOVA com duas variáveis independentes entre groups o f cases (Sumário dos grupos de casos
participantes (d) Clustered (Agrupado) mais Summaríes *;
separate variables (Sumário de variáveis se
(a) Variâncias atribuídas às populações
paradas)
(b) Variâncias atribuídas às duas variáveis inde
pendentes e ao erro Aí questões 6 a 9 se referem às seguintes saídas.
ANÁLISE DE VARIÂNCIA UNIVARIADA
Between-Subjects Factors (Fatores Entre Sujeitos)
Value Label (Rótulos) N

CARBUS 1.00 Cars (Carros) 20
2.00 Buses (Ônibus) 20
AREA 1.00 Town (Cidade) 20
2.00 Country (País) 20
Type III Sum of Mean Squared

Squares (Soma dos df (Média ao Eta Squared
Source (Fonte) Quadrados do Tipo III) (gl) Quadrado) F Sig. (tl2 Parcial)
Corrected Model 8 4 .6 0 0 a 3 28.200 23.178 0.00 0 0.659
(Modelo Corrigido)
Intercept (Intercepto) 577.600 1 577.600 474.74 0 0.000 0.930
CARBUS 4.90 0 1 4.90 0 4.027 0.052 0.101
AREA 12.100 1 12.100 9.945 0.003 0.216
CARBUS * AREA 67.600 1 67 .6 00 55.562 0.000 0.607
Error (Erro) 4 3 .8 00 36 1.217
Total 706.000 40
NCorrected Total 128.400 39
(Total Corrigido)
a. R? 0.659 (R2 ajustado 0.630)

6. Qual é a conclusão óbvia desta saída? (c) Existe apenas um efeito principal
(a) Existe um efeito principal da AREA e uma (d) Existem dois efeitos principais que prova
interação que provavelmente não se devem ao velmente não podem ser atribuídos ao erro
erro amostrai amostrai, mas não uma interação
(b) Existe somente uma interação entre duas va 11. Quantos efeitos estamos comparando contra as res
riáveis independentes, que provavelmente não pectivas hipóteses nulas em uma ANOVA 2 x 2?
se deve ao erro amostrai
(a) 1
(e) Não existem efeitos principais ou interações
(b) 2
(d) Alternativas (aj e (b)
(e) 3
7. Qual é o valor p para o efeito principal do CAR (d) 4
BUS? 12. O teste de esfericidade de Mauchley e':
(a) 0,003 (a) Um teste de hipóteses em que os erros padrões
(b) 9.945 das diferenças entre as médias de variáveis
(c) 0,101 dentre participantes são iguais
(d) Nenhuma das alternativas (b) Um teste em que os dados utilizados na ANO
s. Como o valor F para a interação é calculado? VA são arredondados na fonte
(c) Um leste bem conhecido desenvolvido em um
(a) 4.900 -¡-12.100 hospital psiquiátrico de Londres
(b) 12.100-¡-67,600 (d) Nenhuma das alternativas
(c) 67.600 + 1.217
(d) Nenhuma das alternativas 13. Como você descreveria uma ANOVA 2 x 3 x 5 x
7 x 7?
9. Quanta variação nos erros ao dirigir pode ser debi
(a) Sensível
tada a interação entre CARBUS e AREA?
(b) Uma ANOVA com duas variáveis com três
(a) 93% condições, cinco variáveis com sete condi
(b) 5,2% ções e sete variáveis com uma condição
(c) 60,7% (c) Uma ANOVA com uma variável com duas
(d) 65.9% condições, uma variável com três condições,
uma variável com cinco condições e duas va
10. Olhe para o seguinte diagrama de barras de erro.
riáveis com veie condições
Qual é a conclusão mais adequada?
14. Quais são as fontes de variação em um delineamen
to completo dentre participantes com duas variáveis
independentes?
(a) Efeito principal da variável independente1 mais
erro, efeito principal da variável independente'
mais eiró, interação entre variável independen
te1 e variável independente' mais erro
(b) Efeilo principal da variável independente1, va
riável independente' e a interação entre elas
mais o erro
(c) Efeitos principais da variável independente1, va
riável independente' e a interação entre as duas
Sem álcool Com alcool

15. O r| parcial é:
ÁLCOOL (a) Uma medida do poder de suas análises
Cafeína (b) Igual a rp
i 1 (c) Normalmente bem maior do que rf
a Sem cafeína d Com cafeína
(d) Uma medida da magnitude do efeito
(a) Existem eleitos principais das duas variáveis 16. Qual é a definição de um efeito simples
independentes e uma interação que prova (a) O eleito de uma variável sobre a outra
velmente não podem ser atribuídas ao erro (b) A diferença entre duas condições de uma
amostrai variável independente em um nível de outra
(b) Não existem efeitos principais ou interações variável independente
(c) A maneira mais fácil de se obter um resultado (c) Com testes t relacionados, tendo o cuidad,
significativo de ajustar o valor do a para manter o erro di
(d) Todas as alternativas Tipo I baixo
17. Se você tem uma MS para o seu efeito principal de
12,4 e uma MS para o termo erro de 3,1, qual seria 19. Quantos efeitos estamos comparando contra a re>-
o valor da estatística F 0 pectiva hipótese nula em uma ANOVA 2 x 2 x 27
(a) 6,2 (a) 3
(b) 4,1 (b) 5
<c) 3,1 (c) 7
(d) 4 (d) 8
18. Se você tem um delineamento completamente dentre 20. Se você tem um delineamento 2 x 2 entre paru.
participantes, com cada variável independente tendo pantes, qual deve ser o primeiro passo após g e r-'
duas condições, como examina os efeitos simples? as estatísticas descritivas no SPSSPW ?
(a) Com testes I independentes, sendo cuidadoso (a) Transformar os seus dados
para selecionar os participantes corretos utili (b) Dividir o arquivo de dados
zando o cornando Splil File (Dividir Arquivo) (c) Conduzir um teste /
no SPSSPV,' (d) Realizar uma análise correlacionai
(b) Com testes t independentes, tendo o cuidado
de ajustar o valor do a para manter o erro do
Tipo I baixo
Referências
EKEHAM M AR, B. AKRAM1, N. ARAYA, T. Gender differences in implicit prejudice. Personality
and Individual Differences, v. 34, p. 1509-23, 2003.
FORESTELL, C. A., HUMPHEREY, T. M., STEWART, S. H. Involvement of body weight and
shape factors in ratings of attractiveness by women: a replication and extension of Tassinary ar,_
Hansen. Personality and Individual Differences, v. 36. n. 2, p. 295-305, 2004.
HOWELL. D. C . Statistical Methods fo r Psychology. Boston: PWS-Kent, 2002. 5 h edn.
LOFTUS, G. R. Psychology will be a much better science when we change the way we analyze data
Current Directions in Psychological Science, v. 5, p. 161-71, 1996.
MacFADDEN, A., ELIAS, I ., SAUCIER, D. Males and females scan maps .imilarly. but give
directions differently. Brain and Cognition, v. 53, n. 2, p. 297-300, 2003.
MOGG. K., BRADLEY, B. P. Some methodological issues in assessing attentional biases for threat
faces in anxiety. Behaviour Research and Therapy, v. 37, p. 595-604, 1999.
Análise de Regressão
A análise d e regressão é um a extensão da análise de correlação, abordada no Capítulo 5.

Portanto, se você acha que esqueceu a matéria, é bom reler o capítulo. Na primeira parte do
presente capítulo, mostraremos como avaliar o efeito de uma variável (x) em uma outra (y). Cha
mamos isso de regressão linear bivariada. Na parte final do capítulo, mostraremos como avaliar
o efeito de variáveis (designadas com ox,, x2, e assim por diante) em uma outra variável (y). Cha
mamos isso de regressão múltipla.
Nesse capítulo você irá:
■ avaliar o relacionamento entre a variável dependente e uma ou mais variáveis explica
tivas
, aprender como prever o escore de um informante na variável critério, sabendo os seus
escores em uma ou mais variáveis explicativas
■ usar limites de confiança ao analisar dados com o uso de regressão múltipla
11.1 Propósito da análise de regressão
Psicólogos têm interesse em usar a regressão linear para descobrir o efeito de uma variá
vel (que designamos x) em outra (que designamos y). E parecida com a análise de correlação
simples, mas. enquanto a análise de correlação permite concluir a força da relação entre as
duas variáveis (magnitude e direção), a regressão linear responde à pergunta "Quanto v irá
mudar, se x mudar”? Quer dizer, se x mudar em certo valor, poderemos ter uma estimativa de
quanto v mudará.
Imagine que temos dados sobre a quantidade e o preço de certo refrigerante light compra
do. Se o preço do refrigerante light aumentar o suficiente, as vendas diminuirão (as pessoas
comprarão uma alternativa mais barata). Uma análise de correlação simples nos mostrará que
o preço do refrigerante light e as vendas do mesmo têm uma correlação negativa - podemos
dizer que, quando o preço aumenta, as vendas diminuem. Entretanto, não podemos saber em
quanto as vendas vão diminuir com o aumento de preço. Psicólogos usam a regressão linear
para poder avaliar o efeito que x tem em v. A análise de regressão linear resulta em uma fórmu
la (uma equação de regressão) usada para prever exatamente quanto y mudará, como resultado
de uma mudança em x. Seríamos capazes de afirmar, por exemplo, que, se o preço do refrige
rante light subir 50%, as vendas irão cair 40%.
Como a regressão linear nos fornece uma medida do efeito que x tem em y, a técnica per
mite prever v de .v. No exemplo dado, se soubermos em quanto as vendas de refrigerante /á
diminuirão, como resultado de cada centavo de aumento, poderemos prever as vendas d
refrigerante pelo preço. Em uma situação experimental, psicólogos podem usar a regressl
linear para sugerir que um escore em uma variável influenciou o escore em outra variáve
Dessa maneira, tentam inferir relacionamentos de causa.
A análise de regressão pode ser usada para:
■ avaliar o efeito de estresse nos sintomas de um resfriado (p. ex.. nariz com coriza, c -
de garganta, tosse);
■ prever a habilidade em matemática de crianças a partir da medida da habilidade ..
leitura delas.
Quando conduzimos uma análise de regressão, procedemos exatamente da mesma n';_
neira como em um delineamento de correlação: as duas variáveis são examinadas para ver -.
existe um relacionamento linear (um relacionamento que pode ser melhor descrito por u r .
linha reta) entre elas (ver Capítulo 5). Isso é explicado com mais profundidade a seguir.
Por exemplo, considere o exemplo do relacionamento entre notas em um simulado de ¿
tatística e notas em um teste final de estatística. Existe um relacionamento positivo entre es'_-
duas variáveis: as pessoas que têm um bom desempenho no simulado tendem a ter um b.
desempenho no exame final. Obviamente, o relacionamento não é perfeito: algumas irão c --
ter boas notas no simulado, mas ter um desempenho ruim no teste final; outras com péssirr
desempenho no simulado irão obter notas boas no teste final. Para conduzirmos uma anál ■_
de regressão, coletaríamos dados do escore do simulado e do escore do teste final de todo- -
alunos em um ano específico. Se o relacionamento fosse positivo e forte o suficiente para ur .
previsão, poderíamos observar os escores do simulado dos alunos do ano seguinte e ter uma r .
idéia do seu desempenho no teste final. Portanto, poderíamos identificar os alunos em perigo
não obter aprovação no fim do ano (antes do teste final!) e talvez oferecer um apoio extra. E-
é um exemplo de quando psicólogos usariam a equação de regressão para fazer previsões.
Entretanto, os psicólogos geralmente não usam regressão linear para fazer previsões t
uma amostra nova. Os resultados da análise de regressão, porém, não mostrarão quant
muda como resultado da mudança em x. No exemplo acima, o desempenho no simulado r.I
causa os escores no teste final. Todavia, o desempenho no simulado precede o desemper
no teste final - ambos estão relacionados em um sentido previsível e temporal. Como me
cionado. às vezes os psicólogos podem sugerir relacionamentos causais usando esse métec
E difícil afirmar que mudanças em uma variável provocam mudanças em outra, mesmo qu^‘-
do os dois eventos ocorrem em pontos diferentes no tempo, pois outra variável intervenie- ¡
pode estar influenciando os escores em ambas as variáveis. Essa é, claramente, uma limita, 1
dos delineamentos de correlação.
11.1.1 Duas variáveis, x e y

A variável que está sendo prevista é chamada de critério ou variável dependente. Tambér
denominada de y.' A variável que prevê a variável dependente é, obviamente, chamada de n;
velprevisora (ou explicativa) (variável independente). Ela também é denominada de x.
Um valor verdadeiro de y e sim plesm ente representado por v. mas um valor previsto é designado y.
As vezes as variáveis explicativas sao chamadas de variáveis “independentes”. Todavia,

pode ser um pouco confuso chamai as variáveis de “independente" e “dependente”, pois não
estamos manipulando a variável independente dc maneira alguma. Por exemplo, não designa
mos os alunos u grupos. Estudos que usam a regressão linear são delineamentos de correlação
(p. ex., você quer verificar se as duas variáveis estão relacionadas, em vez de procurar por uma
diferença entre condições, como fizemos no Capítulo 6). Portanto, neste capítulo, chamamos
de explicativas as variáveis que prevêem, ou explicam, os escores da variável dependente.
11.1.2 Linha de regressão

Se você entendeu o capítulo sobre correlação (Capítulo 5), não deve ser muito difícil en
tender a regressão, pois são processos muito parecidos. Por exemplo, a análise de correlação
nos fornece uma medida que representa o quão próximo os pontos de dados estão agrupados
em torno de uma linha (imaginária). Fornece uma medida de quanto y muda como resulta
do de x, e, portanto, não permite prever o escore de uma pessoa em y a partir de x. Como já
mencionamos, a regressão linear permite fazer essa previsão, pois, em vez de uma linha ima
ginária, desenhamos (o computador desenha) uma linha real.
Observe os dados na Tabela 11.1. Podemos plotar as notas em um gráfico exatamente
como fizemos com os dados nos exemplos do Capítulo 5. E conveniente designar a variável
explicativa de .v, ja que utilizamos o eixo x no gráfico, e chamar a variável de critério de y,
pois usamos o eixo y.
Ao observar o diagrama de dispersão da Figura 11.1, você provavelmente pode ver que
existe uma correlação positiva entre x e y (+0,9), mas até agora somente pode afirmar que,
quando as notas do simulado aumentam, as notas do teste final também aumentam. Os pontos
se agrupam justamente bem perto da linha imaginária, mas como podemos prever as notas
de uma pessoa na prova final a partir de suas notas no simulado? A resposta, obviamente, é
a regressão linear. E um método pelo qual colocamos uma linha reta nos dados. Essa linha é
desenhada no melhor lugar possível - quer dizer, nenhuma outra linha encaixaria tão bem.
Por isso é chamada de linha de melhor aderência - falaremos mais sobre isso nos próximos
parágrafos (ver Figura 11.2).
Com uma linha reta representando os dados, podemos ir além do que simplesmente dizer
“quando .t aumenta, y aumenta”. Na verdade, podemos afirmar que, “para cada unidade de
mudança em x, y muda uma quantia específica". No exemplo, podemos dizer: “para cada
aumento de 20 pontos na nota do simulado, as notas do teste final aumentam 18”.
T abela 11.1 Percentagem de acertos no sim ulado e no teste final
% de acertos no sim ulado (previsor)x % de acertos no teste final (critério) j 1
50 55
30 20
60 59
75 78
40 55
90 70
15 20
19 15
64 60
80 84
90 i
80 -
70 -
60 -
râ 50 -
iZ 40 -
30 -
20 -
10 -
0 i------------ 1------------ 1------------ 1------------ 1------------ 1

0 20 40 60 80 100
S im u la d o
Diagrama de dispersão dos resultados no simulado e no teste final.

Figura 11.1
S im u la d o
Figura 11.2 Diagrama de dispersão com a reta de melhor aderência.
Observe a Figura I 1.2. Podemos usar a linha para prever o escore de uma pessoa em
partir de .v. Prevê-se que uma pessoa com escore de 60 em jc terá um escore de 59 em v. I :
fato, se você olhar para a pessoa (Mena) com um escore de 60 em x, verá que teve um es^ -
de 59 em y - portanto, a linha foi correta na previsão do que teria para Mena. Lntretar'
previu-se para .lack, que teve um escore de 90 em x, um escore de 86 em y, mas na verdi_:
seu escore foi 70 em y. Portanto, a previsão para Jack não é boa. A linha fornecerá a me '
previsão possível para os participantes em geral.
Você pode estar imaginando como fomos capazes de calcular os números para os exe~
pios, como soubemos que as notas finais aumentam 18 pontos para cada aumento de 2i -
simulado. Embora pudéssemos calcular isso matematicamente, é mais fácil fazê-lo c o r
SPSSPW. A inclinação da linha (chamada de b) fornece uma medida de quanto y muda qu_-
do o -v é alterado. Quanto maior o valor de b, mais íngreme a inclinação. O uso de uma ):r _
reta, como no exemplo, permite prever o escore de uma pessoa em y a partir de ,v. Você -.
poderia fazer isso com uma simples correlação. O truque é desenhar a linha no lugar coir=‘
(Diferentemente de nós, o SPSSPW não tem dificuldade com isso...)
SPSSPW: traçando a linha de melhor aderência
Hscolha Graphs (Gráficos), então Scatter (Dispersão).
< Sla .ll fs £ V) JJ 5* Üí3 'vs®* M*-■

ffifrcgaaj MaJ______| ,jjE«*»na E \& ie t | i^ ¡W rZc 'ç - r e r p | ¡ y Vkjok* WoxJ -eg |
Você precisa escolher o diagrama de dispersão correto entre quatro opções: escolha Sim
ple (Simples).
Assegure-se de
que a opção
Simple (Simples)
está destacada,
pressione
Define (Definir)
o»1«1 •" c ;.-3 ». » Si’15sou« ir,x

__I E I C^Wr^C .Ti | " ff HKtMtñWuó 't í || j j rh*p1 im n rk lr,
As duas variáveis (a explicativa e a de critério) são movidas da lista das variáveis para .
caixa apropriada no lado direito.
a|B|a|g| I I I Mi>H»H~naaiini
_L _L
56 01
7000
20 00 C 3 n m ~
Mova a variável
1900
Ó4Q0 _ XAji
90 00 I_I I• ' explicativa para
a caixa X Axis
□ f (Eixo X) e a
□ r de critério para
a caixa Y Axis
(Eixo Y),
TBc; | clique em OK
v«w < v í 5 S v w 7 1_jJ_____________________

SPSS Pweessa o
Mjrf______ | íjE-yk*n ) E VjpMçi | Q W r Z c k k z v & | gyMtaoiCflWort '-cg [| gy. rhupl 1_«m ao IO
Depois de clicar em OK, a saída será como a seguinte. Assegure-se de dar um cliq_
duplo no gráfico.
Eis um dia
grama simples
de dispersão
dê um clique
duplo nesse
gráfico
H i______ | jL jE t o f j E ■¿c«: | CjWrZp iç.:;o ap | 'c | I 'r.j

Esse procedimento permitirá que você tenha opções de gráficos.
Escolha Chart
(Diagrama) e
Options
(Opções),
Verifique agora se marcou a opção / it Line TotaI (Trace a linha - total)
em aE E B 23E aa«K H aM i » .
q| alfalfe I
I I Ul I
M arque o Fit
Line Total (Trace
a linha -Total)
e clique em OK
<
Z
0 20
MOCK
if S i P>oce»toi a wjd»
ff. £ 'A Si 0938
BSPvamaMai I ¿jE*fcma Eva I c^WfCo : 1 I nrHcro:VI Wold I it f c h v ll. inocWi I f ô OUOu» SP':S ||r~ C h w ll ■ SI*S " ^
Escolhendo a opção Fit Une Total ( Trace a linha total), você obterá a linha de melh -
aderência.
fie E<y Vww G *iy ChJd St«* Fomal Aral/re Gucha Mo
gigifcl&l
PJ Tl-^l I I IÀj J
Aqui está
sua linha
de melhor
aderência
<S<art ¡'i> t f JJ =»
| ^jE<torxi E\a | l^Wr¿o id-jc | grwocomrwod | fej»aaH.irorti. | S<*S IJu«l1 - SPS
Atividade 11.1
Tente explicar como a análise de regressão difere de uma correlação simples. Que inforrr;
ção extra a análise de regressão forneço?
11.1.3 Previsões a partir da linha

Nas próximas seções, observaremos como usar uma linha para prever uma variável a
tir de outra. Para ficar mais fácil, começaremos com os relacionamentos mais perfeitos.
Relacionamentos perfeitos - positivos

Começaremos com o que você já conhece (Figura 11.3). Você notará imediatamente - . :
a Figura 1 i.3 mostra uma correlação positiva perfeita. Uma linha reta é desenhada por rr. :
dos pontos de dados. Como a correlação é perfeita, a linha passa por cada ponto de d^: •
Nesse caso. a linha de melhor aderência encaixa-se aos dados perfeitamente.
60-]
O ponto no qual a linha

intersecta o e ix o y é cham ado
de a . Tam bém é denom inado
de intercep to . A qui você
pode ver que a = 0
Traçado de x com y.
Figura 11.3
Toda vez que x aumenta 1, v aumenta J0 (certifique-se de confirmar isso verificando a

Figura 11.3.). O zero é o local no qual a linha intercepta o eixo y. Isso quer dizer que, quando
uma pessoa tem um escore zero, tem um escove de zero também em y. Por exemplo:
x y
As notas
0 0
aum entam
1 10 \ 10 unidades
2 20 < a cada vez
3 30 <
4 40 >
5 50
etc.
Você também pode ver pela tabela que y aumenta 10 unidades a cada unidade de mudan
ça em .v (p. ex., 1). Note que essa mudança é constante.
A quantia que y muda quando .v muda por I é chamada dc b, que consiste na inclinação
da linha.
11.1.4 Equação de regressão
Quando conduzimos uma análise de regressão linear, obtemos uma equação de regressão,
que nos mostra a maneira como y muda enquanto resultado de uma mudança em x. Com essa
fórmula, podemos calcular o escore de alguém em y a partir do escore dessa mesma pessoa
em v. A fórmula geral segue:
y = bx + a
ou
y = a + bx
Isso significa que, para qualquer indivíduo, ypodeser previsto pelo valor da inclinaci'
da linha multiplicado pelo seu escore .y, somado aovalor designado por a (intercepto).
■ y é um valor da variável a ser prevista
■ X é um valor da variável x
■ b é a inclinação da linha
■ a é a constante, quer dizer, o lugar onde a linha intercepta o eixo y (ponto tambe-
chamado de intercepto)
A equação de regressão mostra a maneira como y muda enquanto resultado da mudanc.
de x. Quanto mais íngreme a inclinação (chamada de b). mais y muda como resultado de
Portanto, a inclinação é uma parte importante dos resultados, quando se elaboram relatóri, -
de laboratório. Na equação de regressão abaixo, a linha tem uma inclinação de 10. Isso qur
dizer que, cada vez que x aumenta 1 unidade, y muda 10. Somente essa informação já é úi:
mas, como havíamos mencionado, a regressão permite a previsão. A equação abaixo m o s
que y é capaz de ser previsto pela multiplicação do escore de uma pessoa em .v por b, que é 1
somado à constante a (que nesse caso é 0).
No exemplo, a - 0 (ponto inicial no gráfico, intercepto, constante) e b = 10. Portanto:
Esse valor (10) é conhecido

como £>: cada vez que x
aumenta uma unidade,
y aumenta 10 unidades
v = a + 10 x
Nesse caso a = 0 (quando

uma pessoa tem um escore
0 em x, essa pessoa terá
um escore 0 em y)
Se dissermos agora que uma pessoa tem um escore de 7 em .v, você será capaz de pre- _-
o escore em y.
y = 0 + (10 * 7) = 70
*significa multiplicar
Portanto, uma pessoa com um escore de 7 em x tem a previsão de ter um escore de 70 e~

V. Se você observar o gráfico acima, será capaz de confirmar essa afirmação.
Obviamente, e' mais fácil prever o escore de uma pessoa quando todos os pontos e<;
em linha reta. Você sempre acerta! Alguns alunos se confundem nesse ponto, pensando ■
razão pela qual se prevê um escore quando já se sabe seu valor. Se nossa equação de regres^;
foi capaz de fazer uma previsão com alto grau de certeza, significa que poderíamos usa- .
em outra amostra, na qual não temos informação sobre y. Isso se parece com a informas 1
dada pelas seguradoras de que motoristas jovens do sexo masculino se envolvem em nu
acidentes do que outros grupos de pessoas. Quando você tenta comprar um seguro de cár
pela primeira vez, a empresa não precisa saber sua habilidade como motorista - sua idade e
fato de ser homem ou mulher serão utilizados para prever a probabilidade de você se envolver
em acidentes e custar dinheiro à seguradora (não adianta insistir que você é um caso atípico).
Para nossa sorte, pessoas acima de 40 terão seguros mais baratos - mesmo que sejam péssi
mos motoristas.
Atividade 11,2
Qual é o escore previsto de uma pessoa em y quando o seu escorc em x é igual a 20.
Considere a = 5 e b = 2.
R e síd u o s
Se usar a linha de melhor aderência para prever o escore de uma pessoa, a não ser que
tenha um relacionamento perfeito, você sempre terá alguns erros. Observe a linha de melhor
aderência para o refrigerante Arrotcola na página 396. Alguns pontos de dado- estão na linha;
outros, mais distantes. Esses representam erros de previsão.
Se usarmos nossa linha de melhor aderência a fim de prever vendas para cada preço, ob
teremos um número previsto de vendas. Podemos comparar essas previsões com os números
de vendas reais. Se a linha de melhor aderência for realmente um bom modelo, as diferenças
entre os números verdadeiros e os previstos serão pequenas; se a linha de melhor aderência
for um modelo ruim as diferenças serão grandes. As diferenças entre os escores verdadeiros
e os previstos são chamadas de resíduos. Os resíduos são particularmente importantes na
regressão múltipla e, portanto, os veremos posteriormente no capítulo. O SPSSPW fornece
os resíduos. Se você estiver interessado em explorar o assunto mais a fundo, existem muitos
livros com capítulos mais avançados sobre regressão linear.
Se não existisse um relacionamento entre x e y, y não poderia ser previsto por x de ma
neira alguma, e a linha seria horizontal. Quando x e y não têm relacionamento, qualquer linha
de melhor aderência é tao adequada quanto qualquer outra, mas é convenção que nesse caso
a linha seja desenhada na horizontal, tendo, portanto, b = 0.
A Figura 11.4 mostra que x e y não são relacionados (correlação zero. isto é, r = 0); y não
é capaz de ser previno por x (b = 0).
20 -|
O
>
c
u
O
>
LU
10
0 2 3 4 b 6 7 8
Prazer pela tarefa
Relacionamento igual a zero

R elacionam entos p erfeitos - negativos

Não e somente no caso de relacionamentos positivos que podemos fazer previsõe-
Existem também os relacionamentos negativos. Por exemplo, suponhamos que x seja
número de horas assistindo televisão por noite. Digamos também que y sejam notas em u~
teste no fun da semana escolar. A Figura 11.5 é o gráfico (os dados são fictícios). Poden:.
ver que, quando o número de horas assistindo televisão aumenta, as notas no teste dirr -
nuein. O relacionamento é perfeito; quer dizer, a linha reta pode ser desenhada de mane;-.
a passar por cada um dos pontos de dados.
Se você observar a Figura I 1.5, verá que y diminui 3 unidades cada vez que x aumenta
Observe os seguintes dados:
Observe que, quan X y

do x = 0, y = 18.
Isso significa que
- 0 18
o intercepto é 18
l 15
2 12
Os núm eros dim inuefr
i 9- na razão 3.
4 6
5 3
6 0
Aqui você pode ver que, cada vez que x aumenta 1, y diminui 3. Você também pode ■
que a linha de melhor aderência interceptou o eixo y no ponto 18.
■ y= notas emum teste
■ x= númerodehoras de televisão assistidas
■ a= 18
■ b= 3
Diagrama de x ey.
Figura 11.5
Portanto:
Esse 18 é o a
E esse é b
y —18 - (3.r)
Sinal de menos; portanto, relacionamento negativo
Se disséssemos que uma pessoa assistiu 3,5 horas de televisão por noite, que valor você
preveria como escore do teste? Você pode descobrir pelo gráfico - deslize uma régua para cima a
partir do ponto 3,5 no eixo dos x na direção da linha e. depois, usando a régua horizontalmente até
encontrar o eixo v. Entretanto, você não precisa obsen ar o grafico. Pode calcular pela fórmula:
y = 18-(3 x )
Portanto:
y= 18 -(3*3,5)
Os parênteses nos mostram que a soma dentro deles deve ser calculada primeiro. Então:
18 - (3*3,5) = 18-10,5
= 7,5
Portanto, prevemos que uma pessoa que assiste a 3.5 horas de televisão por noite tem
um escore de 7,5 em um teste. O sinal negativo significa que se trata de um relacionamento
negativo: enquanto uma variável aumenta (x), a outra diminui (_y).
In te r c e p to
Na Figura 11.6, a linha começou no 5 (isso significa que uma pessoa com escore de zero
em x, teria um escore previsto de 5 em y). Obviamente, às vezes seria impossível ter um es
core de zero em x ■se x representasse o quociente de inteligência (QI), por exemplo. Não se
preocupe com isso agora. Para cada valor de x, y aumenta 5. Portanto, a fórmula de que você
precisa para prever é:
>>= 5 + 5x
Se uma pessoa tem um escore de 3 em x, o escore previsto em y será:
y 5 + (5*3)
= 5+15
= 20
Então, se x é igual a 3 unidades, há uma previsão de 20 para y. Você pode verificar isso
observando o gráfico da Figura 11.6. Lembre-se que a é também chamado de constante e às
vezes de intercepto. O número multiplicado por x, como você já viu anteriormente, é chama
do de b\ b é a inclinação da linha.
30
25
70
y 15
10
0 H--------- 1-------- r-------- 1-------- 1-------- 1------- 1

0 1 2 3 4 5 6
x
Figura 11.6 Diagrama dey contra x.
Relacionamentos não-perfeitos
Como mencionamos anteriormente, é fácil fazer previsões com um relacionamento pe--
feito, pois sempre se acerta. Todavia, considere o seguinte gráfico de um relacionamen:
não-perfeito (Figura 11.7).
Aqui não podemos desenhar uma linha reta que passe por cada ponto de dados. Pare.,
ser impossível prever y a partir de x. Todavia, é possível. A linha não será perfeita, pois nl
passará por cada ponto, mas, se pudermos desenhá-la pelo melhor local possível, poderão
feitas previsões.
O que você precisa fazer é desenhar a linha no melhor local possível, um lugar ondt
maior número de pontos esteja próximo da Unha, que forneça a melhor aderência aos dadi <
A linha deve ser desenhada para que esteja o mais próxima possível dos pontos. Isso é difu
de fazer, por estimativa. A maioria das pessoas tenta desenhar uma linha através do “mei
dos pontos. Todavia, às vezes é difícil ver onde se localiza o meio.
60
50
40 -
y 30 -
20
10 -
—i—
0 10 20 30 40 50
Diagrama de x com y.
Figura 11.7
Como um exercício, tente estimar a linha de melhor aderência. Normalmente, não pre
cisará fazer isso. pois seu pacote de computador calculará a equação da linha e inclusive
desenhá-la.
Digamos que a = 5. Significa que sua linha deve interceptar o eixo y em 5. Se você dese
jar, desenhe a linha, usando um lápis leve. Obviamente existem muitas linhas diferentes que
poderiam ser desenhadas. Você deve tentar desenhar a “melhor” linha. Se estiver trabalhando
com outras pessoas, veja se sua linha está na mesma posição que a deles: será que eles esco
lheram a mesma linha pelos pontos que você escolheu? As chances são de que não tenham
escolhido. Portanto, nesse ponto, não sabemos qual será a fórmula (chamada equação de
regressão), mas podemos escrevê-la, de algum modo, utilizando letras em vez de números.
Existe um valor que já conhecemos, o a. Esse é o ponto inicial do gráfico, o ponto no qual a
linha intercepta o eixo y. Então:
y = 5 + bx
ou
v = bx + 5
Não importa qual das equações você vai escolher, pois são equivalentes.
Note que usamos o sinal positivo (+) na fórmula geral e na equação para esse exemplo, já
que sabemos que o relacionamento é positivo. Entretanto, se o relacionamento entre ,v e y fosse
negativo (então o valor de b seria negativo), o sinal "positivo" mudaria para um sinal negativo.
EXEMPLO: VENDAS DE REFRIGERANTE LIGHT
Vamos voltar ao exemplo do refrigerante light. Existem muitas alternativas de re

frigerantes lighf, portanto, se o preço de um. chamado Arrotcola, aumentar demais, os
consumidores procurarão outra opção. Os fabricantes do Arrotcola fizeram uma pesquisa e
encontraram os dados expostos na Tabela 11.2.
Primeiramente, vamos observar o diagrama de dispersão (Figura 11.8).
Fica claro que existe uma correlação negativa entre o preço do Arrotcola e os números
de vendas. Quando o relacionamento entre x e y não e' perfeito, temos de selecionar todas
as linhas possíveis que poderiam ser desenhadas por meio dos escores, como você tentou
previamente. Precisamos da linha que fornece a melhor aderência aos dados. Existem mui
tos métodos para calcular a linha de melhor aderência. Uma maneira usada pelo SPSSPW é
minimizar as distâncias verticais entre os pontos e a linha. Essa é chamada linha de regres
são de mínimos quadrados. No exemplo, a linha dc melhor aderência pode ser desenhada
pelo SPSSPW.
Todos os escores na Figura 11.8 estão agrupados em torno da linha - esta, portanto,
será capaz de fazer uma boa previsão. Ela “adere’’ bem aos dados. A fórmula usada permite
que a linha seja desenhada no melhor lugar possível (p. ex., irá nos dar a melhor previsão
possível). Por esse motivo, é chamada linha de melhor aderência.
Todavia, os dados geralmente não são tão alinhados. Olhe para a Figura I 1.9. Nesse
diagrama de dispersão, você pode ver que os pontos não se agrupam tão perto da linha
como na Figura 1 1.8. Aqui a linha está no melhor lugar possível - qualquer outra linha não
daria uma previsão tão boa. Você pode ver que não será tão adequada quanto a da I igura
1 1 .8, pois as distâncias entre os pontos e a linha são maiores.
Uma vez desenhada a linha de melhor aderência, podemos fazer previsões a partir
dela como explicado na página 389.
Tabela 11.2 Preços e vendas da Arrotcola
Preço por garrafa Vendas em milhares
80 500
81 500
82 499
83 498
84 497
85 450
86 445
87 440
88 439
89 438
90 400
91 380
92 370
93 360
94 330
D istâncias verticais
entre pontos de
dados e linha
78 80 82 84 86 88 90 92 94 96
Preço
Diagrama das vendas versus preço.

Figura 11.8
600
500
400
Preço
D ia g ra m a das ve n d a s versus p reço.

Figura 11.9
Quando você conduz análises de regressão usando um pacote para com puiadore'.
obtém todas as informações necessárias para escrever a seção de resultados. O SPSSPV>
fornece a correlação entre x e y e os números para a (o intercepto, ou constante) e b •_
inclinação da linha). O conhecimento do valor da inclinação, ¿>, é essencial, mas vol¿
também quer saber se a altura da inclinação é significantemente diferente do que espera
ria por erro amostrai. Isso pode ser feito com uma tabela de sumário da ANOVA - com -
qual você já está acostumado a trabalhar. A inclinação da linha, b, também é convertic.
em um valor padronizado ((3). Isso responde a pergunta, “se .r muda por um desvio pa
drão. por quantos desvios padrões v mudará?” (escores padronizados foram discutid
no Capítulo 3).
□ SPSSPW: análise de regressão linear
Selecione Analyze (Analisar), Regression (Regresssâo), Linear (Linear).
Escolha
Regression
(Regressão
e Linear
(Linear)
5*ÉÊLd.415»
E31 - _ J I • j» ■___- ____ ■■ - li i? rh-.pllr«*« j _ . A 8 « ___ | r~ .■ jj SC : 4ão,|.9
HLTi - Ifflx iB
a : | B [ a [ 5ii i i s i M i > i M H - | i - i a a i r . i « te i
----------- 2
1B«|
Mova a variável
de critério para
a caixa
Dependent
(Dependente) e a
variável explica
tiva para ,i caixa
Independent x
(Independente)
e clique em OK
JSsiortl P5É23 ' ÍZdQ- O

•
'-»ji I .ÁjE-ptanQ E 'J I ¡^ V-Cc :z r ,X I |yw<-OMl-WoaJ ||^rJwyl1r iÔJaxi S"SS I SPSS Z | rz-i
Verifique se a variável a ser prevista (a variável de critério) é retirada do lado esquerdo

e colocada na caixa Dependent (Dependente) e se a variável explicativa é colocada na caixa
Independent (Independente). Na caixa Method (Método) deve-se ler Enter (Entrar). Depois,
clique em OK.
Verifique se
essas caixas
foram marca
das. Você
pode também
desejar
Descriptives
(Descritivas).
Clique em
Continue
(Continuar)
SPSS Pwtmí B
_ ij_ I
* • ”« ' í > tf. . * i. 2» -» . “v 0551
BFcjswiMtd I ■£** I ¡5Wr£e m uv | »McwrtWwd ||||dU )H coke 9PS r | ■8 0 m f>
Você precisa clicar na opção Confidence intervals (Intervalos de confiança). Também

pode desejar estatísticas descritivas. Se esse for o caô, clique na caixa devida.
O programa retornará à caixa de diálogo Regression (Regressão). Clique em OK.
11.1.6 Partes importantes da saída

Como a saída para a regressão linear é muito longa, vamos dividi-la em partes mais fáceis
de lidar e explicar cada uma. O resumo do modelo é o seguinte.
Model Sumary (Resumo do modelo)
Model Adjusted R Square Std. Error of Estimate

(Modelo) R R Square (R2) (R2 Ajustado) (Erro Padrão da Estimativa)
1 ,968'! .937 .932 14.8737
Predictors: (constant), per botile (a. Preditores: Constante, por garrafa)
Correlação entre x e y
A correlação entre x e y é um simples r de Pearson, representada na saída por R (tamben:
conhecido como R múltiplo). Em nosso caso, esse valor é 0.968, uma correlação forte. Re
lataríamos a correlação como 0.97 (é usual arredondar para dois decimos). Essa correlação e
importante, pois mostra o quão próximo os pontos se agrupam em torno da linha de melhor
aderência. A previsão provavelmente será melhor quando a correlação for alta. Se os ponto'
dos dados estiverem longe da linha, a previsão não será muito boa.
Variância explicada
Aconselhamos elevar o coeficiente de correlação ao quadrado para obter uma medida
da variância explicada. Porém, em uma análise de regressão linear você não precisa se pre
ocupar, pois o SPSSPW terá feito isso para você! Como pode ver esse valor está em torn:
de 0,937. Portanto, aproximadamente 94% da variância das vendas da Arrotcola podem se'
expliçadas pela variância do preço, para a nossa amostra.
R2 ajustado
O R é ajustado pelo SPSSPW para justificar número de participantes e variáveis na aru-
lise. O R ‘ é otimista demais, pois a linha de melhor aderência se baseia em uma amostra. ;
não na população. Queremos generalizar nossos resultados para a população, portanto, o R‘
ajusta o número para fornecer uma estimativa mais realista. Em nosso exemplo, a variân«...
explicada é de 93%.
Erro padrão
Lembre-se de que nossas estatísticas não estão livres de erro. Analisamos nossos rest -
tados como uma amostra específica, e pode ser que uma amostra, em um outro dia, forne. _
resultados um pouco diferentes. Com amostras repetidas, encontraríamos um raio ou garr.
de valores - os desvios padrões de tais distribuições são chamados de erro padrüo (ve:
Capítulo 3). O erro padrão nos dá uma medida de quão correta nossa estimativa pode v.:
a ser. Erros padrões são estimados. Esse número é uma estimativa da variância de y, par
eada valor de x.
' O R múltiplo nunca é fornecido corno um valor negativo. por motivos que não nos interessam nesse m om ento. O sinal da incljn_.
da linha inform ará se o relacionam ento é negaiivo ou positivo. Em nosso caso e negativo.
Na fórmula específica para esse exemplo:

■ y = vendas
■ x = preço
■ a = 1513,96
t = -12,39
vendas = (-12,39 c x) + 1513,90
O valor t acima e o nível de significancia encontrado mostram a significancia estatístic..
da variável explicativa.
11.1.7 Ilustração gráfica

Já mencionamos que a linha de regressão, b, é - 1 2,39. Entretanto, os limites de confiança
permitem afirmar que existe 95% de confiança de que a linha de regressão da populaça
pode estar entre • 10,47 e -10,31. E muito útil verificar isso em um gráfico; para nossa sorte
pode-se fazê-lo facilmente pelo SPSSPW (Figura I 1.10).
A inclinação da linha amostrai está no meio, isto é b = -12,39. Temos 95% de con
fiança de que a inclinação populacional está em algum lugar entre a linha inferior e a linha
superior.
600
Limite superior estimado
da reta populacional
£ 500
Linha de regressão
amostrai
400
Limite inferior estimado
da reta populacional
Preço
Figura 11.10 Linha de regressão com os limites de confiança.
11.1.8 Relato dos resultados
Para os relatórios e projetos de laboratório, você provavelmente preferirá relatar tod.

a saída do SPSSPW. Todavia, a parte textual da seção de resultados pode conter o segui nu
relato:
U m a regressão linear foi conduzida para determ inar o efeito da m udança de preço nu
vendas do Arrotcola. C on statou-se que, para cada centavo de aum ento no preço, as vend^
dim inuíam 12,390. o que representa quase um d esv io padrão. O s lim ites de confiança forar
estreitos, o que dem onstrou que tem os 95% de confiança de que a inclinação da população e>:.
entre -1 4 ,3 1 e -1 0 .4 7 . F ( l , 13) = 194,16 teve um nível de probabilidade associada de p < 0.0( '
dem onstrando ser im provável que os resultados tenham sido obtidos por erro amostrai, sendo í
hipótese nula verdadeira.
11.1.9 Não-linearidade
Não adianta tentar fazer uma regressão linear se os dados não são lineares. Lembre-se do
significado de linear: toda vez que o valor de x aumenta, y muda por um valor constante - uma
linha reta pode descrever adequadamente o relacionamento entre x e 3: Volte ao Capítulo 5
caso preciso relembrar disso.
Estudo adiciona peso ao antigo conto da parteira
O tamanho da caixa de chocolates dado a parteiras pelos pais dos recém-nascidos aumenta com
o peso do nenê ao nascer, de acordo com uma pesquisa que confirma um antigo folclore canônico
da medicina obstétrica. A correlação foi descoberta por Andrew Nordin, um médico em Taunton,
Somerset. Seu estudo de seis meses envolvendo parteiras na sala de parto e duas alas pós-natal do
hospital Musgrove Park está publicado no periódico médico americano Obstetrics and Gynecology
(Obstetrícia e Ginecologia). Pediu-se às parteiras que anotassem 0 peso dos doces recebidos pelos
pais agradecidos e o peso do nenê ao nascer.
O australiano D r. Nordin, um escrivão em obstetrícia e ginecologia, teve a idéia desse estudo
como parte de um trabalho de auditoria médica de rotina. "Lev amos a auditoria muito a sério, mas
tradicionalmente tentamos nos divertir um pouco com a auditoria do Natal.” disse o médico.
Em seu estudo para 0 periódico, Dr. Nordin chama a atenção para 0 seguinte: “A análise de
regressão descobriu uma associação entre o peso do recém-nascido e o do chocolate, com uma
equação de correlação linear de y - 3349 + 0,52058.v".
O Dr. Nordin está preparando a apresentação do seu estudo no encontro de outono dos obste
tras e ginecologistas do sudeste da Inglaterra, no final do próximo mês. Ele espera que esse estudo
inspire uma investigação mais abrangente dos elos existentes entre os presentes dados pelos pais e 0
peso dos nenês ao nascerem, talvez envolvendo 0 uso de garrafas de vinho e latas de biscoitos.
(Retirado de um periódico inglês, 1993)
Atividade 11.4
Observe este gráfico:
12 1
10 -
8 -
6 -
4
2 -
0 i------ 1------ 1----- 1------1---- 1-------1

0 2 4 6 8 10 12
1. Qual é a resposta correta?

(a) b = 0
(b) b = 5
(c) b = 1
2. Na análise de regressão, os escores d ey previstos são designados de:
(a) y
(b) x
(c) y
Graus de liberdade3
O conceito de graus de liberdade (gl) é complicado, e existem maneiras diferentes de explicá-lo.
Aqui falamos sobre os graus de Jiberdade em termos de tamanho da amostra. Lembre-se, é uma
explicação conceituai. Dr. Chong Ho Yu (2001) usa a regressão linear para explicar graus de li
berdade. Agora que você tem uma boa base em regressão linear, a explicação do Dr. Yu o auxiliará
no entendimento dos mesmos. Dr. Yu mostra que, em um diagrama de dispersão de regressão
linear com somente um ponto, você não tem graus de liberdade - você não pode estimar a linha
de regressão.
Esse diagrama nos mostra somente um ponto - se você tentar desenhar a linha de regressão,
qualquer linha é tão boa quanto qualquer outra. Isso não e muito útil. Os graus de liberdade para
regressão são n - ,1. (onde n é o número de pontos de dados). Portanto, aqui, gl = 0(1 1 = 0). Corri'
Dr. Yu diz. 'os dados não têm ‘liberdade’ para variar, e você não tem ‘liberdade’ para conduzir a
pesquisa com esse grupo de dados”. De fato, se você tentar condu/ir tal análise no SPSSPW, obter^
uma mensagem de erro.
Agora imagine que você tem dois pontos para sua regressão linear.
Ver tam bém caixa (destaque) na página 228.

a Cuidado: nem sem pre é n - 1.
10 -,
8 -
6 -
4 -
2 -l — ,-----------------------T---------- T-----------1
0 2 4 6 8
Quando existem somente dois pontos, uma linha reta sempre será a de melhor aderência. Nesse
âso, existe um grau de liberdade para a estimativa: gl = I (2 - 1 = 0). Ce você tentar isso no SPSSPW,
obterá uma saída. Todavia, os resultados não significam nada, pois já sabemos que a linha é perfeita.
Não poderia ocorrer de outra maneira com somente dois pontos.
Agora observe este gráfico de dispersão.
10
8 -
2 -t-------- 1----- 1-------- 1-------- 1

0 2 4 6 8
Aqui a linha de melhor aderência é demonstrada entre três pontos; portanto, os graus de liber
dade são 2. Dessa vez, a linha tem mais liberdade para variar, pois a linha de melhor aderência não
está restrita pelo caminho entre dois pontos.
O Dr. Yu define graus de liberdade como "o número de informações úteis”. Quando tínhamos
gl = 0, não existia informação útil. Quando tínhamos gl = I. não existia informação suficiente
para ser útil. Mesmo com gl = 2, ainda não existia informação adequada para conduzir uma aná
lise útil.
O Dr. Yu tem uma explicação audiovisual on-line sobre graus de liberdade, com atividades in
terativas. Fornecemos o seu endereço virtual para que você possa aprender mais e ainda se divertir
(Yu, 2003).
11.2 Regressão múltipla
A regressão múltipla é uma extensão da regressão linear. Psicólogos estão interessados

em usar essa técnica para descobrir modos de diversas variáveis (chamadas de explicativas e
previsoras) se relacionarem com outra (chamada de variável dependente ou de critério). Por
exemplo:
■ Psicólogos querem descobrir as variáveis que prevêem “exaustão" em professores.

■ Pesquisadores querem descobrir os modos como gênero, estilo de educação usadc
pelos pais e o nível de educação dos pais estão relacionadas com o lócus de controle
em saúde.
A variável de critério ainda é chamada de y, mas dessa vez temos inúmeras variáveis ex
plicativas, chamadas de x i ,.v' , , a' í e assim por diante. A regressão múltipla é capaz de fornecer
informação sobre os modos de relacionamento das variáveis explicativas combinadas con'
a variável de critério e como cada uma das variáveis separadamente está relacionada com _
variável critério.
A equação é somente uma extensão da regressão linear.
y = b, x, + boX, + b,x3... + a
Isso indica que y (a variável de critério) pode ser calculado pela inclinação da primei:_
variável (multiplicado pelo escore na primeira variável), junto com a inclinação da segunda va
riável (multiplicado pelo escore na segunda variável), junto com a inclinação da terceira variáv e
(multiplicado pelo escore na terceira variável) (e assim por diante) mais a constante.
Lembre-se de que você poderia usar a equação da regressão para prever escores de y cr
um grupo de variáveis explicativas em uma nova população. Todavia, os psicólogos não tê~
como objetivo produzir uma equação para fazer previsões em uma nova amostra (embi
esse possa ser o caso). Geralmente querem descobrir o modo de relacionamento das variá
veis selecionadas com a variável de critério e ver a contribuição relativa de cada uma de.".
variáveis.
Regressão múltipla é uma técnica comum - se você observar uma seleção de artigos er
periódicos científicos, encontrará muitos exemplos de regressão múltipla. Existem mui:.,
maneiras de conduzir uma regressão múltipla, e usaremos uma delas - chamada modelo pa
drão. A discussão de outros modelos está além da área de alcance desse livro (se você e*'-
interessado em ir além, veja Tabachnick e Fidell (2001)).
11.2.1 Previsão da variável de critério a partir de várias variáveis explicativas

O Q1 isolado é insuficiente para se prever o sucesso em testes, assim como a motivaci^
por si só. No entanto, juntas, as duas variáveis são capazes de prever muito melhor o suce'-
em testes do que isoladas. Na vida real, é muito raro encontrar relacionamentos simples r
quais uma variável preveja outra, sem a influência de nada mais. E muito mais realista U'_:
variáveis múltiplas em análises estatísticas.
Digamos que você tenha coletado informação sobre sucesso em testes - notas em p;-
centuais. por exemplo. Você também mediu o QI e aplicou um questionário sobre níveis
motivação. É claro que poderia ter mais do que duas variáveis explicativas, mas, a fim i:
explicar melhor, é mais fácil manter somente duas. O quão bem a combinação dessas duas .
riáveis prevê sucesso em testes? A regressão múltipla não só permite responder essa pergur '_
como também descobrir a contribuição relativa de cada variável separadamente.
Portanto, a regressão múltipla indica os efeitos cumulativos de um grupo de variáv. -
explicativas (x,, ,\\, etc.) em uma variável dependente (chamada de y), assim como os efe:’
separados dessas variáveis explicativas.
Suponhamos que vocc deseje fazer uma regressão linear simples a fim de prever o su
cesso em provas por meio do QI. Obteríamos um diagrama de dispersão, colocando sucesso
em testes no eixo y. como a variável de critério, e QI no eixo ,v, como a variável explicativa.
O diagrama de dispersão, com a linha de melhor aderência, é ilustrado pela Figura 11.11.0
diagrama de dispersão que investiga a influência da motivação sobre o sucesso em testes, com
a linha de melhor aderência, está representado na Figura 11.12.
Ambos podem prever sucesso em testes separadamente, mas a previsão pode ser ainda
melhor usando-os juntos. Na Figura 11.13. ambos, o QI e a motivação, são mostrados (em
três dimensões) relacionados a sucesso em testes (no eixo y).
Nesse caso, em vez da linha de melhor aderência, temos o plano de melhor aderência.
Podemos imaginá-lo como uma folha de acrílico cortando o espaço. O plano de melhor ade
rência é aquele que tem os pontos mais próximos ao acrílico. Não nos é possível imaginar
ou desenhar, em mais de três dimensões, mas o SPSSPW não tem dificuldade em analisar os
dados usando muitas variáveis explicativas.
A análise de regressão múltipla não tem surpresas, como a análise de regressão que usa
uma variável explicativa. Os diagramas que seguem são as estatísticas resultantes de uma
análise de regressão múltipla.
90 -i
80 -
70 -
60 -
50 -
40 -
30 -
20 -
10
90 100 110 120 130 140 150 160
QI
Diagrama sobre o sucesso em testes versus QI.
90 -i
80 -
70 -
60 -
40 -
30 -
20 -
10
20 30 40 50 60 70 80 90
M otivação
Diagrama sobre o sucesso em testes versus motivação.

Diagrama sobre o sucesso em testes versus motivação e Ql.
Partes im p o rtantes da saída

A primeira seção confirma que QI e Motivação foram registrados e que a variável critério
é Teste. O método Enter (Entrar) significa que QI e Motivação foram introduzidos juntos para
prever o sucesso em testes.
Variabies Entered/ Removedb (Variáveis Introduzidas/Removidas*1)

Variables Entered Variables Removed
Model (Modelo) (Variáveis Introduzidas) (Variáveis Removidas) Method (Método)
1 IQ, MOTIV (Ql, Motivação“) Enter (Entrar)
a. All requested variables entered (a. Todas as variáveis requeridas foram introduzidas.)
b. Dependent Variable: EXAM (b. Variável Dependente: Teste.)
R esum o do m odelo
O valor R (0,762) é a correlação entre teste e ambas as variáveis explicativas. O R~ (0,579
foi ajustado para 0,52.
Model Summary (Resumo do Modelo)
Model Adjusted R Square Std. Error of the Estimate

(Modelo) R R Square (R2) (R2 ajustado) (Erro Padrão da Estimativa)
1 0 .7 6 2 a 0.579 0.515 11.906
a. Predictors: (Constant), IQ, MOTIV (a. Preditores: (constante), Ql, motivação.)
Na Seção 11.1.6. você teve somente uma variável listada no resumo do modelo. Lembre-
se de que naquele caso r = b. Todavia, aqui você tem duas variáveis explicativas.
E importante lembrar que. na regressão linear, isso era simplesmente o r de Pearson. -
correlação entre x e v. Todavia, na regressão múltipla r é escrito como R e consiste na corre
lação entre todos os valores x e y. No exemplo, é a correlação entre o sucesso em testes, o Q!
e a motivação, y. Nesse estudo, R é 0,76.
Se você eleva 0,76 ao quadrado, obtém 0,58. O R representa a correlação entre todas _
variáveis explicativas juntas com a variável de critério. Significa toda a variância (a compar-
■Na verdade, o R múltiplo representa a correlação entre os escores verdadeiros e previstos de v.

tilhada e a individual) das variáveis explicativas ern relação à variável de critério. Em nossa
amostra, 58% da variação acerca do sucesso em testes pode ser atribuído à variação do Ql e
da motivação. Entretanto, o SPSSPW diminui esse número para oferecer uma estimativa do
R~ da população, pois nosso r é muito otimista. Isso ocorre porque a linha de regressão amos
trai sempre terá melhor aderência com a amostra do que com a população (como é a linha
de melhor aderência para a amostra). Portanto, ajustamos diminuindo. A fórmula para tanto
leva cm consideração o numero de participantes c as variáveis. Então, podemos afirmar que
justificamos 52% da variância de y com as variáveis explicativas.
11.2.2 Tabela de resumo da ANOVA

A tabela de resumo da ANOVA demonstra que, juntas, as variávei explicativas prevêem
a variavel de critério. As chances de os resultados obtidos terem ocorrido por erro amostrai,
sendo a hipótese nula verdadeira, são de somente 0,004.
ANOVAb
Model Sum of Square Mean Square
(Modelo) (Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Regression
1 2545.01291 2 1272.50646 8.97596 0 .0 0 4 a
(Regressão)
Residual
1842.98709 13 141,76824
(Resíduos)
Total 4388.000 15
a. Predictors (Constant), IQ, MOTIV (a. Preditores: (Constante), Q!, Motivação)

b. Dependent Variable: TESTE (b. Variável Dependente: Teste)
A ANOVA indica que o plano de regressão para essas variáveis parte significantemente de
0 ou seja, podemos prever y (sucesso em testes) do QI e motivação juntos. Nossa previsão não
será perfeita, é claro, m as é m elh or que a ch ance por si só (F (2 ,1 3 ) = 8 ,9 7 , p = 0 ,0 0 4 ).
Para a regressão simples, exposta anteriormente, você tinha somente uma variável listada
sob a coluna Coefficíenis (Coeficientes) (ver página 4 0 1 ). Lembre-se de que naquele caso r =
b \ porém aqui temos duas variáveis explicativas.
Coeficientes
A seguinte seção indica os pesos não-padronizados (B) e padronizados ((3) para as va
riáveis Q I e motivação, junto com os valores t, de probabilidade, e os limites de confiança de
95% em torno de B.
Coefficients3 (Coeficientes3)
Standardized
Unstandardized Coefficients
Coefficients (Coefici (Coeficientes 95% Confidence Interval
entes Não-padronizados) Padronizados) t Sig. for B (IC de 95% para B)
Model B Std. P Lower Bound Upper Bound
(Modelo) Error (Erro (Limite inferior) (Limite Superior)
padrão)
(Constant) -43.466292 -1.557 0.1435 -103.781988 16.849405
27.919170
(Constante)
MOTIV 0.614508 0.218457 0.526770 2.813 0.0147 0.142561 1.086455
(Motivação)
IQ (QI) 0.591585 0.262691 0.421726 2.252 0.0422 0.024075 1.159095
a. Dependent Variable: EXAM (a. Variável Dependente: Teste)
M otivação
A motivação tem um coeficiente de regressão de 0.61. Portanto, quando a motivaçãc
aumenta uma unidade, o sucesso em testes aumenta 0,61. Podemos ter 95% de confiança de
que o coeficiente da população está entre 0,14 e 1.09. O valor I é 2.81 com uma probabilidade
associada de 0,01 , então é improvável que nosso coeficiente de regressão tenha ocorrido por
erro amostrai.
O QI tem um peso não-padronizado de 0,59, significando que, quando o QI aumenta uma

unidade, o sucesso em testes aumenta 0,59. Os limites de confiança mostram que temos 95'
de confiança de que o real coeficiente de regressão da população está entre 0,02 e 1,16. É unr.
intervalo um tanto grande, mas pelo menos não inclui o zero ou valores negativos. Portanto
podemos aceitar que a inclinação da regressão populacional c positiva, embora possa varia'
de 0,02 (quase horizontal) a 1.16. O valor t de 2,25 e a probabilidade associada de 0,04 indi
cam que a probabilidade de tal resultado ter ocorrido por erro amostrai, sendo a hipótese nula
verdadeira, é de somente 4 em 100.
Comparação de variáveis explicativas

Você pode ter uma boa ide'ia da importância das variáveis explicativas observando os peso-
padronizados ((3). Não é bom comparar os pesos não-padronizados, pois eles geralmente sã
medidos em unidades diferentes (como gramas ou polegadas, por exemplo). Então, os pe-.. •
são convertidos em escores z usuais. Em relação ao QI, quando aumenta por um desvio padrà.
osucesso em testes aumenta a 0,42 desvio padrão .0 Quando a motivação aumenta um desv
padrão, o sucesso em testes aumenta somente metade de um desvio padrão (0,53). Portanto. _
motivação parece ter uma contribuição maior para o sucesso nos testes do que o QI. É importan
te lembrar de verificar o sinal dos coeficientes de regressão (se um coeficiente for negativo, ser.
interpretado como um coeficiente de correlação negativo). Não temos coeficientes de regres--!
negativos em nosso exemplo.
Atividade 11.5
Em uma análise de regressão múltipla, o R múltiplo representa:

(a) A correlação entre a primeira variável explicativa e a variável de critério
(b) A correlação entre todas as variáveis explicativas
(c) A correlação entre a variável de critério o o grupo inteiro de variáveis explicativas
11.2.3 Equação
Você deve lembrar que, na regressão linear, a equação era:
y = bx + a
0 Depende de as outras variáveis explicativas se manterem constantes.

A fórmula para regressão múltipla é parecida. Se você quisesse usar a fórmula para pre
ver o sucesso em testes com base no QI e na motivação, precisaria usar os coeficientes de
correlação não-padronizados (b) e a constante (a). Então,
(sucesso previsto em testes) = (0,591585 * QI)

+ (0,614508 * MOTIVAÇÃO)
-43.466292
Nos cálculos â mão, dois ou três

decimais após a vírgula serão
suficientes para cálculos
A fórmula permite calcular à mão o escore previsto: podemos, por exemplo, descobrir a
nota prevista a ser atingida pelos alunos, usando os escores obtidos nos testes de QI e moti
vação. O SPSSPW calculou um valor pelo qual os escores individuais de motivação devem
ser multiplicados. Na saída do SPSSPW, o valor é chamado de B na coluna dos coeficientes
não-padronizados. Você pode observar que para motivação, b = 0,614508. Para o QI, os escores
individuais devem ser multiplicados por 0.591585. Portanto, calculamos o sucesso em testes
multiplicando o escore de motivação de uma pessoa por 0,614508 e somamos esse resultado ao
seu QI, que foi multiplicado por 0.591585. Depois, adicionamos ou subtraímos uma constante
(que nesse caso é 43,466292). O número resultante é o escore previsto no teste.
Se você realmente queria prever o sucesso em testes de uma pessoa em uma nova amos
tra, usaria a equação referida. Você iria prever o sucesso em testes utilizando as duas variáveis
uma vez que ambas contribuem para o sucesso em exames.
11.2.4 Parte textual da análise

Lembre-se de que. como psicólogos, a maioria de nós não quer usar a fórmula de previsão
em uma nova amostra. Usamos regressão múltipla para ver como certas variáveis (explicati
vas ou previsoras) estão relacionadas a outra variável (dependente ou de critério).
Vejamos como poderíamos relatar a análise. Les amos em consideração que você apresentou
para seus leitores uma tabela de resultados, como as referidas.
A associação entre as variáveis de critério e explicativas é moderadamente forte (R múltiplo
= 0,76). Juntos. QI e motivação foram responsáveis por 51% da variância no sucesso em testes
( R~ ajustado). Am bos. QI e motivação, estão positivamente relacionados ao sucesso em testes. O
coeficiente de regressão para QI foi 0,59 (IC de 9 5 c/c = 0.02 - 1,16) e para m otivação foi 0,61 (IC
de 95% = 0,14 - 1.09). Com o os intervalos de confiança não incluíram um valor negativo, pode
mos concluir que os coeficientes de regressão da população para QI e motivação são positivos (QI
- i = 2,252; p = 0,04/m otivação - / = 2.813: p = 0.01). Os coeficientes de regressão padronizados
indicam que a m otivação é mais forte do que o QI. Todavia, ambas as variáveis estão positiva e
significantem ente relacionadas ao sucesso em exam es.
Sempre se lembre de que os resultados são específicos para sua amostra. Embora tenha
mos problemas com os limites da generalização em qualquer análise estatística de inferência,
a regressão múltipla é uma técnica matemática de maximização - o plano de melhor ade
rência é o melhor plano possível - para a amostra. Não sabemos o quão bem os resultados
poderiam ser generalizados para a população. Se você tem participantes suficientes e algumas
boas variáveis explicativas, as chances de generalização são melhores do que se você nao
satisfaz as condições (ver a seguir).
11.2.5 Condições a serem satisfeitas na regressão múltipla

1. Verifique se você tem um número suficiente de participantes. Há opiniões diferente
quanto ao número de participantes necessários para se usar uma regressão múltipL
Com freqüência, autores de livros de estatística recomendam uma proporção par. -
cipante/variável. Suponha que você tenha quatro variáveis explicativas. A proporei
participante/variável dada nos livros tende a ir de 15 participantes por variável (>:_
niflea que você deve ter 60 participantes na análise) a 40 participantes por variáve
(significa que você deve ter 160 participantes na análise). É uma grande diferen..
Tabachnick e Fidell afirmam que a maneira mais simples de determinar o taman:
da amostra é:
N > 50 + 8M
M é o número de variáveis explicativas. Portanto, sc você tem quatro variáveis e'-
plicativas e apenas deseja observar os efeitos combinados das variáveis explicati _
(R múltiplo) você deve ter pelo menos:
50 + (8 * 4) =
50 +(32) =
> 82 participantes
Entretanto, é comum os pesquisadores desejarem observar a significância de c . ..
variável separadamente. Nesse caso, Tabachnick e Fidell recomendam o segui'
cálculo:
N > 104+ M
= 104 + 4
= >108
Se você deseja ambos os resultados, os combinados e os separados, escolha o r..
mero mais alto. Nesse caso, precisa de pelo menos 110 participantes. Se não l -_-
participantes o suficiente, seus resultados serão otimistas demais, e você não sat-r.
se podem ser generalizados.
2. A variável de critério deve scr retirada de uma população de escores normalme
distribuída. As variáveis explicativas não precisam ter uma distribuição norma' E
a distribuição da variável de critério, y (condicionada às variáveis explicativas), e . :
precisa ter uma distribuição normal.
3. A5 variáveis devem ter um relacionamento linear com a variável de critério: ce
na regressão linear, as variáveis explicativas devem ter uma relação linear c o r .
variável de critério - ao contrário, não há motivo para se fazer uma análise de
gressão. A inspeção de diagramas de dispersão para as variáveis mostrará se ha .
relacionamento linear (em comparação aos relacionamentos curvilíneos).
4. Valores atípicos talvez precisem ser eliminados. Você aprendeu sobre valore*. ;
tremos ou atípicos (outliers) no Capítulo 2. Valores atípicos podem ter uma gra" _
influência na análise de regressão. Os univariados (um escore não-usual e extre~i
em uma variável) são fáceis de notar, mas os multivariados (extremos em duas .
riáveis juntas) são mais difíceis. Para exemplificar um valor atípico multivariao
uma pessoa de 17 anos não é algo fora do comum, e ganhar um salário de 30 ~
libras também não é incomum (com exceção de professores que escrevem Iivro- i
estatística, que ganham muito menos do que isso). Entretanto, achar uma pessoi i
17 anos que ganhe 30 mil libras é fora do comum. Às vezes, é difícil perceber e- ^
tipo de valor atípico (o SPSSPW pode fazer isso por você, embora não aborde tal
ponto neste livro).
Todavia, se você tem um grupo de dados pequeno, um simples olhar para os dados
pode ser suficiente. Você pode eliminar valores atípicos de sua análise. Entretanto, é
óbvio que não pode eliminar valores atípicos simplesmente por serem extremos. Isso
requer uma consideração cuidadosa, especialmente quando você tem menos que 100
participantes. Alguns estudantes nos perguntam se remover os valores atípicos não é
trapacear, mas queremos que a reta (ou plano) de regressão reflita o sujeito mediano,
não alguém que é muito diferente dos outros.
5. Multicolinearídadc. A melhor situação ocorre quando as variáveis explicativas têm
correlações altas com a variável critério, mas não umas com as outras. Você pode ve
rificar sua matriz correlacionai antes de fazer regressão múltipla. Pode descobrir que
algumas variaveis csiao altamente correlacionadas umas com as outras (0,8 e acima).
Denomina-se multicolínearidade ter tais tipos de variáveis intercorrelacionadas. As
variáveis estão medindo muito da mesma coisa. As vezes, você pode combinar variá
veis altamente correlacionadas ou omitir uma. Há o benefício de reduzir o número de
variávei: e, é claro, contribuir com o item 1 exposto.
função pulmonar e o fumante
Emery e colaboradores (1997) conduziram um estudo para descobrir se a função pulmonar e o

ato de fumar prevêem função cognitiva em uma amostra de britânicos. Uma das medidas da função
cognitiva foi o tempo de reação simples (TRS). Como parte do estudo, os pesquisadores primeiro
buscaram descobrir se idade, gênero, altura e nível de educação poderiam prever TRS. Relatamos
esses resultados a seguir.
A Tabela 11.3 mostra que, juntos, os fatores mencionados eram responsáveis por quase 14% da
variância, quer dizer, 14% da variância nos escores de TRS podem ser explicados por idade, gênero,
altura e nível dc educação. Embora os autores não relatem o R múltiplo, tudo que ternos de fazer é
I obter a raiz quadrada do R \ Se você checar, usando uma calculadora, verá que é 0,369. Portanto, a
correlação entre TRS e as outras variáveis é 0,37 - um relacionamento fraco a moderado. Os autores
fornecem os resultados individuais: os pesos de b (inclinações não-padronizadas) para cada uma
das variáveis separadamente. Por exemplo, a inclinação da idade quanto ao TRS é 0,2824. Signi
fica que, para cada ano de vida, o TRS deve aumentar 0,28 milésimos de segundo (a associação é
positiva). Altura, entretanto, tem um peso b virtualmente plano, demonstrando que o seu poder de
previsão é quase zero.
Tabela 11.3 Resultados de Emery e colaboradores (1997, com permissão de Taylor e Francis Ltda.)
Previsores F- TRS (milésimos de segundo) R
Idade 0.2824 0,1362

Gênero (feminino/masculino' 0.0572
Altura 0,0100
Educação (mais/menos) 0,1602
* * * p < 0,001
satisfação com o emprego entre teletrabalhadores
Konradt e colaboradores (2003) investigaram os efeitos de comportamento gerencial e esiresse

em relação à satisfação com o trabalho entre teletrabalhadores. Fizeram uma regressão múltipla
padrão, usando as variáveis explicativas listadas na Tabela 11.4.
Todas as quatro variáveis juntas previram satisfação com o trabalho com significancia, como
se pode ver pelo valor do R~ e pelo nível de significancia. Como esperado, os estressores mostraram
um relacionamento negativo com relação à satisfação no trabalho. Por exemplo, um aumento em
cada estressor relacionado a uma tarefa foi associado a uma diminuição de 0,21 na satisfação com
o trabalho (b = - 0.21 para você saber que o relacionamento é negativo).
Das quatro variáveis, a qualidade de gerência mostrou o relacionamento mais forte com satis
fação no trabalho. Você pode ver que os pesos são positivos para essa variável. Para cada unidade
de aumento na qualidade da gerência a satisfação com o trabalho aumentou 0.96 de uma unidade. O
peso P (na última coluna) fornece os escores padronizados. Portanto, podemos dizer que, para cada
aumento de um desvio padrão na qualidade de gerência, a satisfação com o trabalho aumenta pouco
mais da metade de um desvio padrão (0.52).
Tabela 11.4 Sumário da análise de regressão simultânea para variáveis prevendo satisfação com o trabalho
entre teletrabalhadores
Variável explicativa B E rros padrões beta
Q u alid ad e d e g erên cia 0.96 0.30 0.52:

E stresso res re la c io n ad o s a tarefas -0 .2 1 0,34 -0.10
R ecurso s re la c io n ad o s a tarefas 0.01 0.28 0,05
E stre sso res não re la c io n ad o s co m o trab alh o -0.40 0.38 -0.17
R = 0.32 (jj <0.05)

*** p < 0,001
Esses são os pesos Esses são os Esses são os

não-padronizados erros padrões, pesos
(ver página 401) (ver pogina 400) padronizados
Atividade 11.6
Calcule o número de participantes necessários para a análise relatada. Dado o número ce

participantes no estudo, quais conclusões você pode tirar dos resultados?
Resumo
■ A análise de regressão permite prever os escores numa variável dependente do co

nhecimento dos escores de uma ou mais variáveis explicativas.
■ Os psicólogos usam a regressão para avaliar relacionamentos entre variáveis.
■ A variável dependente também c chamada variável de critério e as explicativas tam
bém são denominadas variáveis previsoras.
■ A linha de melhor aderência (a inclinação, b) pode ser usada para determinar como o
critério (y) muda devido ao resultado de mudanças na(s) variável(veis) previsora(s) (x).
m Limites de confiança em torno de b permitem que se estime a inclinação da popula
ção com um certo grau de confiança.
Exercício 1
Insira os seguintes dados no SPSSPW e os analise usando o procedimento de regressão: x

é o escore da ansiedade causada por provas, e j é o número de horas de revisão de conteúdos
de exames uma semana antes dos mesmos.
X y X y
33 45 56 79
64 68 44 44
33 100 22 16
22 44 44 6)
70 62 80 60
66 61 66 61
59 52 79 60
84 66
A ansiedade está relacionada com o número de horas estudadas? Quao bem a equação de
regressão prevê isso?
Exercício 2
O professor Limão quer analisar contribuições que se devem ao engajamento social

(SOC) ou à personalidade extrovertida (EXTRO) em relação à satisfação com o trabalho
(SATISF), usando os seus próprios colegas como participantes.
Realize urna regressão múltipla nos dados abaixo. Interprete a saída para o professor
Limão, no formato de um relatório escrito, certificando-se de que o informa da contribuição
de cada uma das variáveis explicativas na variável de critério.
SO( EXTRO SATISF
20,00 15,00 20,00

10,00 30,00 15,00
4,00 5,00 5,00
17,00 16,00 20,00
10,00 14.00 15,00
11,00 8,00 10,00
7,00 7,00 8,00
4,00 4,00 5,00
15,00 10,00 17,00
17.00 5,00 17,00
18,00 6,00 15,00
1 1,00 12,00 18.00
12,00 10,00 15.00
16,00 16,00 17,00
18,00 12,00 20,00
14,00 13,00 14,00
12,00 14,00 15,00
10,00 4.00 5,00
1 1,00 6,00 7,00
10.00 10,00 11,00
QUESTÕES DE MÚLTIPLA ESCOLHA (a) t = 0.049

(b) í = 0,0245
(c) ( = 0,098
1. A linha de melhor aderência:
(d) Não é possível saber
(a) Minimiza a distância entre os escores e a li
nha de regressão 3. F,m uma análise de regressão linear, os resíduos -1
(b) É a melhor de todas as linhas possíveis (a) Escores verdadeiros menos escores previste -
(c) Maximiza a correlação entre x e y (b ) Escores verdadeiros mais escores previsto>
(d) Todas as alternativas (c) A correlação entre os escores verdadeiros í
previstos
2. Na regressão linear, onde som ente uma variável
prevê v e F é estatisticam ente significativo, com
p = 0.049: A t questões 4 a 7 se relacionam com a seguinte saij_
Model Summary (Resumo do Modelo)

Model Adjusted R Square Std. Error of the Estimate
(Modelo) R R Square (R2) (R2 Ajustado) (Erro Padrão da Estimativa)
1 0 .3 1 9 3 0.102 0.078 0.639
a. Predictors (Constant), MRL (a. Preditores: (Constante), MRL)
ANOVA6
(Modelo) (Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Regression
1 1.71690 1 1.71690 4.199 0 .0 4 8 a
(Regressão)
Residual
15.12589 37 0.40881
(Residuos)
Total 16.84279 38
a. Predictors (Constant), MRL (a. Preditores: (Constante), MRL)

b. Dependent Variable: PAIN (b. Variável Dependente: DOR)
Coefficients (Coeficientes3)
Unstandardized Standardized
Coefficients (Coeficien Coefficients (Coefi
tes Não-padronizados) cientes Padronizados) t Sig.
Model
(Modelo) S Std. Error (Erro Padrão) P
Constant)
1 1.757722 0.15455 11.373 0.000
(Constante)
MRL 0.01659 8.09626E-03 0.31928 2.049 0.0476
a. Dependent Variable: PAIN (a. Variável Dependente: DOR)

4. As notas na MRL seriam denominadas de: (b) 1,5455

(a) A variável previsora (c) 4,19978
(b) A variável critério (d) 0.01659
(c) A covariável X. Quantos graus de liberdade haveria onde o dia
(d) A constante grama de dispersão da regressão linear tivesse
somente um ponio de dados? (não muito realista,
5. O valor da probabilidade exata de os resultados
sabemos)
terem ocorrido por erro amostrai, considerando a
hipótese nula verdadeira, é: (a ) Zero
(b) Um
(a) 0,0000
(c) Dois
(b) 0,05
(d) Três
(c) 4,19978
(d) 0,048 9. Psicólogos usam a regressão linear principalmente
para:
6. b c:
(a) Avaliar relacionam entos entre variáveis
(a) 2,049 (b) Usar a fórmula da regressão para pesquisar
(b) 0,31928 mais
(c) 0,01b59 (c) Observar as diferenças entre grupos
(d) Nenhuma das alternativas (d) Nenhuma das alternativas
7. a é: As questões 10 a 15 se relacionam com a saída parcial
(a) 1,75772 da análise cle regressão abaixo.
Model Summary (Resumo modelo)
Model Std. Error of the Estimate

(Modelo) R R Square (R2) Adjusted R Square (R2 Ajustado) (Erro Padrão da Estimativa)
1 0 .8 6 7 a 0.752 0.711 3.2388
a. Predictors (Constant), age, previous history rating (a. Preditores: (Constante), idade, avaliação de histórico prévio)
ANOVAb
(Modelo) (Soma dos Quadrados) Df (gl) (Média dos Quadrados) F Sig.
Regression
1 381.457 2 190.729 18.182 0 .0 0 0 a
(Regressão)
Residual
125.876 12 10.490
(Resíduos)
Total 507.333 14
a. Predictors (Constant), age, previous history rating (a. Preditores: (Constante), idade, avaliação de histórico prévio)
o. Dependent Variable: credit rating (b. Variável Dependente: avaliação de crédito)
Coefficients (Coeficientes3)
Standardized
Unstandardized Coefficients
Coefficients (Coefici (Coeficientes 95% Confidence Interval
entes Não-padronizados) Padronizados) t Sig. for B (IC de 95% para B)
Model B Std. Error P Lower Bound Upper Bound

(Modelo) (Erro Padrão (Limite inferior) (Limite superior)
(Constant)
1 0.790 3.471 0.228 0.824 -6 .7 7 4 8.353
(Constante)
previous 0.571 0.241 0.51 4 2.368 0.036 0.04 6 1.096
history
rating
(avaliação
de histórico
prévio)
Age (idade) 0.276 0.145 0.413 1.904 0.081 -0 .0 4 0 0.592
a. Dependent Variable: Credit rating (a. Variável Dependente: avaliação de crédito)

Sig. =- Significancia
10. A correlação entre o escore do crédito e as outras 15. aé:

variáveis é: (a) 0,514
(a) 0,867 (b) 0,790
(b) 0,752 (c) 0,276
(c) 0 , 7 l l (d) 0.571
(d) 1,32
16. A multicolinearidade significa:
1 1. Para cada aumento no desvio padrão no escore his (a) Que existem mtercorrelaçoes altas entre _
tórico anterior, o escore do crédito: variáveis previsoras
(a) Dim inui 0,5 desvio padrão (b) Que as variáveis previsoras estão córrela^
(b) Aumenta 0,5 desvio padrão nadas positivamente com a variável critéri
(c) Diminui 0,3 desvio padrão (c) Que as variáveis mostram uma distribu:.:
(d) Aumenta 0,3 desvio padrão assimétrica
(d) Que as variáveis mostram uma distribu:,:
12. As variáveis previsoras são chamadac. do:
leptocúrtica
(a) Avaliação de crédito e idade
17. Kieram quer realizar uma regressão múltipla r .
(b) Avaliação de crédito e avaliação do histórico
drão usando seis variáveis explicativas. Ele e- .
prévio
som ente interessado no R~ geral. D e acordo c -
(c) Histórico prévio e idade
a fórmula de Tabachnick e Fidell, quantos pan .
(d) Variáveis de criterio
pantes ele deve recrutar?
13. O nivel de significancia atingido associado ao va (a) 98
lor F de 18.182 é:
(b) 56
(a) 0,284 (c) 240
ib) 0,36 (d) 120
(l ) <.0,001
18. Saeeda desconhece a necessidade de um gra- _
número de participantes para uma regressão ~ .
14. A inclinação da linha (B ) para avaliação de históri tipia. Ela tem somente 20 participantes para .
co previo é: estudo e 20 variáveis explicativas. Qual é a afirr.
(a) 0,514 ção mais apropriada? Comparado com uma an_ -
(b) 0,790 que usa 100 participantes, o R M últiplo será:
(c) 0,276 (a) Combinado
(d) 0,571 (b) Infiacionado
(c) Deflacionado (b) 42% da variância em pressão arterial

(d) Sem diferença (c) 6,5% da variância em estresse
(d) 18% da variância em idade
As questões 19 e 20 se fundamentam no segninte texto,
-xtraíclo da seção de resultados de um periódico. 20. Qual é a afirmação mais apropriada?
Todas as variáreis explicativas previram com sig- (a) Quando o estresse aumentava por um desvio
nificôncia a pressão arterial (R~ ajustado = 0,42; padrão, a pressão arterial aumentava por qua
p = 0.002). O estresse durante a entrevista foi o se metade de um desvio padrão
fator mais forte de aumento da pressão arterial (b) Quando o estresse aumentava por um desvio
(P = 0.49, p = 0,001) seguido pela idade (fi = padrão, a idade aumentava por 0,18 de um
0.18, p = 0.002). desvio padrão
(e) Quando a idade aumentava um ano, a pressão
19. Qual é a afirmação mais apropriada? As variáveis arterial caia por 0,18 de um desvio padrão
explicativas previram (d) Quando a idade aumentava por um ano, a
ta) 6.5% da variância em pressão arterial pressão aumentava 18%
Referências
EMERY, C. E, HUPPERT. F. A.. SCHEIW R. L. Do pulmonary function and smoking behavior
predict cognitive function? Findings from a British sample. Psychology and Health, v. 12. n. 2. p.
265-75. J997.
KONRADT, U. HERTEL. G.. SCHMOOK. R. Quality of management by objectives, task-related
stresssors, and non-task-related stressors a.-, predictors of stress and job satisfaction among
teleworkers. European Journal of Work and Organizational Psychology, v. 12. n. 1. p. 61 -79, 2003.
TABACHN1CK. B., FI DELL. L. S. I 'sing Multivariate Statistics. Addison Wesley. 4 ed.. 2003.
YU, C. H.. LO. W. J.. STOCKIORD, S. Using multimedia to visualize the concepts of degrees of
freedom in terms of sample size and dimensionality. American Statistical Association 2001
Proceedings of the Section on Statistical Education. Atlanta, GA._2002.
YU. C. H. Ilustrating degreees of freedon in multimedia. Available at http://seamonkey.ed.asu.edu/
~alex/pub/df/default.htm jacessoem 10 March 2004|
Introdução à Análise de Fatores
Chegamos até aqui e esperamos que agora você tenha um bom entendimento conce
das técnicas estatísticas mais utilizadas na psicologia. Nesse e nos dois próximos capítulos,
taríamos de ensinar um outro conjunto de técnicas que são uma extensão da regressão mú
e da ANOVA. Estes testes são postos sob o rótulo comum de estatística multivariada. A téc
estatística particular que apresentaremos aqui é a análise de fatores. Damos uma breve
dessa técnica no Capítulo 5.
Neste capitulo iremos:
Fornecer um entendimento conceituai da análise de fatores por meio de um exemp
literatura psicológica
■ Mostrar como entrar com o conjunto de dados no SPSSPW e executar uma anális
fatores
■ Mostrar como interpretar a saída estatística de tal análise
Dar exemplos da literatura para ajudá-lo a entender como a análise de fatores tem
utilizada na psicologia
12.1 Qual é o objetivo da análise de fatores?
Os principais métodos da análise de fatores foram inicialmente utilizados para esu

a estrutura da mente, da inteligência e mais tarde da personalidade. Hoje apresentam
leque bem maior de aplicações. A análise de fatores lida com padrões de correlaçõe'-
Capítulo 5). Assim, por exemplo, nos anos de 1950 os psicólogos notaram que pes
que tinham um bom desempenho nos testes escritos tinham também um bom desempe
nos testes de aritmética, ciências e outros. Essas variáveis estavam correlacionadas e
si. Os psicólogos acreditavam que existia um fator geral que causava os padrões ob-;
dos nas correlações. Esse fator, denominado de "inteligência”, não podia ser obsen
mas foi revelado por meio da observação dos padrões apresentados pelas correlaçõe-
tre as variáveis.
A forma usual de executar uma análise de fatores é constituir uma amostra de pesso_-
qual cada uma tem um conjunto de valores resultados de um certo número de variávei-
servadas, por exemplo, poderiam ter sido submetidas a uma batería de testes ou responc
algum questionário. A matriz dos coeficientes de correlação é calculada (da mesma form-
você aprendeu no Capítulo 5). Digamos que você tenha testado os participantes com seis
de habilidade. Se acreditarmos que cada teste dado aos participantes mede certa habilidade, o
que estamos constatando é que, realmente, nenhum dos testes está relacionado aos demais.
Teoricamente, toda;, as correlações devem ser nulas. Na prática, entretanto, isso é impro
vável de ocorrer. Algumas variáveis que não estão correlacionadas entre si tendem a mostrar
alguma correlação. Na Tabela 12.1, os coeficientes de correlação var iam em torno de 7ero.
Agora vamos tomar a direção oposta e dizer que todos os testes medem a mesma habi
lidade. O que estamos realmente dizendo é que cada variável está relacionada às demais e
na Tabela 12.2 todos os coeficientes de correlação seriam, pelo menos teoricamente, 1. Na
prática, estarão próximos de 1 .
Aqui as correlações estão em tomo do valor 1. Esses são os dois extremos. Normalmente
algumas variáveis estão relacionadas a outras, enquanto as demais não. A análise de fatores
observa esses padrões de correlações. Grupos de variáveis altamente correlacionas entre si for
mam um fator. O fator e' concebido como uma variável subjacente latente (hipotética) ao longo
do qual os participantes diferem, da mesma forma que diferem numa escala de teste. E possível
executar uma análise de fatores trabalhando tanto com a matriz de correlações quanto com a das
variâncias-covariâncias1. Nesse estágio aconselhamos que você escolha a matriz de correlações
quando executar essas técnicas com o seu pacote computacional, apenas por ser mais seguro.
Isso ocorre porque trabalhar com a matriz de correlações equivale a padronizar os dados. Se
as variáveis não foram medidas com as mesmas unidades ou não são pelo menos comparáveis,
utilizar a matriz de correlações irá padronizá-las de forma a torná-las comparáveis. Discussões
adicionais sobre esse tópico estão além dos objetivos deste texto. O objetivo da análise de fatores
é expressar um grande número de variáveis em termos de um número mínimo de fatores.
Tabela 12.1 Correlações hipotéticas entre testes se você acredita que cada teste meça uma
habilidade específica
Teste de Aritmética Química Arte Escritu Alemão Música
Aritmética 1 0,01 0,01 -0.0 i 0,001 -0,01

Química 1 -0.02 0.01 -0,000 0.02
Arte 1 0,00 0,01 0,11
Escrita I 0,00 -0,00
Alemão 1 O.0Ü
Música 1
Tabela 12.2 Correlações hipotéticas entre testes se você acredita que cada teste mede a mesma
habilidade
Teste de Aritmética Química Arte Escrita Alemão Música
Aritmética 1 0,99 0,98 1,00 0.99 0.99

Química 1 0,99 0.99 0.98 1.00
Arte I 0,99 1,00 0.99
Escrita 1 0.99 0.98
Alemão 1 1,00
Música
1 U ma m airiz de variâncias-covariâncias e sem elhante a um a matriz de correlações, exceio pelos escores, que não são padronizados.
E scores padronizados foram explicados no Capítulo 3. páginas 111-112.
Atividade 12.1
Não é fácil explicar o conceito de análise de fatores. Se você estivesse tentando explicar o
que é a análise de fatores a um amigo, o que diria?
12.2 Principais tipos de análise de fatores
Existem diferentes tipos de análise de fatores - aqui nos concentraremos nos mais fami
liares. Um é denominado análise de componentes principais (ACP), e o outro, simplesmente
denominado de análise de fatores (embora isso normalmente signifique “fatoração pelos ei\>
principais”). Muitas pessoas, inclusive nós, utilizam esses termos de forma intercambiáve
Entretanto, existem diferenças entre eles, e, apesar de ser possível tratá-los como se fossen
iguais, gastaremos alguns minutos explicando as diferenças.
12.2.1 Diferenças e semelhanças entre a análise de componentes principais e a

análise de fatores
Tanto a análise de componentes principais (ACP) quanto à análise de fatores reduze:
um grande número de variáveis a um número menor, denominados componentes ou fatore-
respectivamente. A diferença se deve, principalmente, ao modo de tratamento da variâncL
Na ACP, toda a variância dos dados é analisada, tanto a compartilhada quanto a exclusi _
(veja Capítulo 5, para informações sobre variância exclusiva e compartilhada). Esse proce
dimento supõe, é claro, que não existe erro. A ACP, de fato, transforma as variáveis origina:
em um conjunto menor de componentes não-relacionados. Com a análise de fatores, somente
a variância compartilhada é analisada; a variância exclusiva é excluída, e alguma variânci.
do erro é admitida.
Tem se afirmado que a ACP é uma técnica exploratória por natureza, executada simple
mente para reduzir um grande conjunto de dados a um menor. Com freqüência, o pesquisado'
quer executar análises adicionais, como, por exemplo, regressão múltipla. Para ser confiá\ e’
a regressão múltipla precisa de uma boa razão de participantes (veja Capítulo l 1). Assim. -
ACP é. algumas vezes, executada de forma a reduzir um grande conjunto de variáveis a ur
mais manejável, de modo que a regressão múltipla possa ser executada. A análise de fatore-
por outro lado. tem sido utilizada quando o pesquisador acredita que um pequeno conjur:
de ‘‘fatores” é o que de alguma forma influencia o conjunto de variáveis observado. De---
forma, a análise de fatores tem sido utilizada no sentido confirmatorio, de forma a testar hip-: -
teses. Na prática, entretanto, os pesquisadores usam tanto a ACP quanto a análise de fatore
como um meio de explorar os dados, bem como para confirmar hipóteses. Pesquisas te -
mostrado que, embora a análise de fatores e a ACP não sejam equivalentes, as diferenças rü
são importantes. Isso é de fato legítimo quando se trata de grandes conjuntos de dados e gr..'
de número de participantes. Assim, quando você executar uma análise de fatores, o conse!
é que tente obter pelo menos 100 participantes na análise e ter pelo menos cinco vezes m_
participantes do que variáveis. De agora em diante, vamos nos referir tanto à fatoração pe'. -
eixos principais quanto à ACP como análise de fatores.
12.3 Uso da análise de fatores na psicometria
Na psicometna, a análise de fatores possui particular relevância para a validade de cons

tructo. Quando os pesquisadores projetam questionários, normalmente apresentam várias
questões relacionadas a um constructo ou idéia, isto é, certas questões se correlacionam en
tre si porque mensuram o mesmo constructo. Podemos apenas olhar a matriz de correlações
e tentar identificar tais padrões. Entretanto, isso é totalmente subjetivo e pouco confiável. A
análise de fatores pode identificar os padrões de correlações. Os constructos, denominados
fatores (ou algumas vezes componentes), podem ser utilizados para descrever as escalas de
um teste. A análise de fatores permite que o pesquisador descubra a validade fatorial das
questões que compõem cada escala ou constructo. Detalharemos o assunto na página 441.
O uso da análise de fatores não se limita à procura de habilidades cognitivas. Pode ser
utilizada em outros campos, como poderemos ver nos exemplos seguintes.
Exemplo da literatura: vergonha e culpa
Alexander e colaboradores (1999) investigaram vergonha e culpa em uma amostra de pacientes

depressivos. Trabalharam com 86 pacientes e utilizaram uma escala de 10 itens de Gilbert e cola
boradores (1994). Cinco desses itens mensurariam a vergonha (confiabilidade 0,74)," e cinco, a
culpa (confiabilidade de 0,75). Os pesquisadores decidiram executar uma investigação psicométrica
dessa escala. Utilizaremos tal estudo para exemplificar a análise dc fatores. Fazemos isso porque
ele é bastante fácil de ser entendido: o questionário apresenta somente 10 itens e Alexander e cola
boradores queriam conferir se existem duas escalas (vergonha e culpa) como sugerido por Gilben e
colaboradores. Esses eram os itens do questionário. Você pode ver que os itens 1,4, 5, 7 e 8 medem
a vergonha (V), e os itens 2 , 3, 6, 9 e 10, a culpa (C).
1 Fazer algo embaraçoso em público (V)

2 Trapacear secretamente acerca de algo que você sabe que não será desco
berto (C)
3 Ferir os sentimentos de alguém (C)
4 Ser o centro das atenções (V)
5 Parecer inadequado para outras pessoas (V)
6 Não se importar com os outros (C)
7 Ter revelado algo desfavorável sobre você (V)
S Sentir-se autoconsciente face a outros (V)
0 Comportar-se grosseiramente (C)
10 Não dizer nada quando o balconista dá troco a mais (C)
A confiabilidade de escalas deniro de questionários é medida pelo coeficiente de correlação. Q ualquer coeficiente m aior do que 0.70
è forte, indicando que as duas esealas podem ser consideradas confiáveis.
424 C hrístine P. Dancey & John Reidy
Sabemos como visualizar diagramas de dispersão c que um coeficiente de correlação de

0,7 significa que 49% (isto é, 0,7x0,7 = 49) da variação dos valores em x podem ser atribuído-
à variação dos valores em y. Você pode desenhar círculos sobrepostos para representar a cor
relação. No exemplo, as dez variáveis originais podem ser divididas em dois padrões distintos
(veja as Figuras 12.1 e 12.2).
É claro que, quando executa uma análise estatística no computador, você não obtem tais
diagramas na saída do software. Entretanto, a execução de uma analise de fatores permite
que você veja os padrões de alguma forma na saída da análise. Nesse exemplo, Alexander e
colaboradores descobriram que as 10 variáveis listadas acima podem ser atribuídas a dois “fa
tores” distintos. A vergonha influencia os escores de cinco das variáveis, e culpa, os escore-
das outras cinco. Note que não medimos culpa e vergonha diretamente, mas admitimos su_
existência, pelos escores das variáveis observadas. Note ainda que só vale a pena executar
uma análise de fatores se as variáveis estão correlacionadas. Se não estiverem, não existirá»
padrões de correlações para ser analisados.
Dez variáveis correlacionadas.
Dois conjuntos de cinco variáveis correlacionadas.

12.5 0 conceito de análise de fatores
Uma forma de entender a análise de fatores é graficamente. Você já sabe que o relacio
namento entre as variáveis pode ser representado por cocficientes de correlação, círculos
sobrepostos ou diagramas de dispersão. No entanto, existe outra maneira de representar o
relacionamento entre variáveis: calcular o valor do ângulo entre elas.
Retornando ao exemplo, vamos considerar que duas das variáveis, a 8 e a 1, estão correla
cionadas, por um valor de 0.90. Podemos representar esse relacionamento geometricamente,
convertendo o valor 0,9 em uma medida do ângulo entre elas, Para converter 0,90 em um grau
que mede o ângulo entre as duas variáveis, você precisa consultar a Tabela 12.3.
Pode-se ver que um coeficiente de correlação de 0,90 é convertido em um ângulo de 26'.
Use uma linha horizontal para representar uma das variáveis, por exemplo, a 1. Você pode
então, com o auxílio de um transferidor, medir 26' e traçar outra linha que poderá ser rotulada
de 8 (veja Figura 12.3).
Esse ângulo representa o grau de relacionamento entre elas. Essas linhas desenhadas
com uma seta em uma das pontas são denominadas de vetores. Um vetor é simplesmente um
segmento de reta que tem um ponto de partida, uma direção e um comprimento.
Se as nossas duas variáveis medem exatamente a mesma coisa e estão perfeitamente
correlacionadas, o ângulo entre elas será zero, e ambas serão representadas pelo mesmo vetor
(veja Figura 12.4).
Tabela 12.3 Tabela de conversão do /-para um ângulo (valores arredondados para inteiros)
r Grau r Grau r Grau r Grau r Grau
0,00 90 0.30 72 0,50 60 0.70 46 0.90 26

0,11 84 0.31 72 0,51 59 0.71 45 0,91 25
0,12 83 0.32 71 0,52 59 0,72 44 0,92 23
0,13 83 0,33 71 0,53 58 0,73 43 0,93 22
0,14 82 0.34 70 0,54 57 0,74 42 0,94 20
0,15 82 0.35 70 0.55 57 0,75 41 0.95 18
0,16 81 0,36 69 0,56 56 0,76 41 0.96 16
0,17 80 0,37 68 0,57 55 0.77 40 0,97 14
0,18 80 0,38 68 0,58 54 0,78 39 0,98 11
0,19 79 0.39 67 0,59 54 0,79 38 0,99 8
0,20 78 0,40 66 0.60 53 0,80 37 1,00 00
0,21 78 0,41 66 0,61 52 0,81 36
0,22 77 0,42 65 0.62 S2 0,82 35
0.23 77 0,43 65 0,63 51 0.83 34
0,24 76 0,44 64 0,64 50 0.84 33
0,25 76 0,45 03 0,65 49 0,85 32
0,26 75 0,46 63 0,66 49 0,86 31
0,27 74 0.47 62 0,67 48 0.87 30
0,28 74 0,48 61 0,68 47 0,88 28
0,29 73 0,49 61 0,69 46 0.89 27
* Os valores dessa labela foram calculados pelos autores.

90°
Diagrama que mostra um ângulo de 26° entre os itens 1 e 8.

Figura 12.3
90°
. Sentir-se autoconsciente (item 8)
. Fazor algo
em baraçoso em público (item 1)
Diagrama que mostra um ângulo de 0o entre os itens 1 e 8.

Figura 12.4
Se. por outro lado, as duas variáveis são totalmente não-correlacionadas, estão uma em
cada lado de um ângulo reto. O grau de relacionamento será 90, que representa a correlaçã
zero (veja Figura 12.5).
Como forma de realizar a análise de fatores nessas duas variáveis (é claro que não igual, n t-
um modo Fácil de começar), precisamos encontrar um novo vetor, que melhor represente as du_-
variáveis. Fazemos isso traçando o novo vetor bem no centro de x e v (veja Figura 12.6).
Sentir-se autoconsciente (item 8)
Fazer algo
Figura 12.5 Diagrama que mostra um ângulo de 90° entre os itens 1 e 8.

90°
Sentir-se autoconsciente (item 8)
i T 3 0-) | Fazer algo

Figura 12.6 Diagrama que mostra um ângulo de 26° entre os itens 1 e 8 com um fator resultante.
12.6 Denominação de fatores
A linha pontilhada é o novo fator, que podemos chamar de “vergonha”. As pessoas atri
buem nomes aos fatores, verificando o que as variáveis relacionadas possuem em comum.
Nesse caso, as duas variáveis apresentam “vergonha” em comum. Uma vez que as variáveis
“sentir-se autoconsciente” e “fazer algo embaraçoso em público” podem ser representadas
por um ângulo de 26 você pode ver que o ângulo entre “sentir-se autoconsciente” e o novo
vetor deve ser de 13°, e o ângulo entre “fazer algo embaraçoso em público” e o novo vetor
tambem deve ser de 13o. Isso pode ser visto na Figura ] 2.6.
12.7 Cargas de variáveis em fatores
Podemos converter esses ângulos novamente em coeficientes de correlação. Veja Ta

bela 12.4.
Você deve observar que um ângulo de 13" corresponde a um coeficiente de correlação
de 0,97. Esse é o coeficiente de correlação entre “sentir-se autoconsciente” e o novo fator
resultante, bem como entre “fazer algo embaraçoso em público” e o novo fator resultante.
Dizemos que ambas “carregam altamente” na vergonha. De fato, o novo fator representa
94%' do relacionamento entre as variáveis (0,97"). O novo fator agrupa variáveis relacionadas
(matematicamente) entre si, mas são diferentes das demais.
Nos diagramas, desenhamos apenas duas variáveis, mas a análise de fatores trabalha
com um espaço «-dimensional. Não podemos nem desenhar de forma adequada em três di
mensões, embora tentemos explicar pela visualização de tal espaço. O exemplo usou duas
variáveis para ilustrar como obter um novo fator. Existem, no entanto, 10 variáveis. A análise
de fatores procura padrões de correlações e agrupa as variáveis que mais explicam as varia
ções nos valores.
Tabela 12.4 Tabela de conversão das medidas dos ângulos para coeficientes de correlação*
Grau r Grau R Grau K Grau r
0 1.00 24 0.91 48 0,67 72 0,31

1 0.99 25 0.9! 49 0.66 73 0,29
2 0.99 26 0 90 50 0.64 74 0,28
3 0.99 27 0,89 51 0.63 75 0.26
4 0.99 28 0.88 52 0,62 76 0.24
5 0.99 29 0.87 53 0,62 77 0,22
6 0.99 30 0,86 54 0.59 78 0,21
7 0.99 31 0,86 55 0,57 79 0.19
8 0,99 32 0,85 56 0,56 80 0.17
9 0.99 33 0,84 57 0.55 81 0.16
10 0,98 34 0.83 58 0,53 82 0.14
11 0.98 35 0.82 59 0,52 83 0.12
12 0.98 36 0,81 60 0,50 84 0,10
13 0,97 37 0,80 61 0.48 85 0,09
14 0.97 38 0.79 62 0,47 86 0,07
15 0,97 39 0,78 63 0.45 87 0,05
10 0.96 40 0,77 64 0.44 88 0,03
17 0,96 41 0.75 65 0,42 89 0,02
18 0.95 42 0.74 66 0.41 90 0,00
19 0.95 43 0.73 67 0,39
20 0,94 44 0,72 68 0,37
21 0.93 45 0.71 69 0.36
22 0.93 46 0.69 70 0.34
23 0,92 4"’ 0,68 -| 0,33
■O s valores dessa tabela foram calcu la d o s pelos autores.
Via álgebra matricial; os vetores são então situados em um espaço «-dimensional, e o \ e-

tor (fator) resultado é encontrado de uma forma semelhante ao exemplo da Figura 12.6. Uir _
vez determinado tal fator (provisoriamente denominado de Fator 1). o Fator 2 agrupa ur:
conjunto diferente de variáveis, normalmente não-correlacionado com o primeiro. Cada fatc
“representa’ um conjunto de variáveis (as variáveis que estão fortemente relacionadas corr.
ele). Atribuímos nome aos fatores procurando o que essas variáveis apresentam em comum
Imagine que temos uma análise executada sobre 20 variáveis e que o programa obte\ s
os coeficientes de correlação, converteu esses coeficientes em ângulos e encontrou o pn-
meiro fator para o primeiro conjunto de padrões de correlações (o cálculo é feito por me:
da álgebra matricial). Embora não possamos fazer a representação, o diagrama seguin:;
mostra uma forma de visualizar o que está acontecendo, de modo aproximado. Você pou:
imaginar o fator como um guarda-chuva invertido com raios quebrados. Os raios são _
variáveis.
Já se fez m enção a m atrizes: m atriz de dados, de correlações, de variâncias-covariâncias, por exem plo. A álgebra m atricial . -
m étodo pelo qual essas matrizes sào m anipuladas. N as técnicas multivariadas, com o a análise de fatores e a MANOVA. a á k v
m atricial e o m étodo de análise.
variáveis (os vetores mais distantes d o cabo) estão m u ito p o u c o relacionadas

A lg u m a s
com o novo fator e não sã o utilizadas para nomeá-lo. Outras variáveis (a s m ais próximas do
cabo) estão fortemente relacionadas com o fator e são utilizadas para dar um nome ao novo
componente. Variáveis que têm alia carga em um fator são as mais próximas a ele. Embora
não vejamos diagramas como o acima na saída do programa computacional, temos uma tabela
com as cargas dos fatores (são os coeficientes de correlação entre as variáveis e os fatores).
Atividade 12.2
Olhe para o seguinte diagrama, que representa variáveis correlacionadas com o fator 1.
Que nome você daria a esse fator?
As pessoas estão Sinto-m e ansioso

me olhando
Sinto-me em pânico' Pensam entos brotam

na m inha m ente
Tenho enjôo
freqü en tem en te
Sofro de
dor de cabeça
No exemplo de vergonha e culpa, temos dez variáveis.
12.8 Matriz das correlações
O p rim e iro p asso do p ro g ra m a é o b te r a m atriz d o s co eficie n te s de correlação .

Tabela 12.4 Tabela de conversão das medidas dos ângulos para coclicientes de correlação*
Grau i Grau R Grau R Grau r
0 1.00 21 0.91 48 0.67 72 0.31

1 0.99 25 0.91 49 0.66 73 0.29
2 0,99 26 0.90 50 0.64 74 0,28
3 0.99 27 0.89 51 0,63 75 0.26
4 0.99 28 0.88 52 0,62 76 0.24
5 0.99 29 0.87 53 0.62 77 0.22
6 0.99 30 0.86 54 0.59 78 0,21
7 0.99 31 0,86 55 0,57 79 0.19
8 0.99 32 0.85 56 0.56 80 o .r
9 0.99 33 0.84 57 0,55 81 0.16
10 0,98 34 0.83 58 0.53 82 0.14
11 0.98 35 0,82 59 0,52 83 0.12
12 0.98 36 0,8 J 60 0.50 84 0.10
13 0,97 37 0.80 61 0.48 85 0,09
14 0,97 38 0,79 62 0,47 86 0.07
15 0,97 39 0,78 63 0.45 87 0.05
16 0,96 40 0,77 64 0.44 °>8 0.03
17 0,96 41 0.75 65 0.42 89 0.02
18 0,95 42 0.74 66 0.41 90 0,00
19 0,95 43 0,73 67 0.39
20 0.94 44 0,72 68 0,37
21 0,93 45 0.71 69 0.36
22 0,93 46 0.69 70 0.34
23 0,92 47 0,68 ■m 0,33
Os valores d essa tabela fo ram c alcu lad o s pelos autores.
Via álgebra matricial,' os vetores são então situados em um espaço n-dimensional. e o ve
tor (fator) resultado é encontrado, de uma forma semelhante ao exemplo da Figura 12.6. Un^
vez determinado tal fator (provisoriamente denominado de Fator 1), o Fator 2 agrupa urr
conjunto diferente de variáveis, normalmente não-correlacionado com o primeiro. Cada fator
“representa” um conjunto de variáveis (as variáveis que estão fortemente relacionadas corr.
ele). Atribuímos nome aos fatores procurando o que es:.as variáveis apresentam em comum.
Imagine que temos uma análise executada sobre 20 variáveis e que o programa obte\;
os coeficientes de correlação, converteu esses coeficientes em ângulos e encontrou o pr.-
meiro fator para o primeiro conjunto de padrões de correlações (o cálculo é feito por me:
da álgebra matricial). Embora não possamos fazer a representação, o diagrama seguinte
mostra uma forma de visualizar o que está acontecendo, de modo aproximado. Você poc;
imaginar o fator como um guarda-chuva invertido com raios quebrados. Os raios são
variáveis.
Já se fez m enção a matrizes: m atriz de dados, de correlações, de variâncias-covariâncias, por exem plo. A álgebra matricial e -
m étodo pelo qual essas m atrizes são m anipuladas. N as técnicas m ultivariadas, com o a análise de fatores e a MANOVA, a álg c-
m atricial e' o m étodo de análise.
A lg u m a s v a r iá v e is (o s v e to re s m a is d ista n tes d o c a b o ) e stã o m u ito p o u c o r e la cio n a d a s

c o m o n o v o fator e n ão sã o u tiliza d a s para n o m e á -lo . O utras variáveis (as m a is p r ó x im a s do
c a b o ) e stã o fo r te m e n te r e la cio n a d a s c o m o fator e sã o u tiliz a d a s para dar u m n o m e ao n o v o
c o m p o n e n te . V ariá v eis q u e têm alta carg a e m um fator s ã o as m a is p r ó x im a s a e le . E m b ora
nao v e ja m o s d iagram as c o m o o a c im a na sa íd a d o program a c o m p u ta c io n a l, te m o s u m a tabela
c o m as ca rg a s d o s fa to res (sã o o s c o e f ic ie n te s d e c o r r e la ç ã o entre as va riá v eis e o s fatores).
Atividade 12.2
Olhe para o seguinte diagrama, que representa variáveis correlacionadas com o Fator 1
Que nome você daria a esse fator?
As pessoas estão Sinto-me ansioso

me olhando
Sinto-me em pânico' Pensamentos brotam

na minha mente
Tenho enjôo
freqüentemente
Sofro de
dor de cabeça
N o e x e m p lo de verg o n h a e culpr., te m o s d e z variáveis.
12.8 Matriz das correlações
O p rim eiro passo do p ro g ram a é o b ter a m atriz dos co eficien tes de correlação.
430
Correlações: valores r e p para as variáveis vergonha e culpa
Fazer algo Trapacear Ferir os Ser o Parecer Não se Ter algo Sentir-se Compor Não dizer

embaraçoso secretamente sentimentos centro das inadequado importar desfavorável auto- tar-se nada quando
em público acerca de algo de alguém atenções para outras com sobre você conciente grossei o balconista
que você sabe pessoas os outros revelado na frente ramente dá troco
que não será de outros a mais
descoberto
Fazer algo embaraçoso em público 1,000 0,343 0,215 0,557 0,476 0,264 0,416 0,490 0,239 0,230
0,001 0,023 0,000 0,000 0,007 0,000 0,000 0,013 0,017
Trapacear secretamente acerca de algo 1,000 0,450 0,383 0,306 0,354 0,176 0,280 0,503 0,353
que você sabe que não será descoberto
0,000 0,000 0,002 0,000 0,052 0,005 0,000 0,000
Ferir os sentimentos de alguém 1,000 0,202 0,376 0,776 0,137 0,310 0,748 0,318
0,031 0,000 0,000 0,104 0,002 0,000 0,001
Ser o centro das atenções 1,000 0,437 0,168 0,302 0,469 0,230 0,122
0,000 0,062 0,002 0,000 0,017 0,132
Parecer Inadequado para outras pessoas 1,000 0,371 0,530 0,745 0,483 0,177
0,000 0,000 0,000 0,000 0,052
Não se importar com os outros 1,000 0,256 0,258 0,739 0,393
0,009 0,008 0,000 0,000
Ter revelado algo desfavorável sobre você 1,000 0,567 0,272 0,209
0,000 0,006 0,027
Sentir-se autoconsdente face a outros 1,000 0,342 0,267
0,001 0,006
Comportar-se grosseiramente 1,000 0,436
0,000
Não dizer nada quando o balconista 1,000

dá troco a mais
12.9 Matrizes com rotação e sem rotação
O p r o g r a m a e s ta tís tic o (p. e x ., S P S S P W ) u tiliz a a á lg eb ra m a tr ic ia l so b re o s v a lo r e s,

q u e resu lta e m u m a m atriz q u e m o stra as c o r r e la ç õ e s das v a r iá v e is c o m o s fa to res. E ss a pri
m eira m a triz é se m r o ta çã o . E x p lic a r e m o s o q u e s ig n if ic a m a is a d ia n te. A á lg eb ra m a tricia l
é u tiliz a d a para e x e c u ta r r o ta ç õ e s na m a triz . A m atriz c o m r o ta ç ã o c o n té m a s c a r g a s d o s
fa to re s (c o r r e la ç õ e s d as v a r iá v e is c o m o s fa to re s), u s a d o s na in te rp re ta çã o d o s r e s u lta d o s e
n o s v a lo r e s u tiliz a d o s para r e la tá -lo s . O s c o e f ic ie n t e s d e c o r r e la ç ã o na m a triz c o m r otação
(v e ja T a b e la 1 2 .5 ) ta m b ém sã o u tiliz a d o s na c o n str u ç ã o d o s d ia g r a m a s a segu ir. O p r im e i
ro d ia g r a m a m o stra o r e la c io n a m e n to d a s v a r iá v e is c o m o p r im eiro fa to r r e s u lta n te (v e ja
F ig u ra 1 2 .7 ).
V ocê p o d e p erceb er q u e tod as as v a r iá v e is p ró x im a s a o c a b o têm a ver c o m iten s que se
r e la c io n a m c o m o F ator 1 (v e r g o n h a ). O program a e x a m in a as v a r iá v e is e e n c o n tr a o fator
resu lta n te (v e ja F igu ra 1 2 .8 ). V o cê p o d e co n sta ta r qu e to d a s as v a r iá v e is p r ó x im a s a o c a b o
têm a ver c o m a cu lp a . D a s 10 v a riá v eis, sã o e x tra íd o s, en tã o , d o is fatores.
O b se r v a n d o a T ab ela 12.5, p o d e m o s v e r q u e o s c in c o ite n s c o m m a is cargas n o F ator 1
e stã o agru p ad os ju n to s e qu e e s s e fator é d e n o m in a d o “ v e rg o n h a '’. O s ou tros iten s tê m m ais
carga n o Fator 2 , d e n o m in a d o “c u lp a ” . A le x a n d e r e c o la b o ra d o re s m e n c io n a m e m se u artigo
qu e o c ritério qu e u tilizaram para d e c id ir se a carga de um fator era alta fo i 0 ,5 . V o cê d e v e ter
e m m en te qu e e s s e é um v alor to ta lm en te arbitrário e q u e o u tro s p e sq u isa d o r e s p o d e m e s c o
lher 0 ,4 o u m e s m o 0 ,3 . É sem p re b om qu e um item p o ssu a alta carga e m a p en a s um fator.
N a T ab ela 1 2 .5 , c o n v e r te m o s cada carga d o fator e m grau s, a ssim v o c ê p o d e v e rific a r por
si (u tiliz a n d o u m transferid or) q u e d e se n h a m o s as F ig u ra s 12.7 e 12.8 corretam en te.
Tabela 12.5 Cargas dos fatores com rotação
Fato r 1 Fíito r 2
Item Descrição r G rau r G ra u
1 Fazer algo embaraçoso em público 0.75 41 0.15 82

2 Trapacear secretamente acerca de algo que vocô saK' 0,30 72 0.57 55
que não será descoberto
3 Ferir os sentimentos de alguém 0.11 84 0,88 28
4 Ser o centro das atenções 0,71 45 0,11 84
5 Parecer inadequado para outras pessoas 0,76 41 0,32 71
6 Não se importar com os outros 0.12 83 0,87 30
7 Ter revelado algo desfavorável sobre você 0,71 45 0.11 84
8 Sentir-se autoconsciente face a outros 0,82 35 0.21 78
9 Comportar-se grosseiramente 0.20 78 0,88 28
10 Não dizer nada quando o balconista dá troco a inai- 0 .15 82 0,56 56
9r da variância 43.9 17,5
Diagrama dos ângulos representativos da correlação entre as variáveis e o Fator 1'

Figura 12.7
F2 Culpa
Figura 12.8
C o lo c a m o s em n egrito to d a s as c o r r e la ç õ e s a c im a de 0 ,5 . T o d o s o s n ú m eros e m negrit

n o Fator l s e r ela cio n a m c o m vergon h a. T o d o s o s v a lo re s e m n egrito n o Fator 2 se r e la c io n a r
c o m cu lp a. A le x a n d e r e c o la b o ra d o re s verifica ra m qu e a e s c a la v erg o n h a e cu lp a , na rea lid a
d e , c o n s is te d e d u as e s c a la s , em q u e um a p o d e ser c h a m a d a c u lp a e a outra d e vergon h a.
12.10 Plotagem das variáveis no espaço dos fatores
O utra fo r m a de v isu a liz a r o s a g r u p a m e n to s d e v a r iá v e is q u e fo rm a m o s fa to res é d e s e

nhar e s te s e p lotar as v a r iá v e is n o e s p a ç o d c fatores (v e ja F ig u ra 1 2 .9 ). O b se r v e o prim eir:
ite m q u e tem carg a d e 0 .7 5 n o F1 e 0 ,1 5 no F2. P ercorra o e ix o h o r iz o n ta l ( F l ) por 0 ,7 5 ;
su ba (e m d ir e ç ã o a o F 2 ) p or 0 .1 5 . E s c r e \a o n ú m er o d o ite m n o q u al as d u a s lin h a s se e n
co n tra rem . A lin h a p o n tilh a d a fa z e s s a ilu str a ç ã o q u a n to a o item 1.
F2 CULPA
- 1,0
-0 ,9
- 0,8
-0 ,7
- 0,6
-0 ,5
0,4
-0 ,3
- 0,2
0,1
0,0
F1 VERGONHA
-1----í—^-1-------- 1----------r
-1 0 -9 -8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8 9 10
I--2
3
--4
--5
--6
-7
10
Diagrama que mostra a primeira variável (fazer algo embaraçoso em público)

Figura 12.9
representada no espaço de fatores.
Atividade 12.3
Complete o restante você mesmo com lápis. Verifique seus resultados pela Figura 12.10
F2 CULPA
1,0 -
0,9 -
0,8 •
0,7 •
0,6
0,5
0,4
0,3
0,2
0,1 F1
0,0
VERGONHA
0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Não existem cargas
negativas aqui
R esp o sta do exe rcício p ro p o sto na A tiv id a d e 1 2 .3 .

Figura 12.10
É c la r o q u e n ã o p o d e m o s d esen h a r m a is d o q u e o F ator 1 contra o F ator 2 - te m o s sorte

c o m o e x e m p lo . V o cê p o d e v er c la r a m en te que e x is te m d o is a g lo m e r a d o s de v a r iá v e is, o lh a n
d o tanto no d iagram a (F igu ra 1 2 .1 0 ) q u anto na m atriz d o s c o m p o n e n te s ro ta cio n a d a (Tabela
12.5). E stá e x p líc ito porqu e trab alh am os c o m a m atriz r otacion ad a. A segu ir, e is c o m o era a
m atriz an tes da rotação.
Matriz dos componentes5
Componente
1 2
Fazer algo embaraçoso em público 0,625 0,433
Trapacear secretamente acerca de algo que você sabe que não será descoberto 0,621 -0 ,1 7 2
Ferir os sentimentos de alguém 0,710 -0 ,5 3 3
Ser o centro das atenções 0,569 0,441
Parecer inadequado para outras pessoas 0,758 0,334
Não se importar com os outros 0,712 -0 ,5 1 2
Ter revelado algo desfavorável sobre você 0,574 0,43 6
Sentir-se autoconscíente na frente de outros 0,719 0,450
Comportar-se grosseiramente 0,777 -0,461
Não dizer nada quando o balconista dá troco a mais 0,507 -0 ,2 7 7
Método de Extração; Análise de Componentes Principais,

a. Dois componentes extraídos
É d if íc il p e r c e b e r o a g r u p a m e n to d a s v a r iá v e is c o m o u s o d e s s a m atriz; n ã o c o n s e
g u im o s v er q u a is sã o o s ite n s r e la c io n a d o s c o m v e r g o n h a e q u a is o s r e la c io n a d o s c o r
c u lp a , p o r q u e to d a s as v a r iá v e is a p r e se n ta m a lta s c a rg a s c o m o p r im e ir o fator. N o entant
se d e s e n h a r m o s n o v a m e n te as v a r iá v e is n o e s p a ç o d e fa to r e s c o m o u s o d a m a triz qu;
n ã o so fr e u r o ta ç ã o , p o d e m o s v er q u e e x is t e m d o is g r u p o s d e v a r iá v e is , m o d e r a d a m en te
c o r r e la c io n a d a s c o m o s d o is fa to re s. V o c ê p o d e v e r is s o ta n to d o d ia g r a m a (F ig u r a 1 2 . 1'
q u a n to na sa íd a referid a.
12.11 Rotação da matriz
C o m o fo r m a d e ajud ar n a in te r p r e ta ç ã o , o s e ix o s s o fr e m rotações." 1 E x is t e m várL

m a n e ir a s d e fa z e r a r o ta ç ã o d e e ix o s - m a s a m a is c o m u m é d e n o m in a d a d e varimax.
o b je tiv o d e s s e m é to d o é m a x im iz a r as a lta s c o r r e la ç õ e s e m in im iz a r as b a ix a s. O progran .
c o m p u ta c io n a l roda a m a triz tão l o g o v o c ê te n h a s e le c io n a d o a o p ç ã o d e se ja d a . A r o ta ç l
é u m a t é c n ic a já b e m e s t a b e le c id a q u e torn a a in te r p r e ta ç ã o m a is f á c il, e n fa tiz a n d o -
Isso é feito pela multiplicação da matriz dos componentes sem rotação por algo denominado transformação da matriz de co:
nenies, com auxílio da álgebra matricial.
d ife r e n ç a s n as ca rg a s (d a s v a r iá v e is c o m c a d a fa to r ).3 Q u a n d o o s d a d o s sã o fo r te s e o s p a
d r õ e s c la r o s, a e s c o lh a d o m é to d o d e r o ta çã o n ão im p o r ta m u ito , p o is as c o n c lu s õ e s se r ã o
s e m e lh a n te s .
Exemplo da literatura: Sll
O u s o d a a n á lise de fa to re s se e ste n d e à p s ic o lo g ia da sa ú d e. D o e n ç a s c r ô n ic a s in v is ív e is , por

e x e m p lo , sã o a q u ela s e m qu e o s sin to m a s p e r siste m , m a s n ã o sã o ap aren tes para ou tras p e s s o a s .
U m a d e ss a s d o e n ç a s é a sín d ro m e d o in te stin o irritável (S II). u m c o n ju n to d e sin to m a s, n e m to d o s
te n d o a ver c o m o in te stin o . P e s s o a s d ia g n o stic a d a s c o m o portad oras da SII têm s id o a v a lia d a s
q u an to a vários sin to m a s. O s d a d o s e m p ír ic o s sã o o s e s c o r e s o b tid o s nas a v a lia ç õ e s realizad as.
C o m o parte d e um e stu d o in v e stig a n d o as c a ra cterística s de d istú rb io s a lim e n ta r es no S II, T ang
e c o la b o ra d o re s ( 1 9 9 8 ) c o le ta ra m in fo r m a ç õ e s sob re n o v e sin to m a s g a str in te stin a is a cad a d ia por
d u as se m a n a s. S e ss e n ta p a rticip a n tes atribuíram n o ta s a o s se u s sin to m a s em u m a e sc a la d e c in c o
p o n to s (0 - o sin to m a n ão é um p r o b le m a , 4 - p r o b le m a d e b ilita n te ). T ang e c o la b o r a d o r e s c a l
cu laram a m é d ia d o s sin to m a s , q u e eram dor a b d o m in a l, s e n s ib ilid a d e a b d o m in a l, c o n stip a ç ã o ,
eru cta çã o , diarréia, n á u se a s e v ô m ito s.
12.12 Execução da análise de fatores
E s s e s sã o o s p a s so s n e c e s sá r io s para ex ec u ta r u m a a n á lise de fatores:
1. Primeiro, a matriz das correlações é produzida. O s p e sq u isa d o r e s n ã o p recisa m

u tiliz a r a m atriz d e c o r r e la ç õ e s, em b ora o program a u tiliz e in fo r m a ç õ e s su as para
p r o sseg u ir c o m a a n á lise de fatores.
2. O conjunto de fatores é extraído. N a prática, é p o s sív e l extrair tan tos fa to res q u anto
for o n ú m ero de v a r iá v e is (se cada variável n ão for alta m en te c o rr ela c io n a d a co m
q u alq u er outra), m a s is s o c o n tra d iz o s o b je tiv o s da a n á lise de fatores. Q u e re m o s o b
ter o m á x im o p o s sív e l da variação, m a n te n d o o m ín im o p o s sív e l de fatores. E m bora
no p rim eiro e x e m p lo e x is tis s e m d o is fa to res, na m aioria d as v e z e s as c o is a s n ã o são
tão s im p le s a ss im , e a d e c is ã o sob re o n ú m ero de fa to res a serem e x tra íd o s c a b e ao
p e sq u isa d o r, qu e se fu n d a m en ta tanto e m c ritério s e sta tístic o s qu anto te ó rico s.
3. Determina-se o número de fatores que deve ser retido. Q u a n d o a a n á lise d e fatores

é e x ec u ta d a no S P S S P W , o program a d e c id e q u a n to s fa to re s d e v e m ser e x tra íd o s
c o m b a se e m c ritério s e sta tístic o s. C ad a fator e xtraíd o retém certa q u an tid ad e da
variân cia.
(a) O s a u to v a lo r es m ostram a p rop orção da variân cia q u e c a d a fator é c a p a z de
reter. A so m a d o s a u to v a lo r es é igual a o n ú m ero de v a r iá v e is na a n á lise . C ad a
fator que tem um au tovalor a c im a de 1 c m an tid o.
' O m élodo dc rotação vu rin m x assegura que cada fator seja independente dos demais. Na vida real. muitas variáveis psicológicas são
intercorrelacionadas. Portanto, o método varirruix é artificial, mas mesmo assim é uma forma bastante utili/ada de rotação.
É um a regra ú til, m a s o q u e a c o n te c e se um d o s fatores tem um valor d e 0 ,9 9 ?

U tiliz a n d o c e g a m e n te a regra, o fator n ão seria c o n sid e r a d o , to d a v ia p o d e ser
im p ortan te d o p on to de v ista teó rico , É aqui q u e o p e sq u isa d o r d e v e con sid erar
se m antém tal fator. S e d e c id ir qu e o fator d e v e ser m a n tid o , o S P S S P W p recisa
ser in form ad o.
(b) O d iagram a d e d e c liv id a d e é a p en as o nú m ero de fatores p lo ta d o contra a qu an
tidade de variân cia, E is um e x e m p lo d e ss e tip o d e diagram a.
“1
Num ero do com ponente
A id é ia é qu e o s fa to re s d e c r e sc e m até certo n ív el e d e p o is form am u m a linha

q u a se h o rizo n ta l. A regra é olh a r para o g r á fic o e ver o n d e e stá o p on to e m que
o g r á fic o c o m e ç a a ficar q u a se horizon tal e a pegar to d o s o s v a lo res an teriores a
e s s e p on to A q u i e s c o lh e r ía m o s d o is c o m p o n e n te s. É fá c il se o g r á fic o se a ss e
m e lh a ao anterior, m as n ão se for igual ao d iagram a a seguir.
Número do com ponente
É d ifícil d iz er q u an tos c o m p o n e n te s d e v e m ser ex tra íd o s.

(c ) O terceiro c ritér io é o b servar qu an to da v ariân cia o s fa to res c o n s e g u e m extrair.

É um a b o a prática tentar m anter p e lo m e n o s 75% da variân cia. N o en tan to,
v o c ê p r e cisa e x p lic a r o m á x im o d e variação c o m o m ín im o d e fatores. A s sim ,
to d o s o s c ritério s d e v e m ser u tiliz a d o s e m c o n ju n to para d e c id ir q u a n to s fatores
d e v e m ser e x tra íd o s. U m b o m p e sq u isa d o r p r e c isa levar tu d o em c o n sid e r a ç ã o
para chegai' a u m a d e c is ã o d e q u a n to s fatores serã o m a n tid o s.
4. Verificam-se as cargas dos fatores sem rotação. O program a in fo rm a a fo rça do

r e la c io n a m e n to en tre o s iten s e o s fatores. E n tretan to, o s p e sq u isa d o r e s e stã o nor
m a lm en te in te r e ssa d o s so m e n te na m atriz d o s fatores qu e so fr eu rotação, p o is e la é
m a is fá c il de ser interpretada (v e ja p á g in a 4 3 4 ). T ang e c o la b o ra d o re s in form am que
u tiliza ra m o m é to d o de r otação varimax (o pad rão d o S P S S P W ).
5. Nom eiam -se fatores. O p e s q u is a d o r o b s e r v a a carga d o s fa to r e s a p ó s a ro ta çã o

para e n c o n tr a r c o n ju n to s de v a r iá v e is c o m a lg o e m c o m u m . Para is s o , a d e c is ã o
p o d e se r to m a d a c o m b a s e n o v a lo r d a carg a q u e d e v e s e r in c lu íd a n o p r o c e s s o .
C o m o já m e n c io n a d o , te n d e a se r u m p r o c e s s o to ta lm e n te arbitrário e varia d e
0 ,3 a 0 ,5 . T an g e c o la b o r a d o r e s ( 1 9 9 8 ) in fo r m a m q u e o s "itens a p ó s r o ta ç ã o c o m
ca rg a m a io r o u ig u a l a 0 ,4 fo r a m in c o r p o r a d o s d e n tr o d e í n d i c e ' . O F ator 1 n or
m a lm e n te é o r e s p o n s á v e l p e la m a io r q u a n tid a d e d a v a r iâ n c ia , s e g u id o p e lo Fator
2 , e a s s im por d ia n te .
A tab ela a se g u ir m ostra as cargas da se v e rid a d e d o s sin to m a s q u e sofreram r otação p e lo

m é to d o varimax.
Sintomas Componente I Componente II Componente I I I
O
Sensibilidade O
r
0,88 -0.09
1
Dor 0,87 0,28 -0.02

Ingesião de ar 0,73 0,13 0,03
Constipação 0,61 0.06 0,51
Flatulência 0,17 0,86 0,04
Eructação 0.19 0,85 0.09
Diarréia - 0,04 0,37 0,12
Vômitos -0,25 0,15 0,81
Náuseas 0,38 0,18 0,64
Percentagem da variância 3 0 . 1% 19.3% 15,1%
Tang e colaboradojcs ( J 998)
A p r e se n ta m o s e m n eg rito as ca rg a s a c im a d e 0 ,4 . T ang e c o la b o r a d o r e s n ã o m e n c io n a
ram qu e a d ia rséia não foi atrib uída a n e n h u m c o m p o n e n te p e lo critério d e 0 .4 . P or ser um
c ritér io arbitrário, p a r e ce qu e a d iarréia p o d er ia ser c o lo c a d a ju n to às d u as v a r iá v e is que
fo rm a m o C o m p o n e n te II.
N o e stu d o de T ang e c o la b o ra d o re s o b s e r v o u -s e que as n ove va riá v eis lista d a s p o d em ser
agru p ad as em três c o m p o n e n te s, se n d o o Fator 1 fo rm a d o por se n s ib ilid a d e , dor, in g e stã o de
ar e c o n stip a ç ã o .
T an g e c o la b o r a d o r e s d e n o m in a r a m o s fa to re s c o m o “d or fís ic a e d e s c o n fo r to ” , " fla
tu lê n c ia ” e “ v ô m it o s ” . A lg u m a s v e z e s , o s p e sq u isa d o r e s se d iv e rte m p e n sa n d o e m n o m e s
ap rop riad os e e n g r a ça d o s, m a s e s s e n ão fo i o c a so .
Atividade 12.4
Observe o quadro.
Matriz dos Componentes Rotacíonada
Componente
1 2 3
Auto-expressão 0,801
Recreação ativa 0,766
Outros relacionamentos sociais 0,737
Relacionamentos familiares 0,715
Trabalho 0,652
Vida sexual 0,651
Envolvimento com a comunidade 0,638
Relacionamento com a esposa 0,623
Situação financeira 0,592
Saúde 0,592
Recreação passiva 0,447
Religião 0,431
Dieta
Contentamento 0,673
Contentamento com alguma coisa 0,670
Orgulho 0,62 6
Excitação 0,614
No topo do mundo 0,480
Magoado 0,677
Entediado 0,62 8
Agitado 0,511
Deprimido 0,460
Método de Extração: Análise de Componentes Principais

Método de Rotação: Varimax com Normalização de Kaiser
a. Rotação convergiu em cinco interações
Como podemos nomear os fatores - não existem respostas corretas!

questionário para adolescentes sobre auto-imagem
O terceiro e x e m p lo é um p o u c o m a is c o m p lic a d o , p o is o s p e sq u isa d o r e s e x ecu ta ra m três an á

lis e s para p o d erem d e c id ir q u an tos fatores d everiam ser m a n tid o s. É a c eitá v el porqu e a d e c is ã o de
q u a n to s fatores serã o e x tra íd o s é d o p esq u isa d o r, q u e p r e c isa pensar em várias altern ativas, d e m o d o
a c h e g a r à m e lh o r d e c isã o .
P atton e N o lle r ( 1 9 9 4 ) q u eria m d e sc o b r ir a v a lid a d e de c o n str u c to de u m q u e stio n á r io sob re
a u to -im a g e m q u e tinham d e s e n v o lv id o para a d o le s c e n te s . A p lic a r a m um q u estio n á r io d e 5 3 iten s
para 2 1 6 a d o le sc e n te s . E xecu taram três A C P s sep arad as, u m a m a n te n d o quatro fatores, u m a c in c o
e a terceira m a n te n d o s e is fa to res. E n tretan to, o s e x to fator e x p lic a v a a p e n a s 2 ,1 6 % da variâ n cia
(u m a q u an tid ad e rea lm en te p e q u en a ), e so m e n te d o is iten s tinham alta carga (p e lo critério > 0 ,4 ) no
se x to fator (c o m o u m a regra p rática, um fator n ão d e v e ser m a n tid o q u an d o m e n o s dc três v a r iá v e is
e stã o r e la cio n a d a s a e le ). Q u a n d o P atton e N o lle r foram n o m ea r a o s c in c o fa to res restan tes, tiveram
c o n fia n ç a para d e n o m in á -lo s c o m o :
■ F ator 1 - la d o e m o c io n a l
■ F ator 2 - c o n s c iê n c ia so c ia l
a F ator 3 - im ita ç ã o p e sso a l
■ F ator 4 - r e la c io n a m e n to s fa m ilia r es
■ F ator 5 - r e la c io n a m e n to s s o c ia is
D e fa to , con sid era ra m a p o s sib ilid a d e dc m anter a p en a s quatro fatores na a n á lise fin al, m as isso
sig n ific a r ia qu e um fa to r “ s o c ia l” não e x istir ia , e atribuíram im p o rtâ n cia a is s o fa c e ao c o n h e c im e n
to anterior. A s s im , c o n c lu ír a m qu e a a n á lise de fa to re s c o n fir m o u c in c o d im e n s õ e s da a u to -im a g e m
p revistas.
Atividade 12.5
Patton e Noller decidiram manter cinco fatores no estudo descrito. Pense em qual foi o
critério que utilizaram para chegar a essa decisão. Você concorda com a decisão deles?
por que os estudantes decidem viver no campus
L u z z o e M c D o n a ld ( 1 9 9 6 ) execu taram um a p e sq u isa para d e sc o b r ir por qu e o s estu d a n te s d e

c id e m v iv er no campus. P rim eiro, d e c id ir a m c h e ca r as p ro p ried a d es p sic o m é tr ic a s d o q u estio n á rio
q u e preten d iam utilizar. I ntão, ex a m in a ra m a estrutura d o s fa to re s do m e sm o . L u z z o e M cD o n a ld
e sp e c ific a r a m o c ritério que u sariam para d e c id ir q u a n to s fa to res se r ia m extraíd os.
S e g u ir a m o s p a s so s u su a is a fim de ob terem a a n á lise e e sta b e le c e r a m 0 ,4 c o m o critério para
d e c id ir q u e iten s d ev eria m ser u tiliz a d o s na n o m e a ç ã o e in terp retação d o s fa to res, b is a tab ela das
cargas d o s fa to res já c o m rotação.
Item Fator I Fator 2 Fator 3 Fato r 4 Fator 5
Ser mais independente 0,87 0,08 0,17 0,16 0.18

Ter mais liberdade 0,91 -0 ,0 3 0,21 0,12 0,06
Ficar longe dos pais 0,82 0 11 0,10 -0 .1 3 -0,08
Por segurança 0.1 9 0,68 0,05 0,24 0,16
Ein virtude do custo - 0 .0 4 0,66 0,04 0.03 -0,07
V ontade d o s pais 0.01 0,64 0,10 - 0 ,3 6 0,05
Para ficar coro o s am ig o s 0 .2 6 0,26 0,67 - 0 ,0 6 - 0 ,0 6
Para e n c o n tra r novas p esso as 0,04 0,20 0,85 0,13 0,05
Para encontrar o u tras pesso as interessantes 0,11 - 0 ,1 0 0,81 - 0 ,1 2 - 0 ,3 0
Para ter uma experiência universitária integral 0.12 0,07 0,73 0,19 0,36
Para fazer festa 0,38 -0 ,2 1 0,56 - 0 .2 í 0,30
Por conveniência 0,07 0,08 0,02 0,87 -0 ,1 1
E x ig ên c ia d a b o lsa d e e stu d o s 0,03 - 0 ,0 8 -0,04 -0 ,2 5 0,85
O p o rtu n id a d e para se en v o lv er em a tiv id ad es 0,13 0,39 0,35 0.20 0,60
acad êm icas
A s cargas qu e a p resen ta m v a lo re s a cim a de 0 ,4 foram a p resen tad as em n egrito. É p o s sív e l fazer

o program a c o m p u ta c io n a l om itir as cargas in ferio res a d e te rm in a d o critério, b em c o m o ordenar as
c o r r e la ç õ e s , de m o d o q u e as m a io re s ap areçam prim eiro. E s c o lh e n d o e s s a s o p ç õ e s , to r n a -se m a i'
fá c il verificar q u a is iten s (v a r iá v e is) a p resen ta m as m a io res cargas c o m o s fatores.
Há uma maneira de nomear os fatores. Observe que grupo de itens apresenta a maior
carga com o Fator 1 e pense em um nome que reflita essa comunalidade. Faça o mesmo corr
os outros fatores. Não existe uma resposta "correta" para essa tarefa, é claro, mas você pode
ver os nomes que Luzzo e McDonald deram aos fatores na página 588.
12.13 Uso de fatores ou componentes em outras análises
M u ito s d o s artig o s de p e ,q u is a qu e d isc u tim o s a p resen ta m r esu lta d o s c o m b ase n os fa to

res ex tra íd o s. É b e m co m u m a u tiliz a ç ã o de e sc o r e s d o s fatores e m a n á lise s p o ster io re s, p o is
m u ita s v e z e s o s m e sm o s e stã o c o rr e la c io n a d o s c o m outras variáveis. Por e x e m p lo , A le x a n d e r
e c o la b o r a d o r e s ( 1 9 9 9 ) co n firm a ra m q u e e x is tia m d o is fa to re s n o q u e stio n á r io so b re cu lp a
e v e rg o n h a q u e u tilizaram . O s e s c o r e s o b tid o s p e lo s p a rticip a n tes n e s s e s fa to res (d e fa to um
e s c o r e c o m p o s to p e la s v a r iá v e is q u e fa z e m parte da e s c a la ) e sta v a m c o r r e la c io n a d o 0, c o m
um a m e d id a de d e p r e ssã o (In ven tário de D e p r e ssã o de B e c k - B D 1) e um q u estio n á rio sob re
c o m p o r ta m e n to su b m iss o . E is o s r esu lta d o s (p a rcia is).
Vergonha Cu lpa
ID B 0.07 0.28**
Comportamento submisso 0 ,53 *** 0.35 ***
**/?<0,0t ***p< 0,001
Atividade 12.7
O que você pode concluir dos resultados expostos?
T an g e c o la b o r a d o r e s ( 1 9 9 8 ) ta m b é m o b tiv e ra m a s c o r r e la ç õ e s en tre o s n o v o s fa to re s
d e te rm in a d o s e a s v a r iá v e is r e la cio n a d a s a d istú rb io s alim en ta res.
Dor e desconforto Flatulência Vômitos
Não satisfarão com o corpo 0,09 -0,04 0.23

Perfeição 0.34* -0,03 0,14
Ineficiência 0.34* 0,14 0,35*
Buli mia 0,04 0,13 0,35*
Discrepância de peso -0,02 0,22 0,31*
* * p < 0,05
Atividade 12.8
Observe a tabela anterior. Se você tivesse que interpretar os resultados para um amigo, o
que diria?
12.14 Significado das cargas negativas
C argas n eg a tiv a s sig n ific a m que a variável em q u estã o está n e g a tiv a m en te correlacion ad a
c o m o fator. A lg u m a s v e z e s p o d e ser d ifíc il interpretar u m a carga n egativa. P or e x e m p lo , se
v o c ê a c h a ss e q u e um teste d e a ritm ética e stá n e g a tiv a m en te c o rr ela c io n a d o à h a b ilid a d e m e n
tal. su sp eitaria que fe z a lg o errado, N o r m a lm e n te um a carga n eg a tiv a s ig n ific a a p en a s que a
variável e m q u estã o e stá e x p r e ssa de form a n egativa. P or e x e m p lo , o b se r v e o s se g u in te s iten>.
q u e c o m p õ e m o fator fe lic id a d e extrem a.
Item Descrição Cargas
I Eu me sinto contente 0,75

2 Eu me sinto como se estivesse cantando na 0.68
chuva
3 Trabalho é ótimo 0,62
4 Eu me sinto como se amasse alguém 0.61
5 Eu me sinto absolutamente horrível —0,61
T o d o s o s iten s a c im a ap resen tam altas cargas n o fator. O s p r im eiro s quatro têm carga-
p o sitiv a s, e o ú ltim o , n egativa. Isso fa z se n tid o porqu e “ Eu m e sin to a b so lu ta m en te horríve!
é um a d e c la r a ç ã o n eg a tiv a . O s qu atro p r im eiro s ite n s e stã o ag ru p a d o s a o q u e é realm en te
o p o sto . S e a carga d o item 5 fo s s e p o sitiv a , p o d er ía m o s su sp eita r qu e algu m erro tiv e sse sic
c o m e tid o .
Atividade 12.9
A seguinte tabela representa correlações entre três escores:
1 2 3
1 - 0,866 0,6428
2 - 0,1736
3
(a) Converta-os para graus utilizando a tabela na página 425.

(b) Utilizando régua e transferidor, desenhe um diagrama para representar o relaciona
mento entre os três testes.
I |] SPSSPW: análise de fatores - análise de componentes principais
E n tre com seus d ad o s. E sc o lh a A nalyze (A n alisar), D ata R eduction (R e d u ç ã o d e D ad o s)

e F actor (F ato res).
U siiJa-
Fíe Et» fc» C'Js Ttarma» * 6f*h« Mhat
Rwon
* N I* I S I _ 1 _ _ U DnaciwSiM!
CuKcnTttta
Lcnp«*MMrvi
mrUoM
-h à -
3:00 00
F*3a
C«rewcndenceftna^n 400
Kwc.ian-.i c To'. Ot»«ISv*io
40C
laeScnei
mno rn
Htlyl» Rwy » 34 00
1*UU
"nr ieoo
1:00 :0C' 1900
13 rei ifim
w CD 37 00
15 00 tem
16 <13 U3
17 00 D’ 03
isa* 19<£>
18 UCl »00
1800 ;« co
30 00 15 00
:ioo 16 co
18 OD
3000
18 00
30 co
3200 200 200
600 400
41»
n3\D«.V
SPSS Ftoccikx a rcsyjy
y
<s.a«l| l i f t 23^1a
&F--Ì. Ifi . I y n > .- .;;r ../g I .¿jEgU-TQ C-M IP», ÜMt fy ne s I jjfna Figimre * ? à “«
A p a re c e rá a seg u in te c a ix a de d iá lo g o s.
E s«á JJi»
j g i ’tgtiaMil I jj% 1 ?ir I y Mo-oMf vgd | LX |[ w Utipy .#
A s variáveis q u e v o c ê qu er qu e en trem na a n á lise d e fatores d e v e m ser m o v id a s da esq u er

da para a lista d e Varíables (V a r iá v eis) à d ireita. A s s e g u r e -s e d e q u e v o c ê e s c o lh e u som en te
a q u ela s v a r iá v e is q u e r ea lm en te q u er q u e fa ç a m parte da a n á lise . E m u ito fá c il c o m e te r uir.
erro e m o v e r va riá v eis irrelevan tes, por e x e m p lo , o n ú m ero d o grupo.
Marque a opção Initial

Solutions (Solução
Inicial). Você pode
marcar ainda
Descriptives (Descritivas)
e Correlation matrix
(Matriz de correlações)
A
'1 32
^FegasusMal | (¿n d Marf | V-cKuon Wo | i j í vir.it-i C f m i a « ? ipo | ¿J fnd F4»i na |
C liq u e e m Continue (C o n tin u a r) para retornar à c a ix a d e d iá lo g o s a n terior e c liq u e er

Extraction (E x tra çã o ). E ssa o p ç ã o fo rn ecerá a se g u in te c a ix a de d iá lo g o s.
* is _ i_ j_ iM & iü i£ itia â ia ^ iâ i
j !__ I__ 3i__ I__ á __ L 1 *~
■
400
icn
500
600
500
600
200
400
ACP é método
por omissão
(padrão).
Marque o
diagrama de
declividade se
desejar
lT
mtiar»c2 ioc | Fnd Ffe» ra |
V o cê p o d e alterar o Method (M é to d o ) de A C P para ou tras fo r m a s de extrair fa to res d o s

d a d o s, m a s a A C P é o m é to d o por o m is s ã o ( D efault ). V ocê p o d e d e se ja r, ta m b é m , qu e o
program a a n a lise a m atriz d e co v a riâ n c ia s em v e z da m atriz de c o rr ela ç õ es. P o d e qu erer d e s
m arcar a so lu ç ã o n ã o -r o ta cio n a d a - n e ss e e s tá g io e ia p o d e n ã o ser d o seu in te re sse.
A p rim eira c o is a q u e q u e r e m o s fa z e r é o b ser v a r a s o lu ç ã o in ic ia l - isto é , a pad rão (De
fault). P o d e m o s ad iar a e s c o lh a d o n ú m er o d e fa to re s para e sp e r a r até v ê -lo s . A s s im , n ão
v a m o s, n e s s e e s tá g io , s e le c io n a r o n ú m er o d e fa to r e s q u e d e s e ja m o s . P r e s s io n e Continue
(C o n tin u a r ).
E s c o lh e n d o Rotation (R o ta ç ã o ), a se g u in te c a ix a d e d iá lo g o s aberta.
RP«pwmM>i I g p Vaha»Md | yMootonwo I ^jE<tang C íHjilartfi» «/. I ( n i Fte; r.; — T S‘-
N e la v o c ê p o d e s e le c io n a r q u al o m é to d o de ro ta çã o q u e q u er - Varimax (V a r im a x ) é
p ro v a v e lm e n te o qu e p recisa . C e r tifiq u e -se de que a o p ç ã o Rotated solution (S o lu ç ã o rotacio-
nad a) está se le c io n a d a . P r e ssio n e Continue (C on tin u ar).
S e le c io n a n d o Scores (E sc o r e s), v o c ê ob terá a se g u in te a c a ix a .
*5'-'I ¡; ® -u É»
I \*m | y w g w » * - .» I .j J Í K / r g 1 j[ff-tljik»y <« f jm I.v3frdH»1* I
É o n d e p o d e m o s so lic ita r q u e o s e s c o r e s d o s fa to re s (o e s c o r e c o m p o s to con stru id o

partir d as v a r iá v e is c o rr ela c io n a d a s c o m o fator) seja m sa lv o s. P o d e m o s u tiliza r e s s e s e s o
e m outras a n á lise s, isto é. reg r essã o ou c o rr ela ç ã o .
E sc o lh e n d o Options (O p ç õ e s ), aparecerá a se g u in te c a ix a de d iá lo g o .
=*iai«|B;t I I U-ifclHKii-iaair.! vKal

i__!_P«. .1_— I i I !‘" I
jj 1 1 1 II í* 1
r «iic I
1’ ¡
c»**< J
^ .1
<■ r.ft.^1« 1
I
loeêwrí Fau
P Sm íifio«
P mr- n ~
_ l
i*.*' I f Ibêcàm
33,
a»»V
aasl a m \ã
Ma _____
|£g.»h>dm IflWW: 1 |
P o d e m o s so lic ita r q u e o program a ord en e as c o r r e la ç õ e s p or g r a n d eza e e lim in e q u alq u er

v a lo r a b a ix o d e u m n ív el e s p e c ific a d o . E s c o lh e m o s e lim in a r q u alq u er c o r r e la ç ã o in ferior a
0 ,4 , Isso . m u ita s v e z e s , torna a ta b ela das ca rg a s d o s fa to re s r o ta cio n a d a s m a is fácil de ser
lida. C liq u e no b o tã o OK.
Total Variance Explained (Variância Total Explicada)
Rotation Sums of Squared Loadings

Initial Eigenvalues (Autovalores iniciais) (Soma rotacionada das cargas ao quadrado)
Component Total % of Variance Cumulative % Total % of Variance Cumulative %
(Componente) (% da (% Acumulado) (% da (% Acumulado)
Variância) Variância)
1 7.141 5 9 .5 11 59.511 7.111 5 9 .2 6 0 5 9 .2 6 0
2 1 .0 4 4 8 .6 9 8 6 8 .2 0 9 1 .0 7 4 8 .9 5 0 6 8 .2 0 9
3 .957 7.974 76.183
4 .665 5.543 81 .7 26
5 .540 4.502 86 .2 29
6 .362 3.015 89.244
7 .299 2.491 91.735
8 .278 2.320 94.055
9 .246 2.053 96 .1 08
10 .211 1.755 97.863
11 .165 1.377 99.240
12 9.122E-02 .760 100.000
Extraction Method: Principal Component Analysis (Método de Extração: Análise de Componentes Principais)
O padrão d o program a S P S S e s c o lh e u d o is fa to re s c o m b ase n o s a u to v a lo r es a c im a de

1; 68% da v a ria çã o n os e s c o r e s p o d em ser e x p lic a d a s p or e s s e s d o is fatores. E ntretanto, um
terceiro c o m p o n e n te tem um a u tovalor in ic ia l de 0 ,9 6 - ta lv e z o p e sq u isa d o r qu eira dar um a
o lh ad a n e sse c o m p o n e n te para verificar se é útil ou faz se n tid o .
Rotated Component Matrix3 (Matriz dos componentes rotacionada3)
Component (Componente)
1 2
A matemática me faz sentir desconfortável e nervoso 0.900
A matemática me causa mal-estar e me deixa confuso 0.891
Tenho um branco e não consigo pensar claramente quando trabalho

com matemática 0.864
Normalmente não me preocupo com a minha habilidade de

resolver problemas -0.861
Realmente fico tenso nos testes de matemática 0.850
Eu me sinto afundando quando penso em tentar resolver 0.849

problemas difíceis de matemática
Geralmente me saio bem em cursos com matemática -0 .8 3 7
Quase nunca fico tenso em provas de matemática -0 .8 1 9
Geralmente me sinto bem durante testes de matemática -0 .8 1 5
Eu não ficaria chateado em fazer mais cursos de matemática -0 .7 1 5
GCSE* obtido 0.856
GN VQ** obtido ou maior -0 .5 3 5
Extraction Method: Principal component A nalysis (Método de Extração: Análise de Componentes Principais)
Rotation Method: Varimax with Kaiser Normalization (Método de Rotação: Varim ax com Normalização de Kaise'
a. Rotation converged in three iterations (a. A rotação convergiu em três interações.)
V o cê p o d e ver c la r a m en te q u e e x is te m d o is fatores: m uitas va riá v eis têm um a carga a lu

c o m o F ator 1, q u e p o d e ser d e n o m in a d o m a te m á tic a , e so m e n te du as v a r iá v e is têm c a r .,
c o m um se g u n d o fator; a m b o s e stã o r e la cio n a d o s c o m q u a lific a ç ã o . A s sim , p o d e m o s ser o r -
g in a is e ch am ar e s s e fator d e q u a lific a ç ã o .
* N. de R. T. G eneral C ertificate o f Secondary Education (Certificado Geral da Educação Secundária). A primeira qualificação oblida por _
estudante inglês, geralmente aos 16 anos. Principal instrumento para medir a qualificação dos alunos ingleses ao final da educação secun^:.-
obrigatória.
** N. de R. T. G eneral N ational Vocational Q ualification (Qualificação Vocacional Nacional). É um certificado de educaçao vocacional no R-
Unido. Inclui qualificações relacionadas com áreas em geral e não com um trabalho específico. É um curso disponível para pessoas de quaL
idade e não tem pré-requisitos. Envolve as áreas de comunicação, habilidade numérica e tecnologia da informação e lem por objetivo desem i
habilidades para melhorar a empregabilidade.
N o e n ta n to , o qu e a c o n te c e se s o lic ita r m o s a o program a q u e m a n ien h a três fa to res em

v e z de d o is? R e to rn a m o s à c a ix a de d iá lo g o s apropriada e ro d a m o s n o v a m e n te a a n á lise .
o» MM Ut I gTM.. : I E tta n ç C \M II Tn I»y ¡ - j > | jj fr< ri: : r.yrg | e TS- a*
V o lta m o s atrás via Analyzc (A n a lisa r ), Data Reduction (R e d u ç ã o de D a d o s) e Factor

(F ator). E s c o lh e m o s a o p ç ã o Extraction (E x tra çã o ). M u d a m o s o n ú m ero de fa to res para três.
P r e ssio n a m o s Continue (C on tin u ar).
T am b ém o p ta m o s por so lic ita r q u e o program a ap resen te o s e s c o r e s d o s fatores p ela e s
c o lh a de Scores (E sc o r e s) e p e la s e le ç ã o da o p ç ã o apropriada.
s l B l a l g ;l i i I M f ri m i -n r-l ¡ r ì c i n i
ÜI5I
I y»*f I »*■ I »«Im I _L
6 OU
400
500
20a
13 1 00 1 00 1 oo 1 CO 1 00 500
u Oeic<«>toei 1 Rolaban | Dptoni 1 00 500 500 5 CO 5 OC 500
«*
15 00 400 200 2 CO 200 200
16 16 on • > i X ?1 00 no 1 00 2 00 2 OD 2 00 200 3 y>
17 17 00 ICO 2 ou 1 CO 2100 1 00 oc 500 500 5 OC 500 5 00
10 13 OU 2 IX) i if; 100 IS 00 I UU t no -. ÜU 4« 5 00 410 5*»
19 18 00 ICO 200 <00 20 00 i CO oc 300 4 CO 303 30C 4 00
20 1900 ICO ?uo 100 *00 ! CO oc 500 500 ¿00 4UCI 4»
21 »00 1 00 200 ICO 1900 1 00 00 500 200 500 400 500
22 21 00 ICO 200 1 00 16 00 1 00 co 300 300 3CO 300 300
23 22 00 1 CO 1 no ! 00 18 OH 1 co OC1 200 ¿00 4 CO 2 CO 4 00
24 23 00 ICO 100 00 20 00 00 100 200 2 CO 200 200 300
25 24 CO 100 : i 00 18 00 1 00 00 500 500 400 4 00 500
A, 'Sb uu 1 uu .’ IX 1 uu *1 UJ 1 UJ Ul ‘-UJ t>iU 5Ü I *>ou 5ÜU
27 *00 ICO lOC 100 32 00 1 CD 00 400 200 2CO 2® 2 00
26 27 U0 1 LO 2u0 1 JU jyuo 1 UJ (JO 400 60U 4 UJ 500 5UÜ
29 28 CO ICO 200 1 Q0 22 00 1 CO oo 2 00 4 00 400 200 4 30
-.m -.rr, -.or.
H D v » mi «rim« { vwncto V+*.' ! ì i 7
MM H« 1 yMoo»o*Woid 1 j^ E«*3«s C i l |] ", ilA/krj ncl)nc2 ico S 1 Fmd Fíe» iMe» 1^

Rotated Component Matrix3 (Matriz dos componentes rotacionada3)
1 2
Tenho um branco e não consigo pensar claramente quando trabalho

com matemática 0.864
Normalmente não me preocupo com a minha habilidade de

resolver problemas -0.861

Eu não ficaria chateado em fazer mais cursos de matemática -0 .7 1 5
GCSE* obtido 0.856
GN VQ** obtido ou maior -0 .5 3 5
Extraction Method: Principal component Analysis (Método de Extração: Análise de Componentes Principais)
Rotation Method: Varimax with Kaiser Normalization (Método de Rotação: Varimax com Normalização de Kaisf
V o cê p o d e ver cla ra m en te que e x is te m d o is fatores: m u itas va riá v eis têm u m a carga

c o m o F ator I, q u e p o d e ser d e n o m in a d o m a tem á tic a , e so m e n te d u as v a r iá v e is têm car_-
c o m um se g u n d o fator; a m b o s e stã o r ela cio n a d o s c o m q u a lific a ç ã o . A s sim , p o d e m o s ser i -
g in a is e ch am ar e s s e fator de q u a lifica ç ã o .
* N. de R. T. General Certificate of Secondary Educaiion (Certificado Geral da Educação Secundária). A primeira qualificação obtida po-
estudante inglês, geralmente aos 16 anos. Principal instrumento para medira qualificação dos alunos ingleses ao final da educação seci_-_
obrigatória.
** N. de R. T. General Noliona! V<utuional Qualificotion 'Qualificação Vocacional Nacional). É um certificado dc educação vocacional nr -
Unido. Inclui qualificações relacionadas com áreas em geral c não com um trabalho específico. É um curso disponível para pessoas de q___
idade e não tempre'-requisilos. Envolve as áreas de comunicação, habilidade numérica e tecnologia da informação c icm por objetivo deser
habilidades para melhorar a cmpregabilidade.
N o en ta n to , o q u e a c o n te c e se s o lic ita r m o s ao p rogram a qu e m a n ten h a três fa to re s em

v e z de d o is? R e to rn a m o s à c a ix a de d iá lo g o s apropriada e ro d a m o s n o v a m e n te a an álise.
V o lta m o s atras via Analyze (A n a lisa r ), Data Reduction (R e d u ç ã o de D a d o s) e Factor

Extracríon (E x tra çã o ). M u d a m o s o n ú m ero de fatores para três.
(F ator), E s c o lh e m o s a o p ç ã o
P r e ssio n a m o s Continue (C on tin uar).
T am bém o p ta m o s por so lic ita r qu e o program a a p resen te o s e sc o r e s d o s fatores p e la e s
c o lh a de Scores (E sc o r e s) e p ela s e le ç ã o d a o p ç ã o apropriada.
P r e s s i o n e C o n t i n u e ( C o n t i n u a r ) . D e s t a v e z a s a í d a i n c l u i u o t e r c e i r o f a to r.

Initial Eigenvalues (Autovalores Iniciais) (Soma Rotacionada das Cargas ao Quadrado)
(Componente) (% da (% Acumulado) (% da (% Acumulado)
Variância) Variância)
1 7.141 5 9 .5 1 1 59.511 7.088 59.064 59.064
2 1.044 8.698 68.209 1.030 8.582 67.646
3 .957 7.974 76.183 1.024 8.537 76.183
4 .665 5.543 81.726
5 .540 4.502 86.229
6 .362 3.015 89.244
7 .299 2.491 91.735
8 .278 2.320 94.055
9 .246 2.053 96.108
10 .2 1 1 1.755 97.863
11 .165 1.377 99.240
12 9.1 22E-02 .760 100.000
C o m o v o cê p o d e ver, o terceiro fa to r é re sp o n sá v e l p o r q u a s e a m e s m a v a riâ n c ia que

s e g u n d o . O b s e r v e m o s o q u e a ta b e la d a s c a r g a s d o s f a to r e s a p r e s e n ta e se o s c o m p o n e n t e -
fa z e m se n tid o q u a n d o te n ta m o s n o m e á -lo s.
tsta tística sem M atem ática para Psicologia 451
Rotated Component Matrix15 (Matriz dos componentes rotacionada*)
1 2 3
Tenho um branco e não consigo pensar claramente quando 0.867

trabalho com matemática
Normalmente não me preocupo com a minha habilidade de -0 .8 5 9

resolver problemas

Eu náo ficaria chateado em fazer mais cursos de matemática -0 .7 1 2
GCSE obtido 0.993
GNVQ obtido ou maior 0.989
Rotation Method: Varimax with Kaiser Normalization (Método de Rotação: Varimax com Normalização de Kaiser)
B e m , n ão r ea lm en te. N ã o e x is te m u ito se n tid o em ter m a is v a r iâ n cia e x p lic a d a q u an d o

so m e n te u m a variável tem carga em um fator. A s s im , v a m o s ad ian te, a c eita n d o qu e d o is fa to
res e x p lic a m a d eq u a d a m en te o s dad os.
Soma das cargas ao quadrado com rotação
Component % of Variance Cumulative %

(Componente) Total (% da Variância) (% Acumulado)
1 7 .1 11 59.260 59.260
2 1.074 8.950 68.209
Jun tos e s s e s d o is fa to res sã o r es p o n s á v e is por 6 8 ,2 % da variân cia. V ocê pod e ver q u e o s

p e sq u isa d o r e s p r e c isa m ser c a p a z e s de u tilizar su as h a b ilid a d es de in terp retação para an alisar
o s r esu lta d o s da a n á lise de fatores.
452 Christine P. Dancey & John Roidy
Resumo
N e s s e c a p ítu lo a p r e se n ta m o s u m a breve in tro d u çã o à a n á lise d e fa to re s/a n á lise d e c o m

p o n e n te s p rin cip a is e:
■ F o r n e c e m o s um e n te n d im e n to c o n c eitu a i da a n á lise de fatores

■ E x p lic a m o s as se m e lh a n ç a s e d ife re n ç a s das form as m ais c o m u n s de a n á lise de fa to
res (fa to ra çã o p e lo e ix o p rin cip a l) e a n á lise d e c o m p o n e n te s p rin cip ais
■ E x p lic a m o s c o m o e x ec u ta r u m a a n á lise de fatores no S P S S P W
■ M o stra m o s c o m o interpretar a sa íd a d e u m a a n á lise
■ A p r e se n ta m o s um d eta lh a d o e x e m p lo da literatura p s ic o ló g ic a (A le x a n d e r e c o la b o
radores)
■ U tiliz a m o s vários ou tros e x e m p lo s de form a a ilustrar e s s a té c n ic a e sta tística
QUESTÕES DE MÚLTIPLA ESCOLHA Essas variáveis são:

(a) Perfeitamente relacionadas
(b) Totalmente não-relacionadas
1. Para dar nomes aos fatores que foram extraídos, os
(c) Compartilham uma correlação moderada
pesquisadores olham para:
(a) As cargas dos fatores com rotação
5. Um vetor é:
(b) As cargas dos fatores sem rotação
(c) A tabela dos autovalores (a) Um segmento curvo com um comprimento ir-
(d) Nenhuma das alternativas definido
(b) Um segm ento reto com um comprimento i r -
2. As diferenças entre análise de fatores e análise dc definido
com ponentes principais são relativamente pouco (c) Um segm ento reto com um tamanho definic
importantes quando o conjunto de dados é: (d) Uma segm ento curvo com um tamanho de:'-
uido
(a) Grande, e o número de participantes também
(b) Grande, e o número de participantes é pequeno 6. A análise de fatores lida com:
(e) Pequeno, e o número de participantes é grande (a) Padrões de correlações
(d) Pequeno, e o número de participantes é tam (b) Padrões de valores m édios
bém pequeno (c) Contagem de freqüências
3. Um fator é pensado com o uma variável latente sub
jacente: 7. A análise de fatores requer que as variáveis:
Ca) Que é influenciada pelas variáveis observadas (a) Não estejam relacionadas
(b) Que não é explicada pelas variáveis não-ob- (b) Estejam relacionadas
(c) Tenham apenas um relacionamento fraco
servadas
(d) Sejam mensuradas na m esm a unidade
(c.) Ao longo do qual os indivíduos diferem
(d) Ao longo do qual os indivíduos são hom ogê 8 Utilizar a matri/ de correlações para executar u: .
neos análise de fatores em vez da matriz de variânc:_
covariâncias assegura que os dados:
4. Observe o seguinte diagrama
(a) Sejam estatisticam ente significativos
(b) Sejam padronizados
Variável 1 (c) Não sejam padronizados
9. A decisão sobre a escolha do número de fatore- .

tomada com base em:
(a) Critérios estatísticos
(b) Critérios teóricos
(c) Alternativas (a) e (b)
- Variável 2 (d) Nem (a) nem (hl
10. A inatnz original sem rotação normaJmente sofre (c) Fatores plotados contra coeficientes de corre
uma rotação de modo que: lação
(a) Os fatores sejam mais significativos (d) Nenhuma das alternativas
(b) Os cálculos matemáticos sejam mais fáceis 12. E possível extrair
(c) A interpretação seja mais fácil
(a) Tantos fatores quantos variáveis
(d) Todas as alternativas
(b) M ais fatores do que variáveis
11. Um diagrama de declividade é um número de: (c) M ais variáveis do que fatores
(d) N e n h u m a d a s alternativas
(a) Variáveis plotadas contra a variância
(b) Variáveis plotadas contra a carga de fatores A s questões 13 a 15 estão relacionadas à seguinte saída.

Initial Eigenvalues (Autovalores iniciais) (Soma das cargas ao quadrado com rotação)

(Componente) (% da Variância) (% Acumulado) (% da Variância) (% Acumulado)
1 5.804 26.383 26.383 5.235 23.795 23.795
2 2.030 9.227 35.611 2.438 11.081 34,877
3 1.511 6.869 42.480 1.673 7.603 42,480
4 1.305 5.930 48.410
5 1.176 5.344 53.754
6 1.139 5.177 58.931
7 0.972 4.420 63.351
8 0.863 3.925 67.276
9 0.779 3.541 70.817
10 0.752 3.419 74.236
11 0.717 3.259 77.495
12 0.671 3.051 80.546
13 0.615 2.795 83.341
14 0.561 2.552 85.893
15 0.524 2.382 88.275
16 0.488 2.218 90.493
17 0.462 2.099 92.593
18 0.412 1.872 94.465
19 0.364 1.656 96.120
20 0.315 1.431 97.551
21 0.299 1.357 98.908
22 0.240 1.092 100.000
13. Q uantos com ponentes têm um autovalor acim a 17. Que fator apresenta “procura de risco”?
de 1. (a) Fator 1
(a) 3 (b) Fator 2
(b) 4 (c) Fator 3
(c) 5 (d) F ator4
(d) 6
18. Que fator representa “orientação não-verbal"?
14. Se uma solução de três fatores é proposta, aproxi
(a) Fator 1
madamente quanto da variância se irá reter
(b) Fator 2
(a) 43% (c) Fator 3
ib) 35% (d) Fator 4
(c) 24%
(d) 10% 19. N o Fator 2. som ente um dos itens é positivo. I ss.
ocorre por quê?
15. Quantas variáveis estão incluídas nessa análise:
(a) O autor com eteu um erro
(a) 3
(b) O item positivo está codificado de forma opo;-
(b) 10
ta aos demais itens
(c) 22
(c) Os três itens estão codificados na m esma d i
(d) Im possível dizer
reção
16. Qual é o número m ínim o de participantes reco (d) N ão existe significan cia na direção das car
mendado para uma análise de fatores? gas
(a) 50 20. Só as cargas mais “significativas” são mostrada-
(b) 70 nessa tabela. Isso ocorre porque é costum e dei.vr
(c) 100 em branco as cargas abaixo de:
(d) 500
(a) 0,4
4.vquestões 17 a 20 estão relacionadas com o texto e (b) 0.5
com a tabela abaixo, retirada de Romero e colabora (c) 0.6
dores (2003). (d) 0,7
Pesquisadores investigam os componentes do constructo autocontrole na teoria geral do crime, avaliada por vári
questionários. Descobrem que a análise “extraiu quatro fatores com autovalores maiores que 1. que juntos expl:
cam 57.31% da variância. Os fatores resultantes da rotação estão listados na tabela a seguir (F1-F4)”.
F1 F2 F3 F4
Gosto de correr riscos 9.78

As coisas de que mais gosto são perigosas 0.75
Gosto de andar de montanha russa 0,63
Mesmo quando não estou com pressa, dirijo em alta velocidade 0.620,40
Gosto de atividades com muito contato físico 0.54
A melhor maneira de resolver uma questãoé sentar e conversar, mes- -0,80
mo que isso leve horas
Se alguém me insultasse, eugostaria de lhe esbofetear 0 .6 1
Gosto de ler livros -0.57
É melhor gastar meu dinheiro em algo que quero agora do que colo- 0,79
cá-lo no banco
Se vejo algo que quero era uma loja. compro 0.77
Não lido bem com coisas que me deixam frustrado 0.81
Realmente fico furioso quando dirijo atrás de um motorista lento 0,7?
Referências
ALEX A N D ER . B., et al. An investigation o f shame and guilt in a depressed sample. British Jounal of
Medical psychology, v. 72, p. 323-38, 1999.
GILBERT, P., PEHL, J. B.. A LLA N. S. The Phenom enology o f shame and guilt: an empirical
investigation. British Jounal o f Medical Psychology, v. 67, n. 1, p. 23-36, 1994.
LUZZO. D. A., M cDO NA LD, A. Exploring studentes reasons for living on capus. Journal of College
Student Development, v. 37, n. 4. p. 389-95 ) 996.
PATTON, W., NOLLER, P. The Offer self-im age questionnaire for adolescents: psychom etric
properties and factor structure. Jounal o f Youth and Adolescence, v. 23, n. 1, p. 19 - 4 1, 1994.
ROMERO, E. et al. The self-control construct in the general theory o f crime: an investigation in terms
o f personality psychology. Psychology and Crime Law. v. 9, n. 1, p. 61-86, 2003.
TANG, T. N. et al. Features o f eating disorders in patients with irritable bowel syndrome, British
Jounal of Psycholosomatic Research, v. 45, n. 2, p. 171-8, 1998.
4 5 Análise de Três ou Mais Grupos
* ■ Controlando o Efeito de Uma
Covariável
Neste capítulo, apresentaremos uma técnica fundamentada tanto na análise de variância

quanto na regressão iinear. Essa técnica é denominada análise de covarlânda (ANCOVA) e se ba
seia nos conteúdos que foram estudados nos capítulos anteriores. Uma ANCOVA simples indica
se os grupos diferem em uma variável dependente enquanto se mantêm fixos os efeitos de outra
variável denominada covariável. Uma covariável é uma variável que apresenta um relacionamen
to linear com a variável dependente. Você já aprendeu sobre a remoção (eliminação) dos efeitos
de uma variável no Capítulo 5 (p. 205), quando abordamos a análise de correlação. Na ANCOVA
a variável cujos efeitos são removidos é denominada covariável. Neste capítulo discutiremos o
delineamento entre participantes de um fator e o uso de uma covariável.
Como o material deste capítulo tem base na ANOVA de um fator, tudo o que foi ensinado
sobre o delineamento entre participantes de um fator (no Capítulo 9) aplica-se aqui. Em outras
palavras, o delineamento de um fator inclui:
1. Estatísticas descritivas, tais como média e desvio padrão, e ilustrações gráficas, tas
como diagramas de caixa e bigodes e barras de erro.
2. Tamanho do efeito - tanto a magnitude da diferença entre as condições (d) quantc
uma medida global do efeito como, o Tf
3. Um teste inferencial, neste caso, a ANCOVA, que mostra (supondo que a hipótese nula
seja verdadeira) quão provável é, depois de controlados os efeitos da covariável, que as
diferenças entre as condições se devam apenas ao erro amostrai
Neste capítulo você irá:
■ Obter um entendimento conceituai da ANCOVA
■ Verificar as condições nas quais ela pode ser utilizada
Entender as hipóteses que devem ser satisfeitas para que a ANCOVA possa ser executada
i Aprender a apresentar resultados utilizando técnicas gráficas
Existem duas razões principais para utilizar a ANCOVA:
1. Reduzir a variância do erro
2. Ajustar as médias da covariável, de modo que o valor médio da covariável seja o mesrr:
em todos os grupos
EXEMPLO:
T m agine q u e n o v o s e stu d a n te s sã o d e s ig n a d o s a o a c a s o a três d ife r e n te s c u r so s in

trod u tórios de e sta tístic a , qu e u tiliz a m três m é to d o s d ife r e n te s de e n sin o . A s a u la s sã o de
um a hora.
1. O G ru po I tem u m a hora de c o n v e rsa e g iz .

2. O G ru po 2 tem um a hora de c o n v e rsa e g iz , só qu e a auia é interativa, e o s e s tu
d a n tes p o d em interrom per e fa zer p ergu n tas, e n c o ra ja d o s p e lo professor.
3. O G ru po 3 é m u ito in terativo, o s estu d a n te s trabalham em g ru p o s c o m o r ien ta çã o
d o p rofessor.
Para d e sc o b r ir qual m é to d o fu n c io n a m elh o r foi fo r n e c id o a o s e stu d a n te s um teste

de 2 0 q u e s tõ e s para v e rific a r qual gru p o reteve m a is c o n te ú d o s nas au las. D ig a m o s q u e se
esp era q u e o G ru p o 3 ten h a retid o m a is c o n te ú d o s (isto e , o m é to d o a lta m en te in terativo
seria o m elh o r m é to d o d e e n sin o ).
P o d ería m o s execu tar um a A N O VA sim p le s, u tiliz a n d o o m é to d o de e n sin o c o m o a va
riável in d ep en d en te (três n ív e is). Isso ind icaria se e x iste m d iferen ça s entre o s três gru p os, na
retenção de c o n te ú d o s de estatística. Entretanto, im agin e que a h ab ilidad e de reter o con teú d o
esteja relacion ad a c o m o Q I, in d ep en d en tem en te do m étod o de e n sin o . S e o QI e a hab ilidad e
de reter c o n te ú d o s e stã o a sso c ia d o s, esp eraríam os que tal a ss o c ia ç ã o fo s s e p ositiva, isto é , os
e sc o r e s no Q f e no teste e sta tístico d ev em estar p o sitiv a m en te correla cio n a d o s.
Im a g in e q u e te n h a m o s c o le ta d o d a d o s d o QI e as n otas no teste d e e sta tístic a . O d ia
gram a de d isp er sã o p o d eria ser c o m o o da F igu ra 1 3 .1 . E m b ora a co rr ela ç ã o seja p o sitiv a ,
é m od erad a, p o is vale 0 ,4 9 .
O que a c o n te c e na A N C O V A é q u e o Q I (d e n o m in a d o de c o v a riá v el, p o is se altera co m
a variável d e p e n d e n te ) é le v a d o c m c o n ta n o s c á lc u lo s . O qu e a fó r m u la faz é r e m o v e r a
v ariân cia d e v id o à a s s o c ia ç ã o en tre o d e se m p e n h o e s ta tístic o e o Q I. C o m o e x p o s to , isso
red u z a variâ n cia d o erro.
O g r á fic o é um a boa m an eira de v isu a liz a r o qu e e stá a c o n te c e n d o (F igu ra 13 .2 ). S ão
ilu strad os o s três d ife re n te s m é to d o s de e n sin o (d e n o m in a d o s de tra d icio n a l, m isto e intera
tiv o ). A in stru ção de c o m o obter um d iagram a da lin h a de r eg r essã o , c o m o na F ig u ra 13.2,
é dada ad ian te.
30
20 -
10
■— i--------- 1-------- 1--------- 1--------- 1---------1------------ 1

106 108 110 112 114 116 118 120
QI
D ia g ra m a de d isp e rsã o do QI e d a s n o tas em um te ste d e e s ta tístic a .

Figura 13.1
28 ■
_____-
24 ■
_—-
__.__ -
i/í ^ — 1
z 14 "
Grupo
i
4 -
2,00
oH 1,00
1()6 1(58 1 0 1 2 1 4 1 6 1 8 i ; 10
Ql
Diagrama demonstrativo da dispersão e das linhas de melhor aderência para três

grupos de escolares.
SPSSPW: obtenção de um diagrama das linhas de regressão

□
S e le c io n e Graphs (G r á fic o s), e n tã o Scatter (D isp e r sã o ), c o m o se g u e .
F*: E ü 'fim Daw Ti.Yvtrrri Arvore Gl« r i I
^1U N S I _ U _ IM 6 £L ,
Escolha Graphs
I— (Gráficos) e
então Scatter
(Dispersão)
ZD\d-*>"•
*»\ n !jJ_____
SPSS Picc«»x » i >m&
□
IE 'A Mz* ■
I yM p: a:| j-o-- V« I ¿JFnaFlom | j%Y»oolGccC Hîsr aowii i ' ■*a
S erá aberta a c a ix a d e d iá lo g o .
Assegure-se de
que Simples
(Sim ples) esteja
selecionado,
então escolha
Define (Definir)
A s s e g u r e -s e d e q u e a o p ç ã o Simple (S im p le s ) e ste ja se le c io n a d a . A p a recerá a c a ix a de

d iá lo g o d o d iagram a de d isp er sã o , c o m o ilu strad o ab a ix o .
~ r~ e .riT ‘
S IB IL ISI ! I I M&l H l- r l r - i a a r . ! -*!■»!
Verifique se a variável
dependente foi m ovida para
o eixo y (V Axis). A variável
independente é m ovida
para o eixo x (X Axis).
A variável de
agrupam ento
deve ser
colocada aqui
&P<paitaHjl I yMCTXOhWwll pgVaroalMjl | ¿J Fmd Fin no [ fâY-àxri GwC [|^~ LdO^wi I - Ta

Score (E sc o r e ) é m o
A s v a r iá v e is sã o m o v im en ta d a s d o lad o e sq u er d o para o d ireito . O
v id o para o e ix o y ( F A . ) ; Motiv (M o tiv a ç ã o ), para o e ix o x (X Axis), e d e v e m o s m o v er t
ví s
G ru po (Group) para Sei Markers by (A ju star m arcad ores por). Is so é im p ortan te, p o is perm ite
q u e se o b te n h a m lin h as de reg r essã o sep arad as para cada grupo.
C liq u e o n OK :
20
18
16
a; 14
o
U
■2 12
10
x Grupo 3,00
■ Grupo 2,00
a Grupo 1,00
6 8 10 12 14 16 18 20
Motivação
F eito is s o , dê u m d u p lo c liq u e no g r á fic o para ob ter a se g u in te ja n ela .
¿t ________ 3 3 ^ *9 •
{jPafrm r. MM | prMooKflVort Nc | ^Vtf'C<y GeaCct I jãgarnov«! «v S I fjJ O jp J' if*iS ||fT ;Lh ««l • SHS -•'t & ^
V o cê p o d e m a x im iz a r a ja n e la se desejar. E n tão, e s c o lh a Chart (G rá fico ) e Options (O p

ç õ e s ), c o m o se g u e .
Escolha
Chart
(G ráfico) e
Options
(Opções)
A p arecerá a se g u in te c a ix a de d iá lo g o .
H lAl_l
É im portante
que a opção
Subgroups
(Subgrupos)
esteja m arcada
10 12 14 16 18 20
MOTIVATI
SPSSPwrrw «•«•*
i yocJ GccCic I j gancovjl t | j^0up><l SFÌS ||pr)IJm«H •MTi * ^
A s se g u r e -s e de q u e a o p ç á o Subgroups (S u b g r u p o s) fo i m arcada.
C liq u e c m Fit Options (O p ç õ e s d e a d erên cia ) para seguir.
ErmBTgTTTEZMi i i i m i w : a
s a lili
DJ -!= » 1 - I I I Aj _I
Verifique se
GROUP
3.00
2 oo
1 00
■I B^YahOtf G«oCJic I m :>• i | ||~~rh<nl1 ■!il"j S fa -1«
C liq u e e m Continue (C on tin u ar) e e m OK. S erã o fo r n e cid a s lin h a s de reg r essã o para <
três g ru p o s sep arad am en te.
V ocê estará v e n d o u m a lin ha d e m e lh o r aju ste para u m g m p o d e p articip an tes. N a F i

gura 13.2, en tretan to, d e se n h a m o s u m a lin h a de m elh o r ajuste sep arad a para cad a gru p o (1.
2 e 3). N e s s e e x e m p lo fic tíc io , v o c ê p o d e ver q u e o s estu d a n te s in terativos têm um esc o re
m aior n o s s e u s te ste s e s ta tís tic o s d o q u e o g r u p o m isto , q u e a p r e se n ta e s c o r e s m a io res
d o q u e o s e stu d a n te s tr a d icio n a is. Para o s três g r u p o s, e n tretan to, o s r esu lta d o s d o s testes
e s ta tís tic o s e stã o p o s itiv a m e n te r e la c io n a d o s ao Q I (a c o v a r iá v e l) - v o c ê p o d e co n sta ta r
is s o por q u e as lin h as de r eg r essã o sã o p o sitiv a s para to d o s o s três gru p os. E m outras pa
lavras, e stu d a n te s q u e ap resen tam um Q I b a ix o ten d em a ter n o ta s b a ix a s e m se u s testes
e s ta tístic o s, e e stu d a n te s c o m alto Q I te n d e m a ter r esu lta d o s ta m b é m a lto s n o s se u s testes
e sta tístic o s. N o e n ta n to , o G ru po 3 a p resen to u m e lh o r e s r esu lta d o s e m e sta tístic a d o q u e o
G ru po 2, q u e teve um d e se m p e n h o m é d io m elh o r do q u e o G ru po .1.
N o te , en tretan to, q u e as m é d ia s d o s g ru p os no Q I (x, a c o v a r iá v e l) é a m e sm a . É o que
esp e r a m o s, já qu e o s estu d a n te s foram a lea to r ia m e n te a lo c a d o s a o s três m é to d o s de en sin o .
O b v ia m e n te , não tín h a m o s razão para p en sar q u e o s três g r u p o s iriam d iferir n os v a lo res
d o Q I. S eria p o u c o u su al, en tretan to, encon trar m é d ia s exatamente ig u a is, m e sm o porque,
q u a n d o n ã o e x is te m d ife r e n ç a s en tre g r u p o s, e sp e r a m o s p e q u e n a s v a r ia ç õ e s n o s valores.
Para o e x e m p lo , en tretan to, u tiliz a m o s um ev en to im p ro v á v el - to d o s o s três g ru p o s apre
sen ta m um QI de 111.' S e v o c ê d e se n h a r um a lin ha h o rizo n ta l para c a d a m é d ia d o s Q Is
d o s g ru p o s n o e ix o v, ob servará q u e o g ru p o in terativo a p resen ta um a m é d ia d e 16 no teste
Todob os números desse exemplo foram arredondados para o inteiro mais próximo.
e sta tístic o ; o g r u p o m isto , d e 12, e o gru p o tr a d icio n a l, d e 7. E s s a s sã o as m é d ia s q u e a

A N O V A u tilizaria. A N C O V A não trabalha c o m e s s a s m é d ia s, n o en ta n to , o faz para ajustar
as m é d ia s a fim d e levar e m co n ta o r e la c io n a m e n to entre o s Q Is e a h a b ilid a d e e sta tística .
Is so é e x p lic a d o a seguir.
A F ig u ra 13 .2 m ostra c la r a m en te q u e, para to d o s o s três g r u p o s, o Q I está r ela cio n a d o
c o m a r e te n ç ã o e sta tístic a (m ed id a p e lo te ste ). E sta m o s in te r e ssa d o s e m sab er se o s três
gr u p o s d ife re m no teste e s ta tístic o e m virtu d e d o m é to d o de e n s in o a qu e foram su b m e ti
d os. A s s im , q u er e m o s co n tro la r o s e f e it o s d e v id o s ao Q I.
E ssa é a situ a ç ã o id eal para a u tiliz a ç ã o da A N C O V A , p o is e lim in a o e fe ito d e v id o à
c o v a riá v el (n e s s e c a s o o Q I), isto é , red u z a variân cia d o erro, a q u al, c o m o d is s e m o s pre
v ia m e n te , lev a a um valor grande de F. A s sim , o p rim eiro o b je tiv o da A N C O V A é red uzir
a v ariân cia d o erro.
S u p o n h a qu e te n h a m o s u m a situ a ç ã o na qual as m é d ia s na c o v a riá v el d ife re m s ig n ifi
c a tiv a m e n te . A A N C O V A ain d a é ú til. p o is ajusta as m é d ia s e m v (a s n otas de e sta tístic a )
para o q u e e la s seriam se o s g r u p o s tiv e s se m e x a ta m e n te a m e sm a m é d ia n o Q I. E ss e é o
se g u n d o ob jetiv o : a A N C O V A ajusta as m é d ia s na covariáv el para to d o s o s g r u p o s, o que
lev a a u m aju ste nas m é d ia s d a variável y. n e ss e c a so . as notas no te ste de e sta tística .
E x p lic a r e m o s m a is. u tiliz a n d o o e x e m p lo d o s g r u p o s p r e e x iste n te s, isto é , e m q u e o s
não-equi-
p a rticip a n tes n ão foram a lo c a d o s ao a c a so . E ss a situ a ç ã o é d e n o m in a d a g r u p o s
valentes ou intactos. E m ta is c a s o s , p o d e m o s d e sc o b r ir qu e o s g r u p o s d ife re m d e form a
sig n ific a tiv a na c o v a riá v el.
Atividade 13.1
Uma covariável é uma variável que tem um:

(a) Relacionamento curvilíneo com a variável dependente
(b) Relacionamento linear com a variável dependente
(c) Relacionamento curvilíneo com a variável independente
(d) Relacionamento linear com a variável independente
13.1 Grupos preexistentes
Im a g in e u m c a s o e m q u e e x is te m três g r u p o s d e m u lh eres: r e c e p c io n is ta s de b o a te, s e

cretárias qu e trabalham e m turno parcial e c ie n tista s de alto gabarito q u e trabalham e m turno
integral. E ss e s sã o g r u p o s qu e o co rrem n atu ralm en te (isto é, não p o d e m o s a lo ca r p a rticip a n
tes a e s s e s g r u p o s, já e stã o n e le s ). Q u e re m o s testar a h ip ó te se de q u e, qu an to m ais c o m p le x a a
o c u p a ç ã o , m a is alto é o n ível de te sto ste ro n a . A te sto ste ro n a é c o n h e c id a c o m o um h o r m ô n io
m a sc u lin o , m as, em b ora o s h o m e n s ten h am um n ível m ais alto, as m u lh e r es tam b ém a p rod u
z em . E x iste m , de fato, p e sq u isa s que m ostram um a lev e a ss o c ia ç ã o entre n ív e is o c u p a c io n a is
e te sto ste ro n a . V o cê p o d e p en sar em outras v a r iá v e is q u e p o d e m estar r e la cio n a d a s c o m a v a
riável d e p e n d e n te (n ív e l d e te sto ste ro n a )? L e m b r e -se de q u e e s s a s v a r iá v e is sã o d e n o m in a d a s
covariáveis. V o cê p o d e p r o v a v e lm e n te p en sar e m vá ria s, c o m o o dia d o c ic lo m en stru al - o s
464 C hristíne P. Dancey & John Reidy
h o r m ô n io s flutuarri d e a c o rd o c o m o d ia d o c ic lo . S e m e d ir m o s a te sto ste r o n a n o s grupo-.-,

g o sta r ía m o s d e fa z ê -io no m e sm o dia d o c ic lo . A id ad e é outra c o v a riá v el. Para m anter o pro
je to de m o d o sim p le s, v a m o s n os ater a um a ú n ica c o v a riá v el, a id ad e. S u p o n h a q u e a idade
está p o s itiv a m e n te c o rr ela c io n a d a ao n ív el d e testosteron a.
O d ia g r a m a de d isp e r sã o na F ig u r a 13,3 (d a d o s fic tíc io s ) m ostra e s s e r ela c io n a m e n to
para os três grupos.
H3
6 i
C
O 5 -
o>
O H
<s> A
oo _
V 3 -
cu
■o 2
> 1H
10 20 30 40 50
Idade
Figura 13.3 Diagrama de dispersão que mostra o relacionamento entre idade e níveis de testosterona
A g o r a p e n se n o s três g r u p o s. É p r o v á v e l q u e a m é d ia das id a d es d o s três g r u p o s seja a

m esm a'.’ Por q u e não?
N ã o é p ro v á v el. E m a is p ro v á v el q u e as c ie n tista s seja m m a is v e lh a s d o q u e as r e c e p c io
n ista s. A g o r a , s e u tiliz a r m o s a A N C O V A , será um p o u c o d ife re n te . N ã o a p e n a s a A N C O V A
red u z a v a r iâ n cia d o erro p ela r e m o ç ã o da variâ n cia d e v id o a o r e la c io n a m e n to en tre a id a
d e (c o v a r iá v e l) e a v a r iá v e l d e p e n d e n te (te sto ste r o n a ) (o p r im eiro o b je tiv o ) c o m o tarnbén'
ajusta as m e'dias da c o v a riá v el para to d o s o s g r u p o s, c o n d u z in d o ao a ju sta m en to das m é d ia '
d e y (testo ste r o n a ).
Fm outras palavras, o q u e a A N C O V A faz é resp on d er q u a is se r ia m as m éd ia s d o s grupo'
(e m y) se as m é d ia s d o s três g r u p o s (e m x ) fo s s e m as m e sm a s. A fó r m u la aju sta as m éd ias
d e v para o q u e se r ia m se o s três g r u p o s tivessem a mesma média cie idade (x). A a n á lise
resp on d erá q u al a p rob ab ilid ad e d e as d ife r e n ç a s entre as m éd ia s aju stad as d o s g r u p o s teren'
o co rrid o d e v id o ao erro a m o str a i? ”
P rim eiro , o b s e r v e a F igu ra 1 3 .4 , q u e m ostra as lin h a s d e r eg r essã o para c a d a gru p o s e
p aradam ente. Veja c o m o cada grupo d ifere na m éd ia da idade. A s cien tista s, por e x em p lo , têrr
um a m édia de idade de 38 anos. Se v o c ê utilizar um a régua para d eslizar p e lo e ix o v, verá que
indica que a m édia do nível de testosteron a d e sse grupo é 5. D ê um a olhad a na m éd ia das idade'
e nos n ív e is m éd ios de testosteron a d os outros d ois grupos. P rovavelm en te seja ó b v io que pane
das d iferen ça s na m édia da testosteron a se deve ao fa to de o s g ru p os apresentarem d iferen te'
m éd ias de idade.
A n tes de a v a n ça rm o s, lem b r e -se de c o m o v o c ê o b te v e a m é d ia g e ra l, isto é , a m éd ia da'
m éd ia s! A s m éd ia s das id ad es para o s três g r u p o s são:
■ G ru po 1 (c ie n tista s ) = 38
■ G ru po (2 secretá ria s) = 34
■ G ru po (3 r ec e p c io n ista s) = 23
P ortan to, a m éd ia geral é a so m a 3 8 + 3 4 + 2 3 d iv id id a por 3, q u e é igual a 3 1 .6 . V am o'

arredondar e s s e valor para 3 2 v isa n d o a o s o b je tiv o s d o e x e m p lo . A g o r a p o d e -s e ver o quante
cad a m é d ia e stá d istan te da m é d ia geral (F igu ra 13 .5 ).
M édia global
<L>
"O
IDADE
Linhas de regressão para cada grupo separadamente.

Figura 13.4
Utilizando um a régua horizontalm ente a partir da

média da idade das cientistas, 38, você pode constatar
que esse grupo tem um nível de testosterona de 4 ,9 8 (5)
Média global
M édia de
idade das
cientistas = 38
O cupação
Cientistas
Secretárias
Recepcionistas de boate
10 14 18 22 26 30 34
12 16 20 24 28 32 36
Idade Uma linha
vertical m ostra
a média geral, p
Figura 13.5 Linhas de regressão para cada grupo separadamente, mostrando as médias ajustadas e
não-ajustadas das cientistas.
O b se r v e a m é d ia d as c ie n tista s - o p o n to d e n o m in a d o a. U m a lin h a v e r tic a l d ir e c io n a

da para c im a m ostra a m é d ia g e ra l, p. S e o lh a r m o s ao lo n g o (u tiliz e u m a régu a) d o e ix o v.
v e re m o s q u e as c ie n tista s têm u m n ív e l m é d io de testo stero n a ig u a l a 5. E ss a é a m é d ia não-
ajustada, ain d a não fo i ajustada ao r ela c io n a m e n to entre a id ad e e o n ív el de testo stero n a . A
A N C O V A u tiliz a a m éd ia geral, para cada um d os g ru p o s, em v e z da m é d ia reai. A s sim , par^
as c ie n tista s, a A N C O V A não u tiliz a a m é d ia das id a d es que vale 3 8 a fim d e encon trar o níve
m é d io de testo stero n a .
O b serv e a F igu ra 13.6 e im a g in e q u e e s s e p on to é p u x a d o ao lo n g o da lin ha d e regressão
até qu e e n c o n tr e a m é d ia g e ra l. Im a g in e fa z e r a m e sm a c o is a c o m a m é d ia d a s se cretá ria '
(F igu ra 1 3 .7 ) e das r e c e p c io n ista s d e b o a te (F igu ra 1 3 .8 ).
S e v o c ê o lh a r para as n o v a s p o s iç õ e s d e s s e s p o n to s, to d o s e le s e sta rã o so b re a m édi_
geral (tratad os c o m o se o s g r u p o s tiv e s s e m to d o s a m e sm a m é d ia d e id a d e). U s e u m a régua
para p ercorrer n o v o s p o n to s (o s p o n to s c o lo c a d o s sob re a m e sm a m é d ia de id a d e s) a fim de
c o n firm a r a n o v a m é d ia d e v (isto é . a te sto ste r o n a m é d ia aju stad a). A F igu ra 13.9 m ostra
c o m o s e p arece.
D e v e - s e ter e x p lic it a d o q u e a A N C O V A fo r n e c e u u m a e stim a tiv a d o q u e o n ív e l m é
d io d e te sto ste r o n a se r ia , se a id a d e f o s s e m a n tid a c o n s ta n te ( is to é , as m é d ia s d as id a d e-
d o s g r u p o s f o s s e m a s m e s m a s ). A s m é d ia s a ju s ta d a s e n á o -a ju s ta d a s sã o m o s tr a d a s nu
T a b e la 1 3 .1 .
A u tiliz a ç ã o da A N C O V A para o p rim eiro p r o p ó sito - red u zir a v ariân cia d o erro - nâc
tem c o n tr o v é r sia s, p o r q u e, q u a n d o a lo c a m o s p a rticip a n tes a o a c a so à s c o n d iç õ e s (g ru p o s .
a té c n ic a sa tisfa z as r e s tr iç õ e s d e sc r ita s a segu ir. P rim eiro, na u tiliz a ç ã o da A N C O V A . vocé
d e v e se assegu rar de q u e as m e sm a s h ip ó te se s v á lid a s para a A N O V A esteja m sa tisfe ita s (c o n
fira no C a p ítu lo 9 , se v o c ê já e sq u e c e u de q u a is sã o ).
A d ic io n a lm e n te , para m u ito s p rop ó sito s:
a A c o v a riá v el d e v e ser lin ea rm en te rela cio n a d a à variável d e p e n d en te.

» A c o v a riá v el d e v e ser m ed id a se m erros (se r c o n fiá v e l).
* A s lin h a s de reg r essã o para o s d ife r e n te s g r u p o s d e v e m ser paralelas entre si.
Média nào-ajustada do
nível de testosterona
por grupo
Se você utilizar a sua régua, ao longo da média geral,

na linha de regressão no eixo y , encontrará a nova
média ajustada aos níveis de testosterona, isto é,
ajustada aos efeitos do relacionamento entre
idade e testosterona. A nova média ajustada é 4,5.
Figura 13.6 Linha de regressão para as cientistas, mostrando as médias ajustadas e não-ajustadas.
G rupo 2 2, 00 Secretárias
34 é a média das
idades das secretárias
Puxe essa linha para baixo em direção à média geral, a fim de en
contrar a nova média ajustada, no eixoy. Antes do ajustamento,
as secretárias tinham um nível médio de testosterona de 2,8
e, após o ajustamento, passaram a ter uma média de 2,7. Não é
muita diferença, mas assim a linha de regressão é quase plana.
Linha de regressão para as secretárias que trabalham em turno parcial, mostrando as

Figura 13.7
médias ajustadas e não-ajustadas.
Grupo 3 3,00 Recepcionistas Puxe a idade média para

cima do valor 23 para a média
geral (3 2); isso leva a um a nova
média ajustada da testosterona
que vale 2,00.
A idade média das

recepcionistas antes do
ajustam ento é 23; isso leva a
16 18 20 22 24 26 28 30 32 34 36 38 um nível de testosterona de 1,4.
Idade
Linha de regressão para recepcionistas de boate, mostrando as médias ajustadas e não-

Figura 13.8
ajustadas.
Nova média ajustada

das cientistas
Nova m édia ajustada

das secretárias
Nova média
ajustada das
recepcionistas
Idade
Lin h as de re g ressão para os três g ru p o s, m o stra n d o so m e n te a m éd ia a ju sta d a e m y .

Figura 13.9
Tabela 13.1 Médias ajustadas e nao-ajustadas
Grupo Medias da ¡dade Mèdia testosterona M èdia da testosterona ajustada
A ANOVA observará as diferenças A ANOVA observará as diferenças

entre as médias entre a i médias ajustadas
13.1.1 A covariável deve estar linearmente relacionada à variável dependente

Pare de p en sar sob re isso . N ã o e x is te m u ito se n tid o e m e x ec u ta r um a A N C O V A se es->e
não fo r o c a so . O g r á fic o na F igu ra 1 3 .1 0 m ostra o qu e p od e a c o n te c e r se n ão e x is tir r ela cio
n am en to lin ear entre as du as v ariáveis.
V o cê p o d e ajustar as m e d ia s de fo rm a que os p o n to s fiq u e m sob re a lin ha d en om in ad a
m é d ia geral m as o va lo r da m é d ia d e v (te sto ste ro n a ) será a m esm a!
o 4
CJ
l/l
5i/i 3 O cu p .xã o
,CD
Secretárias
• Cientistas
10 14 18 22 26 30 34 38 42 46 50
12 16 20 24 28 32 36 40 44 48
(fa = 0) Idade
Relacionamento zero entre x ey.

Figura 13.10
13.1.2 A covariável deve ser medida sem erro (ser confiável)

S e v o c ê m e d isse o s e s c o r e s d o s p articip an tes na c o v a riá v el e m d ife r e n te s o c a s iõ e s , d e v e
ria e x is tir um a alta c o rr ela ç ã o en tre o s e s c o r e s o b tid o s n e ss a s d ife r e n te s o c a s iõ e s . A ssim .
QT, por e x e m p lo , é um a c o v a riá v el c o n fiá v e l, c o n stitu íd a sem erros s ig n ific a tiv o s de m ed id a
e x iste alta c o rrela çã o entre o e sc o r e do Q I m e d id o e m u m a se m a n a c o m o da p róxim a sem ana
S e v o c ê tiver um va lo r d e 1 10 e sta se m a n a , p r o v a v e lm e n te não obterá e x a ta m e n te o mesn'.
e s c o r e na p ró x im a sem a n a . I ,em b re-se de que is s o não está im p líc ito e m um a alta correlaçãc
S ig n ific a que p e s s o a s c o m b a ix o s e s c o r e s e m um a se m a n a terão e s c o r e s b a ix o s na p róxim a
e p e ss o a s c o m a lto s e s c o r e s em u m a se m a n a terão tam b ém a lto s e s c o r e s na p ró x im a . A idad:
é m e n su ra d a se m erro: a id ad e m e d id a em u m a se m a n a estará p e r feita m en te co rr ela c io n a d a

c o m a id a d e na p r ó x im a se m a n a . C o m o parte d o s e x e r c íc io s na fa c u ld a d e , a lg u m d ia v o c ê
con stru irá um q u estio n á rio . D ig a m o s q u e d e c id a u tiliz a r o s d a d o s de tal q u e stio n á r io c o m o
um a co v a riá v el. V o c ê sa b e q u ão c o n fiá v e l ela é? A m e n o s qu e ten h a testa d o o q u estio n á rio e
saib a qu e é c o n fiá v e l, v o c ê p o d e ter m e n su ra d o a c o v a riá v el com erro.
13.1.3 As linhas de regressão para os diferentes grupos devem ser paralelas entre si
F az se n tid o . Se as in c lin a ç õ e s não sã o p aralelas, u tilizar o p r o c e d im e n to qu e ajusta as

m éd ia s d o s grupos para um a m éd ia geral não terá sen tid o. E p o s sív e l ter um a m édia geral a d e
quada a partir de três in c lin a ç õ e s bastante d iferen tes, tais c o m o as da F igu ra 13.11 ?
A r esp o sta é não: as d ife r e n ç a s entre o s g r u p o s n ão são as m e sm a s, para c a d a v alor da
co v a riá v el. A s s im , n e sse c a s o a A N C O V A n ão será adequ ada.
F e liz m e n te v o c ê n ã o p r e c isa d e se n h a r (ou u tiliza r um p rogram a c o m p u ta c io n a l para
fa z ê -lo ) as lin h as de r eg r essã o para to d o s o s gru p os, de form a a verificar se a h ip ó te se d o para
le lis m o e stá sa tisfeita . O program a c o m p u ta c io n a l u tiliz a d o (o S P S S P W ) faz is s o por v o c ê .
Ocupaçao
Secretárias
------ Cientistas
Idade
Linha d e regressão para os três grupos.

Figura 13.11
Atividade 13.2
ANCOVA:
(a) Reduz a variância entre grupos
(b) Reduz a razão F
(c) Reduz a variância d o erro
13.2 Delineamentos pré e pós-testes
U m d o s d e lin e a m e n to s m a is c o m u n s e m q u e a A N C O V A é u tiliz a d a é o p r é -p ó s-te ste .

C o n s is te e m a p lic a r um te s te a n te s d e u m a c o n d iç ã o e x p e r im e n ta l e d e p o is r e a p lic á -lo
N e s s e c a s o . o p r é -te ste é u tiliz a d o c o m o c o v a r iá v e l. O s e stu d a n te s a lg u m a s v e z e s n o s per
g u n ta m p or qu e usar a A N C O V A e m tais d e lin e a m e n to s . S u g e r e m q u e se c o n s id e r e m a '
d ife r e n ç a s en tre o pré e o p ó s -te s te e s e u tiliz e m c o m o u m a v a r iá v e l d e p e n d e n te na A N O V A
d e um fator (o u te ste t para d o is g r u p o s ). E m b ora is s o se ja s im p le s , p o d e n ã o se r a m e lh o r
o p ç ã o para a n a lisa r tais d a d o s. D u g a r d e T o d m a n ( 1 9 9 5 ) d e m o n stra r a m q u e a n á lis e s que
u tiliz a m m u d a n ç a s d e e s c o r e s n ã o sã o , n o r m a lm e n te , sa tisfa tó r ia s para ta is d e lin e a m e n to s
Q u a n d o e x e c u ta m pré e p ó s - te s t e s , o s p e sq u isa d o r e s, às v e z e s , d e s e ja m c o n tr o la r ou r e m o
v e r o e f e it o d o p r é -te ste para p o d e r e m p e r ce b e r p o s s ív e is a lte r a ç õ e s d e v id a s à in terven ção
fe ita . A u tiliz a ç ã o d e d ife r e n ç a s de e s c o r e s n ão p e r m ite is s o . u m a v e z q u e o p r é -te ste esta
g e r a lm e n te c o r r e la c io n a d o a o r e s u lta d o (d ife r e n ç a ), e a s s im a v a r ia ç ã o n o s v a lo r e s d o pré-
te ste n ã o é r e m o v id a .
O s d a d o s a se g u ir s e r efe re m a u m g ru p o de p r é -te ste e a o u tr o de p ó s -te s te . S u b tra in
d o -s e o s v a lo r e s d o p ó s -te s te d o s d o p r é -te ste , c a d a p a r tic ip a n te te m u m a d ife r e n ç a . U n
te ste i para g r u p o s in d e p e n d e n te s se r á e x e c u ta d o u tiliz a n d o as d if e r e n ç a s c o m o variáve
d e p e n d e n te .
Pré Pós Grupo Diferença
150,00 51,00 i.oo 98.10

130,00 50.00 1,00 80.00
] 25.00 40,00 1.00 85.00
152.00 45.00 1.00 107.00
160.00 60,00 1,00 100,00
174,00 75.00 2,00 99.00
1)0.00 41.00 2,00 69,00
180.00 80.00 2.00 100,00
145.00 60.00 2.00 85.00
140.00 55.00 2.00 85.00
P rim eiro, o b s e r v e q u e, c o m o e sp e r a d o , o s e s c o r e s do p r é -te ste se c o rr ela c io n a m c o m o

d o p ó s -te s te . D e sd e q u e o s v a lo r e s d o pré e do p ó s -te s te seja m a lta m en te c o rr ela c io n a d o s. ;
usual encon trar o s v a lo re s d o p ré-teste c o rr e la c io n a d o s a o s v a lo re s das d ife re n ç a s.
PRE POST DIFF

(PRÉ) (POS) (DIFERENÇA)
PRE Pearson Correlation 1.000 0 .8 7 8 0 .8 3 7 -
(PRÉ) (Correlação de Pearson) Existe uma alta
correlação entre o
Sig (2-tailed) 0.001 0.003
(Sig. Bilateral) escore do pré-teste e os
escores da diferença
N 10 10 10
POST Pearson Correlation 0.878 1.000 0.467
(PÓS) (Correlação de Pearson)
Sig (2-tailed) 0.001 0.173
(Sig. Bilateral)
N 10 10 10
DIFF Pearson Correlation 0.837 0.467 1.000
(DIFERENÇA) (Correlação de Pearson)
Sig (2-tailed) 0.003 0.173
(Sig. Bilateral)
N 10 10 10
E x iste u m a d ife r e n ç a entre o s e s c o r e s d o pré e do p ó s -te s te s se o s p a r ticip a n tes fo rem

c o n sid e r a d o s um grupo. E n tretanto, a id é ia aqui é ver se o s d o is g ru p o s d iferem .
U m a a n á lise u tiliz a n d o u m teste t in d ep e n d e n te fo r n e c e o s se g u in te s resu ltad os:
Levene's Test
for Equality
of Variances
(Teste de
Levene para a
Igualdade de t-test for Equality of Means
Variâncias) (Teste I para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95%
para a Diferença)
(2-tailed) Difference Difference Lower Upper
gi (Sig. (Diferença (Erro Padrão (Limite (Limite
F Sig. t (gl) Bilateral) das Médias) da Diferença) Inferior) Superior)
DIFF Equal variances 0,007 0.935 0.850 8 0.420 6.4200 7.5565 -11.0053 23.8453
assumed
(Igualdade de
variâncias
assumida)
Equal variances 0.850 7.874 0.421 6.4200 7.5565 -11.0539 23.8939
not assumed
(Igualdade de
variâncias
não-assumida)
Sig. -- Significância
A q u i p o d e -s e ver que /(8 ) = 0 ,8 5 0 , p = 0 ,4 2 0 . N ã o e x is te d ife re n ç a sig n ific a tiv a entre o s

d o is g r u p o s n o s e s c o r e s (o in te rv a lo d e c o n fia n ç a c o n fir m a ). O p e sq u isa d o r c o n c lu ir á qu e a
in te rv e n ç ã o afeta o s d o is g r u p o s de fo rm a se m elh a n te .
N o e n ta n to , ao e x e c u ta r m o s u m a A N C O V A , c o m o e sc o r e d o p ó s -te s te c o m o variáve
d e p e n d en te e o e sc o r e do p r e -te ste c o m o u m a c o v a r iá v e l, te re m o s o segu in te:
Tests of Between-Subjects Effects (Testes dos Efeitos entre Sujeitos)

Dependent Variable: POST (Variável Dependente: PÓS)
Type III Sum of Squares gi Mean Square

Source (Fonte) (Soma dos Quadrados do Tipo III) (gi) (Média dos Quadrados) F Sig.
Corrected Model 1 4 80 .5 16a 2 740.258 3 4 .1 84 0.000
(Modelo Corrigido)
Intercept (Intercepto) 65.387 1 65.387 3.019 0.126
PRE (PRÉ) 1058.016 1 1058.016 4 8 .8 58 0.000

GROUP (GRUPO) 2 32.054 1 232.054 1 0 .7 1 6 0 .0 1 4
Error (Erro) 151.584 7 21.655

Total 32 65 7.00 0 10
Corrected Total 1632.100 9
(Total Corrigido)
a. R Squared = .907 — Adjusted R Squared = .881 (a. R2 = 0.907 (R2 Ajustado = 0.881»
P o d e m o s c o n c lu ir en tã o que o s d o is g r u p o s d ife r e m na m e d id a do p ó s -te s te , a p ó s aju>-

ta m en to para o s e s c o r e s d o p r é -te ste . E m g e ra l, a A N C O V A ten d e a fo r n e c e r um teste ma:
p o d e r o so d e h ip ó te se s d o q u e a d ife re n ç a de e sc o r e s.
13.2.1 O que você pode fazer se seu estudo não se encaixa nas
condições de uma ANCOVA?
P rim eir o , p e n s e e m c o n tr o la r experim entalmente , b e m c o m o , ou c m v e z d e , controla*

e sta tistic a m e n te (o q u e fa z e m o s q u an d o e x e c u ta m o s um a A N C O V A ). N o e x e m p lo , p o d em c -
(em b o ra p o ssa ser d ifíc il) tentar encon trar alg u m a c ie n tista jo v e m de alto gabarito e /o u velh a-
r e c e p c io n ista s d e boate ou secretárias. D e ss a form a p o d e m o s em p arelh ar o s g r u p o s qu anto _
id ad e (T ab ela 13.2).
E c la r o qu e não seria p o s s ív e l e m p a relh a r se c re tá ria s ou r e c e p c io n ista s d e b oate d e 1 -
a n o s c o m c ie n tista s de alto gabarito da m e sm a idad e. E n tretan to, s e v o c ê p en so u c o m cu id t-
do no d e lin e a m e n to a n tes de c o n d u z ir o e stu d o , não irá se deparar c o m tal tip o de situaçã
em b araçosa.
T a b ela 1 3 .2 E m p a r e l h a n d o p a r t i c i p a n t e s q u a n t o à id ade
Recepcionistas Secretárias Cientistas
25 25 25
30 30 31
50 50 50
41 41 42
39 39 39
V a m o s im a g in a r q u e o s p a r tic ip a n te s fo r a m e m p a r e lh a d o s q u a n to à id a d e . S ig n if ic a
q u e o s g r u p o s a p r e se n ta m a m e sm a id a d e n a c o v a r iá v e l. A in d a é p o s s ív e l u tiliz a r a A N
C O V A c o m p r o v e ito (n e s te c a s o , será p e lo p r im e ir o o b je tiv o q u e m e n c io n a m o s ) de form a
a r ed u z ir a v a r iâ n c ia d o erro erro d e v id o à c o r r e la ç ã o en tre a v a r iá v e l d e p e n d e n te e a
c o v a r iá v e l.
Atividade 13.3
ANCOVA ajusta as médias dos grupos na covariável para:

(a) A média geral
(b) A média harmônica
(c) A média aritmética
N e s s a altura v a m o s lhe m ostrar c o m o ob ter u m a A N C O V A no S P S S P W .
□ SPSSPW: obtenção de resultados de uma ANCOVA
A b ra o se u arq u ivo de d a d o s. E sc o lh a Analyze (A n a lisa r ), General Linear M odel (M o d e

lo L in ear G eral), Univariate (U n iv a ria d a ).
Escolha Analyze
(Analisar),
General Linear
M odel (Modelo
Linear Geral) e
Univariate
(Univariada)
A p arecerá a se g u in te c a ix a d e d iá lo g o s:
g|B|a| 5| - 1 I I M&l «I •Tiri a ttln i '»M M ova a

VI
variável
dependente
para este
espaço
M ova a
variável
ind ependente
para este
espaço
Mova a
covariável para
este espaço
■ I ' P\ 0«H View { VmwUt Vww / <1 I

SPSS Ptoe«ííi is «№
« * - '! Cs № a j j í»
I py; nrv.-çJ | jjf r d ff r in a | ¡»5 íthool GeoC ||pd*ncov*l » . fjj 3 JpJil
ü program a retornará à c a ix a d e d iá lo g o General hactorial ANOVA (A N O V A F atorial

G eral). C liq u e em Options (O p ç õ e s ). A se g u in te c a ix a de d iá lo g o irá aparecer.
Ellaitdtaj Wrari,
r adatti sudrad» fnteactora* Perm ite que
as m édias
sejam
m ostrad as
C lique aqui
para obter as
m edidas
descritivas e
o tam an ho
do efeito
M o v e n d o a variável de a g ru p a m en to para a c a ix a Display Means (M ostrar M é d ia s), serão

fo r n e cid a s tanto a m éd ia n ão -a ju sta d a qu an to a ajustada (m argin al e stim a d a ). V ocê p o d e ta m
b ém m arcar a o p ç ã o E sta tístic a s d e sc r itiv a s(Descriptive statistics) e E stim a tiv a d o tam anh o
d o e fe it o (Estimates o f effect size). O p o d er p o d e ser m a rca d o se desejar. O b se r v e q u e o s
in terv a lo s d e c o n fia n ç a serão fo r n e c id o s a u to m a tic a m e n te .
C liq u e em Continue (C o n tin u a r) e p r e ssio n e OK. S e r ã o fo r n e c id o s o s resu ltad os.

V o c ê aind a não p r e c isa u tilizar a A N C O V A e m três g ru p o s. C o m o d e v e saber, é p o s sív e l
u tiliza r a A N O V A ou a A N C O V A e m m a is d o q u e três g r u p o s, m a s a lg u m a s v e z e s o s e stu d a n
tes não p e r c e b e m que p o d e m u tilizar e s s a s té c n ic a s e m d o is gru p os. N o r m a lm e n te n ão e x is te
se n tid o e m fa zer u m a A N O V A c o m d o is g r u p o s, p o is se p o d e u tilizar o teste t. E n tretanto, o
q u e ocorre se tiv er m o s d o is g r u p o s e q u iser m o s m an ter o c o n tr o le para um a c o v a riá v el? A q u i,
é claro, p o d e -s e u tilizar a A N C O V A .
Test of Betweeen-Subjects Effects (Teste dos Efeitos Entre Sujeitos)

Dependente Variable: testosterone (Variável Dependente: testosterona)

(Soma dos Quadrados df (Média dos Eta Squared
Souce (Fonte) do Tipo III) (gl) Quadrados) F Sig. n2
Corrected Model
6 9 .2 73 ' 3 23.091 313.80 6 .0 0 0 a .973
(Modelo Corrigido)
Intercept 1
6 .5 2 1 E-02 6.521 E-02 .886 .355 .033
(Intercepto)
A G E (IDADE) 2.981 1 2.981 4 0 .5 0 9 .0 0 0 .6 0 9
GRO U P (GRUPO) 1 4 .2 6 5 2 7 .1 3 3 9 6 .9 3 3 .0 0 0 .8 82
Error (Erro) 1.913 26 7.358E-02
Total 353.320 30
Corrected Total
71.187 29
(Total Corrigido)
a. Computed using alpha = .05 (a. Calculado com o uso de a - 0.05)

b. R2 = .973 (Adjusted R2 = 0.9 7 0 ) (b. R2 = 0.973 [R2 A|ustado = 0.970])
Sig. = Significance
Std. Error 95% Confidence Interval

Mean (Média) (Erro Padrão) (IC de 95%)
profession
Lower Bound (Limite Inferior) Upper Bound (Limite Superior)
(profissão)
scientists
4.46 6 .119 4.222 4.71 1
(cientistas)
secretaries
2.663 .090 2.477 2.848
(secretárias)
hostesses
2.071 .140 1.784 2.358
(recepcionistas)
a. Evaluated at covariates appeared in the model: AGE - 3 1 .6000

(a. Avaliada nas covariaveis do modelo: IDADE = 31.6000)
Pairwise Comparisons (Comparações Emparelhadas)

Dependent Variable: testosterone (Variável Dependente: testosterona)
Mean Std. 95% Confidence

Difference (1 - J) Error Interval for
(Diferenças (Erro Sig. Difference
de Médias) Padrão) (Sig.') (IC de 95%)
(1) profession (J) profession Lower Bound Upper Bound
(profissão) (profissão) (Limite Inferior) (Limite Superior
scientists secretaries
1.804* .133 .000 1.530 2.077
(cientistas) (secretárias)
hostesses
2.395* .227 .000 1.928 2.863
(recepcionistas)
secretaries scientists
-1 .8 0 4 * .133 .000 -2 .0 7 7 -1 .5 3 0
(secretárias) (cientistas)
hostesses hostesses
.592* .184 .003 .214 .969
(recepcionistas) (recepcionistas)
scientists
-2 .3 9 5 * .227 .000 -2 .8 6 3 -1 .9 2 8
(cientistas)
secretaries -2 K
- .5 9 2 * .184 .003 -.9 6 9
(secretárias)
Based on estimated marginal means (Baseado nas médias marginais estimadas)

*The mean difference is significant at the .05 level (* As diferenças entre as médias são significativas no nível de 5%)
a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
(a. Ajustamento para comparações mútliplas: Diferença menos Significativa - equivalente a não-ajustamento)
É im p ro v á v el q u e o r e la c io n a m e n to entre id ad e e te sto ste ro n a se e x p liq u e por erro a m o s

trai, c a s o a h ip ó te se n u la seja verd a d eira ( F ( l , 2 6 ) = 4 0 .5 , p < 0 .0 0 1 ) . O s g r u p o s difereir
qu an to à te sto ste ro n a , um a v e z retirad os o s e f e it o s da id ad e (F (2 , 2 6 ) = 9 6 .9 , p < 0 ,0 0 1 ).
A sa íd a referid a m ostra c la r a m en te qu e a id a d e está r ela cio n a d a à te sto ste ro n a . A ssim
um a A N C O V A é apropriada.
(\T 1 EXEMPLO:
*
P e n se n o v a m e n te sob re o e x e m p lo u tiliz a d o no C a p ítu lo 9, p á g in a 3 0 6 . T rata-se de um
e x p e r im e n to p rojetad o para d e sc o b r ir s e o á lc o o l (c o n d iç õ e s p la c e b o , p o u c o á lc o o l, m uito
á lc o o l) a feta v a o d e se m p e n h o ao v o la n te , m e d id o por erros c o m e tid o s em um sim u la d o r
de d ireçã o . Para o d e lin e a m e n to in d ep en d e n te, o g ru p o c o m n ív e is a lto s d e á lc o o l (m u ito
á lc o o l) d ife riu d o gru p o q u e u sou p la c e b o e d o q u e c o n su m iu b a ix o n ív e l d e á lc o o l (p o u co
á lc o o l). A razão F fo i de 9 .9 1 . c o m u m a p ro b a b ilid a d e a ss o c ia d a d e 0 ,0 0 4 .
A g o r a farem os um a su p o siç ã o p erfeitam en te ra zo á v el d e q u e a e x p e r iê n c ia d e d ireção
está r ela cio n a d a a o s erros c o m e tid o s a o v o la n te , m e sm o em um sim ulad or. Q u a n to s m ais
ex p erien te for o m otorista, m en ores serão o s erros. A ssim , a e x p e riên cia do m otorista está ne
g ativam en te a sso cia d a aos erros ao volan te. Su pon ha que ten h am os d esco b erto qu anto m eses
o s p articip an tes (m o to rista s) já têm de direção. O s d ad os e stã o registrados na T abela 13.3.
O c o e fic ie n te d e co rr ela ç ã o d e P ea rso n c a lc u la d o entre o n ú m ero d e erros e o tem p o de
e x p e r iê n c ia resu lto u e m r = - 0 , 6 2 . E m b ora s ig n ifiq u e qu e o s três g r u p o s d e fa to d ife re m
q u anto ao tem p o de e x p e r iê n c ia , p o d e ter o co rr id o d e v id o ao erro am ostrai (a A N O V A de
um fator p od o m ostrar isso ).
S c p lo ta r m o s as lin h a s de r e g r e s sã o se p a r a d a m e n te para c a d a g r u p o , o b te r e m o s a
F ig u ra 13.12.
T a b ela 13 .3 T einpo de ex p eriência com o m otorista e erros ao volnnte
Placebo Pouco álcool M uito álcool
Erros Experiência Erros Experiência Erros Experiência
5 I? 5 21 X 29
IO -■ 16 10 8
7 9 9 7 8 26
3 24 8 15 9 20
5 15 2 30 11 18
7 6 5 21 15 6
11 3 6 12 7 12
2 30 6 13 11 7
3 20 4 26 8 15
10 4 24 8 9
6 I 8 9 17 3
6 8 10 6 II 7
I , = 70 1 = 149 I-, = 74 I , = 200 V —1° ^ X*= 160
v, = 5.83 y, = 12,417 .V; = 6.17 Vj = 16.5Ñ3 v . s 10.25 <0= 13.33
DP. =2,69 DP =8.306 DP. = 2.35 DP. = 7.70 DP, = 3.05 DP,, = 8.338
M uito álcool
Linha de regressão para os três grupos.

Figura 13.12
D e s s a v e z o b t iv e m o s ta m b é m as lin h a s h o r iz o n ta is : o p o n to c m q u e as lin h a s h o r i
z o n ta is e n c o n tr a m a lin h a d e r e g r e s sã o (para c a d a g r u p o se p a r a d a m e n te ) é a m é d ia d e x
e d e y. V o c ê p o d e v e r q u e a e x p e r iê n c ia c o m o m o to r ista e stá n e g a tiv a m e n te r e la c io n a d a
a o s erro s d e d ir e ç ã o para t o d o s o s g r u p o s . S a t is f iz e m o s e s s a s u p o s iç ã o d e m o d o fá c il
com a A N C O V A .
A m e d id a da c o v a r iá v e l é c o n fiá v e l: as lin h a s sã o m ais ou m e n o s p a ra lela s. C o m a

e x e c u ç ã o de u m a A N C O V A . o b te m o s a sa íd a a seg u ir - n ã o p r e cisa m o s d e vários iten s para
a a n á lise . A s se g u r e -s e de fo c a r o s se g u in te s p o n to s d a saída.
Tests of Between-Subjects Effects (Teste dos Efeitos entre Sujeitos)

Type III Sum of Mean Square

Squares (Soma dos df (Média dos
Source (Fonte) Quadrados do Tipo III) ígl) Quadrados) F Sig.' n2
Corrected Model
294.697b 3 9 8 .23 2 3 4 .1 4 8 0.000 0.762
(Modelo Corrigido)
Intercept (Intercepto) 1 0 3 5 .7 6 0 1 1 0 3 5 .7 6 0 360.058 0.000 0 .9 18
E x p e rie n ce
1 4 9 .53 1 1 149.53 1 51.981 0 .0 0 0 0 .9 1 8
(Experiência)
4
G R O U P (GRUPO) 1 3 6 .3 3 4 2 6 8 .1 6 7 / 2 3 .6 9 7 0 .0 0 0 0 .5 9 7
Error (Erro) 9 2 .05 3 32 2.877

\
Total 2 3 6 7 .0 0 0 36 \
Corrected Total
3 8 6 .7 5 0 35 \\
(Total Corrigido)
a. Computed using alpha = .05 (a. Calculado com o uso de a = 0.5)/
b. R Squared = .762 - Adjusted R Squared = 740
(b. R2 = 0.762 (R2 Ajustado = 0.740)
Sig. = Significance
"Experiência" mostra que a experiência A linha do grupo mostra

ao volante se relaciona negativamente que os três grupos diferem nas
com os erros cometidos e que é medias ajustadas. É improvável
improvável essa relaçào ter ocorrido que essa diferença tenha ocorrido
por erro amostrai, considerando por erro am ostrai, considerando
a hipótese nula verdadeira. a hipótese nula verdadeira.
O saída do S P S S forn ece um a tabela co m as m éd ias reais e ob servad as (n ão ajustadas
Descriptive Statistics (Estatísticas Descritivas)

Dependent Variable: errors made (Variável Dependente: erros cometidos)
Alcohol Mean Std. Deviation

(Álcool) (Média) (Desvio Padrão) N
Placebo 5.8333 2.6912 12
Low (Baixo Consumo) 6.1667 2.3290 12
High (Alto Consumo) 10.2500 3.0488 12
Total 7.4167 3.3242 36

U m a tab ela sep arad a é dad a para as m é d ia s m argin ais e stim a d a s (e s s a s sã o as m éd ias
aju stad as).
2. alcohol (álcool)
Dependent Variable: errors made (Variável Dependente: erros cometidos)
Mean (Média) Std. Error (Erro Padrão) 95% Confidence Interval (IC de 95%)
Lower Bound Upper Bound

alcohol (álcool)
(Limite Inferior) (Limite Superior)
Placebo 5.38 3a 0.494 4.377 6.388
Low (Baixo) 6 .8 2 8 a 0 .49 8 5.813 7.843
High (Alto) 10 .0 39a 0.490 9.040 11.038
a. Evaluated at covariates appeared in the model: driving experience = 14.389.

(a. Avaliado nas covariáveis do modelo: experiência ao volante = 14,1389.)
O s lim ite s d e c o n fia n ç a em torno da m é d ia ajustada tam b ém são d ad os. A s s im , a m éd ia

a m ostrai ajustada para o gru p o q u e usou p la c e b o é 5 ,8 3 8 . E sta m o s 95% c o n fia n te s de q u e
entre o s lim ite s de 4 ,3 8 e 6 ,3 9 e steja a m é d ia p o p u la c io n a l ajustada. A A N O V A m ostraria
a d ife re n ç a entre as m éd ia s o b ser v a d a s, m as c o m um a A N C O V A o b se r v a m o s as d ife re n ç a s
entre as m éd ia s ajustadas.
E m virtude de term os con trolad o os e fe ito s da e x p e riên cia ao vo la n te, tem os um d e lin e a
m en to m ais se n sív e l. A razão F é agora 5 1,91. O r f total era origin alm en te 0 ,3 7 5 e é agora de
0 ,5 8 4 . A s sim 58% da variação nos erros de d ireção p o d em ser e x p lic a d o s p e lo s d iferen tes n í
v eis de á lc o o l, um a v ez que a e x p e riên cia ao volan te é controlad a (con stan te ou rem ovid a).
O relatório da a n á lise p o d e ser o se g u in te (a p rim eira e a ú ltim a parte são sim p le sm e n te
r e p e tiç õ e s das p á g in a s 3 1 2 -3 ).
Estatísticas descritivas (Tabela X)~ mostram que mais erros são cometidos com alto consumo
de álcool do que nas outras duas condições. As médias observadas e ajustadas são mostradas na
Tabela X . Embora o número médio de erros com etidos pelo grupo que consumiu pouco alcool
.->eja maior do que o do grupo que usou placebo, a diferença foi pequena, e, de fato, os limites de
confiança cm tomo das médias mostram uma considerável sobreposição, Constatou-se que a ex
periência com o motorista está negativamente associada ao número de erros ao volante cometidos
(r = - 0,64); uma análise de covariância, utilizando a experiência de motorista como covariável,
mostrou que existe uma significati\a diferença entre as condições (F(2, 332) = 23,7, p - 0,001).
Representa um tamanho do eleito de 0,548, indicando que, sendo constante a experiência de diri
gir. 58% da variação dos erros ao volante podem ser atribuídos aos diferentes níveis de álcool. Um
teste post-hoc (Newman-Keuls) confirmou que existem diferenças significativas entre as condi
ções I e 3 e 2 e 3 (todas Com tamanho do efeito d = 1,54;. As condições relativas ao baixo consumo
de álcool e ao uso de placebo não mostraram diferença significativa (d = 0,14).
Atividade 13.4
A ANCOVA assume que:

(a) A covariével deve estar linearmente relacionada com a variável dependente
(b) As linhas de regressão não devem ser paralelas
(c) A covariável precisa ser confiável
Exemplo da literatura: Dll e Sli

A ttree e c o la b o r a d o r e s ( 2 0 0 3 ) estu d a ra m a fu n ç ã o c o g n itiv a de p e s s o a s c o m D II (d o e n ç a di
in te stin o in fla m a d o ) e c o m S U (sín d r o m e d o in te stin o irritável). U m g ru p o sa u d á v e l fo i incluídc
no estu d o . O s p articip an tes fo ra m su b m e tid o s a três tip o s de a v a lia ç ã o d a fu n çã o c o g n itiv a e a u m :
e sc a la de d e p r e ssã o . O s p e sq u isa d o r e s q u eriam v erifica r se o s g ru p os de d o e n te s d iferia m , quand-
co m p a r a d o s entre si e c o m o gru p o de p e ss o a s sa u d á v e is, e m várias m ed id as, in c lu in d o o Q I. Attree
e c o la b o r a d o r e s e x ec u ta r a m u m a a n á lise d e c o v a r ia n c ia su b d iv id id a d e d o is fa to res. E ntretanto
aqui a p r e se n ta re m o s a p e n a s o resu lta d o d o Q1 verb al, q u e n ão fo i a p r e se n ta d o no artigo de 2 0 0 3
A ttree e c o la b o r a d o r e s levan taram a h ip ó te s e de q u e d e fic iê n c ia s v e rb a is d e v e ria m o co rrer n o
g r u p o s de d o e n te s.
A tabela se g u in te ilustra as m é d ia s ajustadas para os três g ru p o s (G ru po l = SII; G ru po 2 = D ll
G ru po 3 = p e sso a s sa u d á v e is).
Dependent Variable: verbal iq (Variável Dependente: qi verbal)
IC de 95%
conditions Std. Error Lower Bound Upper Bound

(condições) Mean (Média) (Erro Padrão) (Limite Inferior) (Limite Superior)
1.00 9 5 .7 8 5 a 2.076 91.635 99.934

2.00 9 4 .2 3 7 a 3.15 6 87 .9 29 100.545
3.00 107.0 3 8a 2.456 102.129 111.946
a. Evaluated at covariates appeared in the model: depression = 15.3286, participant's gender = 1.8571,
age of participant - 43 .0 0 0 0 , duration of ilness in years = 7.26 43 , years of education = 12.2643.
(a. Avaliado nas covariáveis do modelo: depressão = 15,3286: gênero do participante 1,8571; idade do participante =
43,0000; duração da doença em anos = 7,2643; anos de escolaridade = 12,2643.)
O s r esu lta d o s sa o r e la c io n a d o s a seguir:
Tests of Between-Subjects Effects (Teste dos Efeitos entre Sujeitos)

Dependent Variable: verbal íq (Variável Dependente: qi verbal)

(Soma dos Quadrados df (Média ao
Source (Fonte) do Tipo III) (gl) Quadrado) F Sig. n2
Corrected Model
5 4 22 .2 25a 7 774.604 7.081 0.00 0 0.444
(Modelo Corrigido)
Intercept
23 31 .1 56 1 2331.1 56 2 1 .3 1 1 0.000 0.256
(Intercepto)
CESD 542.165 1 542.165 4.956 0.030 0.074
GENDER (GÊNERO) 0.159 0.159 0.001 0.970 0.000
AGE (IDADE) 960.120 1 960.120 8.777 0.004 0.124
YEARS (ANOS) 211.936 1 211.936 1.937 0.169 0.03 0
SCHOOL
1954.830 1 1954.830 17.870 0.00 0 0.224
(ESCOLARIDADE)
G RUPO S (GRUPOS) 1 3 0 9 .9 8 3 2 6 5 4.99 1 5 .9 8 8 0 .0 0 4 0 .1 6 2
Error (Erro) 6 7 8 2 .1 18 62 109.389
Total 70 90 08 .0 00 70
Corrected Tota!
12204.343 69
(Total Corrigido)
a. R Squared = .444 - Adjusted R Squared .382 (a. R2 = 0,444 (R2 Ajustado = 0,382))
U m a a n á lise p relim in a r fe ita por A ttr ee e c o la b o r a d o r e s m ostrou qu e o s g r u p o s d ife ria m n os

n ív e is de d e p r e ssã o e (para o s g ru p o s de d o e n te s) na du ração d a d o e n ç a , a ssim e ssa s v a r iá v e is foram
u tiliz a d a s c o m o c o v a riá v eis. F e z -s e is s o para red uzir a variân cia atribuída às v a riá v eis, em b o ra seu s
e fe ito s p o ssa m ter sid o m ín im o s.
S e v o c ê olh ar para a lin ha d o s g r u p o s na tab ela acim a , verá q u e F (2 6 2 ) = 5 ,9 8 8 p = 0 ,0 0 4 . O s
gru p o s d ife re m , p ortanto, qu anto ao QI verb al, c o m as outras v a r iá v e is (lista d a s na p rim eira c o lu n a )
c o n tr o la d a s. O r f p arcial m ostra qu e 16 ,2% das v a r ia ç õ e s n o s e s c o r e s no Q I verb al ocorreram d e v i
do à variá v el in d ep en d e n te (isto e', o s g ru p o s de d o e n te s).
O s p e s q u i s a d o r e s q u i s e r a m ir a l é m d o s d a d o s . C o n t r a s t e s f o r a m o b t i d o s v ia S P S S P W e p r o d u
z id o o se g u in te c o n ju n to d e resu ltad o s.
P a irw ise C o m p ariso n s (Comparações Emparelhadas)

Mean 95% Confidence Interval

Difference (IC de 95%)
(l- J )
(1) iv conditions (J) iv conditions (Diferenças Std. Error Lower Bound Upper Bound
(condições iv) (condições iv) de Médias) (Erro Padrão) Sig.a (Limite Inferior) (Limite Superior)
1.00 2.00 1.548 3.635 1.000 -7 .3 9 7 10.492

3.00 -1 1.253* 3.388 0.005 -1 9 .5 9 0 -2 .9 1 6
2.00 1.00 -1 .5 4 8 3.635 1.000 -10 .4 92 7.397

3.00 - 1 2.801 * 4.554 0.020 -24 .0 07 -1 .5 9 4
3.00 1.00 11.253* 3.388 0.005 2.916 19.590

2.00 12.801* 4.554 0.020 1.594 24.007
Based on estimated marginal means (Baseado nas médias marginais estimadas)

*The mean difference is significant at the .05 levei (*As diferenças entre as médias são significativas no nivel de 5%.)
a. Adjustment for múltiple comparisons: Bonferroni (a. Aiustamento para comparações múltiplas: Bonferrom.)
O s r e s u lta d o s d a ta b e la d o teste d o s e fe ito s e n tre s u je ito s a s e re m re la ta d o s e s tã o e m n eg rito

N a ta b e la d a s c o m p a r a ç õ e s e m p a r e lh a d a s , o b s e rv a - s e q u e n ão e x is te m d if e re n ç a s im p o rta n te s entre
o s p a r t i c i p a n t e s c o m SIT e DIT. A d i f e r e n ç a o c o r r e e n t r e o s g r u p o s d e d o e n t e s e o g r u p o d e p e s s o a s
saudáveis.
O s re su lta d o s p o d e m ser re la ta d o s d a se g u in te form a:
A n á l i s e s p r e l i m i n a r e s m o s t r a r a m q u e o s g r u p o s d i f e r e m d e f o r m a s i g n if ic a tiv a q u a n t o à d e p r e s s ã o
e d u r a ç ã o da d o e n ç a . P ara r e d u z i r a v a r i â n c i a at r i b u íd a a e s sa s variáv eis e o u t r a s m e d i d a s d e m o g r á f i c a s
so c iais ( idade, se x o e e s c o l a r i d a d e ) , e s s a s f o r a m u tiliz a d a s c o m o c q Variáveis e m an á l i s e s a d ic io n a is . P ri
m e ir o , u m a m e d i d a d o QI foi c o n s i d e r a d a . O s d a d o s f o r a m u ti l i z a d o s c o m o u m a a n á lis e d e c o v a r i â n c i a
( A N C O V A ) c o m o Q I v erb al c o m o v a r i á v e l d e p e n d e n t e e o s g r u p o s c o m o f a t o r e s i n d e p e n d e n t e s . Os
g r u p o s d o s d o e n t e s m o s t r a r a m valores s i g n i f i c a t i v a m e n t e m e n o r e s d o q u e o d a s p e s s o a s s a u d á v e i s (F(2.
6 2) = 5 , 5 9 , / ; = 0 ,0 0 4 , r| = 0,1.62). C o m p a r a ç õ e s e m p a r e l h a d a s c o n f i r m a r a m q u e a d i f e r e n ç a e n t r e os dois
g r u p o s d o e n t e s n ão f o r a m sign ificativ as ( m é d i a da SII d e 95 ,8 : m é d i a d o DII d e 9 4 ,2 c o m p = 1,00), m a s a
d i f e r e n ç a e n tre o s g r u p o s d o s d o e n t e s e d a s p e s s o a s s a u d á v e is ( m é d i a de 107) foi c o n s i d e rá v e l (SII versus
p e s s o a s sa u dáveis: p - 0 , 0 0 5 : D II v e r su s p e s s o a s sa ud áv eis: p = 0 .0 2 0 ).
Resumo
N e s te c a p ítu lo v o c ê a p re n d e u que:
■ A A N C O V A in d e p e n d e n te de u m fa to r é u tiiiz a d a p a ra d e s c o b rir se e x iste m d ife re n

ç a s e n t r e c o n d i ç õ e s q u a n d o o s e f e i t o s d e o u t r a v a r i á v e l , d e n o m i n a d a c o v a r i á v e l . sã
co n tro lad o s.
v A co v ariáv el é a variável q u e ap re se n ta u m re la c io n a m e n to lin ear c o m a v a riá \e '
dependente.
■ A A N C O V A red uz a variâ n cia d o erro e a ssim fo r n e c e um teste m ais p o d er o so .

■ Para q u e te n h a m o s c o n fia n ç a n o s r esu lta d o s p r o d u zid o s por um a A N C O V A , as h ip ó
te s e s d o m o d e lo p r e cisa m ser sa tisife ita s.
A b ra o arq u ivo de d a d o s u tiliz a d o n o C a p ítu lo 9 . p á g in a 3 2 3 . E ss e s sã o o s d a d o s u tili

z a d o s para a A N O V A d e um fator c o m três g r u p o s d e e stu d a n te s, a lo c a d o s a lab o ra tó rio s em
três d ife re n te s partes d o dia: m an h ã, tarde e n oite. C o m o parte d o p rojeto d o s estu d a n tes, v o c ê
d e c id iu an a lisa r d ife re n ç a s entre o s g r u p o s, u m a v e z qu e a m o tiv a çã o ten h a s id o con trolad a.
O s d ad os sã o o s se g u in te s. L e m b r e -se de q u e v o c ê p r o v a v e lm e n te já tem e s s e s d a d o s em um
a rquivo, a p en as p recisa acrescen ta r o s v a lo re s da m o tiv a çã o .
E x e c u te u m a a n á lise 2 x 2 no seu p a c o te c o m p u ta c io n a l.
G rupo Escore Motivação G ru po Escore M otivação
1.00 15.00 10.00 2.00 15.00 14.00

1.00 10.00 «.00 2.00 15.00 14,00
1.00 14.00 10.00 2.00 18.00 17.00
1.00 15.00 11 ,oo 2.00 19,00 18.00
! .00 17.00 14.00 2,00 13,00 11,00
1,00 13,00 10.00 3.00 13.00 11 .oo
1.00 13.00 10.00 3.00 12,00 11.00
1.00 19.00 17.00 3.00 1 1.00 11.00
1.00 16.00 15.00 3.00 11,00 10.00
1.00 16.00 15.00 3.00 14,00 14.00
2.00 14.00 14.00 3.00 11.00 10,00
2.00 13.00 11.00 3.00 10.00 9.00
2.00 15.00 14.00 3,00 9.00 8.00
2,00 14.00 13,00 3,00 8.00 7.00
2.00 16.00 15.00 3.00 10.00 11.00
1. O b ten h a um d iagram a de d isp er sã o c o m as três lin h a s de r eg r essã o de cad a gru p o de

fo rm a separada. V ocê sa tisfe z as s u p o s iç õ e s da A N C O V A ?
2 . E x e cu te um a A N C O V A c o m o s d a d o s. O q u ã o d ife re n te é e s s e p r o c e d im e n to da
A N O V A d e um fator q u e v o c ê e x e c u to u no C a p itu lo 9? E screv a a su a in terp retação
d o s resu lta d o s.
QUESTÕES DE MÚLTIPLA ESCOLHA 6. Quanto à diferença entre os grupos, é:

(a) Improvável que tenha ocorrido por erro a m o -
1. A ANCOVA mostra qual a probabilidade de di trai, considerando a hipótese nula verdadeir.
ferenças entre condições ocorrerem por erro (F(2. 470) = 387.806. p < 0 .0 0 1 )
amostrai, uma vez que as médias tenham sido ajus (b) Improvável que tenha ocorrido por erro am es
tadas para o relacionamento entre: trai. considerando a hipótese nula verdadeir^
(a) A variável dependente e a covariável (F(2, 470) = 14.565,/; < 0 ,0 0 1 )
(b) A variável independente e a covariável (c) Provável que tenha ocorrido por erro amos
(c) A Variável dependente e a independente trai. considerando a hipótese nula verdadeir.
(d) Nenhuma das alternativas acima (F(2, 470) = 387.806. p < 0 ,0 0 1 )
(d) Provável que tenha ocorrido por erro ann>-
2. A ANCOVA ajusta as médias da covariável, de tral. considerando a hipótese nula verdade::.
forma que o valor da média da covariável seja: (F(2. 4 7 0 ) = 14,565, p < 0 .0 0 1 )
(a) O mesmo para todos os grupos
7. Quatro grupos apresentam as seguintes médias r
(b) Diferente para todos os grupos
covariável: 35. 42, 28 e 65. Qual é a média geral
(c) O m esm o para todos os participantes
(d) Isso depende (a) 43,5
(b) 42.5
3. O uso da ANCOVA pode ser controverso quando: (c) 56.7
(a) Os participantes forem aleatoriamente aloca (d) Nenhuma das alternativas
dos às condições
8. Você pode executar uma ANCOVA em:
(b) As suposições não forem satisfeitas
(a) D ois grupos
(c) Forem usados grupos intactos
(b) Três grupos
(d) Alternativas (b) e (c)
(c) Quatro grupos
A.í questões 4 a 6 se relacionam com a seguinte saída: (d) Todas as alternativas
Test of Betweeen-Subjects Effects (Teste dos Efeitos entre Sujeitos)

Type III Sum of Squares

(Soma dos Quadrados df Mean Square
Source (Fonte) do Tipo III) (gl) (Média dos Quadrados) F Sig. n2
Corrected Model
18267473987.605 3 6089157995.868 259.385 0.000 0.623
(Modelo Corrigido)
Intercept (Intercepto) 29047525437.055 1 29047525437.055 1237.361 0.000 0.725
PREVEXP
341929455.308 1 341929455.308 14.565 0.000 0.03C i
(EXPERIÊNCIA PRÉVIA)
JOBCAT 18207781455.753 2 9 103890727.876 387.806 0.000 0.623 j
Error (Erro) 11033430977.848 470 23475385.059
Total 166546277625.000 474
Corrected Total
29300904965.454 473
(Total Corrigido)
4. A variável dependente é: 9. Quando executam estudos de pré e pós-testes.

(a) Salário inicial pesquisadores às vezes desejam:
(b) Prevexp (a) Controlar o efeito da variável dependente
(c) Jobcat (b) Controlar o efeito do pré-teste
(d) Nenhuma das alternativas (c) Reduzir a correlação entre os valores do pr.
teste e do pós-teste
5. A covariável é:
(a) Salário inicial
(b) Prevexp <4í questões 10 e 11 estão relacionadas ao seguinte tex:
(c) Jobcat O Dr. O zônio Carvalho está analisando os e -t
(d) Nenhuma das alternativas res de um teste de memória para quatro grupos i__
pessoas que ingeriram diferentes quantidades de 13. A covariável é:

álcool. Ele supõe que a memória está relacionada (a) Tempo de reação
ao QI. então decide controlar essa variável e esc o (b.) Grupo
lhe a ANCOVA com o seu teste inferencial. (O Idade
10. Qual é a covariável? (d) Nenhum as das alternativas
(a) Escores do teste de memória 14. A variável dependente é:

(b) Quantidade de álcool
(a) Tempo de reação
(c) QI
(b )Grupo
(c) Idade
11. Suas análises mostrarão: (d) Nenhumas das alternativas
(a) Diferenças entre grupos no teste de memória, 15. Utilizando escores de diferenças de um delinea
controlando os efeitos do QI mento de pré e pós-teste os eleitos do pré-teste não
(b) Diferenças no QI. controlando os efeitos no QI são controlados pelo seguinte motivo:
(c) Diferenças no QI. controlando Os efeitos do
(a) Os escores do pré-teste norm alm ente não
álcool
são correlacionados com os escores do pós-
(d) D iferenças entre grupos no teste de memória,
teste
controlando os efeitos do álcool
(b ) Os escores do pré-teste normalmente são cor
As questões de 12 a 14 se referem a seguinte saída: relacionados com os escores das diferenças

Dependente Variable: testosterone (Vanável Dependente: tempo de reação)

Squares (Soma dos df (Média dos
Source (Fonte) Quadrados do Tipo III) (gl) Quadrados) F Sig. n2
Corrected Model
76.252 3 25.417 3.647 0.064 0.578
(Modelo Corngido)
Intercept (Intercepto) 4.792 1 4.792 0.688 0.431 0.079
AGE (IDADE) 4.252 1 4.252 0.610 0.457 0.071
GROUP (GRUPO) 41.974 2 20.987 3.012 0.106 0.430
Error (Erro) 55.748 8 6.969
Total 1860.000 12
Corrected Total
132.000 11
(Total Corrigido)
12. A variável independente é: (c) Os escores do pós-teste estão normalmente cor

(a) Tempo de reação relacionados com os escores das diferenças
(b ) Grupo
(c) Idade As questões 16 a 20 estão relacionadas aos seguintes
(d) Nenhumas das alternativas resultados:
2. iv conditions (condições iv)

Dependent variable: vocabulary, verbal knowledge, fund of information
(Variável dependente: vocabulário, conhecimento verbal e fundo de informação)
95% Confidence Interval (IC de 95%)

iv conditions Mean Std. Error Lower Upper
(condições iv) (Média) (Erro Padrão) (Limite Inferior) (Limite Superior)
1.00 4 6 .7 2 5 a 1.908 42 .9 15 50.536

2.00 46.246-’ 2.521 41 .2 10 51.281
3.00 54 .4 25a 2.017 50.398 58.453
a. Evaluated at covariates appeared in the model: age of participants = 43 .0 0 0 0 . depression = 15.3286

(Avaliada nas covariáveis do modelo: idade dos participantes = 43.0000. depressáo = 15,3286)
486 C hristine P. Dancey & John Re'idy

Dependente Variable: vocabulary, verbal knowledge, fund of information
(Variável Dependente: vocabulário, conhecimento verbal e fundo de informação)
Type III Sum of Mean Square Partial Eta

Squares (Soma dos df (Média dos Squared
Source (Fonte) Quadrados do Tipo III) (gl) Quadrados) F sig. (ri2 Parcial)
Corrected Model 1 6 03 .6 44a 4 400.911 4.277 .004 .208
(Modelo Corrigido)
Intercept (Intercepto) 14104.574 1 14104.574 150.459 .000 .698
AGE (IDADE) 102.805 1 102.805 1.097 .299 .017
CESD 114.653 1 114.653 1.223 .273 .018
GROUPS (GRUPOS) 804.984 2 402.492 4.29 4 .018 .117
Error (Erro) 6093.341 65 93.744
Total 179809.000 70
Corrected Total 69
7696.986
(Total Corrigido)
a. R Squared = .208 - Adjusted R Squared — . 160 (a. R2 = 0,208 (R2 Ajustado = 0,160))
ló. O mais alto nível de habilidade verbal é mostrado 18 O tamanho do efeito para a diferença entre os gr.
pelo: pos é aproximadamente:
(a) Grupo 1 (a) 2%
(b) Grupo 2 (b) 12%
(c) Grupo 3 (c) 2 1 %
(d) São todos idênticos (d) 70%
I~. Qual é a afirmação mais adequada? Quanto às di 19. A diferença mais forte entre grupos é entre:
ferenças entre os grupos, é: (a) 1 2 versus 3
(a) Provável que tenham ocorrido apenas por erro (b) 2 + 3 versus 1
amostrai F( 1, 65) = 150,46. p < 0,001. (c) I + 3 versus 2
(b) Provável que tenham ocorrido apenas por erro (d) São todos idênticos
amostrai F( 1. 65) = 1,22, p < 0,273
20. O grupo com o maior intervalo de confiança ^
(c) Improvável que tenham ocorrido apenas por
torno da média do nível de habilidade verbal é:
erro amostrai F(2, 65) =4.29. p < 0 ,0 18
(d) Improvável que tenham ocorrido apenas por (a) Grupo 1
erro amostrai F(4, 65) = 4,28. p < 0,0004 (b) Grupo 2
(c) Grupo 3
(d) São todos idênticos
Referências
ATTREE, E. A. DANCEY. C. P.. KEELING. D., W ILSON C. Cognitive function in people

with chronic illness: inflammatory bowel disease and irritable bowel syndrome. Applied
Neuropsychology, v. 10. n. 2, p. 96-104, 2003.
DU G A RD. P., TO DM AN. J.. Analysis o f pre-test-post-test group designs in educational research.
Educational Psychology, v. 15, n. 2, p. 181-98, 1995.
Introdução à Análise Multivariada
U de Variância (MANOVA)
Até agora todas as análises expostas neste livro, com exceção da análise de fatores, fo
ram análises univariadas. Vamos descrever outra técnica multivariada que é uma extensão da
ANOVA, a análise multivariada de variância. Não é a nossa intenção, neste capítulo, fornecer os
fundamentos da técnica, mas queremos apresentar a vocês uma idéia do que esse método tem
a oferecer.
Explicaremos:
■ o que é a MANOVA
■ as condições subjacentes ao uso da MANOVA, incluindo:
- normalidade multivariada
- homogeneidade das matrizes de variância-covariânda
■ MANOVA com:
- uma variável independente entre participantes e duas variáveis dependentes
- uma variável independente dentre participantes e duas variáveis dependentes
- variáveis independentes com duas condições
■ análises post-hoc para verificar a contribuição de cada variável dependente individual
mente para a diferença multivariada entre as condições da variável independente
14.1 Estatísticas multivariadas
In tr o d u z im o s o c o n c e it o de e s ta tís tic a s m u iiiv a r ia d a s q u a n d o e x p lic a m o s a a n á lise de

fatores. C o m o se d iscu tiu n o C a p ítu lo 12, e sta tístic a s m u ltivariad as sã o e x te n s õ e s d as sim p le s
té c n ic a s u n ivariad as (ou b ivariad as) para situ a ç õ e s n as q u a is te m o s m ais d o qu e u m a variável
d e p e n d en te, a ss im c o m o u m a variá v el in d ep e n d e n te o u m a is. N e s te c a p ítu lo será dada u m a
breve in trod u ção d a a n á lise m u ltivariad a d e v ariân cia (M A N O V A ) p or du as r a zõ es. P rim eiro,
e s s a té c n ic a é u m a e x te n sã o ló g ic a d o s m o d e lo s A N O V A d e sc r ito s n os C a p ítu lo s 9 e 10 (de
fato, a A N O V A e' u m c a so e s p e c ia l da M A N O V A ). S e g u n d o , o S P S S P W u tiliza a M A N O V A
c o m o b a se para sua A N O V A den tre p articip an tes; a ssim , será útil para v o c ê ter alg u m a id éia
d o s p r in c íp io s b á s ic o s d e tais a n á lise s. Is so ta m b ém será útil para o e n te n d im e n to d o s vários
d e ta lh e s das sa íd a s, tanto da M A N O V A q u anto da A N O V A dentre p articip an tes.
14.2 Por que utilizar a análise multivariada de variância?
P o r q ue u tiliz a r u m a a n á lise d e v a riâ n c ia m u ltiv a ria d a q u a n d o tem o s u m a A N O V A ur. -

v a ria d a q u e e' p e rfe ita m e n te a d e q u a d a ? C o m fre q ü ê n c ia , há p e s q u is a s em q u e a A N O \ -
u n iv a ria d a não é a m e lh o r o p ç ã o . P o r e x e m p lo , s u p o n h a m o s q u e v o cê q u e ira c o m p a ra r
b e m -e sta r de d e v o to s ( churchgoers ) e a te u s (atheists). H á u m a v ariáv el in d e p e n d e n te par_
c re n ç a (d ev o to s versus ate u s) e u m a v ariáv el d e p e n d e n te p a ra b e m -e sta r. O q u e q u e re m
d iz e r co m b e m -e sta r e, talv e z o m ais im p o rtan te , c o m o p o d e m o s m e n su rá -lo ? E x istem v á rL
re sp o sta s p o ssív eis p a ra essa q u e stão . O b e m -e s ta r p o d e s e r m e d id o , p o r ex e m p lo , p o r me
de a lg u n s fa to re s, in c lu in d o :
■ o tim ism o so b re o futuro

■ felicid ad e
■ e n tu sia sm o p ela vida
■ satisfação com os re la c io n a m e n to s p e sso ais
Q u al d esses ín d ic e s de b e m -e sta r é m ais a p ro p ria d o ? N ão ex iste re s p o sta c e rta ou erra.:_

para tal q u e stã o : em c e rto se n tid o c ia d e p e n d e de c irc u n s tâ n c ia s p a rtic u la re s d as p e ss o .
e n tre v ista d a s. E n tre ta n to , se você u tiliz a r e sse s ín d ic e s c o m o u m g u ia p a ra o b em -est_ :
p ro v a v e lm e n te irá c o n c lu ir q u e c a d a ín d ic e fo rn e c e um p a d rã o d ife re n te de re su lta d o s. P '
ex em p lo , a lg u é m c o m u m a d o e n ç a term in al não e sta rá o tim ista c o m o fu tu ro , m as pode :e
alto s n ív eis de sa tisfa ç ã o co m o re la c io n a m e n to p esso al e u m alto e n tu sia sm o p ela vida. e n
q u a n to o u tra p esso a p o d e e sta r o tim ista q u an to ao fu tu ro , m as p o d e te r b aix a sa tisfa çã o c<
o re la c io n a m e n to p esso al.
E m v irtu d e d e o b e m -e sta r a p re se n ta r m u itas facetas, o m ais sen sato a se fa z e r é o lh a r pa'_
todos os fatores e o b se rv a r se, no g eral, d ev o to s são d ife re n te s de ateu s. Se c o le ta rm o s u>_.
essa in fo rm aç ão , p o d erem o s ex e c u ta r v ário s testes t p ara v e r q u al g ru p o ap re se n ta altos n í\e
de bem -estar. Se o p ta rm o s p o r tal a b o rd a g e m , p o d em o s e x e c u ta r testes t sep a ra d o s em c a c .
um a das m ed id as de b e m -e sta r c o m o um a variável d e p e n d e n te e verific ar se e x istem q u a is q u r
d iferen ças en tre os d o is g ru p o s (variável in d ep en d e n te). P o d e m o s en tã o o b se rv a r se o p ad rã
g eral d esses testes / in d ica qual g ru p o , se existir, e stá m e lh o r e m term o s de bem -estar.
Você p o de id e n tific a r alg u m p ro b le m a co m e ssa a b o rd a g e m ? O p rin c ip a l p ro b le m a :
d e sc rito no C a p ítu lo 9, q u a n d o d isc u tim o s te s te s post-hoc. Se to m arm o s to d a s e ssa s m edid_
e c o n d u z irm o s testes t se p a ra d o s, a u m e n ta re m o s a taxa de e rro de c o n ju n to e, c o m o com _
q ü ê n c ia , a u m e n ta re m o s a p ro b a b ilid a d e d e c o m e te rm o s e rro s d o T ip o I. L e m b re -se de q_.
q u a n to m ais testes t fo rem a p lic ad o s ao s d ad o s, m ais p ro v áv el será c o m e te rm o s e rro d o T ip
I. O que de fato p re c isa m o s é d e ca p a c id a d e p ara a n a lisa r e sse s ín d ice s (v ariáv eis d e p e n d e '-
tes) em um a única an á lise . F e liz m e n te é aqui q u e a e sta tística m u ltiv ariad a é útil. E la p e rm :',
te s ta r to d o s esses ín d ic e s em um a ú n ica an álise.
14.3 Análise multivariada de variância
Nos C apítulos 9 e J.0, intro d u zim o s a ANOVA. E m todos os exem plos forn ecid o s nesses c_-
pítulos, tínham os u m a ou m ais variáveis in d ep en d e n tes com som ente um a variável dep en d en :,
A M A N O V A perm ite trab alh ar co m m ais de um a variável d ependente. Você pode ver que n e '" :
livro p ro g red im o s de testes co m um a variável in d ep e n d e n te e u m a variável d ep en d en te,
testes com u m a variável dep en d en te e um a variável in dependente ou m ais até a M A N O V A . q e ;
pode ter m ais do que um a vartavel independente e m ais do que um a variável dependente. A ssi:'
eis um a recapitulação acerca de q u an d o se usam os p rincipais testes ex p licad o s até agora:
■ C o m u m a v ariáv el d e p e n d e n te e u m a v ariáv el in d e p e n d e n te c o m d u as c o n d iç õ e s
- teste 1
■ C om u m a variável d ep en d en te e u m a variável in d ep en d en te c o m m ais de d u a s c o n d i
ções (A N O V A de u m fator)
■ C o m u m a variável d ep en d en te e u m a uu in ais variáveis ind ep en d en tes, c a d a u m a com
d u as ou m a is c o n d iç õ e s -A N O V A
■ C o m urna v ariáv el d e p e n d e n te com duai. ou m ais v ariáv eis in d e p e n d e n te s - reg ressão
m ú ltip la
■ C o m d u a s ou m a is v a riá v e is d ep en d en te.v c o m u m a o u m a is v a riá v e is in d e p e n d e n
te s - M A N O V A
Atividade 14.1
Para q u a is d o s se g u in te s e stu d o s a M A N O V A se ria u m a a n á lise a p ro p ria d a ?
(a) U m p e sq u isa d o r , in te re ssa d o n o s e fe ito s d e su p e rlo ta ç ã o e m trens, re a liza u m e stu d o
c o m p a r a n d o o estresse e x p e rim e n ta d o p o r tra b a lh a d o re s q u e via ja m d ia ria m e n te c o m
o d a q u e le s q u e via ja m p o r lazer. O estresse é m e d id o p o r m e io d e u m m o n ito r d e b a
tim e n to s ca rd íac o s n o fim d e ca d a jorn ad a.
(b) U m p e sq u isa d o r q u e r d e sc o b rir se "u m p o u c o d e m a líc ia " é b o m para su a saú d e . Ele
c o m p a ra u m g r u p o q u e te m p e rm issã o para t e r p r a z e r (p . ex., c o m e r ch o co la te , b e be r
u m a cerveja) d u ra n te u m a n o e u m g r u p o q u e se a b sté m d e ta is prazeres. A sa ú d e é
m e d id a p e lo n ú m e ro d e d o e n ç a s n a q u e le a n o e u m e x a m e c o m p le to n ó fin al d o an o .
(c) U m p e sq u isa d o r q u e r d e sc o b rir se h o m e n s o u m u lh e re s sã o m a is a n sio so s q u a n to à
e sta tística . A o s g r u p o s d e e stu d a n te s h o m e n s e m u lh e re s fo ra m d a d o s q u e stio n á rio s
q u e m e d e m vá rio s c o m p o n e n te s d a a n sie d a d e e sta tística (p. ex., m e d o d o s p ro fe sso
res d e e statística, m e d o d e p e rg u n ta r n a s a u la s).
(d) P e sq u isa d o re s e stã o te n ta n d o d e sc o b rir se o u v ir m ú sic a e n q u a n to se e stu d a é b o m .
E le s a c h a m q u e o u v ir m ú sic a clá ssic a é m e lh o r d o q u e o u v ir rock. C o m p a r a m d o is g r u
p o s d e e stu d an te s: u m d e le s o u v e m ú sic a clá ssic a e n q u a n to e stud a, e o o utro, rock.
O s p e sq u isa d o re s q u e re m ver se e xiste d ife re n ç a entre o s d o is g r u p o s e m te rm o s d e
d e s e m p e n h o n o exam e.
14.4 A lógica da MANOVA
A ló g ica da M A N O V A é b a sta n te sim p le s q u a n d o p e n sa d a n o co n te x to d a A N O V A . Na

A N O V A , p a rtilh a m o s a v a ria b ilid a d e d a v ariá v el d e p e n d e n te na q u e p o d e se r a trib u íd a às
variáveis in d e p e n d e n te s e su a s in te ra ç õ e s m ais a q u e p o d e ser a trib u íd a ao erro. O b v ia m e n te ,
na M A N O V A , em v irtu d e de ex istire m m u ita s v ariá v eis, o p ro ce so n ão é tão sim p les. Q u a n
do tem o s m u ita s v a riá v e is d e p e n d e n te s a M A N O V A sim p le sm e n te fo rm a u m a com binação
linear d as m esm a s e u sa e ssa c o m b in a ç ã o n a a n á lise , em vez d as v a riá v eis d e p e n d e n te s in
d iv id u ais. C o m b in a as v a riáv eis d e p e n d e n te s em u m a n o v a variável e a u tiliz a c o m o se fo sse
u m a sim p les v ariáv el d e p e n d e n te n a a n á lise . C o n se q ü e n te m e n te , a a n á lise in fo rm a se ex iste
q u a lq u e r e fe ito d a s v ariáv eis in d e p e n d e n te s n a c o m b in a ç ã o lin e a r d as v a riá v e is d e p e n d e n te s.
O b v ia m e n te , se tra ta de u m a sim p lific a ç ã o , m as e sse n c ia lm e n te é o q u e a M A N O V A faz.
U tilizan d o o exem p lo do b em -estar de d evotos e ateu s, vam os co lo c a r to d o s o s ín d ices de
b em -estar na análise co m o variáveis d ep en d en tes e c o n sid e ra r cren ça um a variável independente.
A M A N O V A co m b in ará as variáveis dep en d en tes e o b terá a variabilidade d a co m b in ação linea

das m esm as. Tal co m b in ação é um a sim ples adição de variáveis d ep en d en tes. P o r exem plo:
B e m -e sta r = F e lic id a d e + E n tu sia sm o + O tim ism o + R e la c io n a m e n to
O u talvez:
B e m -e sta r = (F e lic id a d e x 3) + E n tu sia sm o + (O tim ism o x 2) + R e la c io n a m e n to
P o rta n to , e sta m o s sim p le sm e n te c o m b in a n d o as v a riáv eis d a m a n e ira ilu stra d a . A p a r ;

c o m u m de u m a c o m b in a ç ã o lin e a r de v ariá v eis é a u n ião de e sc o re s d e su b te ste s em li~
q u e stio n á rio , p a ra fo rm a r um e sc o re g lo b al d o teste - p o r e x em p lo , u m q u e stio n á rio sobre :
p erfil de estad o s de h u m o r m ed id o p o r v ário s e sta d o s n eg ativ o s de h u m o r c o m o su b teste- .
so m ad o s p a ra o b te r u m a m ed id a g eral d e d istú rb io s d e hum or. O esc o re total d o q u e stio n a r
é ap en as u m a c o m b in a ç ã o lin ear d o s e sco res d o s su b te stes. A ssim , p o r ex em p lo :
D istú rb io s do h u m o r = esco re de d e p re ssã o + e sc o re d e a n sie d a d e +...
Você ta m b é m e stá fa m ilia riz a d o co m c o m b in a ç õ e s lin e a re s n a re g re ssã o m ú l ti p la ..

e q u açõ es de reg re ssão lin eares in tro d u z id a s no C a p ítu lo 1 1 são e x c e le n tes ex em p lo s de c o r
b in açõ e s lineares:
y = b ,x , + b^x, + b ,x , + ... b kx t+ a
N essa equ ação estam o s prevendo y a p a rtir de u m a co m b in ação lin ear de V is (x ,, x „ ... x.
Você pode. a esse p o n to , e star se p e rg u n tan d o c o m o a M A N O V A d ecid e , a p artir de toda
as p o ssív eis co m b in a ç õ e s d as v ariáveis d ep e n d en tes, q u al é a m ais a p ro p riad a p ara a a n á l f :
E ssa é u m a boa q u estão , ten d o em v ista que. p ara q u a lq u e r c o n ju n to de variáveis dependente
ex istirão in fin itas c o m b in açõ es. E sse n c ia lm en te , a M A N O V A u tiliza u m a c o m b in a ç ã o line_-
de variáveis d ep en d e n te s q u e m a x im iz a as d ifere n ç a s e n tre as v árias co n d iç õ e s das v ariáse ■
in d ep en d e n tes. P ara e n c o n tra r tal c o m b in a ç ã o , a M A N O V A u tiliza v árias re g ra s h eu rístic.
(regras práticas). Q u an d o você o b serv a os resu ltad o s de um a M A N O V A . n o tará que há q u a r
estatísticas d iferen tes calcu la d as de form a a av aliar o valor F. São:
1. X (lam b d a ) d e W ilks
2. T raço de Pi liai
3. T raço de H o ttelin g
4. M aio r raiz d e R oy
E sses testes u tilizam d ife re n te s reg ras p a ra c o m b in a r as variáveis d ep en d en tes, d e fo rm a _

m a x im iz a r as d ife re n ç a s e n tre as c o n d iç õ e s d as V is e. e n tã o , c a lc u la r o v a lo r F. D iscu tirem ■
m ais so b re esse assu n to q u a n d o e x a m in a rm o s os re su lta d o s d a M A N O V A .
Atividade 14.2
Q u a is d a s se g u in te s sã o c o m b in a ç õ e s lin e a re s?
(a) a + b + c i - d - t - e
(b) A x B x C x D x E
(c) (a + b + c + d + e)/2
(d) Extrove rsão + 2 *N e u ro tic ism o - 3 *P sic o lo g ism o
N. de T. Samuel Sianley Wilks (1906-1964) - estalísiico e matemático americano.

N. dcT. K. C. Sreedharan Pillai ( 1920-1985) - estatístico indiano.
N .d e T Harold Hotelling (1 8 9 5 -1 9 7 3 )-jornalista e estatístico americano.
N. de T. S. N. Roy - estatístico indiano.
14.5 Condições da MANOVA
A ssim c o m o q u a lq u e r e s ta tís tic a p a ra m é tric a , e x is te m v árias e x ig ê n c ia s a ss o c ia d a s à

M A N O V A q ue p re c isam se r p re e n c h id a s p a ra q u e a a n álise p o ssa ser válida.
14.5.1 Normalidade multivariada
S e v o cê p e n sa r so b re as c o n d iç õ e s p a ra u so de u m a A N O V A , le m b ra rá que u m a d e las é
a d is trib u iç ã o n o rm al d o s d a d o s. N ão se rá su rp re sa , p o rta n to , se u m a re s triç ã o se m e lh a n te
ex istir p ara a M A N O V A . N o e n tan to , a su p o siç ã o p a ra a M A N O V A é um p o u co m ais c o m p le
xa. N esse c aso , p re c isa m o s a ss e g u ra r q u e e x iste a n o rm a lid a d e m u ltiv a ria d a , isto e', se cad a
u m a d as v ariáv eis d e p e n d e n te s e to d a s as c o m b in a ç õ e s lin e a re s d e ssas v a riáv eis d ev em ser
d istrib u íd a s n o rm a lm e n te .
N a p rática, a n o rm a lid a d e m u ltiv a ria d a é d ifícil de se r o b tid a p o rq u e tem o s d e v e rific a r
as d istrib u iç õ e s de c a d a variável d e p e n d en te e to d a s as p o ssív e is c o m b in a ç õ e s lin e ares p ara
n o s a sse g u ra rm o s de q u e são n o rm a lm e n te d istrib u íd a s. A ssim , re c o m e n d a -se q u e p e lo m e
no s se v erifiq u e a n o rm a lid a d e d a d is trib u iç ã o de c a d a variável d ep en d en te. C a b e o b se rv a r
q u e a M A N O V A é ain d a u m teste v álid o , m e sm o co m m o d e sta s v io la çõ e s nas h ip ó te se s de
n o rm a lid a d e m u ltiv aria d a. p a rtic u la rm e n te q u a n d o os ta m an h o s a m o stra is são ig u a is e ex iste
u m n ú m ero razo áv el de p a rtic ip a n te s em c a d a g ru p o . P o r "ra z o á v e l” e n te n d e m o s q u e. em um
d e lin e a m e n to c o m p le ta m e n te en tre p a rtic ip a n te s, deve h a v e r p elo m e n o s 12 p a rtic ip a n te s p o r
g ru p o e, p ara um c o m p le ta m e n te d e n tre p a rtic ip a n te s, p elo m en o s 22 p a rtic ip a n te s no todo.
D essa fo rm a, faz sen tid o , q u a n d o p la n e ja d o o uso de u m a M A N O V A . a sse g u ra r-se q u e p elo
m en o s essas c o n d iç õ e s este ja m sa tisfe ita s, assim você n ão p re cisa rá se p re o c u p a r m u ito com
p eq u e n a s v io laçõ e s das m esm as.
14.5.2 Homogeneidade da variância - matrizes de covariâncias

A s m a triz e s d e v a riâ n c ia -c o v a riâ n c ia d ev em se r ig u a is - esta é a se g u n d a c o n d iç ã o p ara
o uso d a M A N O V A . C o lo c a n d o d e fo rm a m ais sim p le s, essa s u p o s iç ã o e q u iv a le à da h o
m o g e n e id a d e d a v a riâ n c ia p a ra a e s ta tístic a u n iv a ria d a e x p lic a d a a n te rio rm e n te n este livro.
N ão vam o s te n ta r e x p lic a r isso em m a is d eta lh e s, p o is se ria n e c e ssá rio a p e la r p ara a álg e b ra
m atric ia l, e v o cês, le ito re s, n ã o iriam nos p e rd o a r se fiz é ssem o s isso. E su fic ie n te sa b e r que
essa h ip ó te se é e q u iv a le n te à h o m o g e n e id a d e d e v a riâ n c ia s ap licáv el com o u tro s testes p a ra
m étrico s. S e h o u v e r in te re sse em c o n h e c e r m a is so b re o a ssu n to , e x iste m b o a s e x p lic a ç õ e s
nos tex to s lista d o s n o final d o cap ítu lo . P o r o ra, é o su ficien te.
E m g eral, q u a n d o h o u v e r ta m a n h o s d e a m o stra s ig u a is, essa su p o siç ã o n ão se rá u m g ra n
de p ro b le m a . N o e n ta n to , se as a m o stra s n ão fo re m d o m esm o ta m a n h o , e n tã o é n e c e ss á rio
q ue se co n su lte m tex to s m ais a v a n çad o s p a ra o rien ta ç ã o .
E xiste um teste para a sup o sição de h o m o g en eid ad e das m atrizes de v ariâncias-covariâncias,
que pode ser executado no SPSSPW , d en o m in ad o teste M de B ox. Se esse teste for significativo
[p < 0,005), há um a vio lação da condição, e devem ser co n sid erad as as várias o pções p ara asse
gu rar que a M A N O V A é confiável. N a prática, en tretan to , o teste M de B ox é co n serv ad o r - ele
é m ais útil quando você tiver am ostras p eq u en as e de tam an h o s diferentes.
\ ¡1 EXEMPLO
*
S u p o n h a m o s q u e fiz em o s o e stu d o so b re b e m -e sta r d e sc rito a n te rio rm e n te n este c a p í
tulo. m as que d ec id im o s u tiliz ar a p e n as d o is fato res p ara m en su rá -lo , felicid ad e e o tim ism o .
Já o b tiv em o s o s d a d o s a p ro p ria d o s (T ab ela 14.1) de 12 p e ss o a s q u e vão re g u la rm e n te à
ig reja (d ev o to s) e d e 12 q u e n ão vão (ateu s).
A n tes de e x e c u ta rm o s a M A N O V A , p re c isa m o s e x a m in a r as e s ta tístic a s d e sc ritiv a s
p a ra nos a ss e g u ra rm o s d e q u e a s c o n d iç õ e s te'cnicas n ão e stã o se n d o v io la d a s. D ev em o s
e sta b e le c e r in ic ia lm e n te q u e os d ad o s p a ra c a d a variáv el d e p e n d e n te d e c a d a a m o stra estão
d is trib u íd o s n o rm a lm e n te . P ara isso , p o d e m o s so lic ita r ao S P S S P W q u e p ro d u z a d ia g ra
m as de c a ix a e b ig o d e s, h is to g ra m a s e d ia g ra m a s d e c a u le e fo lhas. O d ia g ra m a d e ca ix a e
b ig o d es d o s d a d o s d a T ab ela 14 . 1 é a p re se n ta d o n a F ig u ra 14.1
T ab e la 14.1 D ados para o experim ento do bem -estar
Devotos Ateus
Felicidade Otimismo Felicidade Otimismo

4.00 3,00 5.00 3.00
5.00 4.00 4.00 4.00
5.00 8.00 8.1«] 5.00
6.00 7.00 9.00 4.00
6.00 6.00 7.00 2.00
6,00 5.00 6.00 3.00
7.00 6.00 7.00 4.00
7.00 6,00 5.00 3.00
7.00 5.00 6.00 2.00
8.00 5.00 4.00 4.00
8.00 7.00 5.00 5.00
9.00 4.00 6.00 3.00
X = 6.50 X = 5.5 X = 6.00 X = 3,50
DP = 1.45 DP = 1.45 DP = 1.54 DP = 1.00
IC,JV. = 5,58 - 7.42 IC.„ = 4 .5 8 -6 .4 2 IC„., = 5,02 - 6.98 IC*,. = 2 ,8 6 -4 ,1 4
| Felicidade
□ Otimismo
12 12 12 12
Devotos Ateus
Crença
D iagram a d e ca.xa e b igodes para o índice d e felicidade e otim ism o de dev o to s e

Figura 14.1
ateus.
Você p ode ver. a p a rtir d esse d ia g ra m a de c a ix a e b ig o d es, q u e, p a ra as d u a s v a riáv eis

d e p e n d e n te s n as d u a s c o n d iç õ e s, as d is trib u iç õ e s são a p ro x im a d a m e n te n o rm a is. E sse s
re s u lta d o s , ju n to co m o fato d e q u e te m o s u m m e s m o n ú m e ro d e p a rtic ip a n te s em c a d a
c o n d içã o , sig n ifica que p o d e m o s c o n tin u a r co m a M A N O V A co m a lg u m a co n fia n ç a d e que
n ão e sta m o s c o m e te n d o sé rias v io la ç õ e s d as su p o siçõ e s d a n o rm a lid a d e m u ltiv ariad a.
A se g u n d a h ip ó tese , a d a h o m o g e n e id a d e d as m a triz e s de v a riâ n c ia -c o v a riâ n c ia, é v e ri
ficad a o b se rv a n d o -se a sa íd a da M A N O V A . A ssim , p o d e m o s c o n tin u a r n o ssa an álise .
A n tes de re a liz a rm o s a M A N O V A , é c o n v e n ie n te o lh a rm o s os d ia g ra m a s d as m éd ia s
e d o s in te rv a lo s de 9 5 c/c d e c o n fia n ç a em to rn o d e la s p a ra c a d a v ariáv el d e p e n d e n te em
s e p a ra d o (v eja F ig u ra 14.2).
Atividade 14.3
O q u e os diagram as d e barras d e erro da Figura 14.2 su gerem ?
A F ig u ra 14.2 su g e re q u e e x iste u m a d ife re n ç a real e n tre os d o is g ru p o s em te rm o s d e o ti

m ism o , m as não n e c e ss a ria m e n te em te rm o s d e fe licid ad e . Você deve se r ca p az de c o n sta ta r
qu e não e x iste so b re p o siç ã o no in te rv alo de c o n fia n ç a de 95% p a ra o O tim is m o , p o ré m ex iste
u m a g ran d e so b re p o siç ã o p a ra a fe lic id a d e .
Felicidade
I
□ Otim ism o
12 12
Ateus
Crença
M é d ia s e IC d e 9 5 % e m to rn o d a s m é d ia s para o s ín d ic e s d e fe lic id a d e e o t im is m o de
Figura 14.2
d e v o to s e ateus.
Q u a n d o e x e c u ta m o s u m a M A N O V A co m e ss e s d a d o s, o b te m o s a se g u in te sa íd a c
SPSSPW :
MODELO LINEAR GERAL
W íthin-Subjects Factors (Fator dentre Assuntos)
Value Label
(Valor do Rótulo) N
BELIEF 1.00 Churchgoers 12
(CRENÇA) 200 (Devotos)
12
Atheists (Ateus)
Box's Test of Equality of Covariance M atrices3

(Teste de Box da Igualdade das Matrizes de Covariancia3)
Box's M (M de Box) 1.508

F .453
df 1 (gli) 3
dg2 (gl2) 8712 0.00 0
Sig. .715
Tests the null hyphotesis that the observed covariance matrices

of the dependent variables are equal across groups.
(Testa a hipótese nula de que as matrizes observadas da
covariancia das variáveis dependentes são iguais entre os grupos)
a. Design: Intercept + Belief (a. Projeto: Intercepto + Crença)
Sig — Significancia
M ultivariate Tests6 (Testes Multivariadosb)
Hypothesis df Error df
Effect (Efeito) Value (Valor) F (gl da Hipótese) (gl do Erro) Sig.
Intercept Pillai's Trace (Traço de Pillai) .969 327.224a 2.000 21.000 .000
(Intercepto)
Wilks' Lambda (Lambda de Wilks) .031 327.224a 2.000 21.000 .000
Hotelling's Trace (Traço de Hotelling) 31.164 327.224a 2.000 21.000 .000
Roy's Largest Root (Maior Raiz de Roy) 31.164 327.224a 2.000 21.000 .000
Belief Pillai's Trace (Traço de Pillai) .418 7 .547a 2.000 21.000 .003
(Crença)
Wilks' Lambda (Lambda de Wilks) .582 7.547a 2.000 21.000 .003
Hotelling's Trace (Traço de Hotelling) .719 7.547a 2.000 21.000 .003
Roy's Largest Root (Maior Raiz de Roy .719 7.547a 2.000 21.000 .003

b. Design: Intercept + Belief (b. Projeto: Intercepto - Crença)
Levene's Test of Equality of Error Variances3

(Teste de Levene da Igualdade das Variâncias dos Erros3)
F df 1 (gli) df2 (gl2) Sig.

Happiness
(Felicidade) .000 1 22 1.000
Optimism
1.571 1 22 .223
(Otimismo)
Tests the null hypothesis that the error variance of the dependent variables is equal
across groups. (Testa . nu a de que a variância dos erros da variável
dependente é igual entre os grupos.)
a. Design: Intercept - Belief (a. Projeto: intercepto + Crença)
Testei univariados
Test of W ithin-Subjects Effects (Teste dos Efeitos dentre Assuntos) /
Type III Mean

Sum of Squares Square
Dependent Variable (Soma dos Qua df (Média dos
Source (Fonte) (Variável Dependente) drados do tipo III) (gl) Quadrados) F Sig.
Corrected Model Happiness (Felicidade) 1.500* 1 1.500 .673 .421

(Modelo Corrigido) Optimism (Otimismo) 2 4 .0 0 0 b 1 24.000 15.529 .001
Intercept Happiness (Felicidade) 937.500 1 937.50 0 420.918 .000

(Intercepto) Optimism (Otimismo) 486.00 0 1 4 8 6.00 0 314.471 .000
Belief Happiness (Felicidade) 1.500 1 1.500 .673 .421

(Crença) Optimism (Otimismo) 24 .0 00 1 24.000 15.529 .001
Happiness (Felicidade) 49 .0 00 22 2.227

Error
Optimism (Otimismo) 34.000 22 1.545
Happiness (Felicidade) 988.000 24

Total (Total)
Optimism (Otimismo) 544.000 24
Corrected Total Happiness (Felicidade) 50.500 23

(Total Corrigido) Optimism (Otimismo) 58.000 23
a. R2 = .030 (Adjusted R2 = -.0 1 4 ) (a. R2 - 0,030 |R2 Ajustado = -0,0141)

b. R2 = .414 (Adjusted R2 = .387) (b. R2 0.414 [R2 ajustado = 0,387])
A p rim e ira p a rte d a s a íd a fo rn e c e o te ste d e u m a su p o s iç ã o já m e n c io n a d a a n te s. É t

te ste d a h o m o g e n e id a d e d a s m a triz e s d e v a riâ n c ia -c o v a riâ n c ia (M d e B o x ). S e h o u v e r un:
valo r/? a ss o c ia d o d e m e n o s d o q u e 0 ,0 5 . te re m o s v io la ç õ e s d a s u p o s iç ã o de h o m o g e n e id a d e
d a s m a triz e s d e v a riâ n c ia -c o v a riâ n c ia . D a d o q u e e sse te ste , n a s a íd a re fe rid a , a p re s e n to u
u m v a lo r p m a io r d o q u e 0 ,0 5 , p o d e m o s c o n s id e ra r q u e a c o n d iç ã o n ão fo i v io la d a . Se a
c o n d iç ã o fo r v io la d a , e os ta m a n h o s d a s a m o s tra s , d ife re n te s, d e v e -se u tiliz a r u m a an álise
a lte rn a tiv a e ta lv e z c o n s u lta r u m d o s tex to s re c o m e n d a d o s n o fim d e ste c a p ítu lo .
O re s ta n te d a sa íd a re la c io n a -s e c o m a a n á lise v e rd a d e ira m e n te . P o d e -s e v e r q u e c
SPSSPYV fo rn e c e tan to u m a a n á lise u n iv a ria d a q u a n to m u ltiv a ria d a p a ra as v ariá v e is in d e
p e n d e n te s e as v ariá v eis d e p e n d e n te s. A s e sta tístic a s m u ltiv a ria d a s n o s in fo rm a m d o s efeito^
da v ariáv el in d e p e n d e n te em u m a c o m b in a ç ã o lin e a r d as v a riá v e is d e p e n d e n te s, e n q u a n to a^
e s ta tís tic a s u n iv a ria d a s nos a p re s e n ta m o s re s u lta d o s d e u m a A N O V A da v ariáv el in d e p e n
d e n te c o m c a d a v ariá v e l d e p e n d e n te se p a ra d a m e n te .
14.6 Qual o valor F?
C o m o j á e x p lic a m o s , o S P S S P W fo rn e c e v ário s te ste s m u itiv a ria d o s d ife re n te s, isto e.

u tiliza v árias m a n e ira s d ife re n te s de c o m b in a r as v a riáv eis d e p e n d e n te s e c a lc u la r os valores
F. E sses testes são;
■ A. de W ilks
■ T raço de P illai
■ T raço de H otel ling
■ M a io r raiz de R oy
N o rm alm en te , você v erific a rá q u e e sse s d ife re n te s testes re su lta rã o n o m e sm o v alo r de F

o u valores pelo m e n o s b a sta n te se m e lh an tes. D e ssa fo rm a, n ão im p o rta m u ito q u al d eles será
u tiliz a d o . E n tre ta n to , se e m u m a d e te rm in a d a a n á lise se o b tiv e re m v alo res d e F d if e re n te '
d esses testes, você p re c isa rá d e c id ir q u al d e les u tilizará. M u itas v ezes, n ão e x iste u m c o n se n
so so b re o teste m ais ap ro p ria d o . É c o m p lic a d o : em g era l o teste m ais a p ro p ria d o d e p e n d e dc
tip o d e d a d o s a n a lisa d o s. E n tre ta n to , su g e rim o s o c o n se lh o de T a b a c h n ic k e F id ell (1 997).
q u e su g e re m o uso d o X d e W ilks. o m ais fre q ü e n te m e n te u tilizad o .
O v a lo r F d o X d e W ilk s im p re ss o na s a íd a re fe rid a m o stra q u e as v a riá v e is d e p e n d e n te s
c o m b in a d a s d is tin g u e m c o m s u c e s so os d o is g ru p o s d e c re n ç a . Se a h ip ó te s e n u la é v e r
d a d e ira , a p ro b a b ilid a d e d e se e n c o n tr a r u m a g ra n d e d if e re n ç a m u ltiv a ria d a e n tre o s d ois
g ru p o s, c o m o a o b se rv a d a n o s d a d o s, é tã o p e q u e n a q u e é im p ro v á v e l q u e te n h a se o rig in a d o
ap e n a s p o r e rro a m o s tra i. Q u a n d o tra ta m o s d e d ife re n ç a m u ltiv a ria d a , q u e re m o s n o s re ferir
s im p le s m e n te a u m a d ife re n ç a e m te rm o s d e c o m b in a ç ã o lin e a r d a s v a riáv e is d e p e n d e n te s
C o n s e q ü e n te m e n te , se c o n s id e ra m o s q u e e ss a s v a riá v e is d e p e n d e n te s m e d e m b e m -e sta r,
c o n c lu ire m o s q u e h á u m a d ife re n ç a e n tre o b e m -e s ta r d o s d e v o to s e o d o s ate u s.
Atividade 14.4
Q u a l d o s se g u in te s testes representa u m m é to d o d e c a lc u la r o s valo re s m u ltiv a ria d o s de
F n o S P S S P W ?
(a) Traço d e H o tte lin g
(b) N o ta d e P hil
(c) L ig a ç ã o m a is fraca d e Seth
(d) X. ( l a m b d a ) d e W ilk s
(e) y ( g a m a ) d e H a y le y
(f) Traço d e P illai
(g) C a m in h o d e C ro ssro a d
(h) M a io r raiz d e R oy
14.7 Post-hoc. análise de variáveis dependentes individualmente
A p a re c e na sa íd a do S P S S P W q u e te m o s u m a co n sid e rá v e l d ife re n ç a m u ltiv a riad a en lre

os d o is g ru p o s d e c re n ç a s . O q u e isso sig n ific a d e fa to ? O p ro b le m a q u e e n fre n ta m o s em
re s p o n d e r e ss a q u e stã o a ss e m e lh a -se ao e n fre n ta d o n a A N O V A q u a n d o a c h a m o s o e fe ito
p rin cip al de u m a V I co m três ou m ais c o n d içõ e s. A A N O V A sim p le sm e n te in fo rm a q u e ex iste
um a d ife re n ç a d e v id a à V I . N a se q ü ê n c ia , é n e c e ss á rio e x e c u ta r u m a a n álise post-hoc (o u a
p rio ri) p a ra d e s c o b rir o n d e e stá a d ife re n ç a . N a a n á lise m u ltiv a ria d a c o m m ais d o q u e u m a
variáv el d e p e n d e n te , u m a v ez e n c o n tra d a u m a d ife re n ç a m u ltiv a ria d a , é p re c iso d e s c o b rir
q u a is v ariáv eis d e p e n d e n te s e stã o c o n trib u in d o p a ra e ssa d ife re n ç a . P re c isa m o s fa z e r isso
p o rq u e é p ro v áv el, e sp e c ia lm e n te se tiv e rm o s m u ita s v ariá v eis d e p e n d e n te s, q u e n em to d as
e ste ja m co n trib u in d o p a ra a d ife re n ç a g lo b a l o b serv a d a .
P a ra p o d e rm o s d e te r m in a r q u a is v a riá v e is d e p e n d e n te s c o n trib u e m p a ra e sse e fe ito ,
p re c isa m o s re a liz a r u m a a n á lise post-hoc u n iv a ria d a nas v a riáv eis d e p e n d e n te s in d iv id u a is.
C o m o o co rreu co m a an á lise post-hoc d a A N O V A , e x iste m a lg u m a s fo rm a s de re a liz a r essas
c o m p a ra ç õ e s, e a p re fe rê n c ia p o r e ssa s té c n ic a s v aria e n tre os a u to re s. Se o b tiv e rm o s u m a
d ife re n ç a p ara um d e lin e a m e n to d e d o is g ru p o s, c o m o é o caso , u m a a b o rd a g e m re c o m e n
dad a p o r S tev en s ( 199 7 ) e' sim p le sm e n te re a liz a r testes t u n iv a ria d o s e a ju sta r o v a lo r a p a ra
le v a re m co n ta o n ú m e ro de an á lise s q u e se rã o feitas. Tal aju ste do v alo r a to rn a -se n ec e ssá rio
p a ra c o n tro la r a ta x a de e rro d e c o n ju n to . Você e n fre n to u e sse p ro b le m a n o s C a p ítu lo s 9 e 10.
E ssa será a a b o rd a g e m q u e a d o ta re m o s: e n tre ta n to , p ara u m a d is c u ssã o m ais a p ro fu n d a d a do
assu n to , v o cê dev e c o n su lta r os tex to s su g e rid o s n o final d o cap ítu lo .
A a b o rd ag em re c o m e n d a d a p o r S tev en s (1 9 9 7 ) é e sta b e le c e r o v alo r g lo b al de a (fix am o s
o n o sso em 5 % ) e d iv id i-lo p e lo n ú m e ro d e c o m p a ra ç õ e s rea liz a d as. T em os d u as v ariáv eis d e
p e n d e n te s, a ssim p re c isa m o s de d o is te ste s t. P o rta n to , n o sso a p a ra c a d a te ste t d ev e rá ser:
0,05 - 2 = 0 ,0 2 5
E n tão , re a liz a m o s os teste s t n as v a riá v eis d e p e n d e n te s fe lic id a d e e o tim ism o em s e p a

rad o , co m c re n ç a sen d o a v ariáv el in d e p en d e n te e m c a d a c a so e e sta b e le c e n d o -se o v a lo r de
a p a ra c a d a teste c o m o 0 ,0 2 5 . Se e n c o n tra rm o s as p ro b a b ilid a d e s a sso c ia d a s com os testes t
p ró x im o ao nível 0 ,0 2 5 , p o d e m o s ter relativ a c o n fia n ç a d e q u e n o ssa d e sc o b e rta o c o rre u p o r
erro am o strai.
Se tiv erm o s c in c o v a riáv eis d e p e n d e n te s serão n e c e ssá rio s c in c o teste s t (u m p a ra cac_

variável d e p e n d e n te ). N e sse caso , d e v e m o s d iv id ir o v a lo r de 5% p o r 5:
0 ,0 5 -5 = 0 .0 1
S erá p reciso e sta b e le c e r o valo r alfa de c a d a te ste í e m 1% (le m b re -se de q u e 5 % é ig u a

a u m a p ro b a b ilid a d e d e 0 ,0 5 e 1% e q u iv a le n te a 0 ,0 1 ).
A n á lise da a m o s tr a
Q u an d o co n d u z im o s u m a a n á lise post-hoc nas v a riáv eis d ep e n d e n te s, o b te m o s os seg u in

tes resu ltad o s:
TESTE T

Std. Error
Mean Standard Deviation Mean (Erro Pa
BELIEF (Crença) N (Média) (Desvio Padrão) drão da Média)
Happiness Chruchgoers
12 6.5000 1.44600 0.41742
(Felicidade) (Devotos)
Atheists (Ateus) 12 6.0000 1.53741 0.44381
Optimism Chruchgoers
12 5.5000 1.44600 0.41742
(Otimismo) (Devotos)
Atheists (Ateus) 12 3.5000 1.00000 0.28 86 8

Levene’s Test
for Equality
of Variances
(Teste de Levene
para a igualda
de de variâncias) T-test for Equality of Means (Teste t para a Igualdade de Médias)
95% Confidence Inter.;

Sig. of the Difference (1C
(2-tai Mean Std. Error de 95% para a Diferença
led) Difference Difference
(Sig. (Diferença (Erro padrão Lower (Limite Upper (Lin- -,
F Sig t DF (gl) Bilateral) das Médias) da Diferença) Inferior) Supe- :
Happiness Equal variances as-
(Felicidade) sumed (Igualdade de 0.000 1.000 0.821 22 0.421 0.50000 0.60927 -0.76355 1.76355 j
variâncias assumida)
Equal variances not
assumed (Igualdadede 0.821 21.918 0.421 0.50000 0.60927 -0.76383 1.76383
variâncias não-assumida)
Optimism Equal variances as
(Otimismo) sumed (Igualdade de 1.571 0.223 3.941 22 0.001 2.00000 0.50752 0.94747 3.05253
Equal variances not
assumed (Igualdade de 3.941 19.563 0.001 2.00000 0.50752 0.93982 3.06018
Você p o d e o b serv ar, a p a rtir d e sse s testes r. q u e so m e n te a variável d e p e n d e n te o tim is m :

tem u m a p ro b a b ilid a d e a sso c ia d a de m e n o s d o q u e 2.5% de te r o c o rrid o p o r e rro am o stra'
D ev em o s, e n tão , c o n c lu ir q u e os d o is g ru p o s (d ev o to s e ate u s) d ife re m so m e n te em term o s dc
seu nível d e o tim ism o . S e v am o s c o n sid e ra r v álid a essa m e d id a d o n ível de b e m -esta r, entã
p are c e h av er u m a d ife re n ç a e n tre os dois g ru p o s em te rm o s de b em -esta r. E sse p o n to indica
q u e, m e s m o c o n d u z in d o u m a a n á lise b a sta n te so fistic a d a so b re o s d a d o s, a in d a p re c isa m o s

re la ta r n o sso s re su lta d o s p ara o m u n d o rea l: p re c isa m o s ju lg a r se o o tim ism o p o r si só é um
in d ic a tiv o su fic ie n te d e b e m -esta r. Se a re s p o sta a tal q u e stã o fo r n e g a tiv a, a n o ssa a n á lise
su g e re q ue, no g era l, n ão ex iste d ife re n ç a e n tre as d u a s c o m u n id a d e s a lé m d a q u e p o d e ser
atrib u íd a ao o tim ism o .
Você deve n o ta r q u e os v a lo re s F u n iv a ria d o s re la ta d o s nas a n á lise s o rig in a is eq u iv alem
aos do s testes t (os v a lo re s F são sim p le sm e n te v alo re s t e lev a d o s ao q u a d ra d o ). Você pode,
p o rta n to , u tiliz a r isso p a ra e sta b e le c e r q u a is variáveis dependentes e stão co n trib u in d o p ara os
efe ito s m u ltiv ariad o s, m as ain d a deve u tiliz a r o v a lo r a ao n ível de 0 ,0 2 5 .
14.8 Variáveis dependentes correlacionadas
O p ro ced im en to post-hoc acim a é reco m e n d a d o q u an d o tem os v ariáv eis d ep en d e n tes que

não estão co rrelacio n ad as entre si. O s p ro b lem as co m eçam , no entanto, q u an to estas estão co rre
lacionadas. A razão pela qual tal p ro b lem a surge não é difícil de explicar. Q u an d o o b tem o s um a
d iferença m u ltivariad a nas variáveis d ep en d en tes p recisam o s a v aliar a co n trib u ição de cad a um a
no efeito global (com o feito a pouco). S e tiv erm o s variáveis n ão -co rrelacio n ad as, não ex iste so
breposição na contrib u ição de cad a um a p ara a co m b in ação linear d as m esm as. E m tal situação,
os testes u n iv ariad o s fo rn ecem a v erd ad eira co n trib u içã o de cad a v ariáv el d ep e n d en te p a ra a
diferen ça total. U m a an alo g ia sim ples p o d e au x iliar no e n ten d im en to d o q u e estam o s tentando
explicar. S uponha que você ache óleo e água em um recip ien te e deseje sab er o q u an to de cad a
líq uido tem em m ãos. Se você co lo ca r isso e m u m a p ro v eta, irá v erificar que a água e o ó leo não
se m istu ram . D essa fo rm a, p o d erá afirm a r, o lh an d o apenas, o q u an to c a d a líq u id o e stá c o n tri
buindo p ara o total da p ro v eta (v eja Figura 14.3 (a)). Isso se a ssem elh a ao caso em que se tem
variáveis d ep en d en tes n ão -co rrelacio n ad as: em virtude de não se m istu rarem p o d em o s in fo rm ar
a co n trib u ição de cad a u m a das v ariáveis com a o b serv ação dos testes / individuais.
Q u a n d o te m o s v ariá v eis d e p e n d e n te s c o rre la c io n a d a s, e n tre ta n to , é c o m o se fo sse um a
m istu ra d e á lco o l e á g u a em v ez d e á g u a e ó leo . Se v o cê n ão c o n h e c e as q u a n tid a d e s d e á l
co ol e de ág u a na p ro v e ta , n ã o p o d e rá d izer, a p e n a s o lh a n d o , o q u a n to ex iste de c a d a u m dos
líq u id o s p o rq u e eles e stã o p e rfe ita m e n te m istu ra d o s (F ig u ra 14.3 (b)). P ara p o d e r c a lc u la r o
q u a n to h á de c a d a líq u id o , é n e c e ssá rio u tiliz a r a lg u m p ro c e d im e n to c o m p le x o p a ra a s e p a
ra ç ã o d o s m e s m o s (p. ex ., d e stila ç ã o ). O m e s m o se a p lic a q u a n d o as v a riáv eis d e p e n d e n te s
são c o rre la c io n a d a s. N ão p o d em o s in fo rm ar, a p e n as o lh a n d o p ara os te ste s t, q u al se rá a c o n
trib u ição de c a d a variáv el d e p e n d e n te , p o is e stã o m istu ra d a s, assim c o m o o álcool e a água.
Ilu stra ç ã o d e c o m o (a) á g u a e ó leo e (b) álco o l e ág u a se m istu ra m ou não.

Figura 14.3
P o rta n to , p a ra c a lc u la r a c o n trib u iç ã o re la tiv a d e c a d a urna d é la s, se rá n e c e ss á ria a u tiliz a c l

de p ro c e d im e n to s m ais c o m p lic a d o s p a ra se p a ra r c a d a variável d e p e n d e n te (p. ex ., urna u r _
lise d e sc e n d e n te p a sso -a -p a sso ). T ais a n á lise s estã o além d o s o b je tiv o s d e urna introducá.
M A N O V A . m a s o s tex to s rec o m e n d a d o s fo rn e c e m u m a b o a d is c u ssã o so b re o a ssu n to . N osí
p ro p ó sito aq u i e a p e n a s d e sta c a r o p ro b lem a , p o is a ssim você sab e d e su a ex istê n c ia .
A s variáveis d e p e n d e n te s d o n o sso e x e m p lo n ão e stã o co rre la c io n a d a s. A ssim , p odem
u tili/a r o s testes 1 p ara c a lc u la r a c o n trib u iç ã o rela tiv a de c a d a u m a p a ra as v ariáv eis dep..
den tes c o m b in ad a s.
C0RRELACÕES
_________ ¿____
Correlations <Co"eiações:
Happiness Optimism
(Felicidade) (Otimismo)
Happiness Pearson Correlation
1 0.166
: eiicidade> (Correlação de Pearson)
Sig. (2-tailed) (Sig Bilateral) 0.437
N 24 24
Optimism Pearson Correlation 0.16 6 1
(Otimismo) (Correlação de Pearson)
Sig. (2-tailed) (Sig. Bilateral) 0.437
N 24 24
14.9 Como relatar essas análises
O re lató rio p o d e se r assim :
Diagramas de caixa e bigodes mostraram que os dados para cada variável dependente em c a _ _
condição da variável independente são aproxim adam ente distribuidos de forma norm al, assir
dado que os tamanhos amostrais são iguais, podemos estar razoavelmente confiantes de que nZ
existem maiores violações das hipóteses de normalidade multivariada. O teste M de Box indio _
que não existe violação da hipótese de homogeneidade das matrizes de variância-eovariância. C
diagramas de barras de erro mostraram que existem grandes diferenças, sem sobreposição dos IC-
de 95%, entre os dois grupos em termos do otimismo, mas em termos de felicidade a diferença 1
relativamente pequena e está associada a uma grande sobreposição dos lCs de 959? .
Os dados sobre bem -estar foram analisados por meio de uma MANOVA de um fator (devor -
versus ateus) com os escores de otim ism o e felicidade como variáveis dependentes. As análise-
revelaram que existe uma diferença multivariada entre os dois grupos improvável de ter ocorric
apenas por erro amostrai F(2, 21) = 7,75: p = 0,003; X de W ilks = 0,582). Como as duas variávei -
dependentes não estavam significativam ente correlacionadas 0 = 0 , 17; n = 24; p = 0.44). teste-
/ independentes foram utilizados em cada variável dependente em separado. Essas análises mos
traram que existe uma diferença entre os dois grupos em termos de otim ism o que não pode ser
atribuída ao erro amostrai (t(22) = 3,94; p = 0,001), mas essa diferença não ocorreu em termos do
item felicidade (t(22) = 0,82; p = 0.42).
N o ta : V ocê p o d e , se q u is e r, s im p le sm e n te a p re s e n ta r o s d e ta lh e s d o F u n iv a ria d o em
vez d o s testes t q u a n d o re la ta r as a n á lise s d as v ariá v e is d e p e n d e n te s in d iv id u a is. R e la ta r os
v alo res F u n iv ariad o s é a m e lh o r a b o rd a g e m q u a n d o tiv e rm o s m ais d o q u e três c o n d iç õ e s nas
variáveis in d ep en d e n tes.
resistência mental de jogadores de rúgbi
E m um e stu d o de G o lb y e S h e a rd (2 0 0 4 ), a re s istê n c ia m en tal e o rig o r d o s jo g a d o re s d a lig a
de rú g b i fo ram m e n s u ra d o s p o r m eio de q u e stio n á rio s. A re sistê n c ia m en tal foi m ed id a co m o In
v en tário d e D e se m p e n h o P sic o ló g ic o (ID P : L o eh r, 1986). E ssa e sc a la m e d e sete c o m p o n e n te s da
re s istê n c ia m e n ta l, in c lu in d o a u to c o n fia n ç a , c o n tro le d a e n e rg ia n e g a tiv a (m a n e ja n d o e m o ç õ e s
n eg ativ as), c o n tro le d a a te n ç ã o (m a n te n d o o fo co ), v is u a liz a ç ã o e c o n tro le de im ag e n s (u tiliza n d o
im ag en s p o sitiv a s), m o tiv a çã o , e n e rg ia p o sitiv a (sa tisfa ç ã o ) e c o n tro le da a titu d e (m a n te n d o u m a
atitu d e positiva). O rig o r foi m e d id o co m M ad d i e K h o sh a b a (2 0 0 1 ), p o r m eio d o L e v a n ta m e n to de
P o n to s de V ista P esso ais lii- R . q u e a n a lisa três co m p o n en te s: c o m p ro m isso , c o n tro le e d esafio . O
e stu d o en volve a a d m in istra ç ão de q u estio n ário s aos jo g a d o re s q u e rep re sen ta m três níveis d iferen tes
na liga d e rúgbi. E sses níveis in c lu e m jo g a d o re s in te rn a c io n a is, jo g a d o re s d a su p erlig a e jo g a d o re s
d a p rim eira d ivisão . S ão os três níveis m ais altos d a liga de rú g b i da G rã -B re tan h a . O s p e sq u isa d o re s
ten tav am v erificar se ex istem d ifere n ç a s n a re s istê n c ia m e n ta l e n o rig o r en tre os jo g a d o re s re p re se n
ta n tes d o s três níveis da liga. P ara e x a m in a r tais d ife re n ç a s, fe z -se u m a M A N O V A seg u id a de u m a
A N O V A un iv ariad a. D e sc o b riu -se q u e ex iste u m a d ife re n ç a m u ltiv aria d a sig n ific a tiv a e n tre os três
níveis d a lig a de rú g b i. O s a u to re s re la ta ra m u m X de W ilk s d e 0 ,4 0 e u m v a lo r F de 5 ,9 8 co m p <
0 ,001. T am b ém e n c o n tra ra m u m r f de 0 ,3 7 , su g e rin d o q u e 37 % d a v a ria ç ã o n a c o m b in a ç ã o lin e a r
d as variáveis d ep e n d e n te s p o d e m se r a trib u íd o s ao nível a q u e p e rte n c e m o s jo g a d o re s. Isso é um
e feito b astan te alto p ara tal tip o de p e sq u isa p sic o ló g ic a . O s p e sq u isa d o re s tam b é m a p re se n taram os
re su lta d o s da A N O V A : ex istia m d ife re n ç a s sig n ific ativ a s e n tre os g ru p o s em te rm o s dos três tip o s
de fato res d e rig o r (c o m p ro m isso , c o n tro le e d e sa fio ) e d o is dos fa to re s re la c io n a d o s à re sistên c ia
m ental (c o n tro le da en e rg ia n e g a tiv a e c o n tro le da aten ç ão ). O s a u to res n o taram q u e ex istia m c o r
rela ç õ e s m o d e ra d a s e n tre a lg u m a s d a s v a riáv eis d e p e n d e n te s e, assim , ta m b é m e x e c u ta ra m u m a
a n álise d e sc e n d e n te p a ss o -a -p a ss o (v er S te p h e n s, 1997). C o m o su g e rim o s an te s, tal a n á lise está
além d o s o b jetiv o s d esse tex to , m as v o c ê p o d e c o n su lta r livros m ais a v a n çad o s se tiv er in teresse em
sab er m ais sobre o assunto .
SPSSPW: execução da MANOVA com uma variável

independente entre participantes e duas variáveis dependentes
P a ra e x e c u ta r u m a M A N O V A c o m os d a d o s so b re fe lic id a d e e o tim ism o , v o cê p re c i'..

d e te rm in a r três v ariáv eis n a ja n e la d e d ad o s. A p rim e ira é a v ariáv el d e a g ru p a m e n to (v ariá\ e
in d e p e n d e n te ) e as d u a s restan te s c o n te rã o os ín d ic e s d e fe lic id a d e e o tim ism o d e c a d a p a rti
c ip an te (v ariáv eis d e p e n d e n te s).
U m a v e z d ig ita d o s o s d a d o s , v o c ê d e v e c lic a r n a s o p ç õ e s A n a ly ze (A n a lis a r) e G e
neral L in ea r M o d el (M o d e lo L in e a r G e ra l). Q u a n to e s tiv e r e x e c u ta n d o a a n á lis e d e uir:_
M A N O V A c o m p le ta m e n te e n tr e p a r tic ip a n te s , p r e c is a r á c li c a r n a o p ç ã o M u ltiv a ria
(M u ltiv a ria d a ).
(¡¿3 Manovd beliel SPSS Doto Ediloi H Q B

View Tian:l04m AnalyM U»át*e: Wriòow Help
Regala ►
1 Q t l B l ô l I3J| Ü J Dff:ceptiv«Sia<c(K: * • I- ln l v l ^ l
1 Betef 1 laWK ►
Compaie fcjaaw ► 1 1
Belief I Happines — 1 1 1 l^ j
ünr.aisip
MçjedModete *|
1 00 ' 5C
Coweiaie » 8«pe-ye<j Measures
3 ioò* " * ‘ 5 f »
4 1 00 6C Lsçtne« ►_ Vw nc* Compontul»
5 1 00 6C . Clòcaty *
6 1 óo 6( [¿¿ta RwJucáon ►
7 1 00 7C Scale *
Nanpaamelnc Te:(; ► _i
8 1 00 7C
9 TjmeSene: ►
1 00 7 C-
¿urwai »
10 1 00 8 C‘
11 1 00' 8C Mi:wigValu* Aoaiji:.
12 1 00 9C Conpíex Saneie: ►
13 2 ÜÚ 5 ÍJ T ....... .. JTU
14 2 00 4 00' •4 CO
15 200> 800 5 00 '
16 200 ' 9 (X 400
17 200 700 200
18 2 00 6 GD 300
19 2 00 700 4 00 "
20 200 5 0C 300
21 200 600 200
20 0 4 IX 4 00 ‘ ____ __ __
I • |\ Oj Ij Vicw 4 Vwoi*r / |_«J________________________|
Geneial Miâivanate SPSS Processa «j ((■«*■
v j rJ K ^ | ' S f ■ j I. H gM-nnv. 3 S M 9 íã ll! - « I

A seg u in te c a ix a d e d iá lo g o s d e v e rá aparecer.
SPSS Ptocwích tt ready
<5'»'| 'J K ^ ” jjC«pfa»r>fl I -jyMcwnolt I Pho»o I
Você deve m o v e r as v a riáv eis p a ra as ca ix a s a p ro p riad a s. A s d u as v a riáv eis d e p e n d e n te s

d ev em ser m o v id a s p ara a ca ix a D ependem Variable (V ariável D e p e n d e n te), e a variáv el in d e
p e n d en te deve se r c o lo c a d a n a ca ix a Fixed Factor(s) (F a to r(e s) F ix o (s)).
Para q u e o S P S S P W a p re se n te te stes d e h o m o g e n e id a d e d a v a riâ n c ia, etc., v o c ê p re c isa
c lic a r no b o tã o O ptions (O p ç õ e s). S e rá a p re s e n ta d a a seg u in te ca ix a de d iálo g o s.
¿ U g lij
r ir - j p a n
« ! i
H U n i j
E 1scrJ ^ M’.ofu
sk! rjCU* Iri#*.!*."*!
CD
I” rt«MK£ r '■lyvdom.Sior. rvVrv

r tffwWaiíwic* Us Hrmvpr+ty -e^lr
P Sg№*1 ■
■■
• pfcy.
P e P B cwíjoí iJott
r S jK P * * e « f r
•
5V * ■-- Cuf#*ie»Ke íí
> Cw rttje I Cjr».tJ
H
1 iL ?r
Se d e se ja q u e o S P S S P W a p re s e n te o teste de h o m o g e n e id a d e d a s m a triz e s d e variân-

c ia -c o v a riâ n c ia (te ste M d e B o x ), v o cê d ev e c lic a r na o p ç ão H om ogeneity tests (T estes de
h o m o g en eid ad e). E ú til o b te r m e d id a s d o tam a n h o d o e fe ito ; p a ra tan to , você deve se lecio n ar
essa o pção. F e ita s essas e sc o lh a s, c liq u e e m C ontinue (C o n tin u a r) e re to rn e à tela an te rio r
Você p re c isa c lic a r no b o tão O K p a ra s e g u ir ad ia n te . A sa íd a será s e m e lh a n te a a p re se n ta d a
a n terio rm en te.
14.10 Delineamentos dentre participantes
U m p o n to q u e d e v e m o s d e ix a r c la ro é q u e a a n á lise m u ltiv a ria d a d e v a riâ n c ia não e

s im p le sm e n te u m a A N O V A d e n tre p a rtic ip a n te s. E m b o ra as m ú ltip la s v ariáv eis dependente>
sejam , em se n tid o e strito , m e d id a s d e n tre p a rtic ip a n te s, a a n á lise d as m e sm a s d ife re da a n a
lise de variáveis in d e p e n d e n te s e n tre p a rtic ip a n te s. A d ife re n ç a b á sic a aq u i é e n tre v a riá v e i'
d e p e n d e n te s e v ariáv eis in d e p e n d e n te s. L e m b re -se de q u e a M A N O V A lid a c o m m ú ltip la '
variáveis d e p e n d e n te s, e n q u a n to u m a A N O V A d e n tre p a rtic ip a n te s lid a c o m v ariáv eis in d e
p e n d e n te s d e n tre p a rtic ip a n te s.
P o r e x e m p lo , su p o n h a q u e q u e re m o s d e s c o b r ir se u m a n o v a te ra p ia p a ra a fo b ia de
a ra n h a s é efetiv a. P o d e m o s m e d ir o m e d o d e a ra n h a s d o s p a rtic ip a n te s, tra tá -lo c o m a nova
te ra p ia e e n tã o m e d ir n o v a m e n te o m e d o d e a ra n h a s . S e a te ra p ia fo i e fe tiv a , e s p e r a m o '
q u e o m ed o de a ra n h a s d o s p a rtic ip a n te s a p ó s a te ra p ia seja m e n o r d o q u e a n tes d a m esm a.
U m a c o n sid e ra ç ã o im p o rta n te e m tal e stu d o é o m o d o de m e d ir o m e d o d e a ra n h a s. E x isten
vário s q u e stio n á rio s q u e p o d e m se r ú te is, tais c o m o o Q u e stio n á rio so b re M e d o de A ra n h a '
(Q M A : S z u m a n sk y e 0 'D o n o h u e , 1995). O Q M A é um q u e stio n á rio d e 18 iten s p ro je ta d o
p a ra v e rific a r a fo b ia de a ra n h a s. S z u m a n sk y e 0 ’D o n o h u e d e sc o b rira m q u e o questionário
é c a p a z de d is c rim in a r c o m su c e sso p e ss o a s co m e se m fo b ia d e a ra n h a s, alé m de se r m a>
se n sív e l q u e o u tro s q u e s tio n á rio s à d im in u iç ã o d o m e d o a p ó s o tra ta m e n to . D e ssa form a,
tra ta -se de u m b o m c a n d id a to p a ra se m e d ir o m ed o de a ra n h a s. O e sc o re to ta l no q u e stn -
n ário fo rn e c e u m a in d ic a ç ã o d o n ív el d e m e d o d e u m a p esso a. Q u a n to m ais alto o e sc o re nc
q u e stio n á rio , m a io r é o m ed o .
N o estudo p odem os, po rtan to , u tiliz ar o Q M A antes e depois do tratam ento. P o d em o s, en
tão, co m p arar os dois e sco res u tilizan d o um teste t p ara ver se ex iste um d ecréscim o n o medi
após a terapia. E m b o ra esse e stu d o seja eficaz, seria co n v en ien te in c lu ir um a m edida d o m edo
de aranhas diferente. U m a d essas m edidas é o Teste da A bo rd ag em C o m p o rtam en tal (TAC), que
envolve a ap ro x im ação do p articip an te de um a ara n h a viva até q u e fin alm en te ele a p onha r..
p alm a d a m ão (v er Õ st et al. 1998). O s p articip an tes p o d em p arar o processo em q u a lq u er está
gio. A ssim , obtem o s u m a m ed id a co m p o rtam en tal do seu m edo de aranhas. Õ st e colaboradore-
apresentam 13 estág io s do seu p ro ced im en to , e o p articip an te g an h a um esco re d ep en d en d o d ;
quão perto chegou da aranha. U m esco re zero é atrib u íd o ao particip an te que se recu sa a entrar
na sala onde a aran h a está (m ed o m áxim o) e um esco re 12 é d ad o ao p articip an te que segurar a
aranha na palm a d a m ão p o r p elo m en o s 2 0 seg u n d o s (m ed o m ínim o). N o estu d o p o d em o s in
clu ir as duas m edidas de m edo de fo rm a a ab o rd ar o m aio r nú m ero possível de aspectos. Tenii -
um a m edida au to -rela ta d a (Q M A ). na qual u m alto esc o re é igual a um g ran d e m edo, e u m .
m edida com portam en tal (TAC), na qual um alto escore significa p o u co m edo.
E sse é um d e lin e a m e n to d e n tre p a rtic ip a n te s, p ois esta m o s te sta n d o as m e sm a s pessi -
as a n tes e d e p o is d a te ra p ia p a ra a fo b ia d e a ra n h a s. O s d ad o s p ara 2 2 p a rtic ip a n te s em ta
e stu d o , b e m c o m o as m é d ia s, os d e sv io s p a d rõ e s e in te rv a lo s de c o n fia n ç a d e 95% estã.
a p re s e n ta d o s na T ab ela 14.2.
T abela 14.2 Possíveis dados para um estudo sobre os efeitos de uma terapia contra aracnofobia
Pré-tratam ento Pós-tratam ento
QMA TAC QMA TAC
92 8 51 11
126 i 120 5
126 1 111 8
121 10 84 8
84 4 67 6
67 4 45 6
19 10 21 11
65 5 96 7
73 1 55 7
107 5 91 6
101 0 72 3
8? 6 63 6
110 7 109 8
21 11 31 11
68 8 69 9
42 4 67 3
106 9 110 9
89 6 75 10
88 5 91 6
33 10 41 10
55 6 56 5
33 7 42 10
X = 77.68 X = 71.23 X = 6,14 X = 7,50
DP = 33.19 DP = 27,67 DP = 2.96 DP = 2,44

IC,,,; = 62.97 - 92.40 IC , = 58.96 - 83.49 IC,«., = 4.82-7,45 IC,,,, = 6,42-8,58
N o sso p rim e iro pas so p a ra a n a lisa r os d ad o s deve se r a sse g u ra r q u e não v io lam as condi
ç o e s n ec e ssá ria s p ara a u tiliz a ç ã o d a M A N O V A . O s d ia g ra m a s de c a ix a e b ig o d e s fo rn ec id o s
p elo S P S S P W são a p re se n ta d o s n as F ig u ra s 14.4 (a) e (b).
A s F ig u ra s 14.4 (a) e (b) m o stra m q u e n ão te m o s v alo res a típ ic o s ó b v io s e q u e os d a d o s
parecem ser d istrib u íd o s n o rm alm e n te . P o d e m o s, en tão , a ssu m ir q u e as c o n d içõ e s de n o rm a
lid ad e não fo ram v io lad as. P o d e m o s tam b é m so lic ita r q u e o S P S S P W p ro d u z a os d ia g ra m a s
d e b arras de e rro s p ara os in terv alo s de 9 5 % de c o n fia n ç a em to rn o das m éd ia s (F ig u ra s 14.5
(a) e (b)).
P o d e -s e o b s e r v a r a p a rtir d a s F ig u ra s 14.5 (a) e (b ) q u e n ão e x is te u m a so b re p o s iç ã o
su b s ta n c ia l d o s in te rv a lo s de c o n fia n ç a d e 9 5 % p a ra a Q M A p ré e p ó s -tra ta m e n to . P ro v a
v e lm e n te c o n c lu ire m o s q u e n ã o e x is te d if e re n ç a e n tre as d u a s m e d id a s . A s o b r e p o s iç ã o
d o s in te rv a lo s de 95% p a ra os e sc o re s d o T A C e x is te , m a s a in d a n ão p o d e m o s a firm a r, a
p a rtir d o s m e s m o s, se é p ro v á v e l q u e e x is ta o u n ã o d ife re n ç a s ig n ific a tiv a e n tre a s d u a s
m e d id a s . A s s im , p a re c e e x is tir u m a p o s s ív e l d if e re n ç a n a m e d id a c o m p o r ta m e n ta l d o
m e d o de a ra n h a s , m as n ão na m e d id a a u to -re la ta d a .
140
22
Pós-TAC
(b)
Diagram as de caixa e bigodes para os escores do Q M A (a) e os escores do TAC (b) nas
Figura 14.4
condições pré e pós-terapia.
Grande
sobreposição
dosICs
de 95%
Pré-QMA Pós-QMA
(a)
u
í
o
c Pequena
cC sobreposição
o do; ICs
u
<u
de 95%
■O
u
Pré-TAC Pós-TAC
(b)
Figura 14.5 Diagram as de caixa e bigodes para os escores do Q M A (a) e os escores do TAC (b) nas
condições pré e pós-terapia.
14.10.1 Saída da MANOVA

O s resu ltad o s da M A N O V A p a ra os d ad o s de m ed o de ara n h as são ap re se n ta d o s a seguir
MODELO LINEAR GERAL
W ithin-Subjects Factors (Fator dentre sujeitos)
Measure treatment Dependent Variable

(Medida) tiratamente j .(Variável Dependente)
Fsq Fsq-pre (QMA pré)

QMA)
Fsq-post (QMA pós)
Bat 1 Bat-pre (TAC pré)

(TAC) y
Bat-post (TAC pós)
M ultivariate Testsb (Testes Multivarladosb)
Value Hypothesis df Error df

Effect (Efeito) (Valor) F (gl da Hipótese) (gl do Erro) Sig.
Between Intercept Pillai's Trace (Traço de Pillai) 0.956 216.797-1 2.000 20.000 0.000
(Entre) (Intercepto) Wilks' Lambda (Lambda de Wilks) 0.044 216.797a 2.000 20.000 0.000
Tópicos Hotelling's Trace (Traço de Hotelling) 21.680 216.797a 2.000 20.000 0.000
Roy's Largest Root (Maior Raiz de Roy) 21.680 216.797a 2.000 20.000 0.000
Within Treatment Pillai's Trace (Traço de Pillai) 0.379 6.110a 2.000 20.000 0.008
Subjects (Tratamento) Wilks' Lambda (Lambda de Wilks) 0.621 6.110a 2.000 20.000 0.008
(Dentre 0.611 6 .1 10a 2.000 20.000 0.008
Hotelling's Trace (Traço de Hotelling)
Roy's Largest Root (Malor Ralz de Roy) 0.611 6 .1 10-' 2.000 20.000 0.008

b. Design: Intercept (b. Projeto: Intercepto)
Within Subjects Design: treatment (Delineamento Dentre Tópicos: tratamento)
Sig. = Significance
Mauchly Test of Sphericity*3 (Teste de Esfericídade de Mauchlyb)
Epsilon (ea)
Within Subjects Approx.
Effect Mauchly's Chi-Square
(Efeito Dentre Measure W (M de (Qui-Quadrado Daf Greenhouse- Lower Bound
Tópicos) (Medida) Mauchly) Aproximado) (gl) Sig, Gelsser Huynh-Feldt (Limíte Inferior)
Treatment Fsq (QMA) 1.000 0.000 0 1.000 1.000 1.000

( ¡ratamente!
Bat (TAC) 1.000 0.000 0 1.000 1.000 1.000
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is
proport ona to an identity matrix (Testa a hipotese nula de que a matriz das covariancias das vanáveis dependentes transformadas e
ortonorma"zaclas é proporcional a urna matriz ¡dentidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table, (a. Pode ser utilizado para ajustar o grau de liberdade para um teste de significancia de medias
Os testes corroídos sao apresentados na tabela de Testes de Efeltos Dentre Tópicos.)
b. Design: Intercept ib Delineamento: Intercepto)
Within Subjects Design: treatment (Delineamento Entre Tópicos: terapia)
Sig. - Significancia
TESTE DOS EFEITOS DENTRE TÓPICOS
M ultivariatebc (Multivarladosbt)
Hypothesis df Error df
Within Subjects Effect (Efeito Dentre Tópicos) Value (Valor) F (gl da Hipótese) (gl do Erro) Sig.
Treatment Pillai's Trace (Traço de Pillai) 0.379 6.110a 2.000 20.000 0.008
^ Wilks' Lambda (Lambda de Wilks) 0.621 6.110’ 2.000 20.000 0.008
Hotelling's Trace (Traço de Hotelling) 0.611 6.110' 2.000 20.000 0.008
Roy's Largest Root (Maior Raiz de Roy) 0.61 1 6.110' 2.000 20.000 0.008
a. Exact statistic {a. Estatística exata)

b. Design: Intercept (b Delineamento: Intercepto)
Delineamento Entre Tópicos: Terapia
c. Tests are based on averaged variables (c. Os teste = ^ .ç .ana-.eis
Univariate Tests (Testes univariados)

Squares (Soma dos (Media dos
Source (Fonte) Measure (Medldai Quadrados do Tipo III) df (gl) Quadrados) F Sig.
Treatment Fsq (TMA) Sphencit\ Assumed 458.273 1 458.273 2.731 0.113
(Tratamento)
Greenhouse-Geisser 458.273 1.000 458.273 2.731 0.113
Huynh-Fe'd: 458.273 1.000 458.273 2.731 0.113
Lower bouna i.Lim inferior) 458.273 1.000 458.273 2.731 0.113
Bat (TAC) Sphericity Assumed 20.455 1 20.455 12.084 0.002

(Esfericidsde Assumida)
G reen h o u se-sser 20.455 1.000 20.455 12.084 0.002
Huynh-Feldt 20.455 1.000 20.455 12.084 0.002
Lower bci.no iL.mite inferior) 20.455 1.000 20.455 12.084 0.002
Error (treatment) Fsq (QMA) Sphericity Assumed 3523.727 21 167.797

(Erro do (Esfencca'ji Assumida)
tratamento) Greenhouse-Geisser 3523.727 21.000 167.797
Huynh-Feidt 3523.727 21.000 167.797
Lower bound iLimite inferior) 3523.727 21.000 167.797
Bat (TAC) Sphericity Assumed 35.545 21 1.693

(Esfe'-c dace Assumida)
Huynh-Feldt 35.545 21.000 1.693
Lower bound i.unite inferior) 35.545 21.000 1.693
Test of Within-Subjects Contrasts (Teste dos Contrastes dentre Tópicos)

treatment Squares (Soma dos (Média dos
Source (Fonte) Measure (Medida) (Tratamento) Quadrados do Tipo III) df (gl) Quadrados) F Sig.
Treatment Linear (Linear) 458.273
Fsq (TMA) 1 458.273 2.731 0.113
(Tratamento)
Erro do tratamento Bat (TAC) Linear (Linear) 20.455 1 20.455 12.084 0.002
Fsq (TMA) Linear (Linear) 3523.727 21 167.797
Bat (TAC) Linear (Linear) 35.545 21 1.693
Test of W ithin-Subjects Effects (Teste dos Efeitos dentre Tópicos)

(Variável Transformada: Média)
Measure Type III Sum of Squares df Mean Square
Source (Fonte) (Medida) (Soma dos Quadrados do Tipo III) (gl) (Média dos Quadrados) F Sig.
Intercept Fsq (TMA) 243913.091 1 243913.091 143.555 0.000

(Intercepto) Bat (TAC) 2 0 45.455 1 2045.455 156.457 0.000
Erro (Erro) Fsq (TMA) 35 68 0.90 9 21 1699.091

Bat (TAC) 274.545 21 13.074
P o d e m o s o b s e r v a r q u e h á u m e fe ito d a v a riá v e l in d e p e n d e n te d e n tre p a rtic ip a n te s na

c o m b in a ç ã o lin e a r d a s v a riá v e is d e p e n d e n te s im p ro v á v e l d e te r su rg id o a p e n a s p o r erre
a m o s tra i. Is so p o d e s e r v is to n a ta b e la m u ltiv a ria d a d a se ç ã o d o s te s te s d o s e fe ito s d en tre
tó p ic o s d o s re s u lta d o s . A s s im , h á u m a d if e re n ç a m u ltiv a ria d a e n tr e as c o n d iç õ e s p ré e
p ó s -te ra p ia . V ocê d e v e s e r c a p a z d e c o n s ta ta r q u e te m o s um À. d e W ilk s d e 0 ,6 2 1 q u e se
e q u ip a r a a u m v a lo r F d e 6,11 e u m v a lo r p d e 0 ,0 0 8 . A ssim c o m o a a n á lis e e n tre p a rti
c ip a n te s a p re s e n ta d a p re v ia m e n te , p re c is a m o s a g o ra e x a m in a r a c o n tr ib u iç ã o re la tiv a de
c a d a u m a d as v a riá v e is d e p e n d e n te s p a ra a d ife re n ç a m u ltiv a ria d a .
14.10.2 Avaliação de cada variável dependente

Para avaliar cad a variável d ependente, p rim eiro p recisam o s v erificar se estão co rre la c io n a
das; podem os verificar isso p o r m eio do coeficiente de co rrelação de Pearson. A s co rrelaçõ es são
m ostradas a seguir:
Pré-tratam ento P ós-tratam ento

QMA QMA
TAC - 0 ,3 2 TAC - 0 ,3 5
( 22 ) (2 2 )
p - 0 , 16 p = 0 , 11
É e v id e n te , a p a rtir d o s c o e fic ie n te s de c o rre la ç ã o re fe rid o s, q u e não e x iste c o rre la ç ão

e n tre as d u as v a riáv eis d e p e n d e n te s além d a q u e p o d e ria se r a trib u íd a ao erro a m o strai. P o d e
m os. e n tã o , in v e stig a r a c o n trib u iç ã o re la tiv a de c a d a variáv el p a ra a c o m b in a ç ã o lin e a r das
variáveis d ep en d e n te s p o r m eio d e te stes t (le m b re -se de q u e , se você o b tiv e r v ariá v eis c o rre
lacio n ad as. deve c o n su lta r tex to s m ais av an çad o s). Q u a n d o se fiz e re m os testes l, os seg u in tes
re su lta d o s serão o b tid o s:
TESTE T
Paired Sample Statistics (Estatística das Amostras Emparelhadas)
Std. Error
Mean Std. Deviation Mean (Erro
(Mèdia) N (Desvio Padrão) Padrão da Mèdia)
Pair 1 Fsq-pre QMA pre 77.6818 22 33.18833 7.07578
(Par 1)
Fsq-post (QMA pos. 71.2273 22 27.66626 5.89847
Pair 2 Bat-pre (TAC orei 6.13 64 22 2 .96480 0.63210
(Par 2)
Bat-post (TAC pos) 7.50 00 22 2.44462 0.52120
Paired Sam ple C orrelations (Correlações das Amostras Emparelhadas)
Correlation
Pair 1 (Par 11 Fsq-pre & Fsq-post 22 0,834 0.000
rair 1 (Par 1) (QMA pré/QMA pós)
Pair 2
z (Par
(rar 2)
¿) Fsq' pre
(Q(V]A prè,QMA pós)
& Fsc*-Post 22 0.785 0.000
Paired Sample Test (Testes de Amostras Emparelhadas)
Paired Differences (Diferenças Emparelhadas)
95% Confidence Inter

val of the Difference
Std. Std. Error (IC de 95% da Diferença) Sig.
Deviation Mean (2-tailea)
Mean (Desvio (Erro Padrão Lower bound Upper bound df (Sig.
(Média) padrão) da Média) (Limite inferior) (Limite superior) t (gl) Bilateral)
Pair 1 Fsq-pre - Fsq-post 6.45455 18.31920 3,90567 -1.66773 14.57682 1.653 21 0.113
(Par 1) (QMA pré/QMA pós)
Pair 2 Fsq-pre - Fsq-post
(Par 2) (QMA pré/QMA pós)
-1.36364 1.83991 0.39227 -2.17941 -0.54786 -3.476 21 0.002
D os resu ltad o s, fica c laro que so m en te a m ed id a c o m p o rta m e n ta l do m ed o (TA C) c o n tri

bui de fo rm a sig n ifica tiv a p a ra a d ife re n ç a das v a riá v e is d e p e n d e n te s c o m b in a d a s e q u e não
existe d ife re n ç a na m e d id a de auto-rela(.o d e m ed o (Q M A ) pré e p ó s-te ra p ia alem do q u e pode
se r atrib u íd a ao e rro am o strai.
Você p o d e re la ta r as a n á lise s da se g u in te form a:
Os diagramas de caixa e bigodes mostraram que os dados de cada variável dependente em

cada condição da variável independente são aproximadamente distribuídos de modo normal. D es
sa forma, podemos estar razoavelmente confiantes de que não tem os violações substanciais da
condição de normalidade multivariada. Os diagramas de barras de erro mostraram que existe uma
substancial sobreposição dos intervalos de confiança 95% para a QMA pré e pós-tratamento, su
gerindo que não existe um efeito real do tratamento nessa medida do medo. A sobreposição nos
intervalos de confiança para a medida TAC não foi muito grande: então, pode-se acreditar que
existe mais efeito do tratamento sobre a medida comportamental do medo.
Lima MANOVA de medidas repetidas com um fator de tratamento dentre participantes (pré e
pós) foi conduzida com os escores QMA e TAC como variáveis dependentes. Revelou que existe
uma diferença multivariada entre as condições pré e pós-tratamento que não pode ser atribuída ao
c i t o amostrai (F(2, 20) = 6.11; p = 0,008, X de Wilks = 0,621). Como as duas variáveis dependentes
não estão correlacionadas, testes t univariados separados foram conduzidos em cada variável depen
dente. Essas análises sugeriram que não existe uma contribuição que não possa ser atribuída ao erro
amostrai da medida de comportamento do medo (TAC) para a diferença multivariada entre as con
dições pré e pós-tratamento (t = 1,65; gl = 2 1:p = 0,113). O intervalo de confiança para a diferença
entre as condições pré e pós-tratamento para o TAC mostrou que a diferença média populacional
pode estar contida entre os valores de -2,1 8 e -0,55.
N o t a : C o m o n o d e lin e a m e n to e n tre p a rtic ip a n te s, v o cê p o d e re la ta r os d e talh es u n iv a ria

dos em vez dos teste s t.
Atividade 14.5
Q u a l d o s se g u in te s te ste s se ria a p r o p r ia d o para d e tectar u m a d ife re n ç a m u ltiv a ria d a entre
a s d u a s co n d iç õ e s d a v a riá v e l in d e p e n d e n t e ?
(a) P rim e iro , p re cisa -se v e rific a r se as variáve is d e p e n d e n te s e stã o c o rre la c io n a d a s, Se es
tive re m , u sa -se u m a a n á lise c o m p le x a , tal c o m o a a n á lise d e sc e n d e n te p a sso a p a sso
para c a lc u la r a c o n trib u iç ã o d e c a d a variáve l d e p e n d e n te n a d ife re n ça m u ltiv a ria d a
entre as c o n d iç õ e s d a v a riá ve l in d e p e n d e n te .
(b) V e rifica -se se a s v a riá v e is d e p e n d e n te s e stã o c o rre la c io n a d a s. S e n ã o e stiv e re m , útil -
z a m -se testes f c o m o ajuste a p r o p r ia d o d o a.
(c) V e rific a -se se as va riá ve is d e p e n d e n te s e stã o c o rre la c io n a d a s. Se n ã o e stiv e re m , u tili
z a m -se a n á lise s u n iv a ria d a s d o s re su lta d o s d a M A N O V A .
(d) N ã o é p re ciso se p re o c u p a r c o m c o rre la ç õ e s. O s teste s t s a o fe ito s n a s va riá ve is d e p e n
d e n te s e m se p a ra d o.
SPSSPW: uma variável independente dentre participantes e

ÍQ duas variáveis dependentes
P ara se a n a lis a r o e s tu d o so b re o m e d o d e a ra n h a s , é p re c is o d e te r m in a r q u a tro van.

veis:
1. E sc o re s do p ré -tra ta m e n to (Q M A ).
2. E sco res do p ó s-tra ta m e n to (Q M A ).
3. E sco res d o p ré -tra ta m e n to (TA C).
4 . E sco re s d o p ó s-tra ta m e n to (TA C).
U m a voz d e te rm in a d a s as v a riáv eis e fo rn e c id o s os d a d o s, você d ev e c lic a r em A nalyce

( A n alisar) e, em se g u id a , em G eneral L inear M odel (M o d e lo L in e a r G eral); d ep o is, na o p çao
R ep e u ted M easures (M e d id a s R ep etid a s).
s «anova linai SPSS Dala Edito« HM3

£fe E<Ü V«ev< ala JWcicxm AíiaJvz* Graptr. jjlátwt V/rxiow Help
° * | B | a | 5i| - I I I
Regorlj
Dcjciçftve Slatnbci 1-lr.l v ia l
1 Isqpie lattei
Corapaie Mear«
Jasa-
51 C "
Moderi
i; . 1^°.C £«ieWe
126 0Ó' ■" l i Tc B«gres»on
121 00 84 C Vanarcí1Componen/:
L9^nM>
84 00 67 C Clatrfy
67 00 45 C ta ta Reduelen
19 00 21 C Scile
65 00 96 í ftonp«vr«t/KTetti
Time Senei
73 00 55 C
SurvTval
107 00 91 C
M^ple Rwpore*
101 00 72 C M-.ang )¿akj»Ana^ rn
83 00 63 c
‘110 00 '0 9 Qtr
21 00 31 00
68 00 ‘' 6900
42 00 67 ®
106 00
8900 >000'
88 X 91 ® 600
.. X 4' X to 00
55 X 56 ® 6® 5 00
7 00 10®'
«ST" ~i.iL
SPSS Ptoceisa i: 'fôdy
jjS la il I _J _ Ps ^ I 3 y Mcl': I MO1p'r»V'.' || 57 tepeale
A p a re c e rá a seg u in te c a ix a de d iálo g o . A c a ix a é e x a ta m e n te a m e sm a dos C a p ítu lo s 9

e 10, q u a n d o e x p lic a m o s c o m o u tiliz a r a A N O V A de m e d id a s re p e tid a s. C o m o a n te s, você
p re c isa d e fin ir q u a is são as m ed id as re p e tid a s. Você p o d e o b se rv a r a se g u ir q u e sim p le sm e n te
c h a m a m o s em n o sso e stu d o a v ariáv el d e m e d id a s re p e tid a s d e treatm nt (tra ta m e n to ) e que
ela p o ssu i d u as co n d iç õ e s.
■ái-lara
a|B|d>|E3| i j iMfei m| 0 -1 cl-i-lr.l

fsqpte I f;qpc?l | balpio | balposl | _L J _____ L-H
92 001 51 ® 8® 11 ®
126 00 120 00' 2® so o t
126 0U 111® " ‘‘ 7® 8 00
12: ® * "8 4 ® 10® 6.00'
E' e7Ü P . . | 9 ^ 9 llepc<)led M casuir: Define Facloi)s| E3
67 00 45 ® ’ , iifilhn-Sutoiecl Facíoi Ñame | Define 1
19 0 0 ' ■ ¿rsr
65 00 '9 6 ®
c d L*vek | B«*l 1
73 00*’ 55® iieainrt)2) Cancel 1
107 00 91 ® 5 1---- -- J
Help 1
101 00 7 :® J
83 00 63® ' 6
110 00 109® J Meajue 1
'2 1 0 0 ' 31 00 11_________

68 00 69® 8® ' 9®
42 00 67® 4® 3®
106® 110® 9® 9® '
89 00 75® 6 00 1 0®
88 00 91 0Ò 5® 6.®
3300 41 00 1 0® 1 0® '
55 00 56® 6® 5®
33.00 42® " 7® ' 10®
<I »[\DataVICM\ vãnãwêvW r H_lL
SPSS Pfocestot « leady
j f i S l ji l | [■.] PE ^ ” ^jE>çi>r»3 I Wo»d glepealed meatuit- a f f l a t a l i ^ 1425
N os C apítulos 9 e 10, in fo rm am o s que, dep o is de defin id as as variáveis d entre p articip an tes

você deveria clicar no botão Define (D efinir). Q u ando estam o s u tilizand o a an álise m u ltivariada,
514 Christm e P. Dancey & John Reidy
no entanto, precisam os esp ecificar co m o as variáveis depen d en tes serão reconhecidas. F azem os
isso clicando no botão M easures (M ed id as), que ex p an d irá a caix a de d iálo g o a tu a l.'
a ; | y | a | E3| | I I M ftlM K lr - r lr l- i- lr :! -|o>l
< | » [\ p j t j View { Vatwbte V » w /

SPSS PioceM« is l e v i y
jÕ S ia .> | Q ^ ^ ” J j E > ç 'o r j | T yM g-.noii | ^ g M G lP to o | ffr
T em os d u as v a riáv eis d e p e n d e n te s, c a d a u m a m e d id a e m am b a s as c o n d iç õ e s d a v ariá

vel in d e p en d e n te. N a c a ix a M easure N am e (N o m e das M ed id a s), p re c isa m o s in d ic a r com o
as d u as v ariáv eis d e p e n d e n te s d e v e m se r c h a m a d a s. L e m b re -se d e q u e os n o m e s q u e você
vai u tiliz a r d ev em se r d ife re n te s d o s n o m e s de q u a lq u e r variável q u e já te n h a d e te rm in a d o .
P o d e-se v er no d ia g ra m a que d e n o m in a m o s a p rim eira variável d e p e n d e n te à s f s q (Q M A ) e
a seg u n d a de bat (TA C). Q u a n d o você tiv er os d eta lh e s c o rre to s nessa c a ix a de d iá lo g o , deve
c licar no b o tão D efine (D efin ir).
S iíí
SPSS Piocetsoí tt feôdy

- ú :J ” JjE xplw m g- | 'jy M k iú io » | MGl Pho'o | | jrr m p e a ln
\> .■j deve noiar que o SPSS. versão 12. não apresenta esta tela, mas a próxima. Assim , não é preciso clicar no botão M e n s u r e s para
aumentar a janela.
V ocê p e rc e b e rá q u e, n a c a ix a W ithin-Subjects Variables (V ariáv eis D en tre T< r:*- >' " i
d o is e sp a ç o s d isp o n ív e is p a ra a v ariáv el fs q (q m a ) e o u tro s d o is e sp a ç o s p a ra a .¡rL ’. e - •
(T A C ). Você dev e m o v e r as v ariá v eis de in te re sse d a lista de v a riá v e is p a ra es-e* -
T em o s d e fin id a s d u as v ariáv eis p a ra c a d a v ariá v e l d e p e n d e n te ; a ssim , você p re c isa r „ - . '
c o n d iç õ e s d a fs q (fsp re t f s p o s ,) p a ra p re e n c h e r os e sp aç o s d a fs q (Q M A ) e as dua^ c o n d L
d a b a , (batpre e batpost) p a ra p re e n c h e r os e sp a ç o s d a bat. Você d ev e. e n tão , selecix n .;.'
b o tão O ptions (O p çõ e s) p a ra re q u e re r o c á lc u lo d o ta m a n h o d o e fe ito (v eja a seg u iri.
a l a t esi I I i fallai *l - r i r - l c l- i- ln l r»l&l

1 »tqpw M M „
il
I ( -UI
92 (U
126 00
Rnpoated H easuies Opliont
n 01 I
E ‘.trvjird Maten eiM«on:
126 00
£aciof1s| «nd Faci« Interachoru
121 00
84 00
67 00 □
1900
65 00
‘ 73 OÕ
107 00
8300 Display
11000 r Dejcichv« daterei r~ Tlyitlofnyyioo mailt*
2100 17 oh :c* r
6800 I~ 0bse»ved powe* r
42 X r «semate* r~ Residual pWi
i§6ao
"
r SSCPmatnc« 1
r* Lacfc o H i&tf
I~ RMdual SS£P nvjtrw r ¡¿«r+tii whmaò** kjnctan
i SigrrfKanceWveí |"c6 Conhdence tue95%

3300
66 00 I Cjriru* I Cvgl I Hob I
* I » |\P a ia U iíw \ voirtri? / |_<J_______________________

SPSS P íoc« u * u ready
J jS l.u l ! 'Í J ^ ’* JjE x tJo n n g - I jyM ciM I Mfil F n vo | | r r i e p g a l r M30
F e ita s as o p ç õ e s q u e d e se ja, c liq u e e m C ontinue (C o n tin u a r) e e m O K p a ra ro d a r a a n á li

se. O s re su lta d o s o b tid o s d ev em se r se m e lh a n te s a u m d o s já ap re se n ta d o s.
Resumo
N este c a p ítu lo ap re se n ta m o s u m a b rev e in tro d u ç ã o às té c n ica s e sta tístic a s m u ltiv a ria d a s.

E x p licam o s;
■ Q ue a a n álise m u ltiv a ria d a é u tiliz a d a q u a n d o te m o s u m a ou m a is v a riá v e is in d e p e n

d e n te s com m ais d o q u e u m a v a riá v e l d e p e n d e n te
■ C o m o a M A N O V A é u m a e x te n sã o da A N O V A
■ Q ue a M A N O V A fo rm a u m a c o m b in a ç ã o lin e a r d as v a riá v e is d e p e n d e n te s e. e n tão ,
p ro c u ra p ela d ife re n ç a e n tre a s c o n d iç õ e s d a v a riá v e l in d e p e n d e n te e m term o s de
u m a c o m b in a ç ã o lin e a r das v ariá v e is d e p e n d e n te s
■ Q u ais as co n d iç õ e s n e c e ssá ria s p ara o uso d a M A N O V A :
- A n o rm a lid a d e m u ltiv a ria d a sig n ifica q u e d e v em o s te r v a riá v e is d e p e n d e n te s
n o rm a lm e n te d istrib u íd a s, b e m c o m o su as c o m b in a ç õ e s lin eares
A h o m o g e n e id a d e d as m a triz e s d a v ariâ n c ia -c o v a riâ n c ia é e q u iv a le n te à c o n d iç l-’
da h o m o g e n e id a d e d a v a riâ n c ia d a A N O V A
■ Q ue o S P S S P W tem v árias fo rm as de tra b a lh a r o v alo r F m u ltiv ariad o :

L a m b d a de W ilks
T raço de P illai
- T raço de H o tellin g
- M a io r raiz d e R oy
■ Q u e o v alo r m ais u tiliz a d o é o X d e W ilks

■ Q ue, q u a n d o se o b té m u m v a lo r m u ltiv a riad o d e F sig n ificativ o , é p re c iso d e sc o b rir
q u ais v a riá v e is d e p e n d e n te s c o n trib u e m p a ra ta n to p o r m eio d a re a liz a ç ã o d e um a
a n á lise u n iv a riad a em c a d a u m a d as v a riá v e is d e p e n d e n te s
■ Q ue você p re c isa a ju sta r o v a lo r q u a n d o re a liz a r m a is d o q u e um teste u n iv ariad a
ap ó s u tiliz a r a M A N O V A
■ Q ue você p re c isa ser c u id a d o so q u a n d o tiv e r v a riá v e is d e p e n d e n te s c o rrela cio n a d a s,
p o is isso to rn a a ta re fa de e x a m in a r as m e sm a s variáv eis d e p e n d e n te s in d iv id u a lm e n
te com e sta tístic a s u n iv a ria d a s. m ais c o m p lic a d a
Exercício 1
U m a c o m p a n h ia p e tro lífe ra in v en to u d u a s n o v as fo rm a s d e c o m b u stív el. U m d o s c o m
b ustíveis é fe ito de su co d e c e n o u ra (é c la ro q u e isso aju d a rá o m o to rista a v e r m e lh o r d u ran te
a n o ite): o o u tro e' feito d e p u rê d e e rv ilh a s a m a ssa d a s (q u e não é ú til p ara d irig ir à n o ite, m a '
é b em v erd e). A n tes d e a c o m p a n h ia c o m e rc ia liz a r os c o m b u stív e is, q u e r d e sc o b rir q u a l do^
d o is é o m elhor. A c o m p a n h ia d e c id e re a liz a r u m e x p e rim e n to c o m 12 c arro s m o v id o s a s u a
d e c e n o u ra e o u tro s 12 a p u rê d e e rv ilh a . C ad a c a rro é d irig id o d u ra n te 12 h o ras c o n tín u as a
u m a v e lo c id a d e c o n sta n te de 7 0 q u ilô m e tro s p o r h o ra. A c o m p a n h ia d ecid e q u e os c o m b u s
tíveis devem se r c o m p a ra d o s p or m eio de v ário s ín d ic es d ife ren tes, e n tre ele s u m a e scala de
d an o s ao m o to r q u e v aria d e 1 a 10 (d e te rm in a d a p o r m e c â n ic o s) e o n ú m e ro de q u ilô m etro ^
ro d a d o s p o r litro de c o m b u stív e l. S eg u e m os d ad o s d o e stu d o .
Suco de Cenoura Purê de Ervilhas
Condições do motor km por litro Condições do motor km por litro
4 10 14
? 10 14
X 9 14
5 9 12
6 7 12
i 11 II
4 12 I1
7 I1 9
3 10 15
6 6 15
7 12 16
5 13 17
E n tre c o m o s d a d o s no S P S S P W e e x e c u te u m a M A N O V A . R e sp o n d a as se g u in te s
q u e stõ e s:
I . A co n d iç ã o de h o m o g e n e id a d e d a v a riâ n c ia -c o v a riâ n c ia foi v io la d a ?

2. Q ual é o v alo r F c a lc u la d o p e lo X d e W ilk s?
3. E x iste u m a d ife re n ç a m u ltiv ariad a, além d a q u e p o d e se r a trib u íd a ao e rro am o strai,

e n tre os d o is tip o s de c o m b u stív e l?
4. D e aco rd o co m o teste F u n iv ariad o . q u ais v ariá v e is d e p e n d e n te s c o n trib u e m p a ra a

d ife re n ç a m u ltiv a ria d a e n tre os d o is tip o s de c o m b u stív eis?
5. R e a liz e an á lise s c o rre la c io n a is p a ra se a ss e g u ra r de q u e a A N O V A uni v aria d a é a

fo rm a m ais a p ro p ria d a de e x a m in a r a c o n trib u iç ã o de c a d a v a riá v e l d e p e n d e n te
p a ra o efe ito c o m b in a d o .
6. Q u al é o ta m a n h o d o e fe ito de c a d a v a riá v e l d e p e n d e n te em se p a rad o ?
Exercício 2
U m a c o m p an h ia de cerv eja fo rm u lo u , p ara re v o lu c io n a r o h áb ito de b eb er de h o m en s j o

vens. u m a nova b eb id a alco ó lica. A b eb id a é feita co m o u m a “cerv eja forte” , m as arm azen ad a
e ferm en tad a co m o u m a "c e rv e ja lev e"; p o r isso a c o m p a n h ia d en o m in o u a nova b e b id a de
L evorte. A em p resa decidiu realizar algu n s testes antes de la n çar a bebida em to d a a E uropa. S o
licitou a u m grupo de hom ens jo v e n s que co m p arassem a nova cerve ja com a beb id a uleve” m ais
po p u lar e atribuíssem notas às características da nova bebida. No p rim eiro d ia de teste, m etade
do grupo tom a seis can eco s da L evorte e atribui um a n ota. O restan te do g ru p o testa “cerv eja
leve" popular. N o segundo dia. os g rupos são tro cad o s. D uas das características avaliadas (gosto
e efeitos prazero so s - EP i sào ap resen tad o s na tab e la seguinte. A s no tas variaram de l a 15.
Leve Levorte
Gosto EP Gosto EP
5 8 8 9
!I 7 11 8
9 2 14 7
II 3 14 7
IO 4 15 2
12 7 10 3
9 6 10 4
6 6 15 5
8 5 11 5
10 5 13 6
9 5 13 6
8 4 13 6
E n tre c o m os d a d o s n o S P S S P W e e x e c u te u m a M A N O V A . R e sp o n d a as se g u in te s
q u e stõ e s:
1. E x iste u m a d ife re n ç a m u ltiv aria d a, além d a q u e p o d e se r atrib u íd a ao e rro a m o strai,

en tre o s d o is tip o s de c e rv e ja ?
2. C o m o você e x a m in a ria a c o n trib u iç ã o re la tiv a d as d u as v ariáv e is d e p e n d e n te s para

a d ife re n ç a c o m b in a d a das v ariáv eis d e p e n d e n te s? R ealize essa s a n álises.
3. Q u ais variáv eis d e p e n d e n te s c o n trib u e m p a ra a d ife re n ç a d as m e sm a s co m b in a d a s?

QUESTÕES DE MÚLTIPLA ESCOLHA biiidade verbal. Mediram a habilidade de escrita e

compreensão em um grupo de estudantes hom en;
As questões de l a 3 se referem ao seguinte estudo e e mulheres. As variáveis dependentes não estâ
resultados. correlacionadas. Os resultados seguintes represe-
Os pesquisadores estão interessados em verificar tam as saídas de uma MANOVA realizada com i -
a diferença entre homens e mulheres quanto à ha- dados.
MODELO LINEAR GERAL
Within-Subjects Factors (Fator dentre Tópicos)

Value Label
(Identificação) N
GENDER 1.00 female (mulher) 10

(GENERO) 2.00 male (homem) 10
Box's Test of Equality of Covariance Matrices3

(Teste de Box de Igualdade das Matrizes de Covariancias1)

F 2.488
df 1 (gli ) 3
df2 (g!2) 58320
Sig. 0.058
Tests the null hypothesis that the observed covariance matr ces
of the dependent variables are equal across groups. (Testa a - ootese
nula de que as matrizes de covariancias observadas sao igue s entre : ¡i jpos)
a. Design: Intercept - GENDER (a. Delmeamento: Interceoto - GENERO)
Multivariate Tests'5 (Testes Multivanados0)

Effect Value Hypothesis df Error df
(Efeito) (Valor) F (gl da Hipotese) (gl do Erro) Sig
intercept Pillai's Trace (Traço de Pillai) 0.963 222.465- 2.000 17.000 0.000
(intercepto) Wilks' Lambda (Lambda de Wilks) 0.037 222.465s 2.000 17.000 0.000
Hotelling's Trace (Traço de Hotelling) 26.172 222.465' 2.000 17.000 0.000
Roy's Largest Root (Maior Raiz de Roy) 26.172 222.465’ 2,000 17.000 0.000
GENDER Pillai’s Trace (Traço de Pillai) 0.426 6.308 2.000 17.000 0.009
(GENERO' Wilks' Lambda (Lambda de Wilks) 0.574 6 308 ’ 2.000 17.000 0.009
Hotellmg's Trace (Traço de Hotelling) 0.742 6.308’ 2.000 17.000 0.009
Roy's Largest Root (Maior Raiz de Roy) 0.742 6.308* 2.000 17.000 0.009
a. Exact statistic - istatist'ca exata)

b. Design: 'n:erceo; - GENDER (b Delmeamento: Intercepto - GÊNERO
Sig. = Significároa
Levene's Test of Equality of Error Variances3

(Teste de i event? da igualdade das Variâncias dos Erros3)
F df 1 (gli) df2 (gl2) Sig.
Comprehension
0.012 1 18 0.915
(Compreensão)
Writing Skills (Escrita) 0.611 1 18 0.444
Tests the null hypothesis that the error variance of the dependent variables is equal
across groups. (Testa a hipótese nula de que a variância do erro é a mesma entre os grupos.)
a. Design: Intercept + GENDER (a. Delmeamento: Intercepto + GÊNERO)
Test of W ithin-Subjects Contrasts (Teste dos contrastes dentre tópicos)

Dependent Variable Squares (Soma dos df (Média dos
Source (Fonte) (Variável Dependente) Quadrados do Tipo III) (gl) Quadrados) F Sig.
Corrected Model Comprehension 1
2.450J 2.450 1.100 0.308
(Modelo Corrigido) (Compreensão)
Writing skills (Escrita) 20.000,: 1 20.000 13.235 0.002
Intercept Comprehension 572.450 1 572.450 256.960 0.000
(Intercepto) (Compreensão)
Writing skills (Escrita) 460.800 1 460 800 304.941 0.000
GENDER (GÊNERO) Comprehension 2.450 1 2.450 1.100 0.308
(Compreensão)
Writing skills (Escrita) 20.000 1 20.000 13.235 0.002
Error (Erro) Comprehension 40.100 18 2.228
(Compreensão)
Writing skills (Escnta) 27.200 18 1.511
(Total) Comprehension 615.000 20
(Compreensão
Writing skills (Esc :ai 508.000 20
Corrected Total Comprehension 42.550 19
(Total Corrigido) (Compreensão'
Writing skills Escrita) 47.200 19
a. R Squared = .058 (AdjusteG R Squared .005 (a. R2 = 0,058 (R2 Ajustado = 0,005)
b. R Squared = .424 (Adjusted R Squared = .392 (b. R2 = 0,424 (R2 Ajustado = 0,392) Sig. = Significance
1. Qual é o valor do M de Box? (a) Lambda de Wilks

(a) 8,40 (b) Traço de Pillai
(b) 58320 (c) Traço de Hotelling
(c) 0,058 (d) Todas as alternativas acima
(d) 3 6. O teste M de Box:
2. Qual é o valor do X de Wilks'.' (a) É um teste da suposição dc homogeneidade da
(a) 9 variância na ANOVA
(b) 0,574 ( b) Deve ser ignorado o tempo todo
(c) 0,742 (c) É um teste de homogeneidade das matrizes de
(d) Nenhuma das alternativas variância-covariância
(d) É aplicável somente a delineamentos subdivi
3. Qual é a conclusão mais apropriada a ser retirada
didos
das saídas acima?
(a) Existe uma diferença multivariada, não-atribuí- 7. Se você tem variáveis dependentes correlacionadas
da ao erro amostrai, entre homens e mulheres num a MANOVA com uma variável independente
(b) A habilidade de escrita, mas não-compreensão de dois grupos deve:
contribui para a diferença entre as variáveis (a) Chorar
dependentes combinadas (b) Realizar testes / em cada variáveis dependentes
(c) A condição de homogeneidade das matrizes (c) Realizar uma análise %’ das variáveis depen
de variância-covariância não é violada dentes seguida de testes t
(d) Todas as alternativas (d) Nenhuma das alternativas acima
1. Qual das seguintes é uma MANOVA verdadeira? 8. Para variáveis dependentes não-correlacionadas,
(a) A que analisa apenas múltiplas variáveis inde como examinamos as contribuições relativas in
pendentes dividuais para as combinadas quando a variável
(b) A que analisa múltiplas variáveis dependentes independente apresenta somente duas condições?
e uma ou mais variáveis independentes
(a) Conduzir testes / separados e ajustando o valor
(c) Aquela que pode ser utilizada somente em da
a para manter baixa a taxa de erro de conjunto
dos categóricos
(b) Olhando para o tamanho do efeito multivaria-
do das variáveis dependentes combinadas
5. Qual dos seguintes são métodos multivariados de (c) Verificando se o M de Box é significativo
cálculo do valor F? (d) Alternativas (a) e (b)
9. Se tivermos três variáveis dependentes e encon (c) Os números da loteria

trarmos tinia diferença multivariada. que nível (d) Alternativas (b) e (c)
a devemos estabelecer para cada teste t a fim de
13. Qual das seguintes condições são necessárias par.
manter o o. global a 5%?
o uso dc estatísticas multivariadas?
(a) 5%
(b) 1% (a) Homogeneidade das matrizes de variância-
(c) 1.67% covariancia
(d) 3.33% (b) Tamanhos de amostras iguais
(c) Normalidade dos dados
10. Qual das seguintes afirmações é verdadeira sobre a (d) Nenhuma das alternativas
MANOVA:
14. Que parte da saída de uma MANOVA fornece ir-
(a) Ela forma uma combinação linear das variá
formação sobre diferenças entre as condições d--
veis independentes
variáveis independentes em termos da combinaçà
(b) Ela forma uma combinação linear das variá
linear das variáveis dependentes?
veis dependentes
(c ) Ela é uma extensão do (a) O teste M de Box
(d) Ela correlaciona as variáveis independentes (b) As estatísticas F univariadas
com todas as variáveis dependentes (c) As estatísticas F multivariadas
(d) Todas as alternativas
11. A condição de normalidade multivariada significa
que: 15. Se você tem variáveis dependentes correlaciona
(a) Somente as variáveis dependentes devem ser das, qual das seguintes afirmações é aplicável?
distribuídas normalmente (a) Você deve utilizar testes t para examinar
(b) Todas as variáveis dependentes e todas as va a contribuição das variáveis dependente'
riáveis independentes devem ser distribuídas individuais na com binação linear dessas va
normalmente riáveis
(c) Todas as variáveis dependentes e todas as (b) Você não deve utilizar testes t para exam i
possíveis combinações lineares das variáveis de nar a contribuição das variáveis dependente'
pendentes devem ser distribuídas normalmente individuais na com binação linear dessas va
(d) Todas as alternativas riáveis
12. Qual das seguintes combinações é linear'? (c) Você não deve diluir o seu álcool
(d ) Alternativas (a) e (b)
(a) A + B + C + D
(b) b,x, + b.x, + bjX, +... + a ,U questões de Jó a 70 se referem ò.s seguintes saide....
MODELO LINEAR GERAL
W ithin-Subjects Factors (Fjtor Dentre Tópicos)
Measure condition Dependent Variable

(Medida) (condição) (Variável Dependente)
anxiety 1 anxietyl (ansiedadel)

(ansiedade) 2
anxiety2 (ansiedade2)
depress depression 1 (depressãoi)

(depressão) 2
depression2 (depressão2)
Descriptives Statistics (Estatísticas Descritivas)
Std. Deviation
Mean (Média) (Desvio Padrão) N
Anxietyl (Ansiedadel) 39.5455 16.75518 22
Anxiety2 (Ansiedade2) 56.3636 15.79797 22
Depressioni (DepressãoD 5.8182 4.17060 22
Depression2 (Depressão2) 8.0000 3.03942 22
Multivariate Testsb (Testes multivariadosb)
Effect Value Hypothesis df Error df

(Efeito) (Valor) F (gl da Hipótese) (gl do erro) Sig.
Between Intercept Pillai's Trace (Traço de Pillai) 0.964 264.762" 2.000 20.000 0.000
Subjects (Intercepto) Wilks' Lambda (Lambda de Wilks) 264.762* 2.000 20.000
0.036 0.000
(Entre
Assuntos) Hotelling's Trace (Traço de Hotelling) 26.476 264.762a 2.000 20.000 0.000
Roy's Largest Root (Maior Raiz de Roy) 26.476 264.762a 2.000 20.000 0.000
Within condition Pillai's Trace (Traço de Pillai) 0.497 9.889a 2.000 20.000 0.001
Subjects (condição) Wilks' Lambda (Lambda de Wilks) 0.503 9.889a 0.001
2.000 20.000
Assuntos) Hotelling's Trace (Traço de Hotelling) 0.989 9.889a 2.000 20.000 0.001
Roy's Largest Root (Maior Raiz de Roy) 0 989 9.889a 2.000 20.000 0.001

b. Design: Intercept (b. Delineamento: Intercepto)
W ithin Subjects Design: condition (Delineamento DentreTópicos condicãol
Mauchly's Test of Sphericity13 (Teste de Esferiddade de Mauchlyb)
Between Epsilon (V )
Subjects M auchly's Aprox.
(Efeito Entre W (W de Chi-Square df Greenhouse- Lower Bound
Tópicos) Measure MaucMyi Qui-quadrado) (gi) Sig. Geisser Huynh-Feldt (Limite inferior)
condition anxiety 1.000 0 .0 0 0 0 1.000 1.000 1.000
(condição) (ansiedade)
depress
(depressão) 1.000 0 .0 0 0 0 1.000 1.000 1.000
Tests the null hypothesis that the error covariance matrix of the orthonormalised trasnformed dependent variables is proportional to
an identity matrix (Testa a hipotes-i lula de que a matriz de covariancia ortonormalizada das variáveis dependentes é proporcional à matriz identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of
Within -Subjects Effects Table (a Pode ser utilizado para ajustar os graus de liberdade dos testes de significancia ponderados. Testes corrigidos
são mostrados na tabela dos Efeitos Dentre Assuntos.)
b. Design: intercept (b. Delineamento: Intercepto)
Within Subjects Design: condition (Delineamento Dentre Assuntos: condição)
TESTE DOS EFEITOS DENTRE TÓPICOS
M ültivariateb,<: (M ultivariadosb)
Within-Subjects Effects Value Hypothesis df Error df

(Efeitos dentre Tópicos) (Valor) F (gl da Hipótese) (gl do Erro) Sig.
condition Pillai's Trace (Traço de Pillai) 0.497 9.889" 2.000 20.000 0.001
(condition) Wilks' Lambda (Lambda de Wilks) 0.503 9 .8 8 9 a 2.000 20.000 0.001
Hotelling's Trace (Traço de Hotelling) 0.989 9 .8 8 9 ‘: 2.000 20.000 0.001
Roy's Largest Root (Maior Raiz de Roy) 0.989 9 .8 8 9 a 2.000 20.000 0.001

b. Design: intercept (b. Projeto: Intercepto)
W ithin Subjects Design: condition (Delineamento DentreTópicos: condição)
c. Tests are based on averaged variables (c. Os testes são baseados em variáveis ponderadas.)
Univariate Tests (Testes univariados)

Squares (Soma dos (Média dos
Source (Fonte) Measure (Medida) Quadrados do Tipo III) df (gl) Quadrados) F Sig.
condition anxiety Sphericity Assumed 3111.364 1 3111.364 9.410 0.006

(condição) (ansiedade) (Esfericidade Assumida)
G reen house-Geisser 3111.364 1.000 3111.364 9.410 0.006
Huynh-Feldt 3111.364 1.000 3111.364 9.410 0.006
Lower-bound 311 1.364 1.000 311 1.364 9.410 0.006
(Limite inferior)
depress Sphericity Assumed 52.364 1 52.364 6.407 0.019
(depressão) (Esfericidade Assumida)
Greenhouse-Geisser 52.364 1.000 52.364 6.407 0.019
Huynh-Feldt 52.364 1.000 52.364 6.407 0.019
Lower-bound 52.364 1.000 52.364 6.407 0.019
(Limite inferior)
Error (condition) anxiety Sphericity Assumed 6943.636 21 330.649
(Erro da condição) (ansiedade) (Esfericidade Assumida)
Huynh-Feldt 6943.636 21.000 330.649
Lower-bound 6943.636 21.000 330.649
(Limite inferior)
depress Sphericity Assumed 171.636 21 8.173
(depressão) (Esfericidade Assumida)
Huynh-Feldt 171.636 21.000 8.173
Lower-bound 171.636 21.000 8.173
(Limite inferior)
Test of W ithin-Subjects C ontrasts (Teste dos Contrastes Dentre Tópicos)
Type III Sum of Mean

Source Measure Condition Squares (Soma dos Square (Média
(Fonte) (Medida) (Condição) Quadrados oo Tipo 1l) df (gl) dos Quadrados) F Sig.
condition anxiety Linear
3111.364 1 3111.364 9.410 0.006
(condição) (ansiedade) (Linear)
depress Linear
52.364 1 52.364 6.407 0.019
(depressão) (Linear)
condition anxiety Linear
(condição) (ansiedade) (Linear) 6943.636 21 330.649
depress Linear
(depressão) (Linear) 171.636 21 8.173
Test o f W ithin-Subjects Effects (Teste dos Contrastes dentre Efeitos)

'Variável Transformada: Média)
Type III Sum of Mean

Squares (Soma dos Square (Média
Source (Fonte) Measure (Medida) Quadrados do Tipo III) df (gl) dos Quadrados) F Sig.
Intercept anxiety (ansiedade) 101 184.091 1 101184,091 506.776 0.000

!ln:erceoto)
depress (depressão) 21 00.364 1 21 00 .3 64 113.786 0.00 0
LU
anxiety (ansiedade) 41 92.909 21 199.662

O
depress (depressão) 387.636 21 18.459
16. Quais são as variáveis dependentes nesse estudo? (c) Não podemos afirmar pela saída
(a) Condição e intercepto (d) Sim, mas nenhuma das variáveis dependentes
(b) Ansiedade e depressão contribui individualmente de forma significa
(c) Greenhouse e Geisser tiva para a diferença multivariada
19. Quais das seguintes estatísticas você colocaria no
17. Quantas condições existem na variável indepen seu relatório?
dente? (a) Traço de Pillai = 0,497
(a) I (b) Lambda de Wilks = 0,503
(b) 2 (c) Traço de Hottelinu = 0.989
(c) 3 (d) Maior rai/. de Roy = 0.989
(d) 4
20. Existe a presença de alguma diferença univariada?
18. Existe uma diferença multivariada entre as condi (a) Sim. apenas para ansiedade
ções da variável independente? (b) Sim. apenas para depressão
(a) Sim (c) Sim. para ansiedade e depressão
(b) Não (d) Não existe diferença univariada
Referências
GOLBY, J., SHEARD. M. Mental toughness and hardness at different levels o f rugby league.
Personality and Individual Differences.
LOEHR, J. E. Mental Toughness training fo r Sports: Achieving Athletic Excellence. Lexington (MA):
Stepehn Greene Press. 1986.
MADD1, S. R.. KHOSHABA. D. M. Personal Views S u n e y. Newport Beach (CA): The Hardness
Institute. 2001.
OST. L. STRIDH. B.. W OLF. M. A clinical study o f spider phobia: prediction of outcome after self
help and therapist-directed treatments. Behaviour Research and Therapy, v. 36, p. 17-35, 1998.
STEVENS. J. Applied Multivariate Statistics fo r the Social Sciences. Lawrence Erlbaum Associates.
1997.
SZYMANSKY. J„ O 'D ON O HU E. W. Fear o f spiders questionnaire. Journal o f Behavior Therapy and
Experimental Psychiatry, v. 26, p. 31-4, 1995.
TABACFiNICK, B.. FIDELL. L. S. Using Multivariate Statistics. Harper Collins, 1997.
Estatística Não-Paramétrica
N o s c a p ítu lo s a n te rio re s, v o c ê foi a p re se n ta d o a o s testes p a ra m é trico s, q ue, c o m c :
b e m o s, e x ig e m ce rtas c o n d iç õ e s. O s d a d o s p re cisa m , p o r e x e m p lo , ser re tira d o s d e
p o p u la ç ã o c o m u m a d istrib u iç ã o n o rm a l (v er C a p ítu lo 4). Q u a n d o as c o n d iç õ e s d o s testes :
ra m é tric o s s ã o sa tisfe itas, o s m e s m o s sã o m a is p o d e r o so s d o q u e o s testes n ã o -p a ra m é tric :
p o rta n to , p re fe rid o s p e lo s p sic ó lo g o s. E m m u ita s p e sq u isa s, n ã o p o d e m o s u sa r o s testes p?
m é tric o s, p o is n o sso s d a d o s n ã o sa tisfa z e m as c o n d iç õ e s n e c e ssá ria s para o seu uso. P o d e r"
p o r e x e m p lo , ter d a d o s a s sim é tric o s c o m a m o s tra s p e q u e n a s o u d e sig u a is - n ã o s a b e r ia " ':
c o m certeza se o s d a d o s fo r a m re tira d o s d e u m a p o p u la ç ã o c o m d istrib u iç ã o n o rm a l. O s
n ã o -p a ra m é tric o s n ã o e x ig e m c o n d iç õ e s d o s d a d o s. O s teste s d e sc rito s n e ste ca p ítu lo p c : - -
ser u s a d o s c o m se g u ra n ç a p a ra a n a lisa r d a d o s q u a n d o n ã o fo re m sa tisfe itas a s c o n d iç õ e s ::
testes p a ra m é tric o s.
N e ste ca p ítu lo vo cê a p re n d e rá a lte rn a tiv a s para:
o r de Pearson (p d e Sp e a rm a n ),
o teste t (M a n n -W h itn e y , para a m o stra s in d e p e n d e n te s, e o teste d e p o sto s d e W ilc :
para a m o stra s re la cio n a d a s)
A N O V A (K ru sk a l-W a llis, para a m o stra s in d e p e n d e n te s, e F rie d m a n , para a m o stra s ^
cio n a d a s)
Para q u e c o m p re e n d a o s testes a p r e se n ta d o s ne ste c a p ítu lo , v o cê p re c isa rá ter u m e r : í -
m e n to d o s se g u in te s co n c e ito s:
h ip ó te se s u m e b ila te rais (C a p ítu lo 3)
■ sig n ific â n c ia e statística (C a p ítu lo 3)
: in te rv a lo s d e co n fia n ç a (C a p ítu lo 3)
r d e P e arson (C a p ítu lo 5)
■ teste f (C a p ítu lo 6)
■ A N O V A (C a p ítu lo 9)
15.1 Aternativas ao r de Pearson: o p de Spearman
O r de P earso n e p (rô ) de S p e arm a n são m u ito sim ila re s. A m b o s são c o e fic ie n te s d e c o r

re la ç ã o in te rp re ta d o s da m e sm a m an eira . O r de P e a rso n é u sa d o q u a n d o o s d ad o s satisfa z em
as co n d iç õ e s d o s te ste s p a ra m é tric o s, e n q u a n to o p de S p e a rm a n é u sa d o q u a n d o os d a d o s
n ão sa tisfazem ta is c o n d iç õ e s - talvez, u rn a ou m ais v a riá v e is sejam p o sto s a trib u íd o s p e lo s
p a rtic ip a n te s (p. ex .. a a tra tiv id a d e de u m a p e sso a ), ou eles têm q u e c o lo c a r fo to s em o rd em
de p re fe rê n c ia . N e sse s c aso s, os d a d o s p o d e m n ão te r u m a d istrib u iç ã o n o rm al. Q u a n d o se
tem um n ú m ero p e q u e n o de p a rtic ip a n te s e não h á c e rte z a d e q u e são sa tisfe ita s as c o n d iç õ e s
p ara o r de P e arso n , u sa-se o p de S p ea rm an . E le tra n sfo rm a os e sc o re s o rig in a is e m p o sto s
an tes de fa zer o u tro s cálc u lo s.
O b se rv e os se g u in te s d ad o s. P e sq u isa d o re s p e d ira m a n o v e p e sso a s q u e a v a lia sse m a
sua atra tiv id a d e e a de o u tra p e ss o a e u san d o u m a e sc a la de 10 p o n to s: l e q u iv a le a h o rro ro
so, e 10, a m a rav ilh o so . O p e q u e n o n ú m e ro de p a rtic ip a n te s, a n a tu re z a d o s d a d o s e o fato
de m u ito s p a rtic ip a n te s te re m a v a lia d o a si p ró p rio s co m v a lo re s p ró x im o s ao m a ra v ilh o so
d ev em fa z e r você su s p e ita r de q u e os d a d o s talv ez n ão sa tisfa ç a m as c o n d iç õ e s de um teste
p aram étrico :
SPSSPW: análise de correlação - o p de Spearman

□
A b ra o seu arq u iv o de d ad o s. E sc o lh a Á naixze (A n a lisa r), Correlale (C o rre la ç a o ), Biva-

riate (B iv ariad a).
а :Ы » | " | | И й S IB t |( lr |v - |a i| ji|3 |l3 M
QJ3 Untitled - S P S S D a ta Editor B S D

g ra p h s Utilities W indow H elp
RSQprtS
a ! | H | ã | E il I falbi*
DgtCTiplrv© Statistics
10 т у в я Custom T o b ie s
C o m p ere M eans
myatt
G en era l U neor M odel
R e g re ss io n Perbal
Laglmeo/ D istan ces
G a s s ily
Qoto R eduction
S c a le
N onperam etnc T ests
T ime S e r ie s
S urvival
Multiple R e s p o n s e
M issin g V a lu e A n aly sis.
T~~]\ D a ta V i e w (vanable View / I _____________ I

Br/anate S P S S P ro ce sso r is re a d y
S B S ta rt | . T jC W - 1 l l p j U n l i - J J L - j -'I I ? ]3 F S I jH o w I ijjy .w I И ] chop

Estatística Não-Paramétrica
Nos c a p í t u l o s a n t e r i o r e s , v o c ê foi a p r e se n ta d o a o s testes p a ra m é trico s, q ue, c o m o s a
bem os, exigem c e r t a s c o n d i ç õ e s . O s d a d o s p re cisa m , p o r e x e m p lo , ser re tira d o s d e u m a
p o p u la ç ã o c o m u m a d istrib u içã o n o rm a l (ver C a p ít u lo 4 ). Q u a n d o as c o n d iç õ e s d o s teste s p a
ra m é tric o s s ã o satisfe itas, o s m e s m o s sã o m a is p o d e r o so s d o q u e o s testes n ã o - p a r a m é t r i c o s e.
p o rta n to , p re fe rid o s p e lo s p sic ó lo g o s. E m m u ita s p e sq u isa s, n ã o p o d e m o s u sa r o s testes p a ra
m é tric o s, p o is n o s s o s d a d o s n ã o sa tisfa z e m a s c o n d iç õ e s n e c e ssá ria s p a ra o seu uso . P o d e m o s,
p o r e x e m p lo , ter d a d o s a ssim é tric o s c o m a m o s tra s p e q u e n a s o u d e sig u a is - n ã o sa b e ría m o s
c o m certeza se o s d a d o s fo ra m re tira d o s d e u m a p o p u la ç ã o c o m d istrib u iç ã o n o rm a l. O s testes
n ã o -p a ra m é tric o s n ã o e x ig e m c o n d iç õ e s d o s d a d o s. O s testes d e sc rito s ne ste c a p ítu lo p o d e m
ser u s a d o s c o m se g u ra n ç a p ara a n a lisa r d a d o s q u a n d o n ã o fo re m sa tisfe itas a s c o n d iç õ e s d o s
testes p a ra m é tric o s.
N e ste c a p ítu lo vo cê a p re n d e rá a lte rn a tiv a s para:
■ o r d e P e arson (p d e Sp e a rm a n ),
o teste t (M a n n -W h itn e y , para a m o stra s In d e p e n d e n te s, e o teste d e p o s to s d e W ilc o x o n ,
p ara a m o stra s re la cio n a d a s)
■ A N O V A (K ru sk a l-W a llis, para a m o stra s in d e p e n d e n te s, e F rie d m a n , para a m o stra s re la
c io n a d a s)
Para q u e c o m p re e n d a o s testes a p re se n ta d o s ne ste c a p ítu lo , v o cê p re cisa rá ter u m e n te n d i
m e n to d o s se g u in te s co n c e ito s:
■ h ip ó te se s uni e b ila te rais (C a p ítu lo 3)
■ sign ific a n c ia e sta tística (C a p ítu lo 3)
■ in te rv a lo s d e c o n fia n ç a (C a p ítu lo 3)
r d e P e arson (C a p ítu lo 5)
■ teste t (C a p ítu lo 6)
■ A N O V A (C a p ítu lo 9)
15.1 Aternativas ao rde Pearson: o p de Spearman
O r d e P e a rso n e p (rô ) de S p e a rm a n são m u ito sim ilare s. A m b o s são co e fic ie n te s de co r

rela ç ã o in te rp re ta d o s d a m esm a m an e ira . O r de P ea rso n é u sa d o q u an d o os d ad o s sa tisfa ze m
as c o n d iç õ e s d o s teste s p a ra m é tric o s, e n q u a n to o p de S p e a rm a n é u sa d o q u a n d o os d a d o s
não s a tisfa z e m tais c o n d iç õ e s - ta lv e z u m a ou m a is v ariáv e is se ja m p o sto s a trib u íd o s p e lo s
p a rtic ip a n te s (p. ex ., a a tra tiv id a d e de u m a p esso a), o u eles têm q u e c o lo c a r fo to s em ord em
de p re fe rê n c ia . N e sse s c a so s, o s d a d o s p o d em não te r u m a d is trib u iç ã o n o rm a l. Q u a n d o se
tem um n ú m e ro p e q u e n o d e p a rtic ip a n te s e n ão há c e rte z a d e que são satisfe ita s as c o n d içõ e s
p a ra o r de P e a rs o n , u sa-se o p de S p e arm a n . E le tra n sfo rm a os e sc o re s o rig in a is em p o sto s
an tes de fazer o u tro s cálc u lo s.
O b se rv e os se g u in te s d a d o s. P e sq u isa d o re s p e d ira m a nove p e ss o a s q u e a v a lia sse m a
sua a trativ id ad e e a de o u tra p e sso a e u san d o u m a e sc a la de 10 p o n to s: l eq u iv a le a h o rro ro
so, e 10, a m a ra v ilh o so . O p e q u e n o n ú m e ro de p a rtic ip a n te s, a n a tu re z a dos d a d o s e o fato
de m u ito s p a rtic ip a n te s te re m a v a lia d o a si p ró p rio s c o m v alo res p ró x im o s ao m a ra v ilh o so
d ev em fazer você s u s p e ita r de q u e os d a d o s ta lv e z n ã o sa tisfa ça m as c o n d iç õ e s de u m teste
param étrico :
SPSSPW: análise de correlação - o p de Spearman
A b ra o seu a rq u iv o de d ad o s. E sc o lh a A nalyze (A n a lisa r), Correlate (C o rre la ç ã o ), Biva-

riate (B ivariada).
l i T P !q u u i* l"ll°8 lry l» h . UI i r r t - ' l
&'|a|a| sil - ReQorts ►

‘ D g scn p live Statistics »
10 tlìyaJl Custom T o b ie s »
C o m p are ítfeans » *
myatt I
1
- (¿eneral L inear M odel *
1 C orrelate *
R e g re ss io n ► Partial
L eg lin eer > d ista n c e s
C la ssify *"
D a ta R eduction *
S c a le »
6 OU N o n paiam etric T e sts »
1Hü T im e S e r ie s ►
S urvival »
Multiple R e s p o n s e »
■ M issing V a lu e A n aly sis
I f\Data view (variable View / 1 < |_________________) j r 1

B v a n a te S P S S P ro ce sso r is read y
;J3 S la n | _ 7 jC \W H g lU n li. . .¿ J E .. .I I V] S^S | ?] H i. | u g j .-.„iZ | g jd a p O®* 120-1

A parecerá a caix a de d iálogo d a co rrelação bivariada, c o m o você ap ren d eu no C apítulo 5.
h íj íj & mi
__________I f * - - t e Untried SPSSPjtj . iS o ^ w l - -- I iyu- ’ ■
■'-■
J________ [ ^
D essa vez você deve c e rtifica r-se d e q u e m arco u a o p çã o Spearm an.

M o v a as v ariá v eis de in te re sse d a esq u e rd a p a ra a lista de v ariá v eis à d ireita. P a ra o b ter
e sta tístic a s d e sc ritiv a s, e sc o lh a O ptions (O p ç õ e s). T o d av ia, tais e sta tístic a s p o d e m não ser
relevantes. C liq u e em O K p a ra o b te r a se g u in te saída:
Correlations (Correlaçoes)
a ttra c tiv e n e s s o f
my a ttra c tiv e n e s s p e rso n (atrativi
(minha atratividade) dade da pessoa)
C o rre la tio n
C o e ffic ie n t
1 .0 0 0 .9 2 1 **
Spearman's rho m y a ttra c tiv e n e s s (Coeficiente de
(p de Spearman) (minha atratividade) Correlação)
Sig . (1 -tailed )
(Sig. .0 0 0
Unilateral)
N 9 9
Correlation
attractiveness of Coefficient
.9 2 1 ** 1.000
person (atratividade (Coeficiente de
da pessoa) Correlação)
Sig. (1-tailed)
(Sig. .000
Unilateral)
N 9 9
a. Co-relation is significant at the .01 level (1 -tailed) (** A correlação e significante no nível 0,01 unilateral.)
C om o na m atriz p ara o r de P earson, precisam os som ente p restar atenção em um a m etade da

m atriz. A qui você pode ver que existem nove grupos de escores e que a co rrelação entre as avalia
ções dadas a si e a outra pessoa é 0.92, U m a relação dessa fo rça tem som ente um a chance m uilo
pequena de o co rrer p o r erro am ostrai (p < 0,001), sendo a h ipótese n u la verdadeira. A m aneira
com o avaliam os a atratividade em outros se relaciona a quão atraentes acreditam os ser.
dor e contrações uterinas durante a amamentação
H ô ld c ro ft e c o la b o ra d o re s (2 0 0 2 ) re a liz a ra m um e s tu d o e n tre m u lh e re s q u e a m a m e n ta v a m
p a ra d e s c o b r ir se a in te n s id a d e d a d o r a b d o m in a l e d a s c o n tra ç õ e s u te rin a s d ife re e m fu n ç ã o
d o n ú m e ro de p a rto s q u e tiv e ra m . U m a e sc a la v isu a l a n á lo g a (E V A ) e o q u e s tio n á rio d e d o r da
M c G ill {M cG ill Pain Q u e stio n n a ire) fo ra m u sa d o s p a ra m e d ir a in te n sid a d e d a dor. E sse q u e s
tio n á rio te m q u a tro d im e n s õ e s (s e n s o ria l, a fe tiv a , a v a lia tiv a e m is c e lâ n e a s ), e c a d a u m a p o ssu i
n ú m e ro s v a ria d o s de su b c la sse s . U m ín d ic e de in te n sid a d e to tal de d o r (IT D ) (lo ta ip ain intensity
ín d ex ) p o d e se r c a lc u la d o . O s p e s q u is a d o re s e n tã o u sa ra m o p d e S p e a rm a n p a ra a n a lis a r as re la
çõ e s e n tre v a riá v e is.
E m b o ra os p e sq u isa d o re s in fo rm e m q u e e sta b e le c e ra m o nível de sig n ific a n c ia d e 0 .0 5 , a ss e
g u ram qu e ao leito r é d a d a to d a a in fo rm aç ã o n e c e ssá ria p o r m eio d o relato tan to do c o e fic ie n te de
co rre la ç ã o q u an to d o s v alo res p.
O s p e sq u isa d o re s rela ta m alg u n s de seu s re su lta d o s d a se g u in te form a:
[...] tuna correlação positiva c significativa fo i encontrada para o relacionamento entre os escores
ITD e EVA durante a amamentação, com a duração m édia das contrações uterinas (ITD: p = 0,49, p =
0,006: EVA: ri.5 = 0,40, p = 0.03 1. mas não para o número de contrações uterinas. Nem os escores cla ITD
nem os de EVA observados para a menstruação estavam significativamente correlacionados tanto com o
número quanto com a duração das contrações m erinas durante a amamentação.
A lg u n s dos seus re su lta d o s são a p re se n ta d o s em fo rm a de ta b e la (v er T ab ela 15.1). R e lata m o s

so m en te p arte da ta b e la de re su lta d o s, a q u e se re fe re à d im e n sã o se n so ria l. E la a p re s e n ta 10 su b
c lasses. O s v alo res d essas su b c la sse s estã o c o rre la c io n a d o s co m a d o r d u ra n te a a m a m e n ta ç ã o e a
m en stru a ç ã o . A qui re g istra m o s so m e n te o s re su lta d o s d a d o r d u ra n te a a m am en ta ç ã o .
O s p e sq u isa d o re s fo rn e c e m um p e q u e n o re su m o no artig o , c h a m a n d o a a te n ç ã o do leito r p ara
Oi, p o n to s q ue eles c o n sid e ra m im p o rtan te s.
Tabela 15.1 Coeficiente de correlação de Spearman e valores p para o parto, a amamentação e as

subclasses sensoriais
Subclasse P
Temporal 0.33 0.02

Espacial 0.28 0,05
Pressão pontual 0,21 0.14
Pressão aguda 0,04 0.80
Pressão constritiva 0,34 0.02
Pressão de tração 0,12 0.42
Termal 0.19 0,18
Claridade -0.10 0.50
Dor indefinida 0.39 0.01
Outros 0.09 0.54
A interpretação dos resultados da Tabela 15.1 é uma questão de observação da força, da direção e dos valores das
probabilidades associadas como um todo. Pode-se observar que “Outros” não está relacionada ao número de partos.
Mesmo sem um conhecimento do valor de probabilidade associada (0,54), o coeficiente de correlação é quase zero.
O diagrama de dispersão não mostraria um padrão específico. Embora ’■Claridade" tenha um coeficiente de correla
ção negativo, é muito fraco, e o valor de probabilidade associada de 0,50 provavelmente significa que ocorreu devido
ao erro amostrai.
---
Atividade 15.1
(a ) Q u a l é a c o rre la ç ã o m a is fo rte n a T a b e la 1 5 .1 ?
(b) D è o va lo r d a p ro b a b ilid a d e d o co e ficie n te d e c o rre la ç ã o m a is fraco.
Exercício 1
U m a p ro fe sso ra de a le m ã o le c io n a p a ra um g ru p o d e cin c o alu n o s. E la su p õ e q u e q u an to
m ais c o n fia n ç a o alu n o d e m o n s tra r ao fa la r ( I - e x tre m a m e n te c o n fia n te , 5 - sem co n fian ça),
m e lh o r o d e sem p e n h o . E la q u e r c o rre la c io n a r essa v ariáv el co m o d e se m p e n h o em um ex am e
oral. U m a p ro fe sso ra d iferen te fo rn e c eu as a v a liaçõ es d o s alu n o s em um ex a m e o ra l (1 - sem
ch an ce a lg u m a, 5 - e x celen te).
Pessoa Confiança Desempenho no exame oral
Ahmed 2 5
Bella 3 3
Carol 1 5
Darren 4 4
Elke 5 1
E n tre c o m os d a d o s no S P S S P W , fa ç a u m a a n á lise a p ro p ria d a e re s p o n d a às se g u in te s

q u estõ es. U tiliz e u m a h ip ó te se u n ilateral.
1. Q ual é o v a lo r d o c o e fic ie n te d e c o rre la ç ã o ?
2. Q u al é o v alo r d o nível d e sig n ific a n c ia o b tid o ?
O q u e se p o d e c o n c lu ir d essa a n á lise ?
15.2 Alternativas ao teste í: Mann-Whitney e Wilcoxon
O s testes M a n n -W h itn e y e W ilc o x o n avaliam se e xiste uma diferença e sta tístic a s ig n ifi
c a tiva en tre a s m é d ia s cios p o s to s d a s d u a s c o n d iç õ e s. O teste M a n n -W h itn e y é u sad o q u a n d o
há p a rtic ip a n te s d ife re n te s em c a d a c o n d iç ã o . O teste W ilcoxon é u sa d o q u a n d o h á os m esm o s
p artic ip a n te s ou p a rtic ip a n te s e m p a re lh a d o s nas d u as c o n d iç õ e s.
O W ilc o x o n e q u iv a le ao M a n n -W h itn e y , e m b o ra as fó rm u la s p a ra os d o is te stes sejam
u m p o u co d ife re n te s, p o is no p rim e iro p o d e m o s u sa r o fato d e q u e os m esm o s p artic ip a n te s
estão em am b a s as c o n d iç õ e s. E sses te ste s são m u ito m ais sim p le s q u e os te ste s t, p o is não
en v o lv em c á lc u lo s de m éd ias, d e sv io s p a d rõ es e e rro s p ad rõ es. A m b o s os testes p re c isam que
os esco res de d u as co n d iç õ e s se ja m o rd e n a d o s a fim d e q u e o te ste e sta tístic o se ja c a lc u la d o
a p artir d e ssa s o rd en a ç õ e s.
15.2.1 Mann-Whitney (delineamento independente)
C o n sid e re o se g u in te e stu d o . D o z e p a rtic ip a n te s fize ra m p arte de um e x p e rim e n to p a ra

av a lia r a atra tiv id a d e d e u m a m u lh e r e um h o m e m q u e a ssistira m a um v íd eo de bom h u m o r
ou de m au hum or. C o m o os p a rtic ip a n te s to m aram p arte de so m e n te u m a c o n d içã o , o d e lin e
a m e n to é e n tre p a rtic ip a n te s ou d e lin e a m e n to in d e p e n d e n te . O s d a d o s fo rn e c id o s na T ab ela
15.2 são av aliaçõ e s d ad as p e lo s p a rtic ip a n te s (de 2 0 ) p a ra a m u lh e r de b o m h u m o r ou d e m au
h u m or. A m u lh er, u m a a triz , foi a m e sm a em a m b a s as c o n d iç õ e s. F o ra m p la n e ja d o s seis
p a rtic ip a n te s em c a d a g ru p o , m as in fe liz m e n te um e rro o c o rreu : um p a rtic ip a n te q u e d ev eria
e sta r na c o n d iç ã o b o m h u m o r foi a c id e n ta lm e n te c o lo c a d o na c o n d iç ã o m au hum or. S u p o m o s
qu e h aja urna d ife re n ç a sig n ific an te en tre as av alia ç õ e s d ad as p elo s p a rtic ip a n te s na co n d iç ã o
b o m h u m o r e os d a c o n d iç ã o m au hum or. N o te que p ara esse ex e m p lo a h ip ó te se é b ilateral,
q u e r dizer, n ão se p re v ê a d ire ç ã o d a d iferen ça.
Tabela 15.2 Avaliações dadas por participantes sobre alguém de bom ou mau humor
Bom humor Mau hum or
7.00 4,00
15,tXJ 6.00
14.00 11.00
3.00 7,00
17.0(1 9.00
4.00
7.00
15.2.2 Estatísticas descritivas
A s e s ta tístic a s d e m o n s tra d a s n a T a b e la 15.3 fo ra m o b tid a s p e lo p ro c e d im e n to Explore

no S PS S P W .
P o d e -s e v e r na T a b e la 15.3 q u e as a v a lia ç õ e s n a c o n d iç ã o b o m h u m o r são m ais altas
do q u e na c o n d iç ã o m au h u m o r: e sc o re s n a c o n d iç ã o b o m h u m o r têm m a io r v a ria b ilid a d e ,
c o m o d e m o n s tra d o p elo d e sv io p a d rão . U m a in sp e ç ã o d o s h isto g ra m a s (n ão m o stra d a a q u i)
in d ico u q ue os d a d o s n ão têm u m a d istrib u iç ã o no rm al e j á sab em o s q u e a a m o stra é p eq u en a.
P o rtan to , a m ed id a m ais a p ro p ria d a de te n d ê n c ia c en tral é a m ed ian a, em vez d a me'dia. A lém
d isso , n ão d ev em o s u sa r o teste /, e sim o seu e q u iv a len te n ã o -p a ra m é tric o , q u e n esse caso é
o M an n -W h itn ey .
C o m o M an n -W h itn e y , os esc o re s d e to d o s os p a rtic ip a n te s são o rd e n a d o s do m ais b a ix o
ao m ais alto p a ra q u e o teste c a lc u le o n ú m e ro d e v ezes q u e u m a c o n d iç ã o é o rd e n a d a c o m o
m ais a lta q u e a outra.
Tabela 15.3 Estatísticas descritivas obtidas pelo procedimento Explore para participantes nas
condições bom humor e mau humor
Bom humor M au hum or
M édia DP M ed ian a M édia DP M ediana

I 1,2 5.9 14.0 6,9 2.5 7.0
A T ab ela 15,4 m o stra as av a lia ç õ e s c o n fe rid a s àc d u as c o n d iç õ e s e o s p o sto s d a d o s aos

esco res. E m b o ra e x ista m d u a s c o n d iç õ e s, a m b o s os g ru p o s de e sc o re s são c o n sid e ra d o s ju n
tos no p ro c e sso de o rd e n a m e n to . Você a p re n d eu a o rd e n a r os e sc o re s no C a p ítu lo 2. A q u i. o
e sco re m ais b a ix o é 3 (n a c o n d iç ã o b o m h u m o r); p o rtan to , a ele é d a d o o p rim e iro posto. O
seg u n d o e sco re m ais b aix o é 4 (q u e o c o rre d u a s v ezes na c o n d iç ã o m au h u m o r). E n tão você
tem de d iv id ir os p o sto s 2 e 3 e n tre os d o is e sc o re s ((2 + 3 )/2 = 2 ,5 ). U m a v e z o rd e n a d o s
to d o s os d a d o s, a d ic io n a m o s os p o sto s se p a ra d a m e n te p a ra c a d a p o sição .
S e n ão e x is te d ife re n ç a e n tre o s d o is g ru p o s , p o s to s b a ix o s e a lto s o c o rr e rã o q u a se
ig u a lm e n te no s d o is g ru p o s , e a s o m a d o s p o sto s s e rá p a re c id a . C o m o v o c ê p o d e o b se rv a r,
a m a io ria d o s p o s to s a lto s e s tá e m u m g ru p o , o d o b o m h u m o r, e a m a io ria d o s p o s
tos b a ix o s , no g ru p o m au h u m o r. P o rta n to , a so m a d o s p o s to s é m a is a lta no g ru p o b o ir
h u m o r. T o d a v ia , c o m o e x is te u m n ú m e ro d if e re n te d e p a rtic ip a n te s n a s d u a s c o n d iç õ e s ,
p re c is a m o s e n c o n tr a r o p o s to m é d io . O b s e rv a r o s d a d o s já é ú til, m a s é d ifíc il v e r se os
p o s to s a lto s e b a ix o s e s tã o d is trib u íd o s ig u a lm e n te n a s d u a s c o n d iç õ e s p e la o b se rv a ç ã o
d o s d a d o s. P o d e -s e v er q u e o p o sto m é d io d o g ru p o b o m h u m o r (8 ) é m a is a lto q u e o poste
m é d io d o g ru p o m a u h u m o r (5 ). Isso n o s d iz q u e o s g ru p o s sã o d if e re n te s , e a e s ta tís tic a
(U ) c a lc u la d a (co m b a se n o n ú m e ro d e p a rtic ip a n te s e m c a d a g ru p o e n a so m a d o s p o sto s
se rá a s s o c ia d a a u m v a lo r d e p ro b a b ilid a d e b a ix o . Isso in d ic a rá a p ro b a b ilid a d e d e tal r e
s u lta d o o c o rr e r p o r e rro a m o s tra i. E n tã o , q u a l é a p ro b a b ilid a d e d e a d ife re n ç a n o s p o sto s
te r o c o rrid o p o r e rro a m o s tra i?
Tabela 15.4 Escores e postos atribuídos nas duas condições
Bom Humor Mau Humor
Escore Posto 1 Escore P o sto 2
7,00 6 4.00 2,5

15,00 11 6,00 4
14,00 10 1 1,00 9
3,00 >. 1 7.00 6
17,00 12 9,00 8
4.00 2,5
7,00 6
0 escore m ais baixo
kl
oc
r
« i= 5 1 = 40
II
II
é ordenado
Posto m édio = 8 com o um Posto médio = 5 ,4
| || SPSSPW: teste de duas amostras independentes -

.■■J Mann-Whitney
E sc o lh a A nalyze (A n a lisa r), N onparam etric Tests (T estes n ã o -p a ra m é tric o s ) e In d ep en

dent Sam ples (A m o stra s in d ep en d e n tes):
File E d it y ie w Q ata
- S P S S D a t e E d ito r
Iio i.ilo r n i
lglxl
1 Q rep h s Utilities W indow H elp
ö |B |# |E j| I I b lb l M Beao,1s
D §scn p tiv e Statistics
1 sc o re
Custom T a b le s
score conditic Com(,e,eMe0"s

---------- - G en era l lin e a r M odel
7 00
Correlate
15 00 1 B e g re ss io n
14 00 Loglm ear
3 00 C la ssify
D a ta Reduction
17 00
Scale
4 00
I M onparam etnc T e s t s 1 Chi-Sq uare
6 00 T jrn e S e r ie s * Binom ial
11 00 Survive! * B u ns.
7 00 Multiple R e s p o n s e * 1-S am p le K-S.

M issing y e lu e A n aly sis 1 2 Independent S a m p le s
’ £ Independent S a m p le s
2 Ftejated S a m p le s
UU К R e la te d S a m p le s
n \ D a t a V ievv \ V a f k i t l e i- 1
2 Independent S a m p le s S P S S P ro ce sso r is r e a d y
jifi S ta r t j VJ Iribú- | _}]R ¿ b [ _ j]R ? b | Find | Micro | _j^ £ < p lü [[¡¡Н т]тн п f V j Outpu | j j f - í О '
S erá ab erta a caix a de d iálo g o Two-lndependent-Sum ples (D uas am o stras in dependentes).
1 в г1 аЫ 4 и и И Е1 i L - e k i l o i - Ы - ч з Ы з 1 в |и |
-Ifllxl
F ile {¿dit V ie w ß a ta Transform A n a ly te ¿ra p h s Utilities W indow Help
I I ì= I G?I Ol T | | - 1 U|¿E|I .| -I'^l

1 . sc o re 7
Mova a variável
independente
para a caixa
Grouping Variable
(Variável de
Agrupamento) e
d:que em Define
Groups (Definir
Grupos), como
você fez com
o teste t.
Certifique-se
S P S S P r o c e sso r is rea d y
de defini-los.
i l f i S ta r t j V j In b o x . I _ J j R e b | _ jjR e b | Find | [ j y Micro | .¿ J E x p Io ||[ |fjr й ° и|р“ I О 19зг
D efin a os g ru p o s d a m esm a m a n e ira q u e fez p a ra o teste t e p re ssio n e C ontìnue (C o n ti

nue). C ertifiq u e -se de q u e a o p ção M ann-W hitney foi m arcad a.
T E ü íJ
File £dit View* Qeila TfCWisfunri Anoly/t! (¿mplis IJtililiws Winder** Help
Definim os os
grupos aqui
M arque o
U de M ann
W hitney
¡iB Start I V j Inbox I _ J j P e b | _ J jR e b | Fine | ¡ffiM ia o | _¿ jE » p lQ ||[j^ m a n Outpu [ !
P re ssio n e Continue e d e p o is OK. S erá fo rn ec id a a su a safda.

O b se rv e a se g u in te sa íd a d o S P S S P W . A p rim e ira se ç ã o d a sa íd a nos m o stra o s p o sto s
m éd io s p ara a m b o s os g ru p o s e a so m a d o s p o sto s. Você p o d e v e rific a r o n ú m ero de p a rtic i
p an tes em c ad a co n d içã o .
Ranks (Postos)
Mean Rank Sum of Ranks
mood (humor) N (Posto Médio) (Soma dos Postos)
good mood
SCORE (ESCORE) (bom humor)
5 8.00 40.00
bad mood 7 5.43 38.00

(mau humor)
Total 12
A p ró x im a seção traz o v alo r do teste e sta tístic o , n esse c aso o U d e M a n n -W h itn e y , que
é 10.00.
Test Statistics11(Estatísticas do Testeb)
SCORE (ESCORE)
Mann-Whitney U
10.000
(U de Mann-Whitney)
Wilcoxon W (W de Wilcoxon) 38.000

Esse é o nível de
Z -1 .2 2 9
/ probabilidade associada
Asymp. Sig. (2-tailed) / com a hipótese bilateral
.219
(Sig. Assintótica Bilateral)
Exact Sig. [2* (1-tailed Sig.)]
.268"
(Sig. Exata)
a. Not corrected for ties (a. Não corrigido para empates)
b. Grouping Variable: mood (b Variável de Agrupamento: humor)
Sig. = Significance
15.2.3 Partes importantes da saída

A sa íd a m o stra o v a lo r d o U de M an n -W h itn e y , q u e é 10 (e tam b é m o v alo r eq u iv a le n te
de W ). E sta m o s so m e n te in te re ssa d o s em U . e m b o ra a c o n v ersã o p a ra um e sco re z seja útil,
p o is j d á u m a m e d id a d o ta m a n h o d o e fe ito (v e r p á g in a 1 1 2 -1 13). O v a lo r d a p ro b a b ilid a d e
asso c ia d a é 0 .2 2 . S ig n ific a q u e, se a h ip ó te se n u la fo r v erd a d e ira , ex iste u m a c h a n c e de 2 2 %
de se a c h a r um v alo r U de 10. N ão e sta m o s d is p o sto s a a rrisc a r; e n tão , c o n c lu ím o s q u e não
tem o s p ro v as o su ficie n te p a ra a firm a r q u e as a v aliaç õ es de a tra tiv id a d e dos p a rtic ip a n te s são
in flu e n c ia d a s p e lo h u m o r d a atriz (b o m o u m au ).
O s re su lta d o s p o d e m ser a ssim rela ta d o s:
Histogram as para as duas condições foram inspecionados separadam ente. Como os dados
eram assimétricos e o número de participantes pequeno, o leste estatístico mais apropriado foi o
Mann-Whitney. As estatísticas descritivas mostraram que os participantes que avaliaram a atrativi
dade de um ator de bom humor atribuíram notas mais altas (mediana = 14) do que os participantes
que o avaliaram de mau hum or (mediana = 7). Entretanto, o U de M ann-W hitney foi 10 (/. = -1 ,2 3 )
com um valor de probabilidade associada de 0,22, que mostra ser possível que as avaliações mais
altas na condição BOM HUMOR tenham ocorrido por erro amostrai. Portanto, não existem provas
o suficiente para concluir que os participantes foram influenciados pelo hum or dos atores quando
faziam julgam entos sobre as suas aparências.
Exemplo da literatura: mulheres grávidas e HIV

O s re s u lta d o s d e m o n s tra d o s na T ab ela 15.4 fo ra m re tira d o s de um artig o e sc rito p o r S h e rr e
c o la b o ra d o re s ( 19 9 6 ) so b re HIV. O s p e sq u isa d o re s c o m p a ra ra m , em v ariáv eis d ife re n te s, m u lh eres
g rá v id as qu e c o n c o rd a ra m e m faz er um teste de H IV g ra tu ito e m u lh e re s g rá v id a s q u e se re c u sa ra m
a fa z ê -lo (n = 7 6 ). U m su b g ru p o d o s re su lta d o s a p re se n ta d o s e stá re la ta d o a b aix o .
Você p o d e ver q ue S h e rr e c o la b o ra d o re s re la tara m n ão só c o m p a ra ç õ e s “ n ã o -s ig n ific a n te s” ,
c o m o tam b ém aq u ela s d e c la rad a s c o m o e sta tistica m e n te sig n ificativ as. N o te que tam b ém relataram
os níveis de p ro b ab ilid ad e ex ata d as v ariáv eis q u e c o n sid e ra ra m e sta tistic a m e n te sig n ificativ as. R e la
tar os valores c e U ( o teste e statístic o M a n n -W h itn e y ) p erm ite que se v isu a liz e a fo rça da d iferen ça.
P o r e x em p lo , “ P re o c u p a ç ã o em fa zer um te ste d e H IV " in d ic a q u e a v ariaç ã o e n tre a d ife re n ç a d a
m éd ia esp e ra d a (entre as d u as c o n d içõ e s) e a real d ife re n ç a d a m éd ia é q u ase 2 ,5 d esv io s p a d rõ e s .1
Seção de resultados de Sherr e colaboradores (1996, por permissão de Taylor & Francis Ltd.
T ab e la 15.4
www.tadf.co.uk/journals)
., ., , Teste de Independência „. ... „ .

Variavel ... , , Sigmficancia
(U de Mann-Whitney)
Idade U = 199.5, z = -0,269 n.s.

Número de gestações anteriores U = 130,0. z = 1,975 0,05
Duração da atual gestação U= 195.0, z = -0.369 n.s.
Nível de conhecimento sobre HIV/AIDS U = 152,5, ; = 1,428 n.s.
Preocupação em fazer um teste de HIV U = 91.0, - = 2,363 0.0?.
Ressentimento com o fato de fazer um teste de HIV U = 79,5. : = 2.055 0,05
1Nesse caso estamos nos referindo às diferenças de postos em ve/ de escores.

E n tretan to , pela tab ela a p resen tad a, você não sabe a direção da d iferen ça. Q u e r dizer, qual grupo
tem o m aio r esco re em "P re o c u p a çã o em fazer um teste de H IV ” ? N ão sab em o s pela tab ela a p re se n ta
da. T eríam os de o lh ar a tab ela de m éd ias ou ler o artig o co m p leto . A lém disso, alg u n s valo res U estão
asso ciad o s a valores z p ositivos e o u tro s a valo res r. negativos. Isso reflete a d ireção d a diferen ça. T o
davia, teríam os de ler o artig o orig in al p ara in te rp re ta r os resu ltad o s com m ais d etalh es (a re ferên cia
é dada no final deste cap ítu lo , caso você q u eira in terp re ta r os resu ltad o s). C orno os au to res nos deram
p ro b ab ilid ad es exatas de alg u n s resu ltad o s, tam b ém p o d eriam te r fo rn ecid o as p ro b ab ilid ad es exatas
dos outros. A ssim , além de e x am in ar "n .s.” co n tra “ Id a d e", p o r que não re la tar a p ro b ab ilid ad e ex ata
tam b ém ? Faz parte de u m a boa p rática re la ta r p ro b ab ilid a d es ex atas p ara q u e o leito r p o ssa co n firm ar
os resultados, em vez de d e p en d e r co m p le tam e n te d a in terp retação d ad a p elo s au to res do artigo.
Atividade 15.2
O b se rve a se g u in te sa íd a d e u m a a n á lise d e M a n n -W h it n e y c o n d u z id a e m u m g r u p o ex
p e rim e n ta l versus u m g r u p o co n tro le . A variáve l d e p e n d e n te foi u m a a va lia çã o d e n o m in a d a
E S C O R E . A h ip ó te se d o p e sq u isa d o r é d e q u e o g r u p o e x p e rim e n ta l terá e score s sign ifica n te
m e n te m a is a lto s.
M ann-W hitney
Postos
Mean rank Sum of Ranks

GROUP (GRUPO) N (Posto Médio) (Soma dos Postos)
SCORE (Escore) experimental 5 9.30 46 .5 0
control (controle) 7 4.50 31.50
Total 12
Test Statistics11(Estatísticas do Testeb)
SCORE (ESCORE)
Mann-Whitney U
3.500
(U de Mann-Whitney)
Wilcoxon W (W de Wilcoxon) 31 .5 00 SPSS agora dá dois tipos de testes de

significância para tabulações cruzadas e
Z -2.29 8^ testes náo-paramétricos.
Asymp. Sig. (2-tailed) A significância assintótica se baseia em
^ -^ ^ 0 2 2
(Sig. Assintótica Bilateral) amostras grandes. A exata é usada quando
Exata[2*(1 -tailed Sig.)]'
os dados são pequenos, não-balanceados ou
(Sig. Exata) 0 .0 1 8 a não satisfazem a condição de normalidade.
a. Not corrected for ties (a. Não corrigido para empates)

b. Grouping Variable: GROUP (b. Variável de Agrupamento: grupo)
O q u e vo cê p o d e co n clu ir d e ssa a n á lise ?

Exercício 2
U m a p s ic ó lo g a c o n fe r e n c is ta e s tá c o n d u z in d o u m p e q u e n o e s tu d o p ilo to p a ra d e s
c o b rir se o s a lu n o s p re f e re m a p re n d e r o seu m ó d u lo d e e s ta tís tic a a v a n ç a d a p o r m e io d e
a u la s e x p o sitiv a s o u d a a b o rd a g e m d o a p re n d iz a d o b a se a d o e m p ro b le m a s (A B P ). O g ru p o
é c o m p o s to d e s o m e n te 12 p e ss o a s: p o rta n to , se is sã o a lo c a d a s p a ra o g ru p o tra d ic io n a l e
se is p a ra o g ru p o A B P. A p s ic ó lo g a e n tã o e n s in a o m ó d u lo d u a s v e z e s e m d ia s d ife re n te s
(e la a d o ra e ss e m ó d u lo !). C o m o q u e r s a b e r o q u e o s a lu n o s a c h a m so b re a su a a p r e n d i
z a g e m e a o m e s m o te m p o tira r m e d id a s d e d e s e m p e n h o , e la p e d e a e le s q u e a v a lie m o
q u a n to g o s ta ra m d o c u rs o (e s c a la de 1 a 7 , n a q u al 1 s ig n ific a re a lm e n te d e s a g ra d á v e l, e 7
e x tre m a m e n te a g ra d á v e l), e n tre v á ria s o u tra s m e d id a s. E la n ã o p rev ê q u a l a b o rd a g e m será
a m a is a g ra d á v e l p a ra os a lu n o s.
ABP Tradicional
5 4
7 6
4 4
5 4
7 I
6 2
E ntre co m o s d a d o s no S P S S P W e c o n d u z a um teste M an n -W h itn e y . D ê u m a e x p lic a ç ã o

p e r esc rito do sig n ific ad o d o s resu ltad o s.
15.2.4 Alternativa ao teste t emparelhado: Wilcoxon

O teste W ilc o x o n ta m b ém tra n sfo rm a e sc o re s em p o sto s a n tes de c a lc u la r a e sta tístic a d o
teste (v e r p á g in a 53 8 ).
C o n sid e re o se g u in te estu d o : e n fe rm e iro s g e ra is re c e b e ra m um q u e stio n á rio q u e m ed ia o
nível de sim p a tia c o m p a c ie n te s q u e so fre m de e sc le ro se m ú ltip la (E M ); p a ra c a d a e n fe rm e i
ro. u m esco re total (de 10) foi c a lc u la d o . O s e n fe rm e iro s e n tã o p a rtic ip a ra m de u m g ru p o de
d isc u ssã o (u m a h o ra ), q u e in clu ía p a c ie n te s c o m E M . M ais ta rd e , um q u e stio n á rio p a rec id o
foi d a d o n o v am e n te a eles. O b v ia m e n te , e sse é um d e lin e a m e n to d en tre p a rtic ip a n te s, p ois os
m esm o s p a rtic ip a n te s e stão se n d o m e d id o s n as c o n d iç õ e s “ a n te s" e "d e p o is” . A q u i e sta b e le
c e re m o s u m a h ip ó te se d ire c io n a l. E la deve se r d e fin id a q u a n d o e x iste m p ro v as q u e a p ó ia m
a d ire ç ã o , p o r ex e m p lo , de e stu d o s já feito s. N o ssa h ip ó te se é de q u e h a v e rá u m a d ife re n ç a
sig n ific a tiv a e n tre o s e sc o re s a n te s e depois» d a d isc u ssã o , de m o d o q u e e ste s se ja m m aio res
ap ó s a d iscu ssão . O b se rv e q u e essa é u m a h ip ó tese u n ila tera l, p o is e sp ec ific a m o s a d ire çã o d a
d iferen ça. O s esc o re s d o s e n fe rm e iro s e stã o na T ab ela 15.5.
A s v ezes, os d ad o s d e a m o stra s p e q u e n a s são a ssim é tric o s, e a m é d ia p o d e n ão ¿er a p ro
p ria d a - n esse ca so re la te a m ed ia n a . Você p re c isa rá o b se rv a r h isto g ra m a s p ara d e sc o b rir se
esse é o caso.
T abela 15.5 Escores de simpatia de enfermeiros antes e depois da discussão
Antes da discussão Depois da discussão
5.00 7.00
6.00 6.00
2.00 3.00
4.00 8,00
6.00 7,00
7.00 6,00
3.00 7,00
5.00 8.00
5.00 5.00
5.00 8,00
E m b o ra o h isto g ra m a p ara a c o n d iç ã o a n te s não p a reça ser m u ito a ssim é tric o (v er Figurr.

15.1), a c o n d iç ã o depois m o stra u m a a ss im e tria n eg ativ a (v e r F ig u ra 15.2). T o d av ia, as m e
d ias e m ed ian a s são m u ito p a rec id a s. A s e sta tístic a s de resu m o estão na T abela 15.6.
Desvio padrão = 1,48

Média - 4,8
N 10
Antes
H is to g ra m a m o s tra n d o a d istrib u içã o d e fre q ü ê n c ia s p ara escore s na c o n d iç ã o antes.
Desvio padrão = 1,58

Média = 6,5
N = 10
3,0 4,0 5,0 6,0 7,0 8,0
Depois
Histogram a m ostrando a distribuição de freqüências para escores na condição depois.

Figura 15.2
T abela 15.6 Resumo estatístico
Condição ANTES Condição DEPOIS
X DP Mediana X DP Mediana
4,8 1,48 5 6,5 1,58 7
D iag ram as de c a ix a e b ig o d e s, n o v a m en te , p o d em d a r u m a b o a id éia so b re o s seus d ad o s

(v e r F ig u ra 15.3). N esse c aso . os d ia g ra m a s de c a ix a e b ig o d es c o n firm a m o q u e j á tín h a m o s
visto nos h isto g ra m a s: a m ed ia n a p ara a c o n d iç ã o d e p o is e' m a io r do q u e a da c o n d iç ã o antes,
e a co n d iç ã o a n te s tem u m a a m p litu d e m aior.
U m a in s p e ç ã o da e sta tístic a d e sc ritiv a nos m o stro u q u e os d a d o s da c o n d iç ã o d e p o is
tin h a m u m a a ss im e tria n eg ativ a. S e n d o e sse o c a so e lev a n d o em c o n sid e ra ç ã o q u e tem o s
so m en te dad o s o rd in a is e u m a a m o stra p eq u en a, se ria im p o rta n te u sa r um teste n à o -p a ram é -
trico . O m ais a p ro p ria d o p a ra e sse e stu d o se ria o teste de W ilco x o n . E x iste m b a sic a m e n te
d o is está g io s p a ra se c a lc u la r o teste de W ilco x o n : (a) d ife re n ç a s e n tre c a d a g ru p o rle esc o res
o b tid o s, e (b) d ife re n ç a s o rd e n a d a s d a m e n o r a m aior. N ã o p o d e ría m o s fa ze r isso no c a so de
um e stu d o in d e p e n d e n te , p o is não faria sen tid o e n c o n tra r as d ife re n ç a s u san d o p a rtic ip a n te s
d ife re n te s. A q u i te m o s os m e sm o s p a rtic ip a n te s em a m b a s as c o n d iç õ e s, p o rta n to te re m o s
u m teste m ais sen sív el se e n c o n tra rm o s as d ife re n ç a s e n tre as c o n d iç õ e s an tes de o rd en ar. Se
d im in u irm o s o seg u n d o do p rim eiro esc o re p a ra cad a p a rticip a n te , alg u n s terão u m a d ife re n ç a
n eg ativ a (a sua av aliaç ã o foi m aio r na c o n d iç ã o d ep o is), e a lg u n s terã o u m a d ife re n ç a p o sitiv a
(a sua av aliação foi m e n o r na c o n d iç ã o d ep o is). A lg u m a s d ife re n ç a s se rã o ig u a is a zero p o r
tan to as ig n o ram o s, pois n ão nos fo rn e c e m n e n h u m a in fo rm aç ão . Se n ão h o u v esse d ife re n ç a s
sig n ific a n te s en tre as d u as co n d iç õ e s, h av e ria um n ú m ero p a re c id o d e p o sitiv o s e neg ativ o s,
c o m o as d ife re n ç a s en tre um p a rtic ip a n te e o u tro (a lg u m a s p o sitiv as, a lg u m a s n eg ativ as) c a n
cela riam uns aos o u tro s.
1
N - 10 10
Antes Depois
D ia g ra m a d e caix a e b ig o d e s para a c o n d iç ã o antes.

538 Christine P. Dancey & John Reídy
Essa é a única D iferença Posto

diferença positiva O posto do sinal
nesse grupo de dados _2 4 positivo é 2
0 -
-1 2
-4 7.5
-I 2
1 1 2 ? sinal que mono-, ocorre (■-,)
-4 7,5
-3 5,5
0 -
-3 5,5
U m a vez e n c o n tra d a a d ife re n ç a e n tre e sc o re s, o rd e n am o s os m esm o s de m o d o igual ao

an terio r, ig n o ran d o os sin ais (c o n tin u a m o s falan d o so b re " n ó s ” fa ze n d o isso e ' n ó s” fazen d o
aq u ilo , m as na v erd ad e será o p a co te e sta tístic o q u e e sta rá fazen d o - e sta m o s so m e n te d e ta
lh an d o p ara a ju d a r você a te r u m a id é ia c o n c e itu a i d o q u e e stá a c o n te c e n d o q u a n d o o teste é
co n d u zid o ). Ig n o ra m o s e m p a te s n o s q u ais a d ife re n ç a e n tre os d o is e sc o re s é zero - e sse s não
são o rd en ad o s. O m e n o r e sc o re é 1, e e x istem três d ele s. P o rta n to , a m e d ia d o s p o sto s 1, 2 e
3 é 2 ((1 + 2 + 3) / 3 = 2).
A so m a dos p o sto s co m o sinal m e n o s fre q ü e n te (n o c a so ac im a o sin a l po sitiv o ) fo rn ece
a n o ssa e sta tístic a d e te ste , q u e c h a m a m o s de t. N e sse c a so , u m p o sto p o sitiv o o c o rre u so
m en te u m a vez. E x iste m sete p o sto s n eg ativ o s. P o rta n to , o sin al q u e m e n o s o c o rre é positivo.
D ep o is, so m am o s os posto s das d ife re n ç a s p o sitiv as (se tiv éssem o s três p a rtic ip a n te s co m e s
co res m en o res na c o n d içã o D E P O IS , e x istiriam três esco re s p o sitiv o s; so m a ría m o s os postos
d o s três p o sitiv o s). E x iste so m en te u m sinal de m ais e esse tem o p o sto de 2. E ntão, / = 2. O
q ue q u erem o s ag o ra é q u e o n o sso p a c o te p a ra o c o m p u ta d o r co n firm e n o sso s c á lc u lo s à m ão
e nos d ê a p ro b a b ilid a d e de t = 2 ter o c o rrid o p o r erro a m o strai.
| |] SPSSPW: teste de duas amostras para medidas repetidas -

. " J Wilcoxon
E sc o lh a A nalyze (A n a lisa r), N ónparam etric (N ã o -p a ra m é tric o ) e d u a s R elated Sam ples

(A m o stra s R e lac io n ad as):
•'W
immite iNo |||a,l)n»ted SPSS Dal» . | JJMmxHUon j s T e ío
A p a re c e a c a ix a de d iálo g o Two-Related-Sam ples Test (T este de D u as A m o stra s R e la c io

nadas):
As duas
variáveis
são movidas
para a Lista
Pareada
M ova as d u a s v ariáv eis d e in te re sse d a e sq u e rd a p a ra a Test Pair(s) List (L is ta P aread a)

no lad o d ireito . C e rtifiq u e -se d e q u e a o p ç ã o W ilcoxon e stá m arcad a.
Se v o cê q u e r e s ta tís tic a d e sc ritiv a , é n e c e ss á rio p re s s io n a r o b o tã o O ptions (O p ç õ es).
A p ó s p ressio n e OK.
V ocê terá a se g u in te sa íd a d o S P S S P W .
Posto médio
dos casos positivos
Ranks (Postos)
Mear Rank Sum of the Ranks
N
(Posto I /lédio) (Soma dos Postos)
BEFORE - AFTER Negative Ranks
T 4.86 34.00
(ANTES - DEPOIS) (Postos Negativos)
Positive Ranks -|b 2.00 2.00
(Postos Positivos)
Ties (Empates) T •
Total 10
b. BEFORE > AFTER (b. ANTES > DEPOIS) Ocorreram dois empates que
c. AFTER = BEFORE (c. ANTES DEPOIS) ordenamos como zero
A p ró x im a p a rte d a n o ssa saíd a in d ica as e sta tístic a s d o teste.
Test Statistics (Estatísticas do Testeb) O escore T que você pode calcular

BEFORE - AFTER à mão - ver acima é convertido
(ANTES - DEPOISi em um escore z pelo SPSSPW
Z - 2 .2 5 7 i
Asymp. Sig. (2-tailed)

(Sig. Assintótica .0 2 4 ^ ^
Bilateral)
Esse é o nível de probabilidade bilateral
a. Based on negative ranks (a. Baseado em postos nega: .osi
b. Wilcoxon Signed Ranks Tests (b. Teste de Postos de W coxon)
O N PA é 0 ,0 2 4 . T odavia, esse é um n ível de p ro b a b ilid a d e b ila te ra l, e, c o m o fize m o s um a

p rev isão d e fin itiv a d ire c io n a l, u sam o s u m a p ro b a b ilid a d e u n ila te ral. P a ra o b tê -la , d iv id im o s
o nível de p ro b a b ilid a d e b ila te ra l p o r 2. c o m o m o stra o se g u n d o item a seguir:
1. O p o sto m éd io d o s p o sto s n eg ativ o s e p o sitiv o s p o d e se r o b tid o . N o e x e m p lo , o posto

po sitiv o m é d io = 2. Isso re p re se n ta o total d o m e n o r p o sto (?) e o p o sto n eg ativ o m éd io
= 4,8 6 . V erifique v o cê m esm o a in fo rm a ç ã o acim a.
2. O e sc o re t é co n v e rtid o em um e sc o re p a d ro n iz a d o (esco re ~) p e lo S P S S P W . Isso p er
m ite q u e você v isu alize o ta m a n h o d o e sc o re /. co m re la ç ã o à m éd ia d a d istrib u iç ã o .
N o no sso c a so (v e ja a saíd a a cim a ) o e sc o re t e stá a d o is d e sv io s p a d rõ e s d a m é d ia da
d istrib u iç ã o a m o strai (q u e é se m p re 0). O N PA é d ad o , n esse c a so 0 ,0 2 5 1 . C o n tu d o ,
co m o a n o ssa h ip ó te se e ra d ire c io n a l, d iv id im o s e sse n ú m e ro p o r 2, p a ra o b te r 0,013.
T endo a h ip ó tese n u la c o m o v e rd a d e ira , u m t de 2 o c o rre ria so m e n te u m a ve/, em
13/1000 (u m a em 7 7) e stu d o s re p e tid o s c o m o re su lta d o d e erro a m o strai.
E is o relató rio :
Como a amostra era pequena, a medida de tendência central apropriada foi a mediana, e 0
teste estatístico apropriado foi o Wilcoxon. Da Tabela X‘ podemos ver que a mediana da condição
DEPOIS (7,00) é maior que a da condição ANTES (5). O teste de Wilcoxon (t = 2) foi convertido
em um escore z de -2 ,2 4 com um a probabilidade associada unilateral de 0.01. Portanto, pode ser
concluído que a atitude dos enfermeiros com doentes que sofrem de EM e' mais simpática após
terem participado do grupo de discussão e que é pouco provável que tal diferença tenha ocorrido
por erro amostrai.
Atividade 15.3
O b se rv e a se g u in te sa íd a , n a q u al o s p a r tic ip a n te s p a r tic ip a ra m de a m b a s as co n d içõ e s. A
h ip ó te se d o p e s q u is a d o r era q u e o s g r u p o s d ife riria m , m a s e le n ã o fez u m a p re visã o e sp e cífica
d a d ire çã o d a d ife re n ça .
Wilcoxon
Ranks (Postos)
Mean Rank Sum of Ranks

N (Posto Médio) (Soma dos Postos)
Negative Ranks
1a 2.00 2.00
C O N D 2- COND1 (Postos Negativos)
Positive Ranks
6b 4.33 26.00
(Postos Positivos)
Ties (Empates) 0C
Total 7
a. COND2 < COND1

b. COND2 > COND1
c. COND1 = COND2
Test Statistics11(Estatística do Teste6)
C O N D 2- COND1
Z -2 .0 2 8 a
Exact Sig. (2 tailed)

0.043
(Sig. Exata - Bilateral)
a. Based on negative ranks (a. Baseado em postos negativos)

b. Wilcoxon Signed Rank Test (b. Teste dos Postos com Sinais de Wilcoxon)
Sig. ■
= Significância
O q u e vo cê p o d e c o n c lu ir d e ssa a n á lise ?
' Você deve informar aos seus leitores a tabela na qual estão as estatísticas descritivas.
Exemplo da literatura: procedimentos médicos e HIV

T re lo a n e c o la b o ra d o re s (1 9 9 6 ) c ria ra m u m e stu d o so b re o re s u lta d o d a e d u c a ç ã o em p ro
c e d im e n to s m é d ic o s d ire c io n a d o s a m in im iz a r e x p o siç ã o à in fe c ç ã o p o r H IV. O s p a rtic ip a n te s
fo ram m é d ico s, e n fe rm e iro s e o u tro s fu n c io n á rio s d a saú d e. O s p e sq u isa d o re s m e d ira m o q u a n to
os p a rtic ip a n te s se g u ira m os p a d rõ es d e te rm in a d o s p ara m in im iz a r a e x p o siç ã o ao H IV (co m o usar
lu v as, d e sfa z e r-se d e a g u lh a s a p ro p ria d a m e n te , e tc .). E ssa foi a co n d iç ã o p ré -te ste . E n tão , d e ra m
aos p a rtic ip a n te s u m p ro g ra m a de e d u c a ç ã o c ria d o p a ra c o n sc ie n tiz á -lo s d a s v árias a titu d e s q u e
p o d ia m to m a r p ara m in im iz a r a in fe c ç ão (in te rv e n ç ã o ). M ais ta rd e , os p e sq u isa d o re s os av aliaram
n o v a m e n te n as m e sm a s m e d id a s (c o n d iç ã o p ó s-te ste ). O s re s u lta d o s p a rc ia is fo ram m o stra d o s na
T ab ela 15.7.
O s p esq u isad o res fo rn eceram o esco re d o p ré-teste e o esco re do p ó s-teste; ap ó s, c alc u laram que
a m udança na d ireção esp erad a foi 14%. O iten ta p esso as p articip aram do estu d o . O teste de W ilcoxon
foi co n d u zid o nos dad o s, e a e sta tístic a foi c o n v ertid a p ara u m esco re z. U m esc o re ; d e 3 ,4 4 , co m o
você já sabe, é um e sco re g ra n d e (q u ase 3,5 d e sv io s p ad rõ es ac im a de z ero ). U m p a sso c ia d o de
0,0 0 0 6 d em o n stra q ue é im provável q u e o re su lta d o te n h a o c o rrid o p o r erro am o strai, se a h ip ó tese
nula é verdadeira. P o rtan to , c o n c lu e m o seguinte: "A d iferen ç a m ed ian a e n tre os e sco res de c o n c o r
dância g lobal pré-ed u cação e p ó s-ed u cação foi 14%. sig n ifican tem en te d iferen te de 0 % ” .
T abela 15.7 Resultados de Treloan e colaboradores (1996)
Escore mediano de concordância Postos com sinais de Wilcoxon
Pré-teste Pós-teste Mudança n z p
67.0 83,0 14 80 3.44 0.0006
Exercício 3
Seis alu n o s q u e tin h am fo b ia de c a m u n d o n g o s av alia ra m os seu s m e d o s (1 . sem m ed o ; 5.

m ed o e x trem o ), an tes e d ep o is de p a rtic ip a re m de um p ro g ra m a c o m p o rta m e n ta l c ria d o para
su p e ra r o m ed o . A h ip ó te se fo i u n ila tera l: o m ed o se ria re d u z id o d e p o is d o p ro g ra m a .
Participante Antes Depois
1 5 3
2 4 4
3 4 2
4 3 1
5 5 3
6 5 4
E ntre co m os d ad o s no S P S S P W e c o n d u z a um teste W ilco x o n . F o rn e ç a u m a e x p lic a ç ã o

p o r e scrito do sig n ific a d o d o s re su ltad o s p a ra seu am ig o .
15.3 Alternativas para a ANOVA
15.3.1 Análise de variância de um fator (para grupos independentes): Kruskal-Wallis
K ru sk al-W allis é o e q u iv a le n te n âo -p a ra m é tric o de A N O V A e urna g e n e ra liz a ç ã o d o teste

M a n n -W h itn e y . E c o m o um M a n n -W b itn e y . m as u sa d o q u a n d o você tem m a is de d o is g ru
p o s. O K ru sk a l-W a llis é u tiliz a d o q u a n d o os d a d o s n ão sa tisfa z e m as c o n d iç õ e s re q u e rid a s
p ara u m a A N O V A p a ra m étric a. V ocê não p rec isa se p re o c u p a r co m o fo rm ato d a d istrib u iç ã o
dos esc o re s p ara o K ru sk a l-W a llis; eles não p rec isa m ter u m a d istrib u iç ã o no rm al. E n tre ta n
to, to d as as co n d iç õ e s d e v e m te r um fo rm a to p a re c id o . A fó rm u la p a ra o K ru sk al-W allis se
b aseia nos p o sto s d o s e sc o re s, em v ez de nos p ró p rio s esc o re s. O teste p ro cu ra u m a d ife re n ç a
sig n ificativ a en tre os p o sto s m éd io s de alg u m a s ou de to d a s as c o n d iç õ e s (co m o a A N O V A ).
N o v a m e n te , esse te ste n ão d irá q u ais c o n d iç õ e s são d iferen te s u m a s das o u tras - so m e n te q u e
ex iste u m a d iferen ç a , em alg u m lugar.
C o m o no M an n -W h itn e y , os esc o re s são o rd e n a d o s p o r m eio dos g ru p o s. A p ó s, o p o sto
m éd io p ara cad a g ru p o é calc u la d o . S e n ão e x iste m d ife re n ç a s sig n ific a tiv as e n tre os g ru p o s,
os p o sto s m éd io s te n d e rã o a ser p are c id o s. A té ag o ra d isc u tim o s caso s nos q u a is c o lo c a m o s
ale a to ria m e n te os p a rtic ip a n te s em g ru p o s. E ssa é a m e lh o r situ a çã o p a ra nós. c o m o p sic ó lo
g o s, p o is a ss im tem o s m ais c e rte z a de que n o ssa m a n ip u la ç ã o e x p e rim e n ta l cau so u o efeito
o b serv ad o , se u m for e n c o n tra d o . E n treta n to , às v ezes, q u e re m o s e n c o n tra r d ife re n ç a s e n tre
g ru p o s j á e x is te n te s (p. ex .. p o lic ia is, b o m b e iro s e p a ra m é d ic o s ). E sse s g ru p o s são g e ra l
m en te ch a m a d o s de g ru p o s in tacto s. Se q u is é sse m o s e n c o n tra r d ife re n ç a s e n tre p esso as em
p ro fissõ e s d ife re n te s, te ría m o s de e n c o n tra r g ru p o s in tac to s, p o is não se ria p o ssív el c o lo c a r
os p a rtic ip a n te s em g ru p o s alea to ria m e n te .
Se v o cê c a lc u la sse o K ru sk a l-W a llis à m ão, c h e g a ria a u m a esta tístic a de teste c h a m a d a
de H. O s p a c o te s de e sta tístic a g e ra lm e n te c o n v e rte m e sta tístic a s de teste em u m a o u tra e s
ta tístic a p o r ex e m p lo , em c. ou , e isso é e x a ta m e n te o q u e o S P S S P W faz. N o e x e m p lo
q ue segue, os g ru p o s in tacto s fo ram : o ficiais de se g u ra n ç a (c o d ific a d o s c o m o 3), e sta g iário s
u n iv ersitário s (co d ific a d o s c o m o 4 ) e c o z in h e iro s (c o d ific a d o s co m o 5). O K ru sk al-W allis foi
usad o aqui, pois o n ú m e ro p eq u e n o d e p a rtic ip a n te s e o fato de os g ru p o s se rem d e sig u a is sig
n ificav am q ue era im p ro v áv el q u e os esc o re s na variável d e p e n d e n te (e x p e riê n cia de trab alh o )
tiv essem u m a d istrib u iç ã o n o rm al. A p e rg u n ta a ser re s p o n d id a foi: eles se d ife re n cia v a m em
u m a m ed id a de e x p e riê n c ia de tra b a lh o ?
Grupo Experiência
3,00 13,00
3,00 15,00
3.00 11,00
3.00 12.00
4,00 4,00
4,00 4,00
4,00 6,00
4,00 2.00
4,00 5.00
4,00 3,00
4,00 4,00
5,00 9,00
5,00 10,00
5,00 10.00
5,00 5,00
I 11 SPSSPW: teste para amostras independentes para mais

. " J de duas condições - Kruskal-Wallis
S ele c io n e A nalyze (A n a lisa r), N onparam etric Tesls (T estes n ã o -p a ra m é tric o s ), K Inde
p en d em Sam ples (K p a ra A m o stras In d ep e n d en tes).
QI3 chop15kiuskdl|obcdt. K ü iir m •1st xl

Fie £<* View ße>e Transioim Analyze Graphs Ijtilie: Wndow Help
Reports ►
fluidi m\ J_J = Dfitcqptive Statistics ►
H I
1 group Custom Tables »
Compaie Means »
group I exper
general Lneai Model ► i l l 1 1 M
1 3 0 0| 13C Correlale ►
2 300 15 C Regression ►
3 300 11 C Lflgknear ►
4 300' 12 C Classili ►
5 400 4C Cíala Reduction »
6 400' 4 .C _ ►
tJonparametnc Tests ► £ht-Square .. . . .
7 4 00
Time Series ► g nomai
8 ' 400 2C
Survival ► Buns. •
9 4 00 5C MiAple Response ► 1-Sample K-S
10 400 3C Missng Value Ana^sis 2 Independent Samples
11 4 00
12' 5 00 ............ 9CCl' 2 Related Samples.
13| 500 10 00 K. Related Samóles
14 500 10 00
15 5.0Ö 5 00
1 I f\ D<rt<»View X" v.i-st'e V>,v / I jíL

K Independen» Samples SPSS Processor «ready
"7
f\ £ r ^ ¿i I £ / Micio; .%'l :/ | M r Z y |Ürv | [ - - ç h .ip T ik l '-''■-f-.ifffi_-.p-. | O O Q " 8 1528
A p arecerá a se g u in te c a ix a de d iálo g o .
A VD é
m ovida
para a Test
Variable
List (Lista
da Variável
Teste)
Pressione
para definir
o intervalo
range
M o v a a v ariáv el d e p e n d e n te d o la d o e s q u e rd o p a ra a Test Variabte L ist (L is ta d a V ariá

vel T este), no la d o d ire ito . M o v a a v a riá v e l in d e p e n d e n te (a v ariáv e l d e a g ru p a m e n to ) do
la d o e sq u e rd o p a ra a c a ix a (Jroupm g Variable (V ariáv el de A g ru p a m e n to ), n o la d o d ire ito ,
D e p o is, p re s s io n e o b o tã o D efine R ange (D e fin ir In te rv a lo ). Isso p e rm ite q u e v o c ê d e lin a
o in te rv a lo (range) d o s g ru p o s . Aq u i , n o s s o s g ru p o s fo ra m c o d if ic a d o s c o m o 3, 4 , e 5;
p o rta n to o in te rv a lo é 3-5.
Defina o
grupo mais
baixo e o
mais alto
T,v«------------
P Kut >Mi H
r Jck№ck Telano
-l_íl____
SPSS taccata a □
- r3!i *3© «■*■
I j^ .'. fC c norçu I W«d J| » UníOtrH SP SP,:. I í
E n tre co m o in te rv a lo (range) na c a ix a de d iá lo g o e p re s sio n e C ontinue (C o n tin u a r).

C e rtifiq u e -se de q u e a c a ix a K ruskal-W allis H e stá m a rc a d a . C a so v o cê d e se je e sta tístic a s
d e sc ritiv a s, p re s sio n e o b o tã o O ptions (O p ç õ e s) e se le c io n e a q u e la s de q u e v o cê n ece ssita .
C aso c o n trá rio , p re ssio n e OK. S e rá fo rn e c id a a seg u in te saída:
Ranks (Postos)
job category
(categoria de trabalho) N Mean Rank (Posto Médio)
work experience security officers

4 13.50
(experiência de trabalho) (oficiais de segurança)
college trainees
7 4.21
(estagiários universitários)
cooks (cozinheiros) 4 9.13

Total 15
A p rim e ira p a rte d a sa íd a m o s tra o p o s to m é d io de e x p e riê n c ia d e tra b a lh o p a ra cad a

categ o ria. A q u i, os o fic iais d e se g u ra n ç a têm m ais ex p e riê n c ia.
Test Statistics3 b (Estatísticas do Teste0 6)

work experience
(experiência de trabalho)
Chi-Square (Qui-Quadrado) 11.442
df (gl) 2
Asymp. Sig
0.003
(Sig. Assintótica)
a. Kruskal Wallis Test (a. Teste de Kruskal Wallis)

b. Grouping Variable: job category (b. Variável de
Agrupamento: categoria de trabalho)
A s e s ta tís tic a s d o te s te m o s tra m q u e y j é 1 1,4. O n ív el de sig n ific a n c ia a lc a n ç a d o é

p = 0 ,0 0 3 .
15.3.2 Comparações emparelhadas

C o m o na A N O V A p a ra m é tric a , você n ão c o n se g u e v er o n d e se e n c o n tra m as d ifere n ç a s
sig n ific a n te s. N o e x e m p lo a cim a , fica c la ro q u e os o fic ia is de se g u ra n ç a se d ife re n c ia m de
e sta g iá rio s u n iv e rsitá rio s. N o e n tan to , e le s se d ife re m d o s c o z in h e iro s? E q u a n to às d ife re n
ças e n tre e sta g iá rio s e c o z in h e iro s ? D ife re n te d a A N O V A , não e x iste m teste s q u e seg u em
n a tu ralm en te do K ru sk a l-W a llis e d o F rie d m a n . T o d av ia, você p o d e d e c id ir fa z er d u as c o m
p ara ç õ e s u san d o c o m p a ra ç õ e s e m p a re lh a d a s p e lo s testes M a n n -W h itn e y . L e m b re -se d e que
você p re cisará av aliar o valo r do nível de sig n ific a n c ia a lca n ç a d o à luz do seu co n h e c im e n to
so b re testes m ú ltip lo s.
A g o ra ch e g a m o s ao re la tó rio esc rito . N ão ex iste u m a m an e ira fa c il d e c o n stru ir in te rv a
los de co n fia n ç a ou ta m a n h o s de e feito s, p ois n o ssa m e d id a de te n d ê n c ia c en tra l é a m ed ian a,
em vez d a m édia. A in d a assim , você tem q u e fazer o m e lh o r q u e p o d e. R ela te as e sta tístic a s
d e scritiv as e fo rn e ç a ilu stra ç õ e s g rá fic as o n d e p o ssív el. E is o relató rio :
Como a amostra era pequena e os dados não estavam distribuídos normalmente, foi realizada
uma ANOVA Kruskal-Wallis de um fator nos três grupos ocupacionais. Como era de se t sperar, os
estagiários universitários tinham o menor nível de experiência de trabalho (mediana = 4 anos), e os
oficiais de segurança, o maior nível (mediana = 12.5 anos). Cozinheiros tinham uma mediana de
9.5 anos. Os resultados deram um %'de 11.44 com um valor de probabilidade associada de 0,003.
Portanto, concluiu-se que existem diferenças significantes em experiência de trabalho entre oficiais
de segurança, estagiários universitários e cozinheiros.
Atividade 15.4
O b se rve a s e g u in te sa íd a , c o n d u z id a e m três g r u p o s d e p a rtic ip a n te s. O p e sq u isa d o r e sp e
ra q u e haverá u m a d ife re n ç a entre o s três g r u p o s e q u e o s p a r tic ip a n te s na c o n d iç ã o 3 terão
e score s sig n ific a tiv a m e n te m a is b a ix o s q u e o s p a r tic ip a n te s n o s o u tro s d o is gru p o s.
Kruskal—Wallis
Ranks (Postos)
GROUP (GRUPO) N Mean Rank (Posto Médio)
SCORE (ESCORE) condition 1 (condição t) 6 10.25
condition 2 (condição 2) 5 9.10
condition 3 (condição 3) 5 5.80
Total 16
Test Statistics3-6 (Estatísticas do Teste'1)
RATING (AVALIAÇÃO)
Chi-Square (Qu¡-Quadrado) 2.586
df (gl) 2
Asymp. Sig (Sig. Assintótica) 0.274
a. Kruskal Wallis Test (a. Teste de Kruskal Wallis)

b. Grouping Variable: GROUP (b. Variável de Agrupamento: GRUPO)
SIg. = Significance
O q u e vo cê p o d e co n clu ir d e ssa a n á lise ?
o pensamento em pessoas com distúrbios de humor
Byrne e MacLeod (1997) conduziram um estudo para examinar aspectos do pensamento futuro
em participantes com distúrbios de humor. Os participantes, ansiosos ou ansiosos e deprimidos
(misto) ou que não sofriam de nenhum dos dois distúrbios, foram apresentados a uma gama de
eventos futuros positivos e negativos e tiveram de fornecer explicações sobre o porquê aqueles
eventos acontecerem ou não com eles.
Havia 25 participantes em cada grupo. Como controle de manipulação (para verificar se os
participantes deprimidos mostravam escores maiores de depressão que os outros grupos e que os par
ticipantes ansiosos mostravam escores maiores de ansiedade que os outros grupos, assim por diante)
os autores testaram se havia diferenças significantes entre os três grupos. Os autores dizem:
As diferenças de grupo em escores de ansiedade e depressão foram consideradas com o uso do
Kruskal-Wallis [...] como as condições paramétricas não foram satisfeitas. Havia diferenças significativas
entre os grupos em ambas as medidas (p < 0,001). Grupos ansiosos mistos eram significativamente dife
rentes dos controles na medida de ansiedade [...] Todos os três grupos eram significantemente diferentes
na medida de depressão (escores médios foram 0.1 e 4,2 para os grupos de controle, ansiedade e depressão
mistas respectivamente).
Exercício 4
Como parte de seu projeto conjunto do ano sobre a utilidade da terapia para pessoas que
sofrem de enxaqueca, Nyashia e George distribuíram aleatoriamente 18 pessoas que sofrem
de enxaqueca em três grupos. O Grupo 1 tem seis sessões de urna hora de terapia com um
terapeuta estagiário; o Grupo 2 tem seis sessões de auto-ajuda de urna hora (que não são
lideradas por um facilitador - a agenda é determinada pelos próprios membros do grupo),
e o Grupo 3 consiste de pessoas que sofrem de enxaqueca que gostariam de participar de
terapia ou de auto-ajuda, mas tem que esperar. Nyashia e George prevêem que os grupos de
terapia e de auto-ajuda avaliarão que sofrem menos de enxaquecas do que o grupo na lista
de espera quando avaliarem sua enxaqueca em um segundo ponto no tempo. No início do
estudo, os participantes avaliam os seus sintomas no último mês. de 0 (sem sofrimento) a 5
(sofrimento terrível). Quatorze dias mais tarde, avaliam os seus sintomas (no último mês)
novamente. Os dados seguem abaixo. Entre com os dados no SPSSPW e guarde como um
arquivo de dados.
Como os grupos são pequenos, os escores são aUto-avaliações, e os dados não estão
distribuídos normalmente, recomendamos testes não-paramétricos. Conduza dois Kruskal-
Wallis, um nos sintomas no início do estudo e um nos sintomas 14 dias mais tarde.
Escreva os resultados em forma de um parágrafo breve, explicando o significado dos
resultados em termos do estudo.
Grupo Sintoma 1 Sintoma 2
1,00 3.00 1,00

1.00 4.00 3.00
1.00 5.00 4.00
1.00 2.00 2.00
1.00 3.00 1,00
2.00 4.00 2.00
2.00 5.00 5.00
2.00 4.00 3.00
2.00 2.00 2,00
2.00 3.00 5.00
2.00 2,00 2,00
3,00 4.00 5,00
3.00 5.00 3.00
3.00 4.00 4.00
3.00 2.00 4.00
3.00 3.00 fi.OO
O
ri
3.00 2.00
3.00 3.00 3.00
15.3 Análise de variância de Friedman: delineamento de medidas repetidas
O ANOVA de Friedman é um equivalente nâo-paramétrico do ANOVA de medidas re

petidas e uma generalização do teste de Wilcoxon. É o teste de Wilcoxon aplicado a mais de
dois grupos. Como no Kruskal-Wallis, a fórmula para esse teste envolve os postos dos escores
em vez dos próprios escores.
Embora confuso, o teste é chamado de ANOVA de um fator. Isso se deve ao fato de algu
mas pessoas considerarem os participantes como um fator, em um delineamento de medidas
repetidas, como já mencionamos previamente (ver Capítulo 9). Todavia, é o que conhecemos
por um fator. Na seguinte saída, os participantes avaliaram o quão alerta eles se sentiam em
várias partes do dia (em uma escala de 1 a 5).
Manhã Almoço Tarde
1.00 2.00 3.00

2.00 4.00 5.00
1.00 2.00 2,00
2.00 1.00 3,00
1.00 3,00 3.00
2,00 5.00 5.00
1,00 2.00 3.00
2.00 2.00 2.00
1.00 3.00 3.00
2.00 1.00 3.00
SPSSPW: teste de medidas repetidas para mais de duas

□
condições - teste de Friedman
Selecione Analyze (Analisar), Nonpa:ametric Tests (Testes não-paramétricos), K Related

Samples (k para Amostras Relacionadas).
Aparecera a seguinte caixa de diálogo.
mnmirg
As variáveis
são mudadas
da caixa
Test Variables
(Variáveis Teste)
M arque
Friedman
HUK«« n_iL_
SPSS Pioeewoi nea&
JlStarti fãÉ VJJJft 1:114
I ' . j C |rgr, | y M < , ' W j ^ jíy i jnooi Vi< SP I ¿JPxdf«ri-y]
Mova as variáveis do lado esquerdo para o lado direito. Certifique-se de que a caixa
Friedman está marcada. Ao escolher a opção Sicitistics (Estatística), você pode obter as esta
tísticas descritivas. Pressione OK. Será fornecida a seguinte saída:
Ranks (Postos)
Mean Rank (Posto Médio
morning (manhã) 1.30
lunchtime (almoço) 2.00
afternoon (tarde) 2.70
Test Statistics’ (Estatísticas do Teste*)
N 10
Chi-Square (Quí-Quadrado) 12.250
df (gl) 2
Asymp. Sig
.002
(Sig. Assintótica)
a. FriedmanTest (a. Teste de Friedman)

O valor do x é 12,25, com uma probabilidade associada de 0,002. As diferenças encon

tradas entre os participantes em partes diferentes do dia provavelmente não ocorreram por
erro amostrai.
Atividade 15.5
Observe para a seguinte suida de uma análise de três grupos. Os participantes eram pes
soas com doenças crônicas, que negaram a participação em uma intervenção comportamental
feita para os ajudar. Medidas de depressão foram tiradas em três pontos no tempo. O pesqui
sador previu que haveria diferenças significantes entre escores nos três pontos no tempo, mas
ele não previu a direção da diferença.
Friedman
Ranks (Postos)
Mean Rank (Posto Médio)
TIME 1 (TEMPO 1) 1.31
Test Statistics3 (Estatísticas do Teste3)
N 8
Chi-Square (Qui-quadrado) 12.250
df (gl) 2
Exact Sig (Sig. Exata) 0.002
a. Friedm an Test (a. Teste de Friedman)

O que você pode concluir dessa análise?
danos ao cérebro e estabilidade de resultado
U m a grande p e r ce n ta g e m d os 5 m ilh õ e s d e d a n o s trau m áticos ao céreb ro e stim a d o s n o s E sta d o s
U n id o s to d o s o s a n o s oco rrem em p e s s o a s jo v e n s , qu e en fren tarão m u ito s an os de c o n s e q ü ê n c ia s
e c o n ô m ic a s e se q ü e la s n e u r o c o m p o r ta m e n ta is. A s h le y e c o la b o ra d o re s ( 19 9 7 ) ob servaram 3 3 2 p e s
so a s axé 14 a n o s a p ó s su a lib eração da rea b ilita çã o p ó s-a g u d a d e v id o a d a n o s cereb ra is traum áticos;.
Q u eriam d e sco b rir q u ais v a r iá v e is p rev ia m u m a e sta b ilid a d e de resu ltad o m elh or. M u itas das variá
v e is eram próprias para a n á lise c o m o e sta tístic a param étrica, m as u m a não era - a E sc a la de Status
O c u p a c io n a l (E S O ). A s h le y e c o la b o ra d o re s q u eria m d eterm in ar se o status o c u p a c io n a l m u d ava
por m e io de três p o n to s no te m p o - entrada d e v id o a d a n o s cereb ra is tr a u m á tico s, lib er a ç ã o ap ós
r ea b ilita çã o e c o n tin u a ç ã o de tratam ento p ó s -lib e r a ç ã o . P ortan to, usaram a A N O V A de F ried m an
- e d esco b rira m q u e o status o c u p a c io n a l m ostrou um a d im in u iç ã o sig n ific a n te em status na c o n ti
n u ação do tratam ento a p ó s lib eração.
Exercício 5
D e z p articip an tes em um e x p e r im e n to c o g n itiv o aprenderam palavras de fr e q ü ê n c ia b a i

xa, m é d ia e alta. M a is tarde, rep etiram to d a s as p alavras q u e c o n s e g u ia m lem b rar e m três
m in u to s. O a lu n o d e g r a d u a ç ã o qu e c o n d u z iu e s s e e stu d o tin h a a h ip ó te s e de q u e h averia
um m aior n ú m ero de palavras lem b rad as na c o n d iç ã o de alta freq ü ên cia . O s e sc o r e s nas três
d im e n s õ e s sã o o s se g u in te s:
Baixa Média Alta
10,00 15,00 25,00

5,00 8.00 17,00
7,00 9,00 18.00
8,00 16.00 25,00
10.00 9.00 8,00
15,00 18,00 20,00
21.00 29.00 31.00
18.00 25.00 31.00
20.00 36.00 40,00
8.00 16,00 30,00
E x e c u te u m a A N O V A de F ried m an para os particip an tes n os três te m p o s. A h ip ó te se foi

co n firm a d a ? F o rn eça o s se u s resu ltad os e o- e x p liq u e e m term os d o e x p e rim en to .
Resumo
■ O s te ste s u tiliz a d o s n e ss e c a p ítu lo sã o n ão -p a ra m étrico s e d e v e m ser u sa d o s q u an d o
não é p o s s ív e l u tilizar um param étrico.
■ O s te ste s n ã o -p a ra m é tric o s transform am os d a d o s em um p rim eiro e s tá g io n o c á lc u lo
da e sta tístic a teste.
■ T estes n ã o -p a ra m étrico s não n e c e ssita m da h ip ó te se de n orm alid ad e e n em d e gran
d e s am ostras.
■ A versã o n ã o-p aram étrica do r de P earson é o p de Sp earm an.
■ t sã o o M a n n -W h itn ey , para a m o s
O s te ste s n ã o -p a ra m é tric o s e q u iv a le n te s ao teste
tras in d ep en d e n tes, e o W ilc o x o n , para am ostras r ela cio n a d a s.
■ O s te ste s n ã o -p a ra m étrico s e q u iv a le n te s à A N O V A sã o o d e K ru sk al-W allis para
am ostras in d ep en d e n tes, e o de F ried m an , para am ostras rela cio n a d a s.
QUESTÕES DE MÚLTIPLA ESCOLHA 6. Um teste de M ann-W hitney forneceu o seguinte

resultado:
1. O teste de W ilcoxon e' apropriado para: U ■- 9, p - 0 , 1726 (probabilidade bilateral)

(a) Delineam entos dentre participantes Todavia, o pesquisador previu a direção da dife
(b) D elineam entos entre participantes rença e, portanto, precisa saber a probabilidade
(c) Delineam entos de participantes emparelhados unilateral. Ela é:
(d) Alternativas (a) e (c) (a) 0.0863
2. Para acessar a diferença em valores de duas con (bj 0.863
dições de delineam ento entre participantes, com (c) 0.1726
dados em postos, você usaria: (d) Indeterminada
(a) O teste t independente 7. Se. em um delineam ento de medidas repetidas com

(b) O W ilcoxon duas condições, você tem um número pequeno de
(c) O teste t para amostras relacionadas participantes, com dados ordinais assim étricos, o
(d) O de M ann-Whitney teste inferencial mais apropriado é:
3. Observe essa saída parcial de uma análise do teste (a) Teste / não-relacionado
U de Mann-Whitney, obtida com o SPSSPW: (b) Teste t relacionado
Ranks (Postos)
Mean Rank Sum of Rank

group .grupo) N (Média dos Postos) (Soma dos Postos)
SCORE (ESCORE) Group ' Grupo 1) 8 8.50 68
Group 2 G-jpo l) 8 8.50 68
Total 16
Test Statistics (Estatísticas co Teste (c) Teste U de M ann-Whitney

_ (d) W ilcoxon
SCORE (ESCORE)
Mann-Whitney U 32.0 8. Se um teste de W ilcoxon mostra que t = 3 com

uma probabilidade associada de 0 ,0 2 , significa
Wilcoxon W 68.0 que:
(a) Tendo a hipótese nula com o verdadeira, um
A informação acima sugere que: valor t de 3 ocorreria 2% do tempo por meio
de variação amostrai
(a) Haverá uma diferença estatística significativa
(b) Temos 98% de certeza de que os resultados
entre condições
são estatisticam ente significativos
(b) Não haverá uma diferença estatística signifi
cativa entre condições (c) Pelos dados esperamos encontrar um valor t
(c) Os resultados são indeterminados de 3 ocorrendo 2 % do tempo por chance
(d) Nenhuma das alternativas (d) Se a hipótese nula não é verdadeira, o valor i
de 3 ocorreria 2% do tempo através de varia
4. O teste de W ilcoxon pode ser usado quando: ção amostrai
(a) Existem duas condições
(b) Os m esm os participantes estão em ambas con 9. Um valor t de 3 foi convertido em um escore z de
dições -3 ,2 . Isso significa que:
(c) Existem pelo menos dados de ordem ordinal (a) Os cálculos estão incorretos
(d) Nenhuma das alternativas (b) Não há probabilidade de existir uma diferença
significativa entre condições
5. O te.)te U de M ann-Whitney envolve:
(c) Há a probabilidade de existir uma diferença
(a) A diferença nas m édias para cada condição significativa entre condições
(b) A som a dos postos para cada condição (d) Os resultados são indeterminados
(c) A descoberta da diferença nos escores das con
dições e, após. da ordenação dessas diferenças As questões cle 10 a 12 se referem aos seguintes resul
(d) A diferença dos postos nas condições tados:
Kruskal—Wallis
Ranks (Postos)
GROUP (GRUPO) N Mean Rank (Posto Médio)
SCORE (ESCORE) 1.00 5 4.00
2.00 5 7.30
3.00 5 12.70
Total 15
Test Statistics"3b (Estatísticas do Testea'b)
SCORE (ESCORE)
Chi-Square (ESCORE) 9.785
df (gl) 2
Asymp. Sig (Significancia Assintótica) 0.008
a. Kruskal-Wallis Test (a. Teste de Kruskal-Wallis)

b. Grouping Variable: GROUP (b. Variável de Agrupamento: grupo)
10. Qual é a conclusão mais sensata? Test statistics3 (Estatísticas do Teste0)

(a) Não existem diferenças significativas entre os
três grupos, p > 0,05 N 7
(b) Existem diferenças significativas entre os gru
Chi- Square (Qui-Quadrado) 2.960
pos, p = 0,008
(c) Não existem diferenças significativas entre os df (gl) 2
grupos, p = 0,008
(d) E im possível tirar conclusões Asymp. Sig (Sig. Assintótica) 0.228
11. Qual grupo teve os maiores escores? a. Friedman Test (a. Teste de Friedman)
Sig. = Signifícância
(a) Grupo 1
(b) Grupo 2
(c ) Grupo 3 13. Qual é a conclusão mais sensata?
(d) Não podem os saber (a) Existem diferenças entre os grupos, mas elas
12. Quantos participantes estavam no estudo? têm uma chance de 23% de haverem ocorrido
por erro amostrai
(a) 5
(b) Existem diferenças entre os grupos e é impro
(b) 10 vável que tenham ocorrido por erro amostrai
(e ) 15 (c) Não existe diferença alguma entre os grupos
ld) 20 (d) Nenhuma das alternativas
As questões de 13 a 15 se referem ci seguinte saída. 14. Quantos participantes estavam no estudo?
(a) 7
Friedman's Ranks (Postos de Friedman) (b) 14
(c) 21
Mean Rank (Posto Médio)
(d) N ão é possível saber
BEFORE (ANTES) 1.50 15. Os participantes foram medidos:
AFTER (DEPOIS) 2.29 (a) Em dois pontos no tempo

(b) Em três pontos no tempo
FOLLOW UP (CONTINUAÇÃO) 2.21 (c) Em quatro pontos no tempo
(d) Não é possível saber
As questões de 16 a 17 se referent à tabela abaixo, reti 17. O relacionamento mais forte é entre dor e:
rada de Holdcroft e colaboradores (2003). (a) Tensão
(b) Autonomia
Spearman rank correlation coefficients for affective (c ) M edo
measures and pain (Coeficientes de correlação de postos de (d) Punição
Spearman para medidas afetivas e dor)
18. Leia o seguinte texto, extraído de Daley, Sonuga-
Pain (dor) P value (valor Pi Barke e Thom pson (2003). Eles estavam fazendo
com parações entre mães de crianças com e sem
Tension (Tensão) 0.04 0 .78 problemas de comportamento.
Autonomic (Autônomo) - 0 .0 9 0 55
Testes U de Mann-Whitney foram usados /.../ dife
renças significantes indicaram que mães de crianças
Fear (Medo) - 0 .1 3 0.36 com problemas de comportamento demonstraram
afirmações iniciais menos positivas (z = -4.24)
Punishment (Punição) - 0 .2 4 0 09 tanto quanto relacionamentos (z. = -4,25). menos
afeto (z = -5.08) e menos comentários positivos
(z. = -2,82), todos os valores p < 0,01.
16. Qual é a frase mais apropriada ? Em termos gerais, Das quatro com parações, qual foi a mais forte?
as medidas afetivas e de dor mostram:
(a) Afirm ações iniciais
(a) Um relacionamento fraco (b) Relacionam entos
(b) Um relacionamento moderado (c) A feto
(c) Um relacionamento forte (d) Comentários positivo
(d) U m relacionamento perfeito 19. Observe a saída abaixo:
Correlations (Correlações;
Rating 1 (Avaliação 1) Rating 2 (Avaliação 2)
Spearman's rho Rating 1 Correlation Coefficient 1.000 0.600

(p de Spearman/ (Aval ação i J i Coeficiente de Correlação)
Sig. (2-tailed) (Bilateral) 0.000
N 70 70
Rating 2 Correlation Coefficient 0.600 1.000

lAvaíiação 2) (Coeficiente de Correlação)
N 70 70
Qual é a afirmação mais apropriada? O relaciona vaçào. Infelizmente, o professor queria obter valores
mento entre as duas avaliações é: p unilaterais. Ele gostaria que você interpretasse os
(a) Forte (p = 0.7, p< 0.000) resultados abaixo, para uma hipótese unilateral.
(b) Forte (p = 0,6, p < 0 ,0 0 1 ) O relacionamento entre força e motivação é:
(c) Moderado (/- = 0,7, p < 0 .0 0 1 )
(a) Fòrte (p = 0,35, p = 0,094)
(d) Moderado (r = 0,6, p < 0,000)
(b) Forte (p = 0 .35, p = 0,047)
20. Observe a seguinte tabela. O professor Green previu (c) M oderado (p = 0,35, p = 0,094)
que força teria um relacionamento positivo com moti- (d) Moderado (p = 0 ,3 5 ,/; = 0,047)
Strength (Força) Motivation (Motivação)
Spearman's rho Strength Correlation Coefficient 1.000 0.347

(l> de Spearman) (Força) (Coeficiente de Correlaâo)
l\l 16 16
Motivation Correlation Coefficient 0.347 1.000

(Motivação) (Coeficiente de Correlacao1
Sig. (2-tailed) (Bilateral; 0.094
N 16 16
Sig. = Significance
Referências
ASHLEY, M.J., PERSEL, C.S., CLARK. M.C. e KRYCH, D.K. Long term follow -up o f past-acute
traumatic brain injury rehabilitation: a statistical analysis to test for stability and predictability of
outcom e. Brain Injury. I 1 (9), p. 677-90. 1997.
B Y R N E, A. e M ACLEO D, A.K. Attributions and accessibility o f explanations for future events in
anxiety and depression. British Journal o f Clinical Psychology, 36, p. 505-20, 1997.
DALEY. D., SO N U G A -BA R K E, E.J.S., e TH OM PSO N, M. A ssessing expressed em otion in mothers
o f preschool A D /H D children: psychom etric properties o f a m odified speech sample. British
Journal o f Clinical Psychology. 42. p. 53-67, 2003.
HOLDCROFT, A.. SN IDV O N G S. S.. C A SO N. A.. DORE. C.J. e BERKLEY. K. Pain and uterine
contractions during breast feeding in the imm ediate post-partum period increase with parity. Pain.
104. p. 589-96. 2003.
SHERR. L.. JEFFERIES. S., VICTOR, C. e CH ASE, J. Antenatal HIV testing - which way forward?
Psychology. Health & Medicine, 1 (1), p. 9 9 - 1 12. 1996.
TRELOAN. C.J.. HIGGINBOTHAM . N.. M ALCOLM . J.. SU TH ERLAN D, D. e BERENGER. S.
A n "academic detailing” intervention to decrease exposure to HIV infection among health-care
workers. Journal of Health Psychology, 1 (4), p. 455-68, 1996.
Respostas das atividades
para o SPSSPW, dos exercícios e das
questões de múltipla escolha
Capítulo 1
Atividade 1.1
Quais das seguintes variáveis são contínuas, quais são discretas e quais são categóricas?
■ Velocidade do vento - contínua
■ Tipos de títulos oferecidos por uma universidade - categórica
■ Nível de extroversão - contínua
■ Marcas de carros - categórica
■ Times de futebol - categórica
■ Número de peças capturadas em um jogo de xadrez - discreta
■ Peso de pandas gigantes - contínua
■ Número de pinturas expostas em uma galeria de arte - discreta
Atividade 1.2
Classifique os seguintes estudos em correlacionais, experimentais ou quase-experi-

mentais:
(a) Relação entre o consumo de cafeína e a incidência de dor de cabeça - correlacionai
(b) Diferença entre homens e mulheres na habilidade verbal - quase-experimental
(c) Efeito no desempenho em uma prova na qual os participantes são alocados aleatoria
mente a condições sem ruído e com alto ruído - experimental
(d) Diferenças na auto-estima de pessoas altas e baixas - quase-experimental
(e) Relacionamento entre estresse e horas dispendidas no trabalho - correlacionai
(f) Diferença em escores de ansiedade entre dois grupos aleatoriamente alocados de
participantes, em que um grupo aprendeu técnicas de relaxamento e o outro não-
experimental
Atividade 1.3
No estudo do desenho sobre um espelho, você poderia introduzir o contrabalanceamento

pela divisão dos participantes em dois grupos. Um grupo receberia instruções de motivação (re
compensa de R$ 30,00 por fazer bem) na primeira vez que completassem a tarefa e não teriam a
motivação na segunda vez. O segundo grupo de participantes completaria a primeira tarefa sem
a motivação, oferecida na segunda vez que completassem a tarefa.
Atividade 1.4
Para examinar o relacionamento causal entre cafeína e habilidade matemática, você

deve ter vários grupos que diferem em termos da quantidade de cafeína ingerida por cada
participante. Você pode, por exemplo, ter quatro grupos: um grupo sem cafeína, um grupo
com pouca cafeína, um com um nível moderado de cafeína e o último com um alto nível
de cafeína. Você daria a cada grupo um mesmo teste matemático para que os participantes
completassem. Pode. então, comparar os resultados de cada grupo e tentar estabelecer uma
relação causal entre as variáveis. Pode também conduzir um estudo com um delineamento
dentre participantes, com cada pessoa tomando parte nas quatro condições. Obviamente, em
tal caso. você precisaria de testes matemáticos diferentes, mas equivalentes a cada vez que
fosse completado.
Exercício 7
1. A VI no estudo do Dr. Gênio é se os participantes foram apresentados com adjetivos ou
substantivos.
2. A VD nesse estudo é o número de palavras lembradas corretamente por cada participante.
3. Esse é um delineamento entre participantes porque os adjetivos foram apresentados a um
grupo, e os substantivos, a outro.
4. Esse é um projeto experimental porque o Dr. Gênio alocou ao acaso os 20 participantes a
cada uma das condições.
5. Os dados para esse estudo particular devem ser colocados no SPSSPW como o indicado
a seguir. Devem existir duas variáveis. A primeira deve ser a variável de agrupamento
e contém uma série de valores 1 e 2. Nesse caso, o valor 1 representa a condição dos
adjetivos, e o número 2, a dos substantivos. A segunda variável deve conter o número de
palavras lembradas corretamente por cada participante.
|<>j] Untitled - SPSS Ddla Editoi

Fite V*w gala iiarvsloim AnaJyre giapKs UUhes Wíndow Help
s?|y|ai sai _Lnc?| « m r j n -i- n v|fr|
1 00 10 00
1 !_ I ■ N
1 00 6 IX:
1 oo' 7 00
1 00 900
1 00 11 00
■1oo 9 00
100 600"'
100 600
1 00 9 00
100 ebc
200 ’i2Ò0
200 1300
20CI 1600
200 15 00
2 00 ' 900
200 700
2 00 1400
12fio
200 11 00
200 13CC
1 | |\ D.il.l Vlew x, /
SPSS Proc*»o» o re*4>
► Q .¿jEvptofln | | _JAciobai | | gp lIrHill -3S!-:í'-''sàlf > 1?«
Exercício 2
Os dados para o estudo adjetivos/substantivos devem ser colocados no SPSSPW. como
segue, se for um delineamento dentre participantes:
Ffc £ck V«w fiata Tianslomi AnaJyz« £>aph: y tite s V/rxJcwf Heip
^ I B |£ | m\ * I 1
-1 M & l * 1 ■ r i r — m - I - l n l < * |< » |
18
adject w nouns 1 1 1 1 1 1 I i I-
1 1000 12 QO
2 600 1300
3 700 1600
4 900 1500
5 11 00 9 00
6 900 700
7 800 1400
8 500 12 00
9 9.00 11 00 —
10 8 PCI 1300
■| >[\D.rt.. VifwXVansWeVwv, / ; <|

SPSSPioc««» >: iw ty
jflSIad [ !_! K ^ ► g | • | JJn.b.»' lljlL lo lill . I í J J I f f l í f H i a J f ", l .- B
Quando tomamos dados para um projeto dentre participantes, precisamos determinar

duas variáveis, uma para cada condição. A primeira variável é para a condição dos adjetivos,
e a segunda, para os substantivos.
Questões de múltipla escolha
1. c. 2. c, 3. c. 4. d. 5. d. 6. a, 7. d, 8. d, 9. b, 10. d. 11. e, 12. a. 13. a, 14. a. 15. c, 16. a,

17. b. 18. d, 19, a. 20. d
Capítulo 2
Atividade 2.1
\ amostra mais apropriada para o estudo dos fãs de rúgbi versus fãs de futebol será um
grupo de fãs de futebol e um grupo de fãs de rúgbi (embora talvez alguns possam dizer que
um grupo de chipanzés também seria adequado).
Atividade 2.2
As médias, medianas e modas são as seguintes:

■ Média = 13,6: mediana = 12; moda = 12
■ Média = 6,75; mediana = 5; moda = 5
■ Média = 33,9; mediana = 25,5; moda = 32
Atividade 2.3
As medidas de tendência central mais apropriadas são as seguintes:

(a) 123 25 26 27 23 29 3 0 -m ediana
(b) 11 1 1I i 1I 1 l 1 2 2 2 2 2 3 3 4 5 0 -m o d a
(c) 11 2 3 4 1 2 6 5 8 3 4 5 6 7 - média
(d) 1101 104 106 111 L08 109 200 mediana
Atividade 2.4
Nenhuma resposta é necessária para essa atividade.
Atividade 2.5
Eis as respostas para as questões sobre o histograma:

(a) A moda é 4
(b) O escore menos freqüente é 8
(c) Quatro pessoas têm um escore de 5
(d) Duas pessoas têm um escore de 2
Atividade 2.6
Eis as respostas para a questão sobre o diagrama de caixa e bigodes:

ia) A mediana é 30
(b) Não existem valores extremos abaixo dos do próprio diagrama
Atividade 2.7
O diagrama de dispersão sugere que não existe um relacionamento real entre os preços
do petróleo e a satisfação do motorista. Os pontos no diagrama estão distribuídos ao acaso
entre os eixos.
Atividade 2.8
Se você tem a variância de um conjunto de valores, o desvio padrão é obtido tomando a

raiz quadrada da variância.
As definições mais razoáveis de desvio padrão são (c), o desvio padrão é uma medida da
variação dos escores em torno da média, e (d), o desvio padrão é a raiz quadrada da variância.
Atividade 2.9
A única distribuição normal entre os exemplos dados é a (b).
E xe rcício 7
1. A VI no estudo sobre a troca de lâmpadas c a presença ou ausência de luz vermelha.

2. A VD é número de erros que os digitadores cometem em cada arquivo digitado.
3. O diagrama de caixa e bigodes para a diferença dos erros entre as duas condições é apre
sentado abaixo:
50 -,
40 - *5
30- o13
014
20 -
o 3
10 H * 4
0
N= 20
D ecréscim o nos erros
(a) O tamanho do bigode mais curto, mais o fato de que a mediana está mais próxima
desse lado do que do meio sugere que a distribuição é positivamente assimétrica.
(b) O diagrama mostra vários valores discrepantes (oiitliers) tanto acima quanto abaixo
das cercas internas. Os valores extremos são: 3, 4, 5, 13 e 14.
(c) A média e o desvio padrão do conjunto de valores acima pode ser obtido com a op
ção Explore (Explorar) do menu Summarize (Resumir): a média é 21,40 e o desvio
padrão é 6,61.
Exercício 2
1. A VI no estudo sobre as drogas é se os estudantes tomam ou n ão drogas durante as aulas
do Dr. Boering.
2. A VD são os resultados obtidos no exame final. Essa é urna variável contínua medida em
uma escala discreta. É contínua porque o conhecimento dos estudantes no assunto testado
é por hipótese contínua. É mais simples medir com o uso de uma escala discreta (%).
3. O histograma para os dados de cada condição são os seguintes:
Para o grupo que tom a drogas

2.5 i
2. 0 -
<2
1.5-
‘C
OD
O-
05 - Desvio p adrão = 25,83

M édia = 4 8 ,5
0.0 —i——i——i——i——i——i——i——i——i— N = 10
10.0 2 0 .0 3 0 .0 4 0 .0 5 0.0 6 0 .0 7 0 .0 8 0 .0 90.0
R esultados no exam e final
Para o grupo que não tom a drogas

7.5 -
20- ----- ----- -----

fu
0.5 - Desvio p adrão = 9,95

M édia = 56,2
0.0 J—i——i——i——i——i——i——i——i— N = 10
4 0 .0 4 5 .0 50.0 5 5 .0 6 0 .0 6 5 .0 7 0 .0 75.0
Resultados no exam e final
(a) Alguém pode, talvez, argumentar que os dois conjuntos são aproximadamente distri
buídos de modo normal. Os escores ocorridos com maior freqüência estão no meio
da distribuição e têm caudas acima e abaixo da moda.
(b) Felizmente, as médias e desvios padrões para os dois conjuntos são apresentados
com os histogramas. Normalmente utilizamos o comando Explore (Explorar) para
gerar os dois histogramas e as estatísticas descritivas. A média e o desvio padrão
para os que tomam drogas são 48.5 e 25.83. respectivamente. A média e o desvio pa
drão para os que não tomam drogas são 56.2 e 9,95, respectivamente. Você deve ser
capaz de observar que tomar drogas não causou uma diferença real nos escores, mas
levou a uma variabilidade muito maior nos resultados. O desvio padrão para os que
tomam drogas é aproximadamente 2.5 vezes maior do que o dos que não tomam.
1. b, 2. c. 3. c. 4. c. 5. b. 6. b. 7. c. 8. a, 9. d 10. b, 11. a. 12. c, 13. c, 14. d, 15. a. 16. a, 17.

b, 18. c, 19. c, 20. d
Capítulo 3
Atividade 3.1
Quais desses eventos têm uma probabilidade de 0 (ou muito próxima de 0) e quais tem
uma probabilidade de J (ou muito próxima de 1 )?
■ A noite seguir o dia - 1
■ Todos os políticos nos dizerem a verdade todo o tempo - 0
■ Você achar um cheque de um milhão de libras nas páginas desse livro - 0
■ Um fogo em madeira ser apagado se você colocar água nele - J
■ Autores terem de pedir mais prazo para enviarem manuscritos de livros - 1
Atividade 3.2
Expresse as seguintes probabilidades como percentagens:

■ 0.25(25%)
■ 0.99(99%)
■ 1/3(33.33%)
■ 2/ 20 (20%)
Expresse as seguintes probabilidades como decimais:
■ 1/8(0.125)
■ 10/20(0.50)
■ 30% (0.30)
■ 14% (0.14)
A probabilidade de obter um número par em um dado é 0,5.
Atividade 3.3
Quais das seguintes são probabilidades condicionais?

(a) A probabilidade de ser atingido por um raio enquanto joga golfe - probabilidade
condicional
(b) A probabilidade de ganhar na loteria - não é condicional
(c) A probabilidade de ganhar uma medalha de ouro olímpica se não treinar - probabili
dade condicional
(d) A probabilidade de contrair câncer de pulmão se fumar - probabilidade condicional
(e) A probabilidade de um vôo tripulado à Marte nos próximos 10 anos - não é condi
cional
(f) A probabilidade de você ter doenças nas coronárias se bebe cerveja moderada
mente - probabilidade condicional
Atividade 3.4
Se você tem escores z negativos, estará abaixo da média. Com escores z negativos, a
maioria da população terá escores acima do seu.
Atividade 3.5
Seu escore c de matemática será 1 ((65 - 60)/5). Para inglês, será 0.86 ((71 - 65)/7). Por
tanto. sua melhor matéria, quando comparado aos grupos, é matemática.
Atividade 3.6
A distribuição de freqüências das médias das amostras terá um formato normal.
Atividade 3.7
Quão confiante podemos estar de que a média da população está entre 1,96 erros padrões
a partir da média da amostra? Podemos ter 95% de confiança.
Suponha que você tenha selecionado uma amostra de 20 pessoas com aracnofobia e ob
tido uma medida do medo de aranhas de cada um. Você constata que o intervalo de confiança
para a média é 1 ,5 a 5,6. O que isso significa? Isso indica que podemos ter 95% de confiança
de que o medo médio populacional de aranhas está entre 1.5 e 5,6.
Se houvessem sido selecionadas 200 pessoas com aracnofobia, o intervalo de confiança
seria mais largo ou mais estreito do que o relatado acima? O intervalo de confiança seria mais
estreito.
Atividade 3.8
Dos diagramas de barras de erro apresentados, somente em (a) e (d) existe uma provável
diferença real entre os grupos.
E xe rcício 7
1. O estudo sobre cirurgia dental é um delineamento entre participantes.

2. As estatísticas descritivas para cada grupo são as seguintes:
Sala com isolam ento acústico Sala sem isolam ento acústico
Média 9.10 19,90

Desvio padrão 3.28 2.81
Erro padrão 1.04 0.89
1C de 95% 6.75 - 11.45 17,89 - 21.91
3. 0 diagrama de barras de erro para esse estudo é apresentado abaixo:
30
20
10 -
■o
u
10 10
Com isolam ento a cú stico Sem isolam ento acústico
SALA DE ESPERA
(a) O diagrama de barras de erro mostra que os escores de ansiedade dos pacientes na
sala de espera com isolamento acústico são consideravelmente menores do que os da
sala sem isolamento. Existe também uma sobreposição dos IC de 95% para as duas
condições,
(b) O escore r para o primeiro valor na condição com isolamento acústico é = 0,88. O
escore ; para o primeiro valor na condição sem isolamento é -1,39.
Exercício 2
1. O estudo conduzido pelo Dr. Doolitle e' um delineamento quase-experimental porque ele
não alocou aleatoriamente os participantes às condições. Estas consistem de categoriais
naturais (gatos e cachorros): dessa forma, ele não pode utilizar uma alocação aleatória.
2 . O delineamento é também entre participantes porque cada animal não pode estar nas duas
condições simultaneamente (ser gato e depois cachorro).
3. As estatísticas descritivas das duas espécies são apresentadas na tabela.
Cachorros Gatos
M éd ia 110,40 102.00
D esv io p ad rão 12.62 14.28
E rro p a d rã o 3,99 4.52
IC de 9 5 % 1 0 1 ,3 7 - 1 1 9 .4 3 9 1 .8 7 - 1 1 2 .2 2
4. O diagrama de barras de erro está apresentado abaixo:
130 -
.2
U
j ? 120 - ___ ___
a»
c
ai ----------
| 110-
O
ul/t
ai
g 100 -
ro
Q.
LT> ----------
o 90-
-a
y
8 0 ----------------------------------------------------------------------------------------
N= 10 10
G atos C ach orros
Anim al
(a) O diagrama de barras de erro mostra que os cachorros têm um escore de QI mais alto
do que os gatos; entretanto, existe também uma considerável sobreposição dos ICs
de 95% das duas espécies. Isso pode sugerir que de fato não existe uma diferença
real entre as duas espécies. Lembre-se de que esses intervalos de confiança indicam
que estamos 95% confiantes de que a média populacional está dentro do intervalo.
Assim, as médias populacionais podem ser as mesmas.
(b) O escore z para o primeiro valor dos gatos é -0,49. O escore z para o primeiro valor
dos cachorros é -0.44.
1. c. 2. b. 3. c. 4. d, 5. d. 6. b. 7. d. 8. d. 9. a. 10. b, I I. c, 12. b. 13. b. 14. d. 15. b. 16. d.

17. c. 18. b, 19. d, 20. c
Capítulo 4
Atividade 4.1
As seguintes são as hipóteses nulas relevantes:

■ Não existem diferenças entre homens e mulheres na habilidade espacial
■ Não existe relacionamento entre álcool e o número de erros de direção
■ Não existem diferenças no tempo de reação quando relaxado e quando estressado
■ Não existem diferenças entre o tempo da eleição geral e o número de mentiras ditas
pelos políticos
Atividade 4.2
As descrições em (c) e (d) representam o melhor resumo da lógica do teste de hipóteses.

(c) Medimos o relacionamento entre as variáveis da nossa amostra e encontramos a pro
babilidade de que tal relacionamento tenha ocorrido apenas por erro amostrai. Se tal
probabilidade e' pequena, podemos concluir que um relacionamento genuíno existe
na população.
(d) Medimos a diferença entre as nossas duas condições e calculamos a probabilidade de
obter tal diferença apenas pelo erro amostrai se a hipótese nula for verdadeira. Se a pro
babilidade é pequena, podemos concluir que existe uma diferença real na população.
Atividade 4.3
Se você tem uma probabilidade de 0,005, é provável que uma vez em 200 o resultado
seja obtido por acaso. Se a probabilidade á 0.01, existe uma oportunidade em 100 de que o
resultado ocorra por acaso.
Atividade 4.4
Não podemos, de fato. afirmar, a partir da informação dada, qual das duas descobertas é
mais importante psicologicamente. Lembre-se de que significancia estatística não é o mesmo
que significancia psicológica. Mesmo que o Estudo 2 tenha um valor p bem mais baixo e
possa ter sido obtido de uma grande amostra. Você precisa de mais informação para poder
afirmar qual estudo é mais importante psicologicamente, tais como os tamanhos da amostra
e do efeito.
Atividade 4.5
Quais dos seguintes situações representam um erro do Tipo I e qual um erro do Tipo II?
(a) No seu estudo você descobriu que existe um relacionamento entre a quantidade de
chá ingerido por dia e a quantidade de dinheiro ganho na loteria. Você conclui que
para ganhar na loteria, é preciso tomar muito chá - erro do Tipo I
(b) Você descobriu, em um estudo, que não existe diferença entre as velocidades das
tartarugas e dos leopardos. Você conclui que as tartarugas são tão rápidas quanto os
leopardos - erro do Tipo II
(c) Você verificou, em um estudo, que existe um relacionamento entre modo de vida e
renda anual. No entanto, em virtude de a probabilidade associada ao relacionamento
ser 0,5. você concluiu que não existe relacionamento entre as duas variáveis - erro
do Tipo II
Atividade 4.6
Quais das seguintes hipóteses são unilaterais (unicaudais) e quais são bilaterais (bi-
caudais)?
(a) Prevê-se que as mulheres apresentam escores de empatia mais altos do que os hu
mens - unilateral
(b) Prevê-se que, à medida que o saiário anual aumenta, também aumenta o número de
tomates consumidos por semana - unilateral
(c) Prevê-se que exista relacionamento entre o comprimento do cabelo dos homens e o
número dc crimes cometidos - bilateral
(d) Prevê-se que os fãs de futebol têm um QI menor que os fãs de ópera - unilateral
(e) Prevê-se que exista um relacionamento entre o número de livros lidos por semana e
a extensão do vocabulário - bilateral
Exercício 1
1. A professora Yob conduziu um delineamento dentre participantes, uma vez que coletou
dados de cada situação nos dois estádios.
2. A professora Yob mediu o número de prisões, uma variável discreta (ninguém pode ser
preso pela metade).
3. (a) A VI nesse estudo é a alteração das condições dos assentos (confortáveis versus des
confortáveis)
(b) A VD é o número de prisões e expulsões dos estádios.
4. A previsão é unilateral porque a professora Yob não apenas previu que haveria diferença
entre os dois estádios, mas também a direção dessa diferença, isto é. nos estádios confor
táveis haveria menos prisões e expulsões.
5. A hipótese nula indicaria que não existe diferença entre os dois estádios em termos do
número de prisões e expulsões.
6. O diagrama de barras de erros será como o seguinte:
9 -|
8 - -------------------------
7-
6 -
sS
m ------------
cr,
QJ 5-
-a
u _______
4-
3-
2 -
1 -
N 12 12
A ssen to s Assentos
desco n fo rtáveis confortáveis
As estatísticas descritivas para os dois estádios são apresentadas na seguinte tabela:
Assentos desconfortáveis Assentos confortáveis
Media 6.83 3.25

Desvio padrão 1.90 1.66
ürro padrão 0.55 0.48
K: de 95% 5.63-8.04 2.20-4,30
7. Convertendo o primeiro escore de cada condição em um escore z, obtemos um valor de

0,62 para a condição de assentos desconfortáveis e um valor de -0,15 para o de assentos
confortáveis.
E xe rcíc io 2
1. O Dr. Pedante fez um estudo que envolveu um delineamento dentre participantes, uma
vez que comparou o número de infinitivos divididos utilizados pelos autores antes e de
pois da série Jornada nas Estrelas.
2. O Dr. Pedante mediu certo número de infinitivos divididos escritos e, assim, está traba
lhando com uma variável discreta.
3. (a) A VI nesse estudo é antes e depois da primeira apresentação da série Jornada nas Es
trelas.
(b) A VD e o número de infinitivos divididos escritos pelos autores.
4. A previsão é unilateral porque o Dr. Pedante previu a direção da diferença, isto é, o número
de infinitivos divididos seria maior após a exibição da série.
5. A hipótese nula é que não existe diferença entre o número de infinitivos divididos antes e
depois da exibição da série Jornada nas Estrelas.
6. O diagrama de barras do erro será semelhante ao seguinte:
4,0 -|
3.5 -
3,0 -
2.5 -
§,
o 2'°
' "
(ü
■O
y 1 ,5
1,0 -
0,5 -
0 ,0 - I I
N 12 12
Antes da série Depois da série
Jornada nas Estrelas Jornada nas Estrelas
As estatísticas descritivas relevantes são:
Antes de Jornada nas E strelas Após Jornada nas Estrelas
Média 1.25 2.75

Desvio padrão 1,06 1,54
Erro padrão 0,30 0.45
1C de 95cí 0.58-1.92 1.77-3.73
7. Convenendo o primeiro escore de cada condição em um escore z, obtemos um valor de

0.71 para a condição antes de Jornada nas Estrelas e um valor de -0,49 para a condição
após Jornada nas Estrelas.
1. a, 2. a. 3. b. 4. a. 5. b. 6. d, 7. c. 8. a, 9. b, 10. c, 11. d. 12. a, 13. d, 14. c, 15. c, 16. d,

17. d. 18. c, 19. d, 20. c
Capítulo 5
Atividade 5.1
E difícil encontrar um relacionamento perfeito, mas você pode ser capaz de pensar ein
vários que não sejam perfeitos.
Atividade 5.2
(10
Atividade 5.3
(b)
Atividade 5.4
(i) Negativa e fraca

(ii) Positiva e forte
Atividade 5.5
Atividade 5.6
(d)
Atividade 5.7
(CJ
Atividade 5.8
(a)
Atividade 5.9
1. -0,4983. isso deve normalmente ser arredondado para -0.50.

2. -0.2391. isso deve normalmente ser arredondado para -0.24.
3. O relacionamento entre o estigma e o CQV é baixo depois de controlado o efeitod
veridade da doença. Isso mostra que o relacionamento entre estigma e CQV é afetado (ou
mediado) pela severidade da doença.
Atividade 5.10
Embora algumas dessas correlações sejam estatisticamente significativas a níveis acei

táveis de significancia, algumas (p. ex., saúde, otimismo e idade) são fracas e podem não ter
significancia prática.
1. A correlação entre estigma e qualidade de vida é uma associação negativa fraca a mode
rada (r = -0.32). que pode ter ocorrido por erro amostrai (0.088).
2. Uma vez que a severidade da doença é controlada, a correlação entre estigma e qualidade
de vida se reduz consideravelmente (r = -0,01, p = 0,476), mostrando que o relaciona
mento observado entre estigma e qualidade de vida é quase que totalmente devido ao
relacionamento com a severidade da doença.
1. a. 2. d. 3. a. 4. b. 5. a. 6. c, 7. c, 8. c. 9. d, 10. c, 11. c, 12. c, 13. c, 14. c, 15. b, 16. d.

17. a. 18. c. 19. c, 20. b
Capítulo 6
Atividade 6.1
(70 - 50)/7,5 = 20/7,5 = 2.66
Atividade 6.2
(C)
Atividade 6.3
Dentre participantes - medidas repetidas: delineamento relacionado

Entre participantes - grupos independentes; delineamento independente
Tamanhos do efeito
1. Idade = 0,080
2. Educação = 0,361
3. Pacotes por ano = 0,139
4. Horas de exercício = 0.068
5. Cafeína = 0,053
6. IMC {BMP, = 0,034
7. Álcool = 0.111
Calculados da seguinte forma:
5 8 -5 8 .9 -0 .9
Idade -0.080
1 0 , 6 + 1 1.8 11,2
4 2 .9 -4 9 - 6.1
Pacotes por ano -0,139
43,6 + 44.4 ~44~
2 ,4 - 2.1 0,3
Horas de exercício = 0.068
4,_5 + 3 J 4,4
2 /
3 ,3 -3 .5 -o,;
Cafeína = -0,053
3 ,9 + 3,7 3.8
2 )
19,2-19,3 -0 .2
IMC H --------^ = ------= -0,034
2.6 + 3,3 ^ 2.95
0,5 - 0,7 -0 ,2
Á lc o o l : - 0, 1 1 1
1,4 + 2,2 i 1,8
2"
1 3 , 7 - 1 2 . 6 1,1
Educação = 0.361
2.8+ 3.3 3,05
Atividade 6.4
1 . (c)
2 . (a) Embora o sinal não importe: ele pode facilmente ter sido positivo se tivéssemos codi
ficado os grupos em ordem inversa.
1. Um teste t para grupos independentes é apropriado para um teste de fim-de-ano e episó

dios de doença.
Group Statístics: episodes c* rvess Estatísticas dos grupos: episódios de doenças)
Standard Deviation Std. Error Mean

illness (doençai N Mean (Média) (Desvio Padráo) (Erro Padrão da Média)
boys (menino' 10 14.5000 8.960 2.833
girls (meninaSí 10 12.9000 8.04 8 2.545
Independent Samples Test 'estepara »mostras ndependentes)

Levene's Test
tor Equality
of Variantes
"este de
Levene para
a gualdade
de Variâncias) T-test for Equality of Means (Teste r para a Igualdade de Médias)
F Sig. t df (gl) Sig. Mean Std. Error 95% Confidence

(2-tailed) Difference Difference Interval of the
(Sig. (Diferença (Erro Padrão Difference (IC de 95%
Bilateral) das Médias) da Diferença) para a Diferença)
ILLNESS Equal variances .823 .376 .42 18 .679 1.6000 3.808 -6.401 9.601
(DOENÇA) assumed (Igualdade de
Equal variances not .42 17.80 .679 1.6000 3.808 -6.408 9.608
assumed (Igualdade
de variâncias náo-
assumida)
Sig. = Signif icãncia
Group Statistics: end-of-year test (Estatísticas do Grupo: teste do final de ano)
Standard Deviation Std. Error Mean

TEST (TESTE) N Mean (Média) (Desvio Padrão) (Erro Padrão da Média)
boys (Meninos) 10 20.000 9.189 2.906
girls (Meninas) 10 11.7000 5.638 1.783

independent Samples Test (Teste para Amostras Independentes)
Levene's Test
for Equality
of Variances
(Teste de
Levene para
a Igualdade
de Variances) T-test for Equality of Means (Teste t para a Igualdade de Médias)
F Sig. t Df (gl) Sig. Mean Std. Error 95% Confidence

(2 tailed) Difference Difference Interval of the Differ
Sig. (Diferença (Erro padrão ence (IC de 95%
bilateral das médias) da diferença) para a diferença)
TEST Equal variances 2.018 .173 2.43 18 .026 8.3000 3.409 1.137 15.463
(TESTE) assumed (Assumida
a igualdade de
variâncias)
Equal variances not 2.43 14.93 .028 8.3000 3.409 1.030 15.570
assumed (Igualdade
de variâncias
nào-assumida)
2. O tamanho do efeito é o que consta a seguir. As médias e os desvios padrões foram obti
dos das saídas acima.
Episódios de doenças
14,5 -1 2 ,9
= 1,6/8.504 = 0.19
(8.96+ 8,048)/2
O teste de final de ano

2 0 -1 1 .7
= 8 .3/7,414 = 1,12
(9,189+ 5.638)/2
3. Esse é o tipo de coisa que você diria a um amigo:

Queremos verificar se existem diferenças significativas quanto a episódios de doen
ças entre meninos e meninas nos testes de final de ano. Para os episódios de cloenças.
as diferenças entre as duas médias foi bem pequena - somente 1 ,6, que representa 0 ,19
desvios padrões. O IC mostrou com 95% de certeza que a média populacional pode estar
contida entre -6.40 e 9,60, significando que se o estudo fosse replicado, poderíamos des
cobrir que os meninos apresentam mais doenças, as meninas apresentam mais doenças,
ou ambos apresentam o mesmo número de doenças. O valor t de 0,42 forneceu uma
probabilidade associada de 0,679. mostrando que esse resultado tem alta possibilidade
de ter ocorrido apenas por erro amostrai, dado que a hipótese nula seja verdadeira.
No teste de final de ano, entretanto, os meninos mostraram uin desempenho sig
nificativamente melhor do que as meninas (médias de 20 e 11.7 respectivamente). A
diferença (8,3) mostrou um tamanho de efeito de 1,12 desvios padrões - um valor gran
de. O intervalo de confiança apresenta uma probabilidade de 95% de que os valores 1.14
e 15,46 contenham a média populacional. Supondo verdadeira a hipótese nula, o valor t
foi de 2,43, que é improvável de ter ocorrido apenas por erro amostrai (p = 0,026). Po
demos, dessa forma, concluir que os meninos apresentam um desempenho melhor em
testes do que as meninas.
Paired Samples Tests - Tests at beginning and end of year

(Estatísticas de Amostras em Pares - Testes do início e do fim do ano)
Mean (Média) N Desvio Padrão Erro Padrão

Pair 1 test at beginning of year
13.400000 20 6.0991803 1.3638182
(Par 1) (teste do inicio do ano)
test at end of year
15.850000 20 8.5549309 1.9129407
(teste do firn do ano)
Paired Samples Test (Teste de Amostras em Pares)

Paired Differences (Diferença oaêaca
95°o ConfiGence Interval
of the Difference 'C de
Std. Std. Error Sig.
95?o para a Diferença)
Deviation Mean (Erro (2-tailed)
Mean (Desvio Padrão da Lower (Limite Upper ■
;Limite (Sig.
(Média) Padrão) Média) Inferior) Superior) t df (gl) Bilateral)
test at beginning -2.450000 5.2763125 1.1798193 -4.919390 .019390 -2.077 19 .026

of year-test at
end of year
(teste do inicio do ano
- teste do firn do ano)
O grupo como um todo teve um desempenho melhor no teste do final do ano (média
15,85) do que no do início (média de 13,40). Essa diferença apresenta uma probabilidade de
apenas 2 ,6% de ter ocorrido apenas devido ao erro amostrai, considerando a hipótese nula
verdadeira.
1. a, 2. b. 3. a. 4. b. 5. b. 6. b, 7. c. 8. c, 9. c, 10. a, 11. a, 12. c, 13. b, 14. c, 15. b, 16. c,

17. d. 18. b, 19. a, 20. c
Capítulo 7
Atividade 7.1
Rosenthal acredita que é mais importante relatar o tamanho do efeito do que a estatística
teste e o valor da probabilidade correspondente.
Atividade 7.2
(c)
Atividade 7.3
(b)
Atividade 7.4
Isso requer que você utilize a Internet para encontrar programas que calculem o poder
1. a 2. d, 3. c, 4. b, 5. a. 6. c. 7. d, 8. c 9. d, 10. a, 11. b, 12. d 13. a, 14. d, 15. b, 16.

17. a, 18. b, 19. d, 20. b
Capítulo 8
Atividade 8.1
(c)
Atividade 8.2
Os números não somam I00.
Atividade 8.3
(b)
Atividade 8.4
(a) Altura (cm) e peso (kg) - r de Pearson

(b) Distância percorrida (metros) e tempo gasto (minutos e segundos) - r de Pearson
(c) A fornia física de urna pessoa e sua ocupação (profissional, administrativa, manual) - / '
(d) Tamanho do dedos das mãos e tamanho dos dedos dos pés (cm) r de Pearson
(e) Uso da mão (destro/canhoto) e habilidade espacial (excelente, média, fraca) - y~
Atividade 8.5
(C )
Atividade 8.6
(b)
Atividade 8,7
Nenhum dos itens é verdadeiro.
Exercício 7
Bish e colaboradores utilizaram a correção de Yates. O valor da probabilidade c 0,68.
Exercício 2
E baseado em dados próprios.
Exercício 3
1. 8,25
2. X - 3.48
3. p = 0,32
4. Embora pelos resultados pareça que as pessoas têm uma preferência significativa por certos
animais, resultados mostram um X de- 3,48, indicativo de que é provável que se devam ao
erro amostrai, assumindo que não exista preferência por um animal em particular.
Exercício 4
O valor do X é J -- 6- gl = 1 ■p - 0,26. O relacionamento entre fumar e beber pode ser
explicado pelo erro amostrai apenas. Não existe evidência a partir desse estudo que sugira um
relacionamento entre fumar e beber.
1. b, 2. c, 3. d, 4. a, 5. d, 6. b, 7.d, 8. c, 9. a, 10. a, 11. d, 12. c, 13. d. 14. c, 15. a, 16. b, 17.

b. 18. a. 19. a, 20. b
Capítulo 9
Atividade 9.1
Razões pelas quais os escores variam entre grupos: (a) manipulação da variável indepen
dente as pessoas diferem em virtude das diversas condições nas quais estão; ( b ) diferenças
individuais; (c) erro experimental.
Razões da variação dos participantes dentro de uma condição: (a) diferenças individuais
e (b) erro experimental.
Atividade 9.2
(a)
Atividade 9.3
As diferenças entre as duas médias amostrais para esse estudo é uma estimati\a pontual. Se
repetirmos o estudo com uma amostra diferente, podemos encontrar uma diferença entre as mé
dias ou pouco mais alta ou mais baixa. Os limites de confiança informam que podemos ter 95%
de confiança de que a diferença média populacional está entre os limites inferior e superior.
E xe rcício 1
ANOVA DE UM FATOR
ANOVA
SCORE (ESCORE)
Sum f Squares Mean Square

Between Groups
112.867 2 56,433 12.687 .000
(Entre Grupos)
Within Groups
120.100 27 4.44 8
(Dentro dos Grupos)
Total 232.967 29
Sig. = Sign if icância
COMPARAÇÕES MÚLTIPLAS
Dependent Variable: SCORE (Escore da variável dependente)

Tukey HSD (HSD deTukey)
(IC de 95%)
(I) lab groups (j) lab groups Mean Difference
(grupos de (grupos de (Diferenças de Std. Error Lower bound Upper bound
laboratório) laboratório) médias) (Erro Padrão) Sig. (Limite inferior) (Limite superior)
morning afternoon (tarde) -4.000 .943 .906 -2.7386 1.9386

(manhã) evening (vespertino) 3.9000* .943 .001 1.5614 6.2386
afternoon morning (manhã) .4000 .943 .906 -1.9386 2.7386

(tarde) evening (vespertino) 4.3000* .943 .000 1.9614 6.6386
evening morning (manhã) -3.9000* .943 .001 -6.2386 -1.5614

■.espertino) afternoon (tarde) -4.3000* .943 .000 -6.63 86 -1.9614
' The mean difference is significant at the .05 level. (* A diferença entre as médias é significativa no nível de 5%.)
A ANOVA mostra que existem diferenças entre algun ; ou em todos os grupos que podem
ser atribuídas ao erro amostrai (F(2, 27) = 12,7; p < 0,001); uma comparação post-hoc de
Tukey mostra que não existem diferenças significativas entre os gaipos da manhã e da tarde.
Entretanto, o grupo vespertino difere dos outros dois grupos.
Exercício 2
ANOVA DE MEDIDAS REPETIDAS
Test of Within-Subjects Effects (Teste dos Efeitos dentre Sujeitos)

Measure: M EASURE1 (Medida: Medida 1)
Type III Sum of Mean Squaref

Squáres (Soma dós (Quadrado da 1
Source (Fonte) Quadrados do Tipo lli) df (gl) Média) F Sig. n
DRUG (DROGA) Sphericity Assumed
197.821 3 65.940 4.278 .019
(Esfericida de Assumida)
Green house-Geisser 197.821 2.111 93.693 4.278 .036
Huynh-Feldt 197 821 3.000 65.940 4.278 .019
Lower-Bound
(Limite Inferior)
197.821 1.000 197.821 4.278 .084
Error (DRUG) Sphericity Assumed

(Erro (DROGA)) 277.429 18 15.413
(Esfericidade Assumida)
Fluynh-Feldt 277.429 18.000 15.413
Lower-Bound
277.429 6.000 46.238
(Limite Inferior)
2. DRUG (2. Droga)

Measure: M EASU RE_' (Mec: . Medida 1)

(IC de 95%)
Std. Error Lower bound Upper bound
DRUG (DROGA) Mean (Média) (Erro Padrão) (Limite inferior) (Limite superior)
1 14.286 1.229 11.279 17.293

2 12.857 1.421 9.379 16.335
3 9.857 1.792 5.473 14.242
4 7.429 1.110 4.713 10.144
Uma inspeção das médias mostrou que as mesmas estavam na direção esperada em to
das as condições. Existe uma tendência decrescente: os participantes que ingeriram placebo
tiveram maiores escores, e os que ingeriram altas doses, e menores escores. Essas diferenças
nos escores são improváveis de serem obtidas apenas por erro amostra!, considerando que a
hipótese nula seja verdadeira (F(2, 13) = 4,28, p = 0,036). Pode-se concluir que, quanto mais
os estudantes fumam maconha, pior será seu desempenho nos testes aritméticos.
1. b, 2. c, 3. b, 4. a. 5. b, 6. c, 7. a, 8. b. 9. a, 10. c. II. a, 12. b. 13.b, 14. b, 15. d, 16. b,

17. b, 18. b, 19. a, 20. b
Capítulo 10
Atividade 10.1
Com quatro variáveis você terá as seguintes fontes de variância:

■ Efeitos principais: A. B, C e D
■ Iniciações: AB. AC. AD, BC. BD, CD, ABC. ABD, AC D, BCD, ABCD
■ Erro
Atividade 10.2
Descrição das análises:

(a) Uma ANOVA 6 x 2 - uma VI com seis condições e uma com duas condições
(b) Uma ANOVA 3 x 3 x 3 - três Vis cada uma com três condições
(c) Uma ANOVA 4 x 2 x 4 x 2 - duas Vis com quatro condições e duas com duas
condições
(d) Uma ANOVA 2 x 2 x 2 x 2 x 2 - cinco Vis com duas condições
Atividade 10.3
Com referência à Tabela 10.4, não existe sobreposição entre as condições com álcool e
sem álcool e sem cafeína, sugerindo uma diferença real nas populações. Existe uma pequena
sobreposição dos intervalos de confiança para as condições com cafeína, novamente sugerin
do uma possível diferença nas populações. Comparando as condições com e sem cafeína com
a condição sem álcool, existe uma considerável sobreposição nos intervalos de confiança, su
gerindo que talvez não exista uma diferença real na população. Para as condições com e sem
cafeína associada à condição com álcool, entretanto, não existe sobreposição dos intervalos,
sugerindo novamente uma diferença real entre as populações.
Atividade 10.4
Nos gráficos mostrados, (a) e (b) sugerem que uma interação está presente.
Atividade 10.5
Quais das seguintes situações descrevem um efeito simples?

(a) Diferença entre mascar chicletes e não mascar chicletes enquanto se fala - efeito
simples
(b) Diferença global entre os bebedores e não-bebedores de chá - efeito principal
(c) Os efeitos do barulho somente na prova de matemática - efeito simples
(d) Os efeitos de uma terapia de comportamento cognitivo na respostas ao medo de todo
o grupo de participantes - efeito principal
Atividade 10.6
As medidas de magnitude do efeito apropriadas para uso com a ANOVA podem ser o r f
parcial e o d.
Atividade 10.7
O Tf parcial é calculado da seguinte forma:

■ Para o efeito principal do álcool: 825,021/(825,021 + 110,229)
■ Para o efeito principal da cafeína: 623,521/(623.521 + 189.729)
■ Para a interação: 305,021/(305.021-i 133,229)
Atividade 10.8
O d para o efeito simples e' o seguinte.

Diferença entre com cafeína e sem cafeína
■ Com álcool = 3.68
■ Sem álcool = 0.66
Diferença entre com álcool e sem álcool
■ Com cafeína = l .02
■ Sem cafeína = 3.79
E xe rcício 1
1. O estudo conduzido pela doutora Bod é utn delineamento subdividido do ano em que o
exame foi feito com lima variável entre participantes e o conteúdo envolvido com uma
variável dentre participantes.
2. Umn VI é o ano que o exame foi realizado (1977 ou 1997); a outra VI. o conteúdo envol
vido (inglês ou matemática). A variável dependente é a nota dada pelo examinador em
cada um dos exames.
3. A saída da ANOVA é apresentada abaixo:
MODELO LINEAR GERAL
W ithin-Subjects Factors (Fatores Dentre Sujeitos)

Medida: MEDIDA - 1
Dependent Variable
SUBJECT (ASSUNTO) (Variável Dependente)
1 MATHS (MATEMÁTICA)
2 ENGLISH (INGLÊS)
Within-Subjects Factors (Fatores dentre Sujeitos)
YEAR 1.00 1977 12

(ANO) 1997 12
2.00
Multivariate Tests6 (Testes Multivariadosb)

Efeito (Valor) F (gl da hipótese) (gl do erro) Sig. r|2 Parcial
SUBJECT Pillai's Trace (Traço de Pillai) .000 ,001s 1,000 22.000 .982 .000
(ASSUNTO) Wilks' Lambda (X. de Wilks) 1.000 ,001s 1.000 22.000 .982 .000
Hotelling's Trace (Traço de Hotelling) .000 ,001s 1.000 22.000 .982 .000
Roy's Largest Root (Maior Raiz de Roy) .000 .001J 1.000 22.000 .982 .000
SUBJECT*YEAR Pillai's Trace (Traço de Pillai) .004 ,088s 1.000 22.000 .769 .004
(ANO*ASSUNTO) Wilks' Lambda (Xde Wilks) .996 ,088s 1.000 22.000 .769 .004
Hotelling's Trace (Traço de Hotelling) .004 ,088s 1.000 22.000 .769 .004
Roy’s Largest Root (Maior Raiz de Roy) .004 .088' 1.000 22.000 .769 .004

b. Design: Intercept+YEAR (b. Projeto: intercepto + ANO)
Within Subjects Design: SUBJECT (Delineamento dentre Tópicos: CONTEÚDO)
Sig. = Significance
Mauchly'sTest of Sphericity" (Teste de Esfericidade de Mauchlyb)

Measure: MEASURE 1 (Medida: MEDIDA 1)
ea
Within Subjects Mauchly's Aprox. Chi-Square Lower bound

Effect (Efeito W (W de (Qui-Quadrado Df Greenhouse- Huynh- (Limite
Dentre Sujeitos) Mauchly) Aproximado) (gl) Sig. Geisser Feldt inferior)
Conteúdo 1.000 .000 0 1.000 1.000 1.000
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent
variables is proportional to an identity matrix. (Testa a hipotese nula de que a matriz de covariancia dos erros
da variável dependente transformada e ortonormalizada é proporcional a urna matriz identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected test are
displayed in the Tests of Within-Subjects Effects table, (a. Pode ser utilizado para ajustar os graus de liberdade para
o teste de significancia ponderado. Testes Corrigidos são mostrados na tabela dos Efeitos dos Testes Dentre Sujeitos.)
b. Design: Intercept+YEAR (b. Projeto: Intercepto-ANO)
Within Subjects Design: SUBJECT (Delineamento: Dentre Tópicos: CONTEÚDO)
Test of Within-Subjects Effects (Teste dos Efeitos dentre Tópicos)

Measure: M EASURE1 (Medida: MEDIDA .1)

(Soma dos Quadrados do Mean Squared
Source (Fonte) Tipo III) df (gl) (Quadrado da Média) F Sig. r|2 Parcial
SUBJECT Sphericity Assumed
(CONTEÚDO) (Esfericidade Assumida)
2.083E-02 1 2.083E-02 .001 .982 .000
Greenhouse-Geisser 2.083E-02 1.000 2.083E-02 .001 .982 .000
Huynh-Feldt 2.083E-02 1.000 2.083E-02 .001 .982 .000
Lower-Bound
(Limite Inferior)
2.083E-02 1.000 2.083E-02 .001 .982 .000
SU BJECTYEAR Sphericity Assumed

3.521 1 3.521 .088 .769 .004
(ANO*ASSUNTO) (Esfericidade Assumida)
Greenhouse-Geisser 3.521 1.000 3.521 .088 .769 .004
Huynh-Feldt 3.521 1.000 3.521 .088 .769 .004
Lower bound
(Limite inferior)
3.521 1.000 3.521 .088 .769 .004
Error (SUBJECT) Sphericity Assumed

879.958 22 39.998
(Erro (CONTEÚDO)) (Esfericidade Assumida)
Huynh-Feldt 879.958 22.000 39.998
Lower bound
879.958 22.000 39.998
(Limite inferior)
Test of Within-Subjects Contrasts (Teste dos Contrastes dentre Sujeitos) '

Measure: MEASURE 1 (Medida: M ED IDAJ)
Type III Sum of Squares Mean Squared

SUBJECT (Soma dos Qua df (Quadrado da
Source (Fonte) (CONTEÚDO) drados do Tipo III) (gl) Média) F Sig. r|- Parcial
SUBJECT (CONTEÚDO) Linear 2.083E-02 1 2.083E-02 .001 .982 .000

SUBJECT*YEAR
Linear 3.521 1 3.521 .088 .769 .004
(ANO*ASSUNTO)
Error (SUBJECT) Linear 879.958 22 39.998
(Erro (CONTEÚDO))
Teste dos Efeitos dentre Tópicos

Medida: M E D ID A J
Variável Transformada: Média

(Soma dos Qua df Mean Squared
Fonte drados do Tipo III) (gl) (Quadrado da Média) F Sig. r|2 Parcial
Intercept
(Intercepto) 151762.521 1 151762.521 2262.107 .000 .990
YEAR (ANO) 391.021 1 391.021 5.828 .025 .209
Error (Erro) 1475.985 22 67.089
4. Os valores F e o . valores p associados são:
Efeito;, Valor F Valor p
Efeito principal do ano 5.83 0.025

Eteilo principal do conteúdo 0.00 0.982
Interação 0.09 0.769
5. Essas análises mostram que somente o efeito principal do ano é provavelmente náo-atri-
buível ao erro amostrai, se a hipótese nula for verdadeira. O efeito principal dos conteúdos
e da interação apresentam probabilidades associadas, sugerindo que podem ser atribuídos
ao erro amostrai.
6. Podemos ver a partir dos resultados da ANOVA que o iy parcial para o efeito principal
do ano (0.209) é muito maior do que o ry parcial para o efeito principal dos conteúdos
(0,000) e para a interação (0,004).
E xe rcício 2
1. O estudo executado pelo D r. Kid é um delineamento completamente entre participantes.

2. Uma VI é a idade da criança (5 e 11 anos) c uma VI é o gênero (meninos e meninas). A
VD nesse estudo é o escore de cada participante no teste de percepção de cores.
3. Os resultados da ANOVA são apresentados abaixo:
584 C hristine P, Dancey & John Reidy
ANÁLISE UNIVARIADA DE VARIÂNCIA
Withm-Subjects Factors (Fatores dentre Tópicos)

Value Label
N
(Rótulo)
AGE (IDADE) 5 years old
’ .00 (5 anos) 24
11 years old
2.00 (11 anos) 24
GENDER (GENÊRO) i -00 boys (meninos) 24
2.00 girls (meninas) 24
Test of Within-Subjects Contrasts (Teste dos Contrastes dentre Sujeitos)

Dependent Variable: Colour Perception (Variável D ep en d en te: P ercep ção d a s Cores)

(Soma dos Qua df Mean Squared
Source (Fonte) drados do Tipo III) (gi) (Quadrado da Média) F Sig. r|2 Parcial
Modelo Corrigido 181.229- 3 60.410 22.702 .000 .608
AGE (IDADE) 28.521 1 28.521 10.718 ,C02 .196
GENDER (GENÊRO) 130.021 1 130.021 48.862 .000 .526
AGE*GENDER
22.688 1 22.688 8.526 .006 .162
(IDADE*GENÊRO)
Error (Erro) 117.083 44 2.661
Total 1653.000 48
Corrected Total
(Total Corrigido) 298.313 47
a. R2= 6,08 (R2 Ajustado = 0 ,5 8 1 )

Sig. = Significânda
4. Os valores / e os valores p associados são:
Efeitos Valor F Valor p
Efeito principal da idade 10,72 0,002

Efeito principal do gênero 48.86 0,000
Interação 8,53 0,006
5. Os valores p mostrados acima sugerem ser improvável que o efeito principal da idade e
do gênero e a interação entre essas duas variáveis independentes tenham ocorrido por erro
amostrai se a hipótese nula for verdadeira,
6. Os r f parciais para o efeito principal da idade do gênero e da interação são 0,196, 0,526 e
0,162, respectivamente. Assim, a magnitude do efeito devido ao gênero é grande.
7. A interação pode ser examinada utilizando testes t individuais. Os resultados de tais aná
lises são apresentados a seguir:
TESTE T
GENDER = BOYS (GÊNERO = MENINOS)
Std. Deviation Std. Error Mean

AGE (IDADE) N Mean (Media) (Desvio Padrão) (Erro Padrão da Média)
Color Perception 5 anos 12 3.5833 2.2747 .6566
(Percepção de cores)
1 1 anos 12 3.7500 1.4848 .4286
a. GENDER — boys (a. GÈNERO - meninos)
Independent Samples Test3 (Teste para Amostras Independentes3)

Levene's Test
for Equality
of Variances
(Teste de
Levene para
a Igualdade
de Variâncias) t-test for Equality of Means (Teste t para a igualdade de Medias)
95% Confidence
nterval of the
Difference (ICde95%
para a diferença)
sig- Mean Std. Error
(2-tailed) Difference Difference Lower Upper
Df (Sig. (Diferença (Erro Padrão (Limite (Limite
F Sig. t (gl) Bilateral) das Médias) da Diferença) inferior) superior)
Color Equal variances
Perception assumed (Igualdade .772 .389 -213 22 .834 -.1667 .7842 -1.7929 1.4596
(Percepção de variâncias assumida)
de cores) Equal variances not
assumed (Igualdade de -213 18.933 .834 -.1667 .7842 -1.8083 1.4750
a. GENDER = Boys (a. GÊNERO =meninos)
GENDER = GIRLS (GÉNERO = MENINAS)

Mean Std. Deviation Std. Error Mean
AGE (IDADE) N (Média) (Desvio Padrão) (Erro Padrão da Média)
Color Perception 5 years old 12 5.5000 1.3817 .3989
(Percepção de Cores) (5 anos)
1 1 years old 1.1645 .3362
12 8.4167
(11 anos)
a. GENDER = girls (a GÉNERO = meninas)
Independent Samples Test,J (Teste para Amostras Independentes4)

Levene's Test
for Equality
of Variances
(Teste de
Levene para
a Igualdade
de Variâncias) T-test for Equality of Means (Teste t para a Igualdade de Médias)
95% Confidence
Interval of the Di
fference (IC de 95%
para a Diferença)
Sig. Mean
(2-tailea) Difference Difference Lower Upper
df (Sig. (Diferença (Erro Padrão (Limite (Limite
F Sig. t (gl) Bilateral) das Médias) da Diferença) inferior) superior)
Colour Equal variances
Perception assumed (Igualdade .312 .582 -5.591 22 .000 -2.9167 .5216 -3.9985 -1.8349
(Percepção de variâncias assumida)
de Cores) Equal Variances not
Assumed (igualdade de -5.591 21.386 .000 -2.9167 .5216 -4.0003 -1.8331
a. GENDER = Girls (a. GÉNERO - meninas)
Esses testes t mostram que. para os meninos, não existe diferença nos escores da percepção
de cores entre os 5 e os II anos de idade, além daquela que poderia ser atribuída ao erro amostrai
(/(22) = -0.21, p = 0.824). A diferença na percepção de cores entre as meninas de 5 e 11 anos de
idade provavelmente não se deve, entretanto, ao erro amostrai (/'(22) = -5,59. p < 0,001).
1. c 2. b. 3. c, 4. b, 5. c. 6. a 1. 7. d. 8. c. 9. c. 10. a’. 11 . c, 12. a, 13. e, 14. a, 15. d. 16. b.

17. d, 18. c, 19. c, 20. b
Capítulo 11
Atividade 11.1
A análise correlacionai fornece uma medida de quão próximo estão os pontos de uma
linha imaginária (r). Com a regressão linear, a linha real é traçada entre os pontos, de forma
que o erro total seja mínimo. A linha adere aos dados da melhor forma possível. A linha pode.
portanto, ser utilizada para determinar quanto o y irá mudar, como resultado de uma alteração
em x.
Atividade 11.2
5 + (2*20) = 5 + 40 = 45
' Em bora exista som ente um efeito significativo da área, o v a lo r/> para o C A R R I S IV (0.052) está próxim o ao critério tradicional
para a significância: assim , você provavelm ente quer discutir o efeito principal.
‘ E difícil dizer a partir do gráfico se existe um a interação definitiva. Você provavelm ente vai qu erer olhar a análise para chegar a uma
decisão sobre isso. Se. entretanto, você olhar para a diferença vertical entre os dois pontos no final do lado esquerdo d as linhas e
com pará-la com a diferença do final do lado direito da linha, poderá perceber um a interação.
Atividade 11.3
A linha no segundo diagrama irá prever melhor, uma vez que os pontos no diagrama (b)
estão mais próximos da linha do que os pontos no diagrama (a).
Atividade 11.4
1. (a)
2 . (b)
Atividade 11.5
(C )
Atividade 11.6
Onde os pesquisadores estiverem observando as variáveis tanto de forma isolada quanto

conjunta, deve-se utilizar a segunda fórmula de Tabachnick e Fidell (n > 104 + m). Existem
quatro variáveis explanatórias. Isto quer dizer que os pesquisadores utilizaram > 104 + 4.
Assim, eles devem ter pelo menos 108 participantes.
Exercício 7
O pesquisador quer descobrir se a ansiedade sobre um teste está relacionada ao número
de horas de estudo - talvez as pessoas ansiosas estudem menos (porque estudar aumenta a
ansiedade) ou talvez, pela ansiedade, estudem mais. O coeficiente de correlação entre as duas
variáveis foi moderado (0.35). O R ajustado (0,055) mostrou que somente uma pequena parte
da variação nas horas estudadas pode ser atribuída à ansiedade. O valor F de 1,822 tem uma
probabilidade associada de 0.20. A inclinação da linha de regressão foi de 0,0393. Os limites
de confiança em torno da linha foram de -0,236 a 1,021. Assim, não podemos ter segurança
de que a linha populacional tenha inclinação positiva ou negativa. Não existe evidência, en.
tão, sugerindo que a ansiedade e o número de horas de estudo estejam relacionadas.
Exercício 2
O professor Limão quer saber se suporte social e personalidade podem prever a satisfação.
O suporte e a personalidade combinados mostram um relacionamento forte com a satisfação
(0,90). O R: ajustado indica que 78% da variação na satisfação podem ser explicados pelas
variações no suporte e na personalidade. O valor F de 35,29 mostra que é improvável que esse
resultado tenha sido obtido apenas por erro amostrai, caso a hipótese nula seja verdadeira (p
< 0,001). As duas variáveis, então, contribuem para a previsão da satisfação. Para cada au
mento de um desvio padrão no suporte social, a satisfação aumenta 0,73, e para cada aumento
na personalidade, a satisfação aumenta 0.38. Assim, tanto a personalidade quanto o suporte
social contribuem fortemente para a satisfação.
1. d, 2. d, 3. a, 4. a, 5. d, 6. c, 7. a, 8. a. 9. a, 10. a, 11. b, 12. c. 13. c, 14. d, 15. b, 16. a.

17. a, 18. b. 19. b, 20. a
Capítulo 12
Atividade 12.1
Existem várias maneiras de explicar um fator. E uma entidade hipotética, um constructo

subjacente, uma medida composta que inclui um certo número de variáveis correlacionadas.
Atividade 12.2
Os nomes possíveis são: medroso, agitado, temeroso. Você pode ter outros.
Atividade 12.3
Veja Figura 12.10.
Atividade 12.4
Três nomes possíveis são (1) qualidade de vida. (2) felicidade. (3) tristeza. Você prova
velmente pode pensar em outros nomes mais apropriados.
Atividade 12.5
Você deve tirar suas próprias conclusões!
Atividade 12.6
F1 = independência e liberdade; F2 = fontes externas e motivação; F3 = desenvolvimento

social: F4 = conveniência; F5 = motivação acadêmica.
Atividade 12.7
Ambas, vergonha e culpa, estão moderadamente relacionadas ao comportamento sub

misso. Culpa mostra uma associação fraca com depressão, mas a vergonha não.
Atividade 12.8
Perfeição e ineficiência mostram uma associação moderada com o Fator 1, que foi deno
minado de dor física e desconforto. O fator denominado de flatulência não mostra qualquer
associação importante com as variáveis de desordem alimentar, enquanto o fator que represen
ta o vômito apresenta. O vômito apresenta uma relação positiva moderada com ineficiência,
bulimia e discrepância de peso.
Atividade 12.9
(a)
1 2 3
1 - 30 50
2 - 80
3
(D
1. a, 2. a, 3. c, 4. b. 5. c. 6. a, 7. b, 8. b, 9. c 10. c. 11. d 12. a, 13. d, 14. a. 15. c. 16. c,

17. a, 18. b. 19. b, 20. a
Capítulo 13
Atividade 13.1
(b)
Atividade 13.2
(c)
590 C hristine P. Dancey & John Keidy
Atividade 13.3
(a)
Atividade 13.4
(a)
I. O diagrama de dispersão m ostra que as lin has para todos os três grupos são p aralelas;
assim, as condições da ANCOVA estão satisfeitas.

Type III Sum of Squa Mean Square
res (Soma dos Qua (Quadrados
Source (Fonte) drados do Tipo III) df (gl) Médios) F Sig. n2
Corrected Model
214.627° 3 71.542 101.425 .000 .921
(Modelo Corrigido)
MOTIV (MOTIVO) 101.760 1 101.760 144.264 .000 .847
GROUP (GRUPO) 28.335 2 14,167 20.085 .000 .607
Error (Erro) 18.340 26 .705
Total (Total) 5809.000 30

Corrected Total
232.967 29
(Total Corrigido)
a. Computed using a = .05 (a. Calculado utilizando o. - 0,05)

b. R2 - .921 (Adjusted R2 = .912) (b. Rz = 0,921 ÍR-' Ajustado 0,912])
A motivação está claramente relacionada aos escores, e, assim, a ANCOVA é apropriada.

A análise mostra que as diferenças entre as condições (rp = 0,61) é grande e provavelmente
não ocorreu por erro amostrai (F = 20,085, p < 0,001).
1. a, 2. a, 3. d, 4. a, 5. b, 6. a, 7. b. 8. d, 9. b, 10. c, 11. a. 12. b, 13. c, 14. a. 15. b, 16. c,

17. c, 18. b 19. a, 20. b
Capítulo 14
Atividade 14.1
Dos estudos descritos, (b) c (c) são apropriados para serem analisados por meio de uma
MANOVA.
Atividade 14.2
(a) a + b + c + d + e: combinação linear

(b) A x B x C x D x E : não é uma combinação linear
(c) (a + b + c + d + e)/2: combinação linear
(d) Extroversão + 2*Neuroticismo - 3*Psicologismo: combinação linear
Atividade 14.3
Uma interpretação da Figura 14.2 é dada no texto após a figur?.
Atividade 14.4
(a) Traço de Hotteling - Sim

(b) Nota de Phil - Não
(c) Ligação mais fraca de Seth - Não
(d) X de Wilks - Sim
fe) Gama de Hayley - Não
(f) Traço de Pillai - Sim
(g) Caminho de Crossroad - Não
(h) Maior raiz de Roy - Sim
Atividade 14.5
(a) Apropriado
(b) Apropriado
(c) Apropriado
(d) Inapropriado
E.\ercício 1
1. A suposição de homogeneidade das matrizes de variâncias-covariâncias é testado utili
zando o teste M de Box. Os detalhes são apresentados abaixo:
Teste de Box da Igualdade das Matrizes de Covariâncias
M de Box 2,246
F 0,675
gii 3
gl2 87120
Sig. 0,567
Testa a hipótese nula de que as matrizes observadas da

covariáncia das variáveis dependentes são iguais entre os grupos,
a. Delineamento: Intercepto + Combustível
Se o valor p associado com o M de Box é menor do que 0 05, temos uma violação da
suposição das matrizes de variâncía-covariância. Nesse caso o valor p é bem maior do que
0,05, portanto não temos uma violação dessas suposições.
MODELO LINEAR GERAL
W ithin-Subjects Factors (Fatores dentre Tópicos)

FUEL 1.00 Carrot juice fuel 12
(combustível) (Combustível de suco de cenoura)
2.00 Mushy pea fuel 12
(Combustível de purê de ervilhas)
Box's Test of Equality of Covariance Matrices'* (Teste de Box para

a Igualdade das Matrizes de Covariandas3)
F .675
df 1 (gl1) 3
df2 (gl2) 87120
Sig. .567
Tests the null hypothesis that the observed covariance matrices

of the dependent variables are equal across groups. (Testa a
hipótese nula de que as matrizes observadas da covariância das
variáveis dependentes são iguais entre os grupos.)
a. Design: Intercept + FUEL
(a. Delineamento: Intercepto + COMBUSTÍVEL!
Multivariate Testsb (Testes Multivariados6)

Effect (Efeito) (Valor) F (gl âa hipótese) (gl do erro) Sig. n2
Intercept Pillai's Trace (Traço de Piilai) .973 384.38 1 2.000 21.000 .000 .973
(Intercepto) Wilks' Lambda (/. de Wilks) .027 384.381 * 2.000 21.000 .000 .973
Hotelling's Trace .973
36.608 384.381 ■ 2.000 21.000 .000
Roy's Largest Root .973
36.608 384.381' 2.000 21.000 .000
(Maior Raiz de Roy)
FUEL Pillai's Trace (Traço de Piilai) .386 6.598' 2.000 21.000 .006 .386
(COMBUSTÍVEL) Wilks' Lambda (A. de Wilks) .614 6.598-’ 2.000 21.000 .006 .386
Hotelling's Trace
.628 6 .5 9 8 ’ 2.000 21.000 .006 .386
Roy's Largest Root
.628 6 .5 9 8 ! 2,000 21.000 .006 .386
(Maior Raiz de Roy)

b. Design: Intercept + FUEL(b. Projeto: Intercepto + COMBUSTÍVEL)
Sig. = Significâncía
Levene’s Test of Equality of Error Variance3 (Teste de Levene para a Igualdade das Variâncias dos Erros3)
F df 1 (gll) df2 (gl2) Sig.

Engine condition
(Condição do motor) .184 1 22 .672
Number of km per litre ,760 1 22 .393
(Número de km/L)
Tests the null hypothesis that the error variance of the dependent variables is equal across groups.
(Testa a hipótese nula de que variâncias dos erros das variáveis dependentes são iguais nos grupos.)
a. Design: Intercept + FUEL (a. Projeto: intercepto t- COMBUSTÍVEL)
2. O valor F calculado utilizando o X de Wilks é 6,598

3. Como o valor p associado é somente 0,006, pode-se ter razoável confiança de que é im
provável que a diferença multivariada observada entre os dois tipos de combustível tenha
ocorrido apenas poi' erro amostrai, caso a hipótese nula seja verdadeira.
4. Os testes de análise de variância univariados são apresentados abaixo:
Test of Within-Subjects Effects (Teste dos Efeitos dentre Tec ces
Type lli Sum of Squa Mean Square

Dependent Variable res ÍSoma dos Qua (Média dos
Source (Fonte) (Variável Dependente) drados do T,po df Quadrados) F Sig. n2
Corrected Model Engine condition 1 .421
1.500’ 1.500 .523 .019
(Modelo Corrigido) (Condição co motori
Number of km per litre 66.667: 1 13.750 .001 .385
66.667
(Numero de km/l)
Intercept Engine condition
704.167 1 704.167 197.766 .000 .900
(intercepto) (Condição do motor)
Number of km per litre 3266.667 1 3266.667 673 750 .000 .968
(Nùmero de km/L)
FUEL Engine condition 1.500 1 1.500 .421 .523 .019
(COMBUSTÍVEL) (Condição do motor)
Number of km per litre 66.667 1 66.667 13.750 .001 .385
(Número de km/L)
Erro Engine condition
78.333 22 3.561
(Condição do motor)
Number of km per litre 106.667 22 4.848
(Numero de km/LÌ
Total Engine condition 24
784.000
(Condição do motor)
Number of km per litre 24
(Numero de km/L) 3440.000
Corrected Total Engine condition 79.833 23

(Total Corrigido) (Condição do motor)
Number of km per litre 173.333 23
(Número de km/L)
a. R2 = .019 (Adjusted R2 = -.026 (a. R; = 0.019 [R2 Ajustado ■ -0,026])
b. R2 = .385 (Adjusted R2 = .357 (b. Ri = 0,85 (RJ Ajustado = 0,357])
Sig. = Significáncia
O teste F univariado sugere que somente o número dc quilômetros por litro contribuiu
para a diferença multivariada. Se ajustarmos o valor a global para 0,05, precisaremos
dividi-lo por 2 apenas porque fizemos somente dois lestes univariados. Precisamos ain
da verificar os valores p associados com cada um dos testes univariados para ver se são
menores do que 0,025. Se isso ocorrer, podemoí. estar razoavelmente confiantes de que
contribuem para a diferença multivariada. Nesse caso, somente o número de quilômetros
por litro apresenta um valor p dentro dessa região, e, assim, apenas uma VD está contri
buindo para diferença multivariada.
5. A análise correlacionai é apresentada abaixo e sugere que não existe conrelação entre as
duas variáveis além daquela que poderia ocorrer devido ao erro amostrai.
CORRELAÇÕES
Engine condition Number of km per litre
(Condição do motor) (Número de km/l)
Engine condition Pearson Correlation 1.000 .164
(Condição do motor) (Correlação de Pearson)
.443
Sig. (2-tailed)
(Sig. Bilateral) 24 24
N
Number of km per litre Pearson Correlation .164 1.000
(Número de km/l) (Correlação de Pearson)
.443
Sig. (2-tailed)
(Sig. Bilateral) 24 24
N
6. O tamanho do efeito para cada VD é mostrado com a análise univariada. O rf para o consumo
de combustível é 0,39 e da condição do motor é 0,02. Isso sugere que, quando o consumo de
combustível é a VD na análise univariada, 39c/c da variação no consumo de combustível e' atri
buído a diferenças no tipo de combustnei. Quando a condição do motor é a VD, somente 2c/c
da variação na condição do motor é de responsabilidade da diferença do tipo de combustível.
Exercício 2
1. A análise multivariada para o estudo das bebidas é apresentada abaixo:
MODELO LINEAR GERAL
(Vithin-Subjects Factors (Fatores dentre Tópicos)

DRINK Dependent Variable
Medida (BEBIDA) (Variável Dependente)
TASTE 1 LAGTASTE (SABOR DA LEVE)
(SABOR) 2 LOUTASTE (SABOR DA LEVORTE)
EFFECTS 1 LAGPLEAS
(EFEITOS) (EFEITOS PRAZEROSOS DA LEVE)
2 LOUTPLEAS
(EFEITOS PRAZEROSOS DA LEVORTE)
Multivariate Testsb (Testes Multivariados“)

Hypothesis Errar df
Value df (gl da (gl do
Effect (Efeito) (Valor) F hipótese) erro) Sig. n2
Between Subjects Intercept Pillai's Trace .995 984.826* 2.000 10.000 .000 .995
(Entre Tópicos) (Intercepto) (Traço de Pillai)
.005 984.826s 2.000 10.000 .000 .995
Wilks' Lambda
(X de Wilks) 196.965 984.826* 2.000 10.000 .000 .995
Hotelling's Trace 196.965 984.826a 2.000 10.000 .000 .995
Roy's Largest Root
(Maior Raiz de Roy)
Within Subjects DRINK Pillai's Trace .600 7.516a 2.000 10.000 .010 .600
(Dentre Tópicos) (BEBIDA) (Traço de Pillai)
.400 7.516" 2.000 10.000 .010 .600
Wilks' Lambda
(Xde Wilks) 1.503 7.516a 2.000 10.000 .010 .600
Hotelling's Trace 1.503 7.516 a 2.000 10.000 .010 .600
Roy's Largest Root
(Maior Raiz de Roy)

b. Design: Intercept + Within Subjects Design: DRINK (b. Projeto: Intercepto) (Delineamento dentre Tópicos: BEBIDA)
!. Essas análises mostram que existe uma diferença mukivariada entre as duas bebidas, ale'm
da que pode ser atribuída ao erro amostrai. O valor F é 7,516, com uma probabilidade
associada de p = 0,010 .
2. A decisão sobre como avaliar a contribuição relativa de cada VD individual para a di
ferença multivariada depende de haver ou não correlação entre elas. Os coeficientes de
correlação para as variáveis dependentes são apontados abaixo.
CORRELAÇÕES
Lager: taste Lager: pleasurable effects

(Leve: sabor) (Leve: efeitos prazerosos)
Lager: taste (Leve: sabor' Pearson Correlation
1.000 -.2 2 9
'Correlação de Pearson)
Sig. (2-tailed)
Sig. Bilateral) .475
N 12 12
Lager: pleasurable effects Pearson Correlation
- 229 1.000
(Leve: efeitos praze-ososi ¡Correlação de Pearson)
Sig. (2-tailed)
.475
Sig Bilateral)
N 12 12
CORRELAÇÕES
Lout: taste Lout: pleasurable effects

(Levorte: sabor) (Levorte: efeitos prazerosos)
Lout: taste Pearson Correlation
1.000 -.2 6 4
(Levorte: sabor) (Correlação de Pearson)
(Sig. Bilateral)
N 12 12
Lout: pleasurable effects Pearson Correlation
-.2 6 4 1.000
(Levorte: efeitos (Correlação de Pearson)
prazerosos) Sig. (2-tailed)
(Sig. Bilateral) .407
N 12 12
Essa análise correlacionai mostra que não existem correlações além das que podem ser
atribuídas ao erro amostrai entre o sabor e os efeitos prazerosos da bebida leve e o sabor e os
efeitos prazerosos da nova bebida (Levorte). Podemos utilizar os testes univariados da saída
da MANOVA para examinar a contribuição relativa de cada VD para a diferença multivaria
da, Essa saída é apresentada a seguir:
Univariate Tests (Testes Univariados)

Type III Sum Mean
of Squares Square
(Soma dos Qua (Média dos
Source (Fonte) Measure (Medida) drados do Tipo III) df (gl) Quadrados) F Sig. n2
DRINK TASTE Sphericity Assumed
63.375 1 63.375 16.165 .002 .595
(BEBIDA) (SABOR) (Esfericidade Assumida)
Greenhouse-Geisser 63.375 1.000 63.375 16.165 .002 .595
Huynh-Feldt 63.375 1.000 63.375 16.165 .002 .595
Lower-bound
(Limite Inferior)
63.375 1.000 63.375 16.165 .002 .595
EFFECTS Sphericity Assumed

(Esfericidade Assumida) 1.500 1 1.500 .465 .509 .041
(EFEITOS)
Greenhouse-Geisser 1.500 1.000 1.500 .465 .509 .041
Huynh-Feldt 1.500 1.000 1.500 .465 .509 .041
Lower-bound
1.500 1.000 1.500 .465 .509 .041
(Limite Inferior)
Error (DRINK) TASTE Sphericity Assumed

43.125 11 3.920
(Erro BEBIDA)) (SABOR) (Esfericidade Assumida)
Huynh-Feldt 43.125 11.000 3.920
Lower bound
43.125 11.000 3.920
(Limite inferior)
EFFECTS Sphericity Assumed
35.500 11 3.227
(EFEITOS) (Esfericidade Assumida)
Huynh-Feldt 35.500 11.000 3.227
Lower bound
35.500 11.000 3.227
(Limite inferior)
3. Esses testes univariados sugerem que somente o sabor contribui para a diferença multi-
variada entre as duas bebidas. A diferença observada entre os efeitos prazerosos das duas
é provavelmente decorrência do erro amostrai (p 0,509). A diferença entre os sabores
não é provavel mente devida ao erro amostra] (/; = 0,002), sugerindo que os homens jovens
preferem o sabor da Levorte do que o da leve.
1. a, 2. a, 3. d, 4. a, 5. b, 6. a, 7. b, 8 d, 9. b. 10. c, II. a, 12. b, 13. c. 14. a, 15. b. 16. c.

17. c, 18. b, 19. a, 20. b
Capítulo 15
Atividade 15.1
(a) A correlação mais forte é a observada entre dor indefinida e número de partos (0,39).
(b) O valor da probabilidade para a correlação mais fraca (pressão aguda e número de
partos, 0,04) é p = 0,80.
Atividade 15.2
O grupo experimental obteve resultados significativamente mais altos do que o grupo

de controle (posto médio de 9,30 e 4,50, respectivamente). O valor da estatística de Mann-
Whitney foi de 3,5. com uma probabilidade associada (unilateral) de 0,018. A probabilidade
de esse resultado ter ocorrido devido ao erro amostrai, caso a hipótese nula seja verdadeira,
é menor do que 2 %.
Atividade 15.3
Existe uma diferença entre os escores das duas condições - o valor p bilateral foi 0,043.
A probabilidade desse resultado ter ocorrido devido ao erro amostrai, caso a hipótese nula
seja verdadeira, é menor do que 5%.
Atividade 15.4
Parece que as previsões dos pesquisadores foram confirmadas - o posto médio para a
condição 3 (5.8) é menor do que o posto médio da condição 1 (10.25) e da condição 2 (9,10).
A probabilidade de esse resultado ser decorrência do erro amostrai, entretanto, é maior do
que a que estamos dispostos a aceitar (p = 0,274).
Atividade 15.5
A depressão parece ter aumentado sobre os três pontos no tempo (posto médio 1,31. 1,88
e 2,81). O valor do qui-quadrado é 12,25. A probabilidade de esse valor ter ocorrido devido
ao erro amostrai, dado que a hipótese nula seja verdadeira, é 0,002. Concluímos que as pes
soas que não quiseram tomar parte no programa de intervenção comportamental se tornaram
significativamente mais depressivas com o tempo.
Exercício 7: p c/e Spearm an
CONFID
ORAL (ORAL) (CONFIANÇA)
Spearman's rho Correlation Coefficient
ORAL (ORAL) 1.000 -.8 7 2
(p de Spearman) (Coeficiente de Correlação)
Sig. (1 -tailed)
.027
(Sig. Unilateral)
N 5 5
CONFID Correlation Coefficient

-.8 7 2 1.000
(CONFIANÇA) (Coeficiente de Correlação)
Sig. (1 bailed)
.027
(Sig. Unilateral)
N 5 5
A correlação entre confiança e desempenho no exame oral é -0.872 (p = 0,027). Em

bora seja uma correlação negativa, note que a confiança foi codificada na direção oposta do
desempenho no exame oral. Assim, um relacionamento positivo entre essas duas variáveis é
confirmado - quanto mais confiante o estudante estiver, melhor será seu desempenho. O rela
cionamento é forte e é improvável que tenha ocorrido apenas devido ao erro amostrai.
Exercício 2: M ann-W hitney

Ranks (Postos)
Mean Rank Sum of the Ranks
GROUP (GRUPO) N (Posto Médio) (Soma dos Postos)
SCORE pbl (abp) 6 8.67 52.00
(ESCORE) traditional
6 4.33 26.00
(tradicional)
Total 12
Test Statistics {Estatísticas do Teste0)
SCORE (ESCORE)
Mann-Whitney 5.00
Wilcoxon 26.000
Z -2.131
Asymp. Sig. (2-tailed)
(Significância Assintótica Bilateral) .033
Exact. Sig. [2 *(1-tailed Sig.)]

.0 41a
(Sig. Exata)
a. Not corrected for ties (a. Empates não-corrigidos)

b. Grouping Variable: GROUP (b. Variável de
Agrupamento: GRUPO)
Como a psicóloga conferencista não fez uma previsão de qual abordagem seria mais
agradável para os alunos, ela utilizou um nível de significância bilateral.
O grupo ABP (aprendizagem baseada em problemas) obteve resultados melhores do
que o grupo tradicional (U = 5, c = -2.13, p = 0.041). Seu pequeno estudo piloto mostrou
que pode valer a pena utilizar a abordagem ABP com alunos cursando um módulo de esta
tística avançada.
Exercício 3: Wilcoxon
TESTES DOS SINAIS DE WILCOXON
Ranks (Postos)
Sum of the
Mean Rank Ranks (Soma
N (Posto Médio) dos Postos)
after the programme - before the programme Negative Ranksa
(antes do programa - depois do programa) (Postos Negativos3) 5 3.00 15.00
Positive Ranksb
(Postos Positivos0) 0 .00 .00
Ties (Empatesc) 1
Total 6
a. after the programme < before the programme (a. após o programa < antes do programa)
b. after the programme > before the programme (b. após o programa > antes do programa)
c. after the programme = before the programme (c. após o programa = antes do programa)
Test Statistics0 (Estatísticas do Teste1-')

after the programme - before the programme
(antes do programa - depois do programa)
2 - 2 .1 2 1 a
Test Exact. Sig. (1-tailed)
.031
(Sig. Exata Unilateral)
a. Based on negative ranks (a. Baseado nos postos negativos)
b. Wilcoxon Signed Ranks Test (b. Teste dos Sinais de Wilcoxon)
Os níveis de medo foram reduzidos após o programa (z = 2.12,p = 0,031). Pode ser ob
servado, que o posto médio antes do programa (3,00) foi reduzido para zero após o mesmo.
Um escore z de 2,12 tem menos de 2% de probabilidade de ter surgido devido ao erro amos
trai, caso a hipótese nula seja verdadeira (hipótese unilateral). Podemos concluir, então, que
o programa foi efetivo na redução do medo.
E xe rcício 4 : Kruskal-W allis
KRUSKAL-WALLIS
Ranks (Postos)
Mean Rank
GROUP (GRUPO) N (Média dos Postos)
SYMPTOM 1 (SINTOMA 1) 1.00 5 9.80
2.00 6 9.50
3.00 7 9.29
Total 18
SYMPTOM2 (SÍNTOMA 2) 1.00 5 6.10
2.00 6 9.42
3.00 7 12.00
Total 18
Test Statistics0 (Estatísticas do Teste3 0)
SYMPTOM1 (SINTOMA 1) SYMPTOM2 (SINTOMA 2)
Chi-Square (Qui-Quadrado) .029 3.714
df (gl) 2 2
Exact. Sig. (Sig. Exata) .994 .157
a. Kruskal-Wallis Test (a. Teste de Kruskal-Wallis)

b. Grouping Variable: GROUP (b. Variável de Agrupamento: GRUPO)
Os postos são muito semelhantes nos três grupos com respeito ao Sintoma J. O valor do
qui-quadrado de 0.029 tem uma probabilidade associada de 0,986 - esse resultado pode ser
atribuído ao erro amostrai. Concluímos que não existe diferença significativa entre os três
grupos quanto ao Sintoma 1.
Para o sintoma 2, os postos apresentam menos semelhanças a média dos postos para o
grupo 3 é 12,00. enquanto que para o grupo 1 é 6,00. Para essa análise o valor do é 3,7 e a
significância associada é 0,157. Isso significa que existe uma probabilidade de 15,7% de que
o resultado tenha sido devido ao erro amostrai, assumindo que a hipótese nula seja verdadei
ra. Assim, conclui-se que não existe diferença significativa entre esses dois grupos.
E xe rcício 5 : Friedm an
Ranks3 (Postos“)
Mean Rank
(Média dos Postos)
low (baixo) 1.20
medium (médio) 2.00
high (alto) 2.80
N 10
Chi-Square (Qui-Quadrado) 12.800
df (gl) 2
Exact. Sig. (Sig. Exata) .002
u. Friedman Test (a. Teste de Friedman)

O teste de Friedman mostra que a diferença entre os postos é significativamente maior do

que seria esperado pelo erro amostrai, considerando a hipótese nula verdadeira (qui-quadrado
= 12 ,8; /7 = 0.002).
1. d, 2. d, 3. b, 4. d, 5. b, 6. a, 7. d, 8. a, 9. c. 10. b, 11. c, 12. c, 13. a, 14. a, 15. b, 16. a,

17. d, 18. c, 19. b 20. d
Apêndice 1
Tabela dos escores z e da proporção da distribuição normal padrão que

está abaixo e acima deste escore
Proporção Proporção Proporção Proporção Proporção Proporção

Escore z abaixo acima Escore z abaixo acima Escore z abaixo acima
0,00 0,5000 0.5000 1.01 0.8438 0,1562 2.01 0.9778 0.0222
0.01 0,5040 0.4960 1.02 0,8461 0,1539 2,02 0,9783 0,0217
0,02 0,5080 0,4920 1.03 0.8485 0,1515 2.03 0.9788 0.0212
0,03 0,5120 0,4880 1.04 0,8508 0,1492 2.04 0,9793 0,0207
0,04 0,5160 0,4840 1.05 0.8531 0,1469 2,05 0.9798 0,0202
0,05 0,5199 0,4801 1.06 0,8554 0,1446 2,06 0.9803 0,0197
0,06 0.5239 0,476) 1.07 0.8577
o
rJ
r
0,1423 0,9808 0,0192
0.07 0.5279 0.4721 1.08 0,8599 0,1401 2,08 0,9812 0.0188
0,08 0,5319 0.4681 1.09 0,8621 0,1379 2,09 0.9817 0.0183
0,09 0,5359 0.4641 1,10 0,8643 0,1357 2,10 0.9821 0,0179
0,10 0.5398 0,4602 1.11 0.8665 0,1335 2,11 0,9826 0,0174
0,1 1 0,5438 0,4562 1.12 0,8686 0,1314 2,12 0,9830 0.0170
0.12 0,5478 0,4522 1.13 0,8708 0.1292 2.13 0,9834 0,0166
0.13 0.5517 0.4483 1.14 0,8729 0,1271 2.14 0,9838 0,0162
0.14 0.5557 0.4443 1.15 0.8749 0.1251 2,15 0,9842 0,0158
0.15 0.5596 0,4404 1.16 0.8770 0.1230 2,16 0,9846 0.0154
0.16 0.5636 0,4364 1.17 0.8790 0.1210 2,17 0,9850 0.0150
0.17 0.5675 0,4325 1.18 0,8810 0.1190 2,18 0,9854 0.0146
0,18 0,5714 0.4286 1.19 0,8830 0,1170 2,19 0.9857 0,0143
0.19 0,5753 0,4247 1.20 0,8849 0,1151 2.20 0,9861 0,0139
0,20 0,5793 0,4207 1.21 0,8869 0,1131 2,21 0.9864 0.0136
0,21 0.5832 0,4168 1.22 0,8888 0,1 112 2,22 0,9868 0.0132
0,22 0,5871 0,4129 1,23 0,8907 0,1093 2,23 0,9871 0.0129
0,23 0,5910 0,4090 1.24 0,8925 0,1075 2,24 0,9875 0,0125
0,24 0,5948 0,4052 1.25 0,8944 0,1056 2,25 0,9878 0,0122
0.25 0,5987 0,4013 1,26 0.8962 0,1038 2,26 0,9881 0,0119
0.26 0,6026 0,3974 1,27 0.8980 0,1020 o 77 0,9884 0,0116
0,27 0,6064 0,3936 1,28 0.8997 0,1003 2,28 0.9887 0,0113
0,28 0,6103 0,3897 1,29 0,9015 0,0985 2,29 0.9890 0,0110
0,29 0.6141 0.3859 1,30 0,9032 0,0968 2,30 0,9893 0,0107
0,30 0.6179 0,3821 1,31 0,9049 0,0951 2,31 0,9896 0.0104
0,31 0,6217 0.3783 1,32 0.9066 0,0934 2,32 0,9898 0,0102
0.32 0,6255 0,3745 1,33 0,9082 0,0918 2,33 0,9901 0,0099
0,33 0,6293 0,3707 1,34 0,9099 0,0901 2,34 0,9904 0,0096
0,34 0.6331 0,3669 1.35 0,9115 0,0885 2,35 0,9906 0,0094
0,35 0,6368 0,3632 1,36 0,9131 0,0869 2.36 0,9909 0,0091
0,36 0,6406 0.3594 1,37 0,9147 0,0853 2,37 0,99! 1 0,0089
0,37 0,6443 0,3557 1,38 0,9162 0.0838 2,38 0,9913 0.0087
0,38 0,6480 0,3520 1.39 0,917' 0,0823 2,39 0,9916 0,0084
0.39 0.6517 0,3483 1,40 0,9192 0.0808 2,40 0.9918 0,0082
0,40 0,6554 0.3446 1,41 0,9207 0.0793 2.41 0,9920 0,0080
Proporção Proporção Proporção Proporção Proporção Proporção

Escore z abaixo acima Escore z abaixo acima Escorc 7. abaixo acima
0.41 0.6591 0.3409 1.42 0,9222 0,0778 2.42 0,9922 0,0078

0,42 0.6628 0.3372 1,43 0.9236 0.0764 2.43 0.9925 0,0075
0.43 0.6664 0.3336 1.44 0,9251 0,0749 2.44 0.9927 0.0073
0,44 0.6700 0.3300 1.45 0,9265 0,0735 2,45 0,9929 0.0071
0.45 0.6736 0.3264 1,46 0,9279 0,0721 2,46 0,9931 0,0069
0,46 0,6772 0.3228 1.47 0.9292 0,0708 2,47 0.9932 0,0068
0.47 0,6808 0.3192 1.48 0.9306 0,0694 2,48 0,9934 0,0066
0.48 0.6844 0.3156 1.49 0,9319 0,0681 2.49 0,9936 0,0064
0,49 0.6879 0.3121 1,50 0,9332 0,0668 2,50 0.9938 0,0062
0,50 0,6915 0,3085 1,51 0.9345 0.0655 2,51 0,9940 0.0060
0.51 0.6950 0.3050 1.52 0.9357 0.0643 2.52 0.9941 0.0059
0,52 0.6985 0.3015 1,53 0,9370 0.0630 2.53 0,9943 0,0057
0,53 0.7019 0.2981 1.54 0.9382 0,0618 2.54 0.9945 0,0055
0.54 0.7054 0,2946 1.55 0.9394 0,0606 2,55 0,9946 0,0054
0.55 0.7088 0,2912 1,56 0.9406 0.0594 2,56 0.9948 0,0052
0,56 0,7123 0,2877 1.57 0 .9 4 18 0.0582 2.57 0,9949 0.0051
0.57 0,7157 0.2843 1,58 0.9429 0.0571 2,58 0,9951 0.0049
0,58 0,7190 0.2810 1.59 0.9441 0,0559 2,59 0.9952 0.0048
0.59 0,7224 0.2776 1.60 0.9452 0.0548 2.60 0.9953 0,0047
0.60 0,7257 0.2743 1.61 0,9463 0.0537 2,61 0.9955 0,0045
0,61 0,7291 0.2709 1.62 0,9474 0.0526 2.62 0,9956 0.0044
0,62 0.7324 0.2676 1.63 0.9484 0.0516 2.63 0.9957 0,0043
0,63 0.7357 0,2643 1.64 0,9495 0.0505 2.64 0,9959 0,0041
0,64 0,7389 0.2611 1,65 0.9505 0.0495 2.65 0.9960 0,0040
0.65 0.7422 0,2578 1,66 0,9515 0.0485 2.66 0,9961 0,0039
0.66 0.7454 0.2546 1,67 0,9525 0,0475 2.67 0,9962 0,0038
0,67 0.7486 0,2514 1,68 0,9535 0.0465 2.68 0.9963 0,0037
0.68 0,7517 0,2483 1,69 0,9545 0.0455 2,69 0,9964 0,0036
0.69 0,7549 0,2451 1.70 0,9554 0,0446 2,70 0.9965 0.0035
0,70 0,7580 0,2420 1.71 0,9564 0.0436 2.71 0.9966 0.0034
0.71 0.7611 0.2389 1.72 0,9573 0,0427 2.72 0.9967 0,0033
0,72 0.7642 0.2358 1.7.3 0,9582 0,0418 2.73 0.9968 0,0032
0,73 0,7673 0.2327 1,74 0.9591 0.0409 2.74 0.9969 0,0031
0,74 0.7704 0,2296 1.75 0.9599 0.0401 2.75 0,9970 0.0030
0,75 0,7734 0,2266 1,76 0.9608 0,0392 2,76 0.9971 0,0029
0.76 0,7764 0,2236 1,77 0.9616 0,0384 2,77 0.9972 0,0028
0,77 0.7794 0,2206 1,78 0.9625 0.0375 2.78 0,9973 0,0027
0.78 0.7823 0.2177 1.79 0,9633 0.0367 2.79 0.9974 0.0026
0.79 0,7852 0,2148 1.80 0.9641 0.0359 2.80 0,9974 0,0026
0.80 0,7881 0.2119 1.81 0.9649 0.0351 2.81 0,9975 0,0025
0,81 0.7910 0.2090 1,82 0.9656 0.0344 2.82 0.9976 0.0024
0,82 0.7939 0.2061 1,83 0.9664 0,0336 2.83 0.9977 0.0023
0,83 0,796" 0.2033 1,84 0.9671 0,0329 2,84 0,9977 0.0023
0,84 0,7995 0,2005 1,85 0,9678 0,0322 2.85 0.9978 0.0022
0,85 0.8023 0.1977 1,86 0.9686 0,0314 2.86 0,9979 0,0021
0,86 0.8051 0.1949 1.87 0.9693 0,0307 2.87 0.9979 0.0021
0,87 0.8078 0.1922 1.88 0.9699 0.0301 2.88 0,9980 0,0020
0,88 0.8106 0.1894 1.89 0.9706 0.0294 2.89 0,998 1 0,0019
0,89 0.8133 0.1867 1.90 0.9713 0,0287 2.90 0.9981 0,0019
0,90 0,8159 0.1841 1.91 0.9719 0,0281 2,91 0.9982 0,0018
0.91 0.8186 0,1814 1,92 0,9726 0.0274 2,92 0,9982 0.0018
0.92 0,8212 0,1788 1.93 0.9732 0,0268 2.93 0,9983 0.0017
0.93 0,8238 0,1762 1,94 0.9738 0.0262 2.94 0,9984 0.0016
0,94 0,8264 0.1736 1,95 0,9744 0,0256 2.95 0,9984 0.0016
0,95 0,8289 0.1711 1.96 0,9750 0,0250 2,96 0,9985 0.0015
0.96 0,8315 0,1685 1.97 0.9756 0.0244 2,97 0.9985 0,0015
0.97 0,8340 0.1660 1,98 0.9761 0.0239 2.98 0,9986 0.0014
0,98 0,8365 0,1635 1.99 0.9767 0.0233 2,99 0,9986 0.0014
0,99 0.8389 0.1611 2,00 0,9772 0.0228 3,00 0.9987 0,0013
1.00 0.8413 0,1587
CK valores foram gerados utili/ando o Microsoft Excel 97.

Apêndice 2
Tabela de rpara zr
r zr r zr r zr r 7T r zr
0.0000 n .iK H i 0.2000 0.203 0.4000 0.424 0.6000 0.693 0.8000 1,099
0.0050 1MH15 0.2050 0.208 0.4050 0.430 0.6050 0.701 0.8050 1.1 13
0.0100 0.010 0.2100 0,213 0.4100 0,436 0.6100 0.709 0.8100 1.127
0.0150 0.015 O.2150 0.218 0.4150 0.442 0.6150 0.717 0.8150 1.142
0.0200 0.020 0.2200 0.224 0,4200 0.448 0,6200 0.725 0.8200 1.157
0.0250 0.025 0.2250 0.229 0.4250 0.454 0.6250 0.733 0,8250 1.172
0.0300 0.030 0.2300 0.234 0.4300 0.460 0.6300 0.741 0.8300 1.188
0.0350 0.035 0.2350 0.239 0.4350 0.466 0.6350 0.750 0.8350 1.204
0.0400 0.040 0.2400 0,245 0.4400 0,472 0.6400 0.758 0,8400 1,221
0.0450 0.045 0.2450 0.250 0.4450 0,478 0,6450 0.767 0.8450 1.238
0.0500 0.050 0.2500 0.255 0.4500 0.485 0.6500 0.775 0.8500 1.256
0.0550 0.055 0.2550 0.261 0.4550 0,491 0.6550 0.784 0,8550 1.274
0.0600 0.060 0.2600 0.266 0.4600 0,497 0.6600 0.793 0.8600 1.293
0.0650 0.065 0.2650 0,271 0.4650 0.504 0.6650 0.802 0,8650 1.313
0.0700 0.070 0.2700 0.277 0.4700 0.510 0.6700 0.81 1 0.8700 1,333
0.0750 0.075 0.2750 0.282 0.4750 0.517 0.6750 0,820 0.8750 1.354
0.0800 0.080 0.2800 0.288 0.4800 0.523 0.6800 0.829 0,8800 1.376
0.0850 0.085 0.2850 0.293 0,4850 0.530 0.6850 0,838 0,8850 1.398
0.0900 0.090 0.2900 0.299 0.4900 0,536 0.6900 0.848 0.8900 1,422
0.0950 0.095 0.2950 0.304 0.4950 0,537 0.6950 0.858 0.8950 1.447
0.1000 0.100 0.3000 0.310 0.5000 0.549 0.7000 0,867 0.9000 1,472
0.1050 0.105 0.3050 0.315 0.5050 0.556 0,7050 0.877 0,9050 1.499
0.1100 0.110 0.3100 0.321 0.5100 0.563 0.7100 0.887 0,9100 1.528
0.1150 0 .116 0.3150 0.326 0.5150 0.570 0,7150 0.897 0.9150 1.557
0. i 200 0.121 0.3200 0,332 0.5200 0.576 0.7200 0.908 0.9200 1.589
0.1250 0 ,126 0.3250 0.337 0.5250 0,583 0.7250 0.918 0,9250 1,623
0.1300 0.131 0.3300 0,343 0,5300 0,590 0.7300 0.929 0.9300 1,658
0 .1350 0.136 0.3350 0.348 0.5350 0.597 0,7350 0.940 0.9350 1.697
0.1400 0,141 0.3400 0.354 0,604
CO
0,5400 0.7400
f"'
0,950 0.9400
0.1450 0.146 0.3450 0.360 0,5450 0,61 ! 0,7450 0,962 0,9450 1,783
0.1500 0,151 0,3500 0.365 0.5500 0.618 0.7500 0.973 0,9500 1.832
0.1550 0.156 0.3550 0.371 0.5550 0.626 0,7550 0.984 0,9550 1,886
0,1600 0,161 0.3600 0.377 0,5600 0.633 0,7600 0.996 0,9600 1.946
0.1650 0,167 0.3650 0.383 0.5650 0,640 0,7650 1.008 0,9650 2.014
0.1700 0,172 0.3700 0,388 0.5700 0,648 0.7700 1,020 0,9700 2.092
0.1750 0,177 0,3750 0.394 0.5750 0,655 0.7750 1.033 0,9750 2.185
0.1800 0,182 0.3800 0.400 0,5800 0,662 0.7800 1.045 0.9800 2.298
0.1850 0.187 0.3850 0.406 0.5850 0.670 0.7850 1.058 0.9850 2.443
0.1900 0.192 0.390(1 0.412 0.5900 0.678 0,7900 1.071 0,9900 2.647
0,1950 0,198 0.3950 0.418 0.5950 0.685 0.7950 1.085 0.9950 2,994
Os valores nesta tabela foram calculados pelo- autores.

índice
abuso sexual, estudo das reações ao 243 independente e relacionada 301 302
acomodação dos estudantes, estudo da 440 significado de 3 0 1-303
Aitken. M 30-31 tabela resumo 408-411
Alexander. B. 422-424. 431-432,441 terminologia 333-334
alfa ( a) - ver valor p um fator 307-310
álgebra matricial 431 veja também A N O VA fatorial: análise multivariada de
alocação aleatória 34-35 variância
amamentação, estudo da 527 análise exploratória de dados (A E D ) 70
amostras 56-58 análise multivariada de variância (M AN O VA) 487-516
representativas 57-58 delineamento dentre participantes 504-515
análise correlacionai 178.400 lógica da 488-491
bivariada 178-205 razões para o uso da 488
de variáveis dependentes 498-500 suposições subjacentes 490-496
delineamentos para 30-33 utilizando o SPSSPW 502-515
objetivos da 178-180 análise post-lwc de variáveis dependentes individuais 497-499
padrões na 212-213. 420 ANOVA fatorial 331-333
primeira e vegunda ordens 205-212 ansiedade, estudo da 30-34
tirando conclusões da 178-179 armazenamento de dados (SPSSPW ) 43-44
análise da diferença entre dois grupos 220-221 Ashley, M. J. 5 5 1
análise de componentes principais (A C P I 421-423.4 3 9 ,443 atípicos 77-78, 412-413
451 atralividade de formas corporais, estudo da 364
diferença com a análise de fatores 421-423
Attree, E . A. 480-481
análise de covariancia (A N C O V A l utilizando o SPSSPW
aumento da janela ativa 40-41
473-476
autovalores 435-436,447
análise de fatores 420-452
cargas das variáveis 427-429. 442
Benninghoven. D. 293
como distinta da análise de componentes principais 4 2 1-
bigodes 75-78
423
Bish. A. 291-293
conceito da 425-427
bulimia nervosa, estudo da 293
diagramas de variáveis 432-434
Byrne. A . 547
passos na execução da 435-437
propósito da 420-422
uso na psicometria 422-424 caixa
análise de regressão 381-415 de diálogo W eight cases (Ponderar casos) (S PSSPW ) 2’ 5.
objetivo da 381-382 277-278
utilizando o SPSSPW 39-403 de diálogos Define groitps (SPSSPW ) 232-233
analise de variância (A N O VA) 300-323. 4 0 1 de diálogos do qui-quadrado (SPSSPW ) 274
alternativas a 542-550 Dependem list (SPSSPW ) 66-68
análise inicial 334-335 post-lwc (SPSSPW ) 308-309
com dois fatores dentre participantes 356-367 cargas de variáveis 427-429
com dois fatores entre participantes 349-356 negativas 442
com mais de uma variável independente 329-348 caudas de uma distribuição 160-164
com um fator entre e um dentre participantes 366 375 causação 32-34. 178, 179-180,381-382
delineamento de medidas repetidas 315-321 coeficiente de correlação (/') 185-187
dois fatores 548-550 intervalo de confiança em torno 204
hipóteses subjacentes ao uso da 300 obtido com o uso do SPSSPW 192-194
índice 605
variância, explicação da 194-198 gerado utilizando o SPSSPW 134-136,354-355

veja também o r de Pearson; o rô (p) de Spearman diagramas de dispersão Ucattergmms) 82-88
Cohen. J. 251-253 e o teste de hipóteses 143-149
Colby.J. 501 gerado utilizando o SPSSPW 84-86
Collis. G. M. 29 diferença honestamente significativa (DHS) 311-312
combinação linear de variáveis 488-490,510 diferenças individuais 302-304
Comparações direção da associação 160-16 1. 291 -292
a priori veja comparações planejadas distribuição assimétrica 95-97. 229-231
de variáveis explanai«irias 410-411 distribuição dos dados 70-71. 87-94
emparelhadas 361-363, 370-371. 545-546 características da 94-101
entre populações I 16-1 17 distribuição normal 87-91, 119, 121-126,300,412-413
planejadas 311-312. 345-347 apresentado como um histograma 100-103
veja lambem procedimentos de comparações múltiplas veja também normalidade multivaríada; distribuição nor
componentes niili/adas eni análises posteriores 441 mal padrão
consumo distribuição normal padrão 111-117
de álcool, estudo do 281-282. 298. 335-346, 372-373 distribuições
de cafeína, estudo do 335-346. 372-373 amostrais 118-126
contra-balanceamento 36-37 bimodais 96-100
controle experimental 472 de probabilidade 111-114
correlação bivariada 178-205 leptocúrticas 94-96
utilizando o SPSSPW 192-194 mesoctírticas 94-96
correlação momento produto de Pearson (»' de Pearson) 185, platicárticas 94-96
400. 524-526 sobrepostas 224, 304-306
correlações distúrbios de humor, estudo dos 547
de primeira ordem 205-212 distúrbios inlestinais veja doença do intestino irritável; sín
de segunda ordem 205-212 drome do intestino irritável
parciais 205-209 doença do intestino inflamado (D11) 276.480-482
covariáveis 456, 462-463. 466. 468 veja também doença; síndrome do intestino irritável
critério do nível probabil ístico 250. 252-254 doenças coronarianas. estudo das 236-237
dor nas costas, estudo da 211
culpa, estudo da 422-424, 431-432.441
Dracup, C. 154-155
cuno.se 94-96
Dugard. P. 470
dados, caixa de diálogos Splitjile (SPSSPW) 349-354
Ecstasy, estudo do uso do 3 14-315
dados não-lineares 402-403
efeito simples (na ANOVA) 340-347. 353, 360-362. 366-367.
dano cerebral, estudo do 551
370, 375-376
delineamento ANOVA
efeitos
de dois fatores 300-302
de demanda 36-37
de um fator 300-302
dos tratamentos 302-303
delineamento dentre participantes 36-39, 219 efeitos principais (na ANOVA) 329-330
entrada dos dados 48-49 interpretação da 339-341
na MANOVA 504-515 Ekehammar. B. 348
delineamento entre participantes 36-39. 219 Emery, C. F. 4 13
entrada de dados 44-45-48 emparelhamento de participantes 472-473
delineamento entrada de dados (SPSSPW) 40-49
quase experimental 34-35 ípsilon de Greenhouse-Geisser 300, 3 18-320
subdividido 366-373 equação de regressão 389-397, 410-412
delineamentos de medidas repetidas 257-258. 300-301,315-321 erro
delineamentos pré e pós testes (ANCOVA) 470-482 amostrai 62-65. 85-88. 225-226.401
descrição gráfica dos dados 70-79 do Tipo 1 156-160, 311 -312. 334.488
utilizando o SPSSPW 80-81 do Tipo II 158-160
desvio médio 91-92 experimental 302-304
desvio padrão (DP) 89-94 padrão 125-129.400-401
diagrama Escala
de caixa e bigode 75-79. 98-100. 334.493. 506 de ansiedade e depressão hospitalar 26-27
de caule e folhas 73-76, 334 cie Ansiedade Estatística 30-31
de declividade 436 de Controle Emocional de Courtauld (ECEC) "’9
diagramas escores
de barras de erro 131- 132. 150-15 i . 337. 507 de dados adjacentes 76-77
de barras veja diagramas de barras de erros padronizados 398.421-422
606 Indice
escores - 111- 112, 115-117, 222-223. 542 Hovvell, D. C. 257-259, 311-312. 340-341
tabelados 601-604 Huff.D. 178-179
escrevendo os resultados 102-103, 347-348, 363. 373, 392.
479. 4X2. 499-501. 511. 533. 541. 545-546
imagem dos adolescentes, estudo da 439
esfericidade 300. 318-319. 356, 358. 368
índice de Intensidade Total de Dor (ITD ) 527
espaço /i-dimensional 427
infecção por H1V. estudo da 533-534, 542
estatística (significado estrito do termo) 57-58
instrutor de resultados (SPSSPW) 137-139
estatística intervalos de confiança 120-121. 227. 259-262.401-403
amplitude 89-91 apresentação dos 149-151
inferencial 57-58. 110-111. 220, 267 e a proporção da variância explicada 196-198
qui-quadrado ( x l 286 e o erro padrão 126-128
estatísticas em torno da média 221 -222. 261 -262
multivariadas 420 em torno de outras estatísticas 137-138
nâo-paramétricas 524-552 em torno do coeficiente de correlação 204
estatísticas descritivas 57-58 obtidos com o uso do SPSSPW 128-131
e o teste de Mann-Whitney 528-530 sobrepostos 132-136
e o teste de Wilcoxon 537 inválidos crónicos, estudo dos 241-242. 435
para delineamentos entre dois grupos 221
relatando 102-103 jogadores de rtigbi. estudo dos 501
uso na ANOVA 309-312, 349-351
estimativa por intervalo 120-121. 227
Kebell. M. R. 321-322
estimativa por ponto 120-121, 221, 227. 261-262
Keogh. E. 321-322
eta ao quadrado parcial (r|') 346-347, 363. 372-373
Ketterer. M. W. 236-237
experimento verdadeiro
Khoshaba. D. M. 501
explicação da variância veja variância
Konradth. U. 414
extremos ver atípicos
Kraemer, H. C. 258-259
fatores utilizados em análises posteriores 441

lambda (X) de Wilks 489-490,496
Fidell. L. S. 412-413, 496
leitura de mapas, estudo da 373
força de um relacionamento 185
limites internos 76-77
Forrestell. C. A. 364 linha
French. C. C. 157-158 com limites de confiança 402-403
freqüências de melhor aderência 383-388. 394-395. 458, 462
esperadas 270-271. 283 de regressão populacional 402-403
observadas 270-271 de regressão 383-388,458-460.465-469.477-478
função pulmonar, estudo da 4 13 Loftus. G .R . 149-151,337
Luzzo. D. A. 440
generalização de amostras para populações 57-58
Gosset. William 224-225 MacDonald, R. 250
graus de liberdade (G L) 227-229, 290. 404-406 MacFaden. A. 373
grupos intactos 462-463. 542-543 Maclean, L. 1.261-262
MacLeod, A. K. 547
habilidade de dirigir, estudo da 306-307, 321-322. 335-346 Maddi. S. R. 501
hábito de fumar, estudo do '0-33. 281-282,413 magnitude, estatística 153-154, 185
hipótese maior raiz de Roy 489-490. 496
alternativa 147-149 matriz
experimental 147-149 de correlações 420-422.429, 435
nula 144-149 de espalhamento (dispersão) 201-202
teste da 147-151.250 de variüncias-covariâncias 420-421
unilateral 160-165 dos componentes 434
hipóteses homogeneidade da 490-492, 496
teste de 143-149 McDonald. A. 440
unilaterais e bilaterais 160-165. 257-258, 291-292 McNicholas. J. 29
histograma de freqüências 70-73 media 58-62
histograma! s) 70-73 ajustada e não ajustada 468-469. 479
Holdcroft. A. 527 da distribuição amostrai 119. 121-126
homogeneidade de dois grupos, diferença entre 219
da variância veja variância geral 301-305, 463-464. 466. 468-469
das matrizes de variância-covariância 490-492, 496 populacional 62-63. 221. 227
608 indice
terapia cognitiva, estudo da 259-261 tranqüilizantes, estudo do uso de 2 9 1-293

teste da abordagem comportamental (T A C ) 504-505, 5 1 1 Treloan, C. J. 542
teste da AN O VA de Friedman 548-550 T u k e y .J.W . 70-73, 311-312
teste da diferença menos significativa (D M S) 311 312, 314
315,318-319 U gamba-Agwunobi. G . 29-31. 110-111, 152-153
teste da probabilidade exata de Fisher 283, 288 289
teste de aderência 267-281 V de Cramer 267. 286
utilizando o SPSSPW 272-281 valo r;; 144-147, 151-154. 227, 311-312
teste de atitudes alimentares 313-315 estabelecendo a 0.05 159-161. 250
teste de Bonferroni 318-321 exato 250
teste de Duncan 314-315 interpretação do 153-155
leste de Km skal-W allis 542-546 valores extremos ou atípicos 76-78, 155-157, 160-162,412-413
teste de Mann-Whitney 528-535. 545-546 variação, medidas da 93-95
utilizando SPSSPW 531-533 variância
teste de Mauchley 356. 358. 368, 551 dentre grupos 302-304. 335-336, 466
teste de Srroop 199 do erro veja variância dentre grupos
teste de Wilcoxon 528-529, 535-543, 548 entre grupos 301-303
utilizando o SPSSPW 539-541 entre participantes 224-225
teste M de Box para a igualdade das matrizes de covariâncias explicação da 196-198,400, 408-409. 437, 450-451
491-492,494,496,504 fontes da 329-331. 335-336,356-357
teste para a igualdade das variância''; de Levine 343. 372-373, homogeneidade da 165-167, 233-234. 300, 334
233-235, 495 partição da 303-306, 329-331
teste qui-quadrado () f ) proporção explicada 196-198
de independência 267 268. 281-293 veja também variância do erro
suposições, subjacentes ao u*?o do 288 variáveis 23-28
uma variável veja teste de aderência características das 25-26
teste/2 19.224-234.257-258 dicotomização de 25-28
alternativas ao 528-543 variáveis categóricas 25-27
emparelhado 224-225, 236-240 relacionamento entre 267-269
independente e emparelhado 224-225 variáveis contínuas 25-27
na ANOVA 340-341-343, 361-362, 366-367, 370-371 variáveis de confusão 30-31. 34-35
para amostras independentes 230-243 variáveis dependentes (V D s) 33-35. 383
relacionado veja teste / emparelhado correlações de 498-500
saída do 227-230 múltiplas 488-490
suposições subjacentes ao uso 229-231 variáveis discretas 25-27
utilizando o SPSSPW 2 3 1-235 variáveis explicativas 381-383, 405-406
testemunha ocular, estudo da 321-322 comparação da 4 10-411
testes de distribuição livre 95 96. 164-16^ variáveis independentes (V is ) 33 35, 381-383
(estes estatísticos 155-157 múltiplas 329-334.488-489
diagrama de fluxo, na escolha dos 168 variável critério 381-382,405-407, 412-413
suposições subjacentes ao uso dos 164-168 vendas de cola. estudo da 395-396
testes múltiplos (na AN O VA) 311-313 vergonha, estudo da 422-424, 427,431-432, 441
testes não-paramétricos ver ustes de distribuição livre vetores 425-429
testes paramétricos 164-165. 257-258, 261-262, 524-525 visualização
poder dos 166-167 de dados (SPSSPW ) 42-43
suposições subjacentes ao uso dos 165-167 do delineamento 300-302
testes posi-hoc 311 314 dos fatores 424
testes unilaterais 2 9 1-292 vocabulário, estudo do 2 10
Thieman, S. 258-259
Todman, J. 470 Walsh. J. J. 29-31. 110-111, 152-153
traço de Hotteling 489-490, 496
traço de Pillai 489-490, 496 Yu.Chong Ho 404 406
ESTATÍSTICA
SEM MATEMÁTICA
PARA PSICOLOGIA
3a edição
Christine P. Dancey Estatística sem matemática para psicologia apresenta descrição acessível dos
conceitos e das técnicas estatísticas fundamentais necessárias aos estudantes <
John Reidy pesquisadores de psicologia. Esses conceitos são explicados de forma clara e ser
referência a fórmulas. Os autores oferecem exercícios, atividades e questões de
múltipla escolha para a prática do conhecimento e das habilidades. A utilizaçã
do SPSS para Windows’" (SPSSPW) na realização de análises estatísticas é explicad
detalhadamente e em plena integração com todo o texto. 0 livro também oferec
orientação abrangente para a interpretação e apresentação dos dados gerados
pelo programa. E mais:
• Discussões sobre tópicos importantes, como, por exemplo, dicotomização de

variáveis contínuas.
• Exemplos totalmente atualizados da literatura psicológica.
• Questões de múltipla escolha adicionais para testar a aprendizagem.
• Explicações atualizadas para garantir compatibilidade com as versões 10, 11,

11.5 e 12 do SPSSPW.
• Introduções para alguns dos úteis recursos de auxílio disponíveis no SPSSPW
• No site w w w .booksites.net/dancey. questões de múltipla escolha adicionais

e arquivos de dados SPSSPW. CONTEÚDO EM INGLÊS.
Estatística sem matemática para psicologia é a ferramenta ideal para ajudá-lo a

superar o medo de estatística, normalmente sentido pelos estudantes de ciência
humanas e os capacita a usufruir do SPSS para desenvolver suas pesquisas.

Estatistica Sem Matematica

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatistica Sem Matematica

Enviado por

Direitos autorais:

Formatos disponíveis

M é t o d o s ^ * d e P e s q u i s a

1. E statística - Psicologia. I. Reidy, John. II. Título.

Catalogação na publicação: Júlia Angst Coelho - CRB 10/1712

T radução, consultoria e supervisão desta edição:

Capa: Paola Manica

Preparação do original: Kútia Michelle Lopes Aires

Leitura final: Julia Angst Coelho

Supervisão editorial: Monica Bailejo Canto

Editoração eletrônica: Laser House

Reservados todos os direitos de publicação, em língua portuguesa, à

É proibida a duplicação ou reprodução deste volume, no todo ou em parte,

SAC 0800 703-3444

Gostaríamos de agradecer a valiosa contribuição feita às duas edições anteriores do

o f Health Psychology, v. 1, n. 4 de Treloan e colaboradores em 1996. A Blackwell Publishing

Desde a publicação da segunda edição do Estatística sem matemática para psicologia,

.1 Por que ensinar estatística sem fórmulas matemáticas? 23

2.1 Amostras e populações 56

Panorama do capítulo 108

3.1 Probabilidade 108

SPSSPW: obtenção de intervalos de confiança 129

Panorama do capítulo 143

4.1 Outra forma de aplicar probabilidades à pesquisa: teste de hipóteses 143

Questões de múltipla escolha 176

5.1 Correlações bivariadas 178

Panorama do capítulo 219

6.1 Análise de duas condições 220

Panorama do capítulo 249

7.1 Critérios de significância 250

Panorama do capítulo 267

8 .1 Freqüências (dados categóricos) 267

Panorama do capítulo 300

9 .1 Visualização do delineamento 301

Panorama do capítulo 329

10.1 Introdução 329

10.5 Duas variáveis independentes entre participantes 334

Panorama do capítulo 381

11.1 Propósito da análise de regressão 381

Panorama do capítulo 420

12.1 Qual é o objetivo da análise de fatores? 420

-v. ' - , . ~ >'N; '■=. ■. M<H^:.:'-^-l»tg>.

Panoram a do capítulo 456

SPSSPW: obtenção de um diagrama das linhas deregressão 458

Panorama do capítulo 487

14.1 Estatísticas multivariadas 487

Panorama do capítulo 524

15.1 Aternativas ao r de Pearson: o p de Spearman 525

Panoram a dos ^-Caixas de

'; ' - ■ ■ Pontos de

Captura de telas Exercícios com o

Sum ários de fim „

¿iquiwi éAUm |r Favofos Fenareniòà Q

Statistics Without Maths P r a tio e P, Dance*

for Psychology ' ' • Third edm on

'-• ' L, , '• " N I h->-

for Psychology • • • T h ird « f i b e r

Na te n ta tiv a de e xp lica r co m o u tiliz a r e e n te n d e r e sta tístic a , ta lve z seja m e lh o r in icia r co m o

■ v ariáveis c o n tín u a s, d iscre tas e cate g ó rica s

1.1 Por que ensinar estatística sem fórmulas matemáticas?

O site do partido gira como o 1984, de Orwell*

Explicamos um aspecto muito importante das estatísticas: elas só tem sentido em um

* N. de T. George Orwell (1903-1950), escritor inglês.

As variáveis são o foco principal da pesquisa em ciências. Uma variável é simplesmente

1.2.1 Características das variáveis

Tabela 1.1 Exemplos de variáveis contínuas, discretas e categóricas

constructos de forma contínua, e não dicotomizá-los. Assim, em vez de se utilizar questio

Outra característica importante dos delineamentos de pesquisa é verificar se os partici

C o m o vo cê p ro je taria um estu d o p ara in ve stig a r a possível relação e n tre c a fe ín a e h a b ili

Neste primeiro capítulo expusemos os conceitos básicos para um entendimento da pes