Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
SEM MATEMÁTICA
PARA PSICOLOGIA
Usando SPSS para Windows
D 173e Dancey. C hristine P.
Estatística sem matemática para psicologia / Christine P. Dancey. John
Reidy : tradução Lori Viali, - Porto Alegre : Artnied. 2006,
608 p, ! il. ; 25 cm.
ISBN 978-85-363-0688-9
CDU 311:159.9
John Reidy
University Sheffield HaLLarn
ESTATÍSTICA
SEM MATEMÀTICA
PARA PSICOLOGIA
Usando SPSS para Windows
3a edição
Reimpressão 2007
© Pearson Education Limited 2004
This translation of Statistics without maths fo r psychology. 3 edition is published by arrangem ent with Pearson
Education Limited.
ISBN 0-13-L24941-X
SÃO PAULO
Av. Angélica, 1.091 - Higienópolis
01227-100 São Paulo SP
F o n e (11)3665-1100 F a x ( I I ) 3667-1333
IMPRESSO NO BRASIL
PRINTED IN BRAZIL
Christine dedica este livro a J, Johnstone, pelo amor e apoio nos últimos 18
anos, E também para Heike e Heinz Ka rstens por seu carinhoso apoio.
John dedica este livro para Lisa, Issy, Ollie e Arsenal. Obrigado a vocês
por manter o sorriso em. meu rosto.
Agradecimentos
Escrevemos este livro primeiramente para nossos alunos, muitos dos quais não gostam de
matemática e não conseguem entender porque precisam aprender fórmulas quando existem
programas de computador para fazer isto. Eles não foram convencidos pelo argumento de que
os cálculos realizados servem para dar-lhes um maior entendimento do teste, aliás, nem nós.
Nós queremos que eles tenham um entendimento conceituai da estatística e que gostem da
análise de dados. Durante a última década tivemos que adaptar nosso ensino a grandes gru
pos, nos quais uma boa parte das pessoas não tinha um treinamento formal em matemática.
Encontramos dificuldade para recomendar a esses alunos alguns dos livros didáticos tradicio
nais de estatística. Estes textos estavam cheios de formulas matemáticas e eram vistos pelos
estudantes como difíceis ou chatos, ou então, forneciam meras “receitas”, isto é, mostravam
apenas como fazer os cálculos sem fornecer um entendimento conceituai de estatística.
Outro problema que tivemos ao recomendar livros-texto de estatística foi a grande
dependência dos valores probabilísticos para a interpretação dos resultados. Encontramos di
ficuldades para convencê-los a levar em consideração o tamanho do efeito e os intervalos de
confiança quando os textos disponíveis não faziam considerações sobre testes de hipóteses,
mas simplesmente recomendavam que p < 0,05 é significativo e que p > 0,05 não é! Espera
mos que com este livro os leitores fiquem mais atentos a tais assuntos.
Queremos ainda mostrar aos alunos como incorporar os resultados das suas análises nos
relatórios laboratoriais e como interpretar a seção de resultados de artigos de periódicos. Até
recentemente os livros de estatística ignoravam este aspecto da análise de dados. E claro, en
tendemos que a forma que escrevemos nosso exemplo “resultados da seção” será diferente da
forma que outros psicólogos o fariam. Os estudantes podem utilizar esta seção como forma
de ganhar confiança para escrever seus próprios resultados e esperamos que eles o façam com
o desenvolvimento dos seus cursos.
Tentamos simplificar conceitos complexos, e, algumas vezes, bastante complexos. En
tretanto, ao simplificar existe uma perda de acurácia. Estamos cientes disso e tentamos ser
cuidadosos ao máximo possível, enquanto tentamos dar, também, a explicação mais simples
possível. Além disso, estamos cientes de que os estudantes não utilizam o SPSS em suas
análises de dados. O SPSS, no entanto, é o pacote estatístico mais popular para as ciências so
ciais e é por isso que o texto está tão ligado a esse programa. Os estudantes que não utilizam
esse pacote deverão achar o livro útil de qualquer modo.
Esperamos que os estudantes que leiam o livro não apenas aprendam com ele, mas tam
bém apreciem nossas explicações e exemplos.
Prefácio à Segunda Edição
Desde que escrevemos a primeira edição de Estatística sem matemática para psicologia
tivemos muito retomo, tanto em relação ao conteúdo quanto ao estilo e projeto do livro: como
resultado desse retorno, revisamos e reescrevemos seções substanciais deste texto. Simpli
ficamos e esclarecemos partes do material e acrescentamos também novos conteúdos. Um
novo capítulo introduzindo Análise de Fatores foi adicionado e a estatística nâo-paramétrica
também ganhou um capítulo próprio. A revisão do livro proporcionou-nos a oportunidade
de corrigir alguns dos erros tipográficos que se infiltraram na primeira edição. Esta edição
foi atualizada para o uso do SPSSPW versão 10. Esperamos que você aprecie esta edição do
Estatística sem matemática para psicologia.
Os conjuntos de dados utilizados pelos autores no texto podem ser acessados no endere
ço: www.booksites.net/dancey.
Prefácio à Terceira Edição
Panoram a do capítulo 23
Panorama do capítulo 56
Resumo 103
Exercícios para o SPSSPW 104
Questões de múltipla escolha 105
Referências 107
...................................... > : . * .
is®-"'"--.
Panorama do capítulo 178
m m
IjllSSjPBst
Exem plos da
literatu ra.
Enriquece as
teorias mostrando
outras áreas
de oesquisa ou
opinião
N. de R. N o endereço www.booksiies.nei/dancey. o leitor encontrará materiais para estudo, que incluem: Questões de múltipla escolha, que auxi
liam a testar a aprendizagem; arquivos de dados do SPSSPW: guia dc estudos: e ím k x com outros relevantes. C O N T EÚ D O EM INGLÊS.
Caixas de
cuidado. Ao-
longo do texto
servem de aviso
sobre possíveis
problemas ou
questões a serem
considerados.
■
■ ■‘ -■ — D iagram as e
' ' .......................... , .... • ..... . fig u ras. Servem
de auxilio ao
....................... .............. ^ / 5~ entendimento e à
fixação do texto.
' 7 ........•— •—
ç3 » * * i* r I ; S a n a b l e s
I aaMrestsmrctt d esign
M uftipl«’ c h o ic e
•SP'»*» rfflta s e t s
Wwtoflrfc &
AjfoofiUt
Sytlafeti* M a n a g e r
Arquivos de
dados do
SPSSPW.
wnw
fiicjmvo £<M# Extor Ii rsvortos feriamenlat
i“ s o m e ilt in g t h a t n a
p r c c is io r i.
r v o m e t liin g th a t w e m u m e a s u r e .
r th e m a in fo c u s o f r e s e a r c h in s c ii?
Questões de
a ll o f t h e a b o v p .
escolha m últipla
■adirinnak
Variáveis e Projeto de Pesquisa
Panorama do capítulo
A estatística como um conteúdo tende a despertar medo em corações e mentes de muitos es
tudantes de ciências sociais e em muitos palestrantes* também. Entender os conceitos estatísticos
não deve, no entanto, ser mais difícil do que compreender qualquer outro conceito teórico (por
exemplo, o conceito de inteligência). De fato, alguém poderia pensar que entender um conceito
bastante concreto tal como o de média aritmética seria mais fácil do que compreender o conceito
psicológico, bem mais vago, de “uma atitude”. Ainda assim, a cada ano, parece que a maioria
dos estudantes, que aparentemente percebem muitos conceitos não-estatísticos como um caso
consumado, lutam para entender estatística. No nosso modo de ver, muitas pessoas temem a
estatística porque os conceitos estão perdidos em meio às fórmulas matemáticas. Desta forma,
procuramos explicar a estatística de um modo conceitual, sem confundir os estudantes com
fórmulas matemáticas desnecessárias - isto é, desnecessárias hoje em dia, na era dos pacotes
computacionais. Se o estudante quer aprender estas fórmulas para melhorar o seu conhecimento,
que ponto de partida melhor do que um entendimento conceitual da estatística?
A estatística tende a ter uma má reputação, como ilustra a máxima de Disraeli**: “Existem
três tipos de mentiras: mentiras, mentiras deslavadas e estatísticas”. Entretanto, o problema
não é da estatística, mas sim da forma como ela é utilizada. Com freqüência, particularmente
na política, a estatística é utilizada fora de contexto. Esse problema é claramente ilustrado no
seguinte trecho extraído de um artigo publicado, em 2002, no Guardian***:
* N. de T. O termo no original é lecturer que é uma categoria de professor nas universidades inglesas.
** N. de T. Benjamin Disraeli (1804-1881), primeiro ministro britânico em 1868 e 1874 a 1880.
*** N. de T. Jornal britânico fundado em Manchester em 1821.
24 Christine P. Dancey & John Reidy
O partido dos trabalhadores tem sistematicamente manipulado dados em seu site para m os
trar melhorias na saúde, escolaridade e outros serviços, de acordo com um estudo não-publicado.
Essa prática fo i iniciada no correr das eleições do último ano e tem continuado desde então, com
o partido dos trabalhadores apresentando ao público estatísticas tendenciosas de crimes e desem
prego, bem como de gastos com escolas e hospitais.
Os números têm sido manipulados para fo rn ecer uma m elhor impressão sobre o desempenho
do partido em nível local.
Em um artigo de pesquisa circulando entre acadêmicos, após ter sido apresentado recente
m ente em uma conferência de uma associação de estudos políticos, quatro renomados geógrafos
se detiveram nos números publicados no site para áreas locais. Liderados pelos professores Danny
Dorling da Universidade de Leeds e p o r R on Johnston da Universidade de Bristol, a equipe verifi
cou que o partido consistentemente ajustou e manipulou dados sem conhecê-los.
Em vez de fo rn ecer a impressão de uma série de meias verdades ocasionais, está começando
a parecer que este suprimento de valores distorcidos é uma estratégia de longo prazo do partido,
disse o jornal.
O webmaster do partido é comparado a Winston Smith, personagem do livro 1984 de George
Orwel, que passava o seu tempo no ministério do abastecimento reescrevendo a história. Nenhum
número individualmente é fa lso no sentido estrito da palavra. É a form a como são agrupados - m is
turando e emparelhando áreas e anos para dar a impressão de que as coisas melhoraram - que não
é sincera como um todo.
Por meio do código postal, os visitantes do site do partido podem , ao que parece, acessar
informações detalhadas sobre o local onde vivem. No entanto, alguns dos números apresentados
referem-se ao Reino Unido ou à Inglaterra como um todo, outros a regiões inteiras, alguns à área
de uma cidade ou município, mas muitos poucos a uma área específica e muito menos à rua onde
as pessoas vivem.
Os visitantes do site são informados sobre o aumento de enfermeiras sem ser dito que os
números se referem às regiões do N H S em vez de hospitais específicos. M elhorias na educação
são anunciadas sem que o público seja informado que se referem a toda uma área educacional - a
qual pode conter até 20 regiões. As taxas de criminalidade no site não são específicas ao código
postal, mas a toda uma área policial, algumas muito grandes ou até mesmo à Inglaterra e ao País
de Gales como um todo.
(Extraído do Guardian de 8 de outubro de 2002)1
O estudo mencionado nesta reportagem foi de fato publicado em 2002 no The Political
Quarterly (Dorling et al., 2002).
Este artigo ilustra claramente a importância de se colocar estatísticas em um contexto
correto. Se for dito a você, por exemplo, que a altura média de um adulto é 173 cm, isto pode
ser correto para um homem brasileiro, mas não necessariamente para um homem de uma
tribo africana de pigmeus, na qual a altura média pode ser tão baixa quanto 145 cm.
1.2 Variáveis
A tu ra (cm
Alto — Baixo
variável contínua medida em uma escala discreta. Por exemplo, a escala hospitalar de ansie
dade e depressão apresenta valores que variam de 0 a 21. Para convertê-la em uma variável
categórica, iremos simplesmente comparar os escores superiores a certo valor (p. ex., diga
mos, 11) com aqueles abaixo deste mesmo valor.
Essa dicotomização (divisão em duas categoriais) de variáveis discretas e contínuas é
comum na psicologia e permite que se encontrem diferenças entre grupos que podem estar
nos extremos de variáveis discretas ou contínuas, por exemplo, pessoas altas e baixas. No
entanto, não recomendamos tal prática, pois ela reduz a sensibilidade da análise estatística.
Existe uma boa discussão de tais problemas em Streiner (2002) e Maxwell e Delaney (1993).
Mencionamos isto aqui para que você possa estar ciente do que ocorre na literatura científica
e, assim, entenda o que o pesquisador fez.
PONTO DE DISCUSSÃO:
DICOTOMIZAÇÃO DE VARIÁVEIS CONTÍNUAS
Por que os pesquisadores dicotomizam variáveis? Streiner (2002) ressalta o fato de que
muitas decisões em psicologia, psiquiatria e medicina são binárias. Neste tipo de decisão,
têm-se apenas duas escolhas, tais como se a pessoa apresenta ou não problema mental, se
tem ou não uma determinada doença, se precisa ou não ser hospitalizada, ou se deve ou não
receber alta do hospital. O argumento utilizado é que, se estes profissionais precisam tomar
decisões binárias, então é legítimo investigar estes tipos de variáveis. Tal raciocínio é utiliza
do para dar suporte à prática disseminada de dicotomizar variáveis contínuas.
Streiner argumenta que não precisamos ver as decisões que os médicos tomam como
binárias. Ele sugere que seria melhor pensar em uma doença mental, por exemplo, como um
contínuo. Quantos mais sintomas alguém apresenta mais afetado está. Devemos medir tais
28 Christine P. Dancey & John Reidy
Atividade 1.1
■ V e lo cid a d e do ven to
■ Tip o s de títu lo s o fe re cid o s por um a u n ive rsid ad e
■ Nível de extro versão
■ M arcas de carro s
■ Tim e s de fu te b o l
■ N úm ero de peças d e xa d re z c a p tu ra d a s em um jo g o
■ Peso de p a n d a s g ig an tes
■ N úm ero de p in tu ra s e xp o stas em g a le ria s de arte
Existem muitas técnicas estatísticas que podem ser usadas para se analisar dados cole
tados em uma pesquisa. Neste livro serão apresentadas algumas das mais utilizadas. Muitas
destas técnicas apresentam fórmulas matemáticas complexas para calcular as estatísticas en
volvidas. Estas fórmulas não serão abordadas, pois preferimos fornecer ajuda para que você
entenda as técnicas a partir de um ponto de vista conceitual.
Um dos principais fatores na determinação de qual teste estatístico será utilizado para
analisar os dados é a forma como o estudo foi projetado ou planejado. Existem várias manei
ras de projetar ou planejar um estudo, e a forma como este é feito exercerá grande influência
nos tipos de procedimentos estatísticos disponíveis. Algumas vezes, os pesquisadores querem
observar diferenças entre dois grupos de participantes em uma variável particular. Em outra
situação pode-se querer verificar se duas variáveis apresentam algum tipo de relacionamento.
Um exemplo de procura de diferenças entre dois grupos pode ser a pesquisa relatada por Ni
cholas e Collis (2000). No estudo, eles compararam o número de encontros sociais que pessoas
tinham enquanto levavam o cão para passear com a quantidade de encontros sociais sem o cão.
Constataram que caminhar com o cão aumenta o número de encontros sociais. Um exemplo de
pesquisa correlacional foi relatado por Walsh e Ugumba-Agwunobi (2002). Neste estudo, entre
outras coisas, investigou-se o relacionamento entre ansiedade causada pelo estudo da estatís
tica e a procrastinação. Os autores verificaram que existem relações entre vários componentes
da ansiedade causada pelo estudo da estatística (doravante denominada ansiedade estatística)
(p. ex., temor do professor de estatística) e a procrastinação. Os testes estatísticos que seriam
utilizados nestes exemplos são denominados de testes de diferenças e testes correlacionais,
respectivamente. A forma de planejar o estudo influenciará a decisão de qual destes testes será
utilizado. Nas seções seguintes serão apresentadas várias maneiras de se planejar estudos e os
tipos de testes disponíveis para que o pesquisador analise os resultados.
30 Christine P. Dancey & John Reidy
1.3.3 Causação
A questão da causação é problemática em ciência, ainda mais quando utilizamos deli
neamentos correlacionais. Um dos principais objetivos da ciência, é descobrir a causa dos
acontecimentos. Em todos os ramos da ciência pesquisadores estão tentando determinar
relações causais entre variáveis. Por exemplo, Newton* produziu uma teoria elegante para
explicar o que causa a queda de maçãs. Estabeleceu uma relação causal entre a queda das
maçãs e a gravidade. Em muitas pesquisas psicológicas também tentamos estabelecer tal re
lação causal. Quando usamos delineamentos correlacionais, no entanto, é difícil estabelecer
se a alteração em uma variável causa a mudança em outra variável. Isso ocorre porque em
tais delineamentos estamos simplesmente observando e registrando mudanças em variáveis e
tentando estabelecer se elas covariam de alguma forma que faça sentido. Em virtude de que
estarmos apenas observando como as variáveis mudam, é difícil (para não dizer impossível)
estabelecer a relação causal entre elas. Para sermos capazes de fazer isto de forma mais fácil,
é necessário manipularmos uma das variáveis (mudá-la sistematicamente) e então observar o
que acontece com a outra variável. Esta abordagem será discutida mais tarde nesta seção.
Uma das regras de ouro do delineamento correlacional é não se poder inferir causação
a partir de uma correlação. A indústria do tabaco tem se valido desta fraqueza da correlação
para argumentar que não existe evidência de que o fumo cause câncer. Estritamente falando,
isso pode estar correto, pois os estudos têm sido principalmente correlacionais. Todavia, con
siderado a quantidade de pesquisas feitas corroborando uma relação causal entre o hábito de
fumar e o câncer, alguém seria tolo em ignorar as pesquisas e acreditar nas pessoas que estão
tendo lucro com a venda de tabaco.
Descobrir que ansiedade estatística e procrastinação estão relacionadas não nos infor
ma muito sobre a relação causal entre estas duas variáveis. Pode ser que o aumento na
ansiedade estatística aumente a procrastinação, ou então que alterações na procrastinação
causem alterações na ansiedade estatística. De forma alternativa, podem existir outras va
riáveis, tais como uma neurose, que pode causar mudanças tanto na ansiedade estatística
quanto na procrastinação (veja Figura 1.4). Você pode ver, portanto, que a existência de um
relacionamento entre duas variáveis não nos informa, necessariamente, muita coisa sobre
causa e efeito.
Neurose
©
A ngústia
Ansiedade ^ ► Depressão
* N. de T. Os termos em inglês são DOE (Design O f Experiments) e experimental design (utilizado pelos autores). No Brasil são
utilizadas as versões: projeto de experimentos, desenho de experimentos ou ainda delineamento de experimentos.
34 Christine P. Dancey & John Reidy
os participantes não são alocados aleatoriamente às condições, pois já são homens ou mulhe
res. Assim, temos um projeto quase-experimental. Se for verificado que as mulheres têm mais
encontros sociais do que os homens, então será possível argumentar que o fato de ser mulher
encoraje mais a interação social.
Um dos problemas com os projetos quase-experimentais é a alocação não-aleatória das
várias condições que constituem a variável independente. Não podemos ter certeza de que
a manipulação da variável independente (ou deveríamos dizer pseudomanipulação) é a res
ponsável pelas diferenças entre as várias condições. Assim, é mais difícil inferir relações
causais de projetos quase-experimentais do que de projetos experimentais. Como ilustração,
o exemplo anterior pode apresentar algum fator, além do gênero, que distingue os dois grupos
(tamanho, por exemplo). Pode ser que as mulheres sejam vistas como menos ameaçadoras em
virtude de serem menores do que os homens. Desta forma, uma variável de confusão impor
tante infiltrou-se em nosso estudo. Em virtude do aumento do risco das variáveis de confusão
estarem associadas com estudos quase-experimentais, os estudos experimentais devem ser
preferidos sempre que possível. Caso você não saiba se está lidando com um projeto experi
mental ou quase-experimental, observe a alocação aleatória dos participantes às condições.
Se ela não for uma característica do estudo, então é mais provável que você esteja lidando
com um estudo quase-experimental.
Outra razão importante para preferir estudos experimentais é o fato de muitas das técni
cas estatísticas utilizadas indicarem que os participantes foram atribuídos aleatoriamente às
condições. Se a alocação não foi ao acaso, pode-se ter uma redução na validade das conclu
sões baseadas nestas técnicas estatísticas. Na prática este não é um grande problema, mas
você precisa estar ciente de que ele existe.
Se você está utilizando um estudo experimental ou quase-experimental, então algumas das
técnicas disponíveis para você são: o teste t, o teste U de Mann-Whitney*, o teste de Wilco-
xon** e a análise de variância (ANOVA). Todos eles serão abordados mais adiante no livro.
Tabela 1.2 Panoram a das principais características dos vários delineamentos de pesquisa
Atividade 1.2
C lassifiq u e os se g u in tes estud o s em c o rre lacio n ais, exp e rim e n tais ou q u ase -exp erim en tais:
Entretanto, nem tudo são rosas no jardim do delineamento dentre participantes. Se você
pensar um pouco sobre o estudo da caminhada com o cão, será capaz de identificar alguns
possíveis problemas. Poderá ocorrer, se utilizadas as mesmas pessoas em ambos os casos,
que a familiaridade com o caminho e com outras pessoas, já encontradas, encoraje a inte
ração. Assim, na segunda condição os participantes podem ter mais encontros sociais em
virtude desta familiaridade do que pelo fato de ter o cachorro. Por outro lado, eles podem
ficar aborrecidos ou cansados quando completarem a caminhada na segunda condição, e
isto, talvez, afete o número de encontros sociais que teriam. Esses fatores serão variáveis
de confusão e podem dificultar a interpretação dos dados. Qualquer diferença no número
de encontros sociais detectada entre as duas condições poderá ter origem nesses fatores, em
vez da manipulação experimental da variável independente. Esses fatores são denominados
de efeitos de ordem.
Uma forma de eliminar os efeitos de ordem é introduzir um contrabalanço no estudo.
Para contrabalançar, pode-se fazer metade dos participantes completar a primeira condição e
em seguida a segunda condição, enquanto a outra metade segue o mesmo procedimento, mas
na ordem contrária. Como forma de introduzir o contrabalanço no estudo da caminhada com
o cão, é preciso que a metade dos participantes caminhe primeiro com o cão e depois sem o
mesmo, enquanto a outra metade faz o contrário. Qualquer efeito como fadiga ou tédio será,
desta maneira, distribuído entre as duas condições da variável independente e não será mais
variável de confusão (veja Figura 1.6). Você ainda verificará que cada participante caminhará
sob as duas condições, retendo, assim, as vantagens da utilização do delineamento dentre
participantes.
Outra limitação do delineamento dentre participantes é a maior probabilidade de os par
ticipantes perceberem o objetivo do experimento por terem tomado parte nas duas condições.
Trata-se de um problema porque os participantes podem querer fazer o que o experimentador
deseja que façam, e não o que normalmente fariam. Isso é denominado de efeito de demanda.
É mais provável que ocorra no delineamento dentre participantes porque cada participante
é exposto a mais condições experimentais do que no delineamento equivalente entre parti
cipantes. Em certo sentido, o contrabalanceamento pode reduzir, mas não necessariamente
eliminar, os efeitos de demanda.
Um problema adicional associado ao delineamento dentre participantes é a impossibi
lidade de poder utilizá-lo em muitos projetos quase-experimentais. Por exemplo, se você
Todos os efeitos
de ordem na
Todos os Caminhando Caminhando
condição
participantes com o cão sem o cão
"sem o cão"
igualmente as
Metade dos Caminhando Caminhando ^ duas condições
participantes sem o cão com o cão
quiser comparar encontros sociais de homens e mulheres enquanto estão caminhando, não
será possível a utilização do delineamento dentre participantes. Não se pode ter uma pessoa
que seja homem e mulher simultaneamente em duas ocasiões separadas, e uma pessoa não
pode tomar parte nas duas condições (a menos, é claro, que faça uma mudança de sexo entre
a participação nas duas condições).
Atividade 1.3
alocar todos os participantes com uma determinada característica a um grupo, e isso talvez
confunda ou mascare os resultados. As técnicas estatísticas que descrevemos neste livro
darão indicações da probabilidade de tais circunstâncias aparecerem na nossa pesquisa.
A Tabela 1.3 fornece um sumário das vantagens e desvantagens dos delineamentos entre
e dentre participantes. Deve ficar claro que as vantagens do delineamento dentre participantes
tendem a ser desvantagens no delineamento entre participantes e vice-versa.
Tabela 1.3 Sumário das vantagens e desvantagens dos delineamentos entre e dentre participantes
Atividade 1.4
Esta seção fornece uma breve introdução ao SPSS para Windows e explica como entrar
e salvar dados em um arquivo. Explica ainda a diferença na entrada de dados para os deline
amentos entre e dentre participantes.
O básico
Primeiro você deve saber algumas coisas básicas sobre programas. O Windows é uma
interface gráfica que permite ao usuário manipular ícones e informação textual na tela. Mui
tos programas, tais como o SPSS, apresentam diferentes janelas que você poderá manipular
quando necessário.
Quando você roda o SPSS para Windows versões 10, 11 e 12 (SPSSPW), verá uma janela
perguntando o que quer fazer.
40 Christine P. Dancey & John Reidy
Barras e
setas de
rolagem
A primeira decisão que você precisa tomar é se quer abrir um arquivo de dados já existente
ou criar um novo (entrar com novos dados). Para abrir um arquivo existente, selecione a opção
Open an existing data source (Abrir uma fonte de dados já existente) da caixa de diálogo (janela)
What wouldyou like to do? (O que você gostaria de fazer?). Você deve, então, selecionar o arqui
vo de interesse e clicar em OK para continuar. Se quiser inserir dados, então você deve selecionar
a opção Type in data (digitar dados) e clicar em OK. Feito isso, aparecerá a seguinte tela:
Variáveis =
colunas \m\ | | |^ I |r~|! J|3;|l">h'-N
Participantes ■
(casos) = linhas '
Painéis (orelhas):
Data View (Ver
Dados) e Variable
View (Visualizar
Variáveis)
* N. de T. Os autores não falam sobre o ícone X , que fecha a janela ativa e também não mencionam que os botões de reduzir e am
pliar são um só e funcionam como uma chave liga/desliga.
Estatística sem Matemática para Psicologia 41
Você pode pensar que a janela ativa é muito pequena para mostrar toda a informação
disponível. É possível aumentar o tamanho da janela ativa clicando nos botões Minimizar, Re
duzir/Ampliar (-, i5 ou □) no canto superior direito da janela ativa. Aqui, o botão - minimiza a
janela ativa; ff reduz uma janela ampliada, e □ aumenta uma janela reduzida. Minimizar a janela
ativa consiste em reduzi-la a um ícone que aparecerá na parte inferior da tela. Se uma janela esti
ver reduzida, você poderá visualizar mais informações se clicar no botão n . Se a janela já estiver
em seu tamanho máximo, então, para se poder ver mais informações, ela deverá ser rolada (para
cima ou para baixo) por meio da barra ou setas situadas no lado direito da janela.
Entrada de dados
Antes de executar qualquer análise, você precisa fornecer os dados. Note que existem
células, que são o encontro das linhas com as colunas. Cada linha de dados que você fornecer
representará os dados de um participante, e cada coluna representará os dados de uma variável.
Por exemplo, suponha que você deseja rodar um estudo que esteja procurando relações da an
siedade estatística com a procrastinação. Digamos que temos os seguintes dados de entrada:
Participantes: P1 P2 P3 P4 P5 P6
Ansiedade estatística: 55 59 48 60 62 50
Procrastinação: 125 132 94 110 140 96
A primeira coisa a fazer é declarar as variáveis no SPSSPW. Para determinar o nome e
demais características das variáveis, é preciso selecionar o painel Variable View (Visualizar
Variáveis) no final esquerdo da tela. A tela mudará para uma na qual você poderá caracterizar
as variáveis do seu arquivo de dados.
Uma
célula
Painéis: Ver
Dados e
Visualizar
Variáveis
Nomes das
variáveis
As variáveis foram declaradas, então você pode agora entrar com os dados. Para fazer
isso, você precisa selecionar o painel (no fundo esquerdo da tela) Data View (Visualizar Da
dos), obtendo a seguinte tela:
Os dados da
ansiedade
estatística
devem ser
digitados
nesta coluna
Os dados da
procrastinação
devem ser
digitados
nesta coluna
Você poderá notar que as duas primeiras colunas estão rotuladas como statsanxiety e
procrastination. Lembre-se que na tela de visualização de dados (Data View) as colunas são
variáveis e as linhas são participantes. Desta forma, todos os dados da ansiedade estatística
(statsanxiety) deverão ser digitados na primeira coluna, e os da variável procrastinação (pro
crastination), na segunda. Vá adiante e entre com os dados apresentados anteriormente. Uma
vez feito isso, a tela deverá ser semelhante à seguinte:
Menu File
(Arquivo)
Salvando os dados
Após ter fornecido os dados, é uma boa idéia salvá-los em um arquivo. Isso evitará que
tenha de digitá-los novamente caso queira realizar outras análises no futuro. Para salvar os
dados, é necessário colocar o ponteiro do mouse sobre o item de menu File (Arquivo) e clicar
com o botão esquerdo do mouse. O seguinte menu será apresentado.
Selecione a
opção Save As ■
(Salvar Como)
Mova o ponteiro do mouse e clique na opção Save As... (Salvar Como) e então a se
guinte caixa de diálogo irá aparecer. Ela é denominada de caixa de diálogo porque é onde
você diz ao SPSSPW o que ele deve fazer. Digite o nome do arquivo na linha (em branco)
denominada File name (Nome do arquivo) e clique no botão OK. Seus dados estarão salvos
neste arquivo.
Convém lembrar que o nome de um arquivo deve obedecer às seguintes regras:
■ A primeira parte é um nome que faça sentido para você (p. ex., statsanxiety).
■ A segunda parte deve ser sempre SAV para um arquivo do SPSSPW (esta parte é
denominada de extensão do arquivo).
■ A primeira e a segunda parte serão sempre separadas por um ponto.*
Assim, o nome do nosso arquivo de dados será statsanxiety.sav. De fato, você nãodigitou
.sav nem precisará fazê-lo, pois o SPSSPW faz isso automaticamente. Sempre que você visua
lizar um nome de arquivo terminando em .sav, poderá ter uma confiança razoável de que ele é
um arquivo de dados do SPSSPW. Se você esquecer o nome do seu arquivo, procure entre os
que apresentam a extensão .sav.
Digite o
nome do
arquivo aqui
Clique nas
reticências
Se você deixar as variáveis como definidas pelo software, poderá ter dificuldades para
interpretá-las, uma vez que não haverá rótulos para identificá-las de acordo com as diferentes
condições da VI. Assim, é uma boa idéia detalhar os nomes das condições da VI. Você deve
notar que, quando clica na primeira célula da coluna rotulada como Values (Valores), reticên
cias aparecem. Isso indica que você pode fornecer informações adicionais para esta coluna.
Clique nas reticências e obterá a seguinte caixa de diálogo.
Digite o número
do primeiro
grupo aqui
Digite o nome
do grupo aqui
Clique em Add
(Adicionar) para
confirmar
os detalhes
Estatística sem Matemática para Psicologia 47
Temos duas condições para a variável independente, às quais precisamos atribuir núme
ros. Iremos rotular o grupo “caminhando com o cão” de grupo 1 e o grupo “caminhando sem
o cão” como grupo 2 (ou vice-versa). Digite 1 na linha (caixa) Value (Valor) e “caminhando
com o cão” (Walking with a dog) na linha (caixa) Value Label (Rótulo). Feito isso, clique em
Add (Adicionar), e você verá que os detalhes aparecem na última linha (caixa). Agora digite
2 na linha Value e “caminhando sem o cão” (Walking without a dog) na linha Value Label e
clique Add. A caixa de diálogo deverá ser semelhante a esta:
Clique em OK para retornar à tela Data View (Ver Dados). Sempre que desejar que o
SPSSPW saiba os nomes dos grupos, você pode fazer isso adicionando informações na colu
na Values (Valores).
Agora vamos definir as variáveis. Para entrar com os valores reais dos dados, clique no
painel Data View (Visualizar Dados). Quando os dados forem postos na coluna group (gru
po), digite 1 se a pessoa estiver no grupo com o cão e 2 se a pessoa estiver no grupo sem o
cão. Assim, você poderá verificar que a primeira coluna conterá apenas os valores 1 ou 2. Na
segunda coluna, você deverá entrar com o número de encontros sociais de cada pessoa, como
está na sua variável dependente. Você deverá ser capaz, observando a tela de entrada, de ver
que o participante número 4 está no grupo com o cão (grupo 1) e que ele teve 12 encontros
sociais. Também verá que o participante numero 12 está no grupo sem o cão (grupo 2) e que
teve uma caminhada solitária com apenas um encontro.
48 Christine P. Dancey & John Reidy
Variável de
agrupamento
Variável
dependente
Você pode estar se perguntando por que temos de entrar com os dados de forma dife
renciada para cada um dos diferentes delineamentos. É que cada linha da entrada de dados
representa a informação de um participante. Se você tem um delineamento entre participan
tes, precisa informar ao SPSSPW qual o escore de cada participante e a qual grupo pertence.
Quando o delineamento é dentre participantes, cada um atua sobre as duas condições, e desta
forma, se tem dois escores. Você precisa fazer com que o SPSSPW saiba o que ambos estes
escores significam. Em virtude de cada participante atuar nos dois grupos, não será neces
sário informar ao SPSSPW o grupo, por meio de uma variável de agrupamento. Você pode
perceber, assim, a diferença dos delineamentos dentre e entre participantes através da variá
vel de agrupamento. Se esta variável existir, trata-se do delineamento entre participantes.
Você deve notar, a partir do detalhe da tela, que definimos duas variáveis, uma para a
condição com o cão e outra para a condição sem o cão. Ainda, em virtude de não haver a
variável de agrupamento, não temos de atribuir rótulos de grupos para qualquer variável na
tela Variable View (Visualizar Variável). Definir as variáveis para esse tipo de delineamento é,
dessa forma, mais simples do que para o delineamento entre participantes.
Selecione esta
opção para
rodar o tutorial
Você pode acessar o tutorial a qualquer hora durante uma sessão. Basta clicar no menu
Ajuda (Help) e selecionar o tutorial (Tutorial) a partir daí.
50 Christine P. Dancey & John Reidy
Botões de
navegação
Uma vez iniciado o tutorial, você estará na introdução às facilidades da ajuda do SPSSPW.
Você irá notar quatro ícones no canto inferior direito da tela. Estes ícones permitem que você
navegue da forma que desejar em torno dos tópicos do tutorial. O ícone com a lupa fornece
um índice de tópicos. O ícone com a casa leva você aos conteúdos de cada tópico, enquanto os
ícones com as setas à esquerda e à direita levam para as telas anteriores e posteriores, respec
tivamente. Quando você clica no ícone de conteúdo (casa), obtém uma lista de assuntos. Você
deve então clicar no tópico desejado para que o tutorial possa ajudá-lo.
Estatística sem Matemática para Psicologia 51
Clique no tópico
para obter um
tutorial sobre ele
;j g Start I ^ g) PJ ^ ” | Bg’ MicrQsQ...! g ] Explorin...| Ij jj Enplorin...| Ü §jUntitled...[ ^$MGI P h | |[^> Tutorial T ã | fí 21:0
Resumo
As respostas de todos os exercícios e das questões de escolha múltipla podem ser encon
tradas em seção própria ao final do livro.
Exercício 1
A Dra. Gênio realizou um estudo comparando a memorização de adjetivos com a de
substantivos. Ela alocou aleatoriamente 20 participantes a duas condições. Então, apresentou
a um dos grupos de 10 participantes uma lista de 20 adjetivos e ao outro grupo (também com
10 participantes) uma lista de 20 substantivos. Em seguida, solicitou a cada grupo que ten
tasse lembrar o número máximo possível de palavras apresentadas. Ela obteve os seguintes
resultados:
Adjetivos: 10, 6, 7, 9, 11, 9, 8, 6, 9, 8
Substantivos: 12, 13, 16, 15, 9, 7, 14, 12, 11, 13
1. Qual é a variável independente neste estudo?
2. Qual é a variável dependente?
3. Este é um delineamento dentre ou entre participantes?
4. É um projeto experimental, quase-experimental ou correlacional?
5. Entre com os dados no SPSSPW de forma apropriada para o delineamento do expe
rimento e salve os dados em um arquivo.
Exercício 2
Utilizando os dados do exercício 1:
■ Se você entrou com os dados como um delineamento dentre participantes, entre com
os dados agora como um delineamento entre participantes.
■ Se você entrou com os dados como um delineamento entre participantes, entre com
os dados agora como um delineamento dentre participantes.
Salve os dados em um arquivo utilizando um nome diferente do anterior.
Estatística sem Matemática para Psicologia 53
16. Efeitos de demanda são possíveis variáveis de con 19. Em um delineamento dentre participantes, os efei
fusão nas quais: tos de ordem ocorrem quando:
(a) Os participantes se comportam de acordo com (a) Os participantes ficam cansados nas últimas
o que o pesquisador quer condições
(b) Os participantes apresentam baixo desem pe (b) Os participantes têm o mesmo desempenho
nho, pois estão cansados ou chateados em todas as condições
(c) Os participantes apresentam bom desempenho, (c) Os participantes têm problemas para obter be
pois praticaram as tarefas do experimento bida no bar
(d) Nenhuma das anteriores (d) Nenhuma das anteriores
17. Suponha que você quer conduzir um estudo para 20. Qual dos seguintes problemas está associado com
verificar se pessoas depressivas roem mais as a dicotomização de variáveis contínuas?
unhas do que pessoas não-depressivas. Qual dos (a) Perda de poder experimental
seguintes será a melhor m aneira de proceder? (b) Ocorrência de efeitos espúrios
(a) M edir a depressão dos participantes com um (c) Existência de um a séria perda de informação
questionário e então solicitar que atribuam (d) Todas as anteriores
Referências
MAXWELL, S. E., DELANEY, H. D. Bivariate m edian splits and spurious statistical significance.
Psychological Bulletin. v. 113, p. 181-90, 1993.
McNICHOLAS, J., COLLIS, G. M. Dogs as catalysts for social interactions: robustness of the effect.
British Journal o f Psychology. v. 91, p. 61-70, 2000.
SPIELBERGER, C. D. et al. M anual fo r the State-Trait Anxiety Inventory (Form Y). Palo Alto (CA):
Consulting Psychologists Press, 1983.
STREINER, D. L. Breaking up is hard to do: the heartbreak of dichotomizing continuous data.
Canadian Journal o f Psychology. v. 47, p. 262-66, 2002.
WALSH, J. J., UGUMBA-AGW UNOBI, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences. v. 33, p.
239-51, 2002.
Nota
Panorama do capítulo
Outra amostra
Uma amostra possível possível de cinco faces
de cinco faces
de faces
Outra amostra
possível de cinco faces
c observar o quanto estão relacionadas entre si. Isso seria, no entanto, caro dem ais. Uma
tonna mais conveniente e selecionar um determinado número de pessoas ao acaso da po
pulação e determinar os seus níveis de ansiedade estatística e procrastinação. Podem os,
então, generalizar o resultado desta amostra para a população. U tilizam os estatística, mais
especificam ente estatística inferencial, para generalizarm os os resultados obtidos de am os
tras para toda a população.
Quando realizamos uma pesquisa, devem os estar seguros de que sabem os qual é a po
pulação estudada e escolher a amostra desta população. E inútil realizar um estudo com uma
amostra de homens se a população inclui os dois sexos. E sem sentido conduzir um estudo
com uma amostra de tarântulas se a população alvo é de zebras.
A habilidade para generalizar resultados de uma amostra para a população é de impor
tância vital em pesquisa. A ssim , e' preciso estar seguro de que qualquer amostra utilizada é
verdadeiramente representativa da população visada. Um exem plo sim ples ilustra alguns dos
problemas. Imagine que pesquisadores querem realizar um estudo para saber se caminhar
com o cão leva a mais encontros sociais do que caminhar sem o cão. Eles decidem se diri
gir ao parque mais próximo e seguir um determinado número de proprietários de cães e de
não-proprietários de cães para contar as interações sociais que tiveram. Os pesquisadores des
cobrem que os que não possuem cão tiveram mais encontros dos que possuem e concluem ,
então, que possuir um cão não é bom para a vida social.
Esta conclusão está correta? De fato. não sabemos a resposta a partir da pesquisa que foi
feita. Ela pode estar certa, mas não se utilizou uma amostra correta sobre a qual se pudesse
basear tal conclusão, isto é, pode haver um problem a de am ostragem . O problema aqui é que
os proprietários de cães seguidos podem ser todos, por exem plo, muito tímidos, e é isso. e
não o fato de possuir o cão, que explica a diferença no número de encontros sociais. Aqui. é
possível que exista o viés do pesquisador, no qual ele inconscientemente utiliza pessoas que
ajudam a confirmar a sua hipótese. Pode ser que sejam questões ligadas à hora do dia em
que as pessoas caminham com seus cães. Por exem plo, pessoas caminhando bem cedo pela
Christine P Dancey & John Reidy
manhã, talvez, estejam com pressa para ir ao trabalho e se tomem m enos propensas a encon
tros sociais Certos tipos de cães influem nas interações sociais (p. ex.. caminhar com um p i
buli) Como pesquisadores, devem os estar cientes dessas possibilidades quando projetamos
„ossa pesquisa de forma a nos assegurarmos de que elas não ocorram. Queremos generalizar
os nossos resultados amostrais para toda a população e queremos evitar problemas co
projeto que possam reduzir nossa possibilidade de fazer isso. M uito dos pontos sutis de um
projeto de pesquisa são os que tentam assegurar que possamos generalizar os resultados. Os
p sm n sa d c L . do exem plo acima. p o d en , é claro, .er ido a m ui,os pau,oes d,te,em es c se
guido munas pessoas em várias ocasiões diferemes. D es,a lo ,ma. es,a,ão ma,s seguros de que
suas amostras representam a população. ..... , ,•
O exem plo anterior ilustrou um ponto importante: a habilidade de generalizar re ultai .
de amostras para populações é dependente de amostras que. realmente, representam a popu-
'aC"^Apresentamos aqui a diferença entre amostras e populações. Você irá verificar, quando
ler livros textos de estatística, que os estatísticos possuem maneiras diferentes de d e s ,r v e r
amostras e populações. Estritamente falando, estalísrtcm descrevem amostras. Dessa fo m a
quando calcular a média de uma amostra você terá obtido uma estatística. Se. no entanto, tor
calculada a média de uma população, você deverá denominá-la de p a ra m e, m Enquanto esta
tísticas descrevem amostras, parâmetros descrevem populações. Assim , a media da populaça >
é um parâmetro, e a média de uma amostra é uma estatística. Esta e uma distinção técnica, e
não deve preocupá-lo demasiado desde que você tenha em mente as diferenças entre tecmcas
estatísticas que descrevem amostras daquelas que descrevem populações. Tipicamente u l i
a m o s estatísticas amostrais para estimar parâmetros populacionais. Mais especificam ente,
devem os utilizar estatísticas descritivas para descrever nossas amostras e a estatística infe
rencia! para generalizar estes resultados para a população.
Atividade 2.1
Se você quer descobrir qual grupo, os fãs de futebol ou de rúgbi, é m enos Inteligente,
qual das seguintes am ostras seria m ais apropriada?
2.2.1 Média
A media é facilmente calculada por m eio da soma de todos os valores da amostra e. en
tão. pela div isão pelo número total de valores. A média da amostra (5. 6. 9. 2) será:
5+ 6+9+ 2
----------------- = 5.;>0
4
Com outro exem plo, se tivéssem os o seguinte conjunto de dados 2. 20. 20. 12. 12. 19. 19.
25, 20, poderíamos calcular a média com o segue:
2 + 20 + 20 + 12 + 12 + 19 + 25 + 20 ^
-------------------------------------------------- --- 16.56
9
Isso nos dá uma indicação do escore típico da nossa amostra. É bastante difícil sim ples
mente utilizar a média de uma amostra com o uma estimativa da media de uma população.
Nunca estam os certos de quão próximos da média da população está a média da nossa amos
tra. embora existam técnicas que podemos usar com o auxílio (p. ex.. intervalos de confiança,
ver p. 121).
2.2.2 Mediana
A segunda medida de tendência central é a m ediana, oficialmente definida com o o valor
que está no m eio da amostra, isto é. que apresenta o mesmo número de valores acima e abai
xo dela. A mediana é calculada com a ordenação de todos os valores e com a tomada do valor
que está no meio. Utilizando os dados 2. 20. 20. 12. 12. 19. 19. 25, 20 (valores anteriores)
para ilustrar o cálculo da mediana, primeiro ordenamos os dados em ordem crescente e atri
buímos um posto a cada um. Assim:
O escore mediano
Valores: 2 12 12 19 Í9) 20 20 20 25
Postos: 1 2 3 4 5 ) 6 7 8 9
O posto mediano
Você pode ver que os valores foram ordenados (linha de cima) e a cada um loi atribuído
um posto (raiik). Dessa forma, o valor mais baixo tem posto um. o próximo posto dois e as
sim por diante.
Estritamente falando, no entanto, quando tivermos dois ou mais valores iguais (com o no
exem plo), os postos atribuídos a valores iguais devem ser iguais. Assim , os postos dos dados
apresentados devem realmente ser os seguintes:
Christine P. Dancey & John Reidy
Valores: 2 12 12 19 19 20 20 20 25
Você pode verificar que todos os valores iguais possuem o m esm o posto. Atribuímos os
postos, no caso. tomando a média das posições que eles ocupam, com o ilustrado acima.
Para encontrar a mediana, precisamos localizar o escore que está no m eio da lista dos
postos. Temos nove valores, desta forma, o escore do meio é o quinto. A mediana é. assim, o
valor 19. que é o quinto valor da lista ordenada dos valores da amostra.
N o exem plo acima, foi lácil determinar a mediana, pois tínhamos um número impar de
valores. Quando se tem um número ímpar de valores, sempre vai existir um que estará no
meio. Este não é o caso. entretanto, quando existir um número par de valores. Se agregarmos
o valor 26 no conjunto de dados anterior, teremos agora um número par de valores.
Valores: 2 12 12 19 26
Postos:
Neste caso a mediana será a média entre os dois centrais, isto é, a média entre os valores
que estão na quinta e na sexta posições. A mediana, neste caso. será: (19 + 20) + 2 - 19.5.
.2.3 Moda
A terceira medida de tendência central é a moda. que é simplesmente o valor mais repetido.
No conjunto de valores apresentado acima para ilustrar a média e a mediana, a moda seria 20,
que é o valor que mais se repete.
O valor do conjunto
que mais se repete é a moda
Estatística sem Matemática para Psicologia 61
Atividade 2.2
Descrevem os para você ires diferentes medidas de tendência central, isto c. três medidas
de um valor típico em uma amostra. Uma questão permanece, no entanto: qual destas me
didas você deve utilizar para descrever os seus dados? A resposta a esta questão depende do
conjunto que você tem.
O ponto importante a ser levado em conta quando for escolher uma medida de tendên
cia central é que ela deve dar a você uma boa indicação do valor típico da amostra. Se há
razões para suspeitar que a medida de tendência central que usou não fornece uma boa indi
cação do valor típico do conjunto, então você provavelmente escolheu a m edida errada.
A média é a medida mais freqüentemente utilizada e ê ela que deve ser usada, uma vez.
que você esteja convencido de que ela fornece uma boa idéia do valor típico do conjunto. É a
medida a ser escolhida porque é calculada a partir dos valores reais, e não a partir dos postos,
corno é o caso da mediana c da freqüência de ocorrências, a moda.
Existe um problema com a média, no entanto. Em virtude de utilizar os próprios valores
da amostra, é sensível a valores extremos. Observe a seguinte amostra:
1 2 3 4 5 6 7 8 9 10
A média deste conjunto de dados é 5.5 (assim com o a mediana). Se alterarmos um dos
, valores aumentando-o razoavelmente, obteremos o seguinte conjunto:
1 2 3 4 5 6 7 8 9 20
1 2 3 4 5 6 7 8 9 KW)
T em os, agora, uma m édia de 14.5. que não é. obviam ente, uma boa indicação do
valor típico deste conjunto de dados. C om o ex iste o m esm o núm ero de valores em cada
um destes conjuntos e alteramos som ente o maior valor de cada um. a m ediana permane
ce com o 5.5. A mediana é. assim , uma medida de tendência central m elhor para os dois
últim os conjuntos. Este exem plo ilustra a n ecessid ad e de checar os dados para verificar
se existem valores extrem os (irem os introduzir uma maneira de fazer isto. m ais adiante)
antes de decidir que m edida de tendência central utilizar. Na m aioria dos casos. você.
p rovavelm ente, verificará que é aceitável o uso da m édia co m o m edida de tendência
central.
Se você encontrar valores extrem os, então a m édia não deverá ser utilizada, neste
caso o m elhor é utilizar a mediana. A m ediana não é sensível a valores extrem os, com o
o exem p lo m ostrou. Isso ocorre porque ela é o valor do m eio dos dem ais quando estes
62 Christine P. Dancey & John Reidy
são ordenados. O procedim ento para localizar o valor m ediano não depende dos valores
em si. a não ser do fato de colocá-los em ordem. A ssim , o maior valor no n osso exem plo
poderia ser 10. 20. 100 ou 100 m ilhões, e a mediana ainda não se alteraria. E esta in sensi
bilidade a valores extrem os que faz a m ediana útil quando não podem os utilizar a média.
C om o a m oda e sim plesm ente o valor que ocorre com maior freqüência, não envolve
qualquer cálculo ou ordenamento dos dados. Então, ela pode ser utili/.ada com qualquer
tipo de dados. Um dos problemas da média e da mediana é a existência de certos tipos de
dados em que não podem ser usadas. Quando tem os categorias de uma variável, tal com o
ocupação, não faz sentido tentar ordená-las. D essa forma, não podem os utilizar a média
ou a mediana. Se você tem este tipo de dados, não tem outra escolha a não ser a moda.
Entretanto, quando utilizam os a moda. precisam os ter certeza de que ela está realmente
fornecendo uma boa indicação do valor típico. Dê uma olhada nos seguintes conjuntos de
dados:
1 2 2 2 2 2 2 2 3 4 5 6 7 8
1 2 2 3 4 5 6 7 8 9 10 11 12
Você deve ter notado que. no primeiro conjunto de dados, o valor 2 se repete bem mais
do que qualquer outro. A m oda. neste caso. será uma medida de tendência central apropria
da. já que ela e uma indicação razoável do valor típico. No segundo conjunto o valor 2 será
novamente a moda. pois é o \alor que ocorre com maior freqüência. N o entanto, aqui. ela
não será um bom indicador, pois sua freqüência de ocorrência e apenas levem ente superior
ao de qualquer outro. Então, neste caso. a moda não deveria ser escolhida com o medida
de tendência central. Algum as vezes você não terá uma medida de tendência central apro
priada. Em tais situações, você deve aceitar o fato de que a amostra não apresenta um valor
típico.
Atividade 2.3
Que medida de tendência central é mais apropriada para os seguintes conjuntos de dados?
(a) 1 23 2 5 2 6 27 23 2 9 30
(b) 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 50
(c) 1 1 2 3 4 1 2 6 5 8 3 4 5 6 7
(d) 1 101 104 106 111 108 109 2 0 0
A s medidas de tendência central que descrevem os são úteis para dar uma indicação do
valor típico de uma amostra. Suponha que queremos uma indicação do valor típico em uma
população. Podemos, teoricamente, calcular a média da população (um parâmetro) de manei
ra semelhante ao cálculo da média da amostra: obter os valores de todos na população, somar
e div idir a soma pelo tamanho da população. Na prática, entretanto, isto não é. normalmente,
possível. Você poderia imaginar com o seria tentar medir o nível de ansiedade causada pela
estatística e a procrastinação de cada indivíduo no mundo? Portanto, devem os estimar os
parâmetros populacionais a partir das estatísticas amostrais.
Estatística sem Matemática para Psicologia 63
A média das médias amostrais ( 112,5) é uma melhor aproximação da média da popu
lação (100) do que seriam as médias das amostras individuais (75 e 150). Quando tomamos
várias amostras de mesmo tamanho de uma população, algumas terão médias superiores à da
população, enquanto outras terão valores inferiores. Se calcularmos a média de todas estas
médias, teremos um resultado bem próximo do valor 100. que é a média da população. Essa
tendência da media das m édias amostrais de se igualar ao valor da média da população é
conhecida nos círculos estatísticos com o teorem a central do lim ite. Saber que a média das
médias amostrais fornece uma boa aproximação da média da população é importante para
nos auxiliar a generalizar resultados da amostra para a população.
Atividade 2.4
Acima tem-se um diagrama contendo figuras de muitos pandas gigantes. Cada panda
gigante tem um número que indica seu Ql. Para ilustrar os problemas associados com o erro
amostrai, você deve completar os seguintes passos e então ler a seção erro amostrai. Imagine
que esta figura represente a população dos pandas gigantes. O Ql médio desta população é
100. Queremos que você selecione dez amostras ao acaso desta população. Cada amostra
deve conter somente dois pandas. Para fazer isso, sugerimos que você balance um lápis sobre
a figura com os olhos fechados. Com a mão livre, mova o livro para os lados. Quando pronto,
deixe a ponta do lápis atingir a página do livro. Veja qual o panda selecionado (se você atingiu
um espaço em branco entre os pandas selecione o panda que estiver mais próximo do ponto
que o lápis atingiu). Tome nota do Ql do panda selecionado e repita o processo duas vezes
para cada amostra. Você deve repetir este processo dez vezes, de modo a obter dez amostras
retiradas da população de pandas. Entendemos que isso não fornece uma seleção aleatória da
população, mas basta, por ora, para ilustrar o que queremos mostrar.
Desejamos agora que você repita todo o processo, mas, desta vez, selecionando dez pan
das em cada amostra. Uma vez sorteadas as amostras, calcule a média de cada uma das
selecionadas (todas as de dois pandas e todas as de dez pandas).
Você pode agora continuar a ler a seção sobre o erro amostrai.
Estatística sem Matemática para Psicologia 65
Para obter medidas de tendência central a partir do SPSSPW. você deve entrar com os
dados com o descrito no Capítulo 1 e então clicar no menu A n a lyze (Analisar) (veja figura
abaixo).
Quando o menu A nalyze (Analisar) aparecer, clique na opção D escriptive Statistics (Lista-
tíslica Descritiva) e então selecione a opção Explore... (Explorar) do menu final. Você obterá
a seguinte caixa de diálogo.
Estatística sem Matemática para Psicologia 67
Existem outras opções para determinar estatísticas descritivas, mas a opção Explore
(Explorar) c a m ais flexível. A opção Explore permite que você acesse um grande leque de
técnicas estatísticas descritivas c é. desta forma, uma opção útil para se utilizar. Você poderá
notar que existem várias opções nesta janela de diálogo, incluindo:
■ lista de variáveis
■ caixa para variáveis dependentes (D ependent List)
m caixa para variáveis de agrupamento (Factor List)
m opções de apresentação (D isplay - em baixo à esquerda)
■ várias opções de botões (S ta tistics — Estatísticas. P lots — Diagramas. O ptions —
O pções)
Para obter medidas de tendência central, mova as variáveis de não-agnipamento para a cai
xa da lista das dependentes (D ependem List), selecionando as variáveis de interesse, e clique
na seta preta ►apontando para a caixa da lista das variáveis dependentes (D ependem List I.
68 Christine P Dancey & John Reidy
* l i IjsJ
EXPLORE
Cases (Casos)
V ocê notará, a partir da saída do SPSSPW , que existem m uitas inform ações apresen-
ladas. N ão se preocupe se não entender muitas delas neste estágio: elas serão explicadas
mais adiante no livro. Por enquanto, você deve perceber que. para as duas variáveis, pode-
se ver a m édia e a mediana. Se desejar a m oda. você deve tentar utilizar o F requencies...
(Freqüências), opção do menu A nalyze... (Analisar), submenu D escrip tive S ta tistic s (E s
tatísticas D escritivas), em vez da opção E xplo re... (Explorar). U m a vez obtida a caixa
dc d iálogos F requencies (Freqüências), abra-a e clique no botão S ta tistic s (Estatísticas).
Selecion e a m oda a partir da próxima caixa de diálogo que irá abrir (veja a tela a seguir):
70 Christine P. Dancey & John Reidy
Selecione o menu
Analyze (Analisar) e
após o subm enu
D escriptive Statistics
(Estatística Descritiva)
_UI
pçtcentí?'Jthr.
f~ Quarie.
I” Oj vortttoi ginjpx
P Dapb r Pwçíi^ít I""”"
Dijperocn D«
Sid d r * w w I- Mrwmar. T 51
r V w r< e r Ma. rin*
f" Rarcj» r* S C rim»'
Terminada uma pesquisa, é importante que seus dados sejam analisados. Uma das melho
res formas de fazer isso é por meio da AED (Análise Exploratória de Dados). A AHD consiste,
basicamente, em explorar os dados através de técnicas gráficas. E comum se obter um grande en
tendimento de com o os participantes do estudo se comportaram. A importância de tais técnicas
gráficas foi destacada por Tukey cm 1977. no texto clássico denominado de Análise exploratória
de dados (Explorutory data analysis). Analisar dados graficamente deve ser uma das primeiras
coisas a ser feita. Na próxima seção, mostraremos as principais técnicas para explorar os seus
dados, começando com o histograma de freqüências (.frequency h¡singram). Após. explicaremos
os diagramas de caule e folhas {stem and leaj) e o caixa c bigodes (boxptols).
pelo sangue, os investigadores solicitaram aos participantes que indicassem, a partir de uma
lista de sete cores, qual a favorita. A Figura 2.2 representa o histograma destes dados. Você
deve ser capaz de ver 11a Figura 2.2 quantas pessoas escolheram o azul com o sua cor favorita
com mais frequência e o branco com o sua cor favorita com menos frequência.
H istogram (Histograma)
Histograma mostrando as freqüências de uma cor que as pessoas escolheram como sua
favorita.
’ N. de T. O SPSSPW utiliza o \a lo r N (m aiúsculo) para representar o tam anho Ja am ostra, enquanto i» autores utilizam o \a lo r n
i m inúsculo!.
72 Christine P. Dancey & John Reidy
6 8 10 12 14 16 18 20 22 2 4 -6 0
5 7 9 11 13 15 17 19 21 23
Depression scores (Escores da depressão)
Figura 2.3
Histograma dos dados do questionário sobre depressão.
0 -4 5 -9 1 0 -1 4 15 19 2 0 -2 4 25 ....... 59 6 0 -6 4
Depression scores (Escores da depressão)
Figura 2.4 Histograma dos dados do questionário sobre depressão agrupados em intervalos de
amplitude 5.
Atividade 2.5
C a u le F o lh a s
D ezenas U nidad es
2 --------------- O valor 2
2 2 9 9
0 0 0 5 ------- O valor 25
C a u le F o lh a s
0 11222555
1 2222444455588
2 44444455555558888888
3 22333344444455555
4 222334
Você pode perceber pela Figura 2.6 que o diagrama de caule e folhas fornece uma forma
concisa de apresentar um conjunto grande de dados. Algumas vezes, no entanto, o sistema de
agregar os dados em grupos de dez não é muito informativo. Dê uma olhada na f igura 2.7.
que mostra o diagrama de caule e folhas para os dados da depressão apresentados na forma de
histograma (Figura 2.3) anteriormente.
A Figura 2.7 não nos dá muita informação sobre a distribuição dos valores, a não ser o
fato de que eles sãona maioriainferiores a 20.Um sistema alternativo é juntar os valores em
blocos de cinco (p. ex.. 0-4. 5-9. IO-14.15 -19. etc.) No diagramade caule e folhas da Figura
2.8, a variável depressão está agrupada assim. Isso fornece uma melhor indicação da distri
buição dos valores. Veja que utilizamos um ponto (. i após o caule para representar a primeira
metade do grupo de dez valores (p. ex.. 0-4) e um asterisco (*) para representar a segunda
metade de cada bloco de dez valores (p. ex.. 5-9 1.
C a u le F o lh a s
0 0000022222222333333333555555555555555777777777777799999999
1 000000033333888
2 3
6 4
(B lo co s) (C a u le ) (F o lh a s) / 1
0 -4 0. 0000022222222333333333
5 -9 0* 555555555555555777777777777799999999
1 0 -1 4 1. 000000033333
1 5 -1 9 1* 888
2 0 -2 4 2. 3
6 0 -6 4 6. 4
Figura 2.8 Diagrama de caule e folhas para os dados de depressão agrupados em blocos de dez.
Mesmo que você perceba que existe um valor extremo no exemplo da depressão, o caso
c que muitas vezes valores extremos não são tão óbvios. Tukey (1977). contudo, desenvolveu
uma técnica gráfica denominada de caixa e bigodes (hox phn). que nos fornece uma indica
ção clara dos valores extremos, da mesma forma que o histograma e o diagrama de caule e
folhas informa como os valores estão distribuídos.
Embora você possa utilizar o computador para produzir um diagrama de caixa e bigodes,
iremos descrever como construir um a partir dos dados abaixo, de modo que você saiba como
interpretá-lo (o diagrama para estes dados esiá apresentado na Figura 2.9):
2 20 20 12 12 19 19 25 20
■ Primeiro, encontre o valor mediano como descrito anteriormente. E o valor da quinta
posição (o valor mediano é. neste caso. o 19. após os dados terem sido ordenados).
2 12 12 19 ( ^ K 2 0 ^ 20 20 25
A m ediana é o quinto
valor do conjunto ordenado.
■ Após. calcule os quartis. São os valores que separam o conjunto em quatro partes
iguais . O primeiro quartil deixa 25$ dos valores abaixo dele. e o terceiro quartil.
25% dos valores acima dele. Os quartis 1 e 3 forniam os limites inferior e superior da
caixa (veja Figura 2.9). Para determinar o valor dos quartis, adicionamos 1 à mediana
e então dividimos por 2 (lembrar que a mediana está na quinta posição). Assim:
' N de T. O termo í y j /. i u c bixinhs para httx />/<>/ se explica por 'lukey também ler denom inado e>te diagrama de box and i 1;
: N. de T Os quartis são em núm ero de três. O segundo quartil coincide com a m ediana.
76 Christine P. Dancey & John Reidy
30
\
\
\
V
Valores
20 -
adjacentes
Quartis
_ Bigodes
10 -
Caixa /
N = 9
Dados
Os quartis I e 3 são, portanto, o terceiro valor a partir do fim e o terceiro valor a partir
do início da lista ordenada, que no exemplo são o 20 e o 12. respectivamente.
Quartis
Valores: 8 9
Postos: 20 25
Você podo ver na Figura 2.9 que a amplitude "h" é indicada pelo tamanho da caixa ide 12 ate
20) e que não existem valores extremos. As linhas saindo da caixa são os bigodes e representam a
amplitude dos valores que ficam abaixo do primeiro quartil e acima do terceiro, mas ainda dentro
dos limites internos. Qualquer valor que esteja fora dos limites internos é denominado de valor
extremo ou ainda de atípico (outlier). Você pode ver a partir da Figura 2.9 que não existem valores
fora dos limites internos, que são 0 e 32. Os limites internos não são necessariamente mostrados
no diagrama. O maior e o menor valor entre os limites internos (escores adjacentes 2 e 25) são
indicados no diagrama pelas linhas transversais em cada um dos bigodes.
Se agora adicionarmos o valor 33 ao conjunto de dados ilustrado na Figura 2.9. o dia
grama de caixa e bigodes será semelhante ao mostrado na Figura 2.10. Vocc deve notar que
o valor 10 está destacado. Isso c para nos informar que o décimo valor do nosso conjunto de
dados é um valor extremo (atípico), isto é. ele está fora da cerca interna do valor 32. Podemos
querer dar uma olhada neste valor para saber por que ele é atípico, pois poderia ser resultado
de um erro no registro dos dados.
O diagrama ilustrado na Figura 2.11 representa os dados a partir de escores hipotéticos de
depressão apresentados anteriormente no capítulo. Você vê a partir dele que o valor extremo
40
Valor
o10
atípico
30 -
20 -
10 -
0-
-1 0
N = 10
Dados
70
60-
50 -
Valores
40 -
atípicos
30 -
20 -
10 -
0-
-10
N = 75
Depressão
Figura 2.11
Diagrama de caixa e bigodes para um questionário ilustrando vários valores extremos.
Christine P. Dancey & John Reidy
óbvio (o escore 64) é representado com o tal. Entretanto, existem valores m enos óbvios que
são extremos, com o os valores 18 e 23. Isso mostra que nem sempre é possível apontar quais
valores são atípicos, e. desta forma, o diagrama dc caixa c bigodes é uma técnica bastante útil
para a exploração dc nossos dados. Você notará que o diagrama apresenta um bigode vindo
do topo da caixa. Isso significa que existem valores que estão acima do quartil superior, mas
dentro do limite interno (o valor 13).
Por que é importante identificar valores extremos? Você deve lembrar que muitas das
técnicas estatísticas discutidas no livro envolvem o cálculo de médias. Relembre que também
foi discutido com o a média é sensível a valores extremos. Assim , devem os nos preocupar se
nossos dados contêm ou não tais valores extremos, para que possamos tirar conclusões ade
quadas das análises estatísticas realizadas.
Estritamente falando, não devem os utilizar a maioria das técnicas estatísticas ínfcren-
ciais deste livro se tivermos valores extremos em nossos dados. N o entanto, existem formas
dc se lidar com tais valores. Se você sc deparar com valores atípicos execute as seguintes
etapas:
■ Verifique se anotou ou digitou corretamente os dados.
■ Verifique sc não existe nada diferente do usual com os valores extremos. Por exem
plo. sc você lembra da pessoa que teve tal resultado ter entendido bem as instruções
do teste, se ela com pletou o questionário de forma adequada, se existe algum motivo
para pensar que ela não tenha completado a tareia de lorma adequada.
- Se houver um bom motivo, então você pode remov er o resultado desta pessoa da
análise. Entretanto, quando o relatório lor elaborado, você deve registiai o fato c
colocar o m otivo da remoção daquele v alor.
■ Se não existir nada de especial com o participante além do tato de ele ter apresenta
do um valor atípico, provavelmente, você deve mantê-lo na análise. E legítimo, no
entanto, ajustar este valor de forma que não seja tão extremo e assim não inlluencic
excessivam ente a média. Por que lazer isso?
- Lembre, se estiver utilizando a média é por que está interessado no valor típico
do grupo. Claramente, um valor extremo não é um valor típico, então é legítimo
ajustá-lo para torná-lo mais de acordo com o resto do conjunto.
- Para fazer isso. ajustamos o valor extremo de modo que seja igual a uma unidade
acima do valor mais alto da amostra, mas que não seja um valor atípico. Desta
forma, o participante ainda será reconhecido com o o valor mais alto do conjunto,
mas a sua influência sobre a média e sobre a análise estatística infercncial será
menor.
- C om o exem plo, vamos nos referir aos escores dc depressão já apresentados (veja
Fieura 2 .11). Suponha que exista apenas um valor extremo nesta amostra (o valor
64) e que ele é um escore válido (com o objetivo de ilustração, vamos ignorar os
dois outros valores atípicos desic conjunto). Para ajustar este resultado, encon
tramos o escorc mais alto que não seja atípico. N este caso. o valor é 13. Vamos
ajustar o escore extremo de modo que ele seja uma unidade apenas inaioi do que
13. Para esse exem plo, então, o v alor ajustado será igual a 14.
■ É claro que. se você fizer tais ajustes no v alor, precisa registrar exatamente o que foi
feito quando for elaborar o relatório da pesquisa, de modo que os leitores saibain que
as análises foram realizadas sobre alguns valores ajustados.
Não temos condições de fornecer aqui uma discussão completa deste assunto, mas você
pode encontrar mais informações cm Tabachniek e Fidell (2003).
Estatística sem Matematica para Psicologia 79
Atividade 2.6
Exemplo da literatura:
comportamento emocional e síndrome do pânico
E ram que pesquisadores se refiram a diagramas de caixa e bigodes em publicações, embora
presumamos que de falo os considerem anles de utilizar muitas das técnicas estatísticas abordadas
neste li\ ro. Um a exceção e' a publicação recente de Baker e colaboradores. N este artigo os autores
relatam um estudo conduzido para investigar diferenças entre pacientes com síndrome do pânico
; sem a síndrome, utilizado com o controle em seus com portamentos em ocionais. Eles concluem
que os pacientes com a síndrome parecem controlar m ais as em oções do que os que não apre-
'cniam a síndrome. Um a das medidas de controle em ocional utilizadas foi a CECS iC oitrraiild
L m o tio n a l C ontrol Scale. de Walson e Greer. 1973). que avalia o grau em que os respondentes
:entam controlar os sentim entos com o raiva, ansiedade e felicidade. O questionário fornece, ain
da. um escore total que representa o "grau de controle em ocional geral" dos respondentes. Na
'¿.vão de resultados, os autores apresentam um diagrama de caixa e bigodes do escore lolal da
CECS para o grupo com síndrome do pânico e para os dois grupos de controle que eles ulili/aram .
Entretanto, os autores não com entam em qual diagrama está sugerida a distribuição dos escores
CECS destes grupos. O diagrama de caixa e bigodes mostra que a distribuição dos escores CECS
rara os três grupos são bastante semelhantes, mas os pacientes com síndrome do pânico tendem a
v r escores CECS total mais altos. Adicionalm ente, existem alguns escores atípicos ev identes em
um dos grupos-controle.
Para obter histogramas, diagramas de caule e tolhas e diagramas de caixa e bigodes uti
lizando o SPSSPW. você pode utilizar a caixa de diálogo Explore (Explorar). Proceda com o
já descrito anteriormente para obter as medidas de tendência central. Se quer obter medidas
de tendência central e descritivas gráficas, deve selecionar a opção Boili (Am bos) no canto
inferior direilt) da caixa (opção D isplay). Se. no entanto, você quer som ente as descritivas
gráficas, deve selecionar a opção P lois (Plotar), conlorm e abaixo:
Você deve. então, clicar no botão PIo h (Plotar) para especificar que diagrama você quer.
Surgirá a seguinte janela secundária:
_ j _ j M & J » 1 - r i M c i a i n i '»!■»!
_L-
D«C^®8V»---
r' Facfc» l«veb tojertiei P 0'em-andtea* Selecione a
r Ucperüíri)« 'Lx&tt? opção Histogram
r Non* (Histograma)
r bfeX; ntfh «etf»
i a w O n L*wil *Wh t r-v*n» T« d
tim <t
CI - , -r...
1jJ_ if
SPSStvocwo»«i
^ ^ W p jw itR iú tú S a ta I SF IO w çN r )| j i d o ^ iw ln n q si**.*, <> 11
Estatística sem Matemática para Psicologia 81
H istogram (Histograma)
2,5
3 2,0 -
O
0
1 1,5 -
£ 1,0
¡T
1) „
t 0,5 H Desvio p a d rão = 2 ,1 6
M édia = 8 ,7 0
0,0 N = 6
6 ,0 8 ,0 10,0 12,0
W ITH D O G (Com o cáo)
Diagram a de
Frequency Stem and Leaf
caule e folhas
(Freqüências) (Caule e folhas)
4 .0 0 0 6789
2.00 1 02
Figura 2.12
Saída do SPSSPW fornecendo o histograma, e os diagramas de caule e folhas e caixa e
bigodes.
A seleção por om issão (d e fa u lt) c para os diagramas de caixa e bigodes e caule e to
lhas. Para obter lambem um histograma, selecione a opção e então clique no botão Continue
(Continue). Você retornará para a janela principal e deverá clicar no botão O K para obter os
gráficos desejados. O resultado será o seguinte:
Você obterá um histograma, seguido de um diagrama de caule e folhas e finalmente dc
um diagrama caixa e bigodes. Apresentamos a saída apenas para a condição com o cão. O
SPSS fornecerá ainda a saída para a condição sem o cão. Você deve notar que o SPSS pode
ser configurado para fornecer intervalos diferentes dos demonstrados. Assim , você precisa
checar qual é o tipo de intervalo que o SPSS apresenta.
82 Christine P. Dancey & John Reidy
Uma técnica útil para examinar o relacionamento entre duas variáveis é fazer um diagra
ma de dispersão (.vcattergrams). Um exemplo de tal tipo de gráfico pode ser visto na Figura
2.13 para as variáveis ansiedade estatística e procrastinação apresentadas no Capítulo 1. Estes
dados são mostrados novamente abaixo:
Escores para a ansiedade estatística: 50 59 48 60 62 55
Escores para a procrastinação: 96 132 94 110 140 125
O diagrama de dispersão coloca uma variável no eixo dos "x" e a outra variável no eixo
dos “y’\ A Figura 2.13 fornece os valores para a procrastinação representados no eixo x e a
ansiedade estatística no eixo y. Ela dá uma boa ilustração de como as duas variáveis estão
relacionadas. A partir do resultado, vemos que. geralmente, a ansiedade estatística aumenta
com a procrastinação. Assim, parece haver um relacionamento entre as duas variáveis. Os
escores parecem estar bcni próximos de uma linha imaginária que vai do canto inferior direito
ao canto superior esquerdo. Chamamos este tipo de resultado de relação positiva.
Suponha que no seu estudo da ansiedade estatística você achou que. à medida que a ansie
dade estatística aumentava, a procrastinação, diminuía. Como você imagina que o diagrama
dc dispersão será? Você constatará sua semelhança com o apresentado na Figura 2.14.
Veja no diagrama de dispersão da Figura 2.14 que. quando a procrastinação aumenta, a
ansiedade estatística decresce. Os escores parecem esiar agrupados em torno de uma linha
imaginária que vai do canto superior esquerdo ao canto inferior direito. Podemos dizer que
temos. aqui. uma relação negativa. Como se pareceria o diagrama de dispersão se não exis
tisse um tipo perceptível de relação entre as duas variáveis? O gráfico apresentado na Figura
2.15 dá uma indicação de como ele poderia ser.
Escore de ansiedade
estatística de 55 e
procrastinação de 125
Procrastination (Procrastinação)
Figura 2.14 Diagrama de dispersão indicando que um decréscimo na ansiedade estatística corresponde
a um acréscimo na procrastinação.
0 padrão se assemelha
Procrastination (Procrastinação)
Figura 2.15 Diagrama de dispersão indicando ausência de relacionamento entre ansiedade estatística
e procrastinação.
84 Christine P. Dancey & John Reidy
Note que o arranjo de pontos do diagrama de dispersão ilustrado na Figura 2.15 parece
ser aleatório. Dessa forma, tais diagramas são úteis para se examinar o relacionamento entre
duas variáveis, como será discutido com mais detalhes no Capítulo 5.
Atividade 2.7
Dado o seguinte diagrama de dispersão, qual é a conclusão mais apropriada sobre o rela
cionamento entre o preço do petróleo e a satisfação do motorista?
60 70 80 90 100
Price of petrol (Preço do petróleo)
Para obter diagramas de dispersão utilizando o SPSSPW. clique no menu Graplis (Gráfi
cos) e então selecione a opção Sçatter... (Dispersão). Você obterá a seguinte janela:
86 Christine P. Dancey & John Reidy
Você deve lembrar que. anteriormente, explicamos o problema associado com o erro
de amostragem. Comentamos que. em virtude do erro, a média da amostra pode não ser
um bom indicador da média populacional. Você deve notar que o erro de amostragem não
está limitado a circunstâncias em que queremos estimar a média de uma população. Ele
também é uma questão importante quando queremos determinar o relacionamento entre
duas variáveis. Suponha que realizamos um estudo relacionando ansiedade estatística
e procrastinação e que não exista, de lato. relação entre as duas variáveis. A título de
ilustração, vamos supor que temos apenas 50 escores de pessoas na população. Se você
retira duas amostras diferentes desta população, uma contendo somente 3 pessoas e a
outra contendo 20 pessoas, poderemos obter diagramas de dispersão que se assemelham
às l-igura 2.17 (a) e (b). Nesses diagramas pode-se perceber que aparentemente não existe
relacionamento entre as variáveis. Quando a procrastinação aumenta, não existe um pa
drão consistente de variação da ansiedade estatística. Nesse caso. as nossas amostras são
boas representantes da população subjacente.
Se agora selecionarmos mais duas amostras (uma contendo 3 e a outra contendo 20
pessoas), podemos obter os diagramas mostrados nas Figura 2.18 (a) e (b). Nesse caso. no
diagrama com 3 pessoas podemos concluir que é possível um relacionamento negativo en
tre as duas variáveis. Quando a ansiedade estatística diminui, a procrastinação aumenta. Na
amostra com 20 pessoas, entretanto, a sugestão é. novamente, de que não existe relacio
namento aparente entre as variáveis. Você pode ver que uma amostra pequena não reflete
acuradamente o padrão da população, enquanto a maior o faz.
70 -
„rç 60 -
0
3•/1 40 -
c
<
fT 3 0 -
X
c<0
1 20 -
!T3
* 10
0-
20 40 60 80 100
Procrastination (Procrastinação)
„ 70- ^ 70 n
sJ
á 60- 1 60-
2 □
□ &
t 50- s 50- □ D
_
-5 'Z D □
5 40 - § 40- D □
< <
>■ 3 0 - ^30-
Qj
□
o
□
X X
□ □ □
an
KJ
1
= 20-
0
St \S) □
□d
2 10- | 10-
•E «3 □
5 0 □ & 0 □
i i i
20 40 60 80 100 20 40 60 80 100
Procrastination (Procrastinação) Procrastination (Procrastinação)
(a) (b)
/0 -r
■E 6 0 - 5 60-
n
50 -
*lo 50-
"b
40- %4 0 -
c
< <
30 - 5» 30 -
X
20 - 1 20-
V/»
10 - '■5 10-
0 (/1
20 40 60 80 100 20 40 60 80 100
Procrastination (Procrastinação) Procrastination (Procrastmaçáo)
(a) (b)
Finalmente, se você selecionar mais duas amostras, poderá obter o padrão ilustrado na
Figura 2.19. Aqui você deverá ser capaz de perceber que a amostra de 3 pessoas não sugere
inferir um relacionamento entre as duas variáveis, mas de 20 pessoas sim. Se observar a
Figura 2.19. perceberá que parece existir um padrão na amostra de 20 pessoas sugerindo
que, quando a procrastinação aumenta, a ansiedade estatística também cresce. Nesse caso.
a amostra maior não representa acuradamente o relacionamento existente na população, ao
passo que a menor sim.
Você deve notar que é muito menos provável de se obter uma situação como a ilustra
da na Figura 2.19 do que nas Figuras 2.17 e 2.18. Como indicado anteriormente, amostras
grandes apresentam uma probabilidade maior de representar corretamente a população em
estudo. Hmbora o cenário da Figura 2.19 seja improvável, pode ocorrer. Então, você dev e ser
cuidadoso ao generalizar os resultados de amostras para populações.
88 C h r s t ne P Dancey & John Reidy
4U 60 80
Procrastmation (Procrastinação) 40 60 80
Procrastination (Procrastinação)
(a)
(b)
Figura 2.19
e ProcrTs^inaçâo^ugeHds p e la ^ -jJ)1p^ssoas^^aTn^pela^tte
dados de amostras está sujeita to ' c m » arnioni g*neral,2açao que se P °ssa fazer a partir de
tados de urna amostra refletem o uue o -nm.* ’• a™eme cstaremos certos ^ que os resul-
dispersão ilustraram, os dados amostrais podem nos'e n ^ a ! ^ « ! ? 0 ' C° m° dÌagramas de
valores completamente diferente do padrão d à Z . r Um padrã° de
- — a - b a b .lid a d e de que
- u j T , * * ”* * * « * vWa
de testes, tendem a ser normalmente distribuídas’ t o T T n T ™ * * reSU'tud° S
2.20. Em nossa pesquisa, podemos utilizir esJ- ' r " - pJ,etern com as Cllrvas da Figura
forma de distribuição das populações. I: por esserr ° ™ a<,aopara ,ormular hlP(>teses sobre a
nicas estatísticas utilizadas por nós consider.m *” ° " ° 4U,C ‘" UJlas das mais poderosas téc-
amostras são distribuídas normalmente * ^ ^ P° P Ç° eS das quais reliramos nossas
Distribuições normais.
Figura 2.20
Todas as distribuições na Figura 2.20 são normais: embora não sejam exatamente as
mesmas, apresentam as características descritas. Você pode ver que diferem cm termos de
dispersão e na altura no centro. Observe que. se tivermos uma distribuição normal, a média, a
mediana e a moda coincidem. Outra característica importante é ser uma função da sua média
e do seu desvio padrão (explicaremos o desvio padrão mais adiante neste capítulo). O que se
quer dizer é que. uma ve/, conhecidos a média e o desvio padrão, podemos desenhar a curva
por meio de sua fórmula. Não apresentaremos esta fórmula aqui; apenas lembre que qual
quer distribuição normal pode ser desenhada, uma ve/ que se saiba sua média e seu desvio
padrão.
Como já apontamos, muitas variáveis que ocorrem naturalmente se revelam normais quan
do ploiadas. Percebe-se. também, que, quanto mais valores destas variáveis são plotados. mais
elas se assemelham a uma normal. Um exemplo simples pode serv ir como ilustração. Se você
selecionar lü homens e medir suas alturas em polegadas, os histogramas de freqüências lerão a
aparência da Figura 2.21 (a). Está claro que. nesse caso. ela não lembra muito as distribuições
normais ilustradas na Figura 2.20. Se você selecionar mais 10 homens e colocar em um gráfico
todas as 20 alturas em polegadas, a distribuição resultante poderá ser semelhante à da Figura
2.21 (b). que. novamente, não tem muita semelhança com uma curva normal. Você poderá ver.
entretanto, que. à medida que selecionamos mais homens e registramos suas alturas, o histo
grama torna-se cada vez mais aproximado de uma distribuição normal (Figura 2.21 (c)até(e)).
Quando selecionamos 100 homens, pode-se perceber que teremos uma distribuição normal
quase perfeita. Obviamente, "fabricamos" esses dados para servir de exemplo, mas. cm geral,
é o que acontece com muitas variáveis com as quais você lidará.
90 Christine P. Dancey & John Reidy
Nada
parecido com
uma normal
(b) 20 homens
4 ■
60-61 6 4 -6 5 6 8 -6 9 7 2 -7 3 7 6 -7 7 60-61 6 4 -6 5 68 69 72 73 7 6 -7 7
(c) 30 homens
5
Com 30 homens,
a distribuição começa
a parecer normal
Com 100 homens, temos
" finalmente uma distribuição
que é praticamente normal
60 61 64 65 6 8 -6 9 72-73 76 -7 7
Figura 2.21 Histogramas mostrando a progressão para uma distribuição normal à medida que mais
pessoas são adicionadas à amostra.
2.8.1 Amplitude
Uma maneira simples de se ler uma indicação da dispersão dos valores de uma amostra
ou população e' comparar o valor máximo com o mínimo. Esse resultado é conhecido como
amplitude. A amplitude é simplesmente a diferença entro os valores máximo e mínimo. Por
exemplo, a amplitude dos escores de depressão na Figura 2.3 é 64. isto é. 64 menos 0. Nesse
exemplo, o escore mais baixo é 0 e o mais alto. 64. de modo que a amplitude é 64.
Embora a amplitude nos informe sobre a variação total do conjunto, não fornece qual
quer indicação do que ocorre no interior do conjunto. Por exemplo, dê uma olhada nas duas
distribuições na Figura 2.22. Estes histogramas são gerados a partir de dois conjuntos de
dados que têm a mesma média (16) e os mesmos escores mínimos e máximos (5 e 27). Am
bos apresentam, portanto, a mesma amplitude, que é 22 (27 menos 5). Elas são. entretanto,
distribuições totalmente diferentes; os valores da distribuição B estão distribuídos em grande
parte próximos da média, enquanto na distribuição A estão bem mais espalhados. De forma
ideal, precisamos ter uma idéia da variação total de uma distribuição e de quanto os valores
variam em torno da média. Assim, embora a amplitude forneça uma idéia da variação total
dos valores, ela. de fato, não nos dá uma idéia da forma global da distribuição dos valores de
uma amostra.
10
I
6,0 9,0 12,0 15,0 18,0 21,0 24,0 27,0 9,0 12,0 15,0 18,0 21,0 24,0 27,0
VAR00002 VAR00001
Conjuntos com mesma média e mesmo valor máximo e mínimo, mas que apresentam
Figura 2.22
diferentes distribuições em torno da média.
M édia
D esvios em
relação à m édia
Se som arm os
estes valores,
iremos obter zero
Esse resultado, então, não será de utilidade para informar como o grupo todo está se com
portando em relação à media. Uma maneira de resolv er o problema é elevar cada um desses
desvios ao quadrado, de modo a eliminar os valores negativos. Feito isso, podemos então
calcular a média dos desvios ao quadrado para obter uma indicação da expansão do conjunto
como um todo. Esse resultado é conhecido como variância. Há um problema com a variância:
baseia-se nos quadrados dos desv ios e. assim, não está expressa na mesma unidade dos dados
originais. Por exemplo, se os nossos valores fossem segundos, a variância seria expressa em
segundos ao quadrado. Para obter uma medida compatível com os valores originais, utilizare
mos a raiz quadrada da variância, que é denominada desvio padrão.
Um exemplo simples ilustra lodo o procedimento. Suponha que temos o seguinte conjun
to de valores coletados de um estudo sobre o número de barras de chocolate consumidas por
semana: 1.4. 5, 6. 9. 11. Para calcular o desvio padrão, procederemos da seguinte forma:
■ Primeiro calculamos a média, que e' 6.
■ Os desvios a partir da média de cada um dos valores são: —5, —2. —I, 0, 3, 5 (se você
somar estes valores, poderá verificar que o resultado é 0):
■ Para eliminar os valores negativos, vamos elev ar cada um destes desvios ao quadrado,
obtendo os seguintes resultados: 25, 4. 1.0. 9. 25.
■ A seguir, é calculada a media destes resultados, que é lü.67, isto é. 64 6. fornecen
do a variância.
■ Finalmente, o desvio padrão é obtido por meio da rai/ quadrada da variância, dando
como resultado o valor 3.27.
O valor de 3.27 do desvio padrão é um indicativo de quão próximo os valores estão d
média do conjunto de dados. Hm geral, você vai verificar que aproximadamente lO'/r dos
dados estão situados em um intervalo de desv io padrão a contar da média. No exemplo acima,
o desvio padrão é 3.27. indicando que a maioria dos valores desta amostra está 3.27 unidades
acima ou abaixo da média. Isto é. aproximadamente 70% dos valores estarão entre 2.73 (6
Estatística sem Matemática para Psicologia 93
menos 3.27) e 9.27 (6 mais 3.27). O desvio padrão é útil quando você quer comparar amostras
que apresentam a mesma média. Suponha que tenhamos uma segunda amostra que apresenta
um desvio padrão de 6.14. Se a compararmos com a do exemplo anterior, que apresenta um
desvio padrão de 3.27. pode-se perceber que. no exemplo, os dados estão bem mais próximos
da média do que nesta segunda amostra.
M édia
4 5 (6 ) 9 11 ------Valores originais
D esvios a partir _2 -1 ü 3 5
da m édia
25 4 1 0 9 25 D esvios ao qu ad rad o
Atividade 2.8
□
SPSSPW: obtenção de medidas de variação
Para obter medidas de variação utilizando o SPSSPW, você deve seguir as instruções
apresentadas anteriormente ao se gerar medidas de tendência central. Se você clicar na caixa
de diálogos Explore (Explorar), como descrito previamente, obterá uma saída semelhante à
apresentada a seguir:
94 Christine P. Dancey & John Reidy
EXPLORE
Cases (Cdsos)
Você pode observar que a saída apresenta os valores da variância, do desvio padrão e da
amplitude.
Estatística sem Matemática para Psicologia 95
Platicúrtíca
Figura 2.23
Distribuições não-normais
Distribuição Distribuição
“ positivamente negativamente —
assimétrica assimétrica
2,5 5,0 7,5 10,0 12,5 15,0 ,5 / 5,0 7,5 10,0 12,5 15,0 17,5 20,0
VAR00003 \ VAR000001
Caudas
(a) (b)
Figura 2.24
Distribuições assimetricamente positivas e negativas.
Estatística sem Matemática para Psicologia 97
Ocasionalmente, você pode obter uma distribuição como a representada na Figura 2.25.
E conhecida como uma distribuição bimodal. Esse tipo de distribuição é, claramente, não-
normal. Se você se defrontar com tal tipo de conjunto, é conveniente que os dados sejam
examinados de perto, pois pode existir algum fator que faça os dados se agruparem cm tomo
das duas posições modais. Se nada de diferente estiver ocorrendo, os dados devem ser trata
dos como provenientes de duas populações distintas. Relate que está frente a uma distribuição
bimodal e registre as duas modas.
Um bom exemplo de dados bimodais e' apresentado por Morris e colaboradores (1981). Neste
estudo, eles procuraram relações entre lembranças de resultados de partidas de futebol e conhe
cimento de futebol, medidas por meio de uma prova sobre o assunto. Quando os pesquisadores
examinaram os resultados desta prova, verificaram que era bimodal. Explicou-se o fato pela exis
tência de duas populações distintas de pessoas no estudo: uma formada por entusiastas do futebol
e outra não. Os tas de futebol se agruparam próximos do escore máximo da prova, enquanto os que
não eram lãs se agruparam próximos do escore mínimo, formando uma distribuição bimodal.
Agora mostramos a você como e a aparência de uma distribuição normal e algumas formas
de se desviar da normalidade. Em virtude da importância da distribuição normal na estatística, um
D uas ,
m o das \
/ H istogram \
(Histograma) \
15,0 2 0 ,0 2 5 ,0 3 0 .0 3 5 ,0 4 0 ,0
VA R 00004
Distribuição bimodal
Figura 2.25
98 Christine P. Dancey & John Reidy
dos principais objetivos da representação gráfica dos dados é verificar se eles são normalmente
distribuídos. Talvez as melhores técnicas gráficas para verificar se os dados são ou não normal
mente distribuídos sejam os histogramas e os diagramas de caule e folhas. Se você der uma nova
olhada na Figura 2.21 (e), verá o exemplo de um histograma que mostra uma distribuição normal.
Por outro lado. a Figura 2.23 é o exemplo de uma distribuição que apresenta uma assimetria posi
tiva leve. Compare-a com a Figura 2.24 (a) e verá que cias são semelhantes na forma.
Uma das limitações do diagrama de caixa e bigodes é a dificuldade de. algumas vez.es. a
partir dele. verificar se uma distribuição se desvia da normalidade. Como indicação, as Figu
ras 2.26 (a) e (c) fornecem exemplos de distribuições com dados normais e não-normais.
6- ______
_ Bigodes do m esm o
4 ._ tam anho em cada um
_..— dos lados da caixa
2 ■ ------
Dados
6 - -
O lado de cim a
4 ■ da caixa não
apresenta bigode
2 ■
Dados
8
1
1
2 -
Dados
Figura 2.26 Diagramas de caixa e bigodes ilustrando (a) distribuição normal, (b) com assimetria
negativa c (ç) dados com distribuição bimodal.
Estatística sem Matematica para Psicologia 99
A Figura 2.26 (a) foi gerada a partir de dados normalmente distribuídos (1. 2. 2. 3. 3.3. 4.
4 .4 .4 .5 .5 , 5.6. 6. 7). Mostra que a mediana está no centro da caixa e apresenta dois hicodes
de mesmo tamanho. Não existem valores atípicos.
A Figura 2.26 (h) foi gerada a partir de dados negativamente assimétricos (1.2. 3. 3. 3.
4. 4. 4. 5. 5. 5. 5. 5. 5. 5. 5). Mostra que a mediana está deslocada para cima e próxima ao
limite superior da caixa. Não existe bigode saindo do topo da caixa. Este é um exemplo ex
tremo. mas sempre que a mediana estiver mais próxima de um dos lados da caixa, o bigode
daquele lado será mais curto ou não existirá. Então você deve suspeitar dc que possui dados
assimétricos.
Finalmente, a Figura 2.26 (c) foi gerada a partir de dados com distribuição bimodal (1.
2, 2, 3. 3, 3. 3, 3. 4. 4. 5, 5, 5, 5. 5. 6. 6. 7). Surpreendentemente, o diagrama parece exata
mente como o da Figura 2.26 (a) e é um bom exemplo para ilustrar que se deve ter muita
cautela quando se tentar verificar a normalidade dos dados a partir de um diagrama de caixa
e bigodes. Isso mostra por que o histograma e, de certo modo, o diagrama de caule e folhas
fornecem um melhor indicativo de que os dados estão normalmente distribuídos. Felizmente,
dados que apresentam distribuições bimodais não são muito comuns em pesquisa, e. assim,
o diagrama de caixa e bigodes pode fornecer uma indicação razoável dc que os dados estão
normalmente distri buídos.
Atividade 2.9
Exemplo da literatura:
experiencia de utilização de computadores e atitudes em relação a eles
Mesmo que todos os pesquisadores que utilizam técnicas estatísticas abordadas neste livro
usassem histogramas, na verdade este recurso poueo aparece em relatórios publicados. Urna
agradável exceção é o artigo recente publicado por Garland e Noyes (2004). Neste esludo, os
pesquisadores examinaram aspectos que melhor prevêem atitudes em relação ao uso de compu
tadores. Concluíram que os questionários atuais que medem a experiência com computadores
são inadequados em termos de previsão das atitudes em relação aos mesmos. Parte do questioná
rio que aplicaram aos estudantes universitários solicitava informações sobre o quanto utilizavam
computadores, ü s autores apresentam as análises destas informações utilizando histogramas.
Argumentam que. em virtude de utilizarem uma amostra relativamente grande, seria mais apro
priado usar histogramas para examinar a distribuição das respostas do que outras medidas mais
sensíveis de distribuição. Sugerem que os anos de uso de computadores declarados pelos partici
pantes é normalmente distribuído, mas com alguma curtose evidente, refletindo um pico entre o
l/ e o 1lhanos. Indicam, ainda, que o número de horas de uso dos computadores é positivamente
assimétrico e com curtose positiva.
Estatística sem Matemática para Psicologia 101
É bastante útil fazer uso do SPSSPW para mostrar uma distribuição normal sobreposta a
um histograma, de modo a auxiliar a percepção da normalidade dos dados. Infelizmente, não
é possível fazer isso com a caixa de diálogos Explore (Explorar). Para tal. deve-se gerar o his
tograma utilizando o menu Graphs (Gráficos), em vez do menu Analyze (Analisar). Quando
clicar no menu Graplis, notará que existe uma opção para todas as técnicas descritivas que já
mostramos a você:
*UJ X|
.Iffl xj
102 Christine P Dancey & John Reidy
Para gerar um histograma com uma curva normal, você deve mover a variável de
interesse para a caixa Vurkible (Variável). Selecione a opção que diz Displax normal
curve (Mostrar curva normal). Quando tiver feito a seleção correta, clique no botão OK
para gerar o histograma. O gráfico resultante conterá a curva normal, como indicado pela
Figura 2.27.
Você pode ver, a partir do histograma, que o conjunto de dados que utilizou está bastante
próximo de uma curva normal.
Desvio p adrao = 3 ,5 4
VAR000001
Embora seja uma boa prática examinar a distribuição dos dados, você verá que muitos
pesquisadores não têm o hábito rotineiro de relatar os achados de tais práticas. Tipicamente,
se a distribuição se desvia da normalidade, é uma boa idéia relatar o fato. Se as distribuições
são aproximadamente normais, fica a seu critério fa/er ou não o relato. Registrando ou não
a forma da distribuição dos dados, você deve sempre examiná-la, uma vez que ela desempe
nha um papel importante sobre os tipos de técnicas estatísticas que podem ser utilizados na
análise dos dados.
Se quer mencionar a forma pela qual os dados estão distribuídos, então o exemplo se
guinte é. tahez. o modo de apresentar as estatísticas descritivas. Em um estudo conduzido
por Reidy e Keogh ( I997). pessoas ansiosas e não-ansiosas foram comparadas sobre como
interpretavam informações ambíguas. Fez-se. também, um exame sobre a diferença entre os
gêneros em tais interpretações. Você poderá apresentar as estatísticas descritivas conforme a
seguir:
Estatística sem Matemática para Psicologia 10 3
Tabela 2.1 Número médio de interpretações positivas e negativas apresentadas por homens e
mulheres (o desvio padrão está entre parênteses)
Homens Mulheres
Resumo
Exercício 1
Você recebeu a incumbência de verificar sc a troca das lâmpadas fluorescentes normais
de um escritório por lâmpadas vermelhas aumentará a atenção dos digitadores e diminuirá o
número de erros cometidos por eles. Quando fizer isso encontrará que 20 digitadores dimi
nuíram os números de erros por dia nas seguintes quantidades:
22, 22. 12. 10.42, 19. 20. 19. 20.21.21.20. 30.28.26. 18, 18, 20,21. 19
1. Qual é a VI neste estudo?
2. Qual é a VD neste estudo?
3. Use o SPSSPW para gerar um diagrama de caixa e bigode para os valores acima:
(a) Os dados são normalmente distribuídos?
(b) Existem valores atípicos mostrados pelo diagrama de caixa e bigodes? Se sim.
quais são eles?
(c) Utilizando o SPSSPW, qual é a média do conjunto de valores acima? Qual é o
desvio padrão?
Exercício 2
Um grupo de estudantes do último ano decide descobrir se as aulas da disciplina do
Dr. Boering poderiam ser mais estimulantes. Concluem que a melhor maneira de isso
acontecer ê tomar uma droga alucinógena durante as aulas. Ao tinal do semestre, tez-se
um exame: os estudantes que tomaram a droga durante as aulas obtiveram os seguintes
resultados (%)'.
23. 89. 62. 11. 76. 28.45. 52.71.28
Os estudantes que não tomaram o alucinógeno obtiveram os seguintes resultados:
45. 52. 68. 74. 55. 62. 58. 49. 42. 57
1. Qual é a VI neste estudo?
2. Qual é a VD? A VD é discreta, contínua ou categórica?
3. Use o SPSSPW para obter um histograma para os dois conjuntos de dados e então
responda o seguinte:
(a) Os dois conjuntos de dados são normalmente distribuídos?
(b) Use o SPSSPW para calcular a média e o desvio padrão para os doisconjuntos
de resultados.
Estatística sem Matemática para Psicologia 10 5
Qual das seguintes alternativas representa a m e 6. Q ual a relação entre tam anho da am o stra e erro
lhor estim ativa da m édia populacio n al? am ostrai?
(a) A m édia da am ostra (a) Q uanto m aior o tam anho da am ostra, m aior o
i b) A m éd ia de várias m édias am ostrais erro am ostrai
i c) A m oda de várias m édias am ostrais (b) Q uanto m aior o tam anho d a am ostra, m enor o
d) A m ediana de várias m édias am ostrais erro am ostrai
(c) O tam anho da am ostra é igual ao erro am ostrai
I Se você obteve um a am ostra de dados que eram
(d) N enhum a das anteriores
distribuídos de form a ap roxim adam ente norm al c
não apresentavam valores extrem os, que m edida 7. A m oda é:
de tendência central v ocê usaria? (a) A freqüência do v alor m ais com um dividido
iai M oda pelo núm ero total de valores
i b) M ediana (b) O valor do m eio após a o rd en ação de todos os
i c) M édia esco res
idi N en h u m a das anteriores (c) O v a lo r que ocorre com m ais freqüência
? Qual das seguintes m edidas de tendência central (d) A som a de todos os valores d ividida pelo nú
são sensíveis a valores extrem os? m ero de valores
sas no infinito
(d) T odas as anteriores
Referências
A R M ITA G E . C .. RHIDY. J. D evelopm ent and validation o f a new m easure o f blood fear (nâo-
publicado).
B A K ER . R. et al. E m otional processing and panic. Behaviour Research anil Therapy v. 42. n. I I . p.
1271-87. N o v em b er 2004.
G A R L A N D . K. J.. N O Y E S. J. M . C o m p u ter experience: a p oor p re d ic to r o f co m puter atitudes.
C o m p u ter in H um an B ehaviour, (aguardando im pressão).
M O RIS. P. E. et al. Football know ledge and the acquisition o f new results. British Journal o f
P sychology, v. 72. p. 479-83. 1981.
RHIDY. J. K E O G H . H. State and trait factors underlying the interpretation o f threai/neutral
hom ophones. A rtigo ap resentado na B ritish P sychological Society C ognitive Section Annual
C onference, 1997.
TA B A C H N IC K . B.. F ID F I.I., I.. S. U sing M ultivariate Statistics. A ddison W esley. 4 ed.. 2003.
TU K EY . J. W. E xploratory D ata A nalysis. R eading (M A ): A ddison-W esley, 1977.
W ALSH. J. J.. U G l M B A -A G W t. N O BI. G. Individual differences in statistics anxiety: the roles o f
perfectionism , procrastination and trail anxiety. Personality and Individual D ifferences, v. 33. p.
2 3 9 -5 1 .2 0 0 2 .
W ATSON. M .. G R E E R . S. D evelopm ent o f a questionnaire m easure o f em otional control. Journal o f
P sychosom atic R esearch, v. 27. p. 299-305. 1983.
Probabilidade, Amostragem e
Distribuições
Panoram a do capítulo
p ro b a b ilid a d e e p ro b a b ilid a d e c o n d ic io n a d a
■ a p lic a ç ã o da p ro b a b ilid a d e à p e sq u isa
■ d istrib u iç ã o n o rm a l p ad rão
■ d istrib u iç õ e s a m o stra is
■ e stim a tiva s por p o n to e p o r in tervalo
i erro p a d rão e in tervalo de c o n fia n ç a
■ d ia g ra m a d e b a rras de erro
3.1 Probabilidade
Atividade 3.1
Q u ais destes e ven to s têm p ro b a b ilid a d e igual a 0 (ou m u ito p ró xim o a zero ) e q u a is têm
p ro b a b ilid a d e ig u al a 1 (ou m u ito p ró xim o a 1)?
A n o ite su ce d er ao dia
To d o s os p o lítico s fa la re m a v e rd a d e o te m p o to d o
V o cê a c h a r um c h e q u e d e um m ilh ã o d e reais d e n tre as p á g in a s d e ste livro
O co rre r um in cên d io
■ Escrito re s ad iare m o p razo de en tre g a de m a n u scrito s de livros
Atividade 3.2
E xp resse as se g u in te s p ro b a b ilid a d e s em p e rc e n ta g e n s:
■ 0,25
■ 0,99
■ 1/3
■ 2/10
E xp resse as se g u in te s p ro b a b ilid a d e s em d e cim a is:
■ 1/8
■ 12/20
■ 30%
■ 14%
Vamos agora examinar o jogo de dados. Quando jogamos um dado, qual é a probabilidade
de se obter o número 6? Como temos um resultado desejado (6) c seis resultados possíveis (1,
2, 3, 4, 5 e 6), a probabilidade de se obter um 6 é de 1-4- 6 ou 0,1667. Qual é a probabilidade
de obtermos 1 ou 2? Aqui temos dois resultados desejados (1 ou 2) e seis resultados possíveis,
logo a probabilidade é de 2 -* 6 ou 0,3333.
110 Christine P. Dancey & John Reidy
Tente achar a probabilidade de se obter um número par (a resposta está na seção de Res
postas do livro).
Atividade 3.3
Uma possível conclusão a ser inferida dessa descrição é que a policial estava tentan
do alcançar o homem e prendê-lo. Na maioria dos casos, esta seria uma dedução razoável.
Entretanto, é possível que a policial estivesse seguindo seu colega à paisana e que ambos
estivessem correndo para a cena de um crime.
Podemos ver como é fácil obtermos conclusões errôneas em nosso dia-a-dia. Esse
mesmo tipo de erro pode acontecer na pesquisa psicológica, pois estamos tentando inferir
conclusões a partir de análises estatísticas. Lembre-se de que, na maioria das vezes, quando
testamos uma amostra de pessoas, estamos testando conclusões sobre a população de onde
a amostra foi extraída. Se quiséssemos descobrir se a ansiedade gerada por estatística está
relacionada à procrastinação, selecionaríamos aleatoriamente uma amostra e obteríamos os
valores dessas duas variáveis. A partir desses dados, faríamos inferências sobre a relação
dessas duas variáveis na população. Para esse fim. usaríamos técnicas de estatística infe-
rencial. Entretanto, existe a possibilidade de obtermos as conclusões equivocadas a partir
de nossas análises estatísticas. Isso acontece porque as técnicas estatísticas que usamo.; sc
fundamentam em probabilidades. Portanto, é importante estar sempre ciente da falibilidade
de tais técnicas.
Exemplo da literatura:
ansiedade estatística e procrastinação
-3 -2 -1 0 2 3
15
S ig n if ic a q u e se u Q l e s tá 2 ,3 3 d e s v io s p a d r õ e s a c im a da m éd ia: v o c ê tem u m v a lo r z
d e 2 .3 3 .
U m a v e z c o n v e r tid o s n o s s o s v a lo r e s z, p o d e m o s usar a d istr ib u iç ã o n orm al pad rão de
várias m an eiras. A d istr ib u iç ã o norm al pad rão é um a distribuição de probabilidade. O e n
ca n to d as d istr ib u iç õ e s d e p r o b a b ilid a d e é a e x is tê n c ia de um a a s s o c ia ç ã o c o m ca d a v alor da
d istr ib u iç ã o . S a b e m o s a p r o b a b ilid a d e d e s e le c io n a r a lea to r ia m e n te q u a lq u er v alor da d istr i
b u içã o . A lé m d is s o , s a b e m o s tam b ém a p r o b a b ilid a d e d e s e o b ter u m v a lo r entre q u a isq u er
d o is v a lo r e s da d istr ib u iç ã o , por e x e m p lo , um v alor en tre - 1 e 1. U m a im p ortan te c a r a c te
rística das d istr ib u iç õ e s de p r o b a b ilid a d e é q u e a área a b a ix o da cu rva entre q u a isq u er d o is
p o n to s e s p e c íf ic o s r ep resen ta a p r o b a b ilid a d e d e s e o b te r em v a lo r e s en tre o s d o is p o n to s.
P or e x e m p lo , a p r o b a b ilid a d e d e s e o b te r e m v a lo r e s e n tre - 1 e 1 na d istr ib u iç ã o n orm al
pad rão é d e a p r o x im a d a m e n te 68% (v e r F ig u ra 3 .2 ). Is s o q u er d iz e r q u e 68% da área total
da cu rva n orm al padrão e stá situ ad a en tre -1 e I d e s v io pad rão a con tar da m éd ia . É im p or
tante lem b rar q u e a p r o b a b ilid a d e referid a é a de s e le c io n a r m o s v a lo r e s a lea to r ia m e n te da
d istr ib u iç ã o . L o g o , e x is t e um a p r o b a b ilid a d e d e 68% de se le c io n a r m o s a le a to r ia m e n te um
valor en tre - 1 e 1.
N. de T. A rigor, com o se está falando de uma variável contínua, o que existe é um a probabilidade associada a intervalos da variá
vel. não exatam ente a um valor particular. Por sim plicidade, os autores devem eslar se referindo a esta situação.
Estatística sem Matemática para Psicologia 113
1 desvio padrão
a partir da média
-3 -2 1 0 2 3
M édia de 100
Q!
0.9S96 0,0104
0,9898 0.0102
0,9901 0,0099
0,9904 0.0096
0.9906 0.0094
D a r e m o s ou tro e x e m p lo para e s c la r e c e r o c á lc u lo d as p r o p o r ç õ e s. D ig a m o s q u e v o c ê
tenha tid o um p é s s im o dia q u an d o fe z o se u teste de Q I e c o n se g u iu um resu lta d o de c o m en te
9 5 p o n to s. Q u e p e r ce n ta g e m da p o p u la ç ã o e stá a b a ix o d o seu e sc o r e ?
P o d e m o s co n v erter seu e sc o r e em um valor c. portanto:
9 5 -1 0 0
- 0 ,3 3
15
P ro p o rção da p o p u la ç ã o a c im a e a b a ixo de um va lo r de QI de 9 5 .
Estatística sem Matemática para Psicologia 117
Se você tem um valor z negativo, ele se encontra acima ou abaixo da média? Um valor z
negativo significa que a maioria da população tem um escore mais alto ou mais baixo que o
seu?
Também podemos utilizar a distribuição normal padrão para comparar diferentes si
tuações. Por exemplo, suponhamos que você esteja indeciso sobre sua futura carreira, mas
saiba que gosta dc fazer cerâmica e levantamento de peso. Você decide fazer um curso em
cada uma destas áreas para avaliar seu desempenho e escolher melhor sua futura carreira.
No fim dos cursos, você descobre que sua nota foi de 64% para cerâmica e de 45% para
levantamento dc peso. Com base nestes resultados, poderíamos justificar sua escolha para
seguir uma carreira como oleiro em vez de um levantador de pesos. Para ter uma idéia
melhor, você precisa se comparar com outros em cada um dos grupos. Você pode desco
brir que é pior em cerâmica em comparação ao resto do grupo do que em levantamento
de pesos. Para fazer tais comparações, você precisa converter seus escores em valores z-
Vamos supor que a média e o desvio padrão para cerâmica são 55% e 9%, respectivamen
te, e para o levantamento de peso 40% e 4%. Seu valor ; para cerâmica seria l , e para o
levantamento de pesos seria 1,25.
6 4 -5 5
9 4
Atividade 3.5
Vamos supor que seus aproveitamentos em matemática e inglês sejam 65% e 71%, res
pectivamente. Qual é sua melhor matéria em comparação com outros no seu grupo se as
médias dos grupos e desvios padrões são 60 e 5 (para matemática) e 65 e 7 (para inglês)?
118 Christine P. Dancey & John Reidy
A n teriorm ente e sc la r ec e u -se que a probabilidade de um even to acon tecer pod e ser expressa
co m o um núm ero d ecim al ou c o m o um a percentagem . Por e x em p lo , quando v o c ê jo g a um dado
vo c ê tem um a probabilidade de 0 .1 6 6 7 (1 6 ,6 7 % ) de obter a face 1. D a m esm a m aneira, se houver
um a probabilidade de 0 .0 5 (ou 5% ) de v o c ê sofrer um acid en te enquanto dirige, aproxim adam en
te um a saída e m cada 2 0 resultaria e m acid en te. Tal probabilidade pod e ser d ep end en te de algu m
outro fator, corno falar no celular enquanto dirige. N e ste caso. d iríam os que a probabilidade de
vo c ê sofrer um acid en te, enquanto dirige o carro e fala no celular, seria de 5%. E ste é um e x em p lo
de probabilidade con d icio n a l. A probabilidade de 5% de v o c ê ter um acid en te enquanto dirige o
carro está con d icion ad a ao fato de dirigir e conversar no celular ao m e sm o tem po.
V ocê d e v e estar p e n sa n d o qu e is s o tud o p arece m u ito se n sa to , m a s o q u e a p rob ab ilid ad e
tem a v er c o m o u s o da e sta tístic a na p e sq u isa ? Em p e sq u isa , n o r m a lm en te g e n e r a liz a m o s
resu lta d o s d e a m o stra s para p o p u la ç õ e s. C o m o d isc u tid o no C a p ítu lo 2 , tod a v e z q u e u tili
za m o s am ostras c o rr em o s r is c o s d e c o m e te r erros (erros de a m o str a g em ). Is so s ig n ific a qu e
não sa b e m o s se o padrão de r esu lta d o s q u e o b tiv e m o s em n o ssa s am ostras r ea lm en te r eflete o
qu e e stá a c o n te c e n d o n as p o p u la ç õ e s o u se é sim p le sm e n te r esu lta d o d o erro de a m o stra g em .
S eria v a n ta jo so p o d er c a lc u la r a p r o b a b ilid a d e de o s v a lo r e s a m o str a is resu lta rem d e erro
d e a m o str a g em . S e e x is t is s e so m e n te u m a p eq u en a p o s s ib ilid a d e d e o erro d e a m o str a g em
p rod u zir o pad rão de r esu lta d o s, p o d er ía m o s c o n c lu ir q u e as am ostras r eflete m acu rad am en te
as p o p u la ç õ e s.
U m a das m aneiras m ais sim p le s de aplicar probab ilidad e à p e sq u isa é estim ar parâm etros
p o p u la c io n a is a partir de e sta tística s am ostrais e ca lcu la r in tervalos de c o n fia n ç a . N a s p r ó x i
m as s e ç õ e s , serão ap resen tad os c o n c e ito s n e c essá rio s para ca lcu la r in tervalos de c o n fia n ç a e
e x p lic a d o por que são im p ortan tes para se obterem c o n c lu s õ e s de p e sq u isa s. D e sc re v e re m o s
as d istrib u ições am ostrais e d esta ca rem o s suas p rincip ais características. E m segu id a, será e x
p licad o c o m o a d istrib u ição am ostrai da m éd ia p od e ser u tilizad a para determ inar a qu alid ade
de n o ssa estim ativa da m éd ia am ostrai, em relação à m éd ia p o p u la c io n a l, por m e io do uso de
intervalos de con fian ça.
* N. de T. A frase aqui não deve ser tom ada ao pe da letra, pois. de fato. a distribuição am ostrai só e obtida se forem retiradas todus
as am ostras possíveis de um a dada população. A lém disso, a distribuirão am ostra) ú o conjunto dos valores da estatística am ostrai
com as respectivas probabilidades.
Estatística sem Matemática para Psicologia 119
teressante das distribuições amostrais é o fato de, se elas são determinadas a partir de um nú
mero bastante grande de amostras, apresentarem uma forma aproximadamente normal. Ale'm
disso, quanto mais amostras forem utilizadas, mais próximo da normal estará a resultante
distribuição amostrai.
Talvez, surpreendentemente, a distribuição amostrai da média seja normal, não obstan
te a forma de distribuição da população. Esta pode ser de alguma maneira assimétrica ou
bimodal ou mesmo uniforme, e. ainda assim, podem existir distribuições amostrais quase
normais.
O exemplo seguinte serve como ilustração. Imagine que, quando você nasceu, alguém co
meçou a jogar um dado e a anotar o resultado. Essa pessoa jogou o dado uma vez a cada dois
segundos por toda sua vida ao longo de 80 anos (algo nada interessante para alguém fazer, mas
vamos lá). Agora, se traçarmos a distribuição de todos os lances do dado (a população de todos
os lances do dado ao longo da sua vida), será semelhante à distribuição da Figura 3.8.
Como cada número do dado tem uma probabilidade igual de acontecer (de l em 6),
espera-se que cada número tenha aparecido com aproximadamente a mesma freqüência ao
longo de sua vida. Portanto, a população de todas as jogadas do dado, durante sua vida, tem
uma distribuição uniforme. Considerando que os números ocorreram com igual freqüência,
então a média da população de jogadas é 3,5. Se escolhermos aleatoriamente cinco amos
tras de dez lances do dado, dessa população, poderíamos obter o seguinte:
Média
2 3 4 5 6
Núm ero no dado
N o ta -s e q u e as m é d ia s d a s a m o str a s sã o b o a s a p r o x im a ç õ e s da m é d ia 3 ,5 da p o p u la
ç ã o , e m b o r a variem c o n s id e r a v e lm e n te . F n tr eta n to , se a m éd ia d a s m é d ia s fo s s e c a lc u la d a ,
h a v eria u m a a p r o x im a ç ã o , a in d a m e lh o r, da m é d ia da p o p u la ç ã o :
( 3 ,6 + 3 ,4 + 3 ,9 + 3 + 3 ,4 )
= 3 ,4 6
5
Atividade 3.6
E m b o r a te n h a m o s c o n h e c im e n t o de q u e a m e'dia da a m o str a é u m a a p r o x im a ç ã o da
m e d ia da p o p u la ç ã o , g e r a lm e n te n ã o te m o s m u ita c e r te z a da p r e c is ã o d e sta a p r o x im a ç ã o .
O s in te r v a lo s de c o n fia n ç a p o d e m n o s ajudar n e ssa d ú v id a .
P o r se r a m é d ia d a a m o str a u m v a lo r o u p o n to d e u m a v a r iá v e l, é c o n h e c id a c o m o
estim ativa pontual da m é d ia d a p o p u la ç ã o . A m é d ia d a a m o str a r ep r e se n ta u m p o n to da
v a r iá v e l e p o r e s s e m o tiv o n ã o s a b e m o s se a n o s s a m é d ia a m o str a i é u m a s u b e s tim a ç ã o
ou u m a s o b r e s tim a ç ã o da m é d ia p o p u la c io n a l. A lé m d is s o , n ã o s a b e m o s r e a lm e n te qu al
a p r o x im id a d e d a n o s s a m é d ia da a m o str a c o m a d a p o p u la ç ã o . E n tã o , s e r ia ú til s e ti
v é s s e m o s a lg u m a m a n e ir a d e sa b er a p r o x im a d a m e n te o n d e e s tá a m é d ia d a p o p u la ç ã o .
F e liz m e n te , te m o s u m a m a n eira d e d e s c o b r ir c a lc u la n d o u m in te r v a lo de c o n fia n ç a . O s in
te r v a lo s de c o n fia n ç a para a m é d ia s ã o e s tim a tiv a s in te r v a la r e s para a m é d ia p o p u la c io n a l.
I s to é, e le s n o s fo r n e c e m u m raio d e v a lo r e s e m to r n o da m é d ia a m o str a i (u m in te r v a lo )
d e n tr o d o q u al p o d e m o s c o n sta ta r , c o m d e te r m in a d a c o n fia n ç a , s e e le c o n té m a m é d ia da
p o p u la ç ã o .
P or e x e m p lo , d ig a m o s q u e a p lic á s s e m o s a u m a a m o str a d e p e s s o a s o in v e n tá r io de
d e p r e s s ã o d e B e c k (B D I ) (B e c k et a l., 1 9 6 1 ). O q u e s tio n á r io a v a lia a d e p r e s s ã o , e o s e s
c o r e s p o d e m variar d e 0 a 6 3 . D ig a m o s q u e a m é d ia d a n o s s a a m o str a n o B D I se ja 1 0 .7 2 .
S o m e n t e c o m e s te e x e m p lo n ão te m o s c o m o sa b er a p r o x im id a d e d e s s e r e su lta d o da m é d ia
da p o p u la ç ã o (v e r F ig u ra 3 . 1 1(a )). S e r ia v a n ta jo s o se p u d é s s e m o s dar u m a in d ic a ç ã o da
p r o x im id a d e d e s te n ú m er o à m é d ia da p o p u la ç ã o . P e n s e m o s lo g ic a m e n t e n e ss a situ a ç ã o .
C o m o o m e n o r e s c o r e n o q u e s tio n á r io é 0 , e o m a io r é 6 3 , p o d e m o s ter 100% d e c e r te z a
d e q u e a m é d ia da p o p u la ç ã o e s tá e m a lg u m lu g a r e n tr e e s t e s d o is v a lo r e s (v e r F igu ra
3 .1 1 (b )). E s s e é um in te rv a lo d e c o n f ia n ç a , e m b o r a n ã o se ja m u ito in fo r m a tiv o . P o d e m o s
u sar as c a r a c te r ís tic a s d a s d is tr ib u iç õ e s a m o str a is para e stre ita r e s te in te r v a lo , a p e sa r de
ta m b é m p o d e r m o s e sta r r e d u z in d o a c o n fia n ç a de qu e e le c o n te n h a a m é d ia da p o p u la ç ã o .
G e r a lm e n te fix a m o s in te r v a lo s d e c o n fia n ç a de 9 5 % . V o c ê irá p e r c e b e r q u e , fr e q ü e n te
m e n te . e s t e s in te r v a lo s sã o b e m e s tr e ito s (d e p e n d e n d o d o ta m a n h o da a m o stra u tiliz a d a ).
N o n o s s o e x e m p lo , n o ta -s e q u e e s ta m o s 9 5 % c o n fia n te s d e q u e a m é d ia da p o p u la ç ã o e stá
e n tre 2 ,7 2 e 1 8 .7 2 (v e r F ig u ra 3 .11 ( c )). E s te r e su lta d o é , c o n s id e r a v e lm e n te , m a is p r e c iso
d o q u e afirm ar q u e a m e d ia está en tre 0 e 6 3 . E le n o s fo r n e c e u m a n o ç ã o m a is p r e c is a de
o n d e a m é d ia p o p u la c io n a l p o s sa e sta r em r e la ç ã o à am o stra i.
\ im p ortan te lem b rar q u e, d e v id o ao fa to de e sta r m o s trab alh an d o c o m e stim a tiv a s , não
te m o s ga ra n tia d e q u e o in te rv a lo , d e fa to , e n v o lv a a m é d ia da p o p u la ç ã o . E n tão, d e v e m o s
in d icar, c o m n o s sa c o n fia n ç a , q u e o in te rv a lo c a lc u la d o c o n te m a m é d ia da p o p u la ç ã o . D a í
o term o “ in te rv a lo d e c o n fia n ç a ” .
122 Christine P- Dancey & John Reidy
(a)
A m édia populacional pode estar
em qualquer lugar ao longo desta linha
Média da
am o ;tra
M édia da
am ostra
2,72
-2 -1 2 3
A m édia da am ostra en con tra-se a certo núm ero d e desvios pad rões acim a ou abaixo da
m édia da pop ulação.
Estatística sem M atem ática para Psicologia 125
que vale 99,74%. Então podemos estar 99,74% certos de que a me'dia amostrai estará entre -3 e
3 desvios padrões. Suponhamos agora, como é comum, que queremos estar 95% certos de que
um intervalo da variável contém a média amostrai. Calculamos a probabilidade novamente, con
siderando as áreas sob a curva normal. Na Seção 3.2 vimos que 95% da área sob a distribuição
normal padrão está entre ■ 1,96 e 1,96 desvio padrão (ver Figura 3.15). Então, podemos ter 95%
de confiança de que a média amostrai pode estar no intervalo entre -1,96 e 1,96 erro padrão.
Para ilustrar, vamos supor que a média amostrai está em algum lugar acima da média da
população. Se desenharmos a distribuição baseada na média amostrai em vez de na média da
população, teremos a situação ilustrada na Figura 3.16.
-3 -2 ? -1 X
í í
Média populacional Média amostrai
Figura 3.16
Localização da média populacional na qual a distribuição é desenhada em torno da
média amostrai.
126 C hristine P. Dancey & John Reidy
í í
Média am ostrai Média populacional
M édia da
am ostra é 7
Média da
am ostra é 7
Atividade 3.7
Coloque as
variáveis
nesta caixa
Selecione a
opção Statistics
(Estatísticas)
Clique no
botão Statistics
SPSS Processa n ready
(Estatísticas) ► QJ 1|
¡ y Mctosott Word ■E I Ì J Lqatoirg • Chapic<3 jfojUntitled - SPS... 1734
Verifique se
&\a\a\ E a M I I b=|6| w| >Tlr-| cl- 1-inl o valor correto
está m arcado
I-
EXPLORE
Cases (Casos)
Média
A distância entre o
início e o fim das linhas
é igual à am plitude
do intervalo
de confiança
D ig a m o s q u e q u is é s s e m o s d e sc o b r ir se du as m é d ia s p o p u la c io n a is s e d ife r e n c ia m . P o
d e r ía m o s usar in tervalos de c o n fia n ç a para n os guiar. Por e x e m p lo , im a g in e qu e v o c ê queira
d esco b rir se as m en in a s o b tê m m e lh o re s resu lta d o s d o qu e os m e n in o s em te ste s de m a tem á
tica. V o cê ad m in istra u m a prova de m a tem á tica para du as am ostras, um a de m e n in o s e outra
de m e n in a s. D e s s a s du as am ostras, c a lc u la o s in terv a lo s de c o n fia n ç a e o b tém o d iagram a de
barras d e erro da F igu ra 3 .2 0 .
O qu e fazer co m isso ? P o d e m o s ter 95% de c o n fia n ç a de q u e as m é d ia s p o p u la c io n a is e s
tão dentro d o s in te rv a lo s in d ic a d o s n o d iagram a. C o m o e x iste um a c o n sid e r á v e l so b r e p o siç ã o
entre o s d o is in tervalos de c o n fia n ç a , não p o d e m o s ter c erteza d e qu e e x ista d ife re n ç a entre as
m é d ia s p o p u la c io n a is. N ã o p arece provável que haja u m a d ife re n ç a real nas p o p u la ç õ e s, ou
p e lo m e n o s n ão p o d e m o s p erceb er is s o por m e io de n o ssa s am ostras. P o d e ser que m e n in o s
ten h am um a m é d ia p o p u la c io n a l m aior d o que m e n in a s, ou v ic e -v e r sa . P o d e ser ta m b ém que
as m é d ia s p o p u la c io n a is d e m e n in o s e m en in a s se ja m ig u a is. N ã o sa b e r e m o s p e lo s in terv a lo s
de c o n fia n ç a a p resen ta d o s na F ig u ra 3 .2 0 e, portanto, não p o d er e m o s ob ter c o n c lu s õ e s co m
base n e s s e s d ad os.
A g o r a , v a m o s su p o r q u e o b t iv é s s e m o s o s in te r v a lo s d e c o n f ia n ç a m o str a d o s na F ig u
ra 3 .2 1 . Q u a l seria a c o n c lu s ã o ? N e s s e c a s o , p o d e m o s ver q u e o s in te r v a lo s d e c o n f ia n ç a
n ã o s e s o b r e p õ e m . P o d e m o s ter 9 5 % d e c o n fia n ç a d e q u e a m b a s m é d ia s p o p u la c io n a is
e s tã o e n tr e o s in te r v a lo s in d ic a d o s e , p o r ta n to , n ã o se s o b r e p õ e m . I s s o s u g e r e q u e e x is t e
u m a d ife r e n ç a real e n tr e a s m e d ia s p o p u la c io n a is , P a r e c e , p o r ta n to , q u e a s m e n in a s s e
s a e m m e lh o r d o q u e o s m e n in o s e m te s te s d e m a te m á tic a . V o c ê p o d e v e r q u e , e x a m in a n d o
o s in te r v a lo s d e c o n f ia n ç a , o b t e m o s u m a id é ia c la r a d o p a d rã o d o s v a lo r e s d a s m é d ia s
p o p u la c io n a is .
100
50
0
M enino s M eninas
Atividade 3.8
Em qual dos seguintes d iag ram as de b arras de erro existe um a p robabilidad e real de haver d i
ferença entre as pop ulações das quais fo ram retiradas am o stra s dos dois grupos ap resentad o s?
(a) 10 (b) 10
T
1
T T
5- _L - 1
1 1
.
i
People Computers Rich Poor
(pessoas) (computadores) (ricos) (pobres)
134 C hristine P. Dancey & John Reidy
Hdp
ОМпСЫДге -
í '-/renane-, loi Ы c ò iti
Sterili«*! d variable1:
BS2
¡¿■|H|á>| aa| ч i I M&i *1 ‘í 11—
I ci-i-lr.l ■•[ч>|
7 rodog
Reprезег*
j Cortrfírice r t e t . ai fa meen
Tempiale ...
Г” Уve chart tpecfcabon; Irom I
HE/: NUMil
C o loq ue a VD na
caixa Variable
13 wafccond (Variável) e a
walkcond I I/ Í T ' I VI na caixa
1 1 00 90 : Deline Simple F iioi B a r Summaries la i Gioups of Cases
2 1 00 70 C a teg o ry A xis
,------ - Vanabte
3 1 00 100 (Eixo das
4 1 00 120 Q ra
5 1 00 60
Categorias)
6 1 00 80
7 200 40
□
3 200 50
9 200 30
10 200 60 fiats Repeiert
11 200 50
12 200 10
| Confidence nlwval 1« mwn “3
Templale
F U » eh«» ipecAcatiom fiom.
Você notará que existe uma caixa para a variável dependente (Variable - Variável) e ou
tra para variável de agrupamento (Category Axis - Eixo das categorias). Coloque a variável
dependente na caixa Variable e a variável independente na caixa Category Axis. Clique no
botão OK para gerar o diagrama de barras de erro. Ele deve ser semelhante ao demonstrado
na Figura 3.23.
12
10
?LO 8
a>
T3
cu
= 6
O
0
6
W ITHDOG NODOG
(Com o cachorro) (Sem o cachorro)
GROUP (Grupo)
Exemplo da literatura:
processamento emocional e síndrome do pânico
No Capítulo 2, descrevemos o estudo de Baker e colaboradores (2004), que comparava o con
trole emocional de um grupo de pacientes com síndrome do pânico com o de dois grupos de controle
sem síndrome do pânico (um de Londres e outro de Aberdeen). Os pesquisadores concluíram que
pacientes com síndrome do pânico tendiam a controlar mais suas emoções do que os dos grupos de
controle. Nesse artigo, os autores colocam os intervalos de confiança da magnitude da diferença en
tre os grupos no escore total da Escala de Controle Emocional de Courtauds (CECS). Relatam, por
exemplo, que a diferença da média entre o grupo com pânico e o grupo de controle de Aberdeen foi
de 10,2 pontos, com um intervalo de confiança de 95% de 6,0 a 14,3. A diferença da média entre o
grupo com pânico e o grupo controle de Londres foi de 13,4, com um intervalo de confiança de 95%
de 9,9 a 16,8. Finalmente, a diferença de média entre os dois grupos de controle foi de 3,2, com um
intervalo de confiança de 95% de 0,06 a 5,9.
Agora que você já está acostumado a realizar análises usando o SPSSPW, gostaríamos
de apresentar uma característica muito útil desse programa. Toda vez que estiver com uma
saída do SPSSPW na tela, você pode se valer de um recurso denominado Results Coach (ins
trutor de resultados) que serve de auxílio na interpretação dos resultados de uma análise. Um
dos problemas do SPSSPW é nos fornecer, geralmente, mais informações do que, de fato,
precisamos. Tentar decidir o que é relevante nos resultados apresentados consiste em uma
dificuldade para alunos sem experiência com o programa. O instrutor de resultados pode ser
bastante útil nessas situações.
Para ativar o instrutor de resultados, é necessário ter alguma saída na tela. Iremos demons
trar essa característica com os resultados de uma análise descritiva da variável “ansiedade
estatística” que apresentamos no início do capítulo. Com a tabela Descriptives (descritivas) na
138 Christine P. Dancey & John Reidy
tela, p o sic io n e o cursor em qualquer lugar sobre a tabela e cliq u e no b otao direito do mouse. U m
m enu de o p ç õ e s d eve ser apresentado, c o m o a seguir.
E штшi
Fie Edit V«rw Data Transform Insert Format Analyze £raphs Utfeies Window Helo
Selecione Results
Coach (instrutor
de resultados)
a partir
deste menu
Posicione o
m ouse sobre
a tabela e
clique no
botão direito
í 5tart | . , 5PS5 IZ.Ofoc W rdü...| Hb|UnUled ■5P55 Data . 11 ¿3 Output 1 - SPSS Vi— 1Ü<t ' il Ì ‘' 3-'
V ocê d ev e e n tão clic a r na o p ç ã o Results Coach (instrutor d e r esu ltad os) para ativar o in s
trutor. A p arecerão um e x e m p lo da sa íd a e um a d e sc r iç ã o do c o n te ú d o da tabela. V ocê notará
que no can to inferior direito da tela en con tram -se o s b o tõ es da n avegação que d e sc r ev e m o s no
C ap ítu lo 1 quando m ostram os o s tutoriais. S e clicar na seta à direita, será lev a d o , p a sso a p a sso ,
pela tabela e tera um a breve d esc r iç ã o d o s co n teú d o s. Isso p o d e ser útil para aju d á-lo a d ecid ir
em quais in fo rm a çõ es v o c ê precisa prestar m ais atenção.
Division
Consumer B usiness
Products Products
/ 4309.112 »425.152
95% Confidence Lower Bound $295.906 »397.553
interval for Mean upper Bound »322,319 »452.751
5% Trimmed Mean $299.392 »404.435
Median »289.800 »339,000
3id Deviation 189,537 : ■
Minimum »189.000 »213.000 Breve
Maximum »&97.500 »1,350,000 descrição
Range »508,500 я . 137.000 The Explore Descriplrves table
interquartile Range »77.400 »249.000 provides summary s ta tistic . for . do conteúdo
S kew ness 1 987 continuous numeric variables
1 573 da tabela
Kurtosis 5 267 2 477
Botões de
E xplore D escrip tive S ta tis tic s navegação
J S tart] jg)| Untitled • SPSS Data... | Output 1 - SPSS Vievyci 11^ Tutorial M*roio<t Photo Edtot | « • « < > í IÌ.Q,
Estatística sem M atem ática para Psicologia 139
Resumo
Exercício 1
E m u m c o n s u lt ó r io d e c ir u r g ia d e n tá r ia , a e n fe r m e ir a N a s h e r e o Dr. P a y n e d e c id e m
q u e q u e r e m ten tar r ed u z ir o s n ív e is d e a n s ie d a d e d e p a c ie n te s e m tr a ta m e n to . D e c id e m
q u e a m e lh o r m a n e ira d e fa z e r is s o se r ia is o la r a c u s tic a m e n te as sa la s de e sp e r a a fim d e
q u e o s p a c ie n te s q u e a g u a r d a m n ã o p o d e r e m e sc u ta r o s g r ito s d o s p a c ie n t e s s e n d o tra
ta d o s. P ara ter c e r te z a d e q u e as p a r e d e s à p r o v a d e s o m r e a lm e n te r e d u z e m a n s ie d a d e ,
is o la m a c u s tic a m e n te a p e n a s u m a sa la d e e sp e r a e c o m p a r a m c o m a a n s ie d a d e de p a
c ie n te s q u e e sp e r a m na sa la q u e n ã o é a p rova d e so m . P a c ie n te s s ã o c o lo c a d o s n as d u as
sa la s a le a to r ia m e n te q u a n d o c h e g a m e p r e e n c h e m um q u e s tio n á r io e n q u a n to a g u a r d a m .
140 Christine P. Dancey & John Reidy
12 16
11 26
8 20
4 21
3 19
13 20
10 22
10 18
9 20
11 17
Exercício 2
O Dr. Doolittle finalmente desistiu da idéia de conversar com animais e decidiu tornar-se
um psicólogo experimenta] de animais. Fie está particularmente interessado em descobrir se os
gatos são ou não mais inteligentes do que os cachorros. Para isso, desenvolve um teste de inte
ligência específico a esse estudo e testa amostras de gatos e cachorros. Foi cuidadoso para não
introduzir qualquer tipo de tendenciosidade no teste e acredita ter criado um teste dissociado
de espécies, que pode ser usado em qualquer espécie. O Dr. Doolittle acredita que haverá uma
diferença entre os escores de gatos e cachorros. Os escores estão na tabela a seguir.
Gatos Cachorros
95 116
100 112
104 102
78 96
130 89
111 124
89 131
1 14 117
102 107
97 1 10
Estatística sem M atem atica para Psicologia 141
(a) U s e S P S S P W para gerar g r á fic o s de barras d e erro para cad a u m d o s gru p os.
(b ) C on verta o p rim eiro e sc o r e e m cada c o n d iç ã o para u m v alor z.
•
) I. Qual carreira você deve escolher se seus escores (a) A média amostrai
de levantamento de pesos e cerâmica sào: (b) A média de várias médias amostrais
Levantamento de pesos: escore 52 (c) O desvio padrão
(média amostrai = 55, desvio padrão = 12) (d) O e i T O padrão
Cerâmica: escore 50
16. Obtivemos um desvio padrão de 42 c um tamanho
(média amostrai = 58, desvio padrão = 32)
amostrai de 16 para um grupo de dados. Qual é o
(a) Levantamento de pesos erro padrão'1
(b) Cerâmica
(a) 0,339
(c) Qualquer uma das duas, pois ambas são igual
(b) 2,95
mente boas quando comparadas com suas
respectivas populações (c) 21.68
(d) Nenhuma das duas. pois você é terrível em (d) 10.5
ambas 17. Se você constituir 100 amostras do uma população
1,2. Quais das frases a seguir são verdadeiras quanto à e plotar todas as médias como um histograma de
estatística inferencial? freqüência, você obtém:
(a) Simplesmente descreve nossos dados (a) A distribuição dc médias
(b) E usada para se obterem conclusões dos da ib) Uma distribuição assimétrica
dos amostrais sobre populações (c) A distribuição amostrai
(c) E usada para fazer a psicologia parecer cientí (d) Nenhuma das respostas está correta
fica
18. Dado um erro padrão de 5,2 com uma amostra de
(d) É usada para se obterem conclusões das popu
9, qual é o desvio padrão?
lações sobre amostras
(a) 1,73
13. Se você obtiver um escore de 13 em um ques
(b) 15.6
tionário sobre ansiedade e souber que a média
(c) 46.8
populacional e desvio padrão são 20 e 5, respecti
(d) 0.556
vamente, qual é o seu valor j?
(a) -2,33 19. Para qual das seguintes alternativas você não po
(b) -1 ,4 deria gerar intervalos de confiança?
(c) 1,33 (a) Uma média
(d) 0 (b) Um coeficiente de correlação
14. Se você possui uma população de escores que tem (c.) A diferença da média entre escores
uma distribuição plana (não-normal), então a dis (d) Nenhuma das respostas está correta
tribuição de muitas médias amostrais será: 20. Se você tem uma população negativamente assi
(a) Plana métrica. qual c o formato da distribuição amostrai
(b ) B im o d al das médias daj amostras dessa população?
(c) Negativamente assimétrica
(a) Negativamente assimétrica
(d) Normal
(b) Positivamente assimétrica
15. Qual das seguintes alternativas dá a melhor esti (c) Normal
mativa da média populacional? (d) Não é possível saber
Referências
BAKER, R. et al. Emotional processing and panic. Behaviour Research and Therapy v. 42, n. 11, p.
1271-87, November 2004.
BECK, A. T., et al. An inventory for measuring depression. Archives o f General Psychiatry, v. 4. p.
561-71, 1961.
V\ALSH, J. J., UGUMBA-AGWUNOB1, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences, v. 33, p.
239-51,2002.
Teste de Hipóteses e Significância
4 Estatística
Panorama do capítulo
A m o stra s
Nota na prova
0 10 20 30 40 50 60 70
Horas estudadas por semana
Dê uma olhada agora na Figura 4.2. Neste exemplo, não existe relacionamento entre
o número de horas de estudo e a nota na prova da população. Novamente, apresentamos
três amostras. Uma vez mais, somente uma das amostras reflete acuradamente a popula
ção. O fato é que. devido ao erro amostrai, as amostras que utilizamos podem não refletir
de forma fiel a população de onde foram retiradas. Para cada população que tivermos,
cada um dos padrões amostrais apresentados terá uma probabilidade maior ou menor de
ocorrer, e o valor desta probabilidade dependerá do tamanho da amostra utilizado. Assim,
Estatística sem M atem ática para Psicologia 145
A m o stras
Noto na prova
10 20 30 40 50
Horas estudadas por semana
para a população da Figura 4.1, teremos uma probabilidade maior de observar o padrão
da amostra (c) do que nas amostras (a) e (b), particularmente com valores de tamanho
de amostra razoavelmente grandes. Para a população apresentada na Figura 4.2, teremos
uma probabilidade maior de observar o padrão da amostra (b) do que nas amostras (a) e
(c). Você precisa estar ciente de que, algumas vezes, devido ao erro amostrai, obteremos
padrões nas amostras que não refletem de forma acurada a população de onde as amostras
foram retiradas.
146 C hristine P. Dancey & John Reidy
0 10 20 30 40 50 60 70
Horas estudadas por semana
De que população
f f é mais provável que a
U - '” amostra tenho sido retirada?
10 20 30 40 50 60 70
Horas estudadas por semana
%
De que população
é mais provável que a
amostra tenho sido retirada?
não existe relacionamento entre ambas. De forma semelhante, se você está interessado em
comparar grupos de pessoas, e a hipótese de pesquisa declara que há uma diferença entre os
dois grupos, a hipótese nula afirma que não existe diferença entre os dois grupos.
Quando ler publicações sobre psicologia, encontrará autores que sugerem que a hipótese
nula não pode ser rejeitada. Isso simplesmente significa que a probabilidade calculada indica
que manter a hipótese nula é a conclusão mais sensata. Se você ler que o pesquisador rejeitou
a hipótese nula, significa que a probabilidade de obter os resultados encontrados se a hipó
tese nula fosse verdadeira é tão pequena que se toma mais sensato acreditar na hipótese de
pesquisa (alternativa). Como indicamos anteriormente nesta seção, isso ilustra a competição
entre as hipóteses nula e de pesquisa. O fato de essa abordagem de pesquisa ser denominada
Testagem da Hipótese Nula (THN) ou Teste de Significancia da Hipótese Nula (TSHN) refle
te a importância da mesma.
Se você entendeu a seção anterior, não terá problemas para entender a lógica geral por
trás dos testes de hipóteses, que é a seguinte:
■ formular as hipóteses;
■ medir as variáveis envolvidas e examinar o relacionamento entre elas;
■ calcular a probabilidade de obter tal relacionamento se não existir relação alguma na
população (se a hipótese nula for verdadeira);
■ se esta probabilidade calculada é suficientemente pequena, sugere que o padrão en
contrado é improvável de ter se originado por acaso e, desta forma, provavelmente
reflete um relacionamento genuíno na população.
Colocando de outra forma, se não existe um relacionamento real na população, é impro
vável que você encontre um na sua amostra selecionada aleatoriamente. Desse modo, se você
achar uma relação na amostra, é provável que ela reflita um relacionamento na população, b
importante que você entenda isso. Assim, vá com calma e tenha certeza de que entendeu o
que foi exposto até aqui.
O teste de hipóteses não se limita a investigar o relacionamento entre duas variáveis. Se
você está interessado em estudar diferenças entre grupos, pode também utilizar o teste de
hipóteses. A lógica é mais ou menos a mesma exposta anteriormente. Por exemplo, suponha
que projetamos um ensaio no qual oferecemos aos alunos duas formas de estudo estruturadas,
que se diferenciam apenas na quantidade de horas que precisam estudar. Um grupo estuda
40 horas por semana, enquanto o outro grupo estuda apenas 10 horas por semana (esta é a
variável independente). Vamos supor que os que estudam 40 horas tenham notas mais altas na
prova do que os demais. Esta será nossa hipótese de pesquisa. A hipótese nula corresponderá
à inexistência de diferença entre as médias das notas dos dois grupos. Uma vez coletados os
dados, podemos verificar se existe diferença entre as notas médias dos dois grupos. Se tal
diferença existir, então precisamos determinar a probabilidade de que se origine unicamente
do erro amostrai, isto é, da probabilidade de obtermos uma diferença do tamanho observado
se a hipótese nula for verdadeira. Se esta probabilidade é pequena, faz sentido considerar que
as diferenças se devem à manipulação da variável independente, em vez de unicamente ao
erro amostrai.
150 Christine P. Dancey & John Reidy
Atividade 4.1
Atividade 4.2
Q ual das se g u in te s d e scriçõ es re p rese n ta um bo m su m á rio da lógica por trás dos testos
d e h ip ó teses?
*N. dc T. Os autores não fazem diferença entre as duas situações, mas na verdade o valor/? e' a significância do resultado, enquanto
o valor a e' a significância do teste. As duas probabilidades são, em geral, diferentes.
152 C hristine P. Dancey & John Reidy
Atividade 4.3
Dracup também ressalta o lato de que muitos textos sobre estatística equiparam o valor a
com a probabilidade de que a hipótese nula seja verdadeira. Isso é falso, como Dracup ilustra
claramente: a é a probabilidade de se obter um relacionamento de certa magnitude caso a
hipótese nula seja verdadeira; não é a probabilidade de que esta seja verdadeira.
Uma vez que alguém caia na armadilha de inteipretar a como a probabilidade de que a
hipótese nula seja verdadeira, é relativamente fácil e conveniente sugerir que 1 - a seja a pro
babilidade de a hipótese de pesquisa ser verdadeira. Assim, se fixarmos a no nível tradicional
de 5% e encontrarmos um relacionamento significativo, quem seguir essa interpretação afir
mará que existe uma probabilidade de 95% de a hipótese de pesquisa ser verdadeira. Isso é
falso. De fato, não sabemos qual é a probabilidade de que a hipótese de pesquisa seja verda
deira; nossa probabilidade a é condicionada ao fato de a hipótese nula ser verdadeira, e não
tem nada a ver com a falsidade ou veracidade da hipótese de pesquisa.
Importa relembrar que a explicação sobre relacionamentos entre variáveis também se
aplica à procura por diferenças entre grupos. Assim, o valor p é a probabilidade de se en
contrar diferença entre dois grupos se a hipótese nula é verdadeira (não existe diferença na
população).
Atividade 4.4
Im agine q u e v ocê condu ziu d ois estu d o s sep arad os e en con trou um relacion am ento entre
o ta m a n h o da cabeça e o Ql no estu d o 1 e o ta m a n h o da cab eça e o ta m a n h o d o sa p a to no
e stu d o 2. A probabilidade d e se observar um a relação, por acaso, no estu d o 1 foi calculada
c o m o se n d o 0 ,0 4 , en q u a n to no estu d o 2 esta probabilidade é d e 0 ,0 0 1 . Qual d estes dois re
su ltad os é mais im portante p sicologicam en te?
es Testes estatísticos
Imagine que você está investigando a relação entre o número de horas de estudo e o
desempenho em uma prova. Suponha agora que, quando realizou o estudo, encontrou um
padrão de valores semelhante ao apresentado na Figura 4.3. Como você calcularia a pro
babilidade de que tal relacionamento se devesse ao erro amostrai se a hipótese nula fosse
verdadeira? Aqui precisamos utilizar testes estatísticos inferenciais, tais como o coeficiente
de correlação momento-produto de Pearson (veja Capítulo 5). Se você conduzisse um estudo
para examinar a diferença entre duas condições de uma variável independente, usaria um
teste como o teste-t, a fim de calcular a estatística teste, e a probabilidade seria obtida através
da distribuição t (Student).* No decorrer desta seção esperamos promover um entendimento
conceituai do que os lestes fazem de fato.
Quando olhamos para o relacionamento entre duas variáveis (p. ex. horas de estudo e
resultado em uma prova), somos capazes de calcular uma medida do tamanho ou força do rela-
cio n a m en to (isso será abordado co m m ais d etalh es no p róxim o cap ítu lo). Urna v e z que se tenha
urna m edida da força de um r elacion am en to, p recisa m o s encontrar a p robab ilidad e de encontrar
tal r e la cio n a m e n to u n ica m e n te d e v id o ao erro am ostrai. Para ca lcu la r e ssa p rob ab ilid ad e, fa
z e m o s u so das d istr ib u iç õ es de probab ilidad e introduzidas no C a p ítu lo 3 (p. e x ., veja a págin a
11 1 ). F oi dito anteriorm en te q u e a probab ilidad e de se obter qualquer valor de um a distribu ição
é c o n h e c id a - por e x e m p lo , a probab ilidad e de se obter um valor z d e 1,80 ou m aior é so m en te
3,8% . S e pu d erm os con verter a in fo r m a çã o que te m o s sob re a in ten sid ad e do rela cio n a m en to
e m um valor de distrib u ição de prob ab ilid ad e, p od erem os determ inar a probab ilidad e de que tal
valor seja ob tid o por acaso. Isso indicará a p rob ab ilid ad e de se obter o rela cio n a m en to o b serv a
do e m n o s so estu d o d e v id o ao erro am ostrai (por a c a so ), se não existir, d e fato, relacion am en to
na pop ulação. Is so é b asicam en te um teste de h ip ó te se s (sig n ificâ n cia ). A transform ação d os da
d os de n o ssa am ostra em valores de distrib u ição de probab ilidad e p erm ite determ inar qual é a
probab ilidad e de que e ste s d ad os tenham sid o o b tid os inteiram en te por acaso. P o d e m o s utilizar
e ssa probab ilidad e para d ecid ir qual das h ip ó te se s, se a nula ou a ex p erim en tal, é a e sc o lh a m ais
razoável. D e v e -s e en fatizar que as p rob ab ilid ad es c a lc u la d a s se b a seia m na h ip ó te se de que as
n o ssa s am ostras sã o se le c io n a d a s aleatoriam en te da p op u lação.
A F ig u ra 4 .5 m ostra a d istr ib u iç ã o norm al pad rão e ilu stra q u e a p r o b a b ilid a d e d e se
o b ter um v alor n o s e x tr e m o s (c a u d a s) da d istr ib u iç ã o é m u ito p eq u en a . V o c ê d e v e lem b rar
q u e, q u a n d o u tiliz a m o s d istr ib u iç õ e s c o n tín u a s, a área so b a curva rep resen ta a p rob ab ilid ad e.
Q u an to m aior a área a c im a de um va lo r p o s itiv o , m aior será a p r o b a b ilid a d e d e se ob terem
v a lo r e s ig u a is ou su p e rio r es a e le . D e form a se m e lh a n te , q u an to m a io r a área a b a ix o d e um
v a lo r n e g a tiv o , m a io r será a p r o b a b ilid a d e de se o b terem v a lo re s ig u a is ou in fe rio re s a e le.
A s sim , u m a v e z c o n v e r tid o o grau d e r e la c io n a m e n to entre d u as v a r iá v e is e m um va lo r de
d istrib u içã o de p ro b a b ilid a d e, p o d e m o s d eterm inar a p ro b a b ilid a d e de ob ter e ste valor ou um
m aior (ou m en or) por a c a so . S e o s v a lo re s e stã o tanto e m um a ou outra d as r e g iõ e s in d ic a d a s
na F igu ra 4 .5 , p o d e m o s c o n c lu ir q u e tal r e la c io n a m e n to é im p r o v á v el de ter o c o r r id o por
a c a so - isto é , não p od eria ser resu lta d o d o erro am ostrai.
D ia g ra m a d o s va lo re s e xtre m o s em u m a d istrib u iç ã o .
Estatística sem M atem ática para Psicologia 1 57
Suponha que tenhamos conduzido uma pesquisa e constatado que. considerando a hipó
tese nula verdadeira, a probabilidade de se encontrar o efeito observado é pequena - como
representado na Figura 4.3. Nesse caso, teríamos confiança de que podemos rejeitar a hipó
tese nula. Suponhamos agora que, na verdade, não exista tal efeito na população e tenhamos
encontrado em um efeito ocorrido apenas por acaso. Cometeremos, obviamente, um erro se
concluirmos que há suporte para nossa predição. Os estatísticos diriam que, se rejeitássemos
a hipótese nula, neste caso, cometeríamos um erro do Tipo I.
Se a significância do teste (a) é 5%, temos uma chance de 1 em 20 de cometer o erro
do Tipo I. Isso ocorre porque o valor a é a probabilidade de se rejeitar a hipótese nula, se
verdadeira. É a probabilidade de se obter um efeito como resultado somente erro amostrai
se a hipótese nula é verdadeira. Argumentamos que, se isso é pequeno o suficiente, então
é improvável que a hipótese nula seja verdadeira. Todavia, como o caso acima ilustra, po
demos estar errados; podemos cometer o erro do Tipo I. Dessa forma, o valor p representa
também a probabilidade de se cometer o erro do Tipo l. Se o valor p for igual a 5%, isso
quer dizer que a probabilidade de se cometer o erro do Tipo I é igual a esse valor caso a
hipótese nula seja rejeitada. Embora a probabilidade seja pequena, é possível que o even
to venha a ocorrer. Podemos relacionar isso à loteria nacional. Existe somente 1 em 14
milhões de possibilidades de você ganhar a loteria se comprar um único bilhete. Mesmo
que a probabilidade de ganho seja minúscula, ainda existe, e é por isso que as pessoas
continuam apostando. Então fique atento: mesmo se encontrar um valor p de 0,001%,
existe ainda uma probabilidade muito pequena de você cometer um erro do Tipo I, caso a
hipótese nula seja rejeitada.
* N. de T. É semeJhanie à mega-sena, só que o loral de números é 49 em vez de 60, assim como o número de combinações possíveis
é 13 983 816 em vez dos 50 063 860 da mega-sena.
158 Christine P. Dancey & John Reidy
4.8.1 Replicação
S u p o n h a q u e v o c ê r e a liz e um e stu d o e o b se r v e um r ela c io n a m e n to c o m p ro b a b ilid a d e de
o c o rr ên cia a ss o c ia d a à v e ra c id a d e d a h ip ó te se nula de 0 ,0 1 (ou 1 % ). C o m b o a d o s e d e razão,
v o c ê ficaria f e liz em rejeitar a h ip ó te se nula e d izer que e n c o n tr o u su p o rte para a h ip ó te se de
p esq u isa . O q u ão c o n fia n te v o c ê p o d e esta r de qu e e x ista um a r ela çã o g en u ín a na p o p u la ç ã o ?
A resp o sta para e s s a q u e stã o é d ifíc il e , em a lg u n s a sp e c to s, d e p e n d e d o c o n te x to da p esq u isa
realizad a. S e o seu e stu d o fo i o p rim eiro n e ste a ssu n to , e' se n sa to q u e v o c ê trate o s r esu lta d o s
c o m certo grau d e ca u tela . L e m b r e-se : v o c ê está lid a n d o c o m p r o b a b ilid a d es, n ã o c o m cer
te za s. M e s m o q u e o s r esu lta d o s ten h am b a ix a p ro b a b ilid a d e de o c o rr ên cia se a h ip ó te se nula
fo r verd ad eira, e s s a p r o b a b ilid a d e ain d a e x is te . Q u a n d o retira m o s a m o str a s d e p o p u la ç õ e s ,
c a d a u m a é um p o u c o d ife r e n te , e a d ife r e n ç a entre e la s resu lta n o erro am ostrai (tratam os
d is s o a n te r io r m en te no C a p ítu lo 2 ). P o d e ser que v o c ê ten h a sid o azarad o e o pad rão q u e só
a c o n te c e u m a v e z e m 100, d e v id o ao erro a m o stra i, ten h a ju sta m e n te o c o rrid o . V ocê estaria
errado, n e ste c a s o , em rejeitar a h ip ó te se nu la. C o m o d e v e m o s p r o c e d e r n e sta situ a ç ã o ? O
q u e v o c ê d e v e fa z er é r ep lic a r o s r esu lta d o s, r e a liz a n d o ou tro estu d o . S e en con trar o m e sm o
padrão c o m u m a p ro b a b ilid a d e a p r o x im a d a d e o b tê -lo c a so a h ip ó te se nu la seja verd ad eira,
v o c ê p od erá c o n fia r m a is n os r esu lta d o s o b tid o s. A r e p lic a ç ã o é um a d as pedras a n g u la re s da
c iê n c ia . S e v o c ê o b ser v a um fe n ô m e n o u m a v e z , e n tã o p o d e ter sid o por a c a so ; se o o b ser v a
d u as, três ou m ais v e z e s , p o d e estar certo d e q u e é um resu lta d o a u tê n tic o .
S u p o n h a q u e p r e te n d a m o s a v e r ig u a r se e x is t e r e la c io n a m e n to e n tr e a q u a n tid a d e de
á lc o o l c o n s u m id o e a c o o r d e n a ç ã o d e u m a p e s s o a . U m e s tu d o é r e a liz a d o , e v e r if ic a -s e
q u e e x is t e u m a g ra n d e p r o b a b ilid a d e , d ig a m o s 0 ,8 (8 0 % ), d e q u e a r e la ç ã o o b s e r v a d a na
am ostra ten h a o c o r r id o p or a c a so . V o c ê c o n c lu ir á , p o rta n to , q u e n ão e x is te r e la c io n a m e n to
en tre q u a n tid a d e in g e rid a d e á lc o o l e c o o r d e n a ç ã o . E ss a será u m a c o n c lu s ã o correta? O b
v ia m e n te é u m a c o n c lu s ã o in c o rr eta , p o is to d a s as e v id ê n c ia s ap o n ta m o co n trá rio . E sse é
o m o tiv o da e x is tê n c ia d e le is q u e p r o íb e m de d irig ir a p ó s beber. N e s s e c a s o , p o d e m o s ter
c o m e tid o u m erro d o T ip o II, isto é, r e je ita m o s a h ip ó te s e d e p e s q u is a q u a n d o e la é d e fato
v erd ad eira.
O s m e sm o s tip os de erros p o d e m ocorrer q u an d o se in v e stig a m d ife re n ç a s entre gru p os.
S u p o n h a q u e v o c ê e ste ja c o n d u z in d o um e stu d o para v erifica r s e a lg u é m p od e percorrer 100
m etro s n a d a n d o em um a p is c in a m a is ráp id o d o q u e c o rr en d o e m u m a pista d e a tle tism o .
U m a v e z a n a lisa d o s o s d a d o s, v o c ê v e rific a q u e e x is te um a grande p ro b a b ilid a d e, se a h ip ó
te se nula for verd ad eira, d e q u e a d ife r e n ç a o b tid a tenha resu lta d o de erro am ostrai. D e s s a
fo rm a , v o c ê c o n c lu i q u e n ã o e x is te d ife r e n ç a entre o s te m p o s g a sto s para c o m p leta r o s 100
m etros na terra ou na água para a p o p u la ç ã o e m geral. V ocê c o m ete u cla ra m en te, n e ste c a so ,
um erro do T ip o II.
N a s n o ssa s p e sq u isa s, e m virtu de de nu nca esta rm o s 100% c er to s d e qu e p o d e m o s r ejei
tar a h ip ó te se nu la, ou 100% c erto s de q u e p o d e m o s a c e itá -la , te m o s sem p re a p ro b a b ilid a d e
d e c o m e te r a lg u m tip o d e erro. E s s e s erros sã o d o T ip o I ou II. V ocê d e v e lem brar qu e a pro
b ab ilid ad e de se c o m e te r e m erros d o T ip o I é rep resen tad a por a (alfa ). A p ro b a b ilid a d e de se
c o m e te r e m erros d o T ip o II é rep resen tad a por p (b eta).
S e v o c ê se en con trar na situ a ç ã o d escrita, na qu al se c o m e te u u m erro do T ip o II, c o n v é m
se perguntar por q u e, se e x is te u m a d ife r e n ç a real de r e la c io n a m e n to na p o p u la ç ã o , o seu
e stu d o fa lh o u na su a d e te c ç ã o . E x iste m v á rio s m o tiv o s para a o c o rrên cia d e ss e tipo de p r o b le
ma. N o p rim eiro d e le s , por puro a c a so , v o c ê p o d e ter se le c io n a d o p e ss o a s que p o s su e m um a
gra n d e to ler â n c ia ao á lc o o l (o u p e s s o a s q u e r ea lm en te sã o tão rápidas na p isc in a q u an to na
pista). M a is p r o v a v e lm e n te , no en ta n to , v o c ê fe z um e stu d o m al-p ro jeta d o , ou o s ta m an h os
am ostrais foram m u ito p e q u en o s. E s s e s fa to res afetam a c a p a c id a d e da p e sq u isa em detectar
d ife re n ç a s reais na p o p u la ç ã o . A h a b ilid a d e de um e stu d o rejeitar a h ip ó te se nu la q u an d o for,
de fato, fa lsa é d e n o m in a d o poder d o e stu d o , e su a p rob ab ilid ad e é dada por I - |3. T ratarem os
m u ito m ais d o pod er n o C a p ítu lo 7.
Atividade 4.5
Quais das seg u in tes situ ações representam um erro d o Tipo I e quais um erro d o Tipo II?
Você pode estar se perguntando por que há um ponto de corte a de 0,05. Quem deter
minou que 0,05 é um valor de corte mais apropriado para rejeitar a hipótese nula do que
um de 0,20 ou de 0,001 ? Embora seja um valor arbitrario, não existe uma razão específica
para adotá-lo. Vamos dar uma olhada nas situações em que estabelecemos a como 0,20
e 0,001, respectivamente. Se definirmos a como 0,20, significa que vamos tolerar um
erro do Tipo I de 1 a cada 5. Isso é um critério de significáncia bastante liberal, pois, em
urna vez a cada cinco, podemos rejeitar a hipótese nula quando, de fato, ela é verdadei
ra. Pelo lado positivo, teremos uma probabilidade bem menor de cometermos o erro do
Tipo II. Isto é, teremos uma menor probabilidade de aceitarmos uma hipótese nula falsa.
Com tal critério liberal de significáncia, geralmente vamos rejeitar a hipótese nula mais
freqüentemente, e, dessa forma, é mais provável rejeitá-la quando for falsa (bem como é
mais provável, também, rejeitá-la quando for verdadeira). Isso significa uma probabilidade
menor de erro do Tipo II.
Muito bem, que tal agora estabelecer o nosso valor a em 0,001? Aqui temos uma pro
babilidade bem menor de cometermos o erro do Tipo I. Teremos uma possibilidade em mil
de rejeitarmos a hipótese nula quando for verdadeira. Esse é um critério de significancia
bastante conservador. Sob essa ótica, isso parece ser algo bom. Não queremos rejeitar incor
retamente a hipótese nula, e, então, por que não sermos bastante conservadores no nível de
significáncia? O problema é que, embora reduzamos a probabilidade de cometermos o erro
do Tipo I, também aumentamos a probabilidade de não rejeitarmos a hipótese nula quando é
falsa. Ampliamos a probabilidade de cometermos o erro do Tipo II. Isso ocorre porque, com
um critério de significáncia tão conservador, existirão poucas possibilidades de rejeitarmos
a hipótese nula. Dessa forma, aumentaremos a probabilidade de não rejeitarmos a hipótese
nula quando falsa.
Quando estabelecermos nosso critério para a significancia, devemos, portanto, fazer uru
balanço entre as possibilidades de cometermos erros dos Tipos I e II. Em muitas situações,
um a de 0,05 fornece o ponto de equilíbrio. Você deve notar que, algumas vezes, existem
outras considerações que determinam o nível em que a significancia deve ser estabelecida.
Se vamos testar um remédio novo, por exemplo, devemos ser muito mais conservadores, pois
as conseqüências de cometermos um erro do Tipo I podem ser bastante sérias. As pessoas
podem estar tomando remédios que apresentem efeitos colaterais perigosos ou que possam
não ser efetivos no tratamento. Outra situação na qual podemos estabelecer diferentes níveis
de significáncia é na condução de várias análises sobre o mesmo conjunto de dados. Isso será
abordado com mais detalhes no Capítulo 9.
-3 -2 0 2 3
Cauda inferior Cauda \uperior
Estudo 1 Estudo 2
1 2 I 18
2 4 2 16
3 6 3 14
4 8 4 12
5 10 5 10
6 12 6 8
7 14 7 6
8 16 8 4
9 18 9 2
prevemos que o escore padronizado pertence à cauda direita da distribuição apenas. Isto é,
prevemos a que cauda o escore que calculamos pertence.
Se você faz uma previsão bicaudal, o escore calculado pode pertencer a qualquer uma
das caudas. Suponha agora que convencionamos utilizar o nível de significância de 5% como
nosso ponto de corte para a rejeição da hipótese nula (não recomendamos que você use ta] va
lor: apenas o utilizamos para ilustrar o assunto). Seremos capazes de rejeitar a hipótese nula
somente se existir uma probabilidade de 5% ou menos de obtermos o escore padronizado. A
Figura 4.8 mostra que, em cada cauda, há escores calculados com uma probabilidade de 2,5%
de serem obtidos, isto é, o valor de 5% é dividido entre as duas caudas.
Se fizermos uma previsão unicaudal, então aceitaremos escores em apenas uma das cau
das. Dessa forma, nossa região de 5% de probabilidade está toda em uma única cauda: isto
é. ela não é dividida entre as duas caudas. Isso efetivamente significa que podemos rejeitar a
hipótese nula para um número maior de escores nessa cauda do que no teste bicaudal (veja
Figura 4.9).
A s áre a s c o lo rid a s rep rese n ta m as reg iõ es nas q u a is p o d em o c o rre r esco res de h ip ó tese
9 u n ic a u d a l.
* N. de T. Evidentem ente os autores estão referindo-se às distribuições sim étricas, com o a norm al c a / (Studcnt).
Estatística sem M atem ática para Psicologia 165
Atividade 4.6
Q uais das se g u in tes h ipóteses são u n ila te rais (u n ica u d ais) e q u ais sao b ilaterais (b icau d ais)?
N a s s e ç õ e s a n te r io r es e e m o u tr o s c a p ítu lo s d o liv r o , in tr o d u z im o s o s c o n c e it o s b á s i
c o s da te sta g e m e sta tístic a . N o restan te d o liv r o , e x p lic a r e m o s um grande n ú m ero de te stes
ap rop riad os para o s v á rio s d e lin e a m e n to s p o s s ív e is de u m a p e sq u isa . N o en tan to, e s s e s te stes
req u erem q u e a lg u m a s h ip ó te se s sejam sa tisfe ita s a n tes qu e e le s p o ssa m ser ap rop riad am en te
a p lica d o s a o s d a d o s am ostrais.
M u ita s d as t é c n ic a s e s ta tís tic a s q u e d e s c r e v e m o s n o liv r o r eq u e r e m a s a tis fa ç ã o de
a lg u m a s c o n d iç õ e s p e la s p o p u la ç õ e s das q u ais o s d a d o s sã o retirad os. Em virtu de de as carac
terística s de u m a p o p u la ç ã o serem d e n o m in a d a s de p arâm etros (v e ja C a p ítu lo 2 ), e s s e s te ste s
fr e q ü e n tem e n te sã o d e n o m in a d o s de testes paramétricos. E m virtude d o s r eq u e rim en to s d e s
se s te ste s , p r e c is a m o s a sseg u ra r q u e o s n o s s o s d a d o s tam b ém sa tisfa ç a m certas h ip ó te s e s
an tes qu e p o s s a m o s ap licar tais té c n ic a s e sta tístic a s. E ssa s h ip ó te se s sã o d escrita s nas se ç õ e s
se g u in te s.
E x iste m té c n ic a s e sta tístic a s q u e n ão elab oram h ip ó te se s sob re o c o m p o r ta m e n to da p o
p u la çã o da qual o s d a d o s sã o retirad os, m as e la s n ã o sã o tão u tiliz a d a s q u an to às té c n ic a s
p aram étricas. Por n ão e x ig ir e m qu e a p o p u la ç ã o sa tisfa ç a certas c o n d iç õ e s , sã o m u itas v e z e s
d e n o m in a d a s de testes de distribuição livre. E ss e s te ste s serão ab ord ad os no C a p ítu lo 15.
(a)
Freq üências
(d) 10
Freqüências
N. dc T. Do falo existo um teste para verificar isso. O SPPSPW faz essa verificação autom aticam ente, sem pre que se utili/.ar o teste •
para a diferença entre duas médias.
Estatística sem Matemática para Psicologia 167
—
SPSSPW: conselheiro estatístico (Statistics Coach)
□l
Outra característica útil do SPSSPW é o conselheiro estatístico. Você pode utilizá-lo em
vez da Figura 4.11, para verificar que tipo de análise deveria estar fazendo em seus dados.
Você inicia o conselheiro estatístico por meio do menu Ajuda [Help).
ta View \ Variable V e w / • I ■
SPSS Pioc*MOí « ready
ja SM I Щ К ^ Ц ► И ■ jy M t.f J ll j j ü n l i l l . . rd O JW l I ^ M ,c ,o :c t I- S B W í J T S I s / 11«
Clique no Statistics Coach (Conselheiro Estatístico). Uma vez iniciado, será apresentada
uma tela solicitando o que você quer fazer. Haverá várias opções à disposição, tais como
Summarize (Resumir), Describe or present data (Descrever ou apresentar dados) e Compare
groupsfor significam differences (Comparar grupos para diferenças significativas).
170 C hristine P. Dancey & John Reidy
}p S tatistics C oach ¡U S *1
W h at do yo u w ant to d o ?
S a le s
r Sum m arize, describe, or prese n t data
volum e E ast
Low 49
Medium 42 r Look at variance and distribution of data
Hign 29
Total 120
;-q r C reate CLAP report cubes
No lado esquerdo da tela, são apresentados exemplos de saídas do SPSS. Na parte infe
rior direita da tela, existem vários botões para navegação por meio do conselheiro estatístico.
Uma vez feita a escolha, clique no botão Next (Seguinte). Aparecerão mais algumas opções
relacionadas com o que fazer. Como exemplo, selecionamos a opção Compare groups fo r
significant differences (Comparar grupos para diferenças significativas).
Selecione a
opção
relevante
“ Std Error
Mean Sid Oeviaiion Mean
Sales
Revenue 5371.893 «171.311
Você deve então responder as questões relevantes apresentadas na tela. Após cada con
junto de opções clique no botão Next (Seguinte) para ir à próxima tela. À medida que você
executa as escolhas, pode notar que os exemplos de saída do SPSSPW no painel esquerdo da
tela se alteram para refletir as escolhas feitas.
fp Statistics Coach
Mow m a n y g ro u p s oi v a r ia b le s do yo u w a i l :
e
lo c o m p a ie ?
H ow a r e y o u i d a ta o rg a n iz e d ?
B u sin e ss Products
One continuous, numeric dependent variable
onsum er Products divided into two unrelated groups
Haverá uma série dessas telas para cada lipo de análise que você pode querer fazer. Vá
respondendo as questões e clicando no botão Next (Seguinte) até que apareça uma tela com o
botão Finish (Final) em vez do botão Next (Seguinte).
172 C hristine P. Dancey & John Reidy
Sid Std Error ", T est that a ssu m e s data a re normally distnbuted
Division Mean Deviation Mean within groups
Consum er
$309.112 $89.537 $6.692
Products Test thai d oes not a ssu m e data are normally
B usiness distributed
$425.152 $203.366 514,000
Products
Uma vez feita sua última seleção, clique no botão Finish (Final). O SPSSPW sairá do
conselheiro estatístico e retornará para a janela de dados (Data screen). Você notará que o
programa selecionou o teste relevante a partir dos menus. Haverá uma caixa de diálogos aber
ta para o teste que precisa. Também estará disponível uma janela aberta de ajuda que contém
informações relacionadas a esse teste em particular. Por exemplo, neste caso, aparecerá uma
caixa de diálogos do teste t (veja Capítulo 6). Então, você pode rodar a:, análises relevantes
nos seus dados.
Resumo
Exercício 1
A p r o fe sso r a Y o b e stá in te re ssa d a na v io lê n c ia dc m a ssa durante as partidas de fu te b o l.
E la p en sa qu e a v io lê n c ia do gru p o é resu lta d o d o s a ss e n to s d e sc o n fo r tá v e is do e stá d io . Por
isso , Yob m o d ific a d o is e stá d io s d ife r e n te s na Inglaterra. Em um e stá d io c o lo c a a ss e n to s b em
ap ertad os e d e sc o n fo r tá v e is. N o outro, in sta la a sse n to s c o n fo r tá v e is, c o m m u ito e sp a ç o para
as p ern as e e n tre o s a ss e n to s a d ja c e n tes. A p r o fe sso r a o r g a n iz a u m a c o m p e tiç ã o , de m o d o
q u e um c lu b e jo g u e m etad e das partidas e m u m e stá d io e a outra m eta d e no outro e stá d io . Ela
a co m p a n h a um gru p o de d o z e fãs a d o le s c e n te s a g r e s s iv o s e g r o sse ir o s d o c lu b e e registra o
n ú m ero d e v e z e s q u e cad a um é p reso o u e x p u ls o d o e stá d io . P revê q u e o nú m ero de p r isõ e s
e e x p u ls õ e s será m aior no e stá d io q u e a p resen ta o s a ss e n to s m a is d e sc o n fo r tá v e is e ob tém o s
d a d o s da T ab ela 4 .2 .
174 C hristine P. Dancey & John Reidy
I 8 3
5 2
3 4 4
4 6 6
5 4 2
6 8 1
7 9 6
8 10 3
9 7 4
10 8 1
11 6 4
12 7 3
Exercício 2
' N. de T. Na língua inglesa, isso faz sentido, pois o exem plo dado [lo holdly go where no man has gane before ) seria uni infinitivo
dividido, isto é. o advérbio está entre o lo e o verbo go. Já em to go holdly where no num has gone before o advérbio está depois do
verbo. Esse tipo de construção não existe na língua portuguesa.
Estatística sem Matematica para Psicologia 175
Tabela 4.3 Número de infinitivos divididos utilizados por pesquisadores antes e depois da serie
Jornada nas Estrelas
1
2
3
4
5
6
7
8
9
10
11
12
15. Unia pesquisadora conduziu um estudo sobre tem (c) É mais tácil se obterem resultados significati
pos de reação com 20 participantes em cada uma vos com esse a
das duas condições. Ela constatou que a variân (d) Alternativas (a) e (b)
cia da primeira condição é de 2 segundos, e a da
18. Quando convertemos nossos dados em um valor
segunda, de 14 segundos. Qual das seguintes afir
de uma distribuição de probabilidade, como é de
mações é verdadeira?
nominado o resultado obtido?
(a) Ela não deve utilizar um teste paramétrico
(a) Significativo
porque a condição da homogeneidade das va
(b) Não-significativo
riâncias não está satisfeita
(c) Estatística teste
(b) Ela satisfez todos os requisitos para o uso de
(d) Poder do estudo
um teste paramétrico
(c) Ela não tem homogeneidade de variâncias, 19. Imagine que conduzimos dois estudos. No estudo A.
mas ainda assim pode utilizar um teste pa temos 1000 participantes e obtemos um valor p de
ramétrico, pois possui amostras do mesmo 0,01, enquanto no estudo B temos apenas 20 partici
tamanho pantes e um valor p de 0,05. Em qual desses estudos
íd) Nenhuma das alternativas existe o maior efeito?
(a) Estudo A
¡6. Como representamos o poder de um teste?
(b) Estudo B
(a) a te) O efeito é o mesmo nos dois estudos
(b) p (d) Não podemos responder a questão com base
(c) I - a nas informações dadas
id) l - p
20. Se você constata em um estudo que o valor p e
Porque normalmente utilizamos uma significância 0,05, qual é a probabilidade de que a hipótese al
de 0.05? ternativa seja verdadeira?
(a) É um nível tradicional utilizado pela maioria (a) 0,05
dos psicólogos (b) I menos 0,05
(b) Esse valor representa um bom balanceamento (c) Não podemos determinar a probabilidade de
entre a possibilidade de se cometerem erros que a hipótese alternativa seja verdadeira
dos Tipos I e II (d) Nenhuma das alternativas
Referências
BAKER, R. et a). Emotional processing and panic. Behaviour Research and Therapy v. 42, n. 11. p.
1271-87, November 2004.
CLARK-CARTER, D. Effect size: the missing piece o f the jigsaw. The Psychologist, v. 16, p. 636-38.
2003.
DRACUP, C. Hypothesis testing - what it really is. The Psychologist, v. 8, p. 359-62, 1995.
HOWELL, D. C. Statistical Methods for Psychology. 5“ ed. W adsworth, 2002,
LOFTUS, G. R. On the tyranny of hypothesis testing in the social sciences. Contemporary
Psychology, v. 36, n. 2, p. 102-05. 1991.
LOFTUS, G. R. Psychology will be a much better science when we change the way we analyze data.
Current Directions in Psychological Science, v. 5, p. 161-71, 1996.
MOGG. K., MATHEWS, A., WEINMAN, J. M emory bias in clinical anxiety. Journal o f Abnormal
Psychology, v. 96, p. 94-8, 1987.
PARKINSON, B. Anger on and off the road. British Journal o f Psychology, v. 92. p. 507-26, 2001.
REIDY, J., RICHARDS, A. A memory bias for threat in high-trait anxiety. Personality and Individual
Differences, v. 23, p. 653-63, 1997.
RICHARDS, A., FRENCH, C. C. Effects of encoding and anxiety on implicit and explicit memory
performance. Personality and Individual Differences, v. 12. p. 131-09. 1991.
WALSH, J. J., UGUMBA-AGW UNOBI, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences, v. 33. p
239-51,2002.
Análise de Correlação:
5 o rde Pearson
Panorama do capítulo
que co-variam: quando os valores em uma variável mudam, valores na outra variável também
mudam, de maneira previsível. Em outras palavras, as duas variáveis não são independentes.
Negativo
Valores altos em uma variável são associados com valores baixos na outra variável.
Zero
Relacionamentos zero são aqueles nos quais não existe um relacionamento linear (linha
reta) entre as duas variáveis (o que queremos dizer com o termo relacionamento linear” será
explicado mais tarde. Agora, vamos supor que a ausência de um relacionamento linear signi
fica a ausência de relacionamento entre as duas variáveis).
Agora pense na direção dos relacionamentos dos exemplos mencionados.
Já se mencionou que, em relacionamentos positivos, valores altos numa variável são as
sociados a valores altos na outra, e vice-versa. Podemos observar esse relacionamento ao
plotarmos os valores em um gráfico chamado diagrama de dispersão (scattcrplot). Quando
executamos uma correlação bivariada, temos dois conjuntos de valores (escores). Quando
plotamos os valores em um diagrama de dispersão, designamos uma variável ao eixo horizon
tal - esse é chamado de x. Designamos a outra variável ao eixo vertical - chamado de v. Não
importa qual variável designamos ao x e qual ao y.
Para construir um diagrama de dispersão, tomamos o valor de cada pessoa nos eixos x e
y e os plotamos para onde os dois se encontram. Cada ponto representa dois valores (.* e v).
Você foi apresentado à construção de diagramas de dispersão (usando o SPSSPW) na Seção
5 do Capítulo 2, mas aqui vamos considerar mais detalhes.
Estatística sem M atem ática para Psicologia 181
que o relacionamento é positivo: quando você envelhece, sua irmã também envelhece. O re
lacionamento também deve ser perfeito: para cada ano que você envelhece, sua irmã também
envelhece um ano.
E importante entender que o exemplo mostra que você não pode inferir causalidade quan
do executa a correlação. O aumento da sua idade não causa o aumento da idade de sua irma,
nem o envelhecimento dela. causa o seu!
Valor d e x = 12,
Valor de y = 16
(dois valores, mas
somente um ponto)
o
x>
Q uan do você
tinha 12 anos, sua
irmã tinha 16
Sua idade
140 -i
130 -
120
O
110
100 -
90 ■
10 20 30 40 50
Notas na prova
------
Atividade 5.1
10-1
2 -
0 I I I I I |-------1-------1-------1------- r~
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Dinheiro (R$)
Imagine uma máquina de vendas de chocolate, no qual cada barra de chocolate custa
50 centavos de libra. No início do dia, um representante coloca dez barras de chocolate na
máquina. Levando em consideração que ela funciona como deveria (quer dizer, nenhum cho
colate fica preso, a máquina aceita o dinheiro, devolve o troco correto, etc.: bem. talvez seja
pouco realista, mas vamos acreditar), cuda vez que alguém coloca 50 centavos de libra, a
barra de chocolate é ejetada, e uma a menos fica na máquina.
Como se pode ver, com um relacionamento linear negativo perfeito, os pontos ainda for
mam uma linha reta, mas dessa vez vão do canto superior esquerdo ao canto inferior direito.
40 -|
-C
J.
fU
XJ”
c
<D
£ 20-
Q_
Nível de excitaçao
14 -
12 -
10 -
y 8-
6 -
4 -
2
0 10 12
Atividade 5.2
60 000 -|
50 000 -
-T
O 40 000 -
=3
o 30 000 -
^ 20 000 -
10 000 -
0 i i i i
0 10 000 20 000 30 000 40 000
Salário inicial
Q ual é a c o n c lu sã o m ais se n sa ta ?
A c o rre la ç ã o e n tre sa lá rio inicial e sa lá rio atu al é:
(a) N egativa
(b ) Positiva
(c) Zero
Perfeito +1 -1
.-0,9 - 0,9
+0,7 0,7
+0,6 -0 ,6
M oderado +0,5 -0 ,5
+0,4 -0 ,4
■:0,3 -0,3
Fraco +0,2 - 0 ,2
+0,1 -0,1
Zero 0
Atividade 5.3
2 0 -i
10 ■
10 20 30 40 50 60 70
Idade
10
30 40 50 60 70 80 90
Necessidade de cognição
Existe uma variação entre o quanto as pessoas gostam de raciocinar e resolver problemas.
Psicólogos criaram uma escala para medir esse constructo, que é chamado de necessidade de
cognição (Cacioppo e Petty. 1982). As pessoas que gostam de resolver problemas terão uma
necessidade de cognição mais alta do que aquelas que não gostam. Além do mais. algumas pes
soas evitam atividades de resolução de problemas, demonstrando um impedimento cognitivo.
A correlação entre necessidade de cognição e impedimento cognitivo em uma amostra de
estudantes demonstra que existe uma associação negativa fraca entre ambos (ver Figura 5.9).
Se a correlação é zero, os pontos podem parecer aleatórios, e não existe um padrão dis-
cernível. Portanto, não há um relacionamento entre x e y.
A Figura 5.10 mostra que não existe uma associação entre reavaliação positiva e neces
sidade de cognição.
Dados correlacionando (n = 11, r - +0,68) faltar a escola e ser caçoado por outros são
apresentados na Figura 5.11. Existe um relacionamento positivo moderado entre faltar a es
cola e ser caçoado.
Existe uma associação positiva forte entre ser caçoado e sentir-se diferente dos outro"-
(/? — 11; r - +0,85) (ver Figura 5.12).
188 Christine P. Dancey & John Reidy
10 -
o-
12 -i
11 -
10 -
ro
O 9 -
u
Q)
rc. 8 -
m
fU /-
6-
5-
------------ f rN
Kj-
Ser oacoado
Figura 5.11 C o rrelação e n tre ser caço ad o por o u tro s e fa lta r a escola (n = 1 1 ; r = + 0 ,8 5 ),
10 -
a;
c
<u
JD 8 -
t5
a>
<v
IS )
4 -
10 12
Caço ado
Atividade 5.4
(a) 8 0 -|
70 -
60 -
O 50-
ro
f 40 '
LU
30 -
20 -
(b) 60
50 -
40
30
20 -
B n-MS ( Irritable Bou el Symiróme - Misconcepiion Scale). Escala de concepções errôneas sobre a síndrom e do intestino irritável.
190 C hristine P. Dancey & John Reidy
Pense nessa questão. Ir a igreja faz com que você não fique grávida?
Cerca de 118.000 adolescentes engravidam p o r ano. e metade de todos os pais solteiros tem
menos que 25 anos. O Reino Unido tem a taxa de divórcio mais alta da Europa e o m aior número
de adolescentes grávidas, embora a taxa de g r a v i d e na adolescência em outros países esteja
crescendo rapidamente. O único motivo detectado peta estatística está relacionado à igreja. A
freqüência com que as pessoas vão à igreja começou a diminuir no Reino Unido antes dos outros
países. Em todo os lugares onde a freqüência ci igreja diminui, aumenta a quantidade de divórcios
e pais solteims. (Polly Toynb.ee. Radio Time. 20-26 de março de 1993)
Escore da
Sharm ini
120
100
80 -
60
40
20 -
10 20 30
Teste 1
R e la c io n a m e n to lin e a r p e rfeito .
Figura 5.13
Imagine que essa figura representa o relacionamento perfeito entre os escores em dois
testes. Teste 1 e Teste 2. O fato de essa ser uma correlação perfeita significa que a posição
relativa dos participantes é exatamente a mesma para cada teste. Quer dizer, se Sharmini tem
o melhor escore no Teste 1 (no exemplo acima é 23), também terá o melhor escore no Teste
2 (130). O contrário também é verdade: o participante com o menor escore no Teste 1 terá o
menor escore no Teste 2.
Como dito anteriormente, relacionamentos perfeitos são raros, mas o mesmo raciocínio
se aplica aos relacionamentos imperfeitos. Para calcular o coeficiente de correlação, é neces
sário relacionar a posição relativa de cada participante em uma variável à sua posição relativa
na segunda variável.
Estatística sem M atem ática para Psicologia 191
Vamos imaginar que fizemos uma análise correlacionai entre o número de sorvetes
de casquinha comprados em uma camionete estacionada cm frente a sua universidade e a
temperatura. Perguntamos ao vendedor, chamado Vendemuito, quantas casquinhas foram
vendidas em cada dia. Coletamos os dados durante um período de 20 dias. Agora precisa
mos saber se o número de sorvetes vendidos varia com a temperatura. Prevemos que, de
acordo com leitura prévia, a venda de sorvete aumentaria com o aumento da temperatura.
Essa é uma hipótese unilateral. Os dados são apresentados na Tabela 5.1.
Agora fica fácil ver como plotar um diagrama de dispersão à mão, embora possa ser
tedioso quando temos muitos escores. Naturalmente, o SPSSPW faz esse trabalho melhor
do que nós! Instruções de como obter diagramas de dispersão foram dadas na página 82
do Capítulo 2.
Podemos ver no diagrama da Figura 5.14 que a temperatura e o número de sorvetes de
casquinha vendidos estão relacionados. Obviamente, não é uma correlação perleita, mas
basta olhar os dados para vermos uma correlação posjtiva.
T a b e la 5.1 Dados dos números de sorvetes de casquinha vendidos em dias com d iferente.
temperaturas
1000 26 550 14
950 600 19
870 700 21
890 20 750 22
886 19 800 22
900 21 850 24
560 17 950 22
550 16 1050 26
400 12 1000 26
500 13 J000 26
1100 -1
1000 -
O) 900 -
a;
> 800 -
o
a > 700 -
o
03
T5 600 -
c
> 500 -
400 -
300 -
10 12 14 16 18 20 22 24 26 28
Temperatura
üfeí-lHxia
Fte i<3t View D Iiflntlvm Arvtfr* üuptv. UMoes HeC
:[ü n rss r
SPSS Pkw** m» n
Mude ambas as variáveis do lado esquerdo para o lado direito. Tenha certeza de que as
opções Pearson e One-tailrd (unicaudal) foram selecionadas. Depois, clique em UK. Serão
obtidos os resultados.
Observemos a saída do SPS3PW. Os resultados importantes para os seus relatórios são
os seguintes:
■ O coeficiente de correlação (r) mostra o grau em que nossas variáveis se relacionam
umas com as outras e cm qual direção.
■ O nível de probabilidade associada fornece a probabilidade de nosso coeficiente de
correlação se dar por erro amostrai, desde que a hipótese nula seja considerada ver
dadeira.
Os resultados são apresentados em forma de uma matriz. A matriz é simplesmente um
conjunto de números disposta em fileiras e colunas. A matriz de correlação e um exemplo de
uma matriz quadrada simétrica. Você deve notar que cada variável está em perfeita correlação
com ela mesma (ou então algo está errado). Além disso, você deve notar que os resultados
aparecem duas vezes: cada metade da matriz c uma imagem dela mesma. Isso quer dizer que
você tem de olhar somente uma metade (na diagonal). O SPSSPW também fornece o número
de pares para cada variável. Você pode ver na saída a seguir que o ponto no qual a variável
“SORVETE” encontra a variável “TEMPERATURA” fornece as informações que precisa
mos. A primeira linha nos fornece o coeficiente de correlação - o padrão é fornecer esse
coeficiente correto até dois decimais. O nível de significância adquirido é dado na segunda
linha, e a terceira confirma quantos pares temos na análise. Lembre que, quando o SPSSPW
mostra uma fileira de zeros, mude o último zero para 1 e use o sinal < (p. ex. p < 0,001, n =
20). Observe que nosso coeficiente de correlação é positivo: quando a temperatura aumenta,
aumenta também a venda de sorvetes.
Pearson Correlation
Ice cream (sorvete) 1 .0 0 0 ' .8931
(Correlação de Pearson)
Sig. (2-tailed)
f .0 0 0
(Sig. Bilateral)
N 20
20
Pearson Correlation
.8931 1.000
(Correlação de Pearson)
N 20
________ .
Sig. = Significância
Esse é o nível d e sig nificância ating ido. Lem bre-se de, qu an d o o SPSSPW fornecer uma
fileira de zero s, m udar o últim o zero para "1 "e usar o sinal < (p. ex., p < 0,0 0 1)
Esses resultados indicam que as vendas de sorvete têm um forte relacionamento positivo
com a temperatura. Podemos relatar a análise da seguinte forma:
O relacionamento entre vendas de sorvete e temperatura ambiente é positivo e forte (/■= +0,89, p
< 0.001). Portanto, quando a temperatura auinema, aumenta também a venda de sorvetes.
194 C hristine P. Dancey & John Reidy
Isso é tudo o que podemos explicar no momento, mas você verá, à medida que o capítulo
avançar, que há mais a ensinar sobre esse assunto.
Atividade 5.5
V eja a se g u in te saíd a do SP SS P W :
Correlations (Correlações)
Sig. = Significância
Lembre que correlações negativas ao quadrado fornecem uma resposta positiva. Por exemplo.
-0,4 ao quadrado (-0,4 x -0,4) = 0,16. Portanto, 16% da variância foi explicada pela correlação
de - 0,4, da mesma maneira que seria se a correlação fosse +0.4. Se você tem uma correlação de
0,9, explicou 81% da variância. Um diagrama de Venn deixará isso mais claro. Se duas variáveis
tivessem uma correlação perfeita, não seriam independentes, e os dois círculos parax e v estariam
um em cima do outro, exatamente como se houvessem duas moedas empilhadas:
O
As duas variáveis teriam uma correlação de +1,00, e toda a variância nos escores de uma
variável seria explicada pela variância nos escores da outra variável. Por exemplo, podemos
supor que horas de sol e temperatura têm um escore de correlação de 0,9 (81%).' Os dois
círculos aparecem da seguinte forma:
Atividade 5.6
7 -i
6 -
I
? 5
4 -
3-
2 —i—
2,5 3,0 3,5 4,0 4,5 5,0
SATIG
Os valores
te metade da variância nos escores de altura pode ser explicada pela variância em peso.
Contrariamente, quase metade da variância em peso pode ser explicada em referência à
variância em altura.
E claro que isso também significa que 51% da variância não é explicada, quer dizer,
51% é explicada por outros fatores, como idade, genética ou elementos do ambiente. O
coeficiente de correlação pode sempre ser elevado ao quadrado para se obter a variância
explicada (r ao quadrado). Da mesma maneira, se você sabe o r , pode usar o botão da raiz
quadrada na sua calculadora ¡>ara obter o coeficientc de correlação, o r (embora isso não lhe
diga a direção do relacionamento). Você deve entender, então, que a correlação de 0,4 não
é duas vezes mais forte que a correlação de 0,2. A correlação de 0,4 significa que 16% da
variância foi explicada, enquanto a de 0,2 significa que somente 4% foi explicada. Portanto,
a correlação de 0,4 é, na verdade, quatro vezes mais forte que a correlação de 0,2. Um co
eficiente de correlação é uma boa medida do tamanho do efeito e pode sempre ser elevado
ao quadrado para ver quanto da variância dos escores numa variável pode ser explicada em
referência a outra variável.
198 C hristine P. Dancey & John Reidy
Atividade 5.7
Existe uma correlação (talvez fictícia!) entre a quantidade de sorvete ingerido e o sentimen
to de grande felicidade (+0,85). Quanto da variação nos escores da felicidade pode ser explicado
pela quantidade de sorvete ingerido? Quanto da variação permanece sem explicação?
Atividade 5.8
1,6 -
cü
< 14-
1,0 -
0,8
3,5 4,0 4,5 5,0 5,5 6,0 6,5
AGREEAB
' O tradicional teste de Stroop envolve palavras com significado de cores (vermelho, azul, amarelo, verde) escritas tanto numa cor
congruente (p. ex.. a palavra vermelho escrita em tinta vermelha) como numa cor incongruente (p. ex., a palavra vermelho escrita
em tinta azul). Os participantes geralmente demoram mais para nomear as coros na situação incongruente. A diferença do tempo de
reação entre as duas condições fornece o escore Stroop relatado nesse estudo.
198 C hristine P. Dancey & John Reidy
Atividade 5.7
Existe uma correlação (talvez fictícia!) entre a quantidade de sorvete ingerido e o sentimen
to de grande felicidade (+0,85). Quanto da variação nos escores da felicidade pode ser explicado
pela quantidade de sorvete ingerido? Quanto da variação permanece sem explicação?
Atividade 5.8
1,8 1
1, 6 -
CO
<
LU
1 '4 -
LU
< 1,2 -
\—
1,0 -
O tradicional tesle de Stroop envolve palavras com significado de cores (vermelho, azul, amarelo, verde) escritas tanto numa cor
congruente (p. ex.. a palavra vermelho escrita em tinta vermelha) com o numa cor incongruente (p. ex., a palavra vermelho escrita
em tinta azul). Os participantes geralmente demoram mais para nomear as cores na situação incongruente. A diferença do lempo de
reação entre as duas condições fornece o escore Stroop relatado nesse estudo.
200 C hristine P. Dancey & John Reidy
Tabela 5.3
Correlações
duration of
performance iq illness in
verbal iq (QI de years (duração da depression
(QI verbal) desempenho) doença em anos) stroop (depressão)
verbal iq Pearson Correlation
{QI verbal) (Correlação de Pearsòn) 1 0.615 -0 .1 7 5 -0.227 -0.32 7
N 70 70 70 70 70
performance iq Pearson Correlation
0.615 1 0.043 -0.231 -0 .0 9 4
(QI de desempenho) (Correlação de Pearson)
Sig. (2-tailed) 0.000 0.724 0.055 0.438
(Sig. Bilateral)
N 70 70 70 70 70
N 70 70 70 70 70
Pearson Correlation
stroop -0.22 7 -0.231 0.217 1 0.274
(Correlação de Pearson)
Sig. (2-tailed) 0.059 0.055 0.072 0.022
(Sig. Bilateral)
N 70 70 70 70 70
depression Pearson Correlation
-0.32 7 -0 .0 9 4 0.398 0.274 1
(depressão) (Correlação de Pearson)
Sig. (2-tailed)
(Sig. Bilateral) 0.006 0.438 0.001 0.022
N 70 70 70 70 70
Sig. = Significance
Ql de
desempenho O i.
Duração
da doença
a jL k M ' ' -,
Depressão
Stroop
Para se obter matrizes, abra seu arquivo de dados e selecione Graphs (Gráficos), Scatter
(Dispersão).
U jJ
E» l - P- m
iB â ' . ■
»oc
0900
ecoo 4C0C >er?
«oo
58 00 »43 2>IX
5900 É 48 XS7
;400
U iJü
3000
30 00
9flH '
96 00
“W OT
11400
47 CO
••oo
»00
K00 X 00 11900 :?cc
won
XX
<UQ0
ro o 1C 00
«.IX
C4 0C KCC to; oo :oo 900 xco
. V IXCC
n D tu* Cü
64 00 9" 00
W B u I ÌO S -. ? 1
202 C hristine P. Dancey & John Reidy
1 -JíA 100
1 uu
37 00
4JUU
” 100
LU uu
142 00
w®
t ir o
JU uu
989
u
1654
IU 1J
4X
’•5M
665
9®
1 2;■6* 1 00 54 00 «7 00 1»rr >(T) 9® 19 r *-® •’ 4’
100 45 00
47 (Tl
114 00 ta x 15® '1 89 27 99 e® 16 ®
701 1?1 ITI i l rn -9'/i 7 2f. IP 17 .T !X HI 91
200 53 00 96 00 101 oo 26 OC 568 25 19 19® 1651
30 200 2000 64 00 97® 6® 1037 12 02 10® 105
• T ■¡\Uala Wrw / - . ,p , -/ •
Pr<nrM*jr o >»•}.
Mude as variáveis que você deseja incluir do lado esquerdo da caixa de diálogo para <
lado direito usando o botão ►.Clique em OK.
a ja
fc B « r r'- n -I. n ¡ %
Se você fizer uma análise correlacionai de diversas variáveis, obterá uma saída como a
abaixo, que está no formato de uma matriz correlacionai:
Correlações
m ath em at sco re 1 sco re 1 sco re 1
IQ (Ql) (matemática) (escore 1) (escore 1) (escore 1)
Pearson Correlation
IQ (Qi) (Correlação de Pearson) 1.000 .5741 .0641 .0 1 4 3 .1 4 2 8
Sig. (2-tailed)
.002 .383 .4 7 4 .253
(Sig. Bilateral)
N 24 24 24 24 24
mathemat Pearson Correlation
(matemática) (Correlação de Pearson) .5741 1.000 .0 5 9 8 .0281 .2502
Sig. (2-taíled)
.002 .391 .448 .119
(Sig, Bilateral)
N 24 24 24 24 24
score 1 Pearson Correlation
(escore 1) (Correlação de Pearson) .0641 .0598 1.000 .9952 - .2 1 5 3
Sig. = Significancia
Embora tenhamos correlacionado cinco variáveis umas com as outras, temos somente
dez correlações para analisar. Isso ocorre porque ignoramos as correlações das diagonais:
essas são r - 1,00, e cada variável tem uma correlação perfeita com ela mesma. Além
disso, cada metade é uma imagem da outra; portanto, precisamos observar somente uma
metade. Colocamos a metade de cima em negrito para facilitar a visualização.
A saída mostra o coeficiente de correlação r e a probabilidade de este ocorrer por erro
amostrai, supondo que a hipótese nula seja verdadeira. Também informa o número de pares
de observações.
Nesse exemplo, os escores de matemática têm uma associação positiva com QI (r =
0,57). E uma correlação moderada, mas a associação tem uma probabilidade exata de p =
0,002: existe somente uma pequena chance (0.2%) de que essa correlação tenha ocorrido
por erro amostrai. O número de observações foi de 24.
Se você considerar a primeira fileira de cima da matriz, verá que os escores 1. 2 e
3 têm coeficientes de correlação que são aproximadamente zero. Isso significa que não
existe um relacionamento linear entre as variáveis, e isso é confirmado pelos valores de
probabilidade.
204 C hristine P. Dancey & John Reidy
Observe agora o ponto no qual o escore 1 encontra o escore 2. Você constatará que
existe um relacionamento forte, quase perfeito, entre eles, demonstrando que esses dois
escores devem estar medindo uma habilidade parecida (r = 0,9952). O nível de probabili
dade associado (p < 0,001) mostra que é improvável que esse valor seja resultado apenas do
erro amostrai, supondo que a hipótese nula seja verdadeira. O SPSSPW calcula os valores
p até um certo número de decimais após a vírgula (o usuário pode mudar esses parâmetros
para que os valores sejam apresentados com quatro decimais como acima (r = 0,9952) ou
com três decimais (r = 0,995) ou qualquer outro valor. O mesmo funciona com valores p.
(Lembre-se de que, quando o SPSSPW fornece p , como p = 0,000. você precisa mudar o
último zero para o número 1. e usar o sinal de menor: p < 0,001).
í\j EXEMPLO
*
Vamos tentar esse processo para um coeficiente de correlação de +0,29 em uma análise
com 133 pessoas: r = 0,29. n = 133.
1. Consultamos a tabeja. que mostra um r de 0,29 convertido em um Z. de 0,299.
2. Multiplicamos l/\[\3 0 por 1.96. Ponanto, multiplicamos 1/11 40 por 1.96. Isto
é, multiplicamos 0,0877 por 1,96 = 0,1719.
3. Diminuímos 0,1719 de 0,299 = 0,1271: esse é o limite inferior Zr.
4. Adicionamos 0,1719 a 0,299 = 0,4709: esse é o limite superior Zr.
5. Convertemos os números em 3 e 4 para r (de Zr). Consultando as tabelas, há:
Zr = 0.1271 —> r= 0,126 (limite inferior do intervalo de confiança pra r).
Zr = 0.4709 —> r = 0,440 (limite superior do intervalo de confiança pra r).
Embora o coeficiente de correlação amostrai seja +0,29, temos 95% de confiança de
que o verdadeiro coeficiente de correlação populacional está entre 0.126 e 0,440.
Estatística sem M atem ática para Psicologia 205
Correlações
N 10 10 10
Pearson Correlation
Age (Idade) (Correlação de Pearson) 0.970 0.802 1.000
Sig. (1-tailed)
0.000 0.003
(Sig. Unilateral)
N 10 10 10
Isso significa a correlação total entre altura e peso. Entretanto, parte do relacionamento
entre essas variáveis se dá devido à idade - a parte representada somente por b. Se a influên
cia da idade fosse removida (a área b). a correlação entre altura e peso seria reduzida, pois
seria representada somente por a. Isso é uma correlação parcial: uma correlação entre duas
variáveis, com a influência de uma (nesse caso) removida. '
Com o SPSSPW, é fácil remover a influência de uma variável. As instruções são as se
guintes. Depois de colocaros dados, escolhaAnalyze (Analisar), Corre/ate (Correlacionar).
PartiaI (Parcial).
Colocamos altura e peso na caixa Variables (Variáveis) da direita e a variável que deseja
mos fixar (nesse caso, idade) na caixa Controlling fo r (Controladas).
Seria útil saber o valor do coeficiente de correlação para idade e peso sem o controle
da variável idade para podermos comparar os dois. Para efetuar isso, selecionamos Options
(Opções). Onde obtemos a seguinte caixa de diálogo. Marque Zero-order correlations (Cor
relações de ordem zero) e pressione Continue (Continue).
Lembre-se de
clicar nessa caixa
•*
■íEêro
ff I , l v ~. [lyunMlHd S t ip a la S - ::- .
Isso nos traz de volta à caixa de diálogo Partiul Corrclations (Correlaçoes Parciais), na
qual você pode clicar em OK.
206 C hristine P. Dancey & John Reidy
Isso significa a correlação total entre altura e peso. Entretanto, parte do relacionamento
entre essas variáveis se dá devido à idade - a parte representada somente por b. Se a influên
cia da idade fosse removida (a área b). a correlação entre altura e peso seria reduzida, pois
seria representada somente por a. Isso é uma correlação parcial: uma correlação entre duas
variáveis, com a influência de uma (nesse caso) removida. ’'
Com o SPSSPW, é fácil remover a influência de uma variável. As instruções são as se
guintes. Depois de colocar os dados, escolha Analyze (Analisar), Correlate (Correlacionar),
Partial (Parcial).
Essa não c um a explicação m atem ática, m as sim conceituai. Portanto, a precisão m atem ática é perdida em lavor do entendim ento
conceituai. A fórm ula real para calcular correlações parciais c dada por r* = a/(a + altura) ou a/(a + peso).
Estatística sem M atem ática para Psicologia 207
*»-1 s e a jj a •=*
ff, - - Md____________ r r j " IJ ’ .- i y ’-'1 ’ • : ~V - llmUntÉlwl SPSS Daln rj ‘ ^
Sig. (1 -tailed)
.002 ' . .001
(Siq. Unilateral)
N 0 8 8 A correlação entre
Weight Pearson Correlation altura e peso sem
(Peso) (Correlação de Pearson) .8339 1.000 .8 0 2 0
o controle de outras
Sig. (1 -tailed) variáveis é forte: 0,84
(Siq. Unilateral) .002 .0 0 6
N 8 0 8
Sig. = Significância
Essa tabela é exatamente igual a da página 205, exceto porque o programa foi rotulado de
tabela Zero Order Pa rtials (Parciais de Ordem Zero).' Ela nos dá o relacionamento entre as
variáveis, com o controle das demais.
A saída entào informa a correlação entre altura e peso, com controle da variável idade:
N 0 8
Podemos ver que a correlação entre altura e idade foi reduzida de 0,83 para 0,39 (corri
gido para dois decimais após a vírgula). Portanto, nessa amostra pequena, verificamos que a
associação entre altura e peso se dava parcialmente devido à idade. Se a correlação de 0,83
não tivesse sido reduzida quando excluímos a variável idade, sugeriria que a associação entre
altura e peso não era afetada pela variável idade.
Nesse caso, controlamos (excluímos) somente uma variável, portanto chamamos de cor
relação de primeira ordem. Se excluirmos os efeitos de duas variáveis, estaremos fazendo
uma correlação de segunda ordem, e assim por diante.
Atividade 5.9
Sig. (1-tailed)
.000 .000
(Sig. Unilateral)
N 117 117 117
Total Stigma Pearson Correlation
(Estigma Total) (Correlação de Pearson) -.4 9 8 3 1.000 .4930
Sig. = Significancia
N 117 117
Total Stigma Pearson Correlation
(Estigma Total) -.2391 1.000
(Correlação de Pearson)
Sig. (1-tailed)
(Sig. Unilateral) .005
N 117 117
Sig. = Significancia
Muitos pesquisadores utilizam coeficientes de correlação para relatar seus estudos, e artigos
científicos geralmente incluem matrizes correlacionais para o leitor interpretar. Temos aconselhado
você a relatar valores de probabilidade exatos, mas às vezes os autores não o fazem: relatam ou
o p < ou p > como intervalos. Michas e Henry (1994) testaram 24 meninos e 24 meninas (idade
média de 5,6 anos) por meio de várias medidas. O estudo investigou se duas variáveis de memória
fonológica, lapsos de repetição e lapsos de memória estavam relacionadas ao vocabulário adquiri
do. A Tabela 5.4 contém as correlações entre todas as medidas iniciais tanto quanto as medidas de
aprendizagem de palavras.
Note que os pesquisadores nos deram somente metade da matriz de correlação completa. Como
já dito, não precisamos ver as diagonais (todas serão r - 1,00); precisamos somente da metade da
matriz. Note também que qualquer correlação com * depois dos números é improvável de ter acon
tecido devido ao erro amostrai, tendo a hipótese nula como verdadeira (usando um valor de critério
de 5%), e qualquer correlação com ** após o número é improvável de ter acontecido devido ao erro
amostrai (usando um critério de 1%). Não nos foram dados os valores de probabilidade exatos;
portanto, não sabemos se a correlação entre idade e lapsos de repetição, por exemplo (0,332*), teve
uma probabilidade associada de 0,049 ou 0,02. Isso é importante? Teremos que ler a discussão crí
tica da página 155 para nos decidirmos.
E importante lembrar que os pesquisadores nos deram os valores de r corretos até três decimais.
Nem todos os estudos fazem isso; alguns relatam os números corretos somente com duas casas
decimais após o ponto.
S p a tia l Non-word M em o ry W o rd W o rd c o m W o rd
M e m o ry R e p e titio n Span p r o d u c tio n p re h e n s io n D efin itio n
(M emória (Lapsos de ( Lapsus de V o cab u lary (Produção (Compreensão (Definição
espacial) repetição) memória) (Vocabulário) de palavras) de palavras) de palavras)
Exemplo da literatura:
crenças de saúde e dor nas costas
Tabela 5.5 Intercorrelações (/' de Pearson) de valores básicos de idade, sexo. índice de capacidade funcional
iICF) e variáveis preditoras (otimismo quanto à saúde, três medidas de lócus de controle e depressão)
H e a lth o p tim is m
(O tim ism o O th e rs L O C In te rn a i L O C C hance LO C D e p r e s s io n
q u a n to à saú d e) (O u tro s L O C ) (L O C in tern o s) (L O C casuais) (D ep ressão )
FCI (Functional Capacity Index) (ICF (índice de capacidade funcional)); LOC (Lócus Of Control) (LOC (lócus de controle)).
/• > 0,208, p < 0.Ü l : /• > 0 ,159, p < 0,05.
Exemplo da literatura:
estigma, incapacidade causada por doença e
qualidade de vida na síndrome do intestino irritável
Nesse artigo (Dancey et al., 2002), probabilidades exatas foram dadas quando possíveis. En
tretanto, como você já aprendeu, às vezes o SPSSPW imprime uma fileira de zeros (.p = 0.000), e a
convenção é mudar o último zero para 1 e usar o sinal de menor (p < 0,001). Fez-se isso aqui.
A Tabela 5.6 é uma parte dos resultados dados nesse artigo.
Observe a correlação entre incapacidade causada por doença no papel social c qualidade de
vida das mulheres: r = -0,51. Quando a incapacidade causada por doença aumenta no aspecto
social, a qualidade de vida diminui. Essa é uma correlação moderada. Entretanto, se excluirmos a
variância devido à severidade dos sintomas, a correlação diminui (para-0,37). Isso significa que
parte da relação entre incapacidade causada por doença com respeito ao papel social se devia na
verdade à severidade dos sintomas.
212 C hristine P. Dancey & John Reidy
Tabela 5.6 Correlações completas e parciais entre intrusão da doença e subesealas do questionário de
qualidade de vida relatado por sexo (correlações parciais controladas pelo total da severidade dos sintomas)
M e n (H om ens) W o m e n (M u lh eres)
S o c ia l R o le
-0.64 (p < 0.001) -0.58 (p < 0.001 ) -0,51 (p < 0.001) -0.37 (p = 0.002)
( Papel so cial)
S le e p iS o n oi -0.36 (p = 0.004) -0.25 (p = 0.035) -0.30 ( p < 0.001) -0.15 (p = 0.13)
P h j s ic a l R o le
-0.55 (p < 0.001) -0.52 (p <0.001 ) -0.49 (p < 0.001 ) -0.35 (p < 0.001 )
(Papel físico)
Mental Health
0.70 (p < 0.001) -0.65 (p < 0.001 ) -0.50 (p < 0.001) -0.38 (p < 0.00) )
(Saúde mental)
Energy (Energia) -0.54 (p < 0.001) -0.48 (p< 0.001) -0.51 ( p < 0.001) -0.38 (p< 0.001)
*F.xistem 13 itens na escala de incapacidade causada por doença; reproduzimos apenas 5 aqui.
Atividade 5.10
Você deve ser capaz de observar quais padrões de correlação ocorrem em uma matriz de
correlações. Por exemplo, analise a seguinte situação:
Se você observar cuidadosamente, verá que as variáveis que compartilham a maior parte
da variância umas com as outras estão relacionadas à qualidade de vida, satisfação com os
relacionamentos e com a vida. Esse é um padrão que emerge dos dados. Essas variáveis estão
correlacionadas umas com as outras, formando um grupo “natural”. As outras duas variáveis,
sentir-se triste e ter acessos de choro, também estão correlacionadas entre si (0,442), mas não
com as demais variáveis, demonstrando um segundo padrão. Dessas seis variáveis, podemos
distinguir dois padrões distintos. Obviamente, nesse exemplo, com poucas variáveis, fica
relativamente fácil distinguir os padrões.
Psicólogos desenvolvendo ou verificando as propriedades de questionários fazem u^o
desse tipo de "padronização” para agrupar variáveis. Isso é útil quando, por exemplo, um
questionário foi desenvolvido para medir aspectos diferentes de, digamos, personalidade ou
qualidade de vida. No exemplo, as variáveis no primeiro grupo são questões que constituem
uma subescala de um questionário de qualidade de vida. Um questionário pode incluir ques
tões relacionadas à vida familiar (isto é, uma subescala) e outras relacionadas à situação
financeira e talvez vida sexual. O questionário de qualidade de vida consiste em várias subes-
calas diferentes.
O uso de padrões de correlações para verificar agrupamentos de perguntas dá uma maior
confiança nos questionários elaborados por psicólogos. Obviamente eles não olham somente
para as matrizes correlacionais. Eles usam uma técnica chamada de Análise Fatorial, que
efetivamente faz a mesma coisa. Só que melhor! Isso é discutido com mais detalhes no
Capítulo 12.
Resumo
■ Se duas variáveis são correlacionadas, então não são independentes: quando os esco
res de uma variável mudam, os escores da outra variável tambem mudam, de maneira
previsível.
■ Correlações podem ser positivas (valores altos de x tendem a ser associados a valores
altos de )\ tanto como valores baixos de x tendem a ser associados a valores baixos de
y), negativas (valores altos de x são associados a valores baixos de y) ou zero (ausên
cia de relacionamento linear).
■ Coeficientes de correlação variam de -1 (relacionamento negativo perfeito), passan
do por zero, até +1 (relacionamento positivo perfeito).
■ O r de Pearson é um coeficiente de correlação paramétrico; r é o efeito natural. Pode
ser elevado ao quadrado para se ter uma medida da variância explicada, expressa
como percentagem.
■ Limites de confiança podem ser construídos em torno do r de Pearson. Se o r da
amostra é 0,5. e os limites de confiança são 0,4 a 0,6 (limites de 95%), você pode ter
95% de confiança de que, na população, r será encontrado no intervalo 0,4 a 0,6.
■ Analisar padrões de correlações dentro de uma matriz pode nos mostrai- quais variá
veis “ficam juntas”, e isso é importante na psicometria.
214 Christine P. Dancey & John Reidy
Sumário de casos
lllness intrusiveness
QOL (CQV*) (Incapacidade causada pela doença) STIGMA (Estigma)
Total N 20 20 20
Analise os dados:
J. Obtenha uma correlação de ordem zero entre estigma e CQV.
2. Obtenha uma correlação entre estigma e CQV, mantendo constante os efeitos da
incapacidade causada por doença. Use uma hipótese unilateral.
3. Pense sobre a direção e magnitude dos coeficientes de correlação. O que você con
clui dessa análise?
Correlations (Correlações)
age mood quality of family relationships
(idade) (humor) life (QV) (relacionamentos familiares)
age (idade) Pearson Correlation
1.000 -0.011 -0.093 -0.106
(Correlação de Pearson)
Sig. (2-tailed) 0.912 0.332 0.264
(Sig. bilateral)
N 113 112 111 112
Pearson Correlation
mood (humor) -0.011 1.000 0.463 -0.328
(Correlação de Pearson)
Sig. (2-tailed) 0.912 0.000 0.000
(Sig. bilateral)
N 112 118 115 117
Pearson Correlation
q u a lity o f life (QV)
(Correlação de Pearson) -0,093 0.463 1.000 -0.598
Sig. (2-tailed)
0.332 0.000 0.000
(Sig. bilateral)
N 111 115 116 115
family relationships Pearson Correlation
(relacionamentos familiares) (Correlação de Pearson) -0.106 -0.328 -0.598 1.000
3. Das variáveis abaixo, quais demonstram o relacio (.c) 0,8. mas não podemos concluir se o valor é
namento mais forte: positivo ou negativo
(a) QV e relações familiares (d) +0.64
(b) QV e idade 8. Se você obtém um coeficiente de correlação de
(c) humor e QV 0,4. quanta variância não é explicada?
(d) humor e idade
(a) 16%
4. Qual é a correlação mais fraca? (b) 40V'
(a) QV e idade (c) 84%
(b) humor e idade (d) Nenhuma das alternativas
(c) relações fam iliares e idade
(d) relações familiares e humor
216 Christine P. Dancey & John Reidy
9. Tempo gasto trabalhando na frente do computador Qual é a resposta mais sensata? As variáveis mos
e visão ruim têm uma correlação negativa. O que tram uma correlação de:
você deve concluir? (a) +1,00
(a) Pessoas com a visão ruim têm maior probabi (b) -1,00
lidade de passar longas horas trabalhando na (c) +0,7
frente do computador (d) -0.7
(b) Trabalhar por longas horas pode causar danos Obser\'e o seguinte diagrama de dispersão:
à visão
(c) Um tipo específico de personalidade pode ter
maior probabilidade de ter a visão ruim e de 181
trabalhar longas horas na frente do com puta
Ifc. -
dor 14 -
o
(d) Qualquer uma das alternativas, pois correla <
OL 1/ -
ção não significa causalidade t—
íSl 10 -
1n
10. Observe o seguinte diagrama de dispersão: 8-
6-
140 i 4-
10 12
130 AG E
120
Qual é a resposta mais sensata'.' As variáveis m os
110 tram uma correlação de:
100 H
(a) -1 ,0
(b) -0,1
90 (c) +1,00
10 20 30 40 50 (d) +0,1
MATHEM AT
Questões 12 e 13 estão relacionadas à seguinte tabela
de resultados:
Correlations (Correlações)
Célula a1
Sintom as
d5S§ ih
nrP
Depressão ssr
Ba
cí
Incapacidade
Diagram a de
dispersão
relacionado
a sintom as
e depressão Crenças
intrínsecas
Crenças
extrínsecas
218 Christine P. Dancey & John Reidy
16. Qual célula está relacionada ao diagrama de disper 19. Se um coeficiente de correlação tem um valor de
são entre crenças intrínsecas e crenças extrínsecas? probabilidade associada de 0,02, então:
(a.) dl Ca) Nossa hipótese é obviamente verdadeira
(b) d2 (b) Nossos resultados são importantes
(c) d? (c) Existe uma chance de somente 2% de que
(d) d4 nossos resultados tenham ocorrido por erro
amostrai, se considerarmos a hipótese nula
17. A célula c3 está relacionada a:
verdadeira
ía) Incapacidade e crenças intrínsecas (d) Existe uma chance de somente 2% de que
(b) Incapacidade e crenças extrínsecas nossos resultados estejam corretos
(c) Incapacidade e sintomas
(d ) Depressão e sintomas 20. O SPSSPW imprime o seguinte: p = 0,000. Como
isso deve ser relatado?
18. Um relacionamento positivo significa que:
(a) p < 0,001
(a) Um relacionamento importante existe (b) p< 0,0001
(b) Quando valores em x aumentam, valores em y (c) p > 0,001
diminuem (d) p > 0.0001
(c) Quando valores em \ aumentam, valores em y
também aumentam
(d) Valores altos são freqüentes em a e y
Referências
Panorama do capítulo
Nos capítulos anteriores, você foi apresentado á observação de como os valores de uma
variável se relacionam com os de outra variável, e para essa análise aprendeu sobre o teste pa
ramétrico denominado de r de Pearson. Neste capítulo, você irá considerar as diferenças entre
valores em duas condições. Por exemplo, você poderia comparar a habilidade de memória de
nessoas com ou sem fobia de aranhas para ver se há diferença. Tal delineamento é chamado de
entre participantes, independente ou não-relacionado, pois um grupo de participantes fornece
os valores em uma condição, e um grupo diferente de participantes fornece os valores em outra
condição diferente. Por um outro lado, um grupo de participantes pode participar das duas
condições, por exemplo, aprendendo tanto as palavras de alta frequência quanto as de baixa
•requência. Estudamos, então, o número de palavras lembradas. Esse estudo é chamado de den
tre participantes, medidas repetidas ou relacionado, pois a mesma amostra de pessoas participa
das duas condições. Neste capítulo, vamos discutir as análises de duas condições usando o teste
paramétrico chamado teste t. Estamos interessados nas diferenças entre os dois grupos, mais
especificamente na diferença entre a media dos dois grupos. Mostraremos como analisar os da
dos desse tipo de delineamento Como o teste t é um teste paramétrico, você deve lembrar que
os seus dados devem satisfazer as suposições dos testes paramétricos, isto é, os dados devem
ser retirados de uma população com uma distribuição normal Temos a tendência de supor que
esse é o caso quando os dados da amostra satisfazem esta condição Se você tem motivos para
acreditar que não é o caso, então precisa utilizar o equivalente não-paramétrico do testo t que
é descrito no Capítulo 15.
Para entender os testes apresentados neste capítulo, você precisa de um conhecimento dos
seguintes conceitos:
16. Qual célula está relacionada ao diagrama de disper 19. Se um coeficiente de correlação tem um valor
são entre crenças intrínsecas e crenças extrínsecas? probabilidade associada dc 0.02. então:
(a) dl (a) Nossa hipótese é obviamente verdadeira
tb) d2 (b) Nossos resultados são importantes
(c) d3 (c) Existe uma chance de somente 29f de u_
(d) d4 nossos resultados tenham ocorrido por e_
amostrai, se considerarmos a hipótese r.
17. A célula c3 está relacionada a: verdadeira
(a) Incapacidade e crenças intrínsecas (d) Existe uma chance de somente 2% de
(b) Incapacidade e crenças extrínsecas nossos resultados estejam corretos
(c ) Incapacidade e sintomas
(dl Depressão e sintomas 20. O SPSSPW imprime o seguinte: /> = 0.000. C<:
isso deve ser relatado?
18. Um relacionamento positivo significa que:
(a) /><0.001
ia) Um relacionamento importante existe (b) p <0.0001
(b i Quando valores em .r aumentam, valores cm y (c) /»>0.001
diminuem (d) />>0.0001
(c) Quando valores em x aumentam, valores cm y
também aumentam
(d) Valores altos são freqüentes em x e y
Referências
5.00 15.00
10.00 9.00
6.00 16.00
6.00 15.00
7.00 16.00
.V00 18,00
6.00 17.00
9.(X) 13.00
5,00 11.00
10.(X) I2.IX)
11.(X) 13,(X)
9.<X) I I . (X)
1 = 87* £ = 166
X = 7Jf X - 13.8
DP = 2.5' DP = 2,8
Tabela 6.2 Média, desvio padrão e limites de confiança de 95% para condições com barulho e seni
barulho
A s m édias que você obteve por sua amostra são estimativas por ponto. Essas médias
amostrais constituem as melhores estimativas das m edias populacionais. Se. entretanto, re
pelíssem os o experimento muitas vezes, veríamos que a média varia de experimento para
experimento. Por exemplo, a média da amostra para a condição sem barulho é 13.8. Se repe
tíssemos o experimento, poderíamos obter uma média da amostra de 13.3. Se o experimento
fosse repetido muitas vezes, a melhor estimativa da média populacional seria a média de to
das as médias amostrais. Deve ser óbvio, no entanto, que nossa estimativa pode ser um pouco
diferente da verdadeira diferença média na população: portanto, seria melhor, em vez de dar
uma estimativa por ponto, fornecer um intervalo de valores. Seria mais realista.
O intervalo é limitado por um valor inferior (12.1 nesse caso) e um valor superior (15.6.
no exem plo). Esses valores são denominados de limites de confiança, e os valores entre esses
limites, de intervalo de confiança. Você já viu isso no Capítulo 3. Os limites de confiança nos
indicam o quanto podemos estar confiantes de que o intervalo contém a média populacional.
Por que os limites de confiança são importantes? Quando conduzim os experimentos ou
estudos, queremos ser capazes de generalizar os resultados para a população. Também que
remos que nossos leitores tenham uma idéia com pleta e correia dos resultados. Embora a
média amostrai da condição com barulho seja 7.3. informar ao leitor que “temos 9 5 % de
confiança de que nossa média populacional está entre 5.7 e 8.8" fornece mais informação e é
mais realista do que simplesmente informar a média amostrai. Intervalos de confiança estão
sendo fornecidos cada vez mais em artigos científicos, e. portanto, é importante que você os
entenda bem.
222 Christine P. Dancey & John Reidy
Figura 6.1 Limites de confiança de 95% para as condições com barulho e sem barulho.
Podemos também obter a média de uma para outra, a fim de verificar o quanto difere
7 .3 - 13,8 = -6,5
Esse valor, por si só, informa muito pouco. Se padronizarmos, será muito mais úti
valor bruto (valor original) é convertido em um valor;. O valor - é um valor padronizado
fornece uma medida do efeito, que é facilmente entendível. Essa medida do efeito é der
nada de d e mede o quanto duas médias diferem, em termos de desvios padrões. É cala.,
da seguinte forma:
Isso significa que subtraímos uma média da outra (não importa qual é qual —itinr ■
sinal) e dividimos a diferença pelo desvio padrão da média.
Passo 1: calcular o desvio padrão da média
desvio padrão da condição 1+ desvio padrão da condição 2 2.5+ 2,8 _
Passo 2: calcular d
X - x. 7 .3 -1 3 .8 „
---------;--— — = ------------- = 2.45
média dos desvios 2,65
Estatística sem Matemática para Psicologia 223
Nesse caso. nossas medias diferem cm 2,45 desvios padrões. Esse é um efeito muito
grande, que não e' freqüentemente encontrado em pesquisas psicológicas.
0 tamanho do efeito
Os valores z são padronizados para que a media seja zero e o desvio padrão seja 1. Pode-
se ver que. se as medias diferissem por 0 ,1, iriam diferir por somente um décimo do desvio
padrão. Esse é um número muito pequeno na nossa escala de 0 a 3. Se as médias diferissem
em 3 desvios padrões, seria considerado muito em uma escala de 0 a 3. Não existe uma regra
segura e rápida sobre o que constitui um efeito pequeno ou grande. Cohen (1988) apresenta
a seguinte recomendação:
Pequeno 0,2 85
Médio 0.5 67
Grande 0.8 53
Quando existe uma diferença pequena entre os grupos, os valores coincidem substancial
mente. Os valores para os grupos podem ser plotados separadamente; por exemplo, os valores
para a condição com barulho podem ser plotados e tendem a ter uma distribuição normal. Os
valores para a condição sem barulho podem também ser plotados e tendem a ter. da mesma
forma, uma distribuição normal. Se existe pouca diferença entre eles. as distribuições têm
grande sobreposição.
224 Christine P. Dancey & John Reidy
Se existe uma grande diferença entre os dois grupos, as distribuições ficam mais separada
É o que queremos dizer por percentagem de sobreposição. Kssa medida do efeito pem:
que possamos interpretar resultados de maneira significativa. A extensão exata da sobrcpi
ção é dada na tabela abaixo:
d Percentagem de soi
0.1 92
0.2 85
0.3 79
0.4 73
0.5 67
0.6 62
0.7 57
0.8 53
0.9 4H
1.0 45
t.l 42
1,2 37
1,3 35
1.4 32
1.5 29
Atividade 6.1
O teste t independente e' usado quando os participantes tomam parte em apenas uma de
duas condições, isto é, um delineamento independente, entre participantes ou não relaciona
do. Um teste /, para dados relacionados ou emparelhados, é utilizado quando os participantes
tomam parte de ambas as condições, isto é. um delineamento relacionado, dentre participan
tes ou de medidas repetidas.
O leste t foi criado por William Sealey Gosset em 1908. Gossett trabalhava para a cerveja
ria Guinness, cujos cientistas não podiam publicar os resultados de seus trabalhos científicos.
Gossett publicou seus resultados usando o novo leste sob o nome de S tu d en t (Estudante),
motivo pelo qual você verá. em livros de estatística, referências ao t de Student.
Observe novamente os dados brutos para as condições com barulho e sem barulho (Tabe
la 6.3). A primeira coisa que você deve notar é que os valores dos participantes variam dentro
das condições. Na condição com barulho, os valores variam de 3 a I I. Na condição sem
barulho, os valores variam de 9 a 18 (essa variabilidade dentre participantes pode ser vista
como variância dentro de cada coluna). Você deve lembrar, do Capítulo 2. que o desvio pa
drão c uma medida da variabilidade - quanto maior for o desvio padrão maior a variabilidade
dos valores dentro de cada condição. Os valores dos participantes diferem, também, entre as
condições. Você pode ver que os valores na condição sem barulho, no geral, são mais altos
do que os valores na condição com barulho - as médias confirmam nossa experiência visual
com os dados. Essa é a variância entre participantes e pode ser vista como a variância entre
as colunas.
Queremos saber se as diferenças entre as médias dos grupos são grandes o suficiente
para podermos concluir que as diferenças ocorrem somente devido à influência da variável
independente - quer dizer, pela manipulação das condições com barulho e sem barulho. Con
seguiremos isso fazendo alguns cálculos com os dados. A fórmula para o teste t (não dada
aqui) resulta numa estatística teste, que chamamos de “t”. O teste t é basicamente o quociente
da medida da variância entre os grupos pela variância dentro dos grupos. Quanto maior a va
riância entre os grupos (colunas), comparada com a variância dentre os grupos (linhas), maior
será o valor da estatística t.
Uma vez calculado o valor t. podemos (melhor, o computador pode) achar a probabi
lidade de obter tal valor por acaso (devido ao erro amostrai), considerando a hipótese nula
verdadeira.
Tabela 6.3 Dados brutos para as condições de com barulho e sem barulho
5.(X) 15.00
lO.(X) 9.(X)
6.<X) 16.00
6.00 15.00
7.00 16.00
3.00 18.00
6.00 17.00
9.00 13.00
5.00 11.00
10.00 12.00
11.00 13.00
9.00 11.00
1 = 87 1 = 166
X = 7.3 X = 13.8
DP = 2.5 DP = 2,8
226 C hristine P Dancey & John Reidy
Se não existissem diferenças entre a condição com barulho e a condição sem barulh
qual seria a probabilidade de achar tal valor para r?
Se não existem reais diferenças entre as condições com barulho e sem barulho e tirás-r
mos várias amostras, a maior parte das diferenças estaria em tomo do valor zero (as média
das condições com barulho e sem barulho seriam praticamente iguais). Às vezes, entretâ
to. encontramos um valor maior que zero (talvez, por exemplo, participantes na condiçl
com barulho se saíssem melhor do que os participantes na condição sem barulho). Às veze
encontramos uma diferença grande. Essas diferenças são geralmente aleatórias, existem -
mente porque usamos amostras diferentes a cada vez - dizemos que ocorrem devido ao er
amostrai. As diferenças que podemos encontrar se considerarmos várias amostras podem 'í
plotadas como mostra a Figura 6.2 (é outro exemplo de distribuição amostrai).
Se não existe diferença, dc fato, entre as médias no nosso experimento, seria mais pr
vável que o valor t estivesse na área central do que em uma das “caudas" da distribui».'
amostrai. Sabemos, por meio do teorema do limite central, que a maior parte dos valor:
obtidos estará na região central (ver página 113). Seria raro (mas possível) encontrar
valor t nas caudas, como representado acima, se conduzirmos 100 experimentos repetie
sobre as condições com barulho e sem barulho, usando amostras diferentes. Em uma peque-
percentagem de experimentos, encontraríamos um valor t que estaria nos extremos da di>-
buição. Sc na prática, obtivermos um valor t que se encontra em uma das caudas, concluín.
scr improvável que ele tenha ocorrido somente devido ao erro amostrai Podemos col<x
um número nessa "improbabilidade" também. Cada valor t obtido vem com um nível ex_
dc probabilidade associada. Se. por exemplo, nosso valor t tem um nível de probabilid^_
associada de 0,03.' podemos dizer que, considerando a hipótese nula verdadeira, um
t como o obtido em nosso experimento tem a probabilidade de ter ocorrido em .3 ocas
de 100. Portanto, concluímos que existe uma diferença entre condições que não podem
explicadas por erro amostrai. Como você já viu no Capítulo 4, isso é o que queremos d:~-
por "significância estatística", o que não quer dizer necessariamente que nossos resulta,;
são psicologicamente importantes ou que encontramos um grande efeito. Temos de levar i
consideração as estatísticas descritivas e qualquer medida de efeito, intervalos de confiar.,
etc.. que também calculamos.
y a '"'»e das
lo 0
0 0 x
D istrib u iç ã o a m o stra i.
Psicólogos geralmcntc chamam nivel de significancia atingid» l NSAj. Usaremosesses termos intcrcambiavelmente nesse i;
Estatística sem M atem ática para Psicologia 227
-^ Atividade 6.2
%
O que o teste t independente examina?
■ As médias das duas condições e as diferenças entre elas: o que você deseja saber é
se a diferença entre as duas médias é grande o suficiente para ser importante (não so
mente a "significancia estatística", que informa a probabilidade de a estatística teste
ser obtida quando a hipótese nula for verdadeira).
■ Intervalos de confiança: o SPSSPW, usando o procedimento teste r. fornece os limites
de confiança para a diferença entre as médias." A diferença entre as médias amostrais é
uma estimativa por ponto. Essa diferença das médias amostrais é a melhor estimativ a
da diferença das médias populacionais. Se. entretanto, repetirmos nosso experimen
to muitas vezes, veremos que a diferença varia de experimento para experimento. A
melhor estimativa da média populacional seria a média de todas essas diferenças de
médias. Claramente, é melhor fornecer uma estimativa por intervalo, como explicado
anteriormente. Limites de confiança nos fornecem o quanto está confiante de que a
diferença da média populacional encontra-se em certo intervalo. É uma estimativa
por intervalo para a população (não somente para a amostra).
■ Valor t: quanto maior o valor t. maior a probabilidade de que a diferença entre os gru
pos não resulte do erro amostrai. Um valor negativo é tão importante quanto um valor
positivo. A direção positiva ou negativa dependerá de como os grupos tenham sido
codificados. Por exemplo, chamamos a Condição I de com barulho e a Condição 2
de sem barulho. Obviamente, isso foi uma decisão arbitrária, pois poderíamos ter
feito ao contrário, o que resultaria no mesmo valor absoluto de r. mas com um sinal
diferente (positivo ou negativo).
■ Valor p: é a probabilidade de o valor t obtido ter ocorrido devido à variabilidade amos
trai ou erro, sendo a hipótese nula verdadeira. Isso significa que o valor t obtido está
em uma área da curva incomum. isto é, não seria esperado que tal valor estivesse,
aleatoriamente, nessa região. O valor p é a probabilidade de isso ter ocorrido devido ao
erro amostrai. Por exemplo, p = 0.001 significa que existe somente uma chance em mil
de esse resultado ter ocorrido por erro amostrai, sendo a hipótese nula verdadeira.
■ Grau de liberdade (gl): para a maioria dos propósitos e testes (mas não todos), os graus
de liberdade aproximadamente se equiparam ao tamanho da amostra. Para um teste t
relacionado, o grau de liberdade e' sempre um a menos que o número de participantes.
C filais im portante relatar o intervalo de co n fia rç a para a diferença entre as m íd ias d o que relatar os intervalos para a s duas m&liás
separadam ente.
228 Christine P. Dancey & John Reidy
Para um teste t independente, os graus de liberdade são (»1 —1) + (n - I),' portanto r .
uma amostra de 20 (10 participantes em cada grupo).,?/ = 18 (p.e. 9 + 9) . Para
delineamento dentre participantes com uma amostra de 20 o #/ = 19. Os graus de
berdade devem sempre ser considerados em relatórios ou projetos de laboratório, ju ';
com o valor r, o valor p e os limites de confiança para a diferença entre as média>
grau de liberdade é geralmente escrito entre parênteses, por exemplo: /(87) = 0.78.
significa que o valor 1 foi 0,78 para um grau de liberdade igual a 87.
■ Desvios padrões: fornece a variabilidade das amostras envolvidas no teste (ver p—
na 90).
■ Erro padrão da media (epm): é utilizado no cálculo dos intervalos de confiança 1
página 126).
Grau de liberdade
Esse e um termo matemático geralmente usado nas fórmulas dos testes estatísticos. Existe
definições matemáticas que não são úteis para muitos psicólogos e outras que sim. como, por exem
plo. a do grau de liberdade, que se refere ao número de valores individuais que podem variar (serer
livremente alterados) no cálculo da variância da amostra. Alguns exemplos podem ajudar a ilustr_-
o conceito. Por exemplo, se pedirmos que escolha dois números quaisquer, sem restrições, há d.
graus de liberdade. Agora, se solicitarmos que escolha dois números cuja soma seja 10. então. u í t _
vez escolhido o primeiro número, por exemplo, o 7, o outro não será mais livre, pois você necessa
riamente deve escolher o 3 para que a soma seja 10. Neste caso. você dispõe de apenas um grau úz
liberdade.
Vamos examinar um exemplo que não envolva matemática. Imagine que você é o anfitrião d;
um jantar importante e que precisa alocar 10 pessoas em uma mesa. O conhecimento de onde
primeiros nove irão sentar irá determinar onde a décima pessoa senta. Assim você tem liberdade óz
decidir onde as primeiras nove pessoas irão sentar, mas o lugar da decima estará automaticamente
determinado pela posição das primeiras nove (o gl é, neste caso. 10 - 1 = 9). Agora imagine qu;
você c o anfitrião de uma janta à moda antiga, na qual você tem cinco mulheres e cinco homen^.
precisa colocar cada mulher ao lado de um homem. Nesse caso, sabendo onde os primeiros quatr
pares sentam (oito pessoas), resulta que os lugares do último par (um homem e uma mulher)estarã
determinados, isto é . o g = 10 —2 = 8).
Isso acontece porque, como visto no exemplo do jantar, temos a liberdade de variar todos e
números exceto um quando formos estimar a variância da população, pois um dos valores estar,
automaticamente determinado pelo conhecimento do valor da média da amostra, isto é. para p
dermos calcular a variância amostrai, precisamos ter calculado primeiramente a média amostrai
Portanto, o conhecimento da média da amostra retira um grau de liberdade no cálculo da variânc:.
dessa mesma amostra.
E claro que os psicólogos estão geralmente ocupados com sua profissão, e não freqüentar
jantares. Portanto, uma maneira mais útil de pensar sobre o grau de liberdade é considerá-lo
número de observações feitas menos o número de parâmetros estimados. Quando calculam* -
testes estatísticos, geralmente temos de estimar parâmetros. Uma vez que no teste t temos de
Tiar a media para podermos calcular a variância da amostra, perdemos um grau dc liberdade.
' :>>o é que dividimos a variância por n - I em vez de n. Quanto mais parâmetros forem estima-
maior será a redução do grau de liberdade. O gl é resultado tanto do número de participantes
i vidos na análise quanto do número de variáveis. Não e fácil encontrar um livro de estatística
. -c explique bem o que é o grau de liberdade ou que mostre sua relevância. O Dr. Chong Ho Yu
■ece uma das melhores explicações do grau de liberdade que já vimos, mas boa parte se baseia
conceitos que você irá aprender no Capítulo 11. então falaremos mais sobre o grau de liberdade
-ido chegarmos lá. Se você deseja ver e ouvir o tulorial do Dr. Chong Ho Yu sobre o grau de
x-rdade na Internet, o endereço do site é dado no final deste capítulo (Yu. 2003).
Atividade 6.3
Às vezes é fácil ficar confuso quando os psicólogos usam vários nomes diferentes para a
mesma coisa. Quais são os nomes alternativos para um delineamento dentre participantes?
Quais são os nomes alternativos para um delineamento entre participantes?
Quando temos um número de participantes diferente nos dois grupos, pode ser enganoso
obter uma média simples das duas variâncias, pois seria atribuir pesos iguais aos dois grupos,
quando de fato um grupo tem um número maior de participantes. Nesse caso, deve-se utilizar
a média ponderada. A média ponderada das variâncias amostrais (denominada de estimativa
combinada da variância populacional) é usada para obter uma estimativa mais precisa da
variância da população.
Se os dados apresentarem uma forte assimetria e você tem um número pequeno de parti
cipantes, convém considerar o uso de um teste não-paramétrico (ver Capítulo 15). Os testes
não-paramétricos não necessitam da suposição de normalidade.
Abra seu arquivo de dados. Primeiro deve montar um arquivo próprio para delineamentos
independentes. Você aprendeu a fazer isso na seção do SPSSPW do Capítulo 1; então, por
favor, refira-se a essa seção.
33 t______
<si-i| I 3’MciT.tfiW I laMnaiUní j| pjch«p06_i ‘J.3-Í « O 1513
232 Christine P. Dancey & John Reidy
Isso abre a caixa de diálogos Independent-Samples T Test (Teste i para amostras indepe-
dentes), como segue:
a rs
^ iÜ M * 1 - 1 I M&| MH ir I jj.i.ir.1 - * w
C o lo q u e a variável
d e p e n d e n te na esq u erd a
na lista Test V ariable (Variável
Teste) clica n d o so b re ela e
u tiliza n d o o b o tão > .
Você precisa dar o valor que atribuiu a cada grupo. Por exemplo, se codificou o grupo
das mulheres como "0" e o dos homens como “ 1". então sexo (0. 1) é o formato correto. Em
nosso exemplo, entretanto, nossos grupos foram designados como 1 e 2.
Clique em Continue (Continuar). Essa ação o leva de volta à caixa de diálogo anterior:
então você pode clicar em Options (Opções), que o levará à seguinte caixa de opções. E aqui
que você pode mudar o nível de confiança, de 95% para 90%. por exemplo.
Clique em Continue (Continuar) e após em OK.
-Ul»l
*13111 s _ i _ 1 tl& J Mj £ 1 £ | U M 3 Pressione
Continue
(Continuar)
Os resultados aparecerão na janela de saída. A maioria das saídas fornece muito mais
informação do que você realmente precisa e pode parecer uma confusão de números. Entre
tanto. você aprenderá a selecionar o que realmente importa para o seu experimento ou estudo.
Algumas partes da saída simplesmente dirão o que você já sabe! Por exemplo, na primeira
seção da saída abaixo obtemos:
■ o nome das duas condições
■ o número de casos em cada condição
■ a média em cada condição
■ o desvio padrão e o erro padrão da média das duas condições
As informações mencionadas podem ser vistas rapidamente, pois já as conhecemos. Uma
vez que sabemos o que ignorar, nossa saída será fácil de ler. Essas são as estatísticas de grupo
que aparecem em primeiro lugar na saída:
Sig.
Não-assumida)
Significancia
\
Isso mostra que não existem diferenças Geralmente relatamos Essa é a
significativas entre as variâncias probabilidades exatas. Quando diferença
p = 0,678, portanto usamos a parte o SPSSPW imprime uma fileira entre as
da saida chamada de equal variances de zeros, entretanto, mude médias
assumed (suposição de variâncias iguais), o último número para 1, e use
como indicado pelo SPSSPW o sinal p <. Portanto, p < 0,001.
Uma das coisas que você notará é que o SPSSPW usa um leste chamado de teste C;
Levene para a igualdade de variâncias (Levene's Test fo r EquaUty o f Variances). É usa,;
para verificar se as duas condições têm variâncias iguais. Quando duas ou mais conc
Çôes apresentam variâncias iguais, lemos a denominada "homogeneidade de variância'
Alguns testes estatísticos, como o teste t. supõem que as variâncias enire os grupos
amostras são iguais. O teste de Levene pode ser usado para verificar essa suposição,
tesie t. realizado pelo SPSSPW. fornece dois conjuntos de resultados - um para usar quti
do satisfazemos a suposição (p. ex., as variâncias são iguais) e um para usar quando n.
conseguimos satisfazer a suposição (p. ex., as variâncias são diferentes). O leste de L.e\e:
nos fornece um valor F. que você ainda não aprendeu, mas é um teste parecido com o r.
fato quando o gl = 1. r = |- ou I = sJF . Portanto, sc / = 3. você sabe que isso é igual a u-
valor F de 9. Você aprenderá a estatística F mais tarde, no Capítulo 9.
O leste de Levene é um teste de homogeneidade de variâncias que não depende da suposk_
de normalidade. Quando estamos decidindo se satisfazemos ou não a suposição de variánc:
iguais, precisamos olhar para o valor p dado ao lado do valor F. Para sermos consistentes o
a convenção tradicional, devemos concluir que nossas variâncias são diferentes (d esig u ais ¡
nosso valor p é menor que 0,05. Se o valor /; é maior que 0.05. admitimos que as variâncias
aproximadamente iguais. O SPSSPW usa o critério de p < 0.05 para decidir se as variâncias v
iguais. Obviamente, essa decisão é sujeita às mesmas restrições delineadas no Capítulo 4 ptr.
teste de hipóteses. Para deixar mais simples, usaremos o critério do SPSSPW, como explicad.
Os resultados podem ser relatados como segue:
O s participantes na con d ição com barulho lem braram de m enos palavras ír(22) = 7.3. d o
p adrão = 2.5) do que os participantes na con d ição sem barulho (r(22) = 23.X. DP = 2 .8 ). A d ifere:..
\ ili- I . How ard I-cvene ( I ^ I-4—2<K)3 ), professor em érito do Departamento de Biologia do Instituto Politecnico da Virginia B L ..
burs. VA Estados Unidos.
Estatística sem Matematica para Psicologia 235
de m édias entre as condições foi de 6,58, que c um grande efeito (</ = 2.45): o intervalo de c o n fia n
ça de 959c para a diferença e stim ad a das m édias populacionais é 4.36 a X.X 1. O tesie r independente
revelou que. se a h ipótese nula fo sse verdadeira, tal resultado seria im provável (/(22) = 6.14: /> <
0.001). P ortanto, conclui-se que escu tar b a rulho afeta a m em ória de curto prazo, pelo m enos q u a n
to à lem brança de palavras.
Você pode ver que a diferença de média entre as condições é de 0.67. As variâncias
entre os dois grupos são significativamente diferentes, por isso utilizamos a linha das vari
âncias supostamente diferentes (equal vuriances noi assumed). Isso mostra um valor r de
-0,97. O intervalo de confiança indica que estamos 95% confiantes de que o intervalo de
2,02 a 0.68 contenha a diferença das médias populacionais, em outras palavras um limite
muito amplo. O intervalo de confiança inclui o zero. o que significa que, se repetirmos o
estudo com uma amostra diferente, as mulheres podem exibir valores mais altos do que
os homens (como nesse caso. no qual a diferença de média é —0.67). os homens podem
exibir valores mais altos que as mulheres, ou pode não haver diferença alguma (zero). Ob
viamente, isso não é bom o suficiente, e temos de concluir que os grupos não diferem em
necessidade de cognição. Afirmamos isso devido ao baixo valor t (0.97) e o nível de signi-
ficância associado p = 0,33. Isso quer dizer que. sendo a hipótese nula verdadeira, temos
uma chance de 33% de obter um valor t de 0,97.
CUIDADO!
Exemplo da literatura:
fatores psicológicos e doenças coronarianas
. abela 6.4 Médias, desvios padrões e valores de probabilidade para participantes no estudo de Keuerer e
.íboradores (19%)
F¿ck-years of smoking
' anuais fumados) 42.9(43.6) 49.0(44.4) 0.191
- 'iirs of cxcrcise (per week)
i >rjs de exenncio - por semana) 2.414.5) 2.1 (4.3) 0.530
_ilieine (Calcina) 3.3 (3.9) 3.5 (3.7) 0.668
- oy Mass Index
- Jiee lie massa corporal) 19.2(2.61 19.3(3.3) 0.582
- coohol (drinks per day)
A-lcool - drinques por ilia) 0.5 (1.4) 0.7 (2.2) 0.373
Tabela 6.5 Tempo (em segundos) que as mãos foram mantidas dentro da água em cada condição
1 5 7
-}
7 15
3 6
4 fi 7
5 10 12
6 4 n
7 7 10
X 8 14
9 8 13
10 15 7
Abra seu arquivo de dados. Escolha Puivcd-Scimples I Test (Tcsic t para amostras emp_
relhadas) do menu Compare Means (Compare Médias).
* rr,.. . . . . :j*rjvirt
Estatística sem Matemática para Psicologia 239
li1.riMj.j:1!1a — — p b t -v •~sjf.
Isso indica que não existe um relacionamento entre os valores na condição praia e
valores na condição estatística (/- = 0,07, que é realmente muito fraco).
Então, chegamos às estatísticas das amostras emparelhadas:
95% Confidence
Std. Error Interval of the
Std. Mean Difference (1C de 9S% Sic
Deviation (Erro para a Diferença) (2-tailec
Mean (Desvio Padrão df (S.g
(Média) Padrão) Lower Upper
da Média) t (gl) Bilaters
V (Inferior) (Superior)
Pair 1 STATISTI BEACH
(Par 1) (Praia estatística) -3 .0 0 0 0 N 45947 1.4530 -.2 8 7 6.287 2 06 9 .069
Sig. = Significancia
A diferença entre a O intervalo de confiança mostra p = 0,07
média da condição que temos 95% de certeza de
praia 10,3 e a que o intervalo de -0,287 a
condição estatística 6,287 contém a diferença das
7,3 é 3 médias populacionais
Correlation
N (Correlação) Sig.
Pair 1 (Par 1 ) Verbal IQ & Performance IQ
(Ql verbal e Ql de Desempenho) 40 .680 .000
Como seria esperado, existe um relacionamento forte positivo entre as duas medidas
de QI. I.embre-se de verificar a primeira parte da saída que confirma quantos pares você
tem como também os nomes das variáveis.
Podemos ver imediatamente que o Ql verbal do grupo é mais baixo que o QI de de
sempenho.
95% Confidence
Interval of the
Std Std. Error Difference (1C de 95% Sig.
Deviation Mean (Erro para a Diferença) (2-tailed)
Mean (Desvio Padrão (Sig
Lower Upper
(Média) Padrão) da Média) (Inferior) (Superior) t df (gl) Bilateral)
I ,1 Verbal IQ & Perfor-
. mance IQ (Ql Verbal -14.2250 9.98842 1.57931 -17.4195 -11 .0 30 5 -9 .0 0 7 39 000
e Ql de Desempenho)
- : - Significancia
Atividade 6.4
Correlation
N (Correlação) Sig.
Sig. Significancia
95% Confidence
Interval of the
Std. Std. Error Difference (1C de 95% Sig
Deviation Mean (Erro para a Diferença) (2-tailed)
Mean (Desvio Padrão Sig
Lower Upper
(Média) Padrão) da Média) t df (gl) Bilateral
(Inferior) (Superior)
Pair 1 , _ -
(pa r j ) C o ni e Con2 -8 .3 0 0 0 7.558 2.390 -1 3 .7 0 7 -2 893 - 3 .4 7 9 .007
Sig. = Significancia
Fra/ier (2003) coletou dados dc mulheres que sofreram agressão sexual séria, em quatro pontos
.pós a agressão. Os dados forneceram informações relacionadas à maneira como crenças sobre
. rntrole e sofrimento mudam com o tempo após a agressão. Essas estatísticas descritivas:
Note que os autores conduziram quatro testes t emparelhados. Quer dizer, compararam índices
; auloculpa comportamenlal com índices de culpa do estuprador em quatro pontos do tempo. A
■' meira comparação foi feita duas semanas após a agressão. Embora as participantes avaliassem
. je os estupradores tinham mais culpa do que cias mesmas, a diferença entre as duas variáveis
pequena - o efeito e' dado como 0,19, que é, como os autores nos disseram, um efeito fraco.
À diferença entre as duas variáveis de culpa nesse ponto de tempo tem um nível de probabilidade
"ociada de 0.08. Um segundo teste i foi conduzido com as mesmas variáveis dois meses após a
. ; _essão - esse efeito também foi fraco. Seis meses mais tarde. entretanto, quando se fez um tercei-
teste t. a diferença entre as condições se tomou mais acentuada. As duas condições aqui diferiram
■ r metade do desvio padrão. No quarto ponto de tempo, a diferença foi parecida.
244 Christine P. Dancey & John Reidy
Teste múltiplo
Se você conduzir vários testes dentro de um estudo ou experimento, algumas das suas análise'
inferenciais resultarão em baixos níveis dc probabilidade associada (p. ex., 0.001) simplesmente
por erro amostrai. Para permitir isso. recomendamos que interprete seus resultados com esse co
nhecimento em mente. A maneira mais fácil de fazer isso é div idir 0.05 (a tradicional variável de
criterio para significancia) pelo número de testes que você conduz (em qualquer estudo) e depoi'
interpretar os níveis de probabilidade associada (NPA) de acordo.
Então, se você realizar três testes l no seu experimento:
NPA = ^ ^ = 0,0167
3
Qualquer NPA > 0,0167 pode ter ocorrido por erro amostrai. Lembre-se, entretanto, de que
interpretar níveis de significancia é só uma parte da informação que contribui para a interpretará»
dos resultados. Existem também os efeitos e intervalos de confiança.
Resumo
■ Limites de confiança permitem que você deduza com um certo grau de confiante
(geralmente 95%) que um determinado intervalo contem a media populacional (ou •
diferença entre médias).
■ d, o tamanho do efeito, fornece a magnitude ou diferença entre duas médias indepc'
dentes, expressa em desvios padrões.
■ Testes t permitem avaliar a probabilidade de se obterem por erro amostrai as di:;
renças observadas entre dois grupos: por exemplo. p = 0,03 significa que. se r.
repetíssemos o experimento 100 vezes, usando amostras diferentes sem supor j
ferenças reais entre condições, esperaríamos encontrar o padrão de resultados ir.
vezes, somente devido ao erro amostrai.
■ Testes I são próprios para dados retirados de uma população normal, são testes par_
métricos.
Vinte crianças em idade escolar (10 meninos e 10 meninas) foram examinadas nas >.
guintes variáveis: número de episódios de doenças no período de um ano. desempenho em
teste no início do ano e desempenho em um teste similar no fim do ano. Coloque os seguin;.
dados no SPSSPW e designe os meninos como Grupo 1 e as meninas como Grupo 2.
Estatística sem Matemática para Psicologia 245
1 24 13 16
• 20 16 20
1 8 7 18
1 30 35
1 5 5 5
1 24 io |5
1 0 9 10
1 8 15 24
1 20 18 30
1 24 20 27
2 7 18 17
2 30 14 io
2 2 20 20
10 9 10
2 18 13 9
2 9 13 16
2 20 10 I
2 10 16 14
2 15 5 6
2 8 7 14
Estatísticas do Grupo
-. diferença enlre as m édias dos grupos é: 14. N um a saída do SPSSPW . se p = 0. 000. você dev e
i 0.41 relatá-lo com o:
- 0.69 (a) /> = 0.000
. 0.96 (b) /> = 0.000!
4 0.76 < c) p < 0 .0 0 1
variâncias dos d o is grupos são: (d) p < 0.0001
Equal 0 113 0.738 0.923 106 0.358 0.5258 0,56951 -0.60327 1.65494
Total of Serious
variances
economic con
assumed
sequences (Con
(Assumida a
sequências eco
igualdade de
nómicas serias)
variâncias)
Equal 0.882 16.607 0.391 0.5258 0.59644 -0.73481 1.78649
variances
not assumed
(igualdade
de variâncias
não-assumida)
Sig - Significance
19. Q ual fileira o p esquisador usaria para interpretar 20. G en eralizando para a população, qual é o sinal c
os resultados do teste t independente? esperaríam os do valor f?
(a) A fileira de variâncias iguais (a) Positivo
(b) A fileira de variâncias d esiguais (b) N egativo
(c) P oderia ser tanto positivo com o negativo
Referências
Panorama do capítulo
Para q u e possa e n ten d er as q u e stõ e s d iscu tid a s n este c a p ítu lo , vo cê precisará ter c o m p re e n
d id o a a n á lise co rre lacio n ai (C a p ítu lo 5) e as an á lises de d ife re n ça s e n tre do is g ru p o s com uso do
teste f (C a p ítu lo 6 ).
248 C hristine P. Dancey & John Reidy
Sig. = Significancia
19. Qual fileira o pesquisador usaria para interpretar 20. Generalizando para a população, qual é o sinal que
os resultados do teste t independente? esperaríamos do valor /"?
(a) A fileira de variâncias iguais (a) Positivo
(b) A fileira de variâncias desiguais (b) Negativo
(c) Poderia ser tanto positivo como negativo
Referências
COHEN, J. Statistical Power fo r Behavioral Sciences. New York: Academic Press, 1988. 2 "ed.
COHEN, J. A power primer. Psychological Bulletin, v. 112, p. 155-9. 1992.
FRAZIER, R A. Perceived control and distress following sexual assault: a longitudinal test of a new
model. Journal o f Personality and Social Psychology, v. 84, n. 6, p. 1257-69, 2003.
KETERER. M. W. et al. Denial o f depression as an independent correlate of coronary artery disease.
Journal o f Health Psychology, v. 1, n. l,p . 93-105, 1990.
RATCLIFF. G. et al. Tracking cognitive functioning over time: ten-year longitudinal data from a
comm unity-based study. Applied Neuropsychology, v. 10, n. 2, p. 89-95, 2003.
YU. C. H.. HO. W. J , STOCKFORD. S. Using multimedia to visualize the concepts o f degree of
freedom, perfect-fitting, and over-fitting. Joint Statistical Meetings, August 2001, Atlanta (GA).
YU, C. H. Illustrating degrees of freedom in multimedia. Disponível em: http://seamonkey.ed.asu.
edu/~aiex/pub/df/default.htm [acesso em 10 de março de 2004].
250 C hristine P. Dancey & John Reidy
Como mencionado anteriormente, foi comum. por muitos anos, a prática de relatar os
níveis de probabilidade como < 0,05 ou > 0,05. Essa convenção surgiu, em parte, porque
antes do advento dos poderosos pacotes computacionais, como o SPSSFW, não era possível
determinar a probabilidade exata com facilidade. Todavia, existem bons motivos para que a
probabilidade exata deva ser relatada sempre.
Por exemplo, imagine que você conduz um experimento, o analisa e obtém um valor de
probabilidade associada de 0,049. Subseqüentemente, decide replicar esse experimento, mas
dessa vez obtém um nível de probabilidade de 0,051. Relatar o primeiro estudo como “signi
ficativo” a um nível de 0,05 e o segundo estudo como '‘não-significativo” a um nível de 0,05 é
enganoso, em especial porque quando você conduz um estudo, existe sempre certa quantida
de de erro (ver Capítulo 4). Se c o n d u z ir o experimento novamente, você pode obter u m vaior
de probabilidade associada de 0 ,0 6 ou 0,04. Da mesma maneira, como H o w ell (2002) nota.
seria razoável tratar 0,051 e 0,75 como igualmente não-significatívos, sendo maiores d e 0,05'.’
A lém disso, devem 0,049 e 0 .0 0 0 0 i se r considerados igualmente sig n ific a tiv o s, re latad o s
ambos como p < 0,05?
Outro problema associado à abordagem > 0,05/< 0,05 é sua tendência a levar a uma
visão ortodoxa na qual o ponto de corte 0 05 c tido como uma regra que nunca deve ser
quebrada. Conseqüentemente, as pessoas tendem a pensar que se um resultado está abaixo
desse limite, deve ser importante e. se está acima desse limite, não é de interesse algum. O
problema é que esse ponto de corte deve ser entendido simplesmente como um guia, e não
como uma regra fixa, pois ter significancia estatística nem sempre significa ter importância.
Isso acontece porque o tamanho da amostra afeta a significancia estatística, como veremos
mais tarde. Embora valores p exatos forneçam mais informação do que o relato de < 0.05 ou
> 0,05, a convenção de usar critérios de valores de probabilidade tem seus adeptos, muitos
dos quais acreditam que o método convencional de relatar valores p fornece um padrão
comum para avaliar alegações estatísticas. Entretanto, como Rosnow e Rosenthal (1989)
disseram:
Com certeza De: ; ama o 0,06 tanto quanto o 0.05.
I Atividade 7.1
I. O p r o b l e m a
O h ! O f é g ra n d e , e o p é p e q u en o
E p o r isso no s o rg u lh a m o s
O q u e sig n ifica nós n ão p o n d e ra m o s
A p e n a s a h ip ó te se n u la rejeita m o s
O u o q u i-q u a d ra d o é g ra n d e , e o p q u a se nulo
R esu ltad o s c o m o esse servem bem
E se fo r p reciso u m a e le ição ?
N ão se p re o c u p e , e sta m o s a m il!
A m e n sa g e m a p re n d e m o s bem !
S ig n ific â n c ia ! Já sei de cor!
II. A s i m p l i c a ç õ e s
A m o ral da nossa p e q u e n a histó ria í1
Q u e nós m o rta is so m o s frá g e is
M a s, q u a n d o o b te m o s um p p ró xim o d e ze ro ,
T o rn a m o s-n o s heróis co m g ló ria .
M as a v is a m , e n tã o , c u id a d o , a m o rte!
Po d em o s n ó s, ta lv e z , e vita r nossa so rte?
S u b stitu in d o esse d e sejo pela rejeição d a h ip ó te se nula
R e la ta n d o do ta m a n h o do efeito o p o rte .
Isso p o d e não no s g a ra n tir a g ló ria
M as pelo m e n o s co n ta -se u m a histó ria
Q u e é ju s to o tip o de e n c a n to
Q u e fa z a v a n ç a r o nosso c a m p o .
(R o b e rt R o se n th a l, 1 9 9 1 )
Tamanho do efeito
-V —X,
média dos desvios padrões
Pequeno 0.20 85
Medio 0,50 67
Grandi1 0.80 53
3 Poder
1 A tabela que fornece a percentagem de área sobreposta para valores d de 0.1 a 0.5 foi dada no Capítulo 6. página 224
Estatística sem Matemática para Psicologia 253
■ O ta m a n h o d o e fe ito e sp era d o
■ O n ível d e crité rio de sig n ific a n c ia (p. ex., o v alo r d o nivel de sig n ific a n c ia n o qual
você e stá p re p a rad o a a c e ita r q u e os re su lta d o s p ro v a v elm e n te n ã o seja m re su lta n te s
de e rro am o strai)
■ O n ú m e ro de p a rtic ip a n te s no e stu d o
■ O tip o de teste e sta tístic o u sad o
■ S e o d e lin e a m e n to d o e stu d o é e n tre p a rtic ip a n te s o u d e n tre p a rtic ip a n te s
■ S e a h ip ó te se é uni ou bicau d ai
p = 0 .0 2
p = 0 . 1 6
Atividade 7.2
SCORE Equal 5.660 0.098 -1.46 3 0.239 -4.1667 2.846 -13.225 4.892
(ESCORE) variances
assumed
(igualdade de
variâncias
assumida)
Sig. = Significancia
E x istem tão po u co s p articip an tes nesse e stu d o que, em b o ra p areça e x istir um a boa d ife re n
ça en tre as m édias (4,17 na d ireção e sp e ra d a), esta p o d e ter sid o c a u sa d a p o r e rro am o strai.
F az sen tid o p e n sa r q u e, se re p etísse m o s esse e stu d o co m o u tro s cin c o p artic ip a n te s, p o d eriam
ser e n c o n trad o s valo res to ta lm e n te d ife re n te s a p en as p o r acaso . C o n se q ü e n te m e n te , v o cê tem
q u e e n c o n tra r u m a d ife re n ç a m u ito m a io r e n tre os g ru p o s c o m esse n ú m e ro de p a rtic ip a n tes
p ara que os seu s in terv alo s de c o n fian ç a sejam m ais e stre ito s e o v alo r d a p ro b a b ilid a d e a s
so ciad o seja m ais b aix o . Se u sa sse um n ú m ero g ran d e de p a rtic ip a n te s em c a d a g ru p o , veria
que o teste é d ecla ra d o c o m o “e sta tistic a m en te sig n ificativ o ” com u m a d ife re n ç a m e n o r en tre
grupos. N o e x em p lo p resen te, o in terv alo de co n fia n ç a é grande. E sp e ra -se que a d iferen ç a da
m ed ia p o p u la c io n a l (co m 9 5 % de c o n fia n ça ) p o ssa se r e n c o n tra d a e n tre 13,225 e + 4 ,8 9 2 .
Isso sig n ifica q u e esta m o s co n fia n te s d e q u e, se o e x p e rim e n to fo sse rep etid o , a m éd ia d o g ru
po da c o n d içã o com b a m lh o pode ser m a io r que a d a c o n d iç ã o sem baru lh o , ou a co n d içã o sem
b aru lh o p o d e se r m a io r q u e a co n d iç ã o co m b aru lh o , ou p o d e m ser iguais. Isso se a sse m e lh a a
c o n fiar qu e o tem p o estará b o m , ru im ou neu tro am an h ã . N ão nos é m u ito útil. Com tão poucos
participantes, temos um poder baixo - se um efeito existe, não temos muita probabilidade de
encontrá-lo, pois qualquer efeito pode ter ocorrido por erro amostrai.
256 C hristine P Dancey & John Reidy
SCORE Equal 1.024 0.313 -8.12 214 0.000 -3.8259 0.471 -4.755 -2.897
(ESCORE) variances
assumed
(Igualdade de
variâncias
assumida)
Sig. = Significancia
Atividade 7.3
7.4.5 Delineamento
O s d e lin e a m e n to s de m e d id a s re p e tid as a u m e n ta m o p o d e r p o rq u e re d u z e m a v a ria b ili
dad e d e n tre p a rtic ip a n te s, p o is c ad a p a rtic ip a n te a tu a c o m o o seu p ró p rio co n tro le. C o n sid ere
a u tiliz a ç ã o de um d e lin e a m e n to de m e d id a s re p etid a s em vez de u m d e lin e a m e n to in d e p e n
d e n te se m p re q u e puder.
Atividade 7.4
Tipo de parto
n2
IC de IC de IC de IC de Probabili (tamanho
Variáveis Dependentes Média 95% Média 95% Média 95% Média 95% Razão F dade F do eleito)
1 Autopercepção do risco de ■'1,30 0.62-1.98 hl,30 0.95-1,65 '"'4,20 3,64—4.76 1.50 1.12-188 *39.65 0.001 0,77
ferimentos graves (0,95) (0.48) (0,79) (0,53)
2 Satisfação com o alívio da 2.30 1,29-3,1 2,70 1,34-3,46 4,00 3,25-4,75 1,50 0,89-2.11 *8.77 0,001 0,42
dor durante o parto (1,42) (1,06) (1,50) (0,85)
OC
CJ
0.35
«n
3 Nível de sofrimento durante *6,56 0,001
‘f
■'2.20 1,26-3,14 h2,30 1.62-2,98 * 4 ,2 0 3.64^1.76 ‘ 2.60
o parto relatado pela paciente (1.32) (1,95) (0,79) (1.43)
4 Apoio social: número de 3,60 1,59-5.60 3,80 1,51 -6.08 0,00 0,00-000 2,50 0,15—4.84 4.25 0,01 0.06
familiares que vivem em um (2,79) (3.19) (0,00) (3,27)
raio de cinco milhas
5 Emoções depressivas 3,20 1,13-5,27 6,90 4.73-9.07 4,20 2,27-6,13 3.70 2.12-5,28 3.66 0.02 0,23
(HAD) (2,90) (3,03) (2,70) (2.21)
6 Ansiedade (HAD)* 6,80 3.12 10,48 6.60 3,73-9.47 7,10 4,70-9,50 4,60 2.52-6.68 0,83 0.49 0.07
(5,14) (4.01) (3,35) (2,91)
7 Reação de evitaçâo (IES )** 4,60 -0,95-10.15 5,90 3.05 875 7,00 2.69-11.51 3,80 1,70-5.90 0.66 0,58 0,05
(7,76) (3,98) (6,02) (2.94)
X Reação de intrusão (IES) 8,00 2.07-13,93 7,10 3,62-10,58 11,30 6.09-16,51 7,90 1.66-14,14 0,63 0,60 0.05
(8,29) (4.86) (7.29) (8.72)
Notas: médias com um sobrescrito em comum são significativamente diferentes em um teste Scheffé: razões F com asterisco são significativas em p < 0.0063: o procedimento Bonferro-
ni (onde p = 0.05/N-dos-testes, isto é. 8 aqui, são de Dunn, 1961) foi utilizado.
■■ N. de T. HAD (Hospital Anxiery and Depression) é um questionário (escala) para m edir a depressão e a ansiedade d e pacientes, hospitalizados
** N. de T. IES I lmpact of Evcm Sculc) c um questionário u tili/ad o para m edir a sensação dc intrusão e evitação.
Estatística sem M atem ática para Psicologia 261
Exemplo da literatura:
terapia cognitiva e síndrome do intestino irritável
V o llm er e B la n c h a rd (1 9 9 8 ) d e sig n a ra m p a c ie n te s co m a sín d ro m e do in te stin o irritáv el a três
c o n d içõ e s de tratam en to : te ra p ia c o g n itiv a de g ru p o (T C G ), te ra p ia c o g n itiv a in d iv id u a l (T C I) e um
g ru p o de c o n tro le fo rm a d o p o r p a cie n te s em lista d e e sp e ra (C L E ). N a c o n d iç ã o T C G , h a v ia so m e n
te 3 a 5 p ac ie n tes, e a d u ra ç ã o d o tra ta m e n to foi de 10 sem an as. E le s c o m p a ra m os g ru p o s p o r m eio
de várias m ed id as (p. ex., re d u ç ã o de sin to m a s). F e z - se u m a d a s c o m p a ra ç õ e s e n tre as c o n d iç õ e s
T C G e T C I. C a lc u lo u -se o ta m a n h o do e fe ito , q u e era p eq u en o . O s p e sq u isa d o re s re la ta ra m esses
re su lta d o s e os in terp re taram d a seg u in te m an eira:
A ... comparação das condições TCG e TCI não foi significativa [F( 1,21) = 0,11, p = 0,75].3 O tamanho
do efeito para essa comparação indicou que 4% da variância é explicada pelas condições de tratamento. Uma
equação foi gerada para encontrar o tamanho da amostra necessário para se obter urna diferença significativa
entre os grupos tratados. Com um poder estatístico de 0,80 e um nível de significância de 0,05, seriam ne
cessários 1158 pacientes para se obter uma diferença significativa entre as condições TCG e TCI. Portanto,
parece que os dois tratamentos ativos foram equivalentes em eficácia para todos óS propósitos práticos.
Exemplo da literatura:
respostas emocionais de mulheres a tipos de parto
M aclean e c o la b o ra d o re s (2 0 0 0 ) c o m p a ra ra m q u atro g ru p o s de m u lh eres: a q u e la s q u e tiveram
filhos p o r parto vaginal esp o n tân e o , parto v ag in al in d u zid o , p arto v a g in al in stru m e n ta l ou cesarian a.
H av ia 10 p artic ip a n te s em c a d a g ru p o . As m u lh e re s fo ram c o m p a ra d a s em 8 v ariáv eis in d e p e n d e n
tes p o r u m a série d e an álises d e v a riâ n c ia de u m fator. N ão é co m u m e n c o n tra r um artig o p u b licad o
no q u al ten h am sido in c o rp o ra d o s to d o s os p o n to s m e n c io n ad o s q u e c o n sid e ra m o s d e b o a p rática.
C o m o você v erá na T abela 7 .1 . os a u to res fo rn ec e m m éd ias, lim ites de c o n fia n ç a , v alo res d e p ro b a
b ilid ad e ex ato s e u m a m e d id a do e fe ito ( r f ). V ocê n o tará q u e u tiliz a ra m um c rité rio de sig n ific ân c ia
c o n tra o q u a l c o m p a ra r as p ro b a b ilid a d e o b tid a s. E les n o s d e ra m in fo rm a ç õ e s c o m p le ta s so b re a
m a n e ira na q ual 0 v a lo r d o c rité rio (p < 0 ,0 0 6 3 ) foi d e te rm in a d o . A ta b e la e stá re p ro d u z id a p o r
c o m p le to - um m o d elo p a ra a b o a prática!
Resumo
95% Confidence
Interval of the
Difference
(IC de 95% para
Sig. Mean Std. Error a Diferença)
(2-tailed)
Df (Sig. (Diferença (Erro Padrão Lower Upper
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superior)
Equal variances 34.863 0.000 -6.807 19.000 0.000 -27.7000 4.0692 -36.2169 -19.1831
not assumed
(Igualdade de
variâncias
não-assumida)
Sig. = Significância
Podemos ter 95% de confiança de que: Qual é a conclusão mais sensata? Estam os 95%
(a) A diferença da média populacional é 27,7 confiantes de que a linha de regressão populacio
(b) A média populacional estará entre 19,18 e nal seria:
36,2] (a) Positiva (+0.30)
(c) A média populacional estará entre 19,46 e (b) Zero
35,93 (c) Negativa ( - 0,2)
(d) Os resultados serão importantes (d) Entre - 0,2 e +0,7
12. Um pesquisador encontrou um coeficiente de 13. Observe a seguinte saída de uma análise de teste. I
N Correlation Sig.
(Correlação)
Sig. = Significancia
Estatística sem M atem ática para Psicologia 265
95% Confidence
Paired Differences Interval of the df
(Diferenças Emparelhadas) Difference t Sig.
(gl)
(IC de 95% para
Mean Std. Std. Error a Diferença)
(Média) Deviation Mean (Erro
(Erro Padrão) Padrão da Média)
Lower Upper
(Inferior) (Superior)
Pair 1 congruent-errors & neutral-errors -0.1500 0.7647 8.550E-02 -0.3202 0.02 -1.754 79 0.083
(Par 1) (erros congruentes e erros neutros)
Sig. = Significancia
Qual é a resposta mais sensata? 16. Quais sao as chances de encontrar um efeito (se
(a) A diferença da m édia da am ostra é -0,15, e existente) quando o poder é 0,6?
lemos 95% de confiança de que a diferença (a) 50:50
da média da população estará entre -0 ,3 2 e (b )60:40
0,02 (c) 40:60
(b) A diferença da média da am ostra é 0,76, e (d) 60:60
tem os 95% de confiança de que a diferença 17. Os intervalos de confiança em lorno de um valor
da m édia da população estará entre -0 ,3 2 e de média nos fornecem;
0,02 (a) Um raio dentro do qual a média populacional
(c) A diferença da média da am ostra é -0 ,1 5 , e provavelmente será encontrada
tem os 95% de confiança de que a diferença (b) Um raio dentro do qual a média amostrai pro
da média da população estará entre -0 ,1 5 e vavelmente será encontrada
0,17 (c) Uma estimativa por ponto da média popula
(d) Os resultados são importantes cional
(d) Uma estimativa por ponto da média amostrai
14. i; mais importante saber o poder de um estudo
quando: 18. Quando o seu teste estatístico se torna mais pode
roso, o seu intervalo de confiança se torna:
(a) O estudo tem um número grande de partici
pantes e é estatisticamente significativo (a) Mais largo
(b) O estudo tem um número grande de partici (b) Mais estreito
pantes e não é estatisticamente significativo (c) Não faz diferença alguma
(c) O estudo tem um número pequeno de partici 19. Se d = 0,89, o efeito é:
pantes e é estatisticamente significativo
(a) Zero
(d) O estudo tem um número pequeno de partici (b) Fraco
pantes e não é estatisticamente significativo (c) Moderado
15. Em relação a efeitos grandes, efeitos pequenos (d) Forte
são: 20. Quando o conhecimento do poder é mais impor
(a) Mais fáceis de detectar tante?
(b) Mais difíceis de detectar (a) Quando você encontra um efeito
(c) Tão fáceis de detectar quanto os grandes (b) Quando você não encontra um efeito
(d) Tão difíceis de detectar quanto os grandes (c) Não faz diferença alguma
266 C hristine P. Dancey & John Reidy
Referências
DCOHEN, J. Statistical Power Analysis fo r the Behavioral Sciences. New York: Academic Press,
1988. 2'lJedn.
DUNN, D. J. Multiple comparisons among means. Journal o f the American Statistical Association, v.
56. p. 562-64, 1961.
HOWELL. D. C. Statistical Methods fo r Psychology. Boston: PWS-Kent, 2002. 5th edn.
KRAEMER, H. C.. THIEM AN, S. How Many Subjects? London: Sage, 1987.
KRANTZ. D. H. The null hypothesis testing controversy in psychology. Journal o f the American
Statistical Association, v. 94, p. 1372-81, 1999.
MacDONALD, R. On statistical testing in psychology. BritishJournal o f psychology. V. 88, p. 333-47,1997
MacLEAN, L. I. McDERMOTT, M. R., MAY, C. P. Method of delivery and subjective distress:
women’s emotional responses to childbirth practices. Journal o f Reproductive and Infant
Psychology, v. 18, n. 2, p. 153-62, 2000.
NICKERSON, R. S. Null hypothesis significance testing: a review of an old and continuing
controversy. Psychological Methods, v. 5, n. 2, p. 241-301, 2000.
ROSENTHAL, R. Cumulating psychology: an appreciation o f Donald T. Campbell. Psychological
Science, v. 2, n. 2, p. 213, 217-21, 1991.
ROSNOW, R. L., ROSENTHAL, R. Statistical procedures and the justification o f knowledge in
psychological science. American Psychologist, v. 44, n. 10, 1276-84, 1989.
STEVENS, J. Applied M ultivariate Statistics for the Social Sciences. New Jersey: Lawrence Erlbaum
Associates. 2002, 4lh edn.
VOLLMER, A. BLANCHARD, E. B. Controled comparison of individual versus group cognitive
therapy for irritable bowel syndrome. Behavior Therapy, v. 29, p. 19-33.
Medidas de Associação
Panorama do capítulo
No Capítulo 5, você aprendeu como analisar o relacionamento entre duas variáveis utilizan
do o coeficiente r de Pearson. Esse valor é útil para fornecer uma idéia do grau de associação
entre duas variáveis contínuas. Você viu como representar tal relacionamento por meio dos dia
gramas de dispersão. Aprendeu o que é um coeficiente de correlação e que r é um tamanho
do efeito natural. Neste capítulo, mais uma vez abordaremos relacionamentos, ou associações:
atentaremos para a análise do relacionamento entre variáveis categóricas por meio do %2ou o
qui-quadrado.
Você aprendeu sobre estas variáveis no Capítulo 1. Se, por exemplo, classificarmos pessoas
com base na cor da blusa ou camisa que estão usando, trata-se de uma classificação em catego
rias. Da mesma forma, se classificarmos pessoas por grupos étnicos, religião ou por país no qual
vivem, estaremos fazendo julgamentos categóricos. Não faz sentido ordená-las numericamente.
Neste capítulo, você aprenderá a:
analisar a associação entre duas variáveis categóricas;
registrar outra medida do efeito (o V de Cramer);
■ relatar os resultados de tais análises.
A análise do relacionamento entre variáveis categóricas inclui os seguintes tópicos:
contagem da freqüência sob a forma de uma tabela - isso será explicado mais adiante;
Testes inferenciais que indicam se o relacionamento entre as variáveis pode ter ocorrido
devido a erro amostrai, considerando que a hipótese nula seja verdadeira;
o tamanho do efeito: (qui-quadrado) pode ser convertido em uma estatística denomi
nada V de Cramer - isso é interpretado da mesma forma que qualquer outro coeficiente
de correlação. Felizmente, pode ser obtido com o SPSSPW.
!% &
1O teste x pode ser entendido como um teste de associação ou de dilcrença* entre categorias - depende da forma como o problema
é colocado.
Estatística sem M atem ática para Psicologia 269
Atividade 8.1
20 60 10 20
2 0 + 6 0 + 10 + 2 0 = 110 p e s s o a s n o to ia l
270 Christine P. Dancey & John Reidy
110/4 = 27,5
Tabela 8.3 Freqüências observadas e esperadas de pessoas que preferem diferentes marcas de
chocolate
Observadas 20 60 10 20
Esperadas 27,5 27,5 27,5 27,5
Atividade 8.2
-C
< 4
50 25
Í 15
È
10
r
10
Estatística sem M atem ática para Psicologia 271
20 27.5 = -7.5
60 27.5 = 32,5
10 27,5 = -17.5
20 27.5 = -7.5
1 10 110
- 7 . 5 : = 56,25
3 2 ,5: = 1056,25
- 1 7 ,5 2 = 306.25
- 7 ,5 : = 56,25
5 6 ,2 5
= 2 ,0 5
2 7 ,5
1 056.25
38.41
2 7 ,5
3 0 6 .2 5
= 11.14
2 7 .5
5 6 ,2 5
= 2 .0 5
2 7 ,5 '
T otal = 53,65
E n tã o , o yj é 5 3 ,6 5 (53,7).
IL'lSlalO b Ijil-dlulJiZilul
- S P S S D a ta E d ito r B E I E3
File Edit Yiew Qata Iranstorm ônalyre graphs dirties window tjeip
IН им йз| i i Ь |Ы « I rlr I U lllr .l vl^l
1 chocolot 1
chocolat freq I I I I I I —
1I 1 00 20 00
2 2 00 60 00
3■ “ 3 00 10 00 ■
'
4 4 00 20 00" " .........
,-iflS la r t| 1ДУ Microsoft Word - с | Exploring - С \stat |||jp [o n H v a rch isq u n r fffj Outpuil - S P S S Vi | 0 14:46
H Offi ce [ 3 0 1 S T 4 U U I« I iL 'ie la lo l 1j U ld U lQ l u l
ы
sa \t -SPSS
Ш] o n e v a r c h is q u u re D a lo E d ito r Í
M*.l
Fi le Edit Viev- | ? Щ | Transform AnaJyre ¡¿raphs Utilities ^Vindow {Help
Spirt Eile
Select C o s e s
[ f\ D a ta V ie w ( V a r ia b le V i e w / j j J ______________________ | jJ '
Weight C a s e s S P S S P to cesso r is ready
-|g|x|
F iIp E d il V ie w Q nin Transform £nnty,-ß Q raphs U iiIiUp -1. W indow H elp
-
freqüências para
a caixa Frequency
Variable (Variável
Freqüência)
Z E O \ D a t a V ie w ( V a r i a b l e V i e w / I jl L
S P S S P r o c e sso r is read y
„(0 S t u r i j LlV ‘‘ " • I • . ' ' , — ii n e v u r r h iN H u o r J < «»r. ■■ | ” ' O ' : '
U U Ie l l|J ls | a |o | v .U U b 0 l0 |u |
FTTg o n e v a rch is q u a re .s a v - S P S S D a ta Ed itor j
F ie £ d il V iew D a ta Transform G ra p h s ytililies W indow H elp
R e c o ils ►
=1& J J *
D gscnptrve Statistics »
Custom I a b l e s *
Co m p are W e ans *
freq
G e n eral L in ea; M odel *
1
1 1
1 1 H
00 20 Correlate ►
2 00 60 B e g re ss io n »
3 00 10 Lfig linear »
4 00 20 C la ssify ►
_ 1
Q a ta R eduction ►
S cg Je ►
Nonparam etric T e s t s M Chi-Sq uare
T im e S e n e s ► Binom ial
Survival » Buns
Multiple R e s p o n s e * 1-S am p le K-S.
M issing y a lu e A n aly sis 2 Independent S a m p le s
& Independent S a m p le s
2 R e late d S a m p le s
K R e la te d S a m p le s
I I\ D a ta Vi e w ( V a r i a b l e V i e w / | <I
Chi-Sq uare S P S S P ro c e sso r is re a d y
■itC S to rt [ ¿ y M icrosoft W ord - c | Exploring - C.\stof |[|^}| o n e v a r c h is q u a r ... ¡Outpull -SPSSVi... I i J s E O H:56
274 C hristine P. Dancey & John Reidy
• Chi-Squ ore T e s i
El
Ie s » V a riab le U si
♦г
Help
E x p e cted R a n g e E x p e cted V a lu e s
С U s e sp ecified fange C V a lu e s
E^act
Üphons
[ |\ D a t a V ie w ( V a r i a b l e V i e w /
S P S S P ro c e sso r is rea d y
Para o x de u m a v ariá v el, é im p o rta n te re g istra r o valo r da e sta tístic a teste, os g rau s de
liberdade e a p ro b a b ilid a d e a sso cia d a . N o e n tan to , a p rim e ira se ção d a saíd a do x co n firm a
n o sso s c á lc u lo s n a S e ç ão 8.2.1.
CHOCOIAT (CHOCOLATE)
Ì 20 27.5 -7 .5
2 60 27.5 32.5
3 10 27.5 -1 7 .5
4 20 27.5 -7 .5
Total 110
Estatística sem M atem ática para Psicologia 275
Observadas 20 60 10 20
Esperadas 27.5 27.5 27.5 27.5
Atividade 8.3
(a) x 2 r x c
(b) x 2 d e um a variável
(c) x 2 2 x 2
(d) N enhum a das alternativas acim a
O SPSS fornece agora dois tipos de (estes de signifícância para tabelas cruzadas e dois testes não-param étricos. A signifícância as-
sintóiica se fundam enta em grandes am ostras. U tiliza-se signifícância exata quando o conjunto de dados e' pequeno, desbalanceado
ou não atende à suposição de norm alidade.
276 Christine P. Dancey & John Reidy
Canhotos Destros
Observadas 120 30
Esperadas sob a hipótese nula 75 75
Canhotas Destras
n n
Observadas 268 49
Esperadas 285,3 3 1,7
! r*<*> 1 i i i i i i ■ i i i -
t-ilCmwv 1 00 X 6 00
1 00 49 00
' »
- . . *
.„ c
Mnt Cm«
•I • |\Uü<d View X
Ow.
<
■ • /
jM J
■| • |\üa»aVwvt ^ t ->«w/
¿ÉÊ2- * h jjj_ «U M
w — « aa
A variável !3Krtf
teste hand
(m ão) é
m ovida para
esta posição
ÉfiÊELÍ-®
Estatística sem M atem ática para Psicologia 279
HS&QQESSSOEZHHIHHiHHHIHHHHHHHflHflflBHMHHHHHHBEI
í H i 3) •- k r? M . *T r**i EZ3;itin; *
280 Christine P. Dancey & John Reidy
to ~ noa
Cãf a <9 Bi • i= & « -T r'_ C n , 3>
J ______ I I______ L i i
I*íiV*ubi* UM Cl. i
-------------------
«•■und
dl £ * '"
C<rc<> 1
í■C+Xrj f» fll
• 5«Hica4»r» ' Al M ií
_H *J
I------
i ______ '
fa * í :
-----------*’ fot***
—
HAND (MÃO)
HAND (MÄO)
O x ' perm ite que se descubra se existe u m relacio n am en to ou associação entre duas variáveis
categ óricas (p. ex., a asso ciação entre fum ar [fu m an te/n ão -fu m an te] e o h áb ito de b eber [bebe
d o r/ab stêm io ]). E sses são dad o s c a te g ó rico s p o rq u e não estam o s p erg u n ta n d o so b re q u an to s
cigarros as pessoas fum am ou quanta b ebida alcoólica consom em . E stam o s apenas pergu n tan d o
se elas fum am ou bebem . Tal d elin eam en to será sem elh an te ao da T abela 8.4.
E sse tip o d e tabela de contingência é d e n o m in a d a 2 x 2 p o rq u e ex iste m d u as lin h a s e
d u as co lu n as.
Fuma
Não fuma
A ) Q u a n to s de v o cês fu m am e b eb em ?
B ) Q u a n to s fu m am , m as não b e b em ?
C ) Q u a n to s não fu m a m , m as b eb em ?
D ) Q u a n to s não fu m a m nem b eb em ?
G ru p o 1: 5 0 (célu la A)
G ru p o 2: 2 0 (célu la B)
G ru p o 3: 15 (c é lu la C)
G ru p o 4: 25 (célu la D)
1 i 50
1 2 20
2 1 15
2 2 25
Atividade 8.4
Atividade 8.5
Se você quer testar a hipótese de que os estudantes preferem o chocolate Galaxy em vez
do Mars, Milky Way ou Star, que tipo de análise seria mais apropriada?
(a) Teste de independência %2 2 x 2
(b) Teste de independência %2 2 x 4
(c) x2 de uma variável
(d) Nenhuma das alternativas
284 C hristine P. Dancey & John Reidy
□ SPSSPW: X2 2 X 2
F I Office C 2 0 E iL IS la lo k -lj|.-d iy u i0 |u l
HE] twobytwuchisquorn s i tv - S P S S D a ta Editor - If il X I
dnnk C o m p ere M ea n s
G en eral L inear M odel
►
►
Explore
Q rosstab s
I 00
C orrelate >
1 00 E e g r e s s io n ►
2 00 Laglm ear ►
2 00 C la ssily ►
Q a ta R eduction ►
S c a le *
Nonparam etnc T e s t s »
T im e S e n e s »
S urvival *
Multiple R e s p o n s e ►
M issing V a lu e A n aly sis
[ |\ D a t a V ie w { V a r i a b l e V i e w / j < I
C ro ssto b s S P S S P ro c e sso r is rea d y
-Jlalalnk-UUNiiilaliul |
ЕЗв £dit V ie w Q a la Ira n sfo rm A n a lyze G ra p h s Utilities ^¿indow tJelp
Estatística sem M atem ática para Psicologia 285
E lle £drt ^ le w Eí®t® Iran sto rm A n atyre jjr a p h s Utilities \£¿'mdow Help
Nominal Ordinal
P £ ia f~ R isk
r ycN em a;
r F~
« 1» 1\ Data Vi Ejjact Statistics C e lls
Iarla|-iite>|jj|2fl|g| lL-;|g|aloM-jUlij|:JlelU
- |g |* l
ñ le £dit V iew Q ota Transform A n aly ze g ra p h s Utilities W indow Help
Aparecerão
as frequências
observadas
e esperadas
~| [\ D a t a Vi
SMOKE (FUMAR)
Estatística yj'
O S P S S P W a p re se n ta v árias lin h a s de esta tístic a s. E n tre ta n to , você p re c isa d a p rim eira
d elas. E d e n o m in a d a de Pecirson, e você p re c isa re g istra r o v alo r do o n ú m ero de g ra u s de
lib erd ad e e o nível d e p ro b a b ilid a d e asso ciad o .
1/ de Cramer
■ 50 p e sso a s q u e fu m a m e b eb em
■ 15 qu e b e b e m , m as não fu m am
■ 20 p esso as q u e fu m a m , m as não b eb em
■ 25 p esso as q u e n ão fu m am nem b e b e m
Estatística sem M atem ática para Psicologia 287
Count (Contagem)
do you smoke?
(você fuma?) Total
no (não) 20 25 45
Total 70 40 110
/ X2 = 12,12
Chi-Square Tests (Testes Qui-Quadrado)
Continuity Correction3
10.759 1 .001
(Correção de Continuidade3)
Likelihood Ration -
12.153 .000
(Razão de Verossimilhança)
N of Valid Cases
110
(N dos Casos Válidos)
Sig. = Significancia
a. Not assuming the nuil hypothesis. (Desconsiderando a hipótese nula.)
b. Using the asymptotic standard error assuming the nuil hypothesis. (Utilizando o erro padrão assintótico e considerando a hipótese nula
c. Based on normal approximation. (Com base na aproximação normal.)
L'ma análise com o % foi executada para descobrir se existe uma relação significativa entr;
os hábitos de fumar e beber entre estudantes universitarios. O valor do x foi de 12,12 com uir_
probabilidade associada (valor-p) de menos de 0,001 para um grau de Uberdade de 1, mostrand
que tal relacionamento é bastante improvável apenas como resultado do erro amostra! (ao acaso). O
V de Cramer obtído foi de 0,33 aproximadamente 11% das variações das freqüências dos fumante ■
podem ser explicados pelas variações das freqüências dos que bebem. Assim, é possível conclu -
que existe uma relação entre os hábitos de fum ar e beber.
Count (Contagem)
do you smoke
(você fuma?) Total
Total 65 35 100
290 C hristine P. Dancey & John Reidy
CUIDADO!
Atividade 8.6
O V de C ra m e r é:
(a) U m a m e d id a de d iferen ça
(b) U m c o e ficie n te d e co rre la ç ã o
(c) U m a e sta tístic a e q u iv a le n te ao te ste da p ro b a b ilid a d e exata d e Fisher
(d) U m c o e ficie n te de va ria çã o
Bebem muito
Bebem moderadamente
Não bebem
Estatística sem M atem ática para Psicologia 291
L em b re -se: g l = (r - 1 ) .( r - I )
A ssim : 2 x 2 = 4
Atividade 8.7
V e rd a d e iro ou fa lso :
15 40 36 15
ou esses
36 22 22 40
com o esses
22 36 40 22
ou esses
40 15 15 36
Exemplo da literatura:
classe social e tranqüilizantes
Redução Nâo-redurão
dos tranqüilizantes dos tranqüilizantes
B e n n in g h o v e n e c o la b o ra d o re s (2 0 0 3 ) e stu d a ra m as fo rm a s p e la q u a is p a c ie n te s q u e so fre m
de b u lim ia n e rv o s a d ife re m d e o u tro s p a c ie n te s em p s ic o te ra p ia e de p a rtic ip a n te s em c o n tro le
n ã o -c lín ic o em te rm o s d as fo rm a s de p e rc e b e re m o re la c io n a m e n to fa m ilia r a tu a l e p a ssa d o . É
im p o rta n te m o s tra r q u e tais g ru p o s n ã o d ife re m em v a riá v e is d e m o g rá fic a s - a ssim , q u a lq u e r d ife
re n ç a n as v ariáv eis d e in teresse (n esse c aso , a p e rc e p ç ã o d o re la c io n a m e n to ) n ão deve se r a trib u íd a
а, p o r ex e m p lo , id ad e ou status p ro fissio n a l. B e n n in g h o v e n e c o la b o ra d o re s se p re o c u p a ra m co m
a a s s o c ia ç ã o e n tre os d ife re n te s g ru p o s em te rm o s d e status p ro fiss io n a l. R e la ta ra m o re su lta d o
c o m o na T ab ela 8.10. É um y£ 3 x 4. O g ra u d e lib e rd a d e é (n - 1).(/? - 2 ) q u e é (3 - 1).(4 - 1) =
б. O x = 3,5 tem u m a p ro b a b ilid a d e a ss o c ia d a de 0 ,7 4 4 . D esse m o d o , n ão ex iste u m a asso c ia ç ã o
en tre os três g ru p o s e o status p ro fissio n al.
Trabalhadores 18 28 15 r = 3.5
Estagiários 12 11 10 gl = 3.5
Estudantes uni\.jr. itários 71 56 75 p = 0.744
Donas de casa 0 6 ü
Resumo
■ P ara a an álise d o re la c io n a m e n to e n tre v ariáv eis c a te g ó ric as, o y j é a e sta tístic a infe-
ren cial ap ro p ria d a .
■ O x de u m a v ariáv el (ou teste de a d e rê n c ia ) tem u m a v ariá v el c o m v ário s níveis. O
teste m o stra se as freq ü ê n c ias n as c é lu la s são sig n ific a tiv am en te d ife re n te s d as que
e sp e ra m o s, co n sid e ra n d o a h ip ó te se n u la v erd ad eira.
■ O teste y~ d e in d e p e n d ê n c ia m o stra se ex iste u m a asso c ia ç ã o sig n ificativ a e n tre du as
variáveis (co m d o is ou m ais níveis). A e sta tístic a teste é o re su lta d o d e um cálc u lo
m o stra n d o o g rau de d ife re n ç a e n tre as fre q ü ê n c ia s o b se rv a d a s nas c é lu la s e as e s p e
rad as. c o n sid e ra n d o a h ip ó te se n u la v e rd a d e ira (isso é, sem h a v er re la c io n am en to ).
■ O y~ tem alg u m as restrições (v er página 281). Se violadas, p ara u m a tabela 2 x 2 o teste
exato de F ish er pode ser executado. Isso é feito auto m aticam en te no SPSSPW .
■ O z * p o d e se r c o n v e rtid o n o V d e C ra m e r (u m c o e fic ien te d e c o rre la ç ã o ) d e m o d o a
fo rn e c e r u m a m e d id a d o efeito . Isso é e x e c u ta d o a u to m a tic a m e n te p elo S P S S P W .
Exercício 1
Exercício 2
Fumante Não-fumante
B eb ed o r
A b slêm io
Exercício 3
10 X II 4
2. Q u al é o v alo r do %"?
3. Q u al é o v alo r d a p ro b a b ilid a d e ?
Exercício 4
E x ecu te um teste x n o s seg u in te s dad o s:
Fumante Não-fumante
Bebedor 70 32
Abslemio 7 I
Do Professor MJ
Senhor, NP (correspondência de 24 de julh o / tenta explicar a descoberta de GN (correspon
dência de 22 de julho) de que quinta-feira é o dia mais chuvoso da semana. Nenhuma explicação
é necessária. A variação dos números para os sete dias ê puramente casual como qualquer esta
tístico pode assegurar.
O número total de dias com chuva para iodos os sete dias é 938,9, com uma média cle 134,13.
F.sta média é um valor esperado para cada dia se a chuva fo r igualmente distribuída sobre os sete
dias. Um teste qui-quadrado pode ser utilizado para comparar os sete valores observados com os
esperados. O qui-quadrado resultante de 1,28 para 6 graus de liberdade é muito pequeno para
dem onstrar uma diferença significativa dos valores esperados. De. falo, o ocaso produzirá esta
diferença pelo menos 95 vezes em cada 100.
Sinceramente
Do Sr. AF
Senhor, parece impertinente que um simples graduado critique a sua correspondência, mas
seguramente o professor M J utilizou o teste estatístico errado em sua correspondência (de 27 de
julho). O teste qui-quadrado é utilizado para testar freqüências de ocorrência. Neste caso, lemos
296 C hristine P. Dancey & John Reidy
dados intervalares, e o leste t é que deve ser utilizado, requerendo o conhecimento do desvio p a
drão dos conjuntos de dados. Afora isso, os resultados provavelmente serão semelhantes.
No meu ponto de vista, quinta feira é o dia mais cluivoso como é o primeiro dia de um cam
peonato. Os selecionadores utilizam esta informação para escolher quatro lançadores rápidos qiu
provam ser totalmente inadequados para os restantes quatro dias secos .
Sinceramente
Count (Contagem)
evening 25 99 124
(vespertino)
Total 89 436 525
Linear-by-Linear Association
10.429 1 0.001
(Associação Linear versus Linear)
Sig. = Significance
a. 0 cells (.0% ) have expected count less than 5. The minimum expected count is 21.02.
(a. 0 células (0,0%) apresentam menos do que valores esperados. 0 valor mínimo esperado é 21.02)
3. Quantas mulheres e^tão no grupo das q u a rta ò de 6. 290 pessoas são questionadas sobre qual refri
manhã? gerante de cola preferem . O s resultados são os
(a) 127 seguintes:
(b) 43
(c) 99
(d) 210 Coca-Cola Pepsi Pepsi
Coca-Cola Pepsi
Light Twist Light
4. O x de Pearson apresenta uma probabilidade as
sociada de: 6_ 83 77 6 57
(a) <0,001
(b) 0,00004
(c) 0,00124 Q uais são as freqüências esperadas para as célu
(d) Nenhuma delas las?
(a )57
5. O número de pessoas na aná!i;,e é:
(b) 58
(a) 231 (c) 290
(b) 170
(d) Nenhuma das alternativas
(c) 124
(d) 525 7. Observe a seguinte saída:
Sig. = Significancia
Pearson Chi-Square
2 2 :3 0 5 -' 9 0.00796
(Qui-Quadrado de Pearson)
Sig.= Significância
a. 0 ceils (.0% ) have expected count less than 5. The minimum expected count is 21.02.
a (0 células (0,0%) apresentam valores esperados menores do que 5. A contagem mínima esperada e de 2 1.02).
a. Not assuming the null hypothesis, (a. Não assumindo a hipótese nula.)
b. Using the assymptotic standard error assuming the null hypothesis,
(b. Utilizando o erro paorão assintótico assumindo a hipótese nula.)
Referências
BENNINGHOVEN, D. et al. Family representantion in relationship episodes of patients with a
diagnosis of bulimia nervosa. Psychology & Psychotherapy v. 76. n. 3, p. 323-36. 2003.
BISH, A. et al. The role of coping strategies in protecting individuals against long-term tranquilizer
use. British Journal o f Medical Psychology, v. 69, n. 2, p. 101-15. 1996.
HOWELL, D. C. Statistical Methods fo r Psychology. Boston: PWS-Kent. 2002, 5 ‘ed.
Análise de Diferenças entre Três ou
Mais Condições: ANOVA de um Fatc
Panorama do capítulo
*1 Visualização do delineamento
PI PI I P2I
P2 PI 2 P22
PIO ’0 P30
Al A2 A3
PI P ll P2I
P2 P 12 P22
' A lgum as vezes o delineam ento de m edidas repetidas de um fator é confundido com o de dois fatores. Isso ocorre porque a repetição
dos participantes sobre todas as condições é tam bém denom inada de fator.
302 C hristine P. Dancey & John Reidy
A A NOVA procura verificar se e x iste m d ife re n ç a s n a s m edias dos grupos. Faz isso de -
term inando a m edia g e r a t e verificando o quão diferente cada m edia individual é da médu.
ge ral.
E x istem clois tip o s d e A N O VA :
Al A2 A3
9 15 21 >
9 15 25
9 16 17 Variação dentro do terceiro
9 15 22 grupo (de 17 até 26)
9 16 26
X =9 X = 15.4 X = 22.2 „
' A m édia geral c a media das dem ais médias - por exem plo. (Ml + M2 + M3)/3.
Estatística sem M atem ática para Psicologia 303
.3 Decomposição da variância
C o m o vo cê sabe, o o b jetiv o da A N O V A é d e sc o b rir se ex istem d ife re n ç a s e n tre as m é d ias
de g ru p o s, e isso é fe ito p e lo c á lc u lo in icial da m é d ia g eral, p ro c u ra n d o v e rific a r o q u a n to
c ad a m éd ia in d iv id u al d ifere d a m é d ia g eral. A v erific a ç ã o d e ssa s d ife re n ç a s é feita p o r m eio
da partição da variância , c o m o e x p lic a d o a seguir. A v a ria b ilid a d e nos e sc o re s, tan to d en tro
do s g ru p o s q u a n to e n tre os g ru p o s, re p re se n ta a v a riân cia total. E x istem d u as fo n tes q u e de-
304 Christine P. Dancey & John Reidy
term in am essa v a ria b ilid a d e Lotai: as in flu ê n c ia s e n tre o:> g ru p o s e d en tro dos g ru p o s. O q u .
a A N O V A faz e p a rtic io n a r e ssa v a ria b ilid a d e to ta l em d u as c o m p o n e n te s. P a ra fa zer isso . -
p re c iso e stim a r p or q u a n ta v a ria b ilid a d e c a d a u m a d essa s c o m p o n e n te s é resp o n sáv el.
Variância do Média
global Variância do
Grupo 1
Grupo 2
Variância dentro
do grupos
N. de T. Os autores estão supondo uma ANOVA balanceada, isto é. todos os grupos com o mesmo tamanho.
Estatística sem M atem ática para Psicologia 305
Variação entre
cada grupo
Variação dentro
de cada grupo
5 5 8
¡0 7 10
7 9 8
3 8 9
5 2 11
7 5 15
11 6 7
i 6 11
3 4 8
5 4 8
6 8 17
6 10 11
X = 70J I = 74.00 1 = 123.00
X = 5,83b *= 6,17 X= 10,25
DP = 2.69 DP = 2.33 DP = 3.05
'X = Total
bX = Média
O f llc e 1вг1аЫ
I 0.и Ы й ; II
n n e w n y a lc o h o l a n o v a d o c - S P S S D a t a Editor
File £d it V iew Q ata Transform I A n aly ze ¡¿ra p h s Utilities
Reßorts
c s |H |a |gg| I I МЫ w D escrip tive S tatistics
1 group Custom T a b le s
group score И
Means
g e n e r a l L inear M odel O n e-S am p le T T e s t
1 00 5
Correlate In depen dent-Sam ples I T e s t
2 00 10 J e g re ss io n
B E a ire d -S a m p le s T Test.
3 00 7
о
Loghnear
S
4 00 C la ssify
D a ta R eduction
5 00 5
S c a le
6 00 7
hjonpatem etric T ests
7 00 11 T jm e S e r ie s
8 00 2 ;S urvival
9 00 3 Multiple R e s p o n s e
г M issing \¿alue A n aly sis
10 00
11 00 6 00
12 00 6 00
13 1 00 5 00
14 1 00 7 00
15 ’ 1 00 9 00
I - I ► [\D ata V iew .\Vanable View / lL J a T 1
O ne-W ay A N O V A S P S S P r o c e sso r is re a d y
-"¡fiStartl ¿ y f i a o s oft W ord onp .w fjy tilc o h .. Output! - S P S S Vi | J .J Find F ile s nam ed |
308 C hristine P. Dancey & John Reidy
S erá aberta a se g u in te c a ix a d e d iá lo g o s.
A variável de
agrupamento
é movida da
caixa situada à
esquerda para
] [\ D a t a V i e w ( V a r i a b l e V ie w ? "
Factor (Fator),
S P S S P ro c e sso r is read y
à direita
jifi S tu rt I [jy Microsoft W o r d - с o n e w a y _ a !c o h ... fijjjj Output! - S P S S V i I Find F ile s n am ed . | S g -( - O
Я O n e -W a y A N O V A : P o s t H o c M ultiple C o m p a r is o n s f I. I- ^
1
2 Equal Variances Assum ed
3 Г LSD P S -Ñ -K Г Weller-Duncan -*
Г Jukey
Г T ufce ys-b Г Dunngtt
M arque o Г Quncan
Г tlo ch b e rg 's G T 2
teste
l~ G ab riel
desejado
E q u a l V a ria n c e s Noi A ssu m e d
Marque o teste que você deseja e clique em Continue (Continuar). Clique em Options
(Opções) se desejar as estatística., descritivas para cada condição.
1ДМД| -Ы-^ЫШвЫ
File £dit View Qa'a Transform Analyze G raphs Utilities Window Help
O n e - W a y A N O V A O p tio n s
ET
A qui Stansbcs
Descriptive Qescnpirve E a ste
foi m a r c a d o
Г fcjeans plot
Missing V alues
Exclude c a s e s flnatysis by analysis
j®S ta rtj ¿ y M igoson Wotd - с ||fg¿|O f>Ew py_olcoh ^ Oulputi - S P S S Vi | ^ Find F iles named ■А-l О
T a b e la 9.5 Esiatísticas descritivas e lim ites de confiança para as três condições de álcool
14 1
12 -
10 -
8 -
6 -
Lim ites de 4 ‘
co nfiança
de 95 % 2 _____ -------- 1--------------------- 1--------------------- 1---------------------
N = 12 12 12
M uito álcool Pouco álcool Placebo
A média para o grupo de alto consumo de álcool é bem maior do que as outras duas. *
mais importante, o intervalo de confiança desse grupo não apresenta valores em comum -
os outros dois grupos. Assim, podemos verificar que qualquer efeito está entre o gmpo de _
consumo de álcool e os outros dois grupos.
O teste estatístico para a ANOVA independente de uma classificação é como segue:
Grupo é a linha de interesse, pois mostra as estatísticas entre os grupos. Nossa análise mostra que
F(2, 33) = 9,92, p < 0,001. Lembre-se do Capítulo 5, no qual explícou-se que o coeficiente de
correlação podia ser elevado ao quadrado para mostrar a percentagem das variações de uma das
variáveis responsáveis pelas variações na outra variávet. O r|2 parcial é um coeficiente de correlação
que já é um quadrado. Assim, nesse caso podemos simplesmente ler o seu valor na coluna relativa
ao ri2 . A interpretação do r|2 parcial, nessa ANOVA, indica que 37,5% da variação na habilidade de
dirigir se deve à condição alcoólica do participante.
Corrected Model
(Modelo co'r,gidoi 145.167a ' 2 72.583 9.915 0.000 \ 0 3 -:
/
Intercept (interceptoi 1 9 80 .2 50 / 1 1980.250 270.500 0.00 0 \o .ss-
G RO U P (Grupo) 1 4 5 .1 6 7 2 7 2 .5 8 3 9 .9 1 5 0 .0 0 0 о. 375
Total 2 3 6 7 .0 0 0 \ 36
Corrected Total
386.75 0
(Total corrigido) \ 35
Sig. = Significancia
a. R Squared = .375 (Adjusted R Squared = .^37) (a. R2 ajustado = 0 ,3 7 5 (R2 ajustado = 0 ,3 3 7 ))
Testa a hipótese nula de que variâncias dos erros sáo iguais entre os grupos
Sig. = Significância
a. Projeto: Interceptor- GRUPO
Em artigos de periódicos, você verá que o valor F (9,9), os graus de liberdade (2,33) e a
probabilidade associada (aqui p < 0,001) estão sempre presentes no texto. É útil relatar o valor
global das diferenças entre os grupos. O SPSSPW calcula automaticamente o r¡? parcial no pro
cedimento da ANOVA. Aqui esse valor e' igual a 0,375. Assim, 37,5% da variação nos valores
na habilidade de dirigir podem ser creditados à quantidade de álcool consumida.
Temos agora uma pequena quantidade de informação sobre os efeitos do álcool nos erros
ao dirigir. Embora pareça que as diferenças entre os grupos seja entre a alta quantidade de
álcool e os outros grupos (em vez de entre placebo e pouco álcool), a ANOVA não executa
essas comparações. Apenas nos informa que existe uma diferença entre algumas (ou todas)
as condições, mas é só até esse ponto que chega. Podemos, entretanto, executar testes adicio
nais para confirmar nossa impressão de que as diferenças existentes são entre o grupo de alto
consumo de álcool e os demais.
O procedimento de comparações múltiplas é utilizado para verificar que média de grupo
difere das médias de outros grupos.
Os pesquisadores normalmente podem predizer qual média irá diferir de outras médias, e
muitas vezes as comparações são planejadas antecipadamente. Estas comparações são em geral
executadas depois que a razão F tenha mostrado que existem diferenças significativas entre duas
ou mais das médias. Embora existam testes que realizam as comparações, recomendamos que
você as faça utilizando o teste /, por ser bem conhecido.
*The mean difference is significant at the .05 level (*As diferenças entre as médias são significativas no nível de : : .
Sig. = Significance
Isso mostra que existe uma diferença estatisticamente significativa entre os gru:
que consumiram placebo e altas doses de álcool, bem como entre grupos que consu~
ram baixas e altas quantidades de álcool (em negrito na tabela). Obviamente, não e.\
diferenças entre os grupos que consumiram placebo e pouco álcool. Agora você p .
calcular o tamanho do efeito, d, para as diferenças entre as duas condições, exatamente
mesma forma que fez para o teste t (veja página 2 2 2 ) . Apenas para lembrá-lo, a fórrr.. .
e a seguinte:
Estatística sem M atem ática para Psicologia 313
Desse modo, as médias das condições placebo e muito álcool diferem por 1,54 desvios
padrões e isso é estatisticamente significativo. Se você calcular o tamanho do efeito para as
condições de pouco e muito álcool, encontrará também uma diferença de 1,54. Os cálculos
do tamanho do eleito para os grupos que consumiram placebo e pouco álcool leva a um valor
de 0,135. Assim, essas condições diferem por aproximadamente 1/7 de um desvio padrão. Tal
diferença pode ser creditada ao erro amostrai. Agora temos muitas informações para elaborar
o relatório. A análise pode ser escrita da seguinte forma:
Estatísticas descritivas (Tabela X)3 mostram que mais erros são cometidos na condição de alto
consumo de álcool do que nas outras duas condições. A análise de variância de um fator mostrou que
qualquer diferença entre condições é improvável de ter ocorrido apenas por erro de amostragem,
considerando a hipótese nula seja verdadeira. F(2, 33) = 9,92 e p < 0,001 representam um tama
nho do efeito (iy parcial) de 0,375, mostrando que aproximadamente 38% da variação nos erros de
direção podem ser creditados aos diferentes níveis de álcool. Um teste posi hoc (Newman-Keuls)
confirmou que as diferenças entre as condições 1 e 3. e 2 e 3 (ambas com d = 1.54) tem baixa proba
bilidade de terem ocorrido apenas por erro amostrai. Não se observou diferença significativa entre as
condições pouco álcool e placebo (d = 0,14)
Atividade 9.2
No cálculo do tam anh o do efeito entre duas con d ições na ANOVA de uma classificação,
você ob tém um tam anh o do efeito (d) de 0 ,4 9 0 . Concluiu-se que as m édias diferem por:
' Vocc deve remeter seus leitores à tabela na qual esião as estaiísticas descritivas.
314 C hristine P. Dancey & John Reidy
Exemplo da literatura:
hábitos alimentares e a síndrome do intestino irritável
Exemplo da literatura:
desempenho cognitivo e uso do ecstasy
Dr. Parrot e colegas (Parrot et al., 1998) executaram um estudo sobre desempenho cognitivo com
usuários ocasionais de ecstasy. Trabalhos anteriores mostraram déficit de memória em usuários de
ecstasy. Parrot e colaboradores verificaram o desempenho em uma tarefa (velocidade de resposta,
‘empo de reação, tempo para a escolha, vigilância numérica e lembrança de palavras) em três grupos
de jovens: 10 usuários regulares, 10 usuários novos e 10 de um grupo de controle que nunca tomou
a droga. Os pesquisadores analisaram os dados com a ANOVA de um fator e o teste de Duncan.' So
mente duas das tarefas cognitivas geraram um efeito significativo: lembrança imediata de palavras
e lembrança retardada de palavras, como na Tabela 9.7.
As comparações por Duncan mostraram que a diferença entre os grupos de controle e novos usu
ários, bem como entre o grupo-controle e os usuários regulares, tanto na lembrança imediata quanto
retardada de palavras, não podiam ser atribuídas ao erro amostrai, considerando a hipótese nula ver
dadeira. No entanto, a pequena diferença entre os grupos de usuários novos e de usuários regulares
?ode ter sido obtida em virtude de erro amostrai (sabemos disso porque Parrot e colaboradores não
7orneceram o nível de significância para essa comparação; assim, estamos presumindo que ela seja
não-significativa). Parece que uma diminuição cognitiva pode ocorrer em usuários de ecstasy.
Novos
Controle Controle Usuários
Efeitos de X X X
Lembrança imediata 8.2 1.6 5.3 1,1 6.5 1.3 p <0.001 /><0.01 p < 0.05
de palavras
Lembrança retardada 6.9 1.6 4.6 1.0 5.1 1,4 P < 0.01 p < 0.01 /><0,0!
de palavras
A variância entre grupos é composta dos efeitos dos tratamentos, das diferenças indivi
duais e do erro experimental. No delineamento de medidas repetidas não existe variação entre
grupos devido a diferenças individuais, pois cada participante em cada grupo é único e o mes
mo. A fórmula para o cálculo do F no delineamento de medidas repetidas leva em consideração
o fato de que cada participante é o mesmo em cada condição. A variação devida a diierença>
individuais (que podemos medir) é removida tanto do numerador quanto do denominador d,,
equação. Isso tende a fornecer um teste estatístico mais sensível c com mais poder:
variância entre os grupos
F = -----------------------------------------------------------------------------
variância dentro dos grupos - diferenças individuais
1 5 5 8
2 10 7 10
3 7 9 8
4 3 8 9
5 5 2 11
6 7 5 15
7 11 6 7
8 2 6 11
9 3 4 8
10 5 4 8
11 6 8 17
12 6 10 11
I 70 74 123
A análise inicia da mesma forma que o experimento entre participantes com as estati'
cas descritivas e ilustrações gráficas.
Estatística sem Matemática para Psicologia 317
Escolha o menu Analyze (Analisar), depois General Linear Model. (Modelo Linear Ge
ral) e Repeated Measures (Medidas Repetidas).
ss S P S S D u l a E d it o r
3 00 4 Multiple R e s p o n s e
M issin g V a lu e A n a lysis
10 5 00 4 __
6 00 8 00 17 00
6 00 10 00 11 00
iij-ieig]ioK-M.jiiaizjiBiij|__________________ I
E 'le Ed it V ie w Q a ta Jra n sio rm A n a lyze G ra p h s Utilities W indow fclelp
Mude para
urn nome
apropriado (p.
ex., "álcool")
3 níveis
318 C hristine P. Dancey & John Reidy
Mude o “Fator l " para ura nome adequado - neste caso vamos chamá lo de alcohol (ál
cool) - e insira o número de níveis. Como temos placebo, baixo e alto consumo, o número de
níveis é igual a três. Então, pressione o botão Add (Adicionar). Clique em Define (Definir).
• R e p e a te d M e a su re s
Eile E d il
1 p le ceb
Os níveis são
m ovidos em
ordem, da
esquerda para
Q eNxeen-Subiects F a c to r s ) a caixa Within-
□ S ub jects Varia
bles (Variáveis
dentre Sujeitos)
£o va riates.
CD
COQtíOSlS P o s l t jo c Sove
••sf-ssRaeg«or isi&say
ii f l S l B r t j f l y f /:a o so H W o r d -c . ||[;n ^ rn p B n te riA N O V ..- f g j O u tp u fl- S F S s - | F n . j f- n;.m ed | ¿ ¿ - ¿ O 1^ -5-
Mova as variáveis que estão à esquerda, uma de cada vez, para a caixa Within-SubjeL t
Vciríables (Variáveis dentre Sujeitos) à direita. No exemplo, placebo é movido primeiro para a
posição número I; low (baixo) é movida para a segunda posição, e high (alto), para a terceira
Isso representa os três níveis. Então, pressione Options (Opções).
(Ignore os botões Between-Subjects Factor(s) e Covariates, pois não nos interessam ne*--
sa análise.)
Será abeita a seguinte caixa de diálogos.
- 0 ^ 5 Ll d? M f [• S t r , * <è
. I i - i . J - i i . l i
Médias seráo
m ostradas
na snida
Bonforroní
selecionado
-
SPSS o rwJ.
Estatística sem M atem ática para Psicologia 319
Verifique se você marcou o botão Compare main effects (Comparar efeitos principais).
Terá então uma e s c o lh a de três testes: LSD , Bonferroni ou Sidak. Sugerimos a utilização d o
teste de Bonferroni. qu e faz a correção para o número de testes pareados que você está execu
tando (veja lestes m ú ltip lo s na página 244).
Você pode então verificar as opções que você determinou. Você solicitou descritivas,
tamanho do efeito, médias e poder. Os intervalos de confiança são fornecidos automatica
mente. Pressione Continue (Continuar). O programa retornará à caixa de diálogos Rcpetead
Measures (Medidas Repetidas) da ANOVA. Pressione OK. Os resultados estarão impressos
na janela de saída.
9.7.1 Esfericidade
Na ANOVA, partimos do pressuposto de que todas as condições são independentes. No
delineamento de medidas repetidas, entretanto, utilizamos os mesmos participantes em cada
uma das condições, o que significa que deve existir alguma correlação entre as condições.
Se você possui três condições, existem três correlações bivariadas: condições J versus 2, 2
versus 3 e 1 versus 3. Nós supomos que e sta s três correlações seja m similares. A s s im , a ssu
mimos que todas as covariâncias são similares. A suposição de esfericidade é válida quando
a variância da diferença entre as médias estimadas para um par de grupos é a mesma de qual
quer outro par. Como a satisfação dessa suposição é improvável e violações da esfericidade
são prejudiciais à acurácia da ANOVA, recomendamos que você interprete rotineiramente a
linha Greenhouse-Geiser da saída do SPSSPW. Em outras palavras, é melhor assumir que a
suposição não foi satisfeita. O Greenhouse-Geiser trabalha (como você pode ver no próximo
item) ajustando os graus de liberdade. Essa correção na fórmula faz o nosso teste mais rigo
roso, de modo que, se a hipótese de esfericidade foi violada, há uma possibilidade menor dc
não aumentar o erro do Tipo I.
G re e n h o u se - 1 4 5 .1 6 7 1 .8 3 3 7 9 .1 9 4 1 0 .8 2 6 .001 .4 9 6
G e isse r
Esta é a saída obtida com a opção Compare main effects (Comparar efeitos principais),
utilizando Bonferroni.
Estimates (Estimativas)
Measure: MEASURE ! (Medida: Medida^D
A tabela acima mostra o valor da média para as condições mais os limites de um intervalo
de confiança de 95%.
Estatística sem M atem ática paro Psicologia 321
A tabela compara cada condição com qualquer outra, fornecendo a diferença das médias
entre cada par, o erro padrão, o valor da probabilidade e os limites de um intervalo de 959c de
confiança em torno da diferença das médias.
A primeira linha compara 1 (placebo) com 2 (pouco álcool). A diferença entre as médias
é 0,333. Isso não é estatisticamente significativo por qualquer critério. Esta linha compara
ainda o nível 1 (placebo) com o nível 3 (muito álcool). A diferença aqui é de 4,417. e o nível
de probabilidade associado e 0,011. Continue e interprete o restante da tabela você mesmo.
Atividade 9.3
Exemplo da literatura:
confiança e acurácia de testemunhas oculares
PI PI PI
P2 P2 P2
P3 P3 P3
P. P. P.
Estatístíca sem M atem ática para Psicologia 323
Resumo
Exercício 1
Entre com os dados da Tabela 9.10 no SPSS. Faça a análise com o uso da One Way (que está
no menu Compare Meam - Comparar Médias) e obtenha os resultados. Faça um teste post hoc.
Copie as partes importantes da saída. Interprete os resultados em termos do experimento.
Na universidade local, os estudantes foram alocados aleatoriamente a um de três grupos
para a realização de um trabalho de laboratório - um grupo matutino, um vespertino e um notur
no. Ao final da sessão, eles responderam a um questionário para verificar o quanto lembravam
do que haviam feito. Existem diferenças entre os grupos? Se existirem, qual a direção':’
PI 15 PI 1 14 P21 13
P2 10 P12 13 P22 12
P3 14 P13 15 P23 11
P4 15 PI4 14 P24 I 1
P5 17 PI5 16 P25 14
P6 13 PI6 15 P26 11
P7 13 P17 15 P27 10
PH 19 PIS 18 P2K 9
P9 16 PI9 19 P29 8
PIO 16 P20 13 P30 10
Exercício 2
Existem evidências indicando que fumar maconha leva à perda de memória de curto
prazo e à redução da habilidade na execução de tarefas simples. Sete estudantes fumantes
que normalmente não consomem maconha foram solicitados a responder questões difíceis
de aritmética sob quatro condições diferentes. Na condição 1, fumaram uma mistura de ervas
que pensavam ser maconha. Na condição 2, fumaram uma pequena quantidade de maconha,
ampliada para uma média e grande quantidade nas condições 3 e 4 respectivamente. Os estu-
324 C hristine P. Dancey & John Reidy
dantes foram solicitados a fumar sozinhos. Para evitar efeitos de prática, foram feitos quatro
testes diferentes, todos com o mesmo grau de dificuldade. Para evitar os efeitos de ordem e
fadiga, foi contrabalanceada a ordem de aplicação dos testes. Os resultados são os seguintes.
i 19 16 8 7
"> 14 8 8 11
3 18 17 6 3
4 15 16 17 5
5 11 14 16 7
6 12 10 9 8
7 11 9 5 11
Entre com os dados no SPSSPW e execute uma ANOVA de medidas repetidas. Relate os
resultados de maneira apropriada.
---------------------------------------------------------------------------- •
ANOVA
ENJOYMENT (ENCANTAMENTO)
Sum of Squares Mean Square
(Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Between Groups
(Entre Grupos) 94.4308 2 47.2154 .4893 .6141
Within Groups
13798.1240 143 96.4904
(Dentro dos Grupos)
Total (Total) 13892.5548 145
Sig. = Significancia
Descriptives (Descritivas)
ENJOYMENT (ENCANTAMENTO)
Mean (Mèdia)
1.00 62.9063
2.00 61.2041
3.00 62.9091
Estatística sem M atem ática para Psicologia 325
ANOVA
KNOWLEDGE (CONHECIMENTO)
Sum f Squares Mean Square
(Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Between Groups
1 10.3100 2 55 .1 55 0 5.3557 .0057
(Entre grupos)
W ithin Groups
1482 .9 68 9 144 10.2984
(Dentro dos grupos)
Total (Total) 1593.2789 146
Sig. = Significância
* The mean difference is significant at the .05 level. (* A diferença entre as médias e significativa no nive! de 5%.)
Sig. = Significance
Estatística sem M atem ática para Psicologia 327
i g. = Significância
Sig. = Significância
328 C hristine P. Dancey & John Reidy
18. Qual é a sentença mais adequada? 20. Considerando que a hipótese nula seja verdadeira.
(a) F(2, 12) = 5.62, p =0,020 a diferença entre as condições 1 e 2 tem:
(b) F( 1.6) = 5,62, p =0,050 (a) 5% de chance de surgir como conseqüência
(c) F(2, 12) = 5,62, p =0,049 do erro amostrai
(d) F( 1,6) = 5,62, p =0,055 (b) 6% de chance de surgir conio conseqüência
do erro amostrai
19. Qual das seguintes condições mostra a maior dife
(c) 19% de chance de surgir corno conseqüência
rença?
do erro amostrai
(a) 1 e 2 (d) 20% de chance de surgir como conseqüênc:_
(b) 2 e 3 do erro amostrai
(c) I e 4
(d) São idênticas
Referências
Panorama do capítulo
No C a p ítu lo 9 , in tro d u zim o s u m dos te stes e sta tístic o s m ais u tiliz a d o s na p sico lo g ia a tu a l
m e n te , a a n á lise de va riâ n c ia (A N O V A ). N este ca p ítu lo p re te n d e m o s:
10.1 Introdução
1. A lto s n ív e is de á lc o o l d im in u em a c a p a c id a d e de dirigir.
3. Dada a antiga premissa de que o café auxilia a mantermo-nos alertas, podemos pre
ver que um aumento de cafeína reduz a influência do álcool na habilidade de dirigir.
As duas primeiras previsões são denominadas de efeitos principais. Referem-se ac
efeito global de cada uma das variáveis independentes sobre a variável dependente: o
efeito total do álcool na habilidade de dirigir, não importando a quantidade de cafeína
ingerida, e o efeito total da cafeína na habilidade de dirigir, a despeito da quantidade de
álcool consumida. A terceira hipótese, que prevê uma relação entre álcool e cafeína que
pode alterar a habilidade de dirigir, é denominada de interação entre as duas variáveis
independentes. Assim, temos três previsões nesse estudo, e a ANOVA permite testar toda^
em uma única análise.
Como o nome do teste sugere, utilizamos a ANOVA para analisar todas as possívei-
fontes de variação no estudo. Quando mensuramos os participantes em alguma variá\e.
dependente, temos variações nos escores. Algumas dessas variações são atribuídas à va
riável independente; algumas, ao efeito de interação entre as variáveis independentes.
algumas outras, em conseqüência de erros. O propósito da ANOVA é tentar identificar
quanto da variação total nos escores pode ser atribuída a cada um desses fatores (ve _
Figura 10.1). A Figura 10.1 mostra que, quando temos duas variáveis independentes. _
variação na variável dependente pode ser atribuída às duas variáveis separadamente e _
interação entre elas. Qualquer variação não-atribuída a um desses fatores é denominada d;
variação devida ao erro.
No Capítulo 9, explicamos que a ANOVA de um fator mostra o grau pelo qual a varia
ção entre condições é maior do que a variação dentre ou dentro das condições. Explicam-
que, se a variação entre condições for consideravelmente maior do que a variação dentro d_-
condições, conclui-se que as diferenças entre grupos não se deve ao erro amostrai. Sugerim>
que, em tal situação, a diferença entre grupos pode provavelmente ser atribuída à manipuL-
ção da variável independente. A lógica de analisar mais de uma variável e semelhante à c .
ANOVA de um fator. Essencialmente, dividimos (ou particionamos) a variância total n_
representadas pelas duas variáveis em separado e na interação entre elas. Então, comparam
essas fontes de variância com as da variância dentre (dentro) as condições (ou erro). Es',
análises permitem verificar a possibilidade de que um efeito em particular tenha ocorric
apenas devido ao erro amostrai.
Interação
VI2
Sugerimos anteriormente que a ANOVA permite analisar mais do que duas variáveis in
dependentes em uma única análise. Na Figura 10.2, você pode verificar como seria dividida
a variação se tivéssemos três variáveis independentes. Fica aparente, a partir deste diagrama,
que existem bem mais fontes de variação a se identificar. De fato, com a adição de uma única
variável independente dobramos o número de fontes de variação que precisamos analisar.
Assim, a complexidade da análise cresce dramaticamente quando incluímos mais variáveis
independentes (compare as Figuras ÍO.I e 10.2 com o diagrama de pizza da Seção 9.2.3).
Em tais delineamentos, torna-se muito mais difícil interpretar as interações entre todas as va
riáveis independentes. Assim, para aqueles que estão pensando em realizar um experimento
sobre os efeitos de idade, gênero, classe social, ansiedade e inteligência na habilidade de
praticar rapei e analisar os dados utilizando uma ANOVA. é melhor repensar a idéia. Tal aná
lise é complicada e seria muito difícil de interpretar. Existem formas melhores de se analisar
tais dados, por exemplo por meio de regressão múltipla (veja Capítulo l ]). embora existam
problemas mesmo fazendo isso.
Devemos ressaltar que a partição da variância ilustrada nas Figuras 10 .1 e 10.2 representa
o caso de um delineamento entre participantes apenas. Quando tivermos qualquer variável
independente dentre participantes na análise, as coisas ficam um pouco mais complicadas.
Falaremos desse delineamento mais adiante neste capítulo.
Erro VI1
Interação 1 e 2
VI3
Figura 10.2
Diagrama de pizza sobre as várias fontes de variação na variável dependente para um
estudo com três variáveis independentes.
Atividade 10.1
Veja se você pode descobrir as várias fontes de variância quando tiver quatro variáveis
independentes (variáveis A, B, C e D).
Sem cafeína PI P4
P2 P5
P3 P6
Podemos conduzir esse mesmo estudo por meio de um delineamento totalmente dentre
participantes. Em tal estudo, cada participante deverá tomar parte em todas as quatro condi
ções (veja Tabela 10.2).
Sem calcina PI PI
P? P2
P3 P3
Com cafeína PI Hl
P2 P2
P3 P3
finalmente, podemos ter uma variável independente, digamos o álcool, como a variável
entre participantes e a outra, cafeína, como a variável dentre participante. A alocação dos
participantes às condições cm tal estudo é ilustrada na Tabela 10.3.
Estatística sem M atem atica para Psicologia 333
Tabela 10.3 A locação do participantes às condições em um projeto entre participantes (com álcool
sem álcool) e uni dentre participantes (com cafeína/sem cafeína)
Sem cafeína PI P4
P2 P5
P3 P6
Com cafeína PI P4
P2 P5
P3 P6
\ \
2 x 2 ANOVA
_ Duas Vis, um? com três
. i x 4 AINUVA e 0Ufra com q Uatro condições
3 x 2 x 2 ANOVA
Devemos notar, ainda, que, com muitas variáveis independentes em uma ANOVA, testa
mos muitos efeitos diferentes contra muitas hipóteses nulas diferentes. Assim, devemos ter
em mente a grande probabilidade de cometer um erro do Tipo I. Um exemplo pode ajudar a
entender isso. Suponha que você conduziu um estudo com quatro variáveis independentes (A.
B. C e D). Se executou uma ANOVA com esses dados, testou 15 efeitos diferentes contra as
respectivas hipóteses nulas (efeitos principais de A, B, C e D mais 11 interações entre essas
variáveis independentes). Fazendo isso, você aumentou drasticamente a taxa de erro de con
junto. ampliando, assim, a probabilidade de se cometer o erro do Tipo I. Devemos, portanto,
apelar para o bom-senso quando decidimos analisar dados de pesquisas complicadas.
Atividade 10.2
Descreva as se g u in te s análises
Como foi feito com a ANOVA de um fator, é preciso rodar alguns procedimentos de
análise exploratória de dados para verificar se as hipóteses da ANOVA estão satisfeitas. Al
gumas análises estatísticas iniciais (média, desvio padrão e intervalos de confiança de 95%)
são apresentadas nos dados da Tabela 10.4. Podemos ver, a partir dessas análises, que existem
poucos erros de direção na condição sem álcool e sem cafeína (média = 5,75) e muitos erros
na condição com álcool e sem cafeína (média = 21,25). As médias para as condições sem
álcool e sem cafeína e com álcool e com cafeína estão entre esses dois extremos (médias de
7.92 e 9,00, respectivamente). Podemos ver também que os desvios padrões para todas as
condições são bem semelhantes e estar razoavelmente confiantes de que a hipótese de homo
geneidade da variância não foi violada com esses dados.
O próximo estágio da nossa análise exploratória de dados deve envolver a obtenção de
algumas representações gráficas a fim de determinar se os dados estão ou não normalmente
distribuídos. Podemos verificar isso por meio de histogramas, diagramas de caule e folhas e
diagramas de dispersão. Vamos considerar que geramos esses diagramas e estamos satisfeitos
com a inexistência de violações das hipóteses relacionadas ao uso de testes paramétricos
(lembre: a ANOVA é um teste desse tipo). Assim, podemos continuar a análise dos dados
utilizando a ANOVA.
Estatística sem M atem ática para Psicologia 335
Tabela 10.4 Número de erros com etidos ao dirigir por cada participante em quatro situações (sem
álcool e sem cafeína, com álcool e sem cafeína, sem álcool e com cafeína, e. com álcool e com cafeína)
Sem cafeína 4 2 28 19
9 II 22 16
10 11 21 25
8 10 27 17
6 3 21 19
11 10 20 20
X = 7.92 '; DP = 3,32X = 2 1,25; DP = 3.72
IC de 95%: 5.81 - 10.02 IC de 95%: 18,89 - 23.61
Com cafeína 8 6 5 11
4 3 6 8
9 0 14 10
0 S 8 II
8 9 14 8
6 8 5 8
X = 5,75; DP = 3,28 X = 9,00; DP = 3,07
IC de 95%: 3.67 -7.82 IC de 95%: 7.05- 10,95
X = média
Atividade 10.3
Value Label
(Legenda) N
alcohol 1.00 No alcohol 24
(álcool) (Sem álcool)
2.00 Alcohol 24
(Com álcool)
caffeine 1.00 No caffeine 24
(cafeína) (Sem cafeína)
2.00 Caffeine 24
(Com cafeína)
a. R Squared = .780 (Adjusted R Squared = .765) (R2 = 0,780 [R2 ajustado = 0,765))
* The row that includes the asterisk is for the interaction. (* A linha que inclui o asterisco é de interação.)
Sig. Significancia
Estatística sem M atem ática para Psicologia 337
Você pode perceber a partir das tabelas de saída, que temos uma probabilidade de 0 .0 0 0
associadas aos eleitos principais tanto do álcool quanto da cafeína e tambe'm com a interação
(lembre que um valor p = 0 ,0 0 0 no SPSSPW significa que p < 0 , 0 0 1 ). Isso nos informa que, se
a hipótese nula fosse verdadeira, seria altamente improvável se obterem os efeitos principais e
a interaçao observaria. (> que isso tudo significa? E sempre uma boa idéia tentar entender o que
aconteceu nesse projeto experimental complexo ilustrando as médias graficamente. Com base
nas recomendações de I.oftus (1 9 9 6 ), geramos um diagrama de barras de erro para os dados
desse exemplo, apresentado na Figura 10.3. Você deve perceber que o SPSSPW não apresenta
linhas sólidas para ligar os pares de médias. Fomos nós que as incluímos como ajuda para um
melhor entendimento da natureza da interação entre as duas variáveis independentes.
A linha supenor na Figura 10.3 representa a habilidade de dirigir sem cafeína, e a de baixo,
com cafeína. Podemos imediatamente perceber, a partir desse gráfico, que o efeito principal
devido à cafeína parece indicar que a habilidade de dirigir é melhor quando tomamos uma dose
de cafeína (lembre-se de que esses dados são inventados, não tente fazer isso em casa). Exis
tem mais eixos de direção na condição sem cafeína (linha superior) do que na condição com
cafeína (linha inferior). Os pontos nos finais à direita nas duas linhas representam a condição
com álcool, e os dois à esquerda, a condição sem álcool. Podemos ver aqui, embora isso não
seja tão óbvio (desenhamos gráficos com linhas para que isso se tome mais óbvio, veja Figura
10.4), que existem mais erros ao dirigir quando existe a ingestão de álcool do que o contrário.
Talvez a melhor maneira de visualizar os efeitos principais quando existe um número igual de
participantes em cada grupo seja marcar um ponto no meio de cada linha para o efeito principal
da cafeína (veja Figura 10.4). A diferença vertical entre esses dois pontos representa a diferença
real entre as médias das condições com cafeína e sem cafeína, ignorando a variável indepen
dente álcool. Isso representa o efeito principal da variável independente cafeína. Para a variável
independente álcool, você deve marcar um ponto no meio dos dois finais das linhas à direita
e o mesmo para as linhas à esquerda. A diferença vertical entre esses dois pontos representa a
diferença real entre as condições com consumo de álcool e sem consumo de álcool, ignorando
a variável independente cafeína. Isso representa o efeito principal da variável independente
Cafeína
5 Sem cafeína
Com cafeína
Álcool
Figura 10.3
Diagrama de barras de erro para as condições com álcool/sem álcool e com cafeína/sem
cafeína.
338 C hristine P. Dancey & John Reidy
álcool. Lembre-se de que você pode utilizar essa técnica visual simples somente quando tiver
amostras do mesmo tamanho. Se houver um número diferente de participantes em cada grupo,
terá que calcular as médias dos efeitos principais e representá-las no gráfico.
Como interpretamos a interação? Se você tem uma interação significativa, poderá à prin
cípio interpretá-la graficamente. A Figura 10.5 mostra que a diferença entre as duas condiçõe^
da cafeína sem álcool é muito menor do que a com álcool. Parece que a cafeína exerce utr
grande efeito moderado na condição com álcool. A interpretação alternativa indica que, quan
do não existe cafeína (observe a diferença vertical entre os dois finais direitos das linhas), c
álcool exerce um efeito prejudicial bem maior na habilidade de dirigir do que quando existe
cafeína (diferença entre os finais esquerdos das duas linhas). Essas são duas formas válida'
de se interpretar os dados e constatar essencialmente a mesma coisa.
30 n----------------------------------------------------------------------------------
Diferença entre as
Diferença entre as
° 20
duas condições
de cafeína
com álcool
10 -
♦ Sem cafeína
Com cafeína
Sem álcool Com álcool
Uma das regras de ouro da ANOVA é que, uma vez encontrada uma interação significati
va, você deve seguir adiante para explorá-la em maior profundidade. O que significa ter uma
interação entre duas variáveis? Se há duas variáveis e cada uma apresenta duas condições,
uma interação ocorre quando uma variável se comporta de forma diferente em cada condição
da outra variável. Por exemplo, sugerimos anteriormente que a cafeína tinha um efeito nas
duas condições de álcool. Entretanto, a cafeína apresenta um efeito bem maior quando existe
álcool no organismo do que quando não existe. Um exemplo da literatura é o achado de que
pessoas altamente ansiosas tendem a dirigir a atenção a estímulos negativos do ambiente,
enquanto as pessoas não-ansiosas prestam menos atenção a esses estímulos (Mogg e Bradley,
1999). Aqui existe uma interação entre as variáveis ansiedade e atenção. Uma forma conve
niente de verificar se existe interação entre duas variáveis é gerar gráficos de linhas. Observe
as ilustrações da Figura 10.6.
A Figura 10.6 mostra que, quando não existe interação entre duas variáveis, as linhas
que representam a variável cafeína são paralelas. Quando observarmos tais linhas paralelas,
podemos estar seguros de que não existe interação entre duas variáveis. O que as linhas para
lelas indicam? Se você comparar as condições com e sem álcool nos três exemplos dados na
Figura 10.6, deverá constatar que há mais erros ao volante quando os motoristas não tomaram
cafeína do que quando tomaram. Há os mesmos padrões de resultados nas duas condições de
álcool, mas tomar cafeína resulta em menos erros ao volante.
♦ Sem cafeína
Com cafeína
Como uma interação aparece no formato de gráfico? Dê uma olhada nos gráficos da
Figura 10.7.
Os gráficos na Figura 10.7 ilustram os vários padrões de linhas que sugerem a existência
de interação. A principal característica a ser notada em cada gráfico da Figura 10.7 é que as
duas linhas não são paralelas. Observando cada um dos gráficos, podemos ver que existem
diferentes padrões em cada uma das condições de álcool. No gráfico (a), podemos notar
que, na condição sem álcool, existem mais erros ao volante com cafeína do que sem ela. Na
condição com álcool, entretanto, encontramos um padrão inverso: mais erros sem cafeína.
No gráfico (b). não se observam diferenças reais entre as condições com e sem cafeína na
condição sem álcool, enquanto na condição com álcool a cafeína aumenta o número de erros
ao volante. O gráfico (c) montra o oposto do (b), isto é, não existem diferenças na condição
com álcool, e a cafeína aumenta os erros na condição sem álcool. Observando o gráfico (d),
pode-se ver que nas duas condições, com e sem álcool, tomar cafeína aumenta o número
de erros. Entretanto, o gráfico mostra que existe um impacto maior da cafeína nos erros ao
volante na condição com álcool. O gráfico (e) mostra o efeito oposto, um grande impacto da
cafeína na condição sem álcool.
340 Christine P. Dancey & John Reidy
(d) (e)
G rá fic o d o s p a d rõ e s d e lin h a s d e in te ra çã o .
Figura 10.7
Você d e v e ter em mente que não é possível, apenas p e lo exame d o s gráficos, constatar
se a interação é ou não significativa entre as variáveis independentes. Os gráficos de linhas
fornecem um indicativo da interação. Para saber se ela existe, é necessário consultar a tabela
da ANOVA. Assim, os gráficos devem ser utilizados em associação com a tabela da ANOVA
para entender os padrões encontrados.
Um dos pom os a enfati armos nas discussões dos efeitos simples é que o pesquisador deve
exam inar os setts dados cuidadosamente. Plotcir os dados e analisar o significado é importante,
talvez a parte mais importante de uma análise apropriada de qualquer conjunto de dados.
Atividade 10.4
Você pode utilizar o m étodo recom endado por Howell (2002). Isso envolve rodar ANOVAs de um fator separadas para cada efeito
sim ples e recalcular os valores F utilizando o erro quadrado m édio da análise original no lugar dos calculados para os efeitos sim
ples. Veja H owell (2002) para detalhes de com o proceder.
342 Christine P. Dancey & John Reidy
TESTE T
GRUPO DO ÁLCOOL = SEM ÁLCOOL
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test for Equality of Means
de Variâncias) (Teste t para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95=:
Sig. Mean Std. Error
para a Diferença)
(2-tailed) Difference Difference
Df (Sig. (Diferença (Erro Padrão Lower Uppe'
F Sig. t (gi) Bilateral) das Médias) da Diferença) (Inferior) (Supenot
Driving Equal variances 0.027 0 872 1.610 22 0.122 2.16667 1.34606 -0.62488 4.958
errors assumed (igualdade
(Erros ao de variâncias assumida)
volante) Equa| varjances not 1.610 21.997 0.122 2.16667 1.34606 -0.62490 4.95S
assumed (Igualdade
d e variâncias não-
assum ida)
A saída acima fornece o teste do primeiro efeito simples. Testa a diferença entre a>
condições com cafeína e sem cafeína somente na condição sem álcool. As médias que esta
comparando são indicadas na Figura 10.8 (a) pela seta. O teste t nos diz que a diferença entre
as condições com cafeína e sem cafeína na situação sem álcool tem um valor t associado de
t(22) - 1,61, p = 0 ,12, que é não-significativo.
A segunda análise de um efeito simples é apresentada a seguir:
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test for Equality of Means
de Variâncias) (Teste f para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95%
Sig. Mean Std. Error
para a Diferença)
(2-tailed) Difference Difference
Df (Sig (Diferença (Erro Padrão Lower Upper
F Sig. t (gl) Bilaterali das Médias) da Diferença) (Inferior) (Superior)
Driving Equal variances 0.173 0.682 8.792 22 0.000 12.25000 1.39330 9.360 15.140
; rrors assumed (Igualdade
E'ros ao de variâncias assumida)
jiante) Equa| variances not 8.792 21.25 0.000 12.25000 1.39330 9.355 15.145
assumed (Igualdade
de variâncias não-
assumida)
Esse teste t nos mostra que, na condição com álcool, existe uma diferença significativa
entre duas condições da cafeína. Os detalhes relevantes são t(22) = 8,79, p < 0,001. Essa
análise é ilustrada na Figura 10.8 (b). Colocamos que o valorp é menor do que 0,001 porque
o SPSSPW mostrou um valor p de 0,000. Isso significa que o valor p real é menor do que
0,001, mas o SPSSPW não consegue mostrar. Assim, não podemos apresentar p exato como
o aconselhamos a fazer nos relatos dos resultados. Quando isso acontecer nas suas análises,
relate o valor p como fizemos antes.
O teste da diferença entre as duas condições alcoólicas na presença ou não de cafeína
é apresentado somente na saída a seguir. Esse teste t examina as duas médias ilustradas n^
Figura 10.8 (c).
TESTE T
CONDIÇÀO CAFEÍNA = SEM CAFEÍNA
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test tor Equality of Means
de Variâncias) (Teste f para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95:
Sig. Mean Std. Error
para a Diferença)
(2-tailed) Difference Difference
Df (Sig. (Diferença (Erro Padrão Lower Uppe-
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superic-
Driving Equal variances 0.005 0.945 -9 .2 6 9 22 0.000 -13.3333 1.43856 -16.317 -10.350
errors assumed (igualdade
(Erros ao de variâncias assumida)
volante) Equa| variances not -9.269 21.714 0.000 13.33333 1.43856 16.319 -10.348
assumed (Igualdade
de variâncias não-
assumida)
A saída mostra que existe uma diferença significativa entre as duas condições envolven
do álcool na presença ou não de cafeína. Os detalhes relevantes são: t(22) = 9,27, p < 0,001.
A análise final do efeito simples é apresentada a seguir. Este teste l examina a diferença
entre as duas condições de álcool na condição cafeína (veja Figura 10.8 (d)). A análise sugere
que existe uma diferença significativa ente as duas condições de presença ou não de álcool.
Os detalhes relevantes são: t(22) - 2,51, p = 0,02.
Estatística sem M atem atica para Psicologia 345
CAFEÍNA = CAFEÍNA
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test for Equality of Means
de Variâncias) (Teste í para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de
Sig. Mean Std. Error
95% a Diferença)
(2-tailed) Difference Difference
Df (Sig. (Diferença (Erro Padrão Lower Upper
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superior)
Driving Equal variances 0.059 0.810 -2.505 22 0.020 -3.25000 1.29758 -5.941 -0.5590
errors assumed (Igualdade
Erros ao de variâncias assumida)
volante) Equal variances not -2.505 21.910 0.020 -3.25000 1.29758 -5.942 -0.5583
assumed (Igualdade
de variâncias não-
assumida)
Você deve ser capaz de observar que existe um efeito do álcool nas duas condições de
cafeína que não é provável ocorrer apenas devido ao erro amostra], dada a hipótese nula como
verdadeira. Essas análises confirmam que, nesse caso, existe um efeito principal genuíno da
variável independente álcool. Não se trata de efeito espúrio causado pela interação entre as
duas variáveis independentes. E um efeito principal genuíno, pois o álcool tem um efeito
significativo nas duas condições da variável cafeína. Para a variável independente cafeína, no
entanto, você deve ser capaz de constatar que existe somente um efeito significativo na con
dição com álcool. Isso indica que devemos ser cautelosos sobre o efeito principal observado
acerca da cafeína. Em virtude de não existir um efeito da cafeína na condição sem álcool,
não podemos declarar que a cafeína, no geral, afeta a habilidade de dirigir. A cafeína pare
ce somente surtir efeito quando os participantes também ingeriram álcool. Esses resultados
mostram, claramente, a importância de se investigar qualquer interação significativa quando
tivermos obtido efeitos principais significativos.
Na prática você deve ser cuidadoso quando conduzir análise de efeitos simples, pois,
quanto mais efeitos simples forem calculados, maior será a taxa de erro de conjunto. No
Capítulo 9, explicamos que a taxa de erro de conjunto (familywise error rate) está relacio
nada à taxa de erro global que se tem ao conduzir muitas análises. Ao se realizar um número
elevado de análises, existe um aumento da probabilidade de se cometer o erro do Tipo I, e
você deve ser seletivo nas análises dos efeitos simples que forem realizadas. ( íeralmente.
346 C hristine P. Dancey & John Reidy
quando um experimento de ANOVA fatorial é realizado, você terá feito alguma espécie
de previsão (como fizemos) sobre os efeitos interativos das duas variáveis independentes.
Você deve utilizar essas previsões para guiá-lo na escolha das análises dos efeitos simples
que precisam ser realizadas. Tais análises são geralmente denominadas de comparações
planejadas ou a priori. Quando as comparações são post hoc, ou você está fazendo muita'
comparações, ou precisa fazer alguns ajustes no nível de significância a (veja a seção sobre
testes post hoc no Capítulo 9). Como examinamos todos os possíveis efeitos simples na
saída do SPSSPW apresentada, o nível de significância deve ser estabelecido em 0,0125.
isto é, 0.05 H- 4. Quando fizermos isso. constataremos que o efeito simples do álcool na
condição com cafeína não é significativo (p = 0.02), e, assim, esta diferença será atribuída
ao erro amostrai.
Atividade 10.5
■ ■, SQ _
q parcial = -
SQ*..' SQ
parcial é útil como uma medida global de magnitude do efeito. Se, no entanto, você estiver in
teressado na magnitude da diferença entre duas condições (o tamanho de um efeito simples),
pode utilizar o d, como sugerido no Capítulo 9.
Quando você tiver realizado a análise, os resultados podem ser relatados da seguinte forma:
As médias e os intervalos de confiança de 95C A para o número de erros ao volante nas condi
ções com e sem álcool e com e sem cafeína são apresentados na Figura 10.9. Sugerem que existe
uma diferença considerável no desempenho ao volante entre as condições com e sem cafeína quan
do os participantes ingeriram álcool, mas não necessariamente quando não beberam. Isso indica
que, nas duas condições de cafeína, o álcool tem um efeito prejudicial no desempenho ao volante.
Existe a possibilidade de uma interação entre as duas variáveis independentes, mas não está claro,
a partir dos valores, quão grande seria essa interação.
O número de erros ao volante foi estudado por meio de uma ANOVA entre partici
pantes com dois fatores de álcool (com e sem) e dois de cafeína (com e sem). A análise
revelou que os efeitos principais devidos aos fatores de álcool (F (l, 44) - 73,27, p <
0.001) e cafeína (F (l. 44). 55,38, p < 0.001) e a interação entre eles (F (l, 44) = 27,09,
p 0,001. r f parcial = 0.38) são improváveis de terem ocorrido somente devido ao erro
amostrai. Isso sugere que são cometidos mais erros ao volante quando álcool é ingerido
do que quando não (médias de 15,13 e 6.83, respectivamente, com r f parcial = 0.63).
Além disso, 63% da variação global dos erros ao volante foram atribuídos à influência
da variável independente álcool. O efeito principal da cafeína indica que existem menos
erros ao volante quando cafeína é consumida do que quando não (médias de 7,38 e 14.58.
Cafeína
í . Sem cafeína
Com cafeína
Sem álcool Com álcool
Álcool
Figura 10.9 Gráfico de barras de erro com médias e intervalos de confiança de 95% para o número
de erros ao volante nas condições com/sem álcool e com/sem cafeína.
348 Christine P. Dancey & John P>eidy
Exemplo da literatura:
preconceito e diferença de gênero
Ekehammare colaboradores (2003) examinaram diferenças de gênero no preconceito implícito.
Nesse estudo, deram a homens e mulheres a tarefa de reconhecer rostos de suecos e de emigrantes
suecos. Então, determinaram o quanto essa tarefa influenciou o grau atribuído ao caráter de uma
pessoa descrita em uma história. Estavam interessados no grau de influência que a apresentação do
rosto da pessoa teve na atribuição de caráter negativo na seguinte história:
No estudo os pesquisadores utilizaram unia ÀMOVA 2 (rostos: suecos versus em igrantes suecos)x2
( gênero do participante: homem versus m ulher/ para analisar as respostas em relação ao carater na
história. Não encontraram efeitos principais significativos da variável independente rostos (F( 1, 3 9 1
= 0,94, p = 0,34), sugerindo que no geral não existe diferença no grau do caráter quando os partici
pantes são previam ente expostos a rostos de suecos e de em igrantes suecos. No entanto, fo i encontrado
uma interação significativa entre as variáveis independentes rostos e gênero (F(l , 39) = 5,63, p =
0,02). Realizaram uma análise post hoc dessa interação usando o teste LD S de Fisher e verificaran,
que mostraram às m ulheres uma negativiclade m aior em relação ao caráter do que os hom ens quando
expostas as fotografia s dos em igrantes, m as não com as dos suecos, sugerindo um grande preconceito
im plícito entre as mulheres.
Os detalhes estatísticos podem ser encontrados em Ekehammar e colaboradores. Você pode ver
que eles apresentaram os valores p reais em vez de simplesmente afirmar que o valor p foi maior ou
menor do que 0,05.
Atividade 10.6
(a) d
(b) r2
(c) r |2 p a rd a l
Estatística sem M atem ática para Psicologia 349
Como em todas as análises, a primeira coisa que você precisa fazer é entrar com os da
dos. A maneira de fazer isso é ilustrada abaixo:
B K tk
F E d í v» w Data Transform Analyze Graphs Utàfoes Wmdov* Help
BilOiâl ail « •I M D ?I Ml f l r l C l- I- I n
1 alegrou» i1
alcaiouD V cafqroup | drjverrs | 1 1 1 1
> * 100/^ 400
y 100 900
1CCi^/ i00 1000
Duas variáveis z' ' 100 800
^ 5 100 100 600
de grupo e 100 100 1100
uma dependente.
S i 100 100 200
8 1oo 100 1100
9 100 100 1100
10 100 100 1000
11 100 100 300
12 1oo 100 1000
13 100 200 800
14 100 200 400
15 100 200 900
16 100 200 00
17 1oo 200 800
18 100 200 600
19 100 200 600
20 I00 200 300
21 1oo 2CC 00
22 100 200 800
<1»|\r».il.i VI«* K i H<1 .. i
S PS S P ro c «« * tsready
Lembre-se de que, quando for organizar um banco de dados para uma análise para
duas variáveis independentes entre dois grupos, você precisará determinar duas variáveis de
agrupamento contendo os números que representam os grupos aos quais os participantes
pertencem. Assim, se o participante 15 está no grupo sem álcool/com cafeína, terá um "1"
na coluna alegroup (grupo do álcool) e um “2” na coluna cafgroup (grupo da cafeína). Al
guém no grupo com álcool/sem cafeína terá um "2" na coluna alegroup e um “ 1” na coluna
vafgroup, e quem estiver no grupo com álcool/com cafeína terá um "2" nas duas colunas. A
terceira variável que vai precisar determinar é para a variável dependente, que conterá os va
lores de cada uma das pessoas, nesse caso, o número de erros cometidos ao volante.
em que o arquivo de dados foi dividido, isto é, para as condições com e sem álcool. Dessa
maneira podemos obter todas as estatísticas descritivas para cada um dos quatro grupos de
participantes.
O primeiro passo, portanto, é solicitar que o SPSSPW divida o arquivo em duas partes.
Você pode fazer isso clicando na opção Data (Dados), em Split File (Dividir Dados).
EESSm
Fie E<V ■ с У» Transform Analyze Graphs U til« Window Hdp
ШШШ JâJjsJ
Q i a j l it Oefne Variabte Properties...
----->-----1-----* - Copy Data Properties... ■ 11 ;l-t-inl 'VI^I
1 afcgroup Define Dates...
■ÜCQ i i i i 1 I u
1
2
3 S o r te « « ...
4 Transpose...
5
Merge Fies »
6
Aggregate .
7
Identfy erpicate Cases...
8
9
Setect '.ases...
10
Wetf* Cases...
11
12 100 1 00 10 00
13 100 2 00 8 00
14 100 200 40 0
15 100 2 00 9 00
16 1 00 2 00 00
17 100 2 00 8 00
18 1 00 20 0 60 0
19 1 CO 2 00 6 00
20 loo :go 300
21 1 00 20 0 00
22 1 »XI J 00 8 00
4
< I » |\ P j i4 Vie* X Vertette View / ■ i« i i лi
SPSS Processor »ready
-1*1X1
a=la|a| 51 ^ 1_J fcifej «I £ 1Ü a-x-lnl :*M
Selecione essa _L-
o pção e m ova i? calpouo Ana^re al case», do no» create group»
*> Onvmg eiroii [<*ivetuj f ' Compare gioups
a variável
C' Üigani» oulpU by group*
dlcgroup Groups Bated on
Você precisará selecionar a opção Organize output by qroups (Organize a saída por
grupos) e mover a variável álcool (alcohol) para a caixa (Jroups based on (Grupos basea
dos em). Feito isso, clique no botão OK. O arquivo estará agora efetivamente dividido
em dois, para a condição sem álcool e para a condição com álcool. Qualquer análise que
realize agora será executada nos dois arquivos separadamente. Assim, o próximo passo é
fazer com que o SPSSPW produza as estatísticas descritivas. Você precisa trabalhar com
u caixa de diálogos Analyze (Analisar), Descriptive Statislics (Estatísticas Descritivas),
Explore (Explorar).
Quando o SPSSPW executar essas análises, produzirá dois conjuntos de estatísticas des
critivas, uma para a condição sem álcool e outra para a condição com álcool. Dessa forma,
você terá obtido as estatísticas descritivas (incluindo diagramas de caixa e bigodes e histogra
mas) para todos os quatro grupos envolvidos no estudo.
Quando tiver obtido as estatísticas descritivas para cada um dos quatro grupos, poderá
realizar a ANOVA nos dados. Você precisará solicitar ao SPSSPW para reagrupar os dados
que foram previamente divididos. Se não fizer isso, verá que o software tentará executar a
análise nas duas partes do arquivo separadamente, o que estaria incorreto. Dessa forma, você
precisa deixar o SPSSPW saber que se deve utilizar todos os dados juntos na execução da
ANOVA. Para fazer isso, é preciso voltar ao menu Data (Dados), Split File (Dividir Dados),
e selecionar a opção Analyze ali cases, do not create groups (Analisar todos os casos, não
criar grupos).
352 Christine P. Dancey & John Reidy
SEEK
Selecione a
e jH je i 51 n L J fcJU «1 £ 1 0 П 1М З opção Analyze
ali cases
(A nalisar todos
r’~ Analyse al caies. do no« create gicn*» Г 5Г os casos)
Compare groups
f~ Organee output by groups
Rese»
•> afcgro^j Cancel
□ Help
P
r ■
ГЗ - -ro u ’ ?uu
16 1 00 2 00 00
17 1 CD 200 800
18 1 00 200 600
19 1 00 200 6cc
20 1 00 200 300
21 1 00 200 00
22 1 00 200 800
« 1 > |\0 .it.i View X Va»lefcfe V«-./ /
SPSS Processor «ready
ir 1
st irt tTi' alcohol caffeine BG < l... ^ Microsoft Photo Ed*of “ * * *4i<» i itQ, им
Execução da ANOVA
Para que o SPSSPW execute a ANOVA, você precisa selecionar as opções General L
near Models (Modelos Lineares Geralizados), Univariate (Univariada), do menu Anal):
(Analisar).
jäi*i
g^lBiai sal Mova a VD
e as Vis para
estes locais
Clique no
botão Options
(Opções)
"1-iL
SPSS Processor e ready SpfcHeOn
ii S tart) I Дй alcohol caffeine BG an... ^ Nfccrosoft Photo Edtc* <<• **.$)<» '-fc.0, и «
Estatística sem M atem ática para Psicologia 353
a
•1 -r.l r» lfrl
Selecione
Estimates
o f effe ct size
(Estim ativas
do tam anho
do efeito)
I Corrfrup I Canc«l
2 00
за- JffJx J
il
•> dcgioup ^ Ала^ге a i cases, do not cteate gnx^jj
« Orivng tnot'. [dnveifs] C Compare groups
(• Otgaree output by gioups
Groups Based on____
Ш
(• Soft ihe lie by дгскдод vaiiables
Г Fie is already sorted
Current Status Oiдалее output by aicgroup
~ ra 1 üu ■ z uu
16 1 00 200 00
17 1 00 200 800
16 1 00 200 60 0
19 1.00 200 60 0
20 1 00 20 0 30 0
21 1 00 2.00 00
22 1 00 20 0 80 0
■ 1 > l\D .rta View ^ Verlebte View / J 21^
SPSS Processor isready Spit П в On
J S ta rt) I ;itili alcohol c affeine BG an... ^ Microsoft Photo Editor « ?•«.<)<» í iàQ, И:«
Feito isso, clique no botão OK. e o arquivo será dividido novamente. Você pode rod_-
o teste t independente com álcool como variável independente e erros ao volante corr
variável dependente. O SPSSPW conduzirá testes t para as condições com cafeína e s e r
cafeína.
Você precisará realizar mais testes t para examinar as diferenças entre as condiçõe
com e sem cafeína em cada uma das condições da variável independente álcool. Precisar -
retornar à caixa de diálogos Data (Dados), Split Eile (Dividir Arquivo) e mover a variá\r
álcool para a caixa Groups Based on (Grupos com base em) em vez da variável cafeír._
Feito isso, poderá realizar o teste t independente com a cafeína como variável independe-
te, e erros ao volante como variável dependente sob as duas condições da variável álcoo
Lembre-se, quando você tiver terminado a análise dos efeitos simples, deve informar _
SPSSPW para reagrupar novamente o arquivo dividido, de modo que qualquer análise sub';
qiiente necessária possa ser feita sobre todos os dados.
-1*1*1
m i n i a i 5 J j _ ] _ J fcjfe j Mj HTJfrj E l í j n j ^ |rg |
cafqroup I drrverrs _L
1 1 001 1 00 400
2 1.00 1 00 900
3 1 00 I 00 10 00
4 1 00 1 00 80 0
5 1 00 1 00 60 0 xj
6 1 00 1 00 11 00
Petr« I
7 1 00 1 00 2 00 5 vd(4b Selecione
8 1 00 1 00 11 00 Cancel I
Clustered
9 1 00 1 00 11 00 Clwrtwed
Hcfc I
10 1 00 1 OCi 10 00 (Agrupado)
II 1 00 1 00 300 Data n Chart Ate
12 1 00 1 00 10.00 <• Summar** 1« groups oí cate*
e Summaries
13 1 00 200 80 0 Summaries o» separale variables for groups of
14 1 00 200 400
15 1 00
cases
200 9 00
16 1 CO 200 00 (Sumário pra
17 1 00 200 800
grupos d e casos)
I8 i aD 200 6 00
19 1 00 200 6.00
20 1 00 20 0 300
21 1 00 200 00
22 1 rei ?o o 80 0
■I » |\[).k.i Vif?/, h Var-st*» v > * /
SPSS Processor e ready
/ S ta rt| _ / Chapter 10 I^ Mcjosc/t Photo Edtor 11 5® a*t °hol caffeine BG a ' qjt&A ¡M7
..ü
Mova as variáveis
para os locais
adequados
356 Christine P. Dancey & John Reidy
Mostramos como a ANOVA pode manejar duas variáveis entre participantes e a interação
entre elas em uma análise. Agora vamos apresentar o caso de duas variáveis dentre partici
pantes. Permaneceremos com o mesmo estudo e os mesmos dados utilizados para o exemplo
das variáveis entre participantes, de modo que possamos destacar as diferenças entre os doi>
tipos de delineamentos. A distribuição agora é mostrada na Tabela 10.5. Compare isso com o
delineamento apenas entre participantes anterior (Tabela 10.4).
Você deve ser capaz de ver que temos 12 participantes tomando parte do estudo, mas
cada pessoa contribuiu com um escore em cada uma das células da tabela, isto é, cada um
deles tomou parte em cada uma das quatro condições. Obviamente, isso é difícil de ser exe
cutado em uma única ocasião, e, assim, é necessário que os participantes sejam examinado-
em quatro oportunidades diferentes.
Tabela 10.5 I listribuições dos escores das condições em um projeto dentre participantes
1 4 8 28 5
2 9 4 22 6
3 10 9 21 14
4 8 0 27 8
5 6 8 21 14
6 11 6 20 5
7 2 6 19 11
8 11 3 16 8
9 11 0 25 10
10 10 8 17 11
11 3 9 19 8
12 10 8 20 8
Temos os mesmos dados utilizados na análise anterior (entre participantes), o que signi
fica que as hipóteses necessárias para a utilização de um teste paramétrico também se fazern
necessárias nesse caso. Você deve notar, no entanto, que isso só ocorre porque temos apena-
duas condições para cada uma das nossas variáveis independentes. Se tivermos mais do que
duas condições em qualquer uma das variáveis independentes dentre participantes, precisare
mos checar também se os dados não violam a hipótese adicional de esfericidade, consultando
o teste de Mauchley na saída (tabela) da ANOVA. Lembre: explicamos que essa é a hipóte.-;
adicional necessária quando o delineamento é dentre participantes (veja Capítulo 9).
1 1 noaicnocaff
2 noalccaff
2 1 alcnocaff
2 alccaff
358 C hristine P. Dancey & John Reidy
Partial Eta
Value Hypothesis df Error df Squared
Effect (Efeito) (Valor) F (gl da Hipótese) (gl do Erro) Sig. (r|2 Parcial)
alcohol (Álcool) Pillai's Trace 0.882 82.331a 1.000 1 1 .000 0.0 0 0 0.882
(Traço de Pillai)
Wilks' Lambda 0.118 82.331a 1.000 1 1.000 0.0 0 0 0.882
(Lambda de Wilks)
Hotelling's Trace 7.485 82.331a 1.000 1 1.000 0.0 00 0.882
(Traço de Hotelling)
Roy's Largest Root 7.485 82.331a 1.000 11 .000 0.0 00 0.882
(Maior Raiz de Roy)
caffeine (Cafeína) Pillai's Trace 0.767 36.150a 1.000 11.000 0.0 0 0 0.767
(Traço de Pillai)
Wilks' Lambda 0.233 36.150a 1.000 11.00 0 0.0 0 0 0.767
(Lambda de Wilks)
Hotelling's Trace 3.286 36.150a 1.000 1 1.000 0.0 0 0 0.767
(Traço de Hotelling)
Roy's Largest Root 3.286 36.150a 1.000 11 .0 00 0.000 0.767
(Maior Raiz de Roy)
alcohol * caffeine Pillai's Trace 0.696 25.184a 1.000 1 1 .000 0.0 00 0.696
(álcool * cafeína) (Traço de Pillai)
Wilks' Lambda 0.304 25.184" 1.000 11 .0 00 0.0 00 0.696
(Lambda de Wilks)
Hotelling's Trace 2.289 25.184a 1.000 11 .0 00 0.0 00 0.696
(Traço de Hotelling)
Roy's Largest Root 2.289 25.184a 1.000 11 .000 0 .0 0 0 0.696
(Maior Raiz de Roy)
Aprox. Epsilon3
Chi-Square
Within Subjects Effect W de (Qui-Quadrado df Greenhouse- Lower-bounc
(Efeito Dentre Sujeitos) Mauchly Aproximado) (gl) Sig. Geisser Huynh-Feldt (Limite ifiter,c
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is
proportional to an identity matrix (Testa a hipótese nula de que a matriz de covariancia dos erros da variável dependente transform 5 : -
e ortonormalizada é proporciona! a urna matriz de identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table (a. Pode ser utilizado para ajustar os graus de liberdade para o teste de significancia pondera .■
:
Testes corrigidos são mostrados na tabela dos efeitos dos testes dentre sujeitos.)
b. Design: intercept (Projeto: Intercepto) Within Subjects Design: alcohol + caffeine + alcohol*caffeine
(b. Projeto: dentre sujeitos-álcool^cafeina +áicool'cafeina.)
Sig. = Significância
Estatística sem M atem ática para Psicologia 359
Sig. = Significancia
Sig. = Significancia
Atividade 10.7
Para podermos calcular o valor F no delineamento dentre participantes, temos que dividir
a variância atribuída a cada efeito (média dos quadrados dos efeitos) pela variância do erro
(média dos quadrados dos erros) que foi calculada para lal efeito. Assim, da saída, você pode
verificar que o valor F para o efeito principal do álcool é:
825,021 •v- 10,021 = 82.331
Você notará, ainda, na saída oferecida, que o número total de graus de liberdade foi re
duzido dos 44 no delineamento entre participantes para 11 neste caso. A razão disso é que
temos agora apenas 12 participantes, enquanto na situação anterior existiam 48 (12 em cada
condição).
TESTE T
Std. Error
Mean Std. Deviation Mean (Erro
(Média) N (Desvio Padrão) Padrão da Média)
Pair 1 No alcohol no caffeine 7.9167 12 3.31548 0.95 71 0
(Pari) (Sem álcool e sem cafeína)
No alcohol caffeine 5.7500 12 3.27872 0.94648
(Sem álcool e com cafeína)
Pair 2 Alcohol no caffeine 21.2500 12 3.72034 : 07397
(Par 2) (Com álcool e sem cafeína)
Alcohol caffeine 9.00 00 12 3.07482 0.88763
(Com álcool e com cafeína)
Pair 3 No alcohol no caffeine 7.9167 12 3.31548 0.95 71 0
(Par 3) (Sem álcool e sem cafeína)
Alcohol no caffeine 21.2500 12 3.72034 1.07397
(Com álcool e sem cafeína)
Pair 4 No alcohol caffeine 5.7500 12 3.27872 0.94648
(Par 4) (Sem álcool e com cafeína)
Alcohol caffeine 9.COOO 12 3.07482 C .88763
(Com álcool e com cafeína)
362 Christine P. Dancey & John Reidy
Correlation
N (Correlação) Sig.
Pair 1 No alcohol no caffeine & 12 -0 .3 5 3 0.260
(Par 1) No alcohol caffeine
(sem a Icool e sem cafeína &
(sem a'cooi e com cafema)
Pair 2 Alcohol no caffeine & 12 -0 .2 6 2 0.410
(Par 2) Alcohol caffeine
(com aicoo e sem cafeína &
ice."' alcoo e com cafeína)
Pair 3 No alcohol no caffeine & 12 -0 .1 5 3 0.635
(Par 3) Alcohol no caffeine
(sem a cool e sem cafeína &
com álcool e sem cafeína)
Pair 4 No alcohol caffeine & 12 0.225 0.481
(Par 4) Alcohol caffeine
(sem álcool e com cafeína &
com álcool e com cafeína)
Sig. = Significancia
95% Confidence
Interval of the
Difference (IC de
Std. Std. Error 95% para a Diferença)
Mean Sig. (2-tailed)
Mean (Desvio (Erro Padrão Lower Upper df (Sig.
(Média) Padrão) da Média) (Inferior) (Superior) t (gl) Bilateral)
Pair 1 No alcohol no caffeine - 2.16667 J. / -¿I 1.56589 -1.280 5.61317 1.384 11 0.194
(Par 1) No alcohol caffeine
(sem álcool e sem cafeína -
(sem álcool e com cafeína)
Pair 2 Alcohol no caffeine - 12.250 5.41253 1.56246 8.8110 15.689 7.840 11 0.000
(Par 2) Alcohol caffeine
(com álcool e sem cafeína -
(com álcool e com cafeína)
Pair 3 No alcohol no caffeine - -13.333 5.34846 1.54397 -16.73 -9.9351 -8.636 11 0.000
(Par 3) Alcohol no caffeine
(sem álcool e sem cafeína -
com álcool e sem cafeína)
Pair 4 No alcohol caffeine - -3.2500 3.95716 1.14233 -5.76 4 -0.73574 -2.845 11 0.016
(Par 4) Alcohol caffeine
(sem álcool e com cafeína -
com álcool e com cafeína)
Sig. = Significancia
Estatística sem M atem ática para Psicologia 363
Exemplo da literatura:
graus de atratividade de formatos de corpos de mulheres
A taxa de atratividade fo i analisada utilizando uma ANOVA de medidas repetidas (dentre parti
cipantes) com peso corporal e CQ como variáveis independentes. A variável dependente fo i a taxa de
atratividade dada pelos participantes. A análise revelou efeitos principais significativos tanto do peso
(F(2. 41) = / 1,70, p < 0,005) quanto da razão CQ (F(4, 39) = 29,92, p < 0,001). Foi encontrada ainda
uma interação significativa entre as variáveis independentes (F(8, 35) = 45,50, P k 0.001). Os pesquisa
dores investigaram essa interação utilizando um teste dc B onfem im i que comparou vários CQ para peso
corporal separadamente. Descobriram que, para todos os pesos, as mulheres com uma taxa de CQ ten
dendo a 0,7 foram consideradas as mais atrativas. Entretanto, para pesos moderados¡ um grande leque
de CQ foram considerados atrativos quando comparados com corpos de form as leves ou pesadas.
i^ ia iâ i^ i i 1M Reports
Descnptive Statist«
1 noafcnocafl 4 Tables
Compare Means
noalcnocaff] noalccaf
Urwanate...
4 00| 8C
1
2 9 00 4C
MKedModete MAivanate .
Correlate
3 10 00 9C Regression
4 8 00 C Variance Components...
LogSnear
5 6 00 8C Classify
6 11 00 6CC
6 Data Reduction
7 2 00 6C Sede
8 11 00 3C Nonpaiaroetnc Tests
9 Time Senes
11 00 c
Survival
10 10 CO 8C
Multiple Response
11 3 00 9C Mesng Value Analysis..
12 1000 8C Complex Samples
Dê um nom e
1 noalcnocall 4
para cada noalcnocaflj noalccaff 1 alcnocaff 1 alccaff | _L J_____ L JU 1
variável e o 2800 5 00
núm ero de J C IO O
Wühn-Sutoiecl Fado»Name |ca/ler* | Defñe |
condições e *8 00
Numòei ol Lávete
600 8 00 Rese<
cliq ue em
11 00 600' 20*
afcoW2l Cancel
A d d (A d icio nar) 200 6 CO
11 00 "XI
10 00 600
300 900
10 co 8 00
~LiL
SPSS Processor is ready
Quando atribuir nomes às variáveis dentre participantes, deverá lembrar de qual no
meou primeiro, pois isso c importante quando definir cada variável na caixa de diálogo
seguinte.
366 C hristine P. Dancey & John Reidy
jsjxj
=i&|m| -rir-i g - i- ir i '*№
1 noalcnceafl
I R epeated M e m u r»
fioaicnocafli
Wíh»vSub(ecii Vanattes I«lcohoix«llene|
1-
. EH3EE1E5
900
rwaícnocaHII 1)
10oo OJ nojfccaft{1 2)
B et« I
soo alcr>ocalH21)
60 0 Cancd |
U 00 □ Hetp I
2 G0
11CO
11CO
10 CO
Be»waen-Svfctectt Faciorfs)
30 0
10 00 tu
tu
ConlHMtt | Ptots | PoaHoc... | Save | OpQon; |
/ Start | ^ Mcrosoft Photo Edtor i 7T .ilr c .iff WG <inova - S... . « 'O Q 11:50
Quando você move variáveis de uma caixa para outra, precisa fazê-lo na ordem correta
Esse é o motivo pelo qual precisa lembrar da ordem em que definiu as variáveis na caixa de
diálogos anterior. Na caixa de diálogos Within-Subjects Variables (Variáveis dentre Sujeitos
você pode ver que cada entrada tem um código de dois dígitos, por exemplo, (1, 2). Esi-e
código informa que a entrada em particular representa a primeira condição da variável I e _
segunda condição da variável 2. Lembre: definimos álcool como a primeira variável e cafeúh
como a segunda. Se você acha que não lembra a ordem em que nomeou as variáveis, o SPSS
PW fornece uma dica próximo ao topo da caixa de diálogo. Conseqüentemente, cada códip
representa as seguintes condições:
■ (1,1) = sem álcool/ sem cafeína
■ (1,2) = sem álcool/ com cafeína
■ (2, 1) = com álcool/ sem cafeína
■ (2. 2) = com álcool/ com cafeína
Portanto, as variáveis precisam ser movidas para o local específico na caixa Withir-
Subjects Variables (Variáveis dentre Sujeitos). Quando você tiver movido todas as variáve:-
relevantes para o local apropriado clique no botão Options (Opções) e marque a opção Efft
Size (Tamanho do Efeito), como feito com o delineamento entre participantes anterior. Clique
no botão Continue (Continuar) e no botão OK para executar a análise. Você deve ser apresen
tado a saídas semelhantes às anteriores.
A análise dos efeitos simples é um pouco mais complicada do que no delineamento an
terior. Nesse caso, não precisamos solicitar que o SPSSPW divida o arquivo porque cada
participante forneceu valores para todas as condições. Assim, simplesmente temos de informa:
Estatística sem M atem ática para Psicologia 367
ao software quais variáveis devem fazer parte de cada teste I (lembre-se de que estamos utili
zando o teste I para amostras relacionadas). Se quisermos examinar a diferença entre os grupos
com e sem á lco o l na condição sem cafeína, devemos executar um teste t relacionado nas variá
veis sem álcool e sem cafeína, bem como com álcool e sem cafeína. Se quisermos examinar as
diferenças entre as condições com e sem cafeína na condição com álcool, devemos realizar um
teste l com as variáveis com álcool e sem cafeína, e com álcool e com cafeína.
O último delineamento abordado neste capítulo é uma mistura dos delineamentos en
tre e dentre participantes. Tal análise é muitas vezes denominada de ANOVA subdividida
(split-plot ANOVAI). Continuaremos com o exemplo álcool/cafeína/direção, mas dessa vez
vamos considerar que a variável independente álcool é um fator dentre participantes, e a
variável independente cafeína será tomada como um fator entre participantes. A alocação
dos participantes às condições e seus escores na habilidade de dirigir estão apresentados
na Tabela 10.6.
Como estamos utilizando os mesmos dados que as análises anteriores, podemos inferir
que as suposições necessárias foram satisfeitas. Novamente, esse é o caso porque temos
apenas duas condições na variável independente dentre participantes. Se tivéssemos mais
do que duas condições, precisaríamos nos assegurar de que a hipótese de esfericidade é
verdadeira.
C orno feito com as duas ANOVAs anteriores, a primeira coisa com que devemos nos pre
ocupar são as possíveis fontes de variação nesse delineamento subdividido. Você poderá ver
pela saída da análise que a variável independente entre participantes tem seu próprio termo
erro. A análise de uma variável independente entre participantes é semelhante a realizar uma
ANOVA de um fator, ignorando a variável independente entre p articip an tes.
Tabela 10.6 Distribuição dos escores às condições num delineamento de parcelas subdivididas (.split-plot)
Participantes Sem cafeína Com cafeína Participantes Sem cafeína Com cafeína
1 4 13 28 5
2 9 14 22 6
3 10 15 21 14
4 X 16 27 8
5 6 17 21 14
6 11 18 20 5
7 2 19 19 11
8 II 20 16 8
9 II 21 25 10
10 10 22 17 11
11 3 23 19 8
12 10 24 20 S
368 Christine P. Dancey & John Reidy
Epsilon"
Aprox. Chi-Square
Within Subjects Effect Mauchly's W (Qui-Quadrado df Greenhouse- Lower- bou no
(Efeito Dentre Sujeitos) (W de Mauchly) Aproximado) (gl) Sig. Geisser Huynh-Feldt (Limite Infenc'
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is proport'C'
to an identity matrix (Testa a hipótese nula de que a matriz de covariâncía dos erros da variável dependente transformada e ortonormaliza:.-
proporcional a uma matriz de identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected test are displayed in the Tests :
Within-Subjects Effects table (a. Pode ser utilizado para ajustar os graus de liberdade para o teste de significance ponderado. Testes corriç :
são mostrados na tabela dos efeitos dos testes dentre sujeitos.)
b. Design: intercept+alcgroup (b. Projeto: Intercepto+alcgroup)
Within Subjects Design: cafgroup (Projeto: dentre sujeitos-cafgroup)
Sig. - Significância
Estatística sem M atem ática para Psicologia 369
Test o f W ithin-S ub jects E ffe cts (Teste dos Efeitos Dentre Sujeitos)
Measure: MEASURE_1 (Medida: Medida 1)
Mean
Type III Sum of Squared Partial Eta
Squares (Soma dos df (Quadrado Squared
Source (Fonte) Quadrados do Tipo III) (gl) da Média) F Sig. (ri2 Parcial)
cafgroup Sphericity Assumed 623.521 1 623.521 42.474 0.000 0.659
(Esfericidade assumida)
Greenhouse-Geisser 623.521 1.000 623.521 42.474 0.000 0.659
Huynh-Feldt 623.521 1.000 623.521 42.474 0.000 0.659
Lower-bound 623.521 1.000 623.521 42.474 0.000 0.659
(Limite inferior)
cafgroup*alcgroup Sphericity Assumed 305.021 1 305.021 20.778 0.000 0.486
(Esfericidade assumida)
Greenhouse-Geisser 305.021 1.000 305.021 20.778 0.000 0.486
Huynh-Feldt 305.021 1.000 305.021 20.778 0.000 0.486
Lower-bound 305.021 1.000 305.021 20.778 0.000 0.486
(Limite inferior)
Error(cafgroup) Sphericity Assumed 322.958 22 14.680
(Erro (cafgroup)) (Esfericidade assumida)
Greenhouse-Geisser 322.958 22.000 14.680
Huynh-Feldt 322.958 22.000 14.680
Lower-bound 322.958 22.000 14.680
(Limite inferior)
Sig. = Significancia
Mean
Type III Sum of Squared Partial Eta
Squares (Soma dos df (Quadrado Squared
Source (Fonte) Quadrados do Tipo III) (gl) da Média) F Sig. (ri2 Parcial)
intercept (Intercepto) 5786.021 1 5786.021 738.106 0.000 0.971
alegroup 825.021 1 825.021 105.245 0.000 0.827
Error (Erro) 172.458 22 7.839
Sig. = Significancia
TESTE T
GRUPO DO ÁLCOOL = SEM ÁLCOOL
N Correlação Sig.
95% Confidence
Interval of the
Difference (FC de
Std. Std. Error 95% para a Diferença)
Deviation Mean Erro Sig. <2--
Mean (Desvio (Padrão Lower Upper df (Sign ■
(Média) Padrão) da Média) (Inferior) (Superior) t (gl)
Pair 1 No caffeine & Caffeine 2.167 5.42441 1.56589 1.27984 5.61317 1.384 11
(Par 1) (Sem cafeína/Com cafeína)
N Correlaçao Sig.
95% Confidence
Interval of the
Deference 1C de
Std. Std. Error 95% para a Diferença)
Deviation Mean Erro Sig. (2-tailed)
Mean (Desvio (Padrão Lower Upper df (Significancia
(Média) Padrão) da Mèdia) (Inferior) 1 (Superior) t (90 Bilateral)
Pair 1 No caffeine & Caffeine 12.250 5.41253 1.56246 8.8110 15.689 7.840 11 0.000
Par 1) (Sem cafeina/Com cafeína)
TESTE T
Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade t-test for Equality of Means
de Variâncias) (Teste ( para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (1C de 95%
Sig. Mean Std. Error
para a Diferença)
(2-tailed) Difference Difference
df (Sig. (Diferença (Erro Padrão Lower Uppe-
F Sig. t (gl) Bilateral) das Médias) da Diferença) (Inferior) (Superior'
No Equal variances 0.005 0.945 -9.269 22 0.000 -13.33333 1.43856 -16.317 -10.350
caffeine assumed (Igualdade
(Sem de variâncias assumida)
cafeína) £qua| varjances n0( -9.269 21.714 0.000 -13.33333 1.43856 -16.319 -10.348
assumed (Igualdade
de variâncias não-
assumída)
ç om Equal variances 0.059 0.810 -2.505 22 0.020 -3.25000 1.29758 -5.94101 -0.55899
caffeine assumed (Igualdade
(Com de variâncias assumida)
cafeína) Equal variances not -2.505 21.910 0.020 -3.25000 1.29758 -5.94166 -0.5583-
assumed (Igualdade
de variâncias não-
assumida)
Sig. = Significancia
Atividade 10.8
Calcule d para o s quatro e feito s sim ples das com p arações referidas.
Exemplo da literatura:
diferenças entre os gêneros na literatura de mapas
U m e stu d o r elatad o p or M a cF a d d en e c o la b o r a d o r e s ( 2 0 0 3 ) in v e stig o u d ife r e n ç a s de g ê n e ro
na leitura d e m apas e no fo r n e c im e n to de in str u ç õ e s c o m b a se n e s s e s m ap as. N e s s a p e sq u isa um
m apa fo i ap resen ta d o em u m a tela de com p u tad or, e o s p articip an tes foram so lic ita d o s a encontrar
a rota de um lugar para o u tro n o m apa (p. e x ., de um a e s c o la para o aero p o rto ). O s p a rticip a n tes
tin h am d o is m in u to s para en con trar o ca m in h o : p recisa v a m , en tã o , e sc re v er in str u ç õ e s em um p a
p el d e m o d o que outra p e ss o a p u d e sse en con trar o c a m in h o d o p o n to d e partida até o d e stin o . O s
p e sq u isa d o re s m ed iram o s p a itic ip a n te s por m e io de um “ c o n tr o le para o s o lh o s" a fim de verificar
s e e x istia m d ife re n ç a s sob re a form a c o m o h o m e n s e m u lh e r es v a sc u lh a v a m o m apa. T am b ém e x a
m inaram as in str u ç õ e s escrita s para verificar d ife r e n ç a s de g ên ero .
F e z -s e o e x a m e d o s m apas co m A N O V A 2 x 2 . c o m g ê n e ro c o m o um a variável in d ep en d e n te e n
tre p articip an tes e p o n to s de fix a ç ã o d o olhar (p o n to s de referên cia da cid a d e ou leg e n d a s de b ú sso la )
c o m o u m a variável in d e p e n d e n te dentre p articip an tes. A variável d e p e n d en te fo i o te m p o m é d io
g a sto de fo c a liz a ç ã o do p on to de referên cia ou das m arcas da b ú sso la . O s p esq u isa d o res encontraram
um e fe ito princip al sig n ific a tiv o d o s p o n to s de " fix a çã o do olhar" (F( 1 . 4 2 ) = 150 4 , 2 2 0 , p < 0 ,0 0 1 ).
D e sc o b r ira m que os p articip an tes se concen traram sig n ifica tiv a m e n te m ais n o s p o n to s de referên cia
d o q u e nas le g e n d a s da b ú ssola. N ã o se verificaram e fe ito s p rin cip ais de g ê n e ro nem sig n ific a n c ia de
in teração. O s autores não relataram o s valores F e p para o e fe ito princip al ou interação.
A a n á lise das in stru ções dadas p e lo s participantes foi projetada para com parar h om en s e m ulheres
quanto ao núm ero de p o n to s de referên cia e de d ir e ç õ e s norte, su l, leste ou o e ste. E ss e s d ad os foram
c o n v e rtid o s em e sc o r e s z e an a lisa d o s por um a A N O V A 2 x 2 , co m gên ero c o m o um a variável in d e
p end en te entre participan tes e estratégias de d ireção (p on tos de referên cia versus legen d as da b ú ssola)
c o m o variável in d ep en d en te dentre participan tes. N ã o se verificou um e fe ito principal sig n ifica tiv o de
g ên ero (o s autores não forneceram o s valores F e p). N o entanto, fo i con statad o um a interação sig n i
ficativa entre gên ero e estratégias de d ireção ( F ( l , 4 2 ) = 4 .4 5 8 . p = 0 ,0 2 1 ). E ssa interação fo i segu id a
com testes t p ost hoc que m ostraram que o s h o m e n s fizeram m ais referên cias a p o n to s da b ú ssola do
p = 0 ,0 0 6 ). O s autores não registraram os d etalh es d os outros testen t
que as m u lh eres (/(4 3 ) = 2 .6 9 9 ,
realizad os. T am bém não relataram d eta lh es d o s e fe ito s prin cip ais das estratégias de direção.
V ocê d ev e notar, a partir d is s o , q u e o s autores têm um a te n d ê n c ia de d e ix a r de relatar o s d e ta
lh e s das e sta tístic a s n ã o -s ig n ific a tiv a s . A c o n s e lh a m o s qu e v o c ê relate to d o s o s d e ta lh e s q u a n d o for
registrar as a n á lise s realiza d as.
374 C hristine P. Dancey & John Reidy
1 Start] ^ »Vrosctt Photo Edt or 11 caff alcohol «put ptet —*'• 1ISB1
EJ! Mbii*i mm
ui. ’|пи:п I nocaffeifie I caffems I _L
:*»
200
2 DO 21 OC'
:X 20 00 5 UT-
2 00 1900 I I rjo
200 1600 900
200 2 600 10 00
200 17 00 'il 00
ЗИ\ !•>* X V.VlHH гг SPSS Processor e ready
1 Start I ^M crosoft Photo Edto | [gg саЯ alcohol tptt plot ... > < ] C i 1I152
Estatística sem M atem ática para Psicologia 375
Quando você tiver determinado as variáveis, clique no botão Options (Opções) para se
lecionar a análise do tamanho do efeito e clique no botão OK para que esta comece. A saída
deve ser semelhante a uma já mostrada a você.
Quando for investigar os efeitos simples, precisa ler em mente que uma das variáveis é entre
participantes (nesse caso a variável alc). Assim, se quiser examinar as diferenças entre as condi
ções com e sem cafeína em cada uma das condições alcoólicas, você precisa instruir o SPSSPVV a
dividir o arquivo utilizando a variável álcool (Data - Dados. Splii File - Dividir arquivo). Expli
camos como fazer isso anteriormente, no capítulo. Você pode conduzir os testes i relacionados nas
variáveis nocafft caff. Se quiser examinar as diferenças entre as condições com e sem álcool, não
precisará dividir o arquivo, mas rodar um teste t independente com alc como variável indepen
dente e caff como variável dependente. E válido reiterar aqui que você deve ter cuidado quando
utilizar a opção de dividir o arquivo (Split File). E preciso lembrar de juntar novamente o arquivo
uma vez feita a análise necessária, de modo que qualquer análise adicional seja feita sobre todos
os dados. Assim, deve-se fazer isso antes de se rodarem os testes t independentes.
Resumo
■ C o m o o S P S S P W f o r n e c e o r f p arcial e n q u a n to u m a m e d id a d o ta m a n h o do e f e i
to na A N O V A fa to ria l e q u e i s s o é s im p le s m e n te a razã o d o e f e it o da s o m a do>
q u a d r a d o s d iv id id a p e lo e f e it o da so m a d o s q u a d r a d o s m a is a s o m a d o s q u a d ra d o s
d o s erros.
■ Q u e q u an d o te m o s um d e lin e a m e n to c o m p le ta m e n te dentre p articip an tes, o e fe iu
p rin cip al e a in teração lèm o s se u s próp rios term os erro.
■ Q u e as a n á lise s a priori e post hoc d o s e fe ito s sim p le s p o d em se r fe ita s c o m te stes t.
■ Q ue, quando c o n d u zim o s m ais do que um a com p a ra çã o post hoc (ou a priori ), d ev e
m o s ajustar o nível de sig n ificâ n cia , d iv id in d o -o p elo nú m ero de co m p a r a çõ e s feitas.
Exercício 1
U m a p e sq u isa d o ra , Dra. B od , e stá in te re ssa d a em ex a m in a r se a h a b ilid a d e a c a d ê m u .
d e c lin o u n o s ú ltim o s 2 0 an os. E la d e c id e com p arar o d e se m p e n h o de um a am ostra de e s tu
d an tes de n ív el A , q u e fize ra m o s e x a m e s em 1 9 9 7 , c o m um a am o stra d o s qu e fizeram es^e
m e sm o e x a m e em 197 7 . C ad a estu d a n te fo i su b m e tid o a um a prova de in g lê s e a um a de m_-
tem ática. C o m o form a de assegu rar q u e o s e x a m e s foram a v a lia d o s c o m o s m e sm o s eritérk
ela e m p r e g o u e x a m in a d o r e s para reavaliar as n o ta s o b tid a s por cada e stu d a n te e m cada u ~
d o s an os. A s n o v a s n otas atrib uídas a cada e stu d an te e m m a tem á tica e in g les e stã o na tabe^
abaixo:
67 62 67 63
52 7Ì 49 6^
45 41 48 42
58 51 61 52
59 62 51 51
81 59 55 54
61 65 51 55
55 57 49 52
60 58 53 51
57 60 56 48
51 63 51 50
60 61 50 52
Exercício 2
Uma pesquisadora, Dra. Kid, está interessada em saber se meninos e meninas diferem
na habilidade de perceber cores. Ela acha que as meninas são melhores do que os meninos
na percepção de cores desde bem pequenas. Por conseguinte, testa dois grupos de idades
diferentes (5 e 11 anos) por meio de um teste padrão de percepção de cores e compara o de
sempenho (notas até 10) de meninos e meninas. Os dados são apresentados abaixo:
5 anos 11 anos
4 6 ..i O
3 5 2 9
4 6 3 9
5 4 4 8
9 6 7 7
1 7 5 10
0 8 4 9
2 6 3 10
3 5 2 8
3 4 2 6
4 6 4 9
5 3 5 8
6. Qual é a conclusão óbvia desta saída? (c) Existe apenas um efeito principal
(a) Existe um efeito principal da AREA e uma (d) Existem dois efeitos principais que prova
interação que provavelmente não se devem ao velmente não podem ser atribuídos ao erro
erro amostrai amostrai, mas não uma interação
(b) Existe somente uma interação entre duas va 11. Quantos efeitos estamos comparando contra as res
riáveis independentes, que provavelmente não pectivas hipóteses nulas em uma ANOVA 2 x 2?
se deve ao erro amostrai
(a) 1
(e) Não existem efeitos principais ou interações
(b) 2
(d) Alternativas (aj e (b)
(e) 3
7. Qual é o valor p para o efeito principal do CAR (d) 4
BUS? 12. O teste de esfericidade de Mauchley e':
(a) 0,003 (a) Um teste de hipóteses em que os erros padrões
(b) 9.945 das diferenças entre as médias de variáveis
(c) 0,101 dentre participantes são iguais
(d) Nenhuma das alternativas (b) Um teste em que os dados utilizados na ANO
s. Como o valor F para a interação é calculado? VA são arredondados na fonte
(c) Um leste bem conhecido desenvolvido em um
(a) 4.900 -¡-12.100 hospital psiquiátrico de Londres
(b) 12.100-¡-67,600 (d) Nenhuma das alternativas
(c) 67.600 + 1.217
(d) Nenhuma das alternativas 13. Como você descreveria uma ANOVA 2 x 3 x 5 x
7 x 7?
9. Quanta variação nos erros ao dirigir pode ser debi
(a) Sensível
tada a interação entre CARBUS e AREA?
(b) Uma ANOVA com duas variáveis com três
(a) 93% condições, cinco variáveis com sete condi
(b) 5,2% ções e sete variáveis com uma condição
(c) 60,7% (c) Uma ANOVA com uma variável com duas
(d) 65.9% condições, uma variável com três condições,
uma variável com cinco condições e duas va
10. Olhe para o seguinte diagrama de barras de erro.
riáveis com veie condições
Qual é a conclusão mais adequada?
(d) Alternativas (a) e (c)
14. Quais são as fontes de variação em um delineamen
to completo dentre participantes com duas variáveis
independentes?
(a) Efeito principal da variável independente1 mais
erro, efeito principal da variável independente'
mais eiró, interação entre variável independen
te1 e variável independente' mais erro
(b) Efeilo principal da variável independente1, va
riável independente' e a interação entre elas
mais o erro
(c) Efeitos principais da variável independente1, va
riável independente' e a interação entre as duas
(d) Nenhuma das alternativas
(c) A maneira mais fácil de se obter um resultado (c) Com testes t relacionados, tendo o cuidad,
significativo de ajustar o valor do a para manter o erro di
(d) Todas as alternativas Tipo I baixo
(d) Nenhuma das alternativas
17. Se você tem uma MS para o seu efeito principal de
12,4 e uma MS para o termo erro de 3,1, qual seria 19. Quantos efeitos estamos comparando contra a re>-
o valor da estatística F 0 pectiva hipótese nula em uma ANOVA 2 x 2 x 27
(a) 6,2 (a) 3
(b) 4,1 (b) 5
<c) 3,1 (c) 7
(d) 4 (d) 8
18. Se você tem um delineamento completamente dentre 20. Se você tem um delineamento 2 x 2 entre paru.
participantes, com cada variável independente tendo pantes, qual deve ser o primeiro passo após g e r-'
duas condições, como examina os efeitos simples? as estatísticas descritivas no SPSSPW ?
(a) Com testes I independentes, sendo cuidadoso (a) Transformar os seus dados
para selecionar os participantes corretos utili (b) Dividir o arquivo de dados
zando o cornando Splil File (Dividir Arquivo) (c) Conduzir um teste /
no SPSSPV,' (d) Realizar uma análise correlacionai
(b) Com testes t independentes, tendo o cuidado
de ajustar o valor do a para manter o erro do
Tipo I baixo
Referências
EKEHAM M AR, B. AKRAM1, N. ARAYA, T. Gender differences in implicit prejudice. Personality
and Individual Differences, v. 34, p. 1509-23, 2003.
FORESTELL, C. A., HUMPHEREY, T. M., STEWART, S. H. Involvement of body weight and
shape factors in ratings of attractiveness by women: a replication and extension of Tassinary ar,_
Hansen. Personality and Individual Differences, v. 36. n. 2, p. 295-305, 2004.
HOWELL. D. C . Statistical Methods fo r Psychology. Boston: PWS-Kent, 2002. 5 h edn.
LOFTUS, G. R. Psychology will be a much better science when we change the way we analyze data
Current Directions in Psychological Science, v. 5, p. 161-71, 1996.
MacFADDEN, A., ELIAS, I ., SAUCIER, D. Males and females scan maps .imilarly. but give
directions differently. Brain and Cognition, v. 53, n. 2, p. 297-300, 2003.
MOGG. K., BRADLEY, B. P. Some methodological issues in assessing attentional biases for threat
faces in anxiety. Behaviour Research and Therapy, v. 37, p. 595-604, 1999.
Análise de Regressão
Panorama do capítulo
Psicólogos têm interesse em usar a regressão linear para descobrir o efeito de uma variá
vel (que designamos x) em outra (que designamos y). E parecida com a análise de correlação
simples, mas. enquanto a análise de correlação permite concluir a força da relação entre as
duas variáveis (magnitude e direção), a regressão linear responde à pergunta "Quanto v irá
mudar, se x mudar”? Quer dizer, se x mudar em certo valor, poderemos ter uma estimativa de
quanto v mudará.
Imagine que temos dados sobre a quantidade e o preço de certo refrigerante light compra
do. Se o preço do refrigerante light aumentar o suficiente, as vendas diminuirão (as pessoas
comprarão uma alternativa mais barata). Uma análise de correlação simples nos mostrará que
o preço do refrigerante light e as vendas do mesmo têm uma correlação negativa - podemos
dizer que, quando o preço aumenta, as vendas diminuem. Entretanto, não podemos saber em
quanto as vendas vão diminuir com o aumento de preço. Psicólogos usam a regressão linear
para poder avaliar o efeito que x tem em v. A análise de regressão linear resulta em uma fórmu
la (uma equação de regressão) usada para prever exatamente quanto y mudará, como resultado
de uma mudança em x. Seríamos capazes de afirmar, por exemplo, que, se o preço do refrige
rante light subir 50%, as vendas irão cair 40%.
382 Christine P. Dancey & John Reidy
Como a regressão linear nos fornece uma medida do efeito que x tem em y, a técnica per
mite prever v de .v. No exemplo dado, se soubermos em quanto as vendas de refrigerante /á
diminuirão, como resultado de cada centavo de aumento, poderemos prever as vendas d
refrigerante pelo preço. Em uma situação experimental, psicólogos podem usar a regressl
linear para sugerir que um escore em uma variável influenciou o escore em outra variáve
Dessa maneira, tentam inferir relacionamentos de causa.
A análise de regressão pode ser usada para:
■ avaliar o efeito de estresse nos sintomas de um resfriado (p. ex.. nariz com coriza, c -
de garganta, tosse);
■ prever a habilidade em matemática de crianças a partir da medida da habilidade ..
leitura delas.
Quando conduzimos uma análise de regressão, procedemos exatamente da mesma n';_
neira como em um delineamento de correlação: as duas variáveis são examinadas para ver -.
existe um relacionamento linear (um relacionamento que pode ser melhor descrito por u r .
linha reta) entre elas (ver Capítulo 5). Isso é explicado com mais profundidade a seguir.
Por exemplo, considere o exemplo do relacionamento entre notas em um simulado de ¿
tatística e notas em um teste final de estatística. Existe um relacionamento positivo entre es'_-
duas variáveis: as pessoas que têm um bom desempenho no simulado tendem a ter um b.
desempenho no exame final. Obviamente, o relacionamento não é perfeito: algumas irão c --
ter boas notas no simulado, mas ter um desempenho ruim no teste final; outras com péssirr
desempenho no simulado irão obter notas boas no teste final. Para conduzirmos uma anál ■_
de regressão, coletaríamos dados do escore do simulado e do escore do teste final de todo- -
alunos em um ano específico. Se o relacionamento fosse positivo e forte o suficiente para ur .
previsão, poderíamos observar os escores do simulado dos alunos do ano seguinte e ter uma r .
idéia do seu desempenho no teste final. Portanto, poderíamos identificar os alunos em perigo
não obter aprovação no fim do ano (antes do teste final!) e talvez oferecer um apoio extra. E-
é um exemplo de quando psicólogos usariam a equação de regressão para fazer previsões.
Entretanto, os psicólogos geralmente não usam regressão linear para fazer previsões t
uma amostra nova. Os resultados da análise de regressão, porém, não mostrarão quant
muda como resultado da mudança em x. No exemplo acima, o desempenho no simulado r.I
causa os escores no teste final. Todavia, o desempenho no simulado precede o desemper
no teste final - ambos estão relacionados em um sentido previsível e temporal. Como me
cionado. às vezes os psicólogos podem sugerir relacionamentos causais usando esse métec
E difícil afirmar que mudanças em uma variável provocam mudanças em outra, mesmo qu^‘-
do os dois eventos ocorrem em pontos diferentes no tempo, pois outra variável intervenie- ¡
pode estar influenciando os escores em ambas as variáveis. Essa é, claramente, uma limita, 1
dos delineamentos de correlação.
Um valor verdadeiro de y e sim plesm ente representado por v. mas um valor previsto é designado y.
Estatística sem M atem ática para Psicologia 383
50 55
30 20
60 59
75 78
40 55
90 70
15 20
19 15
64 60
80 84
384 Christine P. Dancey & John Reidy
90 i
80 -
70 -
60 -
râ 50 -
iZ 40 -
30 -
20 -
10 -
S im u la d o
Observe a Figura I 1.2. Podemos usar a linha para prever o escore de uma pessoa em
partir de .v. Prevê-se que uma pessoa com escore de 60 em jc terá um escore de 59 em v. I :
fato, se você olhar para a pessoa (Mena) com um escore de 60 em x, verá que teve um es^ -
de 59 em y - portanto, a linha foi correta na previsão do que teria para Mena. Lntretar'
previu-se para .lack, que teve um escore de 90 em x, um escore de 86 em y, mas na verdi_:
seu escore foi 70 em y. Portanto, a previsão para Jack não é boa. A linha fornecerá a me '
previsão possível para os participantes em geral.
Você pode estar imaginando como fomos capazes de calcular os números para os exe~
pios, como soubemos que as notas finais aumentam 18 pontos para cada aumento de 2i -
simulado. Embora pudéssemos calcular isso matematicamente, é mais fácil fazê-lo c o r
SPSSPW. A inclinação da linha (chamada de b) fornece uma medida de quanto y muda qu_-
do o -v é alterado. Quanto maior o valor de b, mais íngreme a inclinação. O uso de uma ):r _
reta, como no exemplo, permite prever o escore de uma pessoa em y a partir de ,v. Você -.
poderia fazer isso com uma simples correlação. O truque é desenhar a linha no lugar coir=‘
(Diferentemente de nós, o SPSSPW não tem dificuldade com isso...)
Estatística sem M atem ática para Psicologia 385
Você precisa escolher o diagrama de dispersão correto entre quatro opções: escolha Sim
ple (Simples).
Assegure-se de
que a opção
Simple (Simples)
está destacada,
pressione
Define (Definir)
As duas variáveis (a explicativa e a de critério) são movidas da lista das variáveis para .
caixa apropriada no lado direito.
a|B|a|g| I I I Mi>H»H~naaiini
_L _L
56 01
7000
20 00 C 3 n m ~
Mova a variável
1900
Ó4Q0 _ XAji
90 00 I_I I• ' explicativa para
a caixa X Axis
□ f (Eixo X) e a
□ r de critério para
a caixa Y Axis
(Eixo Y),
TBc; | clique em OK
Depois de clicar em OK, a saída será como a seguinte. Assegure-se de dar um cliq_
duplo no gráfico.
Eis um dia
grama simples
de dispersão
dê um clique
duplo nesse
gráfico
Escolha Chart
(Diagrama) e
Options
(Opções),
em aE E B 23E aa«K H aM i » .
q| alfalfe I
I I Ul I
M arque o Fit
Line Total (Trace
a linha -Total)
e clique em OK
<
Z
0 20
MOCK
if S i P>oce»toi a wjd»
ff. £ 'A Si 0938
BSPvamaMai I ¿jE*fcma Eva I c^WfCo : 1 I nrHcro:VI Wold I it f c h v ll. inocWi I f ô OUOu» SP':S ||r~ C h w ll ■ SI*S " ^
388 C hristine P. Dancey & John Reidy
Escolhendo a opção Fit Une Total ( Trace a linha total), você obterá a linha de melh -
aderência.
gigifcl&l
PJ Tl-^l I I IÀj J
Aqui está
sua linha
de melhor
aderência
<S<art ¡'i> t f JJ =»
| ^jE<torxi E\a | l^Wr¿o id-jc | grwocomrwod | fej»aaH.irorti. | S<*S IJu«l1 - SPS
Atividade 11.1
Tente explicar como a análise de regressão difere de uma correlação simples. Que inforrr;
ção extra a análise de regressão forneço?
60-]
Traçado de x com y.
Figura 11.3
x y
As notas
0 0
aum entam
1 10 \ 10 unidades
2 20 < a cada vez
3 30 <
4 40 >
5 50
etc.
Você também pode ver pela tabela que y aumenta 10 unidades a cada unidade de mudan
ça em .v (p. ex., 1). Note que essa mudança é constante.
A quantia que y muda quando .v muda por I é chamada dc b, que consiste na inclinação
da linha.
Quando conduzimos uma análise de regressão linear, obtemos uma equação de regressão,
que nos mostra a maneira como y muda enquanto resultado de uma mudança em x. Com essa
fórmula, podemos calcular o escore de alguém em y a partir do escore dessa mesma pessoa
em v. A fórmula geral segue:
390 Christine P. Dancey & John Reidy
y = bx + a
ou
y = a + bx
Isso significa que, para qualquer indivíduo, ypodeser previsto pelo valor da inclinaci'
da linha multiplicado pelo seu escore .y, somado aovalor designado por a (intercepto).
■ y é um valor da variável a ser prevista
■ X é um valor da variável x
■ b é a inclinação da linha
■ a é a constante, quer dizer, o lugar onde a linha intercepta o eixo y (ponto tambe-
chamado de intercepto)
A equação de regressão mostra a maneira como y muda enquanto resultado da mudanc.
de x. Quanto mais íngreme a inclinação (chamada de b). mais y muda como resultado de
Portanto, a inclinação é uma parte importante dos resultados, quando se elaboram relatóri, -
de laboratório. Na equação de regressão abaixo, a linha tem uma inclinação de 10. Isso qur
dizer que, cada vez que x aumenta 1 unidade, y muda 10. Somente essa informação já é úi:
mas, como havíamos mencionado, a regressão permite a previsão. A equação abaixo m o s
que y é capaz de ser previsto pela multiplicação do escore de uma pessoa em .v por b, que é 1
somado à constante a (que nesse caso é 0).
No exemplo, a - 0 (ponto inicial no gráfico, intercepto, constante) e b = 10. Portanto:
Se dissermos agora que uma pessoa tem um escore de 7 em .v, você será capaz de pre- _-
o escore em y.
y = 0 + (10 * 7) = 70
*significa multiplicar
fato de ser homem ou mulher serão utilizados para prever a probabilidade de você se envolver
em acidentes e custar dinheiro à seguradora (não adianta insistir que você é um caso atípico).
Para nossa sorte, pessoas acima de 40 terão seguros mais baratos - mesmo que sejam péssi
mos motoristas.
Atividade 11,2
Qual é o escore previsto de uma pessoa em y quando o seu escorc em x é igual a 20.
Considere a = 5 e b = 2.
R e síd u o s
Se usar a linha de melhor aderência para prever o escore de uma pessoa, a não ser que
tenha um relacionamento perfeito, você sempre terá alguns erros. Observe a linha de melhor
aderência para o refrigerante Arrotcola na página 396. Alguns pontos de dado- estão na linha;
outros, mais distantes. Esses representam erros de previsão.
Se usarmos nossa linha de melhor aderência a fim de prever vendas para cada preço, ob
teremos um número previsto de vendas. Podemos comparar essas previsões com os números
de vendas reais. Se a linha de melhor aderência for realmente um bom modelo, as diferenças
entre os números verdadeiros e os previstos serão pequenas; se a linha de melhor aderência
for um modelo ruim as diferenças serão grandes. As diferenças entre os escores verdadeiros
e os previstos são chamadas de resíduos. Os resíduos são particularmente importantes na
regressão múltipla e, portanto, os veremos posteriormente no capítulo. O SPSSPW fornece
os resíduos. Se você estiver interessado em explorar o assunto mais a fundo, existem muitos
livros com capítulos mais avançados sobre regressão linear.
Se não existisse um relacionamento entre x e y, y não poderia ser previsto por x de ma
neira alguma, e a linha seria horizontal. Quando x e y não têm relacionamento, qualquer linha
de melhor aderência é tao adequada quanto qualquer outra, mas é convenção que nesse caso
a linha seja desenhada na horizontal, tendo, portanto, b = 0.
A Figura 11.4 mostra que x e y não são relacionados (correlação zero. isto é, r = 0); y não
é capaz de ser previno por x (b = 0).
20 -|
O
>
c
u
O
>
LU
10
0 2 3 4 b 6 7 8
Prazer pela tarefa
6 0
Aqui você pode ver que, cada vez que x aumenta 1, y diminui 3. Você também pode ■
que a linha de melhor aderência interceptou o eixo y no ponto 18.
■ y= notas emum teste
■ x= númerodehoras de televisão assistidas
■ a= 18
■ b= 3
Diagrama de x ey.
Figura 11.5
Estatística sem M atem ática para Psicologia 393
Portanto:
Esse 18 é o a
E esse é b
y —18 - (3.r)
Se disséssemos que uma pessoa assistiu 3,5 horas de televisão por noite, que valor você
preveria como escore do teste? Você pode descobrir pelo gráfico - deslize uma régua para cima a
partir do ponto 3,5 no eixo dos x na direção da linha e. depois, usando a régua horizontalmente até
encontrar o eixo v. Entretanto, você não precisa obsen ar o grafico. Pode calcular pela fórmula:
y = 18-(3 x )
Portanto:
y= 18 -(3*3,5)
Os parênteses nos mostram que a soma dentro deles deve ser calculada primeiro. Então:
18 - (3*3,5) = 18-10,5
= 7,5
Portanto, prevemos que uma pessoa que assiste a 3.5 horas de televisão por noite tem
um escore de 7,5 em um teste. O sinal negativo significa que se trata de um relacionamento
negativo: enquanto uma variável aumenta (x), a outra diminui (_y).
In te r c e p to
Na Figura 11.6, a linha começou no 5 (isso significa que uma pessoa com escore de zero
em x, teria um escore previsto de 5 em y). Obviamente, às vezes seria impossível ter um es
core de zero em x ■se x representasse o quociente de inteligência (QI), por exemplo. Não se
preocupe com isso agora. Para cada valor de x, y aumenta 5. Portanto, a fórmula de que você
precisa para prever é:
>>= 5 + 5x
Se uma pessoa tem um escore de 3 em x, o escore previsto em y será:
y 5 + (5*3)
= 5+15
= 20
Então, se x é igual a 3 unidades, há uma previsão de 20 para y. Você pode verificar isso
observando o gráfico da Figura 11.6. Lembre-se que a é também chamado de constante e às
vezes de intercepto. O número multiplicado por x, como você já viu anteriormente, é chama
do de b\ b é a inclinação da linha.
394 Christine P. Dancey & John Reidy
30
25
70
y 15
10
Relacionamentos não-perfeitos
Como mencionamos anteriormente, é fácil fazer previsões com um relacionamento pe--
feito, pois sempre se acerta. Todavia, considere o seguinte gráfico de um relacionamen:
não-perfeito (Figura 11.7).
Aqui não podemos desenhar uma linha reta que passe por cada ponto de dados. Pare.,
ser impossível prever y a partir de x. Todavia, é possível. A linha não será perfeita, pois nl
passará por cada ponto, mas, se pudermos desenhá-la pelo melhor local possível, poderão
feitas previsões.
O que você precisa fazer é desenhar a linha no melhor local possível, um lugar ondt
maior número de pontos esteja próximo da Unha, que forneça a melhor aderência aos dadi <
A linha deve ser desenhada para que esteja o mais próxima possível dos pontos. Isso é difu
de fazer, por estimativa. A maioria das pessoas tenta desenhar uma linha através do “mei
dos pontos. Todavia, às vezes é difícil ver onde se localiza o meio.
60
50
40 -
y 30 -
20
10 -
—i—
0 10 20 30 40 50
Diagrama de x com y.
Figura 11.7
Estatística sem M atem ática para Psicologia 395
Como um exercício, tente estimar a linha de melhor aderência. Normalmente, não pre
cisará fazer isso. pois seu pacote de computador calculará a equação da linha e inclusive
desenhá-la.
Digamos que a = 5. Significa que sua linha deve interceptar o eixo y em 5. Se você dese
jar, desenhe a linha, usando um lápis leve. Obviamente existem muitas linhas diferentes que
poderiam ser desenhadas. Você deve tentar desenhar a “melhor” linha. Se estiver trabalhando
com outras pessoas, veja se sua linha está na mesma posição que a deles: será que eles esco
lheram a mesma linha pelos pontos que você escolheu? As chances são de que não tenham
escolhido. Portanto, nesse ponto, não sabemos qual será a fórmula (chamada equação de
regressão), mas podemos escrevê-la, de algum modo, utilizando letras em vez de números.
Existe um valor que já conhecemos, o a. Esse é o ponto inicial do gráfico, o ponto no qual a
linha intercepta o eixo y. Então:
y = 5 + bx
ou
v = bx + 5
Não importa qual das equações você vai escolher, pois são equivalentes.
Note que usamos o sinal positivo (+) na fórmula geral e na equação para esse exemplo, já
que sabemos que o relacionamento é positivo. Entretanto, se o relacionamento entre ,v e y fosse
negativo (então o valor de b seria negativo), o sinal "positivo" mudaria para um sinal negativo.
80 500
81 500
82 499
83 498
84 497
85 450
86 445
87 440
88 439
89 438
90 400
91 380
92 370
93 360
94 330
D istâncias verticais
entre pontos de
dados e linha
78 80 82 84 86 88 90 92 94 96
Preço
600
500
400
Preço
Quando você conduz análises de regressão usando um pacote para com puiadore'.
obtém todas as informações necessárias para escrever a seção de resultados. O SPSSPV>
fornece a correlação entre x e y e os números para a (o intercepto, ou constante) e b •_
inclinação da linha). O conhecimento do valor da inclinação, ¿>, é essencial, mas vol¿
também quer saber se a altura da inclinação é significantemente diferente do que espera
ria por erro amostrai. Isso pode ser feito com uma tabela de sumário da ANOVA - com -
qual você já está acostumado a trabalhar. A inclinação da linha, b, também é convertic.
em um valor padronizado ((3). Isso responde a pergunta, “se .r muda por um desvio pa
drão. por quantos desvios padrões v mudará?” (escores padronizados foram discutid
no Capítulo 3).
Escolha
Regression
(Regressão
e Linear
(Linear)
5*ÉÊLd.415»
E31 - _ J I • j» ■___- ____ ■■ - li i? rh-.pllr«*« j _ . A 8 « ___ | r~ .■ jj SC : 4ão,|.9
Estatística sem M atem ática para Psicologia 399
HLTi - Ifflx iB
a : | B [ a [ 5ii i i s i M i > i M H - | i - i a a i r . i « te i
----------- 2
1B«|
Mova a variável
de critério para
a caixa
Dependent
(Dependente) e a
variável explica
tiva para ,i caixa
Independent x
(Independente)
e clique em OK
Verifique se
essas caixas
foram marca
das. Você
pode também
desejar
Descriptives
(Descritivas).
Clique em
Continue
(Continuar)
SPSS Pwtmí B
_ ij_ I
* • ”« ' í > tf. . * i. 2» -» . “v 0551
BFcjswiMtd I ■£** I ¡5Wr£e m uv | »McwrtWwd ||||dU )H coke 9PS r | ■8 0 m f>
Correlação entre x e y
A correlação entre x e y é um simples r de Pearson, representada na saída por R (tamben:
conhecido como R múltiplo). Em nosso caso, esse valor é 0.968, uma correlação forte. Re
lataríamos a correlação como 0.97 (é usual arredondar para dois decimos). Essa correlação e
importante, pois mostra o quão próximo os pontos se agrupam em torno da linha de melhor
aderência. A previsão provavelmente será melhor quando a correlação for alta. Se os ponto'
dos dados estiverem longe da linha, a previsão não será muito boa.
Variância explicada
Aconselhamos elevar o coeficiente de correlação ao quadrado para obter uma medida
da variância explicada. Porém, em uma análise de regressão linear você não precisa se pre
ocupar, pois o SPSSPW terá feito isso para você! Como pode ver esse valor está em torn:
de 0,937. Portanto, aproximadamente 94% da variância das vendas da Arrotcola podem se'
expliçadas pela variância do preço, para a nossa amostra.
R2 ajustado
O R é ajustado pelo SPSSPW para justificar número de participantes e variáveis na aru-
lise. O R ‘ é otimista demais, pois a linha de melhor aderência se baseia em uma amostra. ;
não na população. Queremos generalizar nossos resultados para a população, portanto, o R‘
ajusta o número para fornecer uma estimativa mais realista. Em nosso exemplo, a variân«...
explicada é de 93%.
Erro padrão
Lembre-se de que nossas estatísticas não estão livres de erro. Analisamos nossos rest -
tados como uma amostra específica, e pode ser que uma amostra, em um outro dia, forne. _
resultados um pouco diferentes. Com amostras repetidas, encontraríamos um raio ou garr.
de valores - os desvios padrões de tais distribuições são chamados de erro padrüo (ve:
Capítulo 3). O erro padrão nos dá uma medida de quão correta nossa estimativa pode v.:
a ser. Erros padrões são estimados. Esse número é uma estimativa da variância de y, par
eada valor de x.
' O R múltiplo nunca é fornecido corno um valor negativo. por motivos que não nos interessam nesse m om ento. O sinal da incljn_.
da linha inform ará se o relacionam ento é negaiivo ou positivo. Em nosso caso e negativo.
402 Christine P. Dancey & John Reidy
600
Limite superior estimado
da reta populacional
£ 500
Linha de regressão
amostrai
400
Limite inferior estimado
da reta populacional
Preço
11.1.9 Não-linearidade
Não adianta tentar fazer uma regressão linear se os dados não são lineares. Lembre-se do
significado de linear: toda vez que o valor de x aumenta, y muda por um valor constante - uma
linha reta pode descrever adequadamente o relacionamento entre x e 3: Volte ao Capítulo 5
caso preciso relembrar disso.
O tamanho da caixa de chocolates dado a parteiras pelos pais dos recém-nascidos aumenta com
o peso do nenê ao nascer, de acordo com uma pesquisa que confirma um antigo folclore canônico
da medicina obstétrica. A correlação foi descoberta por Andrew Nordin, um médico em Taunton,
Somerset. Seu estudo de seis meses envolvendo parteiras na sala de parto e duas alas pós-natal do
hospital Musgrove Park está publicado no periódico médico americano Obstetrics and Gynecology
(Obstetrícia e Ginecologia). Pediu-se às parteiras que anotassem 0 peso dos doces recebidos pelos
pais agradecidos e o peso do nenê ao nascer.
O australiano D r. Nordin, um escrivão em obstetrícia e ginecologia, teve a idéia desse estudo
como parte de um trabalho de auditoria médica de rotina. "Lev amos a auditoria muito a sério, mas
tradicionalmente tentamos nos divertir um pouco com a auditoria do Natal.” disse o médico.
Em seu estudo para 0 periódico, Dr. Nordin chama a atenção para 0 seguinte: “A análise de
regressão descobriu uma associação entre o peso do recém-nascido e o do chocolate, com uma
equação de correlação linear de y - 3349 + 0,52058.v".
O Dr. Nordin está preparando a apresentação do seu estudo no encontro de outono dos obste
tras e ginecologistas do sudeste da Inglaterra, no final do próximo mês. Ele espera que esse estudo
inspire uma investigação mais abrangente dos elos existentes entre os presentes dados pelos pais e 0
peso dos nenês ao nascerem, talvez envolvendo 0 uso de garrafas de vinho e latas de biscoitos.
(Retirado de um periódico inglês, 1993)
Atividade 11.4
12 1
10 -
8 -
6 -
4
2 -
Graus de liberdade3
O conceito de graus de liberdade (gl) é complicado, e existem maneiras diferentes de explicá-lo.
Aqui falamos sobre os graus de Jiberdade em termos de tamanho da amostra. Lembre-se, é uma
explicação conceituai. Dr. Chong Ho Yu (2001) usa a regressão linear para explicar graus de li
berdade. Agora que você tem uma boa base em regressão linear, a explicação do Dr. Yu o auxiliará
no entendimento dos mesmos. Dr. Yu mostra que, em um diagrama de dispersão de regressão
linear com somente um ponto, você não tem graus de liberdade - você não pode estimar a linha
de regressão.
Esse diagrama nos mostra somente um ponto - se você tentar desenhar a linha de regressão,
qualquer linha é tão boa quanto qualquer outra. Isso não e muito útil. Os graus de liberdade para
regressão são n - ,1. (onde n é o número de pontos de dados). Portanto, aqui, gl = 0(1 1 = 0). Corri'
Dr. Yu diz. 'os dados não têm ‘liberdade’ para variar, e você não tem ‘liberdade’ para conduzir a
pesquisa com esse grupo de dados”. De fato, se você tentar condu/ir tal análise no SPSSPW, obter^
uma mensagem de erro.
Agora imagine que você tem dois pontos para sua regressão linear.
10 -,
8 -
6 -
4 -
2 -l — ,-----------------------T---------- T-----------1
0 2 4 6 8
Quando existem somente dois pontos, uma linha reta sempre será a de melhor aderência. Nesse
^aso, existe um grau de liberdade para a estimativa: gl = I (2 - 1 = 0). Ce você tentar isso no SPSSPW,
obterá uma saída. Todavia, os resultados não significam nada, pois já sabemos que a linha é perfeita.
Não poderia ocorrer de outra maneira com somente dois pontos.
Agora observe este gráfico de dispersão.
10
8 -
Aqui a linha de melhor aderência é demonstrada entre três pontos; portanto, os graus de liber
dade são 2. Dessa vez, a linha tem mais liberdade para variar, pois a linha de melhor aderência não
está restrita pelo caminho entre dois pontos.
O Dr. Yu define graus de liberdade como "o número de informações úteis”. Quando tínhamos
gl = 0, não existia informação útil. Quando tínhamos gl = I. não existia informação suficiente
para ser útil. Mesmo com gl = 2, ainda não existia informação adequada para conduzir uma aná
lise útil.
O Dr. Yu tem uma explicação audiovisual on-line sobre graus de liberdade, com atividades in
terativas. Fornecemos o seu endereço virtual para que você possa aprender mais e ainda se divertir
(Yu, 2003).
Suponhamos que vocc deseje fazer uma regressão linear simples a fim de prever o su
cesso em provas por meio do QI. Obteríamos um diagrama de dispersão, colocando sucesso
em testes no eixo y. como a variável de critério, e QI no eixo ,v, como a variável explicativa.
O diagrama de dispersão, com a linha de melhor aderência, é ilustrado pela Figura 11.11.0
diagrama de dispersão que investiga a influência da motivação sobre o sucesso em testes, com
a linha de melhor aderência, está representado na Figura 11.12.
Ambos podem prever sucesso em testes separadamente, mas a previsão pode ser ainda
melhor usando-os juntos. Na Figura 11.13. ambos, o QI e a motivação, são mostrados (em
três dimensões) relacionados a sucesso em testes (no eixo y).
Nesse caso, em vez da linha de melhor aderência, temos o plano de melhor aderência.
Podemos imaginá-lo como uma folha de acrílico cortando o espaço. O plano de melhor ade
rência é aquele que tem os pontos mais próximos ao acrílico. Não nos é possível imaginar
ou desenhar, em mais de três dimensões, mas o SPSSPW não tem dificuldade em analisar os
dados usando muitas variáveis explicativas.
A análise de regressão múltipla não tem surpresas, como a análise de regressão que usa
uma variável explicativa. Os diagramas que seguem são as estatísticas resultantes de uma
análise de regressão múltipla.
90 -i
80 -
70 -
60 -
50 -
40 -
30 -
20 -
10
90 100 110 120 130 140 150 160
QI
90 -i
80 -
70 -
60 -
40 -
30 -
20 -
10
20 30 40 50 60 70 80 90
M otivação
a. All requested variables entered (a. Todas as variáveis requeridas foram introduzidas.)
b. Dependent Variable: EXAM (b. Variável Dependente: Teste.)
R esum o do m odelo
O valor R (0,762) é a correlação entre teste e ambas as variáveis explicativas. O R~ (0,579
foi ajustado para 0,52.
Na Seção 11.1.6. você teve somente uma variável listada no resumo do modelo. Lembre-
se de que naquele caso r = b. Todavia, aqui você tem duas variáveis explicativas.
E importante lembrar que. na regressão linear, isso era simplesmente o r de Pearson. -
correlação entre x e v. Todavia, na regressão múltipla r é escrito como R e consiste na corre
lação entre todos os valores x e y. No exemplo, é a correlação entre o sucesso em testes, o Q!
e a motivação, y. Nesse estudo, R é 0,76.
Se você eleva 0,76 ao quadrado, obtém 0,58. O R representa a correlação entre todas _
variáveis explicativas juntas com a variável de critério. Significa toda a variância (a compar-
tilhada e a individual) das variáveis explicativas ern relação à variável de critério. Em nossa
amostra, 58% da variação acerca do sucesso em testes pode ser atribuído à variação do Ql e
da motivação. Entretanto, o SPSSPW diminui esse número para oferecer uma estimativa do
R~ da população, pois nosso r é muito otimista. Isso ocorre porque a linha de regressão amos
trai sempre terá melhor aderência com a amostra do que com a população (como é a linha
de melhor aderência para a amostra). Portanto, ajustamos diminuindo. A fórmula para tanto
leva cm consideração o numero de participantes c as variáveis. Então, podemos afirmar que
justificamos 52% da variância de y com as variáveis explicativas.
ANOVAb
Model Sum of Square Mean Square
(Modelo) (Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Regression
1 2545.01291 2 1272.50646 8.97596 0 .0 0 4 a
(Regressão)
Residual
1842.98709 13 141,76824
(Resíduos)
Total 4388.000 15
A ANOVA indica que o plano de regressão para essas variáveis parte significantemente de
0 ou seja, podemos prever y (sucesso em testes) do QI e motivação juntos. Nossa previsão não
será perfeita, é claro, m as é m elh or que a ch ance por si só (F (2 ,1 3 ) = 8 ,9 7 , p = 0 ,0 0 4 ).
Para a regressão simples, exposta anteriormente, você tinha somente uma variável listada
sob a coluna Coefficíenis (Coeficientes) (ver página 4 0 1 ). Lembre-se de que naquele caso r =
b \ porém aqui temos duas variáveis explicativas.
Coeficientes
A seguinte seção indica os pesos não-padronizados (B) e padronizados ((3) para as va
riáveis Q I e motivação, junto com os valores t, de probabilidade, e os limites de confiança de
95% em torno de B.
Coefficients3 (Coeficientes3)
Standardized
Unstandardized Coefficients
Coefficients (Coefici (Coeficientes 95% Confidence Interval
entes Não-padronizados) Padronizados) t Sig. for B (IC de 95% para B)
Model B Std. P Lower Bound Upper Bound
(Modelo) Error (Erro (Limite inferior) (Limite Superior)
padrão)
(Constant) -43.466292 -1.557 0.1435 -103.781988 16.849405
27.919170
(Constante)
MOTIV 0.614508 0.218457 0.526770 2.813 0.0147 0.142561 1.086455
(Motivação)
IQ (QI) 0.591585 0.262691 0.421726 2.252 0.0422 0.024075 1.159095
a. Dependent Variable: EXAM (a. Variável Dependente: Teste)
Sig. = Significancia
410 Christine P. Dancey & John Reidy
M otivação
A motivação tem um coeficiente de regressão de 0.61. Portanto, quando a motivaçãc
aumenta uma unidade, o sucesso em testes aumenta 0,61. Podemos ter 95% de confiança de
que o coeficiente da população está entre 0,14 e 1.09. O valor I é 2.81 com uma probabilidade
associada de 0,01 , então é improvável que nosso coeficiente de regressão tenha ocorrido por
erro amostrai.
Atividade 11.5
11.2.3 Equação
Você deve lembrar que, na regressão linear, a equação era:
y = bx + a
A fórmula para regressão múltipla é parecida. Se você quisesse usar a fórmula para pre
ver o sucesso em testes com base no QI e na motivação, precisaria usar os coeficientes de
correlação não-padronizados (b) e a constante (a). Então,
A fórmula permite calcular à mão o escore previsto: podemos, por exemplo, descobrir a
nota prevista a ser atingida pelos alunos, usando os escores obtidos nos testes de QI e moti
vação. O SPSSPW calculou um valor pelo qual os escores individuais de motivação devem
ser multiplicados. Na saída do SPSSPW, o valor é chamado de B na coluna dos coeficientes
não-padronizados. Você pode observar que para motivação, b = 0,614508. Para o QI, os escores
individuais devem ser multiplicados por 0.591585. Portanto, calculamos o sucesso em testes
multiplicando o escore de motivação de uma pessoa por 0,614508 e somamos esse resultado ao
seu QI, que foi multiplicado por 0.591585. Depois, adicionamos ou subtraímos uma constante
(que nesse caso é 43,466292). O número resultante é o escore previsto no teste.
Se você realmente queria prever o sucesso em testes de uma pessoa em uma nova amos
tra, usaria a equação referida. Você iria prever o sucesso em testes utilizando as duas variáveis
uma vez que ambas contribuem para o sucesso em exames.
Sempre se lembre de que os resultados são específicos para sua amostra. Embora tenha
mos problemas com os limites da generalização em qualquer análise estatística de inferência,
a regressão múltipla é uma técnica matemática de maximização - o plano de melhor ade
rência é o melhor plano possível - para a amostra. Não sabemos o quão bem os resultados
poderiam ser generalizados para a população. Se você tem participantes suficientes e algumas
boas variáveis explicativas, as chances de generalização são melhores do que se você nao
satisfaz as condições (ver a seguir).
412 C hristine P. Dancey & John Reidy
tipo de valor atípico (o SPSSPW pode fazer isso por você, embora não aborde tal
ponto neste livro).
Todavia, se você tem um grupo de dados pequeno, um simples olhar para os dados
pode ser suficiente. Você pode eliminar valores atípicos de sua análise. Entretanto, é
óbvio que não pode eliminar valores atípicos simplesmente por serem extremos. Isso
requer uma consideração cuidadosa, especialmente quando você tem menos que 100
participantes. Alguns estudantes nos perguntam se remover os valores atípicos não é
trapacear, mas queremos que a reta (ou plano) de regressão reflita o sujeito mediano,
não alguém que é muito diferente dos outros.
5. Multicolinearídadc. A melhor situação ocorre quando as variáveis explicativas têm
correlações altas com a variável critério, mas não umas com as outras. Você pode ve
rificar sua matriz correlacionai antes de fazer regressão múltipla. Pode descobrir que
algumas variaveis csiao altamente correlacionadas umas com as outras (0,8 e acima).
Denomina-se multicolínearidade ter tais tipos de variáveis intercorrelacionadas. As
variáveis estão medindo muito da mesma coisa. As vezes, você pode combinar variá
veis altamente correlacionadas ou omitir uma. Há o benefício de reduzir o número de
variávei: e, é claro, contribuir com o item 1 exposto.
Exemplo da literatura:
função pulmonar e o fumante
Tabela 11.3 Resultados de Emery e colaboradores (1997, com permissão de Taylor e Francis Ltda.)
* * * p < 0,001
414 C hristine P. Dancey & John Reidy
Exemplo da literatura:
satisfação com o emprego entre teletrabalhadores
Tabela 11.4 Sumário da análise de regressão simultânea para variáveis prevendo satisfação com o trabalho
entre teletrabalhadores
Atividade 11.6
Resumo
Exercício 1
X y X y
33 45 56 79
64 68 44 44
33 100 22 16
22 44 44 6)
70 62 80 60
66 61 66 61
59 52 79 60
84 66
A ansiedade está relacionada com o número de horas estudadas? Quao bem a equação de
regressão prevê isso?
Exercício 2
ANOVA6
Model Sum of Square Mean Square
(Modelo) (Soma dos Quadrados) df (gl) (Média dos Quadrados) F Sig.
Regression
1 1.71690 1 1.71690 4.199 0 .0 4 8 a
(Regressão)
Residual
15.12589 37 0.40881
(Residuos)
Total 16.84279 38
Coefficients (Coeficientes3)
Unstandardized Standardized
Coefficients (Coeficien Coefficients (Coefi
tes Não-padronizados) cientes Padronizados) t Sig.
Model
(Modelo) S Std. Error (Erro Padrão) P
Constant)
1 1.757722 0.15455 11.373 0.000
(Constante)
a. Predictors (Constant), age, previous history rating (a. Preditores: (Constante), idade, avaliação de histórico prévio)
ANOVAb
Model Sum of Square Mean Square
(Modelo) (Soma dos Quadrados) Df (gl) (Média dos Quadrados) F Sig.
Regression
1 381.457 2 190.729 18.182 0 .0 0 0 a
(Regressão)
Residual
125.876 12 10.490
(Resíduos)
Total 507.333 14
a. Predictors (Constant), age, previous history rating (a. Preditores: (Constante), idade, avaliação de histórico prévio)
o. Dependent Variable: credit rating (b. Variável Dependente: avaliação de crédito)
Sig. = Significancia
418 C hristine P. Dancey & John Reidy
Coefficients (Coeficientes3)
Standardized
Unstandardized Coefficients
Coefficients (Coefici (Coeficientes 95% Confidence Interval
entes Não-padronizados) Padronizados) t Sig. for B (IC de 95% para B)
(Constant)
1 0.790 3.471 0.228 0.824 -6 .7 7 4 8.353
(Constante)
previous 0.571 0.241 0.51 4 2.368 0.036 0.04 6 1.096
history
rating
(avaliação
de histórico
prévio)
Age (idade) 0.276 0.145 0.413 1.904 0.081 -0 .0 4 0 0.592
Referências
EMERY, C. E, HUPPERT. F. A.. SCHEIW R. L. Do pulmonary function and smoking behavior
predict cognitive function? Findings from a British sample. Psychology and Health, v. 12. n. 2. p.
265-75. J997.
KONRADT, U. HERTEL. G.. SCHMOOK. R. Quality of management by objectives, task-related
stresssors, and non-task-related stressors a.-, predictors of stress and job satisfaction among
teleworkers. European Journal of Work and Organizational Psychology, v. 12. n. 1. p. 61 -79, 2003.
TABACHN1CK. B., FI DELL. L. S. I 'sing Multivariate Statistics. Addison Wesley. 4 ed.. 2003.
YU, C. H.. LO. W. J.. STOCKIORD, S. Using multimedia to visualize the concepts of degrees of
freedom in terms of sample size and dimensionality. American Statistical Association 2001
Proceedings of the Section on Statistical Education. Atlanta, GA._2002.
YU. C. H. Ilustrating degreees of freedon in multimedia. Available at http://seamonkey.ed.asu.edu/
~alex/pub/df/default.htm jacessoem 10 March 2004|
Introdução à Análise de Fatores
Panorama do capítulo
Chegamos até aqui e esperamos que agora você tenha um bom entendimento conce
das técnicas estatísticas mais utilizadas na psicologia. Nesse e nos dois próximos capítulos,
taríamos de ensinar um outro conjunto de técnicas que são uma extensão da regressão mú
e da ANOVA. Estes testes são postos sob o rótulo comum de estatística multivariada. A téc
estatística particular que apresentaremos aqui é a análise de fatores. Damos uma breve
dessa técnica no Capítulo 5.
Neste capitulo iremos:
Fornecer um entendimento conceituai da análise de fatores por meio de um exemp
literatura psicológica
■ Mostrar como entrar com o conjunto de dados no SPSSPW e executar uma anális
fatores
■ Mostrar como interpretar a saída estatística de tal análise
Dar exemplos da literatura para ajudá-lo a entender como a análise de fatores tem
utilizada na psicologia
de habilidade. Se acreditarmos que cada teste dado aos participantes mede certa habilidade, o
que estamos constatando é que, realmente, nenhum dos testes está relacionado aos demais.
Teoricamente, toda;, as correlações devem ser nulas. Na prática, entretanto, isso é impro
vável de ocorrer. Algumas variáveis que não estão correlacionadas entre si tendem a mostrar
alguma correlação. Na Tabela 12.1, os coeficientes de correlação var iam em torno de 7ero.
Agora vamos tomar a direção oposta e dizer que todos os testes medem a mesma habi
lidade. O que estamos realmente dizendo é que cada variável está relacionada às demais e
na Tabela 12.2 todos os coeficientes de correlação seriam, pelo menos teoricamente, 1. Na
prática, estarão próximos de 1 .
Aqui as correlações estão em tomo do valor 1. Esses são os dois extremos. Normalmente
algumas variáveis estão relacionadas a outras, enquanto as demais não. A análise de fatores
observa esses padrões de correlações. Grupos de variáveis altamente correlacionas entre si for
mam um fator. O fator e' concebido como uma variável subjacente latente (hipotética) ao longo
do qual os participantes diferem, da mesma forma que diferem numa escala de teste. E possível
executar uma análise de fatores trabalhando tanto com a matriz de correlações quanto com a das
variâncias-covariâncias1. Nesse estágio aconselhamos que você escolha a matriz de correlações
quando executar essas técnicas com o seu pacote computacional, apenas por ser mais seguro.
Isso ocorre porque trabalhar com a matriz de correlações equivale a padronizar os dados. Se
as variáveis não foram medidas com as mesmas unidades ou não são pelo menos comparáveis,
utilizar a matriz de correlações irá padronizá-las de forma a torná-las comparáveis. Discussões
adicionais sobre esse tópico estão além dos objetivos deste texto. O objetivo da análise de fatores
é expressar um grande número de variáveis em termos de um número mínimo de fatores.
Tabela 12.1 Correlações hipotéticas entre testes se você acredita que cada teste meça uma
habilidade específica
Tabela 12.2 Correlações hipotéticas entre testes se você acredita que cada teste mede a mesma
habilidade
1 U ma m airiz de variâncias-covariâncias e sem elhante a um a matriz de correlações, exceio pelos escores, que não são padronizados.
E scores padronizados foram explicados no Capítulo 3. páginas 111-112.
422 C hristine P. Dancey & John Reidy
Atividade 12.1
Não é fácil explicar o conceito de análise de fatores. Se você estivesse tentando explicar o
que é a análise de fatores a um amigo, o que diria?
Existem diferentes tipos de análise de fatores - aqui nos concentraremos nos mais fami
liares. Um é denominado análise de componentes principais (ACP), e o outro, simplesmente
denominado de análise de fatores (embora isso normalmente signifique “fatoração pelos ei\>
principais”). Muitas pessoas, inclusive nós, utilizam esses termos de forma intercambiáve
Entretanto, existem diferenças entre eles, e, apesar de ser possível tratá-los como se fossen
iguais, gastaremos alguns minutos explicando as diferenças.
A confiabilidade de escalas deniro de questionários é medida pelo coeficiente de correlação. Q ualquer coeficiente m aior do que 0.70
è forte, indicando que as duas esealas podem ser consideradas confiáveis.
424 C hrístine P. Dancey & John Reidy
Uma forma de entender a análise de fatores é graficamente. Você já sabe que o relacio
namento entre as variáveis pode ser representado por cocficientes de correlação, círculos
sobrepostos ou diagramas de dispersão. No entanto, existe outra maneira de representar o
relacionamento entre variáveis: calcular o valor do ângulo entre elas.
Retornando ao exemplo, vamos considerar que duas das variáveis, a 8 e a 1, estão correla
cionadas, por um valor de 0.90. Podemos representar esse relacionamento geometricamente,
convertendo o valor 0,9 em uma medida do ângulo entre elas, Para converter 0,90 em um grau
que mede o ângulo entre as duas variáveis, você precisa consultar a Tabela 12.3.
Pode-se ver que um coeficiente de correlação de 0,90 é convertido em um ângulo de 26'.
Use uma linha horizontal para representar uma das variáveis, por exemplo, a 1. Você pode
então, com o auxílio de um transferidor, medir 26' e traçar outra linha que poderá ser rotulada
de 8 (veja Figura 12.3).
Esse ângulo representa o grau de relacionamento entre elas. Essas linhas desenhadas
com uma seta em uma das pontas são denominadas de vetores. Um vetor é simplesmente um
segmento de reta que tem um ponto de partida, uma direção e um comprimento.
Se as nossas duas variáveis medem exatamente a mesma coisa e estão perfeitamente
correlacionadas, o ângulo entre elas será zero, e ambas serão representadas pelo mesmo vetor
(veja Figura 12.4).
Tabela 12.3 Tabela de conversão do /-para um ângulo (valores arredondados para inteiros)
90°
90°
. Fazor algo
em baraçoso em público (item 1)
Se. por outro lado, as duas variáveis são totalmente não-correlacionadas, estão uma em
cada lado de um ângulo reto. O grau de relacionamento será 90, que representa a correlaçã
zero (veja Figura 12.5).
Como forma de realizar a análise de fatores nessas duas variáveis (é claro que não igual, n t-
um modo Fácil de começar), precisamos encontrar um novo vetor, que melhor represente as du_-
variáveis. Fazemos isso traçando o novo vetor bem no centro de x e v (veja Figura 12.6).
Fazer algo
em baraçoso em público (item 1)
90°
Figura 12.6 Diagrama que mostra um ângulo de 26° entre os itens 1 e 8 com um fator resultante.
A linha pontilhada é o novo fator, que podemos chamar de “vergonha”. As pessoas atri
buem nomes aos fatores, verificando o que as variáveis relacionadas possuem em comum.
Nesse caso, as duas variáveis apresentam “vergonha” em comum. Uma vez que as variáveis
“sentir-se autoconsciente” e “fazer algo embaraçoso em público” podem ser representadas
por um ângulo de 26 você pode ver que o ângulo entre “sentir-se autoconsciente” e o novo
vetor deve ser de 13°, e o ângulo entre “fazer algo embaraçoso em público” e o novo vetor
tambem deve ser de 13o. Isso pode ser visto na Figura ] 2.6.
Tabela 12.4 Tabela de conversão das medidas dos ângulos para coeficientes de correlação*
Já se fez m enção a m atrizes: m atriz de dados, de correlações, de variâncias-covariâncias, por exem plo. A álgebra m atricial . -
m étodo pelo qual essas matrizes sào m anipuladas. N as técnicas multivariadas, com o a análise de fatores e a MANOVA. a á k v
m atricial e o m étodo de análise.
Estatística sem M atem ática para Psicologia 429
Atividade 12.2
Olhe para o seguinte diagrama, que representa variáveis correlacionadas com o fator 1.
Que nome você daria a esse fator?
Tenho enjôo
freqü en tem en te
Sofro de
dor de cabeça
Tabela 12.4 Tabela de conversão das medidas dos ângulos para coclicientes de correlação*
Via álgebra matricial,' os vetores são então situados em um espaço n-dimensional. e o ve
tor (fator) resultado é encontrado, de uma forma semelhante ao exemplo da Figura 12.6. Un^
vez determinado tal fator (provisoriamente denominado de Fator 1), o Fator 2 agrupa urr
conjunto diferente de variáveis, normalmente não-correlacionado com o primeiro. Cada fator
“representa” um conjunto de variáveis (as variáveis que estão fortemente relacionadas corr.
ele). Atribuímos nome aos fatores procurando o que es:.as variáveis apresentam em comum.
Imagine que temos uma análise executada sobre 20 variáveis e que o programa obte\;
os coeficientes de correlação, converteu esses coeficientes em ângulos e encontrou o pr.-
meiro fator para o primeiro conjunto de padrões de correlações (o cálculo é feito por me:
da álgebra matricial). Embora não possamos fazer a representação, o diagrama seguinte
mostra uma forma de visualizar o que está acontecendo, de modo aproximado. Você poc;
imaginar o fator como um guarda-chuva invertido com raios quebrados. Os raios são
variáveis.
Já se fez m enção a matrizes: m atriz de dados, de correlações, de variâncias-covariâncias, por exem plo. A álgebra matricial e -
m étodo pelo qual essas m atrizes são m anipuladas. N as técnicas m ultivariadas, com o a análise de fatores e a MANOVA, a álg c-
m atricial e' o m étodo de análise.
Estatística sem M atem ática para Psicologia 429
Atividade 12.2
Olhe para o seguinte diagrama, que representa variáveis correlacionadas com o Fator 1
Que nome você daria a esse fator?
Tenho enjôo
freqüentemente
Sofro de
dor de cabeça
O p rim eiro passo do p ro g ram a é o b ter a m atriz dos co eficien tes de correlação.
430
Correlações: valores r e p para as variáveis vergonha e culpa
Fazer algo Trapacear Ferir os Ser o Parecer Não se Ter algo Sentir-se Compor Não dizer
Fazer algo embaraçoso em público 1,000 0,343 0,215 0,557 0,476 0,264 0,416 0,490 0,239 0,230
Trapacear secretamente acerca de algo 1,000 0,450 0,383 0,306 0,354 0,176 0,280 0,503 0,353
que você sabe que não será descoberto
Ferir os sentimentos de alguém 1,000 0,202 0,376 0,776 0,137 0,310 0,748 0,318
Ser o centro das atenções 1,000 0,437 0,168 0,302 0,469 0,230 0,122
Parecer Inadequado para outras pessoas 1,000 0,371 0,530 0,745 0,483 0,177
Ter revelado algo desfavorável sobre você 1,000 0,567 0,272 0,209
0,001 0,006
0,000
Fato r 1 Fíito r 2
F2 Culpa
Figura 12.8
F2 CULPA
- 1,0
-0 ,9
- 0,8
-0 ,7
- 0,6
-0 ,5
0,4
-0 ,3
- 0,2
0,1
0,0
F1 VERGONHA
-1----í—^-1-------- 1----------r
-1 0 -9 -8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8 9 10
I--2
3
--4
--5
--6
-7
10
Atividade 12.3
Complete o restante você mesmo com lápis. Verifique seus resultados pela Figura 12.10
F2 CULPA
1,0 -
0,9 -
0,8 •
0,7 •
0,6
0,5
0,4
0,3
0,2
0,1 F1
0,0
VERGONHA
0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Não existem cargas
negativas aqui
Componente
1 2
Trapacear secretamente acerca de algo que você sabe que não será descoberto 0,621 -0 ,1 7 2
É d if íc il p e r c e b e r o a g r u p a m e n to d a s v a r iá v e is c o m o u s o d e s s a m atriz; n ã o c o n s e
g u im o s v er q u a is sã o o s ite n s r e la c io n a d o s c o m v e r g o n h a e q u a is o s r e la c io n a d o s c o r
c u lp a , p o r q u e to d a s as v a r iá v e is a p r e se n ta m a lta s c a rg a s c o m o p r im e ir o fator. N o entant
se d e s e n h a r m o s n o v a m e n te as v a r iá v e is n o e s p a ç o d e fa to r e s c o m o u s o d a m a triz qu;
n ã o so fr e u r o ta ç ã o , p o d e m o s v er q u e e x is t e m d o is g r u p o s d e v a r iá v e is , m o d e r a d a m en te
c o r r e la c io n a d a s c o m o s d o is fa to re s. V o c ê p o d e v e r is s o ta n to d o d ia g r a m a (F ig u r a 1 2 . 1'
q u a n to na sa íd a referid a.
Isso é feito pela multiplicação da matriz dos componentes sem rotação por algo denominado transformação da matriz de co:
nenies, com auxílio da álgebra matricial.
Estatística sem M atem ática para Psicologia 435
d ife r e n ç a s n as ca rg a s (d a s v a r iá v e is c o m c a d a fa to r ).3 Q u a n d o o s d a d o s sã o fo r te s e o s p a
d r õ e s c la r o s, a e s c o lh a d o m é to d o d e r o ta çã o n ão im p o r ta m u ito , p o is as c o n c lu s õ e s se r ã o
s e m e lh a n te s .
2. O conjunto de fatores é extraído. N a prática, é p o s sív e l extrair tan tos fa to res q u anto
for o n ú m ero de v a r iá v e is (se cada variável n ão for alta m en te c o rr ela c io n a d a co m
q u alq u er outra), m a s is s o c o n tra d iz o s o b je tiv o s da a n á lise de fatores. Q u e re m o s o b
ter o m á x im o p o s sív e l da variação, m a n te n d o o m ín im o p o s sív e l de fatores. E m bora
no p rim eiro e x e m p lo e x is tis s e m d o is fa to res, na m aioria d as v e z e s as c o is a s n ã o são
tão s im p le s a ss im , e a d e c is ã o sob re o n ú m ero de fa to res a serem e x tra íd o s c a b e ao
p e sq u isa d o r, qu e se fu n d a m en ta tanto e m c ritério s e sta tístic o s qu anto te ó rico s.
' O m élodo dc rotação vu rin m x assegura que cada fator seja independente dos demais. Na vida real. muitas variáveis psicológicas são
intercorrelacionadas. Portanto, o método varirruix é artificial, mas mesmo assim é uma forma bastante utili/ada de rotação.
436 Christine P. Dancey & John Reidy
“1
O
Sensibilidade O
r
0,88 -0.09
1
A p r e se n ta m o s e m n eg rito as ca rg a s a c im a d e 0 ,4 . T ang e c o la b o r a d o r e s n ã o m e n c io n a
ram qu e a d ia rséia não foi atrib uída a n e n h u m c o m p o n e n te p e lo critério d e 0 .4 . P or ser um
c ritér io arbitrário, p a r e ce qu e a d iarréia p o d er ia ser c o lo c a d a ju n to às d u as v a r iá v e is que
fo rm a m o C o m p o n e n te II.
N o e stu d o de T ang e c o la b o ra d o re s o b s e r v o u -s e que as n ove va riá v eis lista d a s p o d em ser
agru p ad as em três c o m p o n e n te s, se n d o o Fator 1 fo rm a d o por se n s ib ilid a d e , dor, in g e stã o de
ar e c o n stip a ç ã o .
T an g e c o la b o r a d o r e s d e n o m in a r a m o s fa to re s c o m o “d or fís ic a e d e s c o n fo r to ” , " fla
tu lê n c ia ” e “ v ô m it o s ” . A lg u m a s v e z e s , o s p e sq u isa d o r e s se d iv e rte m p e n sa n d o e m n o m e s
ap rop riad os e e n g r a ça d o s, m a s e s s e n ão fo i o c a so .
438 C hristine P. Dancey & John Reidy
Atividade 12.4
Observe o quadro.
Componente
1 2 3
Auto-expressão 0,801
Trabalho 0,652
Saúde 0,592
Religião 0,431
Dieta
Contentamento 0,673
Orgulho 0,62 6
Excitação 0,614
Magoado 0,677
Entediado 0,62 8
Agitado 0,511
Deprimido 0,460
Exemplo da literatura:
questionário para adolescentes sobre auto-imagem
■ F ator 1 - la d o e m o c io n a l
■ F ator 2 - c o n s c iê n c ia so c ia l
a F ator 3 - im ita ç ã o p e sso a l
■ F ator 4 - r e la c io n a m e n to s fa m ilia r es
■ F ator 5 - r e la c io n a m e n to s s o c ia is
D e fa to , con sid era ra m a p o s sib ilid a d e dc m anter a p en a s quatro fatores na a n á lise fin al, m as isso
sig n ific a r ia qu e um fa to r “ s o c ia l” não e x istir ia , e atribuíram im p o rtâ n cia a is s o fa c e ao c o n h e c im e n
to anterior. A s s im , c o n c lu ír a m qu e a a n á lise de fa to re s c o n fir m o u c in c o d im e n s õ e s da a u to -im a g e m
p revistas.
Atividade 12.5
Patton e Noller decidiram manter cinco fatores no estudo descrito. Pense em qual foi o
critério que utilizaram para chegar a essa decisão. Você concorda com a decisão deles?
440 C hristine P. Dancey & John Reidy
Exemplo da literatura:
por que os estudantes decidem viver no campus
Há uma maneira de nomear os fatores. Observe que grupo de itens apresenta a maior
carga com o Fator 1 e pense em um nome que reflita essa comunalidade. Faça o mesmo corr
os outros fatores. Não existe uma resposta "correta" para essa tarefa, é claro, mas você pode
ver os nomes que Luzzo e McDonald deram aos fatores na página 588.
Estatística sem M atem ática para Psicologia 441
Vergonha Cu lpa
ID B 0.07 0.28**
Comportamento submisso 0 ,53 *** 0.35 ***
Atividade 12.7
T an g e c o la b o r a d o r e s ( 1 9 9 8 ) ta m b é m o b tiv e ra m a s c o r r e la ç õ e s en tre o s n o v o s fa to re s
d e te rm in a d o s e a s v a r iá v e is r e la cio n a d a s a d istú rb io s alim en ta res.
* * p < 0,05
Atividade 12.8
Observe a tabela anterior. Se você tivesse que interpretar os resultados para um amigo, o
que diria?
442 C hristine P. Dancey & John Reidy
C argas n eg a tiv a s sig n ific a m que a variável em q u estã o está n e g a tiv a m en te correlacion ad a
c o m o fator. A lg u m a s v e z e s p o d e ser d ifíc il interpretar u m a carga n egativa. P or e x e m p lo , se
v o c ê a c h a ss e q u e um teste d e a ritm ética e stá n e g a tiv a m en te c o rr ela c io n a d o à h a b ilid a d e m e n
tal. su sp eitaria que fe z a lg o errado, N o r m a lm e n te um a carga n eg a tiv a s ig n ific a a p en a s que a
variável e m q u estã o e stá e x p r e ssa de form a n egativa. P or e x e m p lo , o b se r v e o s se g u in te s iten>.
q u e c o m p õ e m o fator fe lic id a d e extrem a.
T o d o s o s iten s a c im a ap resen tam altas cargas n o fator. O s p r im eiro s quatro têm carga-
p o sitiv a s, e o ú ltim o , n egativa. Isso fa z se n tid o porqu e “ Eu m e sin to a b so lu ta m en te horríve!
é um a d e c la r a ç ã o n eg a tiv a . O s qu atro p r im eiro s ite n s e stã o ag ru p a d o s a o q u e é realm en te
o p o sto . S e a carga d o item 5 fo s s e p o sitiv a , p o d er ía m o s su sp eita r qu e algu m erro tiv e sse sic
c o m e tid o .
Atividade 12.9
1 2 3
1 - 0,866 0,6428
2 - 0,1736
3
U siiJa-
Fíe Et» fc» C'Js Ttarma» * 6f*h« Mhat
Rwon
* N I* I S I _ 1 _ _ U DnaciwSiM!
CuKcnTttta
Lcnp«*MMrvi
mrUoM
-h à -
3:00 00
F*3a
C«rewcndenceftna^n 400
Kwc.ian-.i c To'. Ot»«ISv*io
40C
laeScnei
mno rn
Htlyl» Rwy » 34 00
1*UU
"nr ieoo
1:00 :0C' 1900
13 rei ifim
w CD 37 00
15 00 tem
16 <13 U3
17 00 D’ 03
isa* 19<£>
18 UCl »00
1800 ;« co
30 00 15 00
:ioo 16 co
18 OD
3000
18 00
30 co
3200 200 200
600 400
41»
n3\D«.V
SPSS Ftoccikx a rcsyjy
y
<s.a«l| l i f t 23^1a
&F--Ì. Ifi . I y n > .- .;;r ../g I .¿jEgU-TQ C-M IP», ÜMt fy ne s I jjfna Figimre * ? à “«
A p a re c e rá a seg u in te c a ix a de d iá lo g o s.
E s«á JJi»
j g i ’tgtiaMil I jj% 1 ?ir I y Mo-oMf vgd | LX |[ w Utipy .#
444 C hristine P. Dancey & John Reidy
A
'1 32
^FegasusMal | (¿n d Marf | V-cKuon Wo | i j í vir.it-i C f m i a « ? ipo | ¿J fnd F4»i na |
* is _ i_ j_ iM & iü i£ itia â ia ^ iâ i
j !__ I__ 3i__ I__ á __ L 1 *~
■
400
icn
500
600
500
600
200
400
ACP é método
por omissão
(padrão).
Marque o
diagrama de
declividade se
desejar
lT
mtiar»c2 ioc | Fnd Ffe» ra |
Estatística sem M atem ática para Psicologia 445
N e la v o c ê p o d e s e le c io n a r q u al o m é to d o de ro ta çã o q u e q u er - Varimax (V a r im a x ) é
p ro v a v e lm e n te o qu e p recisa . C e r tifiq u e -se de que a o p ç ã o Rotated solution (S o lu ç ã o rotacio-
nad a) está se le c io n a d a . P r e ssio n e Continue (C on tin u ar).
446 Christine P. Dancey & John Reidy
*5'-'I ¡; ® -u É»
I \*m | y w g w » * - .» I .j J Í K / r g 1 j[ff-tljik»y <« f jm I.v3frdH»1* I
jj 1 1 1 II í* 1
r «iic I
1’ ¡
c»**< J
^ .1
<■ r.ft.^1« 1
I
loe^ewrí Fau
P Sm íifio«
P mr- n ~
_ l
i*.*' I f Ibêcàm
33,
a»»V
aasl a m \ã
Ma _____
|£g.»h>dm IflWW: 1 |
Estatística sem M atem ática para Psicologia 447
2 1 .0 4 4 8 .6 9 8 6 8 .2 0 9 1 .0 7 4 8 .9 5 0 6 8 .2 0 9
4 .665 5.543 81 .7 26
5 .540 4.502 86 .2 29
9 .246 2.053 96 .1 08
Extraction Method: Principal Component Analysis (Método de Extração: Análise de Componentes Principais)
Component (Componente)
1 2
Extraction Method: Principal component A nalysis (Método de Extração: Análise de Componentes Principais)
Rotation Method: Varimax with Kaiser Normalization (Método de Rotação: Varim ax com Normalização de Kaise'
a. Rotation converged in three iterations (a. A rotação convergiu em três interações.)
* N. de R. T. G eneral C ertificate o f Secondary Education (Certificado Geral da Educação Secundária). A primeira qualificação oblida por _
estudante inglês, geralmente aos 16 anos. Principal instrumento para medir a qualificação dos alunos ingleses ao final da educação secun^:.-
obrigatória.
** N. de R. T. G eneral N ational Vocational Q ualification (Qualificação Vocacional Nacional). É um certificado de educaçao vocacional no R-
Unido. Inclui qualificações relacionadas com áreas em geral e não com um trabalho específico. É um curso disponível para pessoas de quaL
idade e não tem pré-requisitos. Envolve as áreas de comunicação, habilidade numérica e tecnologia da informação e lem por objetivo desem i
habilidades para melhorar a empregabilidade.
Estatística sem M atem ática para Psicologia 449
s l B l a l g ;l i i I M f ri m i -n r-l ¡ r ì c i n i
ÜI5I
I y»*f I »*■ I »«Im I _L
6 OU
400
500
20a
13 1 00 1 00 1 oo 1 CO 1 00 500
u Oeic<«>toei 1 Rolaban | Dptoni 1 00 500 500 5 CO 5 OC 500
«*
15 00 400 200 2 CO 200 200
16 16 on • > i X ?1 00 no 1 00 2 00 2 OD 2 00 200 3 y>
17 17 00 ICO 2 ou 1 CO 2100 1 00 oc 500 500 5 OC 500 5 00
10 13 OU 2 IX) i if; 100 IS 00 I UU t no -. ÜU 4« 5 00 410 5*»
19 18 00 ICO 200 <00 20 00 i CO oc 300 4 CO 303 30C 4 00
20 1900 ICO ?uo 100 *00 ! CO oc 500 500 ¿00 4UCI 4»
21 »00 1 00 200 ICO 1900 1 00 00 500 200 500 400 500
22 21 00 ICO 200 1 00 16 00 1 00 co 300 300 3CO 300 300
23 22 00 1 CO 1 no ! 00 18 OH 1 co OC1 200 ¿00 4 CO 2 CO 4 00
24 23 00 ICO 100 00 20 00 00 100 200 2 CO 200 200 300
25 24 CO 100 : i 00 18 00 1 00 00 500 500 400 4 00 500
A, 'Sb uu 1 uu .’ IX 1 uu *1 UJ 1 UJ Ul ‘-UJ t>iU 5Ü I *>ou 5ÜU
27 *00 ICO lOC 100 32 00 1 CD 00 400 200 2CO 2® 2 00
26 27 U0 1 LO 2u0 1 JU jyuo 1 UJ (JO 400 60U 4 UJ 500 5UÜ
29 28 CO ICO 200 1 Q0 22 00 1 CO oo 2 00 4 00 400 200 4 30
-.m -.rr, -.or.
H D v » mi «rim« { vwncto V+*.' ! ì i 7
Component (Componente)
1 2
Extraction Method: Principal component Analysis (Método de Extração: Análise de Componentes Principais)
Rotation Method: Varimax with Kaiser Normalization (Método de Rotação: Varimax com Normalização de Kaisf
a. Rotation converged in three iterations (a. A rotação convergiu em três interações.)
* N. de R. T. General Certificate of Secondary Educaiion (Certificado Geral da Educação Secundária). A primeira qualificação obtida po-
estudante inglês, geralmente aos 16 anos. Principal instrumento para medira qualificação dos alunos ingleses ao final da educação seci_-_
obrigatória.
** N. de R. T. General Noliona! V<utuional Qualificotion 'Qualificação Vocacional Nacional). É um certificado dc educação vocacional nr -
Unido. Inclui qualificações relacionadas com áreas em geral c não com um trabalho específico. É um curso disponível para pessoas de q___
idade e não tempre'-requisilos. Envolve as áreas de comunicação, habilidade numérica e tecnologia da informação c icm por objetivo deser
habilidades para melhorar a cmpregabilidade.
Estatística sem M atem ática para Psicologia 449
P r e s s i o n e C o n t i n u e ( C o n t i n u a r ) . D e s t a v e z a s a í d a i n c l u i u o t e r c e i r o f a to r.
10 .2 1 1 1.755 97.863
Extraction Method: Principal Component Analysis (Método de Extração: Análise de Componentes Principais)
Component (Componente)
1 2 3
Extraction Method: Principal component Analysis (Método de Extração: Análise de Componentes Principais)
Rotation Method: Varimax with Kaiser Normalization (Método de Rotação: Varimax com Normalização de Kaiser)
a. Rotation converged in three iterations (a. A rotação convergiu em três interações.)
1 7 .1 11 59.260 59.260
Extraction Method: Principal Component Analysis (Método de Extração: Análise de Componentes Principais)
Resumo
Ca) Que é influenciada pelas variáveis observadas (a) Não estejam relacionadas
(b) Que não é explicada pelas variáveis não-ob- (b) Estejam relacionadas
(c) Tenham apenas um relacionamento fraco
servadas
(d) Sejam mensuradas na m esm a unidade
(c.) Ao longo do qual os indivíduos diferem
(d) Ao longo do qual os indivíduos são hom ogê 8 Utilizar a matri/ de correlações para executar u: .
neos análise de fatores em vez da matriz de variânc:_
covariâncias assegura que os dados:
4. Observe o seguinte diagrama
(a) Sejam estatisticam ente significativos
(b) Sejam padronizados
Variável 1 (c) Não sejam padronizados
(d) Nenhuma das alternativas
10. A inatnz original sem rotação normaJmente sofre (c) Fatores plotados contra coeficientes de corre
uma rotação de modo que: lação
(a) Os fatores sejam mais significativos (d) Nenhuma das alternativas
(b) Os cálculos matemáticos sejam mais fáceis 12. E possível extrair
(c) A interpretação seja mais fácil
(a) Tantos fatores quantos variáveis
(d) Todas as alternativas
(b) M ais fatores do que variáveis
11. Um diagrama de declividade é um número de: (c) M ais variáveis do que fatores
(d) N e n h u m a d a s alternativas
(a) Variáveis plotadas contra a variância
(b) Variáveis plotadas contra a carga de fatores A s questões 13 a 15 estão relacionadas à seguinte saída.
Extraction Method: Principal component Analysis (Método de Extração: Análise de Componentes Principais)
454 C hristine P. Dancey & John Reidy
13. Q uantos com ponentes têm um autovalor acim a 17. Que fator apresenta “procura de risco”?
de 1. (a) Fator 1
(a) 3 (b) Fator 2
(b) 4 (c) Fator 3
(c) 5 (d) F ator4
(d) 6
18. Que fator representa “orientação não-verbal"?
14. Se uma solução de três fatores é proposta, aproxi
(a) Fator 1
madamente quanto da variância se irá reter
(b) Fator 2
(a) 43% (c) Fator 3
ib) 35% (d) Fator 4
(c) 24%
(d) 10% 19. N o Fator 2. som ente um dos itens é positivo. I ss.
ocorre por quê?
15. Quantas variáveis estão incluídas nessa análise:
(a) O autor com eteu um erro
(a) 3
(b) O item positivo está codificado de forma opo;-
(b) 10
ta aos demais itens
(c) 22
(c) Os três itens estão codificados na m esma d i
(d) Im possível dizer
reção
16. Qual é o número m ínim o de participantes reco (d) N ão existe significan cia na direção das car
mendado para uma análise de fatores? gas
(a) 50 20. Só as cargas mais “significativas” são mostrada-
(b) 70 nessa tabela. Isso ocorre porque é costum e dei.vr
(c) 100 em branco as cargas abaixo de:
(d) 500
(a) 0,4
4.vquestões 17 a 20 estão relacionadas com o texto e (b) 0.5
com a tabela abaixo, retirada de Romero e colabora (c) 0.6
dores (2003). (d) 0,7
Pesquisadores investigam os componentes do constructo autocontrole na teoria geral do crime, avaliada por vári
questionários. Descobrem que a análise “extraiu quatro fatores com autovalores maiores que 1. que juntos expl:
cam 57.31% da variância. Os fatores resultantes da rotação estão listados na tabela a seguir (F1-F4)”.
F1 F2 F3 F4
Referências
ALEX A N D ER . B., et al. An investigation o f shame and guilt in a depressed sample. British Jounal of
Medical psychology, v. 72, p. 323-38, 1999.
GILBERT, P., PEHL, J. B.. A LLA N. S. The Phenom enology o f shame and guilt: an empirical
investigation. British Jounal o f Medical Psychology, v. 67, n. 1, p. 23-36, 1994.
LUZZO. D. A., M cDO NA LD, A. Exploring studentes reasons for living on capus. Journal of College
Student Development, v. 37, n. 4. p. 389-95 ) 996.
PATTON, W., NOLLER, P. The Offer self-im age questionnaire for adolescents: psychom etric
properties and factor structure. Jounal o f Youth and Adolescence, v. 23, n. 1, p. 19 - 4 1, 1994.
ROMERO, E. et al. The self-control construct in the general theory o f crime: an investigation in terms
o f personality psychology. Psychology and Crime Law. v. 9, n. 1, p. 61-86, 2003.
TANG, T. N. et al. Features o f eating disorders in patients with irritable bowel syndrome, British
Jounal of Psycholosomatic Research, v. 45, n. 2, p. 171-8, 1998.
4 5 Análise de Três ou Mais Grupos
* ■ Controlando o Efeito de Uma
Covariável
Panorama do capítulo
EXEMPLO:
30
20 -
10
QI
28 ■
_____-
24 ■
_—-
__.__ -
i/í ^ — 1
z 14 "
Grupo
i
4 -
2,00
oH 1,00
1()6 1(58 1 0 1 2 1 4 1 6 1 8 i ; 10
Ql
^1U N S I _ U _ IM 6 £L ,
Escolha Graphs
I— (Gráficos) e
então Scatter
(Dispersão)
ZD\d-*>"•
*»\ n !jJ_____
SPSS Picc«»x » i >m&
□
IE 'A Mz* ■
I yM p: a:| j-o-- V« I ¿JFnaFlom | j%Y»oolGccC H^isr aowii i ' ■*a
Estatística sem M atem ática para Psicologia 459
S erá aberta a c a ix a d e d iá lo g o .
Assegure-se de
que Simples
(Sim ples) esteja
selecionado,
então escolha
Define (Definir)
~ r~ e .riT ‘
S IB IL ISI ! I I M&l H l- r l r - i a a r . ! -*!■»!
Verifique se a variável
dependente foi m ovida para
o eixo y (V Axis). A variável
independente é m ovida
para o eixo x (X Axis).
A variável de
agrupam ento
deve ser
colocada aqui
Score (E sc o r e ) é m o
A s v a r iá v e is sã o m o v im en ta d a s d o lad o e sq u er d o para o d ireito . O
v id o para o e ix o y ( F A . ) ; Motiv (M o tiv a ç ã o ), para o e ix o x (X Axis), e d e v e m o s m o v er t
ví s
G ru po (Group) para Sei Markers by (A ju star m arcad ores por). Is so é im p ortan te, p o is perm ite
q u e se o b te n h a m lin h as de reg r essã o sep arad as para cada grupo.
C liq u e o n OK :
20
18
16
a; 14
o
U
■2 12
10
x Grupo 3,00
■ Grupo 2,00
a Grupo 1,00
6 8 10 12 14 16 18 20
Motivação
¿t ________ 3 3 ^ *9 •
{jPafrm r. MM | prMooKflVort Nc | ^Vtf'C<y GeaCct I jãgarnov«! «v S I fjJ O jp J' if*iS ||fT ;Lh ««l • SHS -•'t & ^
Estatística sem M atem ática para Psicologia 461
Escolha
Chart
(G ráfico) e
Options
(Opções)
A p arecerá a se g u in te c a ix a de d iá lo g o .
H lAl_l
É im portante
que a opção
Subgroups
(Subgrupos)
esteja m arcada
10 12 14 16 18 20
MOTIVATI
SPSSPwrrw «•«•*
A s se g u r e -s e de q u e a o p ç á o Subgroups (S u b g r u p o s) fo i m arcada.
462 Christine P. Dancey & John Reidy
ErmBTgTTTEZMi i i i m i w : a
s a lili
DJ -!= » 1 - I I I Aj _I
Verifique se
GROUP
3.00
2 oo
1 00
C liq u e e m Continue (C on tin u ar) e e m OK. S erã o fo r n e cid a s lin h a s de reg r essã o para <
três g ru p o s sep arad am en te.
Todob os números desse exemplo foram arredondados para o inteiro mais próximo.
Estatística sem M atem ática para Psicologia 463
Atividade 13.1
H3
6 i
C
O 5 -
o>
O H
<s> A
oo _
V 3 -
cu
■o 2
> 1H
10 20 30 40 50
Idade
Figura 13.3 Diagrama de dispersão que mostra o relacionamento entre idade e níveis de testosterona
■ G ru po 1 (c ie n tista s ) = 38
■ G ru po (2 secretá ria s) = 34
■ G ru po (3 r ec e p c io n ista s) = 23
M édia global
<L>
"O
IDADE
Média global
M édia de
idade das
cientistas = 38
O cupação
Cientistas
Secretárias
Recepcionistas de boate
10 14 18 22 26 30 34
12 16 20 24 28 32 36
Idade Uma linha
vertical m ostra
a média geral, p
Figura 13.5 Linhas de regressão para cada grupo separadamente, mostrando as médias ajustadas e
não-ajustadas das cientistas.
466 C hristine P. Dancey & John Reidy
Média nào-ajustada do
nível de testosterona
por grupo
Figura 13.6 Linha de regressão para as cientistas, mostrando as médias ajustadas e não-ajustadas.
Estatística sem M atem ática para Psicologia 467
G rupo 2 2, 00 Secretárias
34 é a média das
idades das secretárias
Puxe essa linha para baixo em direção à média geral, a fim de en
contrar a nova média ajustada, no eixoy. Antes do ajustamento,
as secretárias tinham um nível médio de testosterona de 2,8
e, após o ajustamento, passaram a ter uma média de 2,7. Não é
muita diferença, mas assim a linha de regressão é quase plana.
Idade
Nova média
ajustada das
recepcionistas
Idade
o 4
CJ
l/l
5i/i 3 O cu p .xã o
,CD
Recepcionistas de boate
Secretárias
• Cientistas
10 14 18 22 26 30 34 38 42 46 50
12 16 20 24 28 32 36 40 44 48
(fa = 0) Idade
13.1.3 As linhas de regressão para os diferentes grupos devem ser paralelas entre si
Ocupaçao
Recepcionistas de boate
Secretárias
------ Cientistas
Idade
Atividade 13.2
ANCOVA:
(a) Reduz a variância entre grupos
(b) Reduz a razão F
(c) Reduz a variância d o erro
470 C hristine P. Dancey & John Reidy
Correlations (Correlações)
Levene's Test
for Equality
of Variances
(Teste de
Levene para a
Igualdade de t-test for Equality of Means
Variâncias) (Teste I para a Igualdade de Médias)
95% Confidence
Interval of the
Difference (IC de 95%
para a Diferença)
Sig. Mean Std. Error
(2-tailed) Difference Difference Lower Upper
gi (Sig. (Diferença (Erro Padrão (Limite (Limite
F Sig. t (gl) Bilateral) das Médias) da Diferença) Inferior) Superior)
DIFF Equal variances 0,007 0.935 0.850 8 0.420 6.4200 7.5565 -11.0053 23.8453
assumed
(Igualdade de
variâncias
assumida)
Equal variances 0.850 7.874 0.421 6.4200 7.5565 -11.0539 23.8939
not assumed
(Igualdade de
variâncias
não-assumida)
Sig. -- Significância
N o e n ta n to , ao e x e c u ta r m o s u m a A N C O V A , c o m o e sc o r e d o p ó s -te s te c o m o variáve
d e p e n d en te e o e sc o r e do p r e -te ste c o m o u m a c o v a r iá v e l, te re m o s o segu in te:
a. R Squared = .907 — Adjusted R Squared = .881 (a. R2 = 0.907 (R2 Ajustado = 0.881»
Sig. = Significância
13.2.1 O que você pode fazer se seu estudo não se encaixa nas
condições de uma ANCOVA?
T a b ela 1 3 .2 E m p a r e l h a n d o p a r t i c i p a n t e s q u a n t o à id ade
25 25 25
30 30 31
50 50 50
41 41 42
39 39 39
Estatística sem M atem ática para Psicologia 473
V a m o s im a g in a r q u e o s p a r tic ip a n te s fo r a m e m p a r e lh a d o s q u a n to à id a d e . S ig n if ic a
q u e o s g r u p o s a p r e se n ta m a m e sm a id a d e n a c o v a r iá v e l. A in d a é p o s s ív e l u tiliz a r a A N
C O V A c o m p r o v e ito (n e s te c a s o , será p e lo p r im e ir o o b je tiv o q u e m e n c io n a m o s ) de form a
a r ed u z ir a v a r iâ n c ia d o erro erro d e v id o à c o r r e la ç ã o en tre a v a r iá v e l d e p e n d e n te e a
c o v a r iá v e l.
Atividade 13.3
Escolha Analyze
(Analisar),
General Linear
M odel (Modelo
Linear Geral) e
Univariate
(Univariada)
474 Christine P. Dancey & John Reidy
A p arecerá a se g u in te c a ix a d e d iá lo g o s:
M ova a
variável
ind ependente
para este
espaço
Mova a
covariável para
este espaço
« * - '! Cs № a j j í»
I py; nrv.-çJ | jjf r d ff r in a | ¡»5 íthool GeoC ||pd*ncov*l » . fjj 3 JpJil
Ellaitdtaj Wrari,
r adatti sudrad» fnteactora* Perm ite que
as m édias
sejam
m ostrad as
C lique aqui
para obter as
m edidas
descritivas e
o tam an ho
do efeito
GRO U P (GRUPO) 1 4 .2 6 5 2 7 .1 3 3 9 6 .9 3 3 .0 0 0 .8 82
Total 353.320 30
Corrected Total
71.187 29
(Total Corrigido)
Estimates (Estimativas)
Dependente Variable: testosterone (Variável Dependente: testosterona)
(\T 1 EXEMPLO:
*
P e n se n o v a m e n te sob re o e x e m p lo u tiliz a d o no C a p ítu lo 9, p á g in a 3 0 6 . T rata-se de um
e x p e r im e n to p rojetad o para d e sc o b r ir s e o á lc o o l (c o n d iç õ e s p la c e b o , p o u c o á lc o o l, m uito
á lc o o l) a feta v a o d e se m p e n h o ao v o la n te , m e d id o por erros c o m e tid o s em um sim u la d o r
de d ireçã o . Para o d e lin e a m e n to in d ep en d e n te, o g ru p o c o m n ív e is a lto s d e á lc o o l (m u ito
á lc o o l) d ife riu d o gru p o q u e u sou p la c e b o e d o q u e c o n su m iu b a ix o n ív e l d e á lc o o l (p o u co
á lc o o l). A razão F fo i de 9 .9 1 . c o m u m a p ro b a b ilid a d e a ss o c ia d a d e 0 ,0 0 4 .
A g o r a farem os um a su p o siç ã o p erfeitam en te ra zo á v el d e q u e a e x p e r iê n c ia d e d ireção
está r ela cio n a d a a o s erros c o m e tid o s a o v o la n te , m e sm o em um sim ulad or. Q u a n to s m ais
ex p erien te for o m otorista, m en ores serão o s erros. A ssim , a e x p e riên cia do m otorista está ne
g ativam en te a sso cia d a aos erros ao volan te. Su pon ha que ten h am os d esco b erto qu anto m eses
o s p articip an tes (m o to rista s) já têm de direção. O s d ad os e stã o registrados na T abela 13.3.
O c o e fic ie n te d e co rr ela ç ã o d e P ea rso n c a lc u la d o entre o n ú m ero d e erros e o tem p o de
e x p e r iê n c ia resu lto u e m r = - 0 , 6 2 . E m b ora s ig n ifiq u e qu e o s três g r u p o s d e fa to d ife re m
q u anto ao tem p o de e x p e r iê n c ia , p o d e ter o co rr id o d e v id o ao erro am ostrai (a A N O V A de
um fator p od o m ostrar isso ).
S c p lo ta r m o s as lin h a s de r e g r e s sã o se p a r a d a m e n te para c a d a g r u p o , o b te r e m o s a
F ig u ra 13.12.
Estatística sem Matemática para Psicologia 477
5 I? 5 21 X 29
IO -■ 16 10 8
7 9 9 7 8 26
3 24 8 15 9 20
5 15 2 30 11 18
7 6 5 21 15 6
11 3 6 12 7 12
2 30 6 13 11 7
3 20 4 26 8 15
10 4 24 8 9
6 I 8 9 17 3
6 8 10 6 II 7
I , = 70 1 = 149 I-, = 74 I , = 200 V —1° ^ X*= 160
v, = 5.83 y, = 12,417 .V; = 6.17 Vj = 16.5Ñ3 v . s 10.25 <0= 13.33
DP. =2,69 DP =8.306 DP. = 2.35 DP. = 7.70 DP, = 3.05 DP,, = 8.338
M uito álcool
D e s s a v e z o b t iv e m o s ta m b é m as lin h a s h o r iz o n ta is : o p o n to c m q u e as lin h a s h o r i
z o n ta is e n c o n tr a m a lin h a d e r e g r e s sã o (para c a d a g r u p o se p a r a d a m e n te ) é a m é d ia d e x
e d e y. V o c ê p o d e v e r q u e a e x p e r iê n c ia c o m o m o to r ista e stá n e g a tiv a m e n te r e la c io n a d a
a o s erro s d e d ir e ç ã o para t o d o s o s g r u p o s . S a t is f iz e m o s e s s a s u p o s iç ã o d e m o d o fá c il
com a A N C O V A .
478 C hristine P. Dancey & John Reidy
U m a tab ela sep arad a é dad a para as m é d ia s m argin ais e stim a d a s (e s s a s sã o as m éd ias
aju stad as).
Estimates (Estimativas)
2. alcohol (álcool)
Dependent Variable: errors made (Variável Dependente: erros cometidos)
Mean (Média) Std. Error (Erro Padrão) 95% Confidence Interval (IC de 95%)
Estatísticas descritivas (Tabela X)~ mostram que mais erros são cometidos com alto consumo
de álcool do que nas outras duas condições. As médias observadas e ajustadas são mostradas na
Tabela X . Embora o número médio de erros com etidos pelo grupo que consumiu pouco alcool
.->eja maior do que o do grupo que usou placebo, a diferença foi pequena, e, de fato, os limites de
confiança cm tomo das médias mostram uma considerável sobreposição, Constatou-se que a ex
periência com o motorista está negativamente associada ao número de erros ao volante cometidos
(r = - 0,64); uma análise de covariância, utilizando a experiência de motorista como covariável,
mostrou que existe uma significati\a diferença entre as condições (F(2, 332) = 23,7, p - 0,001).
Representa um tamanho do eleito de 0,548, indicando que, sendo constante a experiência de diri
gir. 58% da variação dos erros ao volante podem ser atribuídos aos diferentes níveis de álcool. Um
teste post-hoc (Newman-Keuls) confirmou que existem diferenças significativas entre as condi
ções I e 3 e 2 e 3 (todas Com tamanho do efeito d = 1,54;. As condições relativas ao baixo consumo
de álcool e ao uso de placebo não mostraram diferença significativa (d = 0,14).
480 C hristine P. Dancey & John Reidy
Atividade 13.4
Estimates (Estimativas)
Dependent Variable: verbal iq (Variável Dependente: qi verbal)
IC de 95%
a. Evaluated at covariates appeared in the model: depression = 15.3286, participant's gender = 1.8571,
age of participant - 43 .0 0 0 0 , duration of ilness in years = 7.26 43 , years of education = 12.2643.
(a. Avaliado nas covariáveis do modelo: depressão = 15,3286: gênero do participante 1,8571; idade do participante =
43,0000; duração da doença em anos = 7,2643; anos de escolaridade = 12,2643.)
Estatística sem M atem ática para Psicologia 481
Corrected Model
5 4 22 .2 25a 7 774.604 7.081 0.00 0 0.444
(Modelo Corrigido)
Intercept
23 31 .1 56 1 2331.1 56 2 1 .3 1 1 0.000 0.256
(Intercepto)
SCHOOL
1954.830 1 1954.830 17.870 0.00 0 0.224
(ESCOLARIDADE)
Total 70 90 08 .0 00 70
Corrected Tota!
12204.343 69
(Total Corrigido)
a. R Squared = .444 - Adjusted R Squared .382 (a. R2 = 0,444 (R2 Ajustado = 0,382))
Sig. = Significância
O s p e s q u i s a d o r e s q u i s e r a m ir a l é m d o s d a d o s . C o n t r a s t e s f o r a m o b t i d o s v ia S P S S P W e p r o d u
z id o o se g u in te c o n ju n to d e resu ltad o s.
A n á l i s e s p r e l i m i n a r e s m o s t r a r a m q u e o s g r u p o s d i f e r e m d e f o r m a s i g n if ic a tiv a q u a n t o à d e p r e s s ã o
e d u r a ç ã o da d o e n ç a . P ara r e d u z i r a v a r i â n c i a at r i b u íd a a e s sa s variáv eis e o u t r a s m e d i d a s d e m o g r á f i c a s
so c iais ( idade, se x o e e s c o l a r i d a d e ) , e s s a s f o r a m u tiliz a d a s c o m o c q Variáveis e m an á l i s e s a d ic io n a is . P ri
m e ir o , u m a m e d i d a d o QI foi c o n s i d e r a d a . O s d a d o s f o r a m u ti l i z a d o s c o m o u m a a n á lis e d e c o v a r i â n c i a
( A N C O V A ) c o m o Q I v erb al c o m o v a r i á v e l d e p e n d e n t e e o s g r u p o s c o m o f a t o r e s i n d e p e n d e n t e s . Os
g r u p o s d o s d o e n t e s m o s t r a r a m valores s i g n i f i c a t i v a m e n t e m e n o r e s d o q u e o d a s p e s s o a s s a u d á v e i s (F(2.
6 2) = 5 , 5 9 , / ; = 0 ,0 0 4 , r| = 0,1.62). C o m p a r a ç õ e s e m p a r e l h a d a s c o n f i r m a r a m q u e a d i f e r e n ç a e n t r e os dois
g r u p o s d o e n t e s n ão f o r a m sign ificativ as ( m é d i a da SII d e 95 ,8 : m é d i a d o DII d e 9 4 ,2 c o m p = 1,00), m a s a
d i f e r e n ç a e n tre o s g r u p o s d o s d o e n t e s e d a s p e s s o a s s a u d á v e is ( m é d i a de 107) foi c o n s i d e rá v e l (SII versus
p e s s o a s sa u dáveis: p - 0 , 0 0 5 : D II v e r su s p e s s o a s sa ud áv eis: p = 0 .0 2 0 ).
Resumo
N e s te c a p ítu lo v o c ê a p re n d e u que:
2 . E x e cu te um a A N C O V A c o m o s d a d o s. O q u ã o d ife re n te é e s s e p r o c e d im e n to da
A N O V A d e um fator q u e v o c ê e x e c u to u no C a p itu lo 9? E screv a a su a in terp retação
d o s resu lta d o s.
484 C hristine P. Dancey & John Reidy
Sig. = Significancia
a. R Squared = .208 - Adjusted R Squared — . 160 (a. R2 = 0,208 (R2 Ajustado = 0,160))
Sig. = Significancia
ló. O mais alto nível de habilidade verbal é mostrado 18 O tamanho do efeito para a diferença entre os gr.
pelo: pos é aproximadamente:
(a) Grupo 1 (a) 2%
(b) Grupo 2 (b) 12%
(c) Grupo 3 (c) 2 1 %
(d) São todos idênticos (d) 70%
I~. Qual é a afirmação mais adequada? Quanto às di 19. A diferença mais forte entre grupos é entre:
ferenças entre os grupos, é: (a) 1 2 versus 3
(a) Provável que tenham ocorrido apenas por erro (b) 2 + 3 versus 1
amostrai F( 1, 65) = 150,46. p < 0,001. (c) I + 3 versus 2
(b) Provável que tenham ocorrido apenas por erro (d) São todos idênticos
amostrai F( 1. 65) = 1,22, p < 0,273
20. O grupo com o maior intervalo de confiança ^
(c) Improvável que tenham ocorrido apenas por
torno da média do nível de habilidade verbal é:
erro amostrai F(2, 65) =4.29. p < 0 ,0 18
(d) Improvável que tenham ocorrido apenas por (a) Grupo 1
erro amostrai F(4, 65) = 4,28. p < 0,0004 (b) Grupo 2
(c) Grupo 3
(d) São todos idênticos
Referências
Panorama do capítulo
Até agora todas as análises expostas neste livro, com exceção da análise de fatores, fo
ram análises univariadas. Vamos descrever outra técnica multivariada que é uma extensão da
ANOVA, a análise multivariada de variância. Não é a nossa intenção, neste capítulo, fornecer os
fundamentos da técnica, mas queremos apresentar a vocês uma idéia do que esse método tem
a oferecer.
Explicaremos:
■ o que é a MANOVA
■ as condições subjacentes ao uso da MANOVA, incluindo:
- normalidade multivariada
- homogeneidade das matrizes de variância-covariânda
■ MANOVA com:
- uma variável independente entre participantes e duas variáveis dependentes
- uma variável independente dentre participantes e duas variáveis dependentes
- variáveis independentes com duas condições
■ análises post-hoc para verificar a contribuição de cada variável dependente individual
mente para a diferença multivariada entre as condições da variável independente
Nos C apítulos 9 e J.0, intro d u zim o s a ANOVA. E m todos os exem plos forn ecid o s nesses c_-
pítulos, tínham os u m a ou m ais variáveis in d ep en d e n tes com som ente um a variável dep en d en :,
A M A N O V A perm ite trab alh ar co m m ais de um a variável d ependente. Você pode ver que n e '" :
livro p ro g red im o s de testes co m um a variável in d ep e n d e n te e u m a variável d ep en d en te,
testes com u m a variável dep en d en te e um a variável in dependente ou m ais até a M A N O V A . q e ;
pode ter m ais do que um a vartavel independente e m ais do que um a variável dependente. A ssi:'
eis um a recapitulação acerca de q u an d o se usam os p rincipais testes ex p licad o s até agora:
Estatística sem M atem ática para Psicologia 489
■ C o m u m a v ariáv el d e p e n d e n te e u m a v ariáv el in d e p e n d e n te c o m d u as c o n d iç õ e s
- teste 1
■ C om u m a variável d ep en d en te e u m a variável in d ep en d en te c o m m ais de d u a s c o n d i
ções (A N O V A de u m fator)
■ C o m u m a variável d ep en d en te e u m a uu in ais variáveis ind ep en d en tes, c a d a u m a com
d u as ou m a is c o n d iç õ e s -A N O V A
■ C o m urna v ariáv el d e p e n d e n te com duai. ou m ais v ariáv eis in d e p e n d e n te s - reg ressão
m ú ltip la
■ C o m d u a s ou m a is v a riá v e is d ep en d en te.v c o m u m a o u m a is v a riá v e is in d e p e n d e n
te s - M A N O V A
Atividade 14.1
m e d id a p e lo n ú m e ro d e d o e n ç a s n a q u e le a n o e u m e x a m e c o m p le to n ó fin al d o an o .
d e s e m p e n h o n o exam e.
O u talvez:
y = b ,x , + b^x, + b ,x , + ... b kx t+ a
N essa equ ação estam o s prevendo y a p a rtir de u m a co m b in ação lin ear de V is (x ,, x „ ... x.
Você pode. a esse p o n to , e star se p e rg u n tan d o c o m o a M A N O V A d ecid e , a p artir de toda
as p o ssív eis co m b in a ç õ e s d as v ariáveis d ep e n d en tes, q u al é a m ais a p ro p riad a p ara a a n á l f :
E ssa é u m a boa q u estão , ten d o em v ista que. p ara q u a lq u e r c o n ju n to de variáveis dependente
ex istirão in fin itas c o m b in açõ es. E sse n c ia lm en te , a M A N O V A u tiliza u m a c o m b in a ç ã o line_-
de variáveis d ep en d e n te s q u e m a x im iz a as d ifere n ç a s e n tre as v árias co n d iç õ e s das v ariáse ■
in d ep en d e n tes. P ara e n c o n tra r tal c o m b in a ç ã o , a M A N O V A u tiliza v árias re g ra s h eu rístic.
(regras práticas). Q u an d o você o b serv a os resu ltad o s de um a M A N O V A . n o tará que há q u a r
estatísticas d iferen tes calcu la d as de form a a av aliar o valor F. São:
1. X (lam b d a ) d e W ilks
2. T raço de Pi liai
3. T raço de H o ttelin g
4. M aio r raiz d e R oy
Atividade 14.2
Q u a is d a s se g u in te s sã o c o m b in a ç õ e s lin e a re s?
(a) a + b + c i - d - t - e
(b) A x B x C x D x E
(c) (a + b + c + d + e)/2
S e v o cê p e n sa r so b re as c o n d iç õ e s p a ra u so de u m a A N O V A , le m b ra rá que u m a d e las é
a d is trib u iç ã o n o rm al d o s d a d o s. N ão se rá su rp re sa , p o rta n to , se u m a re s triç ã o se m e lh a n te
ex istir p ara a M A N O V A . N o e n tan to , a su p o siç ã o p a ra a M A N O V A é um p o u co m ais c o m p le
xa. N esse c aso , p re c isa m o s a ss e g u ra r q u e e x iste a n o rm a lid a d e m u ltiv a ria d a , isto e', se cad a
u m a d as v ariáv eis d e p e n d e n te s e to d a s as c o m b in a ç õ e s lin e a re s d e ssas v a riáv eis d ev em ser
d istrib u íd a s n o rm a lm e n te .
N a p rática, a n o rm a lid a d e m u ltiv a ria d a é d ifícil de se r o b tid a p o rq u e tem o s d e v e rific a r
as d istrib u iç õ e s de c a d a variável d e p e n d en te e to d a s as p o ssív e is c o m b in a ç õ e s lin e ares p ara
n o s a sse g u ra rm o s de q u e são n o rm a lm e n te d istrib u íd a s. A ssim , re c o m e n d a -se q u e p e lo m e
no s se v erifiq u e a n o rm a lid a d e d a d is trib u iç ã o de c a d a variável d ep en d en te. C a b e o b se rv a r
q u e a M A N O V A é ain d a u m teste v álid o , m e sm o co m m o d e sta s v io la çõ e s nas h ip ó te se s de
n o rm a lid a d e m u ltiv aria d a. p a rtic u la rm e n te q u a n d o os ta m an h o s a m o stra is são ig u a is e ex iste
u m n ú m ero razo áv el de p a rtic ip a n te s em c a d a g ru p o . P o r "ra z o á v e l” e n te n d e m o s q u e. em um
d e lin e a m e n to c o m p le ta m e n te en tre p a rtic ip a n te s, deve h a v e r p elo m e n o s 12 p a rtic ip a n te s p o r
g ru p o e, p ara um c o m p le ta m e n te d e n tre p a rtic ip a n te s, p elo m en o s 22 p a rtic ip a n te s no todo.
D essa fo rm a, faz sen tid o , q u a n d o p la n e ja d o o uso de u m a M A N O V A . a sse g u ra r-se q u e p elo
m en o s essas c o n d iç õ e s este ja m sa tisfe ita s, assim você n ão p re cisa rá se p re o c u p a r m u ito com
p eq u e n a s v io laçõ e s das m esm as.
\ ¡1 EXEMPLO
*
S u p o n h a m o s q u e fiz em o s o e stu d o so b re b e m -e sta r d e sc rito a n te rio rm e n te n este c a p í
tulo. m as que d ec id im o s u tiliz ar a p e n as d o is fato res p ara m en su rá -lo , felicid ad e e o tim ism o .
Já o b tiv em o s o s d a d o s a p ro p ria d o s (T ab ela 14.1) de 12 p e ss o a s q u e vão re g u la rm e n te à
ig reja (d ev o to s) e d e 12 q u e n ão vão (ateu s).
A n tes de e x e c u ta rm o s a M A N O V A , p re c isa m o s e x a m in a r as e s ta tístic a s d e sc ritiv a s
p a ra nos a ss e g u ra rm o s d e q u e a s c o n d iç õ e s te'cnicas n ão e stã o se n d o v io la d a s. D ev em o s
e sta b e le c e r in ic ia lm e n te q u e os d ad o s p a ra c a d a variáv el d e p e n d e n te d e c a d a a m o stra estão
d is trib u íd o s n o rm a lm e n te . P ara isso , p o d e m o s so lic ita r ao S P S S P W q u e p ro d u z a d ia g ra
m as de c a ix a e b ig o d e s, h is to g ra m a s e d ia g ra m a s d e c a u le e fo lhas. O d ia g ra m a d e ca ix a e
b ig o d es d o s d a d o s d a T ab ela 14 . 1 é a p re se n ta d o n a F ig u ra 14.1
Devotos Ateus
| Felicidade
□ Otimismo
12 12 12 12
Devotos Ateus
Crença
Atividade 14.3
Felicidade
I
□ Otim ism o
12 12
Ateus
Crença
M é d ia s e IC d e 9 5 % e m to rn o d a s m é d ia s para o s ín d ic e s d e fe lic id a d e e o t im is m o de
Figura 14.2
d e v o to s e ateus.
Q u a n d o e x e c u ta m o s u m a M A N O V A co m e ss e s d a d o s, o b te m o s a se g u in te sa íd a c
SPSSPW :
Value Label
(Valor do Rótulo) N
BELIEF 1.00 Churchgoers 12
(CRENÇA) 200 (Devotos)
12
Atheists (Ateus)
Hypothesis df Error df
Effect (Efeito) Value (Valor) F (gl da Hipótese) (gl do Erro) Sig.
Intercept Pillai's Trace (Traço de Pillai) .969 327.224a 2.000 21.000 .000
(Intercepto)
Wilks' Lambda (Lambda de Wilks) .031 327.224a 2.000 21.000 .000
Hotelling's Trace (Traço de Hotelling) 31.164 327.224a 2.000 21.000 .000
Roy's Largest Root (Maior Raiz de Roy) 31.164 327.224a 2.000 21.000 .000
Belief Pillai's Trace (Traço de Pillai) .418 7 .547a 2.000 21.000 .003
(Crença)
Wilks' Lambda (Lambda de Wilks) .582 7.547a 2.000 21.000 .003
Hotelling's Trace (Traço de Hotelling) .719 7.547a 2.000 21.000 .003
Roy's Largest Root (Maior Raiz de Roy .719 7.547a 2.000 21.000 .003
Testei univariados
Test of W ithin-Subjects Effects (Teste dos Efeitos dentre Assuntos) /
■ A. de W ilks
■ T raço de P illai
■ T raço de H otel ling
■ M a io r raiz de R oy
Atividade 14.4
F n o S P S S P W ?
(b) N o ta d e P hil
(d) X. ( l a m b d a ) d e W ilk s
(e) y ( g a m a ) d e H a y le y
(g) C a m in h o d e C ro ssro a d
(h) M a io r raiz d e R oy
0,05 - 2 = 0 ,0 2 5
0 ,0 5 -5 = 0 .0 1
A n á lise da a m o s tr a
TESTE T
C0RRELACÕES
_________ ¿____
Correlations <Co"eiações:
Happiness Optimism
(Felicidade) (Otimismo)
Happiness Pearson Correlation
1 0.166
: eiicidade> (Correlação de Pearson)
Sig. (2-tailed) (Sig Bilateral) 0.437
N 24 24
Optimism Pearson Correlation 0.16 6 1
(Otimismo) (Correlação de Pearson)
Sig. (2-tailed) (Sig. Bilateral) 0.437
N 24 24
Sig. = Significancia
Diagramas de caixa e bigodes mostraram que os dados para cada variável dependente em c a _ _
condição da variável independente são aproxim adam ente distribuidos de forma norm al, assir
dado que os tamanhos amostrais são iguais, podemos estar razoavelmente confiantes de que nZ
existem maiores violações das hipóteses de normalidade multivariada. O teste M de Box indio _
que não existe violação da hipótese de homogeneidade das matrizes de variância-eovariância. C
diagramas de barras de erro mostraram que existem grandes diferenças, sem sobreposição dos IC-
de 95%, entre os dois grupos em termos do otimismo, mas em termos de felicidade a diferença 1
relativamente pequena e está associada a uma grande sobreposição dos lCs de 959? .
Os dados sobre bem -estar foram analisados por meio de uma MANOVA de um fator (devor -
versus ateus) com os escores de otim ism o e felicidade como variáveis dependentes. As análise-
revelaram que existe uma diferença multivariada entre os dois grupos improvável de ter ocorric
apenas por erro amostrai F(2, 21) = 7,75: p = 0,003; X de W ilks = 0,582). Como as duas variávei -
dependentes não estavam significativam ente correlacionadas 0 = 0 , 17; n = 24; p = 0.44). teste-
Estatística sem M atem ática para Psicologia 501
/ independentes foram utilizados em cada variável dependente em separado. Essas análises mos
traram que existe uma diferença entre os dois grupos em termos de otim ism o que não pode ser
atribuída ao erro amostrai (t(22) = 3,94; p = 0,001), mas essa diferença não ocorreu em termos do
item felicidade (t(22) = 0,82; p = 0.42).
N o ta : V ocê p o d e , se q u is e r, s im p le sm e n te a p re s e n ta r o s d e ta lh e s d o F u n iv a ria d o em
vez d o s testes t q u a n d o re la ta r as a n á lise s d as v ariá v e is d e p e n d e n te s in d iv id u a is. R e la ta r os
v alo res F u n iv ariad o s é a m e lh o r a b o rd a g e m q u a n d o tiv e rm o s m ais d o q u e três c o n d iç õ e s nas
variáveis in d ep en d e n tes.
Exemplo da literatura:
resistência mental de jogadores de rúgbi
E m um e stu d o de G o lb y e S h e a rd (2 0 0 4 ), a re s istê n c ia m en tal e o rig o r d o s jo g a d o re s d a lig a
de rú g b i fo ram m e n s u ra d o s p o r m eio de q u e stio n á rio s. A re sistê n c ia m en tal foi m ed id a co m o In
v en tário d e D e se m p e n h o P sic o ló g ic o (ID P : L o eh r, 1986). E ssa e sc a la m e d e sete c o m p o n e n te s da
re s istê n c ia m e n ta l, in c lu in d o a u to c o n fia n ç a , c o n tro le d a e n e rg ia n e g a tiv a (m a n e ja n d o e m o ç õ e s
n eg ativ as), c o n tro le d a a te n ç ã o (m a n te n d o o fo co ), v is u a liz a ç ã o e c o n tro le de im ag e n s (u tiliza n d o
im ag en s p o sitiv a s), m o tiv a çã o , e n e rg ia p o sitiv a (sa tisfa ç ã o ) e c o n tro le da a titu d e (m a n te n d o u m a
atitu d e positiva). O rig o r foi m e d id o co m M ad d i e K h o sh a b a (2 0 0 1 ), p o r m eio d o L e v a n ta m e n to de
P o n to s de V ista P esso ais lii- R . q u e a n a lisa três co m p o n en te s: c o m p ro m isso , c o n tro le e d esafio . O
e stu d o en volve a a d m in istra ç ão de q u estio n ário s aos jo g a d o re s q u e rep re sen ta m três níveis d iferen tes
na liga d e rúgbi. E sses níveis in c lu e m jo g a d o re s in te rn a c io n a is, jo g a d o re s d a su p erlig a e jo g a d o re s
d a p rim eira d ivisão . S ão os três níveis m ais altos d a liga de rú g b i da G rã -B re tan h a . O s p e sq u isa d o re s
ten tav am v erificar se ex istem d ifere n ç a s n a re s istê n c ia m e n ta l e n o rig o r en tre os jo g a d o re s re p re se n
ta n tes d o s três níveis da liga. P ara e x a m in a r tais d ife re n ç a s, fe z -se u m a M A N O V A seg u id a de u m a
A N O V A un iv ariad a. D e sc o b riu -se q u e ex iste u m a d ife re n ç a m u ltiv aria d a sig n ific a tiv a e n tre os três
níveis d a lig a de rú g b i. O s a u to re s re la ta ra m u m X de W ilk s d e 0 ,4 0 e u m v a lo r F de 5 ,9 8 co m p <
0 ,001. T am b ém e n c o n tra ra m u m r f de 0 ,3 7 , su g e rin d o q u e 37 % d a v a ria ç ã o n a c o m b in a ç ã o lin e a r
d as variáveis d ep e n d e n te s p o d e m se r a trib u íd o s ao nível a q u e p e rte n c e m o s jo g a d o re s. Isso é um
e feito b astan te alto p ara tal tip o de p e sq u isa p sic o ló g ic a . O s p e sq u isa d o re s tam b é m a p re se n taram os
re su lta d o s da A N O V A : ex istia m d ife re n ç a s sig n ific ativ a s e n tre os g ru p o s em te rm o s dos três tip o s
de fato res d e rig o r (c o m p ro m isso , c o n tro le e d e sa fio ) e d o is dos fa to re s re la c io n a d o s à re sistên c ia
m ental (c o n tro le da en e rg ia n e g a tiv a e c o n tro le da aten ç ão ). O s a u to res n o taram q u e ex istia m c o r
rela ç õ e s m o d e ra d a s e n tre a lg u m a s d a s v a riáv eis d e p e n d e n te s e, assim , ta m b é m e x e c u ta ra m u m a
a n álise d e sc e n d e n te p a ss o -a -p a ss o (v er S te p h e n s, 1997). C o m o su g e rim o s an te s, tal a n á lise está
além d o s o b jetiv o s d esse tex to , m as v o c ê p o d e c o n su lta r livros m ais a v a n çad o s se tiv er in teresse em
sab er m ais sobre o assunto .
502 Christine P. Dancey & John Reidy
A seg u in te c a ix a d e d iá lo g o s d e v e rá aparecer.
¿ U g lij
r ir - j p a n
« ! i
H U n i j
E 1scrJ ^ M’.ofu
sk! rjCU* Iri#*.!*."*!
CD
5V * ■-- Cuf#*ie»Ke íí
> Cw rttje I Cjr».tJ
H
1 iL ?r
504 Christine P. Dancey & John Reidy
q u e stio n á rio , m a io r é o m ed o .
N o estudo p odem os, po rtan to , u tiliz ar o Q M A antes e depois do tratam ento. P o d em o s, en
tão, co m p arar os dois e sco res u tilizan d o um teste t p ara ver se ex iste um d ecréscim o n o medi
após a terapia. E m b o ra esse e stu d o seja eficaz, seria co n v en ien te in c lu ir um a m edida d o m edo
de aranhas diferente. U m a d essas m edidas é o Teste da A bo rd ag em C o m p o rtam en tal (TAC), que
envolve a ap ro x im ação do p articip an te de um a ara n h a viva até q u e fin alm en te ele a p onha r..
p alm a d a m ão (v er Õ st et al. 1998). O s p articip an tes p o d em p arar o processo em q u a lq u er está
gio. A ssim , obtem o s u m a m ed id a co m p o rtam en tal do seu m edo de aranhas. Õ st e colaboradore-
apresentam 13 estág io s do seu p ro ced im en to , e o p articip an te g an h a um esco re d ep en d en d o d ;
quão perto chegou da aranha. U m esco re zero é atrib u íd o ao particip an te que se recu sa a entrar
na sala onde a aran h a está (m ed o m áxim o) e um esco re 12 é d ad o ao p articip an te que segurar a
aranha na palm a d a m ão p o r p elo m en o s 2 0 seg u n d o s (m ed o m ínim o). N o estu d o p o d em o s in
clu ir as duas m edidas de m edo de fo rm a a ab o rd ar o m aio r nú m ero possível de aspectos. Tenii -
um a m edida au to -rela ta d a (Q M A ). na qual u m alto esc o re é igual a um g ran d e m edo, e u m .
m edida com portam en tal (TAC), na qual um alto escore significa p o u co m edo.
E sse é um d e lin e a m e n to d e n tre p a rtic ip a n te s, p ois esta m o s te sta n d o as m e sm a s pessi -
as a n tes e d e p o is d a te ra p ia p a ra a fo b ia d e a ra n h a s. O s d ad o s p ara 2 2 p a rtic ip a n te s em ta
e stu d o , b e m c o m o as m é d ia s, os d e sv io s p a d rõ e s e in te rv a lo s de c o n fia n ç a d e 95% estã.
a p re s e n ta d o s na T ab ela 14.2.
Estatística sem M atem ática para Psicologia 505
T abela 14.2 Possíveis dados para um estudo sobre os efeitos de uma terapia contra aracnofobia
92 8 51 11
126 i 120 5
126 1 111 8
121 10 84 8
84 4 67 6
67 4 45 6
19 10 21 11
65 5 96 7
73 1 55 7
107 5 91 6
101 0 72 3
8? 6 63 6
110 7 109 8
21 11 31 11
68 8 69 9
42 4 67 3
106 9 110 9
89 6 75 10
88 5 91 6
33 10 41 10
55 6 56 5
33 7 42 10
X = 77.68 X = 71.23 X = 6,14 X = 7,50
N o sso p rim e iro pas so p a ra a n a lisa r os d ad o s deve se r a sse g u ra r q u e não v io lam as condi
ç o e s n ec e ssá ria s p ara a u tiliz a ç ã o d a M A N O V A . O s d ia g ra m a s de c a ix a e b ig o d e s fo rn ec id o s
p elo S P S S P W são a p re se n ta d o s n as F ig u ra s 14.4 (a) e (b).
A s F ig u ra s 14.4 (a) e (b) m o stra m q u e n ão te m o s v alo res a típ ic o s ó b v io s e q u e os d a d o s
parecem ser d istrib u íd o s n o rm alm e n te . P o d e m o s, en tão , a ssu m ir q u e as c o n d içõ e s de n o rm a
lid ad e não fo ram v io lad as. P o d e m o s tam b é m so lic ita r q u e o S P S S P W p ro d u z a os d ia g ra m a s
d e b arras de e rro s p ara os in terv alo s de 9 5 % de c o n fia n ç a em to rn o das m éd ia s (F ig u ra s 14.5
(a) e (b)).
P o d e -s e o b s e r v a r a p a rtir d a s F ig u ra s 14.5 (a) e (b ) q u e n ão e x is te u m a so b re p o s iç ã o
su b s ta n c ia l d o s in te rv a lo s de c o n fia n ç a d e 9 5 % p a ra a Q M A p ré e p ó s -tra ta m e n to . P ro v a
v e lm e n te c o n c lu ire m o s q u e n ã o e x is te d if e re n ç a e n tre as d u a s m e d id a s . A s o b r e p o s iç ã o
d o s in te rv a lo s de 95% p a ra os e sc o re s d o T A C e x is te , m a s a in d a n ão p o d e m o s a firm a r, a
p a rtir d o s m e s m o s, se é p ro v á v e l q u e e x is ta o u n ã o d ife re n ç a s ig n ific a tiv a e n tre a s d u a s
m e d id a s . A s s im , p a re c e e x is tir u m a p o s s ív e l d if e re n ç a n a m e d id a c o m p o r ta m e n ta l d o
m e d o de a ra n h a s , m as n ão na m e d id a a u to -re la ta d a .
506 Christine P. Dancey & John Reidy
140
22
Pós-TAC
(b)
Diagram as de caixa e bigodes para os escores do Q M A (a) e os escores do TAC (b) nas
Figura 14.4
condições pré e pós-terapia.
Estatística sem M atem ática para Psicologia 507
Grande
sobreposição
dosICs
de 95%
Pré-QMA Pós-QMA
(a)
u
í
o
c Pequena
cC sobreposição
o do; ICs
u
<u
de 95%
■O
u
Pré-TAC Pós-TAC
(b)
Figura 14.5 Diagram as de caixa e bigodes para os escores do Q M A (a) e os escores do TAC (b) nas
condições pré e pós-terapia.
508 C hristine P. Dancey & John Reidy
Between Intercept Pillai's Trace (Traço de Pillai) 0.956 216.797-1 2.000 20.000 0.000
(Entre) (Intercepto) Wilks' Lambda (Lambda de Wilks) 0.044 216.797a 2.000 20.000 0.000
Tópicos Hotelling's Trace (Traço de Hotelling) 21.680 216.797a 2.000 20.000 0.000
Roy's Largest Root (Maior Raiz de Roy) 21.680 216.797a 2.000 20.000 0.000
Within Treatment Pillai's Trace (Traço de Pillai) 0.379 6.110a 2.000 20.000 0.008
Subjects (Tratamento) Wilks' Lambda (Lambda de Wilks) 0.621 6.110a 2.000 20.000 0.008
(Dentre 0.611 6 .1 10a 2.000 20.000 0.008
Hotelling's Trace (Traço de Hotelling)
Roy's Largest Root (Malor Ralz de Roy) 0.611 6 .1 10-' 2.000 20.000 0.008
Epsilon (ea)
Within Subjects Approx.
Effect Mauchly's Chi-Square
(Efeito Dentre Measure W (M de (Qui-Quadrado Daf Greenhouse- Lower Bound
Tópicos) (Medida) Mauchly) Aproximado) (gl) Sig, Gelsser Huynh-Feldt (Limíte Inferior)
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is
proport ona to an identity matrix (Testa a hipotese nula de que a matriz das covariancias das vanáveis dependentes transformadas e
ortonorma"zaclas é proporcional a urna matriz ¡dentidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table, (a. Pode ser utilizado para ajustar o grau de liberdade para um teste de significancia de medias
Os testes corroídos sao apresentados na tabela de Testes de Efeltos Dentre Tópicos.)
b. Design: Intercept ib Delineamento: Intercepto)
Within Subjects Design: treatment (Delineamento Entre Tópicos: terapia)
Sig. - Significancia
Estatística sem M atem ática para Psicologia 509
M ultivariatebc (Multivarladosbt)
Hypothesis df Error df
Within Subjects Effect (Efeito Dentre Tópicos) Value (Valor) F (gl da Hipótese) (gl do Erro) Sig.
Treatment Pillai's Trace (Traço de Pillai) 0.379 6.110a 2.000 20.000 0.008
^ Wilks' Lambda (Lambda de Wilks) 0.621 6.110’ 2.000 20.000 0.008
Hotelling's Trace (Traço de Hotelling) 0.611 6.110' 2.000 20.000 0.008
Roy's Largest Root (Maior Raiz de Roy) 0.61 1 6.110' 2.000 20.000 0.008
Sig. = Significância
Sig. = Significância
510 Christine P. Dancey & John Reidy
Sig. = Significância
TESTE T
Std. Error
Mean Std. Deviation Mean (Erro
(Mèdia) N (Desvio Padrão) Padrão da Mèdia)
Pair 1 Fsq-pre QMA pre 77.6818 22 33.18833 7.07578
(Par 1)
Fsq-post (QMA pos. 71.2273 22 27.66626 5.89847
Pair 2 Bat-pre (TAC orei 6.13 64 22 2 .96480 0.63210
(Par 2)
Bat-post (TAC pos) 7.50 00 22 2.44462 0.52120
Estatística sem M atem ática para Psicologia 511
Correlation
N (Correlação) Sig.
Pair 1 (Par 11 Fsq-pre & Fsq-post 22 0,834 0.000
rair 1 (Par 1) (QMA pré/QMA pós)
Pair 2
z (Par
(rar 2)
¿) Fsq' pre
(Q(V]A prè,QMA pós)
& Fsc*-Post 22 0.785 0.000
Sig. = Significancia
Pair 1 Fsq-pre - Fsq-post 6.45455 18.31920 3,90567 -1.66773 14.57682 1.653 21 0.113
(Par 1) (QMA pré/QMA pós)
Pair 2 Fsq-pre - Fsq-post
(Par 2) (QMA pré/QMA pós)
-1.36364 1.83991 0.39227 -2.17941 -0.54786 -3.476 21 0.002
Sig. = Significância
não estão correlacionadas, testes t univariados separados foram conduzidos em cada variável depen
dente. Essas análises sugeriram que não existe uma contribuição que não possa ser atribuída ao erro
amostrai da medida de comportamento do medo (TAC) para a diferença multivariada entre as con
dições pré e pós-tratamento (t = 1,65; gl = 2 1:p = 0,113). O intervalo de confiança para a diferença
entre as condições pré e pós-tratamento para o TAC mostrou que a diferença média populacional
pode estar contida entre os valores de -2,1 8 e -0,55.
Atividade 14.5
a s d u a s co n d iç õ e s d a v a riá v e l in d e p e n d e n t e ?
(a) P rim e iro , p re cisa -se v e rific a r se as variáve is d e p e n d e n te s e stã o c o rre la c io n a d a s, Se es
entre as c o n d iç õ e s d a v a riá ve l in d e p e n d e n te .
d e n te s e m se p a ra d o.
1. E sc o re s do p ré -tra ta m e n to (Q M A ).
2. E sco res do p ó s-tra ta m e n to (Q M A ).
3. E sco res d o p ré -tra ta m e n to (TA C).
4 . E sco re s d o p ó s-tra ta m e n to (TA C).
Estatística sem Matemática para Psicologia 513
° * | B | a | 5i| - I I I
Regorlj
Dcjciçftve Slatnbci 1-lr.l v ia l
1 Isqpie lattei
Corapaie Mear«
Jasa-
51 C "
Moderi
i; . 1^°.C £«ieWe
126 0Ó' ■" l i Tc B«gres»on
121 00 84 C Vanarcí1Componen/:
L9^nM>
84 00 67 C Clatrfy
67 00 45 C ta ta Reduelen
19 00 21 C Scile
65 00 96 í ftonp«vr«t/KTetti
Time Senei
73 00 55 C
SurvTval
107 00 91 C
M^ple Rwpore*
101 00 72 C M-.ang )¿akj»Ana^ rn
83 00 63 c
‘110 00 '0 9 Qtr
21 00 31 00
68 00 ‘' 6900
42 00 67 ®
106 00
8900 >000'
88 X 91 ® 600
.. X 4' X to 00
55 X 56 ® 6® 5 00
7 00 10®'
«ST" ~i.iL
SPSS Ptoceisa i: 'fôdy
jjS la il I _J _ Ps ^ I 3 y Mcl': I MO1p'r»V'.' || 57 tepeale
■ái-lara
no entanto, precisam os esp ecificar co m o as variáveis depen d en tes serão reconhecidas. F azem os
isso clicando no botão M easures (M ed id as), que ex p an d irá a caix a de d iálo g o a tu a l.'
S iíí
\> .■j deve noiar que o SPSS. versão 12. não apresenta esta tela, mas a próxima. Assim , não é preciso clicar no botão M e n s u r e s para
aumentar a janela.
Estatística sem M atem atica para Psicologia 515
V ocê p e rc e b e rá q u e, n a c a ix a W ithin-Subjects Variables (V ariáv eis D en tre T< r:*- >' " i
d o is e sp a ç o s d isp o n ív e is p a ra a v ariáv el fs q (q m a ) e o u tro s d o is e sp a ç o s p a ra a .¡rL ’. e - •
(T A C ). Você dev e m o v e r as v ariá v eis de in te re sse d a lista de v a riá v e is p a ra es-e* -
T em o s d e fin id a s d u as v ariáv eis p a ra c a d a v ariá v e l d e p e n d e n te ; a ssim , você p re c isa r „ - . '
c o n d iç õ e s d a fs q (fsp re t f s p o s ,) p a ra p re e n c h e r os e sp aç o s d a fs q (Q M A ) e as dua^ c o n d L
d a b a , (batpre e batpost) p a ra p re e n c h e r os e sp a ç o s d a bat. Você d ev e. e n tão , selecix n .;.'
b o tão O ptions (O p çõ e s) p a ra re q u e re r o c á lc u lo d o ta m a n h o d o e fe ito (v eja a seg u iri.
8300 Display
11000 r Dejcichv« daterei r~ Tlyitlofnyyioo mailt*
2100 17 oh :c* r
6800 I~ 0bse»ved powe* r
42 X r «semate* r~ Residual pWi
i§6ao
"
r SSCPmatnc« 1
r* Lacfc o H i&tf
I~ RMdual SS£P nvjtrw r ¡¿«r+tii whmaò** kjnctan
Resumo
- T raço de H o tellin g
- M a io r raiz d e R oy
Exercício 1
U m a c o m p a n h ia p e tro lífe ra in v en to u d u a s n o v as fo rm a s d e c o m b u stív el. U m d o s c o m
b ustíveis é fe ito de su co d e c e n o u ra (é c la ro q u e isso aju d a rá o m o to rista a v e r m e lh o r d u ran te
a n o ite): o o u tro e' feito d e p u rê d e e rv ilh a s a m a ssa d a s (q u e não é ú til p ara d irig ir à n o ite, m a '
é b em v erd e). A n tes d e a c o m p a n h ia c o m e rc ia liz a r os c o m b u stív e is, q u e r d e sc o b rir q u a l do^
d o is é o m elhor. A c o m p a n h ia d e c id e re a liz a r u m e x p e rim e n to c o m 12 c arro s m o v id o s a s u a
d e c e n o u ra e o u tro s 12 a p u rê d e e rv ilh a . C ad a c a rro é d irig id o d u ra n te 12 h o ras c o n tín u as a
u m a v e lo c id a d e c o n sta n te de 7 0 q u ilô m e tro s p o r h o ra. A c o m p a n h ia d ecid e q u e os c o m b u s
tíveis devem se r c o m p a ra d o s p or m eio de v ário s ín d ic es d ife ren tes, e n tre ele s u m a e scala de
d an o s ao m o to r q u e v aria d e 1 a 10 (d e te rm in a d a p o r m e c â n ic o s) e o n ú m e ro de q u ilô m etro ^
ro d a d o s p o r litro de c o m b u stív e l. S eg u e m os d ad o s d o e stu d o .
4 10 14
? 10 14
X 9 14
5 9 12
6 7 12
i 11 II
4 12 I1
7 I1 9
3 10 15
6 6 15
7 12 16
5 13 17
E n tre c o m o s d a d o s no S P S S P W e e x e c u te u m a M A N O V A . R e sp o n d a as se g u in te s
q u e stõ e s:
Exercício 2
Leve Levorte
Gosto EP Gosto EP
5 8 8 9
!I 7 11 8
9 2 14 7
II 3 14 7
IO 4 15 2
12 7 10 3
9 6 10 4
6 6 15 5
8 5 11 5
10 5 13 6
9 5 13 6
8 4 13 6
E n tre c o m os d a d o s n o S P S S P W e e x e c u te u m a M A N O V A . R e sp o n d a as se g u in te s
q u e stõ e s:
intercept Pillai's Trace (Traço de Pillai) 0.963 222.465- 2.000 17.000 0.000
(intercepto) Wilks' Lambda (Lambda de Wilks) 0.037 222.465s 2.000 17.000 0.000
Hotelling's Trace (Traço de Hotelling) 26.172 222.465' 2.000 17.000 0.000
Roy's Largest Root (Maior Raiz de Roy) 26.172 222.465’ 2,000 17.000 0.000
GENDER Pillai’s Trace (Traço de Pillai) 0.426 6.308 2.000 17.000 0.009
(GENERO' Wilks' Lambda (Lambda de Wilks) 0.574 6 308 ’ 2.000 17.000 0.009
Hotellmg's Trace (Traço de Hotelling) 0.742 6.308’ 2.000 17.000 0.009
Roy's Largest Root (Maior Raiz de Roy) 0.742 6.308* 2.000 17.000 0.009
Tests the null hypothesis that the error variance of the dependent variables is equal
across groups. (Testa a hipótese nula de que a variância do erro é a mesma entre os grupos.)
a. Design: Intercept + GENDER (a. Delmeamento: Intercepto + GÊNERO)
Sig. = Significância
Estatística sem M atem ática para Psicologia 519
a. R Squared = .058 (AdjusteG R Squared .005 (a. R2 = 0,058 (R2 Ajustado = 0,005)
b. R Squared = .424 (Adjusted R Squared = .392 (b. R2 = 0,424 (R2 Ajustado = 0,392) Sig. = Significance
Std. Deviation
Mean (Média) (Desvio Padrão) N
Anxietyl (Ansiedadel) 39.5455 16.75518 22
Anxiety2 (Ansiedade2) 56.3636 15.79797 22
Depressioni (DepressãoD 5.8182 4.17060 22
Depression2 (Depressão2) 8.0000 3.03942 22
Estatística sem M atem ática para Psicologia 521
Between Intercept Pillai's Trace (Traço de Pillai) 0.964 264.762" 2.000 20.000 0.000
Subjects (Intercepto) Wilks' Lambda (Lambda de Wilks) 264.762* 2.000 20.000
0.036 0.000
(Entre
Assuntos) Hotelling's Trace (Traço de Hotelling) 26.476 264.762a 2.000 20.000 0.000
Roy's Largest Root (Maior Raiz de Roy) 26.476 264.762a 2.000 20.000 0.000
Within condition Pillai's Trace (Traço de Pillai) 0.497 9.889a 2.000 20.000 0.001
Subjects (condição) Wilks' Lambda (Lambda de Wilks) 0.503 9.889a 0.001
2.000 20.000
Assuntos) Hotelling's Trace (Traço de Hotelling) 0.989 9.889a 2.000 20.000 0.001
Roy's Largest Root (Maior Raiz de Roy) 0 989 9.889a 2.000 20.000 0.001
Between Epsilon (V )
Subjects M auchly's Aprox.
(Efeito Entre W (W de Chi-Square df Greenhouse- Lower Bound
Tópicos) Measure MaucMyi Qui-quadrado) (gi) Sig. Geisser Huynh-Feldt (Limite inferior)
condition anxiety 1.000 0 .0 0 0 0 1.000 1.000 1.000
(condição) (ansiedade)
depress
(depressão) 1.000 0 .0 0 0 0 1.000 1.000 1.000
Tests the null hypothesis that the error covariance matrix of the orthonormalised trasnformed dependent variables is proportional to
an identity matrix (Testa a hipotes-i lula de que a matriz de covariancia ortonormalizada das variáveis dependentes é proporcional à matriz identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of
Within -Subjects Effects Table (a Pode ser utilizado para ajustar os graus de liberdade dos testes de significancia ponderados. Testes corrigidos
são mostrados na tabela dos Efeitos Dentre Assuntos.)
b. Design: intercept (b. Delineamento: Intercepto)
Within Subjects Design: condition (Delineamento Dentre Assuntos: condição)
Sig. = Significancia
M ültivariateb,<: (M ultivariadosb)
condition Pillai's Trace (Traço de Pillai) 0.497 9.889" 2.000 20.000 0.001
(condition) Wilks' Lambda (Lambda de Wilks) 0.503 9 .8 8 9 a 2.000 20.000 0.001
Hotelling's Trace (Traço de Hotelling) 0.989 9 .8 8 9 ‘: 2.000 20.000 0.001
Roy's Largest Root (Maior Raiz de Roy) 0.989 9 .8 8 9 a 2.000 20.000 0.001
Sig. = Significancia
depress Linear
(depressão) (Linear) 171.636 21 8.173
Sig. = Significancia
Sig. = Significancia
Estatística sem M atem ática para Psicologia 523
16. Quais são as variáveis dependentes nesse estudo? (c) Não podemos afirmar pela saída
(a) Condição e intercepto (d) Sim, mas nenhuma das variáveis dependentes
(b) Ansiedade e depressão contribui individualmente de forma significa
(c) Greenhouse e Geisser tiva para a diferença multivariada
(d) Nenhuma das alternativas
19. Quais das seguintes estatísticas você colocaria no
17. Quantas condições existem na variável indepen seu relatório?
dente? (a) Traço de Pillai = 0,497
(a) I (b) Lambda de Wilks = 0,503
(b) 2 (c) Traço de Hottelinu = 0.989
(c) 3 (d) Maior rai/. de Roy = 0.989
(d) 4
20. Existe a presença de alguma diferença univariada?
18. Existe uma diferença multivariada entre as condi (a) Sim. apenas para ansiedade
ções da variável independente? (b) Sim. apenas para depressão
(a) Sim (c) Sim. para ansiedade e depressão
(b) Não (d) Não existe diferença univariada
Referências
GOLBY, J., SHEARD. M. Mental toughness and hardness at different levels o f rugby league.
Personality and Individual Differences.
LOEHR, J. E. Mental Toughness training fo r Sports: Achieving Athletic Excellence. Lexington (MA):
Stepehn Greene Press. 1986.
MADD1, S. R.. KHOSHABA. D. M. Personal Views S u n e y. Newport Beach (CA): The Hardness
Institute. 2001.
OST. L. STRIDH. B.. W OLF. M. A clinical study o f spider phobia: prediction of outcome after self
help and therapist-directed treatments. Behaviour Research and Therapy, v. 36, p. 17-35, 1998.
STEVENS. J. Applied Multivariate Statistics fo r the Social Sciences. Lawrence Erlbaum Associates.
1997.
SZYMANSKY. J„ O 'D ON O HU E. W. Fear o f spiders questionnaire. Journal o f Behavior Therapy and
Experimental Psychiatry, v. 26, p. 31-4, 1995.
TABACFiNICK, B.. FIDELL. L. S. Using Multivariate Statistics. Harper Collins, 1997.
Estatística Não-Paramétrica
Panorama do capítulo
testes p a ra m é tric o s.
o r de Pearson (p d e Sp e a rm a n ),
cio n a d a s)
m e n to d o s se g u in te s co n c e ito s:
: in te rv a lo s d e co n fia n ç a (C a p ítu lo 3)
r d e P e arson (C a p ítu lo 5)
■ teste f (C a p ítu lo 6)
■ A N O V A (C a p ítu lo 9)
Estatística sem M atem ática para Psicologia 525
RSQprtS
a ! | H | ã | E il I falbi*
DgtCTiplrv© Statistics
10 т у в я Custom T o b ie s
C o m p ere M eans
myatt
G en era l U neor M odel
R e g re ss io n Perbal
Laglmeo/ D istan ces
G a s s ily
Qoto R eduction
S c a le
N onperam etnc T ests
T ime S e r ie s
S urvival
Multiple R e s p o n s e
M issin g V a lu e A n aly sis.
Panorama do capítulo
testes p a ra m é tric o s.
■ o r d e P e arson (p d e Sp e a rm a n ),
c io n a d a s)
m e n to d o s se g u in te s co n c e ito s:
■ in te rv a lo s d e c o n fia n ç a (C a p ítu lo 3)
r d e P e arson (C a p ítu lo 5)
■ teste t (C a p ítu lo 6)
■ A N O V A (C a p ítu lo 9)
Estatística sem M atem ática para Psicologia 525
h íj íj & mi
__________I f * - - t e Untried SPSSPjtj . iS o ^ w l - -- I iyu- ’ ■
■'-■
J________ [ ^
Correlations (Correlaçoes)
a ttra c tiv e n e s s o f
my a ttra c tiv e n e s s p e rso n (atrativi
(minha atratividade) dade da pessoa)
C o rre la tio n
C o e ffic ie n t
1 .0 0 0 .9 2 1 **
Spearman's rho m y a ttra c tiv e n e s s (Coeficiente de
(p de Spearman) (minha atratividade) Correlação)
Sig . (1 -tailed )
(Sig. .0 0 0
Unilateral)
N 9 9
Correlation
attractiveness of Coefficient
.9 2 1 ** 1.000
person (atratividade (Coeficiente de
da pessoa) Correlação)
Sig. (1-tailed)
(Sig. .000
Unilateral)
N 9 9
a. Co-relation is significant at the .01 level (1 -tailed) (** A correlação e significante no nível 0,01 unilateral.)
Sig. = Significância
Exemplo da literatura:
dor e contrações uterinas durante a amamentação
H ô ld c ro ft e c o la b o ra d o re s (2 0 0 2 ) re a liz a ra m um e s tu d o e n tre m u lh e re s q u e a m a m e n ta v a m
p a ra d e s c o b r ir se a in te n s id a d e d a d o r a b d o m in a l e d a s c o n tra ç õ e s u te rin a s d ife re e m fu n ç ã o
d o n ú m e ro de p a rto s q u e tiv e ra m . U m a e sc a la v isu a l a n á lo g a (E V A ) e o q u e s tio n á rio d e d o r da
M c G ill {M cG ill Pain Q u e stio n n a ire) fo ra m u sa d o s p a ra m e d ir a in te n sid a d e d a dor. E sse q u e s
tio n á rio te m q u a tro d im e n s õ e s (s e n s o ria l, a fe tiv a , a v a lia tiv a e m is c e lâ n e a s ), e c a d a u m a p o ssu i
n ú m e ro s v a ria d o s de su b c la sse s . U m ín d ic e de in te n sid a d e to tal de d o r (IT D ) (lo ta ip ain intensity
ín d ex ) p o d e se r c a lc u la d o . O s p e s q u is a d o re s e n tã o u sa ra m o p d e S p e a rm a n p a ra a n a lis a r as re la
çõ e s e n tre v a riá v e is.
E m b o ra os p e sq u isa d o re s in fo rm e m q u e e sta b e le c e ra m o nível de sig n ific a n c ia d e 0 .0 5 , a ss e
g u ram qu e ao leito r é d a d a to d a a in fo rm aç ã o n e c e ssá ria p o r m eio d o relato tan to do c o e fic ie n te de
co rre la ç ã o q u an to d o s v alo res p.
O s p e sq u isa d o re s rela ta m alg u n s de seu s re su lta d o s d a se g u in te form a:
[...] tuna correlação positiva c significativa fo i encontrada para o relacionamento entre os escores
ITD e EVA durante a amamentação, com a duração m édia das contrações uterinas (ITD: p = 0,49, p =
0,006: EVA: ri.5 = 0,40, p = 0.03 1. mas não para o número de contrações uterinas. Nem os escores cla ITD
nem os de EVA observados para a menstruação estavam significativamente correlacionados tanto com o
número quanto com a duração das contrações m erinas durante a amamentação.
Subclasse P
A interpretação dos resultados da Tabela 15.1 é uma questão de observação da força, da direção e dos valores das
probabilidades associadas como um todo. Pode-se observar que “Outros” não está relacionada ao número de partos.
Mesmo sem um conhecimento do valor de probabilidade associada (0,54), o coeficiente de correlação é quase zero.
O diagrama de dispersão não mostraria um padrão específico. Embora ’■Claridade" tenha um coeficiente de correla
ção negativo, é muito fraco, e o valor de probabilidade associada de 0,50 provavelmente significa que ocorreu devido
ao erro amostrai.
528 C hristine P. Dancey & John Reidy
---
Atividade 15.1
(a ) Q u a l é a c o rre la ç ã o m a is fo rte n a T a b e la 1 5 .1 ?
Exercício 1
U m a p ro fe sso ra de a le m ã o le c io n a p a ra um g ru p o d e cin c o alu n o s. E la su p õ e q u e q u an to
m ais c o n fia n ç a o alu n o d e m o n s tra r ao fa la r ( I - e x tre m a m e n te c o n fia n te , 5 - sem co n fian ça),
m e lh o r o d e sem p e n h o . E la q u e r c o rre la c io n a r essa v ariáv el co m o d e se m p e n h o em um ex am e
oral. U m a p ro fe sso ra d iferen te fo rn e c eu as a v a liaçõ es d o s alu n o s em um ex a m e o ra l (1 - sem
ch an ce a lg u m a, 5 - e x celen te).
Ahmed 2 5
Bella 3 3
Carol 1 5
Darren 4 4
Elke 5 1
O q u e se p o d e c o n c lu ir d essa a n á lise ?
O s testes M a n n -W h itn e y e W ilc o x o n avaliam se e xiste uma diferença e sta tístic a s ig n ifi
c a tiva en tre a s m é d ia s cios p o s to s d a s d u a s c o n d iç õ e s. O teste M a n n -W h itn e y é u sad o q u a n d o
há p a rtic ip a n te s d ife re n te s em c a d a c o n d iç ã o . O teste W ilcoxon é u sa d o q u a n d o h á os m esm o s
p artic ip a n te s ou p a rtic ip a n te s e m p a re lh a d o s nas d u as c o n d iç õ e s.
O W ilc o x o n e q u iv a le ao M a n n -W h itn e y , e m b o ra as fó rm u la s p a ra os d o is te stes sejam
u m p o u co d ife re n te s, p o is no p rim e iro p o d e m o s u sa r o fato d e q u e os m esm o s p artic ip a n te s
estão em am b a s as c o n d iç õ e s. E sses te ste s são m u ito m ais sim p le s q u e os te ste s t, p o is não
en v o lv em c á lc u lo s de m éd ias, d e sv io s p a d rõ es e e rro s p ad rõ es. A m b o s os testes p re c isam que
os esco res de d u as co n d iç õ e s se ja m o rd e n a d o s a fim d e q u e o te ste e sta tístic o se ja c a lc u la d o
a p artir d e ssa s o rd en a ç õ e s.
Estatística sem M atem ática para Psicologia 529
Tabela 15.2 Avaliações dadas por participantes sobre alguém de bom ou mau humor
7.00 4,00
15,tXJ 6.00
14.00 11.00
3.00 7,00
17.0(1 9.00
4.00
7.00
Tabela 15.3 Estatísticas descritivas obtidas pelo procedimento Explore para participantes nas
condições bom humor e mau humor
oc
r
« i= 5 1 = 40
II
II
é ordenado
Posto m édio = 8 com o um Posto médio = 5 ,4
Estatística sem M atem ática para Psicologia 531
File E d it y ie w Q ata
- S P S S D a t e E d ito r
Iio i.ilo r n i
lglxl
1 Q rep h s Utilities W indow H elp
ö |B |# |E j| I I b lb l M Beao,1s
D §scn p tiv e Statistics
1 sc o re
Custom T a b le s
3 00 C la ssify
D a ta Reduction
17 00
Scale
4 00
I M onparam etnc T e s t s 1 Chi-Sq uare
6 00 T jrn e S e r ie s * Binom ial
11 00 Survive! * B u ns.
n \ D a t a V ievv \ V a f k i t l e i- 1
2 Independent S a m p le s S P S S P ro ce sso r is r e a d y
jifi S ta r t j VJ Iribú- | _}]R ¿ b [ _ j]R ? b | Find | Micro | _j^ £ < p lü [[¡¡Н т]тн п f V j Outpu | j j f - í О '
1 в г1 аЫ 4 и и И Е1 i L - e k i l o i - Ы - ч з Ы з 1 в |и |
-Ifllxl
F ile {¿dit V ie w ß a ta Transform A n a ly te ¿ra p h s Utilities W indow Help
Mova a variável
independente
para a caixa
Grouping Variable
(Variável de
Agrupamento) e
d:que em Define
Groups (Definir
Grupos), como
você fez com
o teste t.
Certifique-se
S P S S P r o c e sso r is rea d y
de defini-los.
i l f i S ta r t j V j In b o x . I _ J j R e b | _ jjR e b | Find | [ j y Micro | .¿ J E x p Io ||[ |fjr й ° и|р“ I О 19зг
532 C hristine P. Dancey & John Reidy
T E ü íJ
File £dit View* Qeila TfCWisfunri Anoly/t! (¿mplis IJtililiws Winder** Help
Definim os os
grupos aqui
M arque o
U de M ann
W hitney
¡iB Start I V j Inbox I _ J j P e b | _ J jR e b | Fine | ¡ffiM ia o | _¿ jE » p lQ ||[j^ m a n Outpu [ !
Ranks (Postos)
Mean Rank Sum of Ranks
mood (humor) N (Posto Médio) (Soma dos Postos)
good mood
SCORE (ESCORE) (bom humor)
5 8.00 40.00
Total 12
A p ró x im a seção traz o v alo r do teste e sta tístic o , n esse c aso o U d e M a n n -W h itn e y , que
é 10.00.
SCORE (ESCORE)
Mann-Whitney U
10.000
(U de Mann-Whitney)
Histogram as para as duas condições foram inspecionados separadam ente. Como os dados
eram assimétricos e o número de participantes pequeno, o leste estatístico mais apropriado foi o
Mann-Whitney. As estatísticas descritivas mostraram que os participantes que avaliaram a atrativi
dade de um ator de bom humor atribuíram notas mais altas (mediana = 14) do que os participantes
que o avaliaram de mau hum or (mediana = 7). Entretanto, o U de M ann-W hitney foi 10 (/. = -1 ,2 3 )
com um valor de probabilidade associada de 0,22, que mostra ser possível que as avaliações mais
altas na condição BOM HUMOR tenham ocorrido por erro amostrai. Portanto, não existem provas
o suficiente para concluir que os participantes foram influenciados pelo hum or dos atores quando
faziam julgam entos sobre as suas aparências.
Seção de resultados de Sherr e colaboradores (1996, por permissão de Taylor & Francis Ltd.
T ab e la 15.4
www.tadf.co.uk/journals)
E n tretan to , pela tab ela a p resen tad a, você não sabe a direção da d iferen ça. Q u e r dizer, qual grupo
tem o m aio r esco re em "P re o c u p a çã o em fazer um teste de H IV ” ? N ão sab em o s pela tab ela a p re se n ta
da. T eríam os de o lh ar a tab ela de m éd ias ou ler o artig o co m p leto . A lém disso, alg u n s valo res U estão
asso ciad o s a valores z p ositivos e o u tro s a valo res r. negativos. Isso reflete a d ireção d a diferen ça. T o
davia, teríam os de ler o artig o orig in al p ara in te rp re ta r os resu ltad o s com m ais d etalh es (a re ferên cia
é dada no final deste cap ítu lo , caso você q u eira in terp re ta r os resu ltad o s). C orno os au to res nos deram
p ro b ab ilid ad es exatas de alg u n s resu ltad o s, tam b ém p o d eriam te r fo rn ecid o as p ro b ab ilid ad es exatas
dos outros. A ssim , além de e x am in ar "n .s.” co n tra “ Id a d e", p o r que não re la tar a p ro b ab ilid ad e ex ata
tam b ém ? Faz parte de u m a boa p rática re la ta r p ro b ab ilid a d es ex atas p ara q u e o leito r p o ssa co n firm ar
os resultados, em vez de d e p en d e r co m p le tam e n te d a in terp retação d ad a p elo s au to res do artigo.
Atividade 15.2
m e n te m a is a lto s.
M ann-W hitney
Postos
Total 12
SCORE (ESCORE)
Mann-Whitney U
3.500
(U de Mann-Whitney)
Exercício 2
U m a p s ic ó lo g a c o n fe r e n c is ta e s tá c o n d u z in d o u m p e q u e n o e s tu d o p ilo to p a ra d e s
c o b rir se o s a lu n o s p re f e re m a p re n d e r o seu m ó d u lo d e e s ta tís tic a a v a n ç a d a p o r m e io d e
a u la s e x p o sitiv a s o u d a a b o rd a g e m d o a p re n d iz a d o b a se a d o e m p ro b le m a s (A B P ). O g ru p o
é c o m p o s to d e s o m e n te 12 p e ss o a s: p o rta n to , se is sã o a lo c a d a s p a ra o g ru p o tra d ic io n a l e
se is p a ra o g ru p o A B P. A p s ic ó lo g a e n tã o e n s in a o m ó d u lo d u a s v e z e s e m d ia s d ife re n te s
(e la a d o ra e ss e m ó d u lo !). C o m o q u e r s a b e r o q u e o s a lu n o s a c h a m so b re a su a a p r e n d i
z a g e m e a o m e s m o te m p o tira r m e d id a s d e d e s e m p e n h o , e la p e d e a e le s q u e a v a lie m o
q u a n to g o s ta ra m d o c u rs o (e s c a la de 1 a 7 , n a q u al 1 s ig n ific a re a lm e n te d e s a g ra d á v e l, e 7
e x tre m a m e n te a g ra d á v e l), e n tre v á ria s o u tra s m e d id a s. E la n ã o p rev ê q u a l a b o rd a g e m será
a m a is a g ra d á v e l p a ra os a lu n o s.
ABP Tradicional
5 4
7 6
4 4
5 4
7 I
6 2
5.00 7.00
6.00 6.00
2.00 3.00
4.00 8,00
6.00 7,00
7.00 6,00
3.00 7,00
5.00 8.00
5.00 5.00
5.00 8,00
Antes
X DP Mediana X DP Mediana
1
N - 10 10
Antes Depois
-1 2
-4 7.5
-I 2
1 1 2 ? sinal que mono-, ocorre (■-,)
-4 7,5
-3 5,5
0 -
-3 5,5
•'W
immite iNo |||a,l)n»ted SPSS Dal» . | JJMmxHUon j s T e ío
As duas
variáveis
são movidas
para a Lista
Pareada
540 Christine P. Dancey & John Reidy
Posto médio
dos casos positivos
Ranks (Postos)
Mear Rank Sum of the Ranks
N
(Posto I /lédio) (Soma dos Postos)
BEFORE - AFTER Negative Ranks
T 4.86 34.00
(ANTES - DEPOIS) (Postos Negativos)
Positive Ranks -|b 2.00 2.00
(Postos Positivos)
Ties (Empates) T •
Total 10
b. BEFORE > AFTER (b. ANTES > DEPOIS) Ocorreram dois empates que
c. AFTER = BEFORE (c. ANTES DEPOIS) ordenamos como zero
E is o relató rio :
Como a amostra era pequena, a medida de tendência central apropriada foi a mediana, e 0
teste estatístico apropriado foi o Wilcoxon. Da Tabela X‘ podemos ver que a mediana da condição
DEPOIS (7,00) é maior que a da condição ANTES (5). O teste de Wilcoxon (t = 2) foi convertido
em um escore z de -2 ,2 4 com um a probabilidade associada unilateral de 0.01. Portanto, pode ser
concluído que a atitude dos enfermeiros com doentes que sofrem de EM e' mais simpática após
terem participado do grupo de discussão e que é pouco provável que tal diferença tenha ocorrido
por erro amostrai.
Atividade 15.3
d a d ire çã o d a d ife re n ça .
Wilcoxon
Ranks (Postos)
Total 7
C O N D 2- COND1
Z -2 .0 2 8 a
O q u e vo cê p o d e c o n c lu ir d e ssa a n á lise ?
' Você deve informar aos seus leitores a tabela na qual estão as estatísticas descritivas.
542 C hristine P. Dancey & John Reidy
Exercício 3
1 5 3
2 4 4
3 4 2
4 3 1
5 5 3
6 5 4
Grupo Experiência
3,00 13,00
3,00 15,00
3.00 11,00
3.00 12.00
4,00 4,00
4,00 4,00
4,00 6,00
4,00 2.00
4,00 5.00
4,00 3,00
4,00 4,00
5,00 9,00
5,00 10,00
5,00 10.00
5,00 5,00
544 C hristine P. Dancey & John Reidy
S ele c io n e A nalyze (A n a lisa r), N onparam etric Tesls (T estes n ã o -p a ra m é tric o s ), K Inde
p en d em Sam ples (K p a ra A m o stras In d ep e n d en tes).
"7
f\ £ r ^ ¿i I £ / Micio; .%'l :/ | M r Z y |Ürv | [ - - ç h .ip T ik l '-''■-f-.ifffi_-.p-. | O O Q " 8 1528
A p arecerá a se g u in te c a ix a de d iálo g o .
A VD é
m ovida
para a Test
Variable
List (Lista
da Variável
Teste)
Pressione
para definir
o intervalo
range
Estatística sem M atem ática para Psicologia 545
Defina o
grupo mais
baixo e o
mais alto
T,v«------------
P Kut >Mi H
r Jck№ck Telano
-l_íl____
SPSS taccata a □
- r3!i *3© «■*■
I j^ .'. fC c norçu I W«d J| » UníOtrH SP SP,:. I í
Ranks (Postos)
job category
(categoria de trabalho) N Mean Rank (Posto Médio)
df (gl) 2
Asymp. Sig
0.003
(Sig. Assintótica)
Como a amostra era pequena e os dados não estavam distribuídos normalmente, foi realizada
uma ANOVA Kruskal-Wallis de um fator nos três grupos ocupacionais. Como era de se t sperar, os
estagiários universitários tinham o menor nível de experiência de trabalho (mediana = 4 anos), e os
oficiais de segurança, o maior nível (mediana = 12.5 anos). Cozinheiros tinham uma mediana de
9.5 anos. Os resultados deram um %'de 11.44 com um valor de probabilidade associada de 0,003.
Portanto, concluiu-se que existem diferenças significantes em experiência de trabalho entre oficiais
de segurança, estagiários universitários e cozinheiros.
Estatística sem M atem ática para Psicologia 547
Atividade 15.4
Kruskal—Wallis
Ranks (Postos)
Total 16
RATING (AVALIAÇÃO)
df (gl) 2
Exemplo da literatura:
o pensamento em pessoas com distúrbios de humor
Byrne e MacLeod (1997) conduziram um estudo para examinar aspectos do pensamento futuro
em participantes com distúrbios de humor. Os participantes, ansiosos ou ansiosos e deprimidos
(misto) ou que não sofriam de nenhum dos dois distúrbios, foram apresentados a uma gama de
eventos futuros positivos e negativos e tiveram de fornecer explicações sobre o porquê aqueles
eventos acontecerem ou não com eles.
Havia 25 participantes em cada grupo. Como controle de manipulação (para verificar se os
participantes deprimidos mostravam escores maiores de depressão que os outros grupos e que os par
ticipantes ansiosos mostravam escores maiores de ansiedade que os outros grupos, assim por diante)
os autores testaram se havia diferenças significantes entre os três grupos. Os autores dizem:
As diferenças de grupo em escores de ansiedade e depressão foram consideradas com o uso do
Kruskal-Wallis [...] como as condições paramétricas não foram satisfeitas. Havia diferenças significativas
entre os grupos em ambas as medidas (p < 0,001). Grupos ansiosos mistos eram significativamente dife
rentes dos controles na medida de ansiedade [...] Todos os três grupos eram significantemente diferentes
na medida de depressão (escores médios foram 0.1 e 4,2 para os grupos de controle, ansiedade e depressão
mistas respectivamente).
548 Christine P. Dancey & John Reidy
Exercício 4
Como parte de seu projeto conjunto do ano sobre a utilidade da terapia para pessoas que
sofrem de enxaqueca, Nyashia e George distribuíram aleatoriamente 18 pessoas que sofrem
de enxaqueca em três grupos. O Grupo 1 tem seis sessões de urna hora de terapia com um
terapeuta estagiário; o Grupo 2 tem seis sessões de auto-ajuda de urna hora (que não são
lideradas por um facilitador - a agenda é determinada pelos próprios membros do grupo),
e o Grupo 3 consiste de pessoas que sofrem de enxaqueca que gostariam de participar de
terapia ou de auto-ajuda, mas tem que esperar. Nyashia e George prevêem que os grupos de
terapia e de auto-ajuda avaliarão que sofrem menos de enxaquecas do que o grupo na lista
de espera quando avaliarem sua enxaqueca em um segundo ponto no tempo. No início do
estudo, os participantes avaliam os seus sintomas no último mês. de 0 (sem sofrimento) a 5
(sofrimento terrível). Quatorze dias mais tarde, avaliam os seus sintomas (no último mês)
novamente. Os dados seguem abaixo. Entre com os dados no SPSSPW e guarde como um
arquivo de dados.
Como os grupos são pequenos, os escores são aUto-avaliações, e os dados não estão
distribuídos normalmente, recomendamos testes não-paramétricos. Conduza dois Kruskal-
Wallis, um nos sintomas no início do estudo e um nos sintomas 14 dias mais tarde.
Escreva os resultados em forma de um parágrafo breve, explicando o significado dos
resultados em termos do estudo.
3.00 2.00
3.00 3.00 3.00
Embora confuso, o teste é chamado de ANOVA de um fator. Isso se deve ao fato de algu
mas pessoas considerarem os participantes como um fator, em um delineamento de medidas
repetidas, como já mencionamos previamente (ver Capítulo 9). Todavia, é o que conhecemos
por um fator. Na seguinte saída, os participantes avaliaram o quão alerta eles se sentiam em
várias partes do dia (em uma escala de 1 a 5).
mnmirg
As variáveis
são mudadas
da caixa
Test Variables
(Variáveis Teste)
M arque
Friedman
HUK«« n_iL_
SPSS Pioeewoi nea&
JlStarti fãÉ VJJJft 1:114
I ' . j C |rgr, | y M < , ' W j ^ jíy i jnooi Vi< SP I ¿JPxdf«ri-y]
Mova as variáveis do lado esquerdo para o lado direito. Certifique-se de que a caixa
Friedman está marcada. Ao escolher a opção Sicitistics (Estatística), você pode obter as esta
tísticas descritivas. Pressione OK. Será fornecida a seguinte saída:
Ranks (Postos)
N 10
df (gl) 2
Asymp. Sig
.002
(Sig. Assintótica)
Atividade 15.5
Observe para a seguinte suida de uma análise de três grupos. Os participantes eram pes
soas com doenças crônicas, que negaram a participação em uma intervenção comportamental
feita para os ajudar. Medidas de depressão foram tiradas em três pontos no tempo. O pesqui
sador previu que haveria diferenças significantes entre escores nos três pontos no tempo, mas
ele não previu a direção da diferença.
Friedman
Ranks (Postos)
N 8
df (gl) 2
Exemplo da literatura:
danos ao cérebro e estabilidade de resultado
U m a grande p e r ce n ta g e m d os 5 m ilh õ e s d e d a n o s trau m áticos ao céreb ro e stim a d o s n o s E sta d o s
U n id o s to d o s o s a n o s oco rrem em p e s s o a s jo v e n s , qu e en fren tarão m u ito s an os de c o n s e q ü ê n c ia s
e c o n ô m ic a s e se q ü e la s n e u r o c o m p o r ta m e n ta is. A s h le y e c o la b o ra d o re s ( 19 9 7 ) ob servaram 3 3 2 p e s
so a s axé 14 a n o s a p ó s su a lib eração da rea b ilita çã o p ó s-a g u d a d e v id o a d a n o s cereb ra is traum áticos;.
Q u eriam d e sco b rir q u ais v a r iá v e is p rev ia m u m a e sta b ilid a d e de resu ltad o m elh or. M u itas das variá
v e is eram próprias para a n á lise c o m o e sta tístic a param étrica, m as u m a não era - a E sc a la de Status
O c u p a c io n a l (E S O ). A s h le y e c o la b o ra d o re s q u eria m d eterm in ar se o status o c u p a c io n a l m u d ava
por m e io de três p o n to s no te m p o - entrada d e v id o a d a n o s cereb ra is tr a u m á tico s, lib er a ç ã o ap ós
r ea b ilita çã o e c o n tin u a ç ã o de tratam ento p ó s -lib e r a ç ã o . P ortan to, usaram a A N O V A de F ried m an
- e d esco b rira m q u e o status o c u p a c io n a l m ostrou um a d im in u iç ã o sig n ific a n te em status na c o n ti
n u ação do tratam ento a p ó s lib eração.
552 Christine P. Dancey & John Reidy
Exercício 5
Resumo
■ O s te ste s u tiliz a d o s n e ss e c a p ítu lo sã o n ão -p a ra m étrico s e d e v e m ser u sa d o s q u an d o
não é p o s s ív e l u tilizar um param étrico.
■ O s te ste s n ã o -p a ra m é tric o s transform am os d a d o s em um p rim eiro e s tá g io n o c á lc u lo
da e sta tístic a teste.
■ T estes n ã o -p a ra m étrico s não n e c e ssita m da h ip ó te se de n orm alid ad e e n em d e gran
d e s am ostras.
■ A versã o n ã o-p aram étrica do r de P earson é o p de Sp earm an.
■ t sã o o M a n n -W h itn ey , para a m o s
O s te ste s n ã o -p a ra m é tric o s e q u iv a le n te s ao teste
tras in d ep en d e n tes, e o W ilc o x o n , para am ostras r ela cio n a d a s.
■ O s te ste s n ã o -p a ra m étrico s e q u iv a le n te s à A N O V A sã o o d e K ru sk al-W allis para
am ostras in d ep en d e n tes, e o de F ried m an , para am ostras rela cio n a d a s.
Estatística sem M atem ática para Psicologia 553
Ranks (Postos)
Total 16
Kruskal—Wallis
Ranks (Postos)
2.00 5 7.30
3.00 5 12.70
Total 15
SCORE (ESCORE)
df (gl) 2
11. Qual grupo teve os maiores escores? a. Friedman Test (a. Teste de Friedman)
Sig. = Signifícância
(a) Grupo 1
(b) Grupo 2
(c ) Grupo 3 13. Qual é a conclusão mais sensata?
(d) Não podem os saber (a) Existem diferenças entre os grupos, mas elas
12. Quantos participantes estavam no estudo? têm uma chance de 23% de haverem ocorrido
por erro amostrai
(a) 5
(b) Existem diferenças entre os grupos e é impro
(b) 10 vável que tenham ocorrido por erro amostrai
(e ) 15 (c) Não existe diferença alguma entre os grupos
ld) 20 (d) Nenhuma das alternativas
As questões de 13 a 15 se referem ci seguinte saída. 14. Quantos participantes estavam no estudo?
(a) 7
Friedman's Ranks (Postos de Friedman) (b) 14
(c) 21
Mean Rank (Posto Médio)
(d) N ão é possível saber
BEFORE (ANTES) 1.50 15. Os participantes foram medidos:
As questões de 16 a 17 se referent à tabela abaixo, reti 17. O relacionamento mais forte é entre dor e:
rada de Holdcroft e colaboradores (2003). (a) Tensão
(b) Autonomia
Spearman rank correlation coefficients for affective (c ) M edo
measures and pain (Coeficientes de correlação de postos de (d) Punição
Spearman para medidas afetivas e dor)
18. Leia o seguinte texto, extraído de Daley, Sonuga-
Pain (dor) P value (valor Pi Barke e Thom pson (2003). Eles estavam fazendo
com parações entre mães de crianças com e sem
Tension (Tensão) 0.04 0 .78 problemas de comportamento.
Autonomic (Autônomo) - 0 .0 9 0 55
Testes U de Mann-Whitney foram usados /.../ dife
renças significantes indicaram que mães de crianças
Fear (Medo) - 0 .1 3 0.36 com problemas de comportamento demonstraram
afirmações iniciais menos positivas (z = -4.24)
Punishment (Punição) - 0 .2 4 0 09 tanto quanto relacionamentos (z. = -4,25). menos
afeto (z = -5.08) e menos comentários positivos
(z. = -2,82), todos os valores p < 0,01.
16. Qual é a frase mais apropriada ? Em termos gerais, Das quatro com parações, qual foi a mais forte?
as medidas afetivas e de dor mostram:
(a) Afirm ações iniciais
(a) Um relacionamento fraco (b) Relacionam entos
(b) Um relacionamento moderado (c) A feto
(c) Um relacionamento forte (d) Comentários positivo
Correlations (Correlações;
N 70 70
N 70 70
Sig. = Significancia
556 C hristine P. Dancey & John Reidy
Qual é a afirmação mais apropriada? O relaciona vaçào. Infelizmente, o professor queria obter valores
mento entre as duas avaliações é: p unilaterais. Ele gostaria que você interpretasse os
(a) Forte (p = 0.7, p< 0.000) resultados abaixo, para uma hipótese unilateral.
(b) Forte (p = 0,6, p < 0 ,0 0 1 ) O relacionamento entre força e motivação é:
(c) Moderado (/- = 0,7, p < 0 .0 0 1 )
(a) Fòrte (p = 0,35, p = 0,094)
(d) Moderado (r = 0,6, p < 0,000)
(b) Forte (p = 0 .35, p = 0,047)
20. Observe a seguinte tabela. O professor Green previu (c) M oderado (p = 0,35, p = 0,094)
que força teria um relacionamento positivo com moti- (d) Moderado (p = 0 ,3 5 ,/; = 0,047)
Correlations (Correlações)
l\l 16 16
N 16 16
Sig. = Significance
Referências
ASHLEY, M.J., PERSEL, C.S., CLARK. M.C. e KRYCH, D.K. Long term follow -up o f past-acute
traumatic brain injury rehabilitation: a statistical analysis to test for stability and predictability of
outcom e. Brain Injury. I 1 (9), p. 677-90. 1997.
B Y R N E, A. e M ACLEO D, A.K. Attributions and accessibility o f explanations for future events in
anxiety and depression. British Journal o f Clinical Psychology, 36, p. 505-20, 1997.
DALEY. D., SO N U G A -BA R K E, E.J.S., e TH OM PSO N, M. A ssessing expressed em otion in mothers
o f preschool A D /H D children: psychom etric properties o f a m odified speech sample. British
Journal o f Clinical Psychology. 42. p. 53-67, 2003.
HOLDCROFT, A.. SN IDV O N G S. S.. C A SO N. A.. DORE. C.J. e BERKLEY. K. Pain and uterine
contractions during breast feeding in the imm ediate post-partum period increase with parity. Pain.
104. p. 589-96. 2003.
SHERR. L.. JEFFERIES. S., VICTOR, C. e CH ASE, J. Antenatal HIV testing - which way forward?
Psychology. Health & Medicine, 1 (1), p. 9 9 - 1 12. 1996.
TRELOAN. C.J.. HIGGINBOTHAM . N.. M ALCOLM . J.. SU TH ERLAN D, D. e BERENGER. S.
A n "academic detailing” intervention to decrease exposure to HIV infection among health-care
workers. Journal of Health Psychology, 1 (4), p. 455-68, 1996.
Respostas das atividades
para o SPSSPW, dos exercícios e das
questões de múltipla escolha
Capítulo 1
Atividade 1.1
Quais das seguintes variáveis são contínuas, quais são discretas e quais são categóricas?
■ Velocidade do vento - contínua
■ Tipos de títulos oferecidos por uma universidade - categórica
■ Nível de extroversão - contínua
■ Marcas de carros - categórica
■ Times de futebol - categórica
■ Número de peças capturadas em um jogo de xadrez - discreta
■ Peso de pandas gigantes - contínua
■ Número de pinturas expostas em uma galeria de arte - discreta
Atividade 1.2
Atividade 1.3
Atividade 1.4
Exercício 7
1. A VI no estudo do Dr. Gênio é se os participantes foram apresentados com adjetivos ou
substantivos.
2. A VD nesse estudo é o número de palavras lembradas corretamente por cada participante.
3. Esse é um delineamento entre participantes porque os adjetivos foram apresentados a um
grupo, e os substantivos, a outro.
4. Esse é um projeto experimental porque o Dr. Gênio alocou ao acaso os 20 participantes a
cada uma das condições.
5. Os dados para esse estudo particular devem ser colocados no SPSSPW como o indicado
a seguir. Devem existir duas variáveis. A primeira deve ser a variável de agrupamento
e contém uma série de valores 1 e 2. Nesse caso, o valor 1 representa a condição dos
adjetivos, e o número 2, a dos substantivos. A segunda variável deve conter o número de
palavras lembradas corretamente por cada participante.
1 00 10 00
1 !_ I ■ N
1 00 6 IX:
1 oo' 7 00
1 00 900
1 00 11 00
■1oo 9 00
100 600"'
100 600
1 00 9 00
100 ebc
200 ’i2Ò0
200 1300
20CI 1600
200 15 00
2 00 ' 900
200 700
2 00 1400
12fio
200 11 00
200 13CC
1 | |\ D.il.l Vlew x, /
SPSS Proc*»o» o re*4>
► Q .¿jEvptofln | | _JAciobai | | gp lIrHill -3S!-:í'-''sàlf > 1?«
Estatística sem M atem ática para Psicologia 559
Exercício 2
Os dados para o estudo adjetivos/substantivos devem ser colocados no SPSSPW. como
segue, se for um delineamento dentre participantes:
Ffc £ck V«w fiata Tianslomi AnaJyz« £>aph: y tite s V/rxJcwf Heip
^ I B |£ | m\ * I 1
-1 M & l * 1 ■ r i r — m - I - l n l < * |< » |
18
adject w nouns 1 1 1 1 1 1 I i I-
1 1000 12 QO
2 600 1300
3 700 1600
4 900 1500
5 11 00 9 00
6 900 700
7 800 1400
8 500 12 00
9 9.00 11 00 —
10 8 PCI 1300
Capítulo 2
Atividade 2.1
\ amostra mais apropriada para o estudo dos fãs de rúgbi versus fãs de futebol será um
grupo de fãs de futebol e um grupo de fãs de rúgbi (embora talvez alguns possam dizer que
um grupo de chipanzés também seria adequado).
560 Christine P. Dancey & John Reidy
Atividade 2.2
Atividade 2.3
Atividade 2.4
Atividade 2.5
Atividade 2.6
Atividade 2.7
O diagrama de dispersão sugere que não existe um relacionamento real entre os preços
do petróleo e a satisfação do motorista. Os pontos no diagrama estão distribuídos ao acaso
entre os eixos.
Atividade 2.8
As definições mais razoáveis de desvio padrão são (c), o desvio padrão é uma medida da
variação dos escores em torno da média, e (d), o desvio padrão é a raiz quadrada da variância.
Atividade 2.9
E xe rcício 7
50 -,
40 - *5
30- o13
014
20 -
o 3
10 H * 4
0
N= 20
D ecréscim o nos erros
(a) O tamanho do bigode mais curto, mais o fato de que a mediana está mais próxima
desse lado do que do meio sugere que a distribuição é positivamente assimétrica.
(b) O diagrama mostra vários valores discrepantes (oiitliers) tanto acima quanto abaixo
das cercas internas. Os valores extremos são: 3, 4, 5, 13 e 14.
(c) A média e o desvio padrão do conjunto de valores acima pode ser obtido com a op
ção Explore (Explorar) do menu Summarize (Resumir): a média é 21,40 e o desvio
padrão é 6,61.
Exercício 2
1. A VI no estudo sobre as drogas é se os estudantes tomam ou n ão drogas durante as aulas
do Dr. Boering.
2. A VD são os resultados obtidos no exame final. Essa é urna variável contínua medida em
uma escala discreta. É contínua porque o conhecimento dos estudantes no assunto testado
é por hipótese contínua. É mais simples medir com o uso de uma escala discreta (%).
562 Christine P. Dancey & John Reidy
2. 0 -
<2
1.5-
‘C
OD
O-
0.0 —i——i——i——i——i——i——i——i——i— N = 10
10.0 2 0 .0 3 0 .0 4 0 .0 5 0.0 6 0 .0 7 0 .0 8 0 .0 90.0
R esultados no exam e final
0.0 J—i——i——i——i——i——i——i——i— N = 10
4 0 .0 4 5 .0 50.0 5 5 .0 6 0 .0 6 5 .0 7 0 .0 75.0
Resultados no exam e final
(a) Alguém pode, talvez, argumentar que os dois conjuntos são aproximadamente distri
buídos de modo normal. Os escores ocorridos com maior freqüência estão no meio
da distribuição e têm caudas acima e abaixo da moda.
(b) Felizmente, as médias e desvios padrões para os dois conjuntos são apresentados
com os histogramas. Normalmente utilizamos o comando Explore (Explorar) para
gerar os dois histogramas e as estatísticas descritivas. A média e o desvio padrão
para os que tomam drogas são 48.5 e 25.83. respectivamente. A média e o desvio pa
drão para os que não tomam drogas são 56.2 e 9,95, respectivamente. Você deve ser
capaz de observar que tomar drogas não causou uma diferença real nos escores, mas
levou a uma variabilidade muito maior nos resultados. O desvio padrão para os que
tomam drogas é aproximadamente 2.5 vezes maior do que o dos que não tomam.
Capítulo 3
Atividade 3.1
Quais desses eventos têm uma probabilidade de 0 (ou muito próxima de 0) e quais tem
uma probabilidade de J (ou muito próxima de 1 )?
■ A noite seguir o dia - 1
■ Todos os políticos nos dizerem a verdade todo o tempo - 0
■ Você achar um cheque de um milhão de libras nas páginas desse livro - 0
■ Um fogo em madeira ser apagado se você colocar água nele - J
■ Autores terem de pedir mais prazo para enviarem manuscritos de livros - 1
Atividade 3.2
Atividade 3.3
Atividade 3.4
Se você tem escores z negativos, estará abaixo da média. Com escores z negativos, a
maioria da população terá escores acima do seu.
564 Christine P. Dancey & John Reidy
Atividade 3.5
Seu escore c de matemática será 1 ((65 - 60)/5). Para inglês, será 0.86 ((71 - 65)/7). Por
tanto. sua melhor matéria, quando comparado aos grupos, é matemática.
Atividade 3.6
Atividade 3.7
Quão confiante podemos estar de que a média da população está entre 1,96 erros padrões
a partir da média da amostra? Podemos ter 95% de confiança.
Suponha que você tenha selecionado uma amostra de 20 pessoas com aracnofobia e ob
tido uma medida do medo de aranhas de cada um. Você constata que o intervalo de confiança
para a média é 1 ,5 a 5,6. O que isso significa? Isso indica que podemos ter 95% de confiança
de que o medo médio populacional de aranhas está entre 1.5 e 5,6.
Se houvessem sido selecionadas 200 pessoas com aracnofobia, o intervalo de confiança
seria mais largo ou mais estreito do que o relatado acima? O intervalo de confiança seria mais
estreito.
Atividade 3.8
Dos diagramas de barras de erro apresentados, somente em (a) e (d) existe uma provável
diferença real entre os grupos.
E xe rcício 7
Sala com isolam ento acústico Sala sem isolam ento acústico
30
20
10 -
■o
u
10 10
Com isolam ento a cú stico Sem isolam ento acústico
SALA DE ESPERA
(a) O diagrama de barras de erro mostra que os escores de ansiedade dos pacientes na
sala de espera com isolamento acústico são consideravelmente menores do que os da
sala sem isolamento. Existe também uma sobreposição dos IC de 95% para as duas
condições,
(b) O escore r para o primeiro valor na condição com isolamento acústico é = 0,88. O
escore ; para o primeiro valor na condição sem isolamento é -1,39.
Exercício 2
1. O estudo conduzido pelo Dr. Doolitle e' um delineamento quase-experimental porque ele
não alocou aleatoriamente os participantes às condições. Estas consistem de categoriais
naturais (gatos e cachorros): dessa forma, ele não pode utilizar uma alocação aleatória.
2 . O delineamento é também entre participantes porque cada animal não pode estar nas duas
condições simultaneamente (ser gato e depois cachorro).
3. As estatísticas descritivas das duas espécies são apresentadas na tabela.
Cachorros Gatos
M éd ia 110,40 102.00
D esv io p ad rão 12.62 14.28
E rro p a d rã o 3,99 4.52
IC de 9 5 % 1 0 1 ,3 7 - 1 1 9 .4 3 9 1 .8 7 - 1 1 2 .2 2
566 C hristine P. Dancey & John Reidy
130 -
.2
U
j ? 120 - ___ ___
a»
c
ai ----------
| 110-
O
ul/t
ai
g 100 -
ro
Q.
LT> ----------
o 90-
-a
y
8 0 ----------------------------------------------------------------------------------------
N= 10 10
G atos C ach orros
Anim al
(a) O diagrama de barras de erro mostra que os cachorros têm um escore de QI mais alto
do que os gatos; entretanto, existe também uma considerável sobreposição dos ICs
de 95% das duas espécies. Isso pode sugerir que de fato não existe uma diferença
real entre as duas espécies. Lembre-se de que esses intervalos de confiança indicam
que estamos 95% confiantes de que a média populacional está dentro do intervalo.
Assim, as médias populacionais podem ser as mesmas.
(b) O escore z para o primeiro valor dos gatos é -0,49. O escore z para o primeiro valor
dos cachorros é -0.44.
Capítulo 4
Atividade 4.1
Atividade 4.2
Atividade 4.3
Se você tem uma probabilidade de 0,005, é provável que uma vez em 200 o resultado
seja obtido por acaso. Se a probabilidade á 0.01, existe uma oportunidade em 100 de que o
resultado ocorra por acaso.
Atividade 4.4
Não podemos, de fato. afirmar, a partir da informação dada, qual das duas descobertas é
mais importante psicologicamente. Lembre-se de que significancia estatística não é o mesmo
que significancia psicológica. Mesmo que o Estudo 2 tenha um valor p bem mais baixo e
possa ter sido obtido de uma grande amostra. Você precisa de mais informação para poder
afirmar qual estudo é mais importante psicologicamente, tais como os tamanhos da amostra
e do efeito.
Atividade 4.5
Quais dos seguintes situações representam um erro do Tipo I e qual um erro do Tipo II?
(a) No seu estudo você descobriu que existe um relacionamento entre a quantidade de
chá ingerido por dia e a quantidade de dinheiro ganho na loteria. Você conclui que
para ganhar na loteria, é preciso tomar muito chá - erro do Tipo I
(b) Você descobriu, em um estudo, que não existe diferença entre as velocidades das
tartarugas e dos leopardos. Você conclui que as tartarugas são tão rápidas quanto os
leopardos - erro do Tipo II
(c) Você verificou, em um estudo, que existe um relacionamento entre modo de vida e
renda anual. No entanto, em virtude de a probabilidade associada ao relacionamento
ser 0,5. você concluiu que não existe relacionamento entre as duas variáveis - erro
do Tipo II
Atividade 4.6
Quais das seguintes hipóteses são unilaterais (unicaudais) e quais são bilaterais (bi-
caudais)?
568 C hristine P. Dancey & John Reidy
(a) Prevê-se que as mulheres apresentam escores de empatia mais altos do que os hu
mens - unilateral
(b) Prevê-se que, à medida que o saiário anual aumenta, também aumenta o número de
tomates consumidos por semana - unilateral
(c) Prevê-se que exista relacionamento entre o comprimento do cabelo dos homens e o
número dc crimes cometidos - bilateral
(d) Prevê-se que os fãs de futebol têm um QI menor que os fãs de ópera - unilateral
(e) Prevê-se que exista um relacionamento entre o número de livros lidos por semana e
a extensão do vocabulário - bilateral
Exercício 1
1. A professora Yob conduziu um delineamento dentre participantes, uma vez que coletou
dados de cada situação nos dois estádios.
2. A professora Yob mediu o número de prisões, uma variável discreta (ninguém pode ser
preso pela metade).
3. (a) A VI nesse estudo é a alteração das condições dos assentos (confortáveis versus des
confortáveis)
(b) A VD é o número de prisões e expulsões dos estádios.
4. A previsão é unilateral porque a professora Yob não apenas previu que haveria diferença
entre os dois estádios, mas também a direção dessa diferença, isto é. nos estádios confor
táveis haveria menos prisões e expulsões.
5. A hipótese nula indicaria que não existe diferença entre os dois estádios em termos do
número de prisões e expulsões.
6. O diagrama de barras de erros será como o seguinte:
9 -|
8 - -------------------------
7-
6 -
sS
m ------------
cr,
QJ 5-
-a
u _______
4-
3-
2 -
1 -
N 12 12
A ssen to s Assentos
desco n fo rtáveis confortáveis
Estatística sem M atem ática para Psicologia 569
E xe rcíc io 2
1. O Dr. Pedante fez um estudo que envolveu um delineamento dentre participantes, uma
vez que comparou o número de infinitivos divididos utilizados pelos autores antes e de
pois da série Jornada nas Estrelas.
2. O Dr. Pedante mediu certo número de infinitivos divididos escritos e, assim, está traba
lhando com uma variável discreta.
3. (a) A VI nesse estudo é antes e depois da primeira apresentação da série Jornada nas Es
trelas.
(b) A VD e o número de infinitivos divididos escritos pelos autores.
4. A previsão é unilateral porque o Dr. Pedante previu a direção da diferença, isto é, o número
de infinitivos divididos seria maior após a exibição da série.
5. A hipótese nula é que não existe diferença entre o número de infinitivos divididos antes e
depois da exibição da série Jornada nas Estrelas.
6. O diagrama de barras do erro será semelhante ao seguinte:
4,0 -|
3.5 -
3,0 -
2.5 -
§,
o 2'°
' "
(ü
■O
y 1 ,5
1,0 -
0,5 -
0 ,0 - I I
N 12 12
Antes da série Depois da série
Jornada nas Estrelas Jornada nas Estrelas
570 Christine P. Dancey & John Reidy
Capítulo 5
Atividade 5.1
E difícil encontrar um relacionamento perfeito, mas você pode ser capaz de pensar ein
vários que não sejam perfeitos.
Atividade 5.2
(10
Atividade 5.3
(b)
Atividade 5.4
Atividade 5.5
Estatística sem M atem ática para Psicologia 571
Atividade 5.6
(d)
Atividade 5.7
(CJ
Atividade 5.8
(a)
Atividade 5.9
Atividade 5.10
1. A correlação entre estigma e qualidade de vida é uma associação negativa fraca a mode
rada (r = -0.32). que pode ter ocorrido por erro amostrai (0.088).
2. Uma vez que a severidade da doença é controlada, a correlação entre estigma e qualidade
de vida se reduz consideravelmente (r = -0,01, p = 0,476), mostrando que o relaciona
mento observado entre estigma e qualidade de vida é quase que totalmente devido ao
relacionamento com a severidade da doença.
Capítulo 6
Atividade 6.1
Atividade 6.2
(C)
Atividade 6.3
Tamanhos do efeito
1. Idade = 0,080
2. Educação = 0,361
3. Pacotes por ano = 0,139
4. Horas de exercício = 0.068
5. Cafeína = 0,053
6. IMC {BMP, = 0,034
7. Álcool = 0.111
Calculados da seguinte forma:
5 8 -5 8 .9 -0 .9
Idade -0.080
1 0 , 6 + 1 1.8 11,2
4 2 .9 -4 9 - 6.1
Pacotes por ano -0,139
43,6 + 44.4 ~44~
2 ,4 - 2.1 0,3
Horas de exercício = 0.068
4,_5 + 3 J 4,4
2 /
3 ,3 -3 .5 -o,;
Cafeína = -0,053
3 ,9 + 3,7 3.8
2 )
19,2-19,3 -0 .2
IMC H --------^ = ------= -0,034
2.6 + 3,3 ^ 2.95
Estatística sem M atem ática para Psicologia 573
0,5 - 0,7 -0 ,2
Á lc o o l : - 0, 1 1 1
1,4 + 2,2 i 1,8
2"
1 3 , 7 - 1 2 . 6 1,1
Educação = 0.361
2.8+ 3.3 3,05
Atividade 6.4
1 . (c)
2 . (a) Embora o sinal não importe: ele pode facilmente ter sido positivo se tivéssemos codi
ficado os grupos em ordem inversa.
Levene's Test
for Equality
of Variances
(Teste de
Levene para
a Igualdade
de Variances) T-test for Equality of Means (Teste t para a Igualdade de Médias)
Sig. = Significancia
2. O tamanho do efeito é o que consta a seguir. As médias e os desvios padrões foram obti
dos das saídas acima.
Episódios de doenças
14,5 -1 2 ,9
= 1,6/8.504 = 0.19
(8.96+ 8,048)/2
Sig. = Significancia
O grupo como um todo teve um desempenho melhor no teste do final do ano (média
15,85) do que no do início (média de 13,40). Essa diferença apresenta uma probabilidade de
apenas 2 ,6% de ter ocorrido apenas devido ao erro amostrai, considerando a hipótese nula
verdadeira.
Capítulo 7
Atividade 7.1
Rosenthal acredita que é mais importante relatar o tamanho do efeito do que a estatística
teste e o valor da probabilidade correspondente.
Atividade 7.2
(c)
Atividade 7.3
(b)
576 Christine P. Dancey & John Reidy
Atividade 7.4
Isso requer que você utilize a Internet para encontrar programas que calculem o poder
Capítulo 8
Atividade 8.1
(c)
Atividade 8.2
Atividade 8.3
(b)
Atividade 8.4
Atividade 8.5
(C )
Atividade 8.6
(b)
Estatística sem M atem ática para Psicologia 577
Atividade 8,7
Exercício 7
Bish e colaboradores utilizaram a correção de Yates. O valor da probabilidade c 0,68.
Exercício 2
E baseado em dados próprios.
Exercício 3
1. 8,25
2. X - 3.48
3. p = 0,32
4. Embora pelos resultados pareça que as pessoas têm uma preferência significativa por certos
animais, resultados mostram um X de- 3,48, indicativo de que é provável que se devam ao
erro amostrai, assumindo que não exista preferência por um animal em particular.
Exercício 4
O valor do X é J -- 6- gl = 1 ■p - 0,26. O relacionamento entre fumar e beber pode ser
explicado pelo erro amostrai apenas. Não existe evidência a partir desse estudo que sugira um
relacionamento entre fumar e beber.
Capítulo 9
Atividade 9.1
Razões pelas quais os escores variam entre grupos: (a) manipulação da variável indepen
dente as pessoas diferem em virtude das diversas condições nas quais estão; ( b ) diferenças
individuais; (c) erro experimental.
Razões da variação dos participantes dentro de uma condição: (a) diferenças individuais
e (b) erro experimental.
Atividade 9.2
(a)
578 C hristine P. Dancey & John Reidy
Atividade 9.3
As diferenças entre as duas médias amostrais para esse estudo é uma estimati\a pontual. Se
repetirmos o estudo com uma amostra diferente, podemos encontrar uma diferença entre as mé
dias ou pouco mais alta ou mais baixa. Os limites de confiança informam que podemos ter 95%
de confiança de que a diferença média populacional está entre os limites inferior e superior.
E xe rcício 1
ANOVA DE UM FATOR
ANOVA
SCORE (ESCORE)
COMPARAÇÕES MÚLTIPLAS
' The mean difference is significant at the .05 level. (* A diferença entre as médias é significativa no nível de 5%.)
Sig. = Significância
A ANOVA mostra que existem diferenças entre algun ; ou em todos os grupos que podem
ser atribuídas ao erro amostrai (F(2, 27) = 12,7; p < 0,001); uma comparação post-hoc de
Tukey mostra que não existem diferenças significativas entre os gaipos da manhã e da tarde.
Entretanto, o grupo vespertino difere dos outros dois grupos.
Estatística sem M atem ática para Psicologia 579
Exercício 2
Sig. = Significancia
Uma inspeção das médias mostrou que as mesmas estavam na direção esperada em to
das as condições. Existe uma tendência decrescente: os participantes que ingeriram placebo
tiveram maiores escores, e os que ingeriram altas doses, e menores escores. Essas diferenças
nos escores são improváveis de serem obtidas apenas por erro amostra!, considerando que a
hipótese nula seja verdadeira (F(2, 13) = 4,28, p = 0,036). Pode-se concluir que, quanto mais
os estudantes fumam maconha, pior será seu desempenho nos testes aritméticos.
Capítulo 10
Atividade 10.1
■ Efeitos principais: A. B, C e D
■ Iniciações: AB. AC. AD, BC. BD, CD, ABC. ABD, AC D, BCD, ABCD
■ Erro
Atividade 10.2
Atividade 10.3
Com referência à Tabela 10.4, não existe sobreposição entre as condições com álcool e
sem álcool e sem cafeína, sugerindo uma diferença real nas populações. Existe uma pequena
sobreposição dos intervalos de confiança para as condições com cafeína, novamente sugerin
do uma possível diferença nas populações. Comparando as condições com e sem cafeína com
a condição sem álcool, existe uma considerável sobreposição nos intervalos de confiança, su
gerindo que talvez não exista uma diferença real na população. Para as condições com e sem
cafeína associada à condição com álcool, entretanto, não existe sobreposição dos intervalos,
sugerindo novamente uma diferença real entre as populações.
Atividade 10.4
Nos gráficos mostrados, (a) e (b) sugerem que uma interação está presente.
Atividade 10.5
Atividade 10.6
As medidas de magnitude do efeito apropriadas para uso com a ANOVA podem ser o r f
parcial e o d.
Estatística sem M atem ática para Psicologia 581
Atividade 10.7
Atividade 10.8
E xe rcício 1
1. O estudo conduzido pela doutora Bod é utn delineamento subdividido do ano em que o
exame foi feito com lima variável entre participantes e o conteúdo envolvido com uma
variável dentre participantes.
2. Umn VI é o ano que o exame foi realizado (1977 ou 1997); a outra VI. o conteúdo envol
vido (inglês ou matemática). A variável dependente é a nota dada pelo examinador em
cada um dos exames.
3. A saída da ANOVA é apresentada abaixo:
SUBJECT Pillai's Trace (Traço de Pillai) .000 ,001s 1,000 22.000 .982 .000
(ASSUNTO) Wilks' Lambda (X. de Wilks) 1.000 ,001s 1.000 22.000 .982 .000
Hotelling's Trace (Traço de Hotelling) .000 ,001s 1.000 22.000 .982 .000
Roy's Largest Root (Maior Raiz de Roy) .000 .001J 1.000 22.000 .982 .000
SUBJECT*YEAR Pillai's Trace (Traço de Pillai) .004 ,088s 1.000 22.000 .769 .004
(ANO*ASSUNTO) Wilks' Lambda (Xde Wilks) .996 ,088s 1.000 22.000 .769 .004
Hotelling's Trace (Traço de Hotelling) .004 ,088s 1.000 22.000 .769 .004
Roy’s Largest Root (Maior Raiz de Roy) .004 .088' 1.000 22.000 .769 .004
ea
Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent
variables is proportional to an identity matrix. (Testa a hipotese nula de que a matriz de covariancia dos erros
da variável dependente transformada e ortonormalizada é proporcional a urna matriz identidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected test are
displayed in the Tests of Within-Subjects Effects table, (a. Pode ser utilizado para ajustar os graus de liberdade para
o teste de significancia ponderado. Testes Corrigidos são mostrados na tabela dos Efeitos dos Testes Dentre Sujeitos.)
b. Design: Intercept+YEAR (b. Projeto: Intercepto-ANO)
Within Subjects Design: SUBJECT (Delineamento: Dentre Tópicos: CONTEÚDO)
Sig. = Significancia
Sig. = Significancia
Estatística sem M atem ática para Psicologia 583
Intercept
(Intercepto) 151762.521 1 151762.521 2262.107 .000 .990
YEAR (ANO) 391.021 1 391.021 5.828 .025 .209
Error (Erro) 1475.985 22 67.089
Sig. = Significancia
5. Essas análises mostram que somente o efeito principal do ano é provavelmente náo-atri-
buível ao erro amostrai, se a hipótese nula for verdadeira. O efeito principal dos conteúdos
e da interação apresentam probabilidades associadas, sugerindo que podem ser atribuídos
ao erro amostrai.
6. Podemos ver a partir dos resultados da ANOVA que o iy parcial para o efeito principal
do ano (0.209) é muito maior do que o ry parcial para o efeito principal dos conteúdos
(0,000) e para a interação (0,004).
E xe rcício 2
5. Os valores p mostrados acima sugerem ser improvável que o efeito principal da idade e
do gênero e a interação entre essas duas variáveis independentes tenham ocorrido por erro
amostrai se a hipótese nula for verdadeira,
6. Os r f parciais para o efeito principal da idade do gênero e da interação são 0,196, 0,526 e
0,162, respectivamente. Assim, a magnitude do efeito devido ao gênero é grande.
7. A interação pode ser examinada utilizando testes t individuais. Os resultados de tais aná
lises são apresentados a seguir:
Estatística sem M atem ática para Psicologia 585
TESTE T
GENDER = BOYS (GÊNERO = MENINOS)
Esses testes t mostram que. para os meninos, não existe diferença nos escores da percepção
de cores entre os 5 e os II anos de idade, além daquela que poderia ser atribuída ao erro amostrai
(/(22) = -0.21, p = 0.824). A diferença na percepção de cores entre as meninas de 5 e 11 anos de
idade provavelmente não se deve, entretanto, ao erro amostrai (/'(22) = -5,59. p < 0,001).
Capítulo 11
Atividade 11.1
A análise correlacionai fornece uma medida de quão próximo estão os pontos de uma
linha imaginária (r). Com a regressão linear, a linha real é traçada entre os pontos, de forma
que o erro total seja mínimo. A linha adere aos dados da melhor forma possível. A linha pode.
portanto, ser utilizada para determinar quanto o y irá mudar, como resultado de uma alteração
em x.
Atividade 11.2
5 + (2*20) = 5 + 40 = 45
' Em bora exista som ente um efeito significativo da área, o v a lo r/> para o C A R R I S IV (0.052) está próxim o ao critério tradicional
para a significância: assim , você provavelm ente quer discutir o efeito principal.
‘ E difícil dizer a partir do gráfico se existe um a interação definitiva. Você provavelm ente vai qu erer olhar a análise para chegar a uma
decisão sobre isso. Se. entretanto, você olhar para a diferença vertical entre os dois pontos no final do lado esquerdo d as linhas e
com pará-la com a diferença do final do lado direito da linha, poderá perceber um a interação.
Estatística sem M atem ática para Psicologia 587
Atividade 11.3
A linha no segundo diagrama irá prever melhor, uma vez que os pontos no diagrama (b)
estão mais próximos da linha do que os pontos no diagrama (a).
Atividade 11.4
1. (a)
2 . (b)
Atividade 11.5
(C )
Atividade 11.6
Exercício 7
O pesquisador quer descobrir se a ansiedade sobre um teste está relacionada ao número
de horas de estudo - talvez as pessoas ansiosas estudem menos (porque estudar aumenta a
ansiedade) ou talvez, pela ansiedade, estudem mais. O coeficiente de correlação entre as duas
variáveis foi moderado (0.35). O R ajustado (0,055) mostrou que somente uma pequena parte
da variação nas horas estudadas pode ser atribuída à ansiedade. O valor F de 1,822 tem uma
probabilidade associada de 0.20. A inclinação da linha de regressão foi de 0,0393. Os limites
de confiança em torno da linha foram de -0,236 a 1,021. Assim, não podemos ter segurança
de que a linha populacional tenha inclinação positiva ou negativa. Não existe evidência, en.
tão, sugerindo que a ansiedade e o número de horas de estudo estejam relacionadas.
Exercício 2
O professor Limão quer saber se suporte social e personalidade podem prever a satisfação.
O suporte e a personalidade combinados mostram um relacionamento forte com a satisfação
(0,90). O R: ajustado indica que 78% da variação na satisfação podem ser explicados pelas
variações no suporte e na personalidade. O valor F de 35,29 mostra que é improvável que esse
resultado tenha sido obtido apenas por erro amostrai, caso a hipótese nula seja verdadeira (p
< 0,001). As duas variáveis, então, contribuem para a previsão da satisfação. Para cada au
mento de um desvio padrão no suporte social, a satisfação aumenta 0,73, e para cada aumento
na personalidade, a satisfação aumenta 0.38. Assim, tanto a personalidade quanto o suporte
social contribuem fortemente para a satisfação.
588 C hristine P. Dancey & John Reidy
Capítulo 12
Atividade 12.1
Atividade 12.2
Os nomes possíveis são: medroso, agitado, temeroso. Você pode ter outros.
Atividade 12.3
Atividade 12.4
Três nomes possíveis são (1) qualidade de vida. (2) felicidade. (3) tristeza. Você prova
velmente pode pensar em outros nomes mais apropriados.
Atividade 12.5
Atividade 12.6
Atividade 12.7
Atividade 12.8
Perfeição e ineficiência mostram uma associação moderada com o Fator 1, que foi deno
minado de dor física e desconforto. O fator denominado de flatulência não mostra qualquer
associação importante com as variáveis de desordem alimentar, enquanto o fator que represen
ta o vômito apresenta. O vômito apresenta uma relação positiva moderada com ineficiência,
bulimia e discrepância de peso.
Atividade 12.9
(a)
1 2 3
1 - 30 50
2 - 80
3
(D
Capítulo 13
Atividade 13.1
(b)
Atividade 13.2
(c)
590 C hristine P. Dancey & John Keidy
Atividade 13.3
(a)
Atividade 13.4
(a)
I. O diagrama de dispersão m ostra que as lin has para todos os três grupos são p aralelas;
assim, as condições da ANCOVA estão satisfeitas.
Capítulo 14
Atividade 14.1
Dos estudos descritos, (b) c (c) são apropriados para serem analisados por meio de uma
MANOVA.
Estatística sem M atem ática para Psicologia 591
Atividade 14.2
Atividade 14.3
Atividade 14.4
Atividade 14.5
(a) Apropriado
(b) Apropriado
(c) Apropriado
(d) Inapropriado
E.\ercício 1
1. A suposição de homogeneidade das matrizes de variâncias-covariâncias é testado utili
zando o teste M de Box. Os detalhes são apresentados abaixo:
M de Box 2,246
F 0,675
gii 3
gl2 87120
Sig. 0,567
Se o valor p associado com o M de Box é menor do que 0 05, temos uma violação da
suposição das matrizes de variâncía-covariância. Nesse caso o valor p é bem maior do que
0,05, portanto não temos uma violação dessas suposições.
Intercept Pillai's Trace (Traço de Piilai) .973 384.38 1 2.000 21.000 .000 .973
(Intercepto) Wilks' Lambda (/. de Wilks) .027 384.381 * 2.000 21.000 .000 .973
Hotelling's Trace .973
36.608 384.381 ■ 2.000 21.000 .000
(Traço de Hotelling)
Roy's Largest Root .973
36.608 384.381' 2.000 21.000 .000
(Maior Raiz de Roy)
FUEL Pillai's Trace (Traço de Piilai) .386 6.598' 2.000 21.000 .006 .386
(COMBUSTÍVEL) Wilks' Lambda (A. de Wilks) .614 6.598-’ 2.000 21.000 .006 .386
Hotelling's Trace
.628 6 .5 9 8 ’ 2.000 21.000 .006 .386
(Traço de Hotelling)
Roy's Largest Root
.628 6 .5 9 8 ! 2,000 21.000 .006 .386
(Maior Raiz de Roy)
Levene’s Test of Equality of Error Variance3 (Teste de Levene para a Igualdade das Variâncias dos Erros3)
O teste F univariado sugere que somente o número dc quilômetros por litro contribuiu
para a diferença multivariada. Se ajustarmos o valor a global para 0,05, precisaremos
dividi-lo por 2 apenas porque fizemos somente dois lestes univariados. Precisamos ain
da verificar os valores p associados com cada um dos testes univariados para ver se são
menores do que 0,025. Se isso ocorrer, podemoí. estar razoavelmente confiantes de que
contribuem para a diferença multivariada. Nesse caso, somente o número de quilômetros
por litro apresenta um valor p dentro dessa região, e, assim, apenas uma VD está contri
buindo para diferença multivariada.
5. A análise correlacionai é apresentada abaixo e sugere que não existe conrelação entre as
duas variáveis além daquela que poderia ocorrer devido ao erro amostrai.
594 C hristine P. Dancey & John Reidy
CORRELAÇÕES
Correlations (Correlações)
Engine condition Number of km per litre
(Condição do motor) (Número de km/l)
Engine condition Pearson Correlation 1.000 .164
(Condição do motor) (Correlação de Pearson)
.443
Sig. (2-tailed)
(Sig. Bilateral) 24 24
N
Number of km per litre Pearson Correlation .164 1.000
(Número de km/l) (Correlação de Pearson)
.443
Sig. (2-tailed)
(Sig. Bilateral) 24 24
N
Sig. = Significancia
6. O tamanho do efeito para cada VD é mostrado com a análise univariada. O rf para o consumo
de combustível é 0,39 e da condição do motor é 0,02. Isso sugere que, quando o consumo de
combustível é a VD na análise univariada, 39c/c da variação no consumo de combustível e' atri
buído a diferenças no tipo de combustnei. Quando a condição do motor é a VD, somente 2c/c
da variação na condição do motor é de responsabilidade da diferença do tipo de combustível.
Exercício 2
1. A análise multivariada para o estudo das bebidas é apresentada abaixo:
!. Essas análises mostram que existe uma diferença mukivariada entre as duas bebidas, ale'm
da que pode ser atribuída ao erro amostrai. O valor F é 7,516, com uma probabilidade
associada de p = 0,010 .
2. A decisão sobre como avaliar a contribuição relativa de cada VD individual para a di
ferença multivariada depende de haver ou não correlação entre elas. Os coeficientes de
correlação para as variáveis dependentes são apontados abaixo.
CORRELAÇÕES
CORRELAÇÕES
Sig. = Significancia
Essa análise correlacionai mostra que não existem correlações além das que podem ser
atribuídas ao erro amostrai entre o sabor e os efeitos prazerosos da bebida leve e o sabor e os
efeitos prazerosos da nova bebida (Levorte). Podemos utilizar os testes univariados da saída
da MANOVA para examinar a contribuição relativa de cada VD para a diferença multivaria
da, Essa saída é apresentada a seguir:
596 Christine P. Dancey & John Reidy
3. Esses testes univariados sugerem que somente o sabor contribui para a diferença multi-
variada entre as duas bebidas. A diferença observada entre os efeitos prazerosos das duas
é provavelmente decorrência do erro amostrai (p 0,509). A diferença entre os sabores
não é provavel mente devida ao erro amostra] (/; = 0,002), sugerindo que os homens jovens
preferem o sabor da Levorte do que o da leve.
Capítulo 15
Atividade 15.1
(a) A correlação mais forte é a observada entre dor indefinida e número de partos (0,39).
(b) O valor da probabilidade para a correlação mais fraca (pressão aguda e número de
partos, 0,04) é p = 0,80.
Atividade 15.2
Whitney foi de 3,5. com uma probabilidade associada (unilateral) de 0,018. A probabilidade
de esse resultado ter ocorrido devido ao erro amostrai, caso a hipótese nula seja verdadeira,
é menor do que 2 %.
Atividade 15.3
Existe uma diferença entre os escores das duas condições - o valor p bilateral foi 0,043.
A probabilidade desse resultado ter ocorrido devido ao erro amostrai, caso a hipótese nula
seja verdadeira, é menor do que 5%.
Atividade 15.4
Parece que as previsões dos pesquisadores foram confirmadas - o posto médio para a
condição 3 (5.8) é menor do que o posto médio da condição 1 (10.25) e da condição 2 (9,10).
A probabilidade de esse resultado ser decorrência do erro amostrai, entretanto, é maior do
que a que estamos dispostos a aceitar (p = 0,274).
Atividade 15.5
A depressão parece ter aumentado sobre os três pontos no tempo (posto médio 1,31. 1,88
e 2,81). O valor do qui-quadrado é 12,25. A probabilidade de esse valor ter ocorrido devido
ao erro amostrai, dado que a hipótese nula seja verdadeira, é 0,002. Concluímos que as pes
soas que não quiseram tomar parte no programa de intervenção comportamental se tornaram
significativamente mais depressivas com o tempo.
CONFID
ORAL (ORAL) (CONFIANÇA)
Spearman's rho Correlation Coefficient
ORAL (ORAL) 1.000 -.8 7 2
(p de Spearman) (Coeficiente de Correlação)
Sig. (1 -tailed)
.027
(Sig. Unilateral)
N 5 5
N 5 5
Sig. = Significância
SCORE (ESCORE)
Mann-Whitney 5.00
Wilcoxon 26.000
Z -2.131
Asymp. Sig. (2-tailed)
(Significância Assintótica Bilateral) .033
Como a psicóloga conferencista não fez uma previsão de qual abordagem seria mais
agradável para os alunos, ela utilizou um nível de significância bilateral.
O grupo ABP (aprendizagem baseada em problemas) obteve resultados melhores do
que o grupo tradicional (U = 5, c = -2.13, p = 0.041). Seu pequeno estudo piloto mostrou
que pode valer a pena utilizar a abordagem ABP com alunos cursando um módulo de esta
tística avançada.
Exercício 3: Wilcoxon
Ranks (Postos)
Sum of the
Mean Rank Ranks (Soma
N (Posto Médio) dos Postos)
after the programme - before the programme Negative Ranksa
(antes do programa - depois do programa) (Postos Negativos3) 5 3.00 15.00
Positive Ranksb
(Postos Positivos0) 0 .00 .00
Ties (Empatesc) 1
Total 6
a. after the programme < before the programme (a. após o programa < antes do programa)
b. after the programme > before the programme (b. após o programa > antes do programa)
c. after the programme = before the programme (c. após o programa = antes do programa)
Estatística sem M atem ática para Psicologia 599
Os níveis de medo foram reduzidos após o programa (z = 2.12,p = 0,031). Pode ser ob
servado, que o posto médio antes do programa (3,00) foi reduzido para zero após o mesmo.
Um escore z de 2,12 tem menos de 2% de probabilidade de ter surgido devido ao erro amos
trai, caso a hipótese nula seja verdadeira (hipótese unilateral). Podemos concluir, então, que
o programa foi efetivo na redução do medo.
KRUSKAL-WALLIS
Ranks (Postos)
Mean Rank
GROUP (GRUPO) N (Média dos Postos)
2.00 6 9.50
3.00 7 9.29
Total 18
2.00 6 9.42
3.00 7 12.00
Total 18
df (gl) 2 2
Os postos são muito semelhantes nos três grupos com respeito ao Sintoma J. O valor do
qui-quadrado de 0.029 tem uma probabilidade associada de 0,986 - esse resultado pode ser
atribuído ao erro amostrai. Concluímos que não existe diferença significativa entre os três
grupos quanto ao Sintoma 1.
600 C hristine P. Dancey & John Reidy
Para o sintoma 2, os postos apresentam menos semelhanças a média dos postos para o
grupo 3 é 12,00. enquanto que para o grupo 1 é 6,00. Para essa análise o valor do é 3,7 e a
significância associada é 0,157. Isso significa que existe uma probabilidade de 15,7% de que
o resultado tenha sido devido ao erro amostrai, assumindo que a hipótese nula seja verdadei
ra. Assim, conclui-se que não existe diferença significativa entre esses dois grupos.
E xe rcício 5 : Friedm an
Ranks3 (Postos“)
Mean Rank
(Média dos Postos)
N 10
df (gl) 2
Tabela de rpara zr
r zr r zr r zr r 7T r zr
0.0000 n .iK H i 0.2000 0.203 0.4000 0.424 0.6000 0.693 0.8000 1,099
0.0050 1MH15 0.2050 0.208 0.4050 0.430 0.6050 0.701 0.8050 1.1 13
0.0100 0.010 0.2100 0,213 0.4100 0,436 0.6100 0.709 0.8100 1.127
0.0150 0.015 O.2150 0.218 0.4150 0.442 0.6150 0.717 0.8150 1.142
0.0200 0.020 0.2200 0.224 0,4200 0.448 0,6200 0.725 0.8200 1.157
0.0250 0.025 0.2250 0.229 0.4250 0.454 0.6250 0.733 0,8250 1.172
0.0300 0.030 0.2300 0.234 0.4300 0.460 0.6300 0.741 0.8300 1.188
0.0350 0.035 0.2350 0.239 0.4350 0.466 0.6350 0.750 0.8350 1.204
0.0400 0.040 0.2400 0,245 0.4400 0,472 0.6400 0.758 0,8400 1,221
0.0450 0.045 0.2450 0.250 0.4450 0,478 0,6450 0.767 0.8450 1.238
0.0500 0.050 0.2500 0.255 0.4500 0.485 0.6500 0.775 0.8500 1.256
0.0550 0.055 0.2550 0.261 0.4550 0,491 0.6550 0.784 0,8550 1.274
0.0600 0.060 0.2600 0.266 0.4600 0,497 0.6600 0.793 0.8600 1.293
0.0650 0.065 0.2650 0,271 0.4650 0.504 0.6650 0.802 0,8650 1.313
0.0700 0.070 0.2700 0.277 0.4700 0.510 0.6700 0.81 1 0.8700 1,333
0.0750 0.075 0.2750 0.282 0.4750 0.517 0.6750 0,820 0.8750 1.354
0.0800 0.080 0.2800 0.288 0.4800 0.523 0.6800 0.829 0,8800 1.376
0.0850 0.085 0.2850 0.293 0,4850 0.530 0.6850 0,838 0,8850 1.398
0.0900 0.090 0.2900 0.299 0.4900 0,536 0.6900 0.848 0.8900 1,422
0.0950 0.095 0.2950 0.304 0.4950 0,537 0.6950 0.858 0.8950 1.447
0.1000 0.100 0.3000 0.310 0.5000 0.549 0.7000 0,867 0.9000 1,472
0.1050 0.105 0.3050 0.315 0.5050 0.556 0,7050 0.877 0,9050 1.499
0.1100 0.110 0.3100 0.321 0.5100 0.563 0.7100 0.887 0,9100 1.528
0.1150 0 .116 0.3150 0.326 0.5150 0.570 0,7150 0.897 0.9150 1.557
0. i 200 0.121 0.3200 0,332 0.5200 0.576 0.7200 0.908 0.9200 1.589
0.1250 0 ,126 0.3250 0.337 0.5250 0,583 0.7250 0.918 0,9250 1,623
0.1300 0.131 0.3300 0,343 0,5300 0,590 0.7300 0.929 0.9300 1,658
0 .1350 0.136 0.3350 0.348 0.5350 0.597 0,7350 0.940 0.9350 1.697
0.1400 0,141 0.3400 0.354 0,604
CO
0,5400 0.7400
f"'
0,950 0.9400
0.1450 0.146 0.3450 0.360 0,5450 0,61 ! 0,7450 0,962 0,9450 1,783
0.1500 0,151 0,3500 0.365 0.5500 0.618 0.7500 0.973 0,9500 1.832
0.1550 0.156 0.3550 0.371 0.5550 0.626 0,7550 0.984 0,9550 1,886
0,1600 0,161 0.3600 0.377 0,5600 0.633 0,7600 0.996 0,9600 1.946
0.1650 0,167 0.3650 0.383 0.5650 0,640 0,7650 1.008 0,9650 2.014
0.1700 0,172 0.3700 0,388 0.5700 0,648 0.7700 1,020 0,9700 2.092
0.1750 0,177 0,3750 0.394 0.5750 0,655 0.7750 1.033 0,9750 2.185
0.1800 0,182 0.3800 0.400 0,5800 0,662 0.7800 1.045 0.9800 2.298
0.1850 0.187 0.3850 0.406 0.5850 0.670 0.7850 1.058 0.9850 2.443
0.1900 0.192 0.390(1 0.412 0.5900 0.678 0,7900 1.071 0,9900 2.647
0,1950 0,198 0.3950 0.418 0.5950 0.685 0.7950 1.085 0.9950 2,994
abuso sexual, estudo das reações ao 243 independente e relacionada 301 302
acomodação dos estudantes, estudo da 440 significado de 3 0 1-303
Aitken. M 30-31 tabela resumo 408-411
Alexander. B. 422-424. 431-432,441 terminologia 333-334
alfa ( a) - ver valor p um fator 307-310
álgebra matricial 431 veja também A N O VA fatorial: análise multivariada de
alocação aleatória 34-35 variância
amamentação, estudo da 527 análise exploratória de dados (A E D ) 70
amostras 56-58 análise multivariada de variância (M AN O VA) 487-516
representativas 57-58 delineamento dentre participantes 504-515
análise correlacionai 178.400 lógica da 488-491
bivariada 178-205 razões para o uso da 488
de variáveis dependentes 498-500 suposições subjacentes 490-496
delineamentos para 30-33 utilizando o SPSSPW 502-515
objetivos da 178-180 análise post-lwc de variáveis dependentes individuais 497-499
padrões na 212-213. 420 ANOVA fatorial 331-333
primeira e vegunda ordens 205-212 ansiedade, estudo da 30-34
tirando conclusões da 178-179 armazenamento de dados (SPSSPW ) 43-44
análise da diferença entre dois grupos 220-221 Ashley, M. J. 5 5 1
análise de componentes principais (A C P I 421-423.4 3 9 ,443 atípicos 77-78, 412-413
451 atralividade de formas corporais, estudo da 364
diferença com a análise de fatores 421-423
Attree, E . A. 480-481
análise de covariancia (A N C O V A l utilizando o SPSSPW
aumento da janela ativa 40-41
473-476
autovalores 435-436,447
análise de fatores 420-452
cargas das variáveis 427-429. 442
Benninghoven. D. 293
como distinta da análise de componentes principais 4 2 1-
bigodes 75-78
423
Bish. A. 291-293
conceito da 425-427
bulimia nervosa, estudo da 293
diagramas de variáveis 432-434
Byrne. A . 547
passos na execução da 435-437
propósito da 420-422
uso na psicometria 422-424 caixa
análise de regressão 381-415 de diálogo W eight cases (Ponderar casos) (S PSSPW ) 2’ 5.
objetivo da 381-382 277-278
utilizando o SPSSPW 39-403 de diálogos Define groitps (SPSSPW ) 232-233
analise de variância (A N O VA) 300-323. 4 0 1 de diálogos do qui-quadrado (SPSSPW ) 274
alternativas a 542-550 Dependem list (SPSSPW ) 66-68
análise inicial 334-335 post-lwc (SPSSPW ) 308-309
com dois fatores dentre participantes 356-367 cargas de variáveis 427-429
com dois fatores entre participantes 349-356 negativas 442
com mais de uma variável independente 329-348 caudas de uma distribuição 160-164
com um fator entre e um dentre participantes 366 375 causação 32-34. 178, 179-180,381-382
delineamento de medidas repetidas 315-321 coeficiente de correlação (/') 185-187
dois fatores 548-550 intervalo de confiança em torno 204
hipóteses subjacentes ao uso da 300 obtido com o uso do SPSSPW 192-194
índice 605
escores - 111- 112, 115-117, 222-223. 542 Hovvell, D. C. 257-259, 311-312. 340-341
tabelados 601-604 Huff.D. 178-179
escrevendo os resultados 102-103, 347-348, 363. 373, 392.
479. 4X2. 499-501. 511. 533. 541. 545-546
imagem dos adolescentes, estudo da 439
esfericidade 300. 318-319. 356, 358. 368
índice de Intensidade Total de Dor (ITD ) 527
espaço /i-dimensional 427
infecção por H1V. estudo da 533-534, 542
estatística (significado estrito do termo) 57-58
instrutor de resultados (SPSSPW) 137-139
estatística intervalos de confiança 120-121. 227. 259-262.401-403
amplitude 89-91 apresentação dos 149-151
inferencial 57-58. 110-111. 220, 267 e a proporção da variância explicada 196-198
qui-quadrado ( x l 286 e o erro padrão 126-128
estatísticas em torno da média 221 -222. 261 -262
multivariadas 420 em torno de outras estatísticas 137-138
nâo-paramétricas 524-552 em torno do coeficiente de correlação 204
estatísticas descritivas 57-58 obtidos com o uso do SPSSPW 128-131
e o teste de Mann-Whitney 528-530 sobrepostos 132-136
e o teste de Wilcoxon 537 inválidos crónicos, estudo dos 241-242. 435
para delineamentos entre dois grupos 221
relatando 102-103 jogadores de rtigbi. estudo dos 501
uso na ANOVA 309-312, 349-351
estimativa por intervalo 120-121. 227
Kebell. M. R. 321-322
estimativa por ponto 120-121, 221, 227. 261-262
Keogh. E. 321-322
eta ao quadrado parcial (r|') 346-347, 363. 372-373
Ketterer. M. W. 236-237
experimento verdadeiro
Khoshaba. D. M. 501
explicação da variância veja variância
Konradth. U. 414
extremos ver atípicos
Kraemer, H. C. 258-259
Christine P. Dancey Estatística sem matemática para psicologia apresenta descrição acessível dos
conceitos e das técnicas estatísticas fundamentais necessárias aos estudantes <
John Reidy pesquisadores de psicologia. Esses conceitos são explicados de forma clara e ser
referência a fórmulas. Os autores oferecem exercícios, atividades e questões de
múltipla escolha para a prática do conhecimento e das habilidades. A utilizaçã
do SPSS para Windows’" (SPSSPW) na realização de análises estatísticas é explicad
detalhadamente e em plena integração com todo o texto. 0 livro também oferec
orientação abrangente para a interpretação e apresentação dos dados gerados
pelo programa. E mais: