Escolar Documentos
Profissional Documentos
Cultura Documentos
Investigação
Científica
1º Semestre – 1º Ano
Mestrado
2022/2023
Inês Matias
1
Avaliar o índice de experiências
O processo de investigação traumáticas em presos preventivos vs.
Para responder a questões interessantes precisamos de dados. Qual foi a experiência deles, que insights tem dos eventos
traumáticos que passaram
Quando trabalhamos com números, com construtos
mensuráveis – Métodos Quantitativos → grande nº de dados
e participantes para obter dados representativos da pop. É um O início do processo de investigação
tipo de estudo mais superficial. Data Initial Observation (Research Question)
Quando trabalhamos com linguagem ou discursos, perceções, Com base num tema que nós gostamos, no que é que é útil e para
quem é que é útil
experiências – Métodos Qualitativos → amostra menor, mas
com um processo mais moroso, com entrevistas, focus group. Generate theory
Identify variables Generate hypothesis Measure variables H0, hipótese nula, é especificada como a ausência de efeito (ausência
de diferença entre grupos, ausência do fenómeno).
Estudos exploratórios tendem a ser qualitativos, são muito preliminares, não há grande teoria que
suporte .
Teoria: é um princípio geral hipotetizado ou conjunto de princípios que explicam factos conhecidos
acerca de um tópico e a partir da qual se podem gerar novas hipóteses.
Variáveis: aquilo que queremos medir, qualquer coisa que pode ser medida e pode diferir:
2
• No espaço – Taxa de desemprego em Portugal ou na Índia
Variável Independente (VI) e Variável Dependente (VD) são conceitos muito ligados a métodos
experimentais – estudos onde se manipula a causa.
Neste caso, podemos usar métodos correlacionais e em vez de VI e VD será preferível falar de
Preditor(es) e Outcome(s)/Resultado(s)
Em suma:
• Variável Independente: uma variável pensada para ser a causa de um efeito. Este termo é
geralmente usado na investigação experimental para nos referirmos a uma variável
manipulada na investigação
• Variável Dependente: uma variável pensada para ser afetada por mudanças na variável
independente. Podemos pensar nesta como um outcome/resultado
• Variável Preditora: uma variável pensada para predizer uma variável de outcome/resultado.
3
8. Divulgação dos resultados
Questões de investigação
É a pergunta em torno da qual se centra uma investigação, é a estrutura para tudo o resto
Deve ser:
• Clara: fornece especificações suficientes para que o seu público possa facilmente compreender o
seu propósito sem precisar de explicações adicionais
Clareza:
Que medidas devem tomar os sítios de redes sociais como o MySpace e o Facebook
para proteger as informações pessoas e a privacidade dos utilizadores?
• Focada: é suficientemente especifica para poder ser respondida minuciosamente no espaço que a
tarefa de escrita permite
Foco:
• Complexa: Não se responde com um simples “sim” ou “não”, mas requer síntese e analise de
ideias e fontes, antes da composição de uma resposta
Complexidade:
• Discutível: as suas respostas potenciais são abertas ao debate e à reflexão e não factos aceites
4
Passos para o desenvolvimento de uma questão de investigação 1. Escolha um tema geral
interessante: escolha um tópico amplo sobre o qual gostaria genuinamente de saber mais
2. Faça alguma pesquisa preliminar sobre o seu tema geral: faça algumas pesquisas rápidas em
revistas atuais sobre o tópico para ver o que já foi feito e para ajudar a restringir o seu foco.
Que questões estão os investigadores/as a discutir, quando se trata do seu tópico? Que
questões lhe ocorrem ao ler estes artigos?
3. Considere o seu público: Para a maioria dos artigos, o público será académico, mas tenha
sempre em mente o seu público ao desenvolver a sua pergunta. Estaria esse público
interessado na pergunta que está a desenvolver?
4. Comece a fazer perguntas: tendo em consideração o exposto, comece a fazer-se perguntas
abertas “como” e “porquê” sobre o seu tópico 5. Avalie a sua pergunta em função dos critérios
anteriores
a. A pergunta de investigação é clara?
b. A pergunta de investigação está focada?
c. A pergunta de investigação é complexa?
6. Comece a investigação: Depois de formulada a pergunta, pense nos possíveis caminhos que a
pesquisa poderia tomar. Que fontes deve consultar ao procurar respostas para a sua pergunta?
Que processo de pesquisa irá garantir que encontrará uma variedade de perspetivas e respostas
à sua pergunta?
•A ansiedade face a exames está relacionada com •A ansiedade face a exames está associada à
a dificuldade da matéria em avaliação? dificuldade da matéria em avaliação.
5
b. Diferenças entre 2 (ou mais grupos numa determinada variável;
Tópico de investigação: Impacto da violência conjugal, competências socio emocionais das crianças
Hipótese:
H1: A violência conjugal entre cuidadores impacta o desenvolvimento socio emocional em crianças
que frequentem o primeiro ciclo.
Correção: delimitar crianças por idade cronológica e não por ano escolar.
6
Tipos de Investigações
Antes de começar o trabalho, é preciso decidir como projetar o estudo, que tipo de estudo vamos fazer.
↓
O design da investigação refere-se à estratégia geral para integrar os diferentes componentes do
estudo de maneira coerente e lógica, garantindo assim que a questão de investigação será efetivamente
explorada.
↓
Constitui o modelo para a recolha e análise de dados. Os tipos de estudos dão-nos o mapa para
assegurar a consistência do trabalho.
↓
O problema ou questão de investigação determinam o tipo de design - não o contrário, não partimos do
design para o tema! É a partir da questão de investigação que escolho o design de modo a chegar à
resposta que pretendo.
↓
Um erro comum cometido nos estudos é serem iniciados muito cedo, antes de se pensar criticamente
sobre quais as informações necessárias para responder à questão de investigação, p.e., qual a
metodologia mais adequada, o que pode comprometer a validade geral do estudo.
Tipos de Investigação
Investigação-ação Histórico
Causal Meta-análise
Coorte Misto
Transversal Observacional
Descritivo Filosófico
Experimental Sequencial
Os tipos de estudos não são, na sua maioria, mutuamente exclusivos (com a exceção do transversal e o
longitudinal).
7
Design de investigação-ação
Definição e objetivo
• É adotada uma postura exploratória, na qual se desenvolve a compreensão de um problema e o
plano contempla alguma forma de intervenção. Não estamos unicamente a investigar, há uma
componente de intervenção.
8
• É frequentemente usado para restringir um campo muito amplo de pesquisa a um ou alguns
exemplos facilmente pesquisáveis ou paradigmáticos. Temos uma realidade que achamos
possível ser bem compreendido em profundidade através de 1 pessoa paradigmática, i.e. que
represente explicitamente e bem a população/ fenómeno em questão
• Pode ser útil para testar se uma teoria ou um modelo específicos se aplicam realmente a
fenómenos no mundo real.
• Pode ser útil quando se sabe muito pouco sobre um problema ou fenómeno
Design causal
Definição e objetivo
• Trata-se da compreensão de um fenómeno em termos de formulações do tipo: "Se X, então Y." -
procura da relação entre duas variáveis
• É usado para medir o impacto que uma mudança específica terá sobre normas e suposições
existentes.
9
• Grande parte das ciências sociais procuram explicações causais que reflitam testes de hipóteses,
nomeadamente a variação num fenómeno - variável independente - resultar, em média, na
variação de outro fenómeno - variável dependente.
Design experimental
Definição e objetivo
• Comparação entre dois grupos
• Orienta-se por um plano do procedimento que visa manter o controle sobre todos os fatores que
podem afetar o resultado de uma experiência. • É frequentemente usado quando há uma relação
causal e consistência nessa relação (a causa precede o efeito e resulta sempre no mesmo efeito) e a
magnitude da correlação é grande.
10
Em termos éticos não é justo por uma questão de sorte que as pessoas dos grupos de
controlo não possam ter acesso a uma intervenção que se prova ser benéfica. Após os
estudos deve-se então perguntar se o grupo de controlo quer passar por essa intervenção.
Design Longitudinal
Definição e objetivo
• Um estudo longitudinal segue a mesma amostra ao longo do tempo, em vários momentos e faz
observações repetidas, para perceber se há alguma mudança e qual a evolução do fenómeno.
Por exemplo, o mesmo grupo de pessoas é entrevistado em intervalos regulares, permitindo
que o estudo acompanhe as mudanças ao longo do tempo e as relacione com variáveis que
podem explicar as mudanças ocorridas.
11
2. Permitem a aproximação ao tipo de explicações causais geralmente só atingíveis com estudos
experimentais.
3. Permite a medição de diferenças numa variável de um período para outro [ou seja, a descrição
dos padrões de mudança ao longo do tempo].
Design Transversal
Definição e objetivo
• Estudos transversais têm três características distintivas:
o sem dimensão de tempo;
o foco nas diferenças existentes em vez das mudanças após intervenção; o e, os grupos
são selecionados com base nas diferenças existentes, em vez de aleatoriamente.
• O projeto transversal só pode medir as diferenças entre pessoas ou fenómenos, e não processos
de mudança. Como tal, estes projetos têm de ser cautelosos ao fazer inferências causais com
base nos resultados.
12
5. Como geralmente usam técnicas de inquérito para recolher os dados, são relativamente baratos e
rápidos.
Design Exploratório
• Um estudo exploratório aplica-se quando há poucos ou nenhum estudo anterior para se referir ou
confiar para prever um resultado, ou quando as questões de investigação estão numa fase
preliminar. Estou a começar a estudar um determinado tema para que estudos futuros possam
estudar de forma mais robusta esse tema.
• Foco: obter insights e conhecimento base para investigações posteriores. • Decidir como melhor
prosseguir no estudo ou que metodologia se revela mais eficaz a recolher a informação pretendida.
13
5. Na área política ou na aplicação à prática, estudos exploratórios ajudam a estabelecer
prioridades de pesquisa e a definir onde os recursos devem ser alocados – onde é mais
pertinente intervir e investir.
• Não é uma revisão tradicional da literatura, mas um estudo independente que explora um
problema de investigação usando estudos existentes, aplicando princípios específicos no
processo avaliativo de análise da literatura.
• Requer uma pesquisa da literatura extensa e contínua para garantir que todos os estudos
publicados e não publicados sobre o problema de pesquisa foram localizados e avaliados
quanto à sua inclusão na análise.
• Devido ao tempo e à carga de trabalho exigidos, esses tipos de revisões geralmente são
conduzidos em equipa.
14
3. Podem ser usadas para identificar, justificar e refinar hipóteses, reconhecer e evitar problemas
ocultos em estudos anteriores e explicar inconsistências e conflitos de dados.
4. Podem ser usadas para ajudar decisores a formular diretrizes e regulamentos baseados em
evidências.
5. O uso de métodos estritos, explícitos e pré-determinados de síntese, quando aplicados
adequadamente, fornece estimativas confiáveis sobre os efeitos de intervenções, avaliações e
efeitos relacionados com a questão de investigação.
6. Revisões sistemáticas identificam falhas de conhecimento ou compreensão de uma questão de
investigação e, portanto, podem ser usadas para orientar futuros pesquisas.
7. A inclusão aceita de estudos não publicados [isto é, literatura cinza] garante a maneira mais
ampla possível de analisar e interpretar a pesquisa sobre um tópico.
8. Os resultados da síntese podem ser generalizados e os achados extrapolados para a população
em geral com mais validade do que a maioria dos outros tipos de estudos.
• É uma metodologia analítica que visa avaliar e resumir sistematicamente os resultados de uma
série de estudos, aumentando assim o tamanho geral da amostra e a capacidade de estudar o
tamanho dos efeitos de interesse.
15
de um problema usando o raciocínio sinótico: pretende, nomeadamente analisando diferenças
nos resultados entre estudos e aumentar a precisão de estimativa dos efeitos.
• Depende da estrita adesão aos critérios utilizados para a seleção de estudos (os estudos incluídos
têm de cumprir uma série de critérios, bem explícitos) e da disponibilidade de informações em
cada estudo para analisar adequadamente os seus resultados, uma vez que a falta de
informação pode limitar severamente o tipo de análises e conclusões que podem ser
alcançadas.
• Além disso, quanto mais diferença houver nos resultados entre estudos, mais difícil é justificar
interpretações que regem uma sinopse válida de resultados. Convém que haja um consenso
dos estudos, p.e., se uma intervenção é válida: não pode haver estudos com resultados
positivos e outros negativos
Precisa cumprir os seguintes requisitos para garantir a validade dos seus resultados:
• Descrição claramente definida dos objetivos, incluindo definições precisas das variáveis e
resultados que estão a ser avaliados;
• Uma justificação bem fundamentada e bem documentada para a identificação e seleção dos
estudos – porque é que aqueles estudos estão incluídos na pool final e outros não;
• Descrição e avaliação do grau de heterogeneidade entre o tamanho amostral dos estudos revistos;
16
O que estes estudos não nos dizem?
1. Pequenas violações na definição dos critérios utilizados para análise de conteúdo podem levar a
resultados difíceis de interpretar e/ou sem sentido. 2. Um grande tamanho da amostra pode
produzir resultados fiáveis, mas não necessariamente válidos.
3. A falta de uniformidade em relação, por exemplo, ao tipo de literatura revista, à forma como os
métodos são aplicados e como os resultados são medidos dentro da amostra de estudos, pode
dificultar o processo de síntese.
4. Dependendo do tamanho da amostra, o processo de revisão e síntese de vários estudos pode ser
muito demorado.
• Tashakkori e Creswell (2007) e outros defensores de métodos mistos argumentam que estes são
mais do que a simples combinação de métodos qualitativos e quantitativos, refletindo, em vez
disso, um novo terceiro paradigma epistemológico que ocupa o espaço concetual entre
positivismo e fenomenologia.
18
SPSS – Operações Básicas
Tipos de Variáveis
1. Nominais – estabelece categorias – os números são usados para codificar essas categorias (ex:
sexo)
2. Ordinais – os números são usados para ordenar as suas diferentes categorias (ex: 0=1º lugar na
corrida, 1=2º lugar, 2=3º lugar … não garante unidades iguais entre as diversas posições do
ranking – a diferença entre o 1º e o 2º lugar pode ser 5min e entre o 2º e o 3º pode ser 2h)
3. Intervalares – os intervalos entre as unidades são iguais: a distância que separa o 1 e o 2 é a
mesma que separa o 2 do 3 mas o zero não é real (ex: temperatura)
4. Razão – os intervalos entre as unidades são iguais e o zero é verdadeiro (ex: peso)
No SPSS – 3 e 4 – Escala
Nome: Se for um questionário no nome da variável convém por o nº do questionário, para caso haja
erros, podermos saber e ir à fonte.
Tipo de variável é quase sempre uma variável numérica, quando muito também se usa a data
Labels/Rótulo - descreve-nos o item quando o nome não dá a entender do que se trata. No caso de ser
um item de uma escala põe-se mesmo o item
precisamos de saber ou que precisamos que outra pessoa saiba. ▪ Exemplo: Fator 1
ECPF
19
o Se o label for demasiado comprido pode dificultar a análise das tabelas dos resultados.
Valores – se a variável for idade não precisamos de pôr valores 1 é igual a 1 ano. Mas se a variável é
sexo aí tem de se por, porque 1 = feminino/masculino.
• Se não se puser 999 nos missing values, nas celulas com ausência de resposta, vai aparecer um
pontinho – missing system.
• Quando temos muitos dados, podemos nos enganar e saltar a resposta de alguém, então ao
aparecer missing system podemos identificar estes erros. Se nos missing values não
puséssemos 999, não conseguíamos distinguir os nossos lapsos das respostas não dadas.
A maneira mais fácil e direta é pedir ao SPSS a tabela de frequências, bem como o máximo e o
mínimo. Se no máximo aparecer 22, quando é uma escala de 1 a 5, consigo saber que há um erro.
20
Recodificar uma variável
Há muitas situações em que podemos precisar de recodificar uma variável Cuidados a ter
antes de recodificar uma nova variável:
• Deve ser o último passo, ou seja, se forem inseridos ou retirados dados após a criação de uma
variável, esta terá de ser criada novamente
Situação exemplo 1 em que precisamos de recodificar uma variável: Dicotomizar uma variável de
Likert de 5 valores em 2 (para apresentação dos dados):
• Em ‘discordância’ e ‘concordância’
21
• De 0 a 4
• Em de 4 a 0 (Nota: a posição do meio não é preciso recodificar) Transform > Recode into same variable
• Ter a certeza que os itens estão feitos todos no mesmo sentido o Caso não estejam terá de ser feita uma recodificação
2 opções:
• os testes de associação – quando queremos estudar se uma variável se associa ou não a outra e
de que forma que se associa,
• os testes de diferenças – quando comparamos 2 grupos ou o mesmo grupo em momentos
diferente: pode ser inter ou intra sujeito.
• identificar, com base na formulação da própria questão de investigação, qual destes 2 grupos de
testes nos permitirá responder à mesma (importância da questão de investigação ser muito
clara).
23
Q.I. 1: A ansiedade face a exames está Palavra-chave: ‘relacionada’.
relacionada com a dificuldade da
• As variáveis em causa estão relacionadas, ou, por outras
matéria em avaliação?
palavras, estão associadas? A resposta a esta questão
implica a utilização de testes de associação.
• São duas variáveis intervalares – idade e pontuação num teste, vou usar o coeficiente de
correlação de Pearson.
• Se tiver uma variável nominal dicotómica e uma intervalar, o teste mais adequado é o de
Correlação de Ponto-Bisserial.
24
3.1 Processo de tomada de decisão no caso de testes de associação:
25
4. Passo: que tipo de variáveis?
5. Passo: que teste uso?
2 grupos:
3 grupos:
3.2.1 Processo de tomada de decisão no caso de testes de diferenças num design inter-
sujeitos:
26
2.2.2 Sistematização do terceiro, quarto e quinto passos da decisão quando consideramos
um teste de diferenças num design intra-sujeitos
3.2.2 Processo de tomada de decisão no caso de testes de diferenças num design intra-
sujeitos:
27
Cálculo do Tamanho da Amostra adequados para a nossa amostra, com base no teste que usamos
G*Power – software que nos informa o número de participante (quantitativos) e a robustez que queremos dos nossos resultados
↓↓↓↓
Ex: Teste T, Baseado em estudos prévios/uso de valor mais conservador
Valor β Valor α ANOVA…
Valor beta: na maior parte das vezes não temos de o alterar – exceto quando, p.e. a nossa amostra é
muito difícil de alcançar e sabemos que o valor padronizado é demasiado exigente
Tamanho do efeito: geralmente a parte + difícil de definir: ou fazemos com base em estudos prévios
ou acabamos por usar um valor mais conservador que o G*Power já dá.
28
Estudos realizados com uma parte da população que se quer estudar - amostra ↓
Resultado estatístico da amostra pode diferir do da população (menos provável de diferir quanto maior
é a amostra, i.e., quanto mais representativa é da população)
↓
Necessidade de avaliar a probabilidade do resultado estatístico da amostra ocorrer por acaso, quando
a hipótese nula é verdadeira para a população - p
Tamanho do efeito
Se se sortear um prémio de 5 euros e calha à pessoa A. Se se fizer um teste de diferenças entre a
pessoa A e as restantes, o p é significativo, mas o tamanho do efeito é pequeno. Se o prémio fosse 1
000 0000 de euros, o p seria igualmente significativo, mas o tamanho do efeito seria muito maior.
• Permite melhor compreensão da magnitude das conclusões de um estudo • Deve ser incluído
na secção Resultados
• Os tamanhos dos efeitos são estimativas estatísticas
o Ex., d de Cohen
• Fornecer aos leitores informações suficientes para avaliar a magnitude do efeito observado
Testes Paramétricos
• Resultados baseados em medianas
29
Testes de Diferenças
O que são?
Os testes de diferenças possibilitam avaliar o efeito que uma variável independente tem sobre uma
variável dependente.
• Permitem compreender se há diferenças entre grupos independentes (VI – define a pertença aos
grupos em comparação, p.e. sexo - homens vs. mulheres) ou entre momentos temporais ou
condições experimentais diferentes (VI – define os diferentes momentos temporais ou
condições experimentais em comparação).
30
Pressuposto 2: Normalidade das distribuições
Podemos ver se a distribuição é normal visualmente através de um histograma ou de um gráfico de
bigodes.
Nas populações forenses é raro encontrar distribuições normais, tem de haver uma margem de valores
razoáveis
Histogramas
Análise de gráficos
Caixa de Bigodes
Avaliação da
normalidade da
distribuição
Kolmogorov-Smirnov
(N≥50)
Shapiro-Wilk (N<50)
Procedimentos
estatísticos
Assimetria e
curtose/achatamento
Procedimentos estatísticos:
Testar coeficiente de assimetria e curtose:
-1.96 < Coeficiente de assimetria e de curtose (achatamento) < 1.96 Pestana & Gageiro
(2003)
Vários critérios:
• Critério conservador: valores dentro do intervalo -0.5 a 0.5
31
Teste de Kolmogorov-Smirnov (amostras superiores ou Permite testar a normalidade para amostras inferiores a 50.
iguais a 50):
• Um valor não-significativo (p > 0,05), indica que os dados da amostra não diferem
significativamente de uma distribuição normal – tem uma distribuição normal.
• Um valor significativo (p ≤ 0,05) indica um desvio da normalidade.
Limitação: com amostras grandes é muito fácil obter valores significativos - assim, um resultado
significativo não nos informa necessariamente se o desvio da normalidade é suficiente para prejudicar
os procedimentos estatísticos que serão aplicados aos dados.
Que tipo de testes utilizar quando há violação dos pressupostos? Há situações em que não
são cumpridos os pressupostos, mas que o paramétrico até se adequa. Quando não termos a certeza dos
critérios, qualquer um, testamos com os dois testes:
• Comparar dois grupos de sujeitos diferentes (ex.: alunos de Engenharia com alunos de
Psicologia) → design inter-sujeito → VI – curso dos indivíduos.
• Comparar o mesmo grupo de sujeitos em dois momentos temporais (ex.: ansiedade sentida 1
semana antes do exame e 24h antes do mesmo) → design intrasujeito → VI – momento
temporal. Ou porque viveram uma situação que pode ter alterado – condição experimental
33
Teste T para Amostras Independentes
Objetivo: avaliar se as médias da variável dependente nos dois grupos em comparação diferem
significativamente uma da outra.
Características:
• 2 grupos independentes
(se a variável de grupo tiver 3 ou mais grupos temos de ir ao define groups e dizer quais os grupos que
queremos comparar)
O ideal não é clicar no OK (aparece só o output), mas no paste (aparece o output e abre outra janela: a
sintaxe – a codificação daquilo que estamos a pedir). Para efeitos de exame podemos clicar no OK
Se trabalharmos na sintaxe, não precisamos de fazer tudo outra vez se ficar incompleto, basta copiar e
colar e adaptar para aquilo
34
Sig é o p.
Se o p relativo ao teste de Levene é maior que 0.05 lemos a linha de cima de variâncias iguais
assumidas. Se for inferior a 0.05 lê-se a linha de baixo de variâncias iguais não assumidas
• Se o 0 estiver incluído no intervalo de confiança, o p não vai ser significativo. O IC tem de estar
todo acima ou abaixo de 0
OU
35
Homens (n=63) Média (DP)
Mulheres (n=37) Média (DP) T(98)
Teste de Mann-Whitney
Objetivo: avaliar se as ordens médias (medianas) dos dois grupos independentes diferem ao nível de
uma variável dependente ordinal.
Características:
• VD Ordinal
• O grau de ansiedade (em escala de likert) sentido face a exames varia em função do curso
frequentado?
o Ho: Não há diferenças entre os alunos de Cursos de Engenharia e alunos de Cursos de
Ciências Sociais e Humanas ao nível do grau de ansiedade sentido face aos exames.
o H1: Há diferenças entre os alunos de Cursos de Engenharia e alunos de Cursos de
Ciências Sociais e Humanas ao nível do grau de ansiedade face aos exames.
36
Redação e apresentação dos resultados:
Os alunos dos cursos de Engenharia relatam um grau de ansiedade face aos exames significativamente
superior ao dos alunos dos cursos de CSH, U = 364.50, p = .001.
CSH (n=33) Ansiedade sentido face a exames
***p < .001
Ordem Média U
43.65 28.05 364.50***
Grau de
Engenharia (n=39) Ordem Média
• Hipótese nula (H0): Não há diferenças entre os momentos temporais (ou condições
experimentais) A e B ao nível da variável Z.
• Hipótese alternativa (H1): Há diferenças entre os momentos temporais (ou condições
experimentais) A e B ao nível da variável Z.
37
Testes de diferenças em contexto de design intra-sujeitos
Nº de grupos
Escala de medida
da VD Teste de diferenças intra-sujeitos
definido pela VI
2 Intervalar (Scale) Teste t para amostras emparelhadas
Características:
• VD intervalar;
• Há diferenças entre a ansiedade sentida uma semana antes do exame e a ansiedade sentida 24h
antes do mesmo?
38
Paired Samples Test – averigua se a diferença observada nas médias nos dois momentos
temporais/condições experimentais é ou não estatisticamente significativa.
39
Resultados
• O valor da probabilidade, p < .001, permite rejeitar a hipótese nula (H0) e aceitar a hipótese
alternativa (H1), concluindo que há diferenças significativas entre os dois momentos
temporais/condições experimentais ao nível da variável dependente.
Exemplo de Redação:
• Há diferenças significativas entre a ansiedade sentida pelos alunos uma semana antes de um
exame do que 24 horas antes do mesmo, t (71) ~ -17.00, p < .001, 95% CI [-18,839, -14,883].
A ansiedade é mais elevada 24 horas antes do exame do que uma semana antes do mesmo (o
significado psicológico dos dados reportados).
Teste de Wilcoxon
Objetivo: Comparar a mesma variável em dois momentos temporais (ou duas condições
experimentais), quando a VD é ordinal.
Características:
• VD ordinal;
Questão de Investigação:
40
Passos para a utilização do teste de Wilcoxon
Analyze > Nonparametric Tests > Legacy Dialogs > 2 related samples
Output
• Ranks – constituída por três colunas: N (número de participantes em cada grupo); Mean Rank
(Ordem média); e Sum of Ranks (Soma das Ordens); • Test Statistics – apresenta o valor do Teste
de Wilcoxon, representado pela letra Z e o respetivo nível de significância (linha Asymp. Sig)
o O teste de Wilcoxon apresenta as ordens médias das Negative Ranks e Positive Ranks
(primeira e segunda linhas da tabela Ranks), e não as ordens médias das duas
variáveis em análise.
41
Resultados
O valor da probabilidade, p > .05, não nos permite rejeitar a hipótese nula (H0). Exemplo de
Redação:
Atividades Práticas
Atividade 1
Assimetria = -.345
Curtose = -,667
42
Estão ambas acima de -1,96 e abaixo de 1,96, pelo que podemos assumir uma normalidade aceitável
da distribuição da VD
• Pedir o respetivo teste – Teste t para amostras independentes
• Reportar os resultados
o Há diferenças significativas entre alunos de psicologia e de direito em termos do nível
de empatia, t(98)= 12.509, p<.001, d=2.543, 95% IC [26.673, 36.732], sendo que os
alunos de psicologia apresentaram níveis superiores de empatia (M = 72.68, DP =
11.921) do que os alunos de direito (M =40.98, DP = 13.213).
Atividade 2
43
2. Mann-Whitney
44
• Reportar os resultados
1. Há diferenças significativas entre momentos ao nível de burnout, t(244)= -40.799,
p<.001, d= -2.607, 95% IC [-36.138, -32.809], havendo um aumento do burnout no
segundo momento (M = 23.70, DP = 6.678), quando comparado com o primeiro
momento (M =58.18, DP = 10.657).
2. Os indivíduos do sexo feminino reportam níveis de qualidade de vida
significativamente superiores aos indivíduos do sexo masculino, U = 4362,500, p
= .014.
Testes de Diferenças
O que são?
Os testes de diferenças possibilitam avaliar o efeito que uma variável independente tem sobre uma
variável dependente.
• Permitem compreender se há diferenças entre grupos independentes (VI - define a pertença aos
grupos em comparação) ou entre momentos temporais ou condições experimentais
diferentes (VI – define os diferentes momentos temporais ou condições experimentais em
comparação)
• Comparar dois grupos de sujeitos diferentes (ex.: alunos de Engenharia com alunos de
Psicologia) ➔ design inter-sujeito ➔VI – curso dos indivíduos • Comparar o mesmo grupo de
sujeitos em dois momentos temporais (ex.: ansiedade sentida 1 semana antes do exame e 24h
antes do mesmo) ➔ design intrasujeito ➔ VI – momento temporal
• Pode ser usado quando com mais do que uma Variável Independente • É uma
extensão da regressão (General Linear Model)
Existem várias ANOVAs, a mais complicada é a MANOVA mas não vamos lá chegar.
45
Se percebemos a ANOVA one-way, com um bocadinho de esforço e raciocínio conseguimos perceber
as de two-way e assim sucessivamente
As mais difíceis relacionam as várias variáveis, o que as complexifica mas o processo é semelhante às
mais fáceis
• Tal como no t-test, a ANOVA testa a hipótese nula que as médias são as mesmas.
Hipótese experimental:
• As médias diferem.
ANOVA
A teoria da ANOVA
O que é que a ANOVA começa por fazer…
• Calcula(mos) a variabilidade que existe entre totais – Total Sum of squares (SST).
46
• Depois calculamos quanto desta variabilidade pode ser explicada pelo modelo que encaixamos
nos dados
o Quanta desta variabilidade se deve à manipulação experimental, Model Sum of
Squares (SSM)...
• Se o modelo explica muito mais variabilidade do que não explica, então a manipulação
experimental teve um efeito significativo no resultado (VD). o Existem diferenças
significativas e o nosso modelo/ análise é boa para explicar os dados
• Se o “experiment” for bem-sucedido, então o modelo explicará mais variância do que aquela
que não consegue explicar
o SSM será maior do que SSR
ANOVA
One-way ANOVA
Exemplo com uma variável independente
• O Viagra é um estimulante sexual (usado para tratar a impotência) que invadiu o mercado negro
com base na crença de que torna os homens melhores amantes.
• Suponhamos que testámos esta crença utilizando três grupos de participantes: administramos a
um grupo um placebo (G1), a um grupo uma dose baixa de Viagra (G2) e a outro uma dose
elevada (G2).
• A variável dependente foi uma medida objetiva de libido (foi medida ao longo de uma semana –
o resto vou deixar à sua própria imaginação) ... • Os dados encontram-se no ficheiro Viagra.sav (e-
campus).
47
Exercício
Testar os efeitos do Viagra na Libido utilizando três grupos:
Os dados
Passos para a utilização da One-way ANOVA
Analyse > Compare Means > One-way ANOVA
Factor: V. Independente
48
Options: escolher nas estatísticas – Descriptive; Homogeneity of variance test; Brown Forsythe teste;
Welsh test
Caso haja a violação do pressuposto da homogeneidade (se o teste de Levene for significativo),
vamos usar o Brown-Forsythe ou Welch em vez do F (de preferência o Welch)
49
Para que serve este procedimento?
Acreditamos que o resultado é genuíno quando temos 95% de confiança de que o é – ou, quando
existe apenas 5% de chance de os resultados poderem ocorrer por acaso, sem haver de facto um
efeito (a hipótese nula é verdadeira).
Contudo, mesmo com 95% de confiança, há uma pequena chance de estarmos errados.
50
Há dois tipos de erro: Erros de Tipo I e de Tipo II
Falso Negativo
Escolhemos o teste consoante aquilo que mais precisamos e em função dos nossos objetivos e das
características do nosso estudo
51
poder estatístico quando amostra é grande.
o São geralmente os mais utilizados
o Com 60 a 80 participantes é melhor o Bonferroni;
o Com 600 participantes o Tukey é melhor.
• Dunn and Scheffé – menor poder estatístico do que o Tukey.
• The Ryan, Einot, Gabriel and Welsch Q procedure (REGWQ) – Bom poder estatístico.
Controla bem erros de tipo I. Não se deve utilizar quando os grupos são de tamanhos
diferentes.
o Grupo 1, 2 e 3 com 10 participantes
Erro Tipo I - rejeição de uma hipótese nula verdadeira (também conhecido como um resultado “falso
positivo”)
Erro Tipo II - não rejeição de uma falsa hipótese nula (também conhecido como um resultado “falso
negativo”)
• REGWQ ou Tukey - Amostras de tamanho igual e confiança que variâncias da população são
semelhantes. Ambos têm bom poder estatístico e controla bem taxas de erro tipo I.
• Bonferroni’s - conservador, controlo sobre erros tipo I garantido. • Gabriel - Amostras de
tamanho ligeiramente diferente, maior poder estatístico. Para amostras de tamanhos bastante
diferente torna-se demasiado liberal. • Hochberg’s GT2 - Amostras de tamanho bastante
diferente. Muito pouco fiável quando as variâncias da população são diferentes e, por isso, só deve
ser utilizado quando se tem a certeza de que não é esse o caso.
• Tamhane’s T2 - é conservador
• Dunnett’s T3 – mantém controlo rígido
dos Erros Tipo I
• Dunnett’s C. - mantém controlo rígido
dos Erros Tipo I
• Games–Howell - é o procedimento
mais poderoso (i.e., com maior poder
estatístico), mas pode ser liberal
quando as amostras são pequenas.
No entanto, o Games-Howell
também é fiável/preciso quando os
tamanhos da amostra são desiguais.
A escolha do procedimento de comparação depende da situação exata e se nos importa mais controlar
as taxas de erro ou ter mais poder estatístico.
52
No exercício em análise, as amostras são iguais, por isso não precisamos de usar o teste de Gabriel.
• REGWQ e Tukey - Amostras de tamanho igual e confiança que variâncias da população são
semelhantes. Ambos têm bom poder estatístico e controla bem taxas de erro tipo I.
• Games–Howell - é o procedimento mais poderoso (i.e., com maior poder estatístico) para os
casos em que as variâncias diferem, mas pode ser liberal com amostras pequenas. No entanto,
o Games-Howell também é fiável/preciso quando os A escolha do procedimento de
comparação tamanhos da amostra são desiguais.
Temos ainda uma hipótese específica de que tanto os grupos aos quais foi administrada uma alta
dosagem de viagra como aqueles aos quais foi administrada uma baixa dosagem devem diferir do
grupo ao qual foi administrado um placebo, pelo que podemos usar o teste de Dunnett para examinar
esta hipótese.
• Quando temos amostras de tamanho igual e as variâncias dos grupos são semelhantes utilizamos
o procedimento REGWQ ou Tukey (para amostras maiores).
• Se
queremos garantir controlo sobre a taxa de erro tipo I, utilizamos o procedimento Bonferroni.
53
• Se as amostras forem de tamanhos ligeiramente diferentes, usamos o procedimento de Gabriel,
mas se as amostras forem de tamanhos muito diferentes, usamos o Hochberg’s GT2.
• Se há dúvidas quanto à igualdade da variância dos grupos, então usamos o procedimento
Games-Howell.
Possíveis soluções:
1. Transformar dados;
2. Transformações nem sempre
funcionam, é preferível reportar o
valor de Welch’s F - mais
recomendado do que reportar o
valor de Brown–Forsythe F (Field,
Então reportar o valor de F da tabela da ANOVA – reporta-se também o p., os graus de liberdade e o
Effect size (calculado mais à frente)
54
Não basta dizer que há
diferenças significativas,
temos de dizer quais é que
diferem, por isso vamos à
tabela dos outros testes
Post Hoc
Effect size
O effect size (tamanho do efeito) é uma medida objetiva e estandardizada da magnitude do efeito
observado.
↓
Podemos comparar effect sizes entre vários estudos, que testaram variáveis diferentes ou utilizaram
diferentes escalas de medição (APA exige que todos os artigos publicados contenham effect sizes)
Medidas de effect size mais comuns: Cohen’s d; Pearson’s correlation coeficiente r; odds ratio
��2 =������
������= √������
������
Calculamos o r2 utilizando o between-group effect (SSM) e o total de variância dos dados (SST) –
também designado de eta squared, η2
55
Redação e apresentação dos resultados
Quando reportamos uma ANOVA, indicamos o F-ratio e os graus de liberdade; a significância (α-
level) e o effect size
→ A Análise de Variâncias (ANOVA) evidenciou que existe um efeito significativo do Viagra nos
níveis da líbido, F(2, 12) = 5.12, p < .05
.68 é um grande efeito. Portanto, o efeito do Viagra nos níveis da libido é um resultado robusto.
No entanto, esta medida de tamanho do efeito (eta squared, η2) é ligeiramente enviesada porque se
baseia exclusivamente em somas de quadrados da amostra e não é feito nenhum ajuste para o facto
de estarmos a tentar estimar o tamanho do efeito na população.
Portanto, muitas vezes usamos uma medida um pouco mais complexa chamada omega squared
(ω2).
• Esta estimativa de tamanho do efeito também é baseada nas somas de quadrados, mas, tal como
o F-ratio, usa a variância explicada pelo modelo e o erro da variância.
• O dfM são os graus de liberdade para o efeito (output do SPSS - no caso do efeito principal este
é o número de condições experimentais menos um).
������
������������ ������
=16.19
45.70
= .35
ω = .60
56
→ A Análise de
Variâncias
(ANOVA)
evidenciou que
existe um efeito
significativo do
Viagra nos níveis
da líbido, F(2, 12)
= 5.12, p < .05, ω
= .60
→ O Teste Post-Hoc de Tukey HSD revelou que aqueles que tomaram uma dose mais alta viagra
(M = 5.00, DP = 1.58) têm níveis mais elevados de líbido do que aqueles que tomaram o
placebo (M = 2.20, DP = 1.30).
O poder estatístico
Statistical Power
Capacidade de um teste estatístico detetar um efeito daquele tamanho (effect size encontrado)
O objetivo é atingir um poder estatístico (power) de .8, ou 80% de probabilidade de detetar um efeito
quando este existe genuinamente.
Calcular o tamanho da amostra necessário para alcançar determinado nível de poder estatístico:
Calcular à priori - antes de recolher os dados (preferencial)
57
Programa G*Power
Selecionar os testes F
58
Selecionar o teste específico
Selecionar o teste Post Hoc
(porque estamos a testar o power
desta análise específica, depois
de termos conduzido o estudo)
Selecionar effect
size from variance
Selecionar effect
size from variance
Calcular e transferir
59
ANOVA Fatorial
Introduzir os dados que são solicitados:
Calcular
Quando um estudo tem duas ou mais variáveis independentes designa-se de design fatorial (porque
as variáveis são, por vezes, nomeadas de fatores).
60
Exemplo com duas variáveis independentes
Racional: Após o consumo de álcool, a perceção sobre a atratividade física de alguém torna-se menos
precisa - o conhecido “beer-goggles effect” (Chen, Wang, Yang, & Chen, 2014)
Amostra:
Testar os efeitos do consumo de álcool na escolha do engate em discotecas utilizando três grupos:
• Homem
• Mulher
Os dados
61
Passos para a utilização da ANOVA two-way:
Analyze > General Linear Model > Univariate
Dependent variable: Atratividade
Temos de clicar no Paste e pedir um procedimento extra de comparar as médias nas interações para
saber quais as médias que diferem.
62
Não há um efeito significativo do
sexo: F não significativo, o que
sugere que o sexo do participante
não influenciou a escolha da pessoa
que tentou engatar na discoteca.
Há um efeito significativo do
consumo de cerveja: F é altamente
significativo, o que sugere que a
Há um efeito significativo de interação entre o efeito do quantidade de cerveja consumida afetou significativamente a
consumo de cerveja e o efeito do sexo: F é altamente escolha da pessoa que o participante tentou engatar na
significativo, o que sugere que o efeito do consumo de cerveja discoteca.
na escolha da pessoa que o participante tentou engatar na
Valor total, ignorando o sexo 63
discoteca foi diferente para homens e para mulheres.
Os participantes que
consumiram 2 litros de
cerveja engataram pessoas
menos atraentes do que
aqueles que consumiram 1
litro de cerveja e do que
aqueles que não
consumiram. 64
Há um efeito significativo de interação
entre o efeito do consumo de cerveja e o
efeito do sexo: F é altamente significativo, o
que sugere que o efeito do consumo de
cerveja na escolha da pessoa que o
participante tentou engatar na discoteca foi
diferente para homens e para mulheres.
65
Redação e apresentação dos resultados:
Quando reportamos uma ANOVA, apresentamos o F-ratio e os graus de liberdade (variável e erro); a
significância (α-level) e o effect size (partial eta squared, ηp2) – na one-way é o ómega
Primeiro reportamos efeitos principais, começando pelo significativo (se forem todos significativos
podemos seguir a ordem na tabela). Só depois é que reportamos a interação (Se não houver efeitos
principais significativos e só houver interação, temos de dizer à mesma primeiro que não efeitos
principais e só depois a interação).
Efeito do consumo de
cerveja
O Teste de comparações
múltiplas, com correções
Bonferroni, revelou que os
participantes que consumiram
2 litros de cerveja (M=46.56, DP=14.34) engataram pessoas significativamente menos atraentes do
que aqueles que consumiram 1 litro (M = 64.69, DP = 9.91) e do que aqueles que não consumiram (M
= 63.75, DP = 8.47)
66
Efeito de interação
Houve um efeito significativo de interação entre o efeito do consumo de cerveja e o efeito do sexo,
F(2, 42) = 11.91, p < .001, ηp 2 = .36. Estes resultados sugerem que homens e mulheres foram
afetados de forma diferente pelo consumo de cerveja. O teste de comparações múltiplas, com
correções Bonferroni, evidenciou que os homens que consumiram 2 litros de cerveja (M = 35.63, DP
= 10.84) escolheram engates menos atraentes do que as mulheres que consumiram a mesma
quantidade de cerveja (M = 57.50, DP = 7.07). (As mulheres parecem manter os standards de
exigência na escolha do parceiro da noite!)
Aula Prática
One-way ANOVA
Existem evidências científicas de que a terapia assistida por animais tem efeitos positivos na saúde
mental infantil (Hoagwood, Acri, Morrissey, & Peth-Pierce, 2017). Contudo, os resultados existentes
são bastante inconsistentes.
Assim, suponhamos que queríamos contribuir para esta literatura através da realização de um estudo
em que alocávamos aleatoriamente os participantes em três grupos:
67
[e.g., se a hipótese estivesse relacionada com cães, podia ser um gato disfarçado de cão]);
2. G2 Grupo de Baixa Dosagem – 15 minutos de terapia assistida com um cão bebé;
3. G3 Grupo de Alta Dosagem – 30 minutos de terapia assistida com um cão bebé.
A variável dependente foi uma medida de felicidade que variava de 0 (tão infeliz quanto posso
imaginar ser) a 10 (o mais feliz que posso imaginar ser)
Testar os efeitos da terapia assistida por animais na saúde mental infantil utilizando três grupos:
• Grupo de Baixa Dosagem (15 min de terapia assistida por animais) • Grupo de
Alta Dosagem (30 min de terapia assistida por animais)
Hipóteses:
• Qualquer forma de terapia assistida por animais deve ser melhor do que o controlo (isto é,
pontuações de felicidade mais altas)
Os dados
Questões de investigação:
• Calcule o poder estatístico da análise conduzida descrevendo os passos que deu e os resultados
que obteve.
Two-way ANOVA
Os gostos musicais das pessoas tendem a mudar à medida que envelhecem.
Suponhamos que queríamos testar esta crença através de um estudo em que alocávamos
aleatoriamente os participantes em dois grupos (Idade). Cada grupo etário foi ainda dividido em 3
grupos, de acordo com o estilo de música que ouviram (Musica):
Variável Dependente: Cada participante avaliou de -100 (detesto esta música) a 0 (esta música é-me
completamente indiferente) a + 100 (adoro esta música)
Exercício:
69
Efeito principal do estilo de música
A Análise de Variâncias (ANOVA) evidenciou um efeito significativo do estilo de música que os
participantes ouviram, na avaliação da preferência da música, F (2, 84) = 105, 620, p < .001, ηp 2
= .715. Não se verificou
um efeito significativo
da idade na avaliação
da preferência da
música, F(1, 84) = .002,
p = .966, ηp 2 = .000.
O Teste de comparações
múltiplas, com correções
Bonferroni, revelou que
os
participantes que
ouviram U2
(M=62,003, DP=34.1)
relataram gostar mais
/preferir a música que
ouviram (ou: avaliaram a
musica que ouviram
significativamente mais
alto)
do que aqueles que ouviram
Ed Sheeran (M = 1.4, DP =
34.1) e do que aqueles que
ouviram LMFAO (M = -4.833,
DP = 34.1)
Efeito de interação
70
Verificou-se também um efeito significativo de interação entre o grupo etário e o estilo de música,
F (2, 84) = 400.97, p < .001, ηp 2 = .905. Estes resultados sugerem que a preferência musical dos
participantes com idades entre 0-40 anos e participantes com idades superiores a 40 anos foi
influenciada de forma diferente pelo estilo de música. O teste de comparações múltiplas, com
correções Bonferroni, evidenciou que os participantes 0-40 gostaram mais de ouvir LMFAO (M=
66.20, DP=48.22) do que os participantes 40+ (M=-75.867, DP=48.22) e os participantes 0-40
reportaram gostar menos de ouvir Ed Sheeran (M=-71.467, DP=48.22) do que os participantes 40+
(M=74,267, DP=48.22). Não houve diferenças significativas entre os grupos etários ao nível da
preferência por U2 (M0-40=64.133, DP=48.22; M40+=59,933, DP=48.22).
71
Dentro dos grupos etários, os participantes 0-40 que ouviram Ed Sheeran (M= -71.467; DP= 48.22)
relataram gostar menos da música do que os que ouviram LMFAO (M = 66.2, DP = 48.22) e do que
os que ouviram U2 (M= 64.133; DP= 48.22), enquanto os participantes 40+ que ouviram LMFAO
(M = -75,867, DP = 48.22) relataram gostar menos da música do que os que ouviram Ed Sheeran
(M= 74.267; DP= 48.22) e do que os que ouviram U2 (M= 54.933; DP= 48.22).
NOTA: USEI AS TABELAS DAS ESTIMATIVAS MAS É MELHOR USAR LOGO A SEGUNDA
TABELA QUE APARECE QUE JÁ ME DÁ AS MÉDIAS E O DESVIO PADRÃO
ANOVA Fatorial
Repeated measures (related) factorial design
Várias variáveis independentes ou preditores, sendo que os mesmos participantes foram avaliados
em três ou mais momentos temporais (ou condições experimentais).
• A.k.a “within-subjects”
O que há de novo?
Conceito de Esfericidade
A precisão do teste F (F-ratio) depende do pressuposto de que os resultados das diferentes condições
experimentais são independentes.
Na ANOVA para medidas repetidas este pressuposto é violado; os resultados das diferentes condições
experimentais estão provavelmente relacionados porque são provenientes dos mesmos participantes.
Assim, o teste F convencional torna-se pouco preciso e deve ser gerado um novo pressuposto.
72
Mauchly’s test
• Significativo (p < .05) = Há diferenças significativas = pressuposto violado • Não significativo (p
> .05) = Não há diferenças significativas = pressuposto verifica-se.
O SPSS produz correções com base nos pressupostos de esfericidade definidos por:
Ambos geram uma correção aplicada aso graus de liberdade utilizados para analisar
o F-ratio
3. MANOVA
a. Outra solução possível é reportar os testes multivariados (MANOVA), pois estes não
estão dependentes do pressuposto de esfericidade.
Racional: Programa de TV onde celebridades têm de sobreviver na selva australiana, para tal
procurando a sua própria “comida selvagem”.
Amostra: 8 celebridades
73
Procedimento: Um dos desafios das 8 celebridades passa por comerem quatro tipos de “comida
selvagem”, em ordem contrabalançada: bicho-pau, testículo de canguru, olho de peixe e larvas de
mariposa. Em cada ocasião medimos (em segundos) o tempo que demoraram até vomitar.
nome ao fator que vai ser avaliado intra-sujeitos e quantos níveis tem.
74
Vai aparecer uma ordem e temos de colocar os níveis da VI a corresponder a um número dessa ordem:
Das técnicas univariadas mais robustas, especialmente no que concerne ao controlo do poder estatístico e dos erros de Tipo I.
75
Como só há 1 VI, não vão existir interações pelo que podemos clicar logo no OK e não no Paste
76
Como proceder perante a violação do pressuposto de
Esfericidade?
Reportar o Huynh-Feldt se os
valores da Greenhous-Geisser
forem superiores a .75
Opção 1
77
“A Análise de Variâncias (ANOVA) evidenciou que o tempo até vomitar não foi influenciado
pelo tipo de animal ingerido, F(1.60, 11.19) = 3.79, p = .063, ηp2 = .35.”
Solução 2
Vimos anteriormente que, quando o pressuposto de esfericidade é violado (o teste de Mauchly é
significativo), existe outra solução para a interpretação dos dados:
• Reportar os testes multivariados (MANOVA), uma vez que estes não se regem pelo
pressuposto da esferecidade.
• Há 4 estatísticas de teste, mas na maioria das situações reporta-se o Pillai’s trace.
o Reportamos o valor de V (Value), assim como o valor do F, os graus de liberdade
(variável e erro) e a significância (α level)
O teste de Mauchly indicou que o pressuposto da esfericidade foi violado, χ2(5) = 11.41, p
= .047, sendo que a estimativa de esfericidade de Greenhouse Geisser revelou um desvio
substancial (ε= .53).
78
Deste modo, reportam-se os testes multivariados. Estes resultados demonstram que o tempo
até vomitar foi significativamente afetado pelo tipo de animal ingerido, V =.94, F(3,5)=26.94,
p<.01, ηp2= .94.
O tempo até vomitar foi
significativamente superior após
a
ingestão do inseto bicho-pau
(M=8.13, DP=2.23), em
comparação
com a ingestão do testículo do
canguru (M=4.25, DP=1.83) e
do
olho de peixe (M=4.13,
DP=2.75),
mas não comparativamente à
ingestão das larvas de mariposa
(M=5.75, DP=2.92). O tempo
até
vomitar após a ingestão do
testículo
de canguru não diferiu
significativamente do tempo até
vomitar após a ingestão do olho
de
peixe ou das larvas. Por último o
tempo até vomitar após a ingestão
do olho de peixe não diferiu
significativamente do tempo até
vomitar após a ingestão das larvas
de mariposa.
Mas se nos guiássemos pelo Greenhouse
Geisser seria um falso negativo certo?
Nota Final
• Estes dados ilustram a importância de utilizarmos um F-ratio válido: pode potencialmente
significar a diferença entre cometermos um erro de Tipo I (falso positivo) ou não
• Percebemos também o argumento defendido por muitos estatísticos de que a utilização de um
nível de significância de .05 é extremamente arbitrário • Os resultados deste exercício mostram que
as correções aplicadas geram valores de significância estatística que diferem apenas por .015,
mesmo assim, levam a conclusões completamente opostas
• Por este motivo, muitas vezes em estatística importa mais o tamanho do efeito (Effect size) do
que o grau de significância.
79
• Nestes casos em que o pressuposto da esfericidade é violado, podemos optar, então, por reportar
os testes multivariados (MANOVA), dado que estes não se regem pelo pressuposto da
esfericidade.
Exemplo – Repeated-measures ANOVA com 2 Variáveis Independentes Racional: Existem
evidências científicas de que as atitudes da população em relação a determinados estímulos podem ser
alteradas através da utilização de imagens positivas e negativas (Field, 2005c; Stuart, Shimp, & Engle,
1987).
Os participantes viram um total de nove anúncios falsos ao longo de três sessões. 1ª Sessão –
participantes viram três anúncios:
(1) uma marca de Cerveja apresentada com uma imagem negativa (2) uma marca de
Vinho apresentada com uma imagem positiva (3) uma marca de Água apresentada ao
lado de uma imagem neutra
80