Métodos Estatísticos: Fundamentos

Aspetos e Conceitos Fundamentais da Investigação Quantitativa
Licenciatura em Psicologia Edição 2022-2023

Métodos Estatísticos: Fundamentos
Prof. J. M. Tomás Silva
Aula 2: O processo de investigação

Teorias são as ferramentas analíticas que construímos para
compreender, explicar e predizer um determinado
fenómeno; Hipóteses são asserções ou conjecturas
deduzidas da teoria e que irão ser submetidas a um
rigoroso inquérito;
Operacionalização dos conceitos é feita através de
procedimentos e/ou medidas concretas dos conceitos que
queremos estudar;
Selecção da amostra diz respeito aos processos que usamos
para escolher as unidades que iremos observar no estudo.
Conceitos básicos
População: Conjunto total de objetos (existentes ou apenas possíveis) em que estamos interessados.
Por objeto entende-se qualquer pessoa, animal, coisa, operação, família, instituição, etc.
Amostra: Qualquer subconjunto (parte) de uma população. A amostra referencia-se sempre a uma
população da qual é parte integrante.
Parâmetro: É uma caraterística da população (i.e., uma função dos valores da população). Mais
simplesmente é um sumário numérico da população. O alfabeto Grego, representa os parâmetros (μ = média
da população)
Estatística: É uma função de uma amostra. Mais simplesmente é um sumário numérico de uma
amostra obtida da população. O alfabeto Romano ou Latino é usado para representar as estatísticas (e.g., M
= média da amostra, embora na estatística o símbolo ou [lê-se x barra]
Divisões da Estatística
Estatística Descritiva : A que trata da recolha ou colheita, ordenação, sumarização e análise dos
dados de uma amostra.
Estatística Inferencial : A que procura a veri cação de inferências acerca da população (e.g., dos
seus parâmetros, da forma da distribuição) a partir de uma amostra (dos seus dados estatísticos, da forma da
sua distribuição).
Variáveis :Uma caraterística que consiste em duas ou mais categorias (e.g., pro ssão ou a
nacionalidade) ou dois ou mais valores (e.g., idade ou score de inteligência).
Constantes: O oposto de uma variável, consiste num único valor.
Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 1 de 39

 
 

𝑥
fi

 
𝑋

fi
Variabilidade/Variação :Todas as medidas variam também consoante a amostra de que se dispõe;• A
preocupação central das ciências é o estudo da variabilidade
Denominamos e classi camos as variáveis de muitas maneiras diferentes

Variáveis independentes (VI) : Uma variável que se supõe ter uma in uência ou ser capaz de afetar
outra variável. Preditores*
Variáveis dependentes (VD): São as que sofrem o efeito das VI’s. Os seus valores sendo suposto
estarem dependentes do valor da VI. variáveis de critério * ou de resultado*
* Fora do contexto experimental
Variáveis Quantitativas :As variáveis podem conter números, caso em que são chamadas de
quantitativas (também ditas variáveis de medição ou numéricas) e dizem respeito a contagens, percentagens
ou números; As unidades devem re ectir o modo como foram medidas (i.e., todas as variáveis quantitativas
têm uma unidade de medida: por exemplo, idade = anos; salário = euros)
Variáveis Qualitativas :As variáveis podem ainda ser categorias, ou seja, descrições de grupos ou
coisas, como "raças de cães" ou "preferência de voto” e, nesse caso, são apelidadas de qualitativas; Estas não
precisam de ser numéricas, embora usem números para representá-las (e.g., Sexo Masculino = 0; Feminino =
1)
Classi cação Matemática das Variáveis (Kirk, 1978)
Tipo de Variável Características

A amplitude consiste em categorias exaustivas e mutuamente exclusivas que representam
Qualitativa
atributos ou características não quantitativas
- Não ordenada As categorias não sugerem uma ordem ou posto/posição
- Ordenada As categorias sugerem uma ordem ou posto/posição
Quantitativa A amplitude consiste numa contagem ou na mensuração numérica de uma característica
Número de valores nito (geralmente), ou número de valores in nito, mas que poderia ser
- Discreta
contado
- Contínua Número de valores in nito e não calculável
Classi cação das Variáveis pelo Nível/Escala de Medida:

Conjunto de modalidades (distintas) e de conjuntos de números (distintos) relacionados. Cada
modalidade corresponde um só número e cada número uma só modalidade. Teremos um ou outro tipo de
escala, segundo sejam veri cáveis empiricamente mais ou relações entre as modalidades que constituem a
escala (ver próximos slides).
Escalas de medidas (Stevans, 1946)
Nomimal: Os números são usados para nomear, identi car ou classi car (Os símbolos servem
apenas de rótulos, ou etiquetas. Estes apenas têm a propriedade da diferenciação (i.e., só é veri cável a
relação de igualdade-desigualdade). Transformações apropriadas: Qualquer substituição de um para um.
Limitação: técnicas estatísticas baseadas na contagem. Exemplo: os números de telefone; género (masculino/
feminino); raça/etnia; tipos de personalidade.
Ordinal: Os números indicam colocação ou ordem (números, indicam a posição de classes

equivalentes. Diferenciação e de ordem. Os símbolos ordenados não oferecem informação acerca das
 
fi
fi
fi
fi
fi
fi
fl
fi
fi
fl
fi
fi
diferenças de magnitude entre as classes. Transformações apropriadas: Qualquer transformação monótona.
Limitação: os métodos de classi cação e outras técnicas estatísticas baseadas em interpretações de “maior do
que” ou “menor do que “ são permitidos. Exemplo: os postos militares; classi cações do atraso mental,
posições na turma; classe social.
Intervalar: Os intervalos ou distâncias entre cada número e o seguinte são iguais, mas não se sabe a
que distância qualquer deles se encontra de zero. Têm as propriedades de diferenciação, ordem e
equivalência de intervalos.
Transformações apropriadas: De tipo linear (i.e., Y = a + bX). Limitação: são permitidas a soma, a subtração,
e as técnicas estatísticas baseadas nessas operações aritméticas. A multiplicação e a divisão não são
permitidas. Exemplo: Escalas de temperatura Celsius e Fahrenheit; tempo medido pelo calendário; altitude.
Razão: Pode-se imaginar cada número como uma distância medida a partir de zero. Todas as
propriedades das escalas de intervalo são aplicáveis e, para além destas, a origem da escala re ete a ausência
da característica medida.
Transformações apropriadas: Multiplicação por uma constante positiva. Limitação: Não há limitações. São
permitidas todas as operações aritméticas e técnicas estatísticas. Exemplo: Altura, peso, medidas do tempo
(v.g., tempos de reação).

fi
fi
fl
Aula 3: Estatísticas descritivas
• São procedimentos para sumarizar, organizar e simpli car os dados.
• começamos por organizar os scores/contagens numa tabela ou grá co de modo a que possamos ver o
conjunto de scores na totalidade
• Outra técnica comum consiste em sumariar um conjunto de dados através de um pequeno conjunto de
resumos numéricos (p. ex., o sumário com cinco números).
• Habitualmente usamos números de três categorias complementares (tendência central, dispersão e forma)
Distribuição de frequências
• Há dois procedimentos principais para sumariar um conjunto de dados:
✓Tabelas e/ou Grá cos (Tópico desta apresentação)
✓Números (Tópico de uma próxima apresentação)
• Habitualmente quererá usar ambos os procedimentos
Distribuição de frequências & Grá cos

• DF são modo de organizar os dados procedendo à listagem de cada resultado possível (incluindo aqueles
que não foram observados na amostra) numa coluna de números (ou categorias) e a frequência da ocorrência
de cada um deles noutra coluna.
• Grá cos são diagramas ilustrando ligações ou relações entre duas ou mais variáveis. Os grá cos são
frequentemente compostos por linhas ou pontos ligados.
Distribuição de frequências: Primeiro passo na análise de dados

Na investigação vamos querer dizer algo sobre os participantes da sua amostra, p. ex.: quantos
zeram parte do estudo? quantos eram do sexo masculino? Quantos do sexo feminino?
A distribuição de frequências é a ferramenta apropriada para esse objetivo, embora, na prática nem
sempre se use uma tabela para apresentar os dados, optando-se antes por uma narrativa simples
Efeito do tipo de dados/variáveis nas distribuições de frequências e grá cos

Há regras distintas para a construção de tabelas/grá cos;
Dependem do tipo de medida das variáveis observadas (e.g., qualitativas vs. quantitativas):
•Nominais - dados qualitativos
•Ordinais - dados qualitativo
•Métricos/Escalares (intervalares e razão) - dados quantitativo
Variáveis qualitativas (nível nominal) e Variáveis qualitativas (nível ordinal)

• tabela de frequências
• Grá co de barras/bar graph
• Grá co circular/ pie graph
• Output do IBM SPSS
• SPSS GRÁFICOS
Variáveis quantitativas (TABELAS E GRÁFICOS)

• Autoavaliação da capacidade de liderança (variável “quase” intervalar)
• Distribuição de frequências (não agrupada) - variáveis quantitativas
• Resultados de capacidade de liderança (ordem numérica ascendente sequencial)
• Output SPSS

fi
fi
fi
fi
fi
 
fi
fi
fi
fi
fi
fi
Variáveis de Intervalo/Razão
• As variáveis de quantitativas tendem a manifestar-se através de um grande número de valores e, muitas
vezes, cada um deles ocorrendo infrequentemente
• Construir uma distribuição de frequências simples, nestes casos, não é muito e caz e, no passado, a opção
era fazer uma divisão em classes (pode falar-se neste caso numa distribuição agrupada, ou classi cada,
para a distinguir das distribuições simples ou não agrupadas) - ver slide seguinte.
Distribuição em Classes
Numa apresentação formal, habitualmente apenas

incluiríamos as frequências absolutas e as percentagens. Neste
exemplo, seguiram-se as escolhas de Kirk (1978), quanto ao
número de classes (outras construções seriam possíveis).
f = frequência absoluta; p = proporção, ou frequência
relativa; % = percentagem; fac = frequência acumulada (absoluta);
facrel = frequência acumulada relativa; facr% = frequência acumulada em percentagem.
Representação grá ca: Histograma, Polígono de frequências, Polígono de frequências acumuladas (ogiva
de Galton), Output SPSS - Histograma
Grá cos simples vs. complexos
• Os grá cos anteriores retratam situações simples (v.g., uma única variável categorial ou contínua)
• A adição de uma (ou mais) variáveis, embora complexi que a representação grá ca, pode ser também
muito elucidativa de qualquer tendência que exista nos dados
• De seguida apresentamos* dois tipos de grá cos de barras que podem usar-se para planos de investigação
entre-grupos (between groups designs) e intra-grupos (within groups designs)
Plano de investigação Entre-grupos

fi
fi
fi
fi
 
fi
fi
fi
 
fi
Um diretor de cinema está interessado em saber se realmente existe um efeito “ckick ick” (um lme que
agrada mais às mulheres que aos homens).
• Obtém uma amostra de 20 participantes de cada sexo e mostrou a metade de cada
amostra um lme seria um “chick ick” (Bridget Jones’ Diary), e à outra metade
não se enquadra na categoria de “chick ick” (Memento).
• Todos os casos (participantes) são avaliados como indicador de quanto gostaram do
lme.
Uma maneira de apresentar os seus resultados é através de um grá co (Grá cos de
barras agrupados para amostras independentes)
Plano de investigação Intra-grupos

• investigação hipotética com pessoas que sofrem de soluços (hiccups/hipo);
• Os tratamentos médicos o ciais
• obteve 15 sofredores de soluços e durante um episódio de soluços
administrou cada um dos três procedimentos (em ordem aleatória) e com
intervalos de 5 minutos após ter obtido uma linha de base (baseline) de
quantos soluços emitiram num minuto.
• Contaram-se o número de soluços no minuto subsequente a cada procedimento e os dados foram
apresentados num grá co de barras (Grá cos de barras simples para dados de medidas repetidas (intra-
grupo).
Como construir uma distribuição com classes? (Martins, 1980, p. 39):

• Localize os valores máximo e mínimo das observações recolhidas (ou observadas). A diferença
destes extremos é o intervalo de variação (amplitude) da variável;
• Estabeleça, pela fórmula de Sturges, ou com base na sua experiência, o número de classes mais
apropriado para obter uma variação regular das frequências – a maioria dos autores sugere um n.o
entre 5 e 15 classes;
• Analise novamente as observações (dados) e veri que se estas têm tendência para concentrar-se em
torno de determinados valores. Oriente-se por eles para de nir a sucessão das marcas (ou do ponto
médio) de acordo com o número de classes que pretende estabelecer;
De na depois a sucessão dos extremos das classes, correspondentes às marcas estabelecidas;
• Proceda à contagem das observações segundo as classes estabelecidas. Veri que se a soma das
frequências apuradas é igual ao efetivo (ou tamanho) da amostra;
• Represente gra camente a distribuição obtida (optativo, mas bastante recomendado em análise de
dados.)
Nota sobre a fórmula de Sturges
✓O número k de intervalos (i.e., classes) para cada conjunto de observações com n valores pode ser
calculado como: k = 1 + 3,322(log10 n) (fórmula de Sturges) [log, também, denominado logaritmo comum]
✓Exemplo: para um conjunto com n = 169 observações obtemos log10(169) = 2.2279; Assim, temos: k = 1
+ 3.322 × 2.2279 ~= 7.68
(i.e., aproximadamente) 8 intervalos/classes.
✓Para pequenas amostras alguns autores sugerem que se use antes a fórmula: k = √n
Onde k = n.o de classes e n = efetivo (tamanho) da amostra
Nota: Os dois métodos podem propor soluções muito diferentes (e.g., k = 13, versus 8 = k de Sturges).

fi
fi
fi
fi
fi
fi
fl
 
fl
fi
 
fi
 
fi
fi
 
fi
fi
fl
fi

Aula 4: Descrição das distribuições através de números
Medidas de Tendência Central

Medida Função Fórmula
média A descrição de uma distribuição quase sempre inclui uma medida do seu
aritmética centro. A mais comum destas medidas é a média aritmética, ou simplesmente,
, M, _x média. Denotando-se n observações por x , x ,..., x , a sua média é:
1 2 n
média uma distribuição precisamos de atribuir um peso diferente às distintas

aritmética observações. Nesse caso, temos de calcular a média ponderada, pesada, ou
ponderad combinada.
Denotando-se n observações por x , x ,..., x e, os respectivos pesos, por p ,
a, _X p 1 2 n 1
p , ..., p a média ponderada é
2 n
média comparar várias populações/amostras, ou para descrever como uma variável

aritmética evolui ao longo do tempo. Pode ser muito pouco ável se a população não é
truncada , homogénea (Para evitar este problema, podemos calcular a média truncada/
_x aparada.)
5% Como fazer? Eliminamos os valores mais extremos (% desejada) e apenas
calculamos a média para os restantes.
Mediana, “valor da variável que ocupa a posição central da sucessão de observações ou

mdn* na distribuição de frequências”Para achar a mediana de uma distribuição:
• Ordene todas as observações, da menor para a maior (ou vice-versa).
• Se o número n de observações é ímpar, a mdn é a observação do centro dessa
lista ordenada. Determine a localização da mediana contando (n+1)/2
observações a partir do começo da lista.
• Se o número n de observações é par, a mdn é a média das duas observações
centrais na lista ordenada. A localização da mdn é ainda (n+1)/2 a contar do
começo da lista.
*Ao contrário da média aritmética não há uma notação uniforme para esta estatística. Nas publicações
psicológicas é frequente usar-se a palavra mediana (em itálico).
Moda, É a modalidade da variável estudada que se obtém com maior frequência.

*Não há uma notação uniforme para esta estatística. Nas publicações psicológicas é frequente usar-se a palavra
Mo* moda (em itálico).

 
fi
Medidas de Variabilidade
Medidas Função Fórmula
Dispersão iz-nos se uma grande proporção dos dados está concentrada na

(variáveis categoria modal, ou se está dispersa por todas as outras categorias. A
qualitativas): razão de variação é definida como:
A razão de
variação
Dispersão é apenas a diferença entre o valor x máximo e o valor x mínimo A=x −x
(variáveis observado: max min
quantitativas) :
Amplitude
Total
2 conjunto de observações é a média dos quadrados dos desvios das
Variância* s observações a respeito da sua média. Em notação estatística, a
(Inferencial) variância de n observações x , x ,..., x é
1 2 n
Desvio-padrão 2
(Inferencial) * s é a raiz quadrada da variância s
Soma dos utilizada noutras técnicas estatísticas mais avançadas.

Quadrados dos O denominador da fração contém os graus de liberdade, gl (em inglês,
Desvios (SDQ) degrees of freedom, df).
Variância Quando trabalha com populações (algo raro!) ou quando o seu
(versões interesse é exclusivamente descrever a dispersão de uma amostra
descritiva e concreta, as fórmulas anteriores sofrem uma ligeira alteração no
Populacional) denominador; em vez de n – 1 usará N (i.e., efetivo da amostra) como
divisor. Note que nas fórmulas acima usámos letras gregas, µ e σ;
Desvio-Padrão
(versões
descritiva e
Populacional)
Coeficiente de Uma medida absoluta de dispersão, por vezes dada como

Variação percentagem. Em princípio deve ser usado apenas com variáveis de
nível proporcional ou de razão
*ambos medem a dispersão tomando em consideração o grau de afastamento das observações da respectiva média. Neste curso a fórmula inferencial será usada,
se nada for dito em contrário!
Medidas de Localização/Posição _ Não Centrais

Quantis (e.g., Quartis, Decis, Percentis/Centis.) : são
usadas, para variáveis quantitativas, medidas no nível intervalar/
razão. Podem, ainda, ser usadas com variáveis no nível ordinal.
Não são usadas com medidas nominais.
Modo de determinar como um registo individual se
compara com todos os outros.
A medida de posição mais simples é o quartil. Se
ordenarmos os dados de forma ascendente de acordo com a sua
magnitude, os quartis são os valores que dividem a população ordenada em quatro grupos iguais. Ou seja,

25% da população/amostra tem um resultado menor ou

igual ao 1o quartil (Q ), 50% tem um resultado menor ou
1
igual ao 2o quartil (Q ), e 75% tem um resultado inferior
2
ao 3o quartil (Q ). A mediana é, por definição, o 2o quartil.
3
Decis, Centis/Percentis: semelhante, podemos

definir os decis: dividem a população em dez grupos iguais.
Todavia, a medida de posição mais comum, é o (per)centil.
Os dados são ordenados em função do seu tamanho e
divididos em 100 grupos iguais.
Medidas de dispersão baseadas nos quantis

• Amplitude Interquartílica (ou Interquartis), Q
Q=Q −Q 31
Onde, Q e Q são, respetivamente, o terceiro e o
3 1
primeiro quartis. O terceiro quartil é o valor que tem
abaixo de si 75% das observações e 25% acima de si. O
primeiro quartil, por sua vez, separa 25% das
observações inferiores das restantes 75%.
• Amplitude Semi-Interquartílica (ou, Interquartis),

ASI
Alguns autores preferem calcular uma medida próxima da referida anteriormente, a Amplitude Semi-
Interquartílica (ASI):
ASI = (Q3-Q1)/2
NÃO USADAS NESTE CURSO

Medidas da Forma da Distribuição
Simetria/Assimetria :Uma distribuição diz-se simétrica se a média (aritmética) divide o histograma em duas metades
iguais, uma constituindo a imagem em espelho da outra. Uma distribuição simétrica típica é a distribuição normal.
A curva normal, por exemplo, tem uma assimetria de 0 (zero). Se a assimetria é maior do que 1, a forma da distribuição
começa a afastar-se significativamente da curva normal. Se a distribuição não é simétrica, diz-se assimétrica! O que
quer dizer que um dos lados do gráfico da distribuição é mais alongado do que o outro. A distribuição é assimétrica
positiva (fig. A) se o alongamento tende a ocorrer no lado direito e é assimétrica negativa (fig. B) se o alongamento
ocorrer predominantemente do lado esquerdo.
Curtose/Achatamento : Esta é uma medida que descreve o grau de achatamento ou afunilamento da curva da
distribuição: A distribuição normal tem uma curtose igual a 0 (zero) - mesocúrtica.; Um valor positivo -dados estão
concentrados no centro e que a distribuição apresenta um forte pico/elevação nesse lugar - leptocúrtica.: Um valor
negativo -dados estão dispersos e que a distribuição é mais achatada do que a curva normal - platicúrtica; Valores de
curtose superiores a +/-1 indicam que a curva não é mesocúrtica.
Distribuições simétricas e mesocúrticas – critério de decisão convencional

ASSIMETRIA : Coeficiente se situa no intervalo [-1,+1] - distribuição aproximadamente simétrica.
CURTOSE: Coeficiente se situa no intervalo [-1,+1], considera-se a distribuição mesocúrtica (ou normal). Nota: Esta
opinião não é consensual!
Diagramas derivados da Análise Exploratória de Dados

Diagrama de caule-e-folhas(stem-and-leaf): Os gráficos/diagramas de caule-e-folhas são úteis para apresentar a
frequência com que certas classes ou valores ocorrem; O “caule”/ “Stem” são os valores da coluna mais à esquerda e
que contém o dígito dominante (e.g., classe dos 20, 30, 40, etc.); As “folhas”/ “Leaves” são as listas na(s) colunas mais
à direita e contêm os “trailing digits”.
Diagrama de extremos-e-quartis, ou caixas-de-bigodes(box-and-whiskers)

 
 
 

Aula 5: Medidas de localização/Posição Relativa
Problema
•Nas ciências sociais, frequentemente, estamos preocupados com a interpretação e a comparação de
resultados individuais
• Existem vários métodos disponíveis para medir a posição relativa de um resultado
• Os dois mais comuns - Percentis e Resultados Z - serão apresentados de seguida.
• Iremos ainda referir um terceiro método (Resultados/Pontuações T), igualmente, muito popular
na Psicologia.
• O QI é outro método muito popular para atribuir significado a uma caraterística individual muito estudada
na Psicologia (a inteligência).
Percentis, P e Rank Percentílico (PR: Posto Percentílico)

i
• O PR, Rank Percentílico (Percentile Rank) - revelar a posição relativa numa distribuição.
• PR (nº percentagem de scores) que são menores ou iguais que um dado score numa qualquer medida.
•“os percentis são pontos [scores] numa distribuição contínua abaixo dos quais estão situadas determinadas
percentagens de N”, Ou seja, quando um score é definido pelo seu rank percentílico, chama-se percentil.
Exemplos : se numa distribuição 30 é o valor associado ao PR de 75, então, o score 30 é o percentil e
75 é o PR de 30 (i.e., 75% dos valores/scores na distribuição são valores menores ou iguais a 30),
simbolicamente P = 30.
75
Se, por exemplo, um aluno alcançou 45 pontos num teste de realização académica e, se o percentil,
P, que lhe corresponde é 70, então 70% de todos os resultados da distribuição estarão abaixo do resultado 45.
• Podemos expressar o resultado (pontuação/score) de 45 como P isto é, P = 45.
70 , 70
Comparar Percentis :
Com os percentis podemos ainda comparar facilmente a realização do indivíduo em diferentes testes
– um percentil de 55 no teste A, por exemplo, sendo superior ao percentil de 50 obtido no teste B. (Lembre:
Percentis são Quantis! )
Donde, para conhecer o valor de um qualquer quantil, basta calcular o respetivo percentil. Contudo,
não existe uma única maneira de calcular percentis! Uma maneira bastante popular (usada em programas
como o SPSS) baseia- se numa regra bastante simples (ver slide seguinte). Usámos este método no cálculo
dos percentis requeridos no estudo de caso (Alzina).
Método usado no SPPS (default)

Comece por ordenar os casos de forma ascendente tendo em conta o seu valor em X, e
imediatamente calcule = ( + 1)/100. Onde: k = percentagem (%) de casos acumulados que se pretende
encontrar. De seguida comprove qual das duas condições se aplica:
• se i é um número inteiro, então P = Y [1] • se i é um número decimal, então P = (1 – d)Y + (d) Y . [2]
k i k i i+1
• Onde: Yi é o valor da variável que ocupa a posição correspondente à parte inteira de i; e, • d é a parte
decimal de i.

𝑘
𝑛

 
 

Dois métodos (complementares) de cálculo dos percentis

MÉTODO 1 - Percentil (P) - parte-se da MÉTODO 2 - Ordem Percentílica (OP) - parte-se
percentagem e quer- se obter o valor da pontuação de uma certa pontuação e quer-se obter o percentil
correspondente na distribuição - Percentil!) que lhe corresponde
É o ponto de uma distribuição de frequências abaixo É a posição de um resultado numa
do qual ficam uma percentagem dos resultados (e.g., escala de 100.
pontos abaixo dos quais ficam 10%, 43% ou 85%).
Ao calcular-se os percentis parte-se de uma certa No cálculo da OP parte-se de um resultado/medida

percentagem de N, digamos 15% ou 62%. Conta-se, individual e determina- se a percentagem de
então, na distribuição a percentagem dada e o ponto resultados/medidas que se situa abaixo do mesmo.
atingido será o percentil desejado, por exemplo, P Se essa percentagem for 62, digamos, o resultado
15 terá a ordem percentílica, ou OP, de 62 numa escala
ou P . de 100.
62
Legendas: P = Percentil/Ponto percentílico

p
p = Percentil desejado (e.g., 10, 20, 50) L = Limite inferior do intervalo onde se localiza o P
p
N = Efetivo (número total) da amostra S = Soma dos resultados localizados abaixo de L
f = Número de resultados dentro do intervalo que contém Pp
i = Amplitude do intervalo
Resultados z, típicos, padronizados, ou Resultados T

estandardizados
Um resultado típico, ou resultado z, informa-nos Para eliminar os inconvenientes de resultados

acerca da localização relativa de cada resultado negativos e com casas decimais, os psicólogos
individual relativamente à média dos resultados da inventaram outras procedimentos para proceder ao
distribuição. Resultado z indica-nos, por um lado, se escalonamento das respostas, um dos mais comuns,
o resultado está acima ou abaixo da média e, por sendo os resultados, ou escalas T
outro, revela-nos a distância que separa esse ponto
da média.
Os resultados z têm, necessariamente, média = 0 e
desvio-padrão = 1
T = bz + a
z = resultado padrão x = resultado bruto M = média Onde:

DP = desvio padrão a = média nova;
z = resultado padrão
b = desvio padrão novo

 

 
 

 
 
 

 
 
Exercícios: Teste Estatístico z Uma Amostra : σ conhecido versus σ desconhecido
Um grupo (n = 100) viu excertos de cenas

violentas (v.g., cenas do filme Karate Kid III)
Depois de verem o vídeo, os participantes
tiveram como tarefa criar associações livres a 26
palavras homónimas*. Por exemplo: Cuff, Mug,
Plaster, Pound, Sock
Resultados quantitativos obtidos no estudo:

Número médio de associações livres de tipo
agressivo = 7.10 • n = 100
Assuma que se sabe que a média populacional
(µ) de produção de palavras de teor agressivo é 5.65, e
o desvio padrão populacional (σ ) é 4.5
Estes são os parâmetros: µ e σ, respetivamente
É 7.10 suficientemente maior do que 5.65 para
concluirmos que ver o vídeo afeta os resultados obtidos?
É aqui que o teste estatístico (i.e., a inferência estatística) mostra a sua potencialidade.
Etapas para Testar uma Hipótese* (Dunn)

1. Declare as hipóteses nula (H ) e alternativa (H ), e selecione um nível de significância (valor-p ou
0 1
nível alfa) para o teste estatístico.
2. Calcule o erro-padrão da média (se aplicável) e decida se usará um teste de significância unilateral
ou bilateral; esta escolha determinará a região (regiões) crítica (críticas) e o(s) valor(es) crítico(s)
para rejeitar ou não rejeitar H .
0
3. Calcule o teste estatístico e os graus de liberdade (se aplicável), e depois determine se rejeita ou não
rejeita H .
0
4. Interprete e avalie os resultados à luz da hipótese nula e da hipótese alternativa.
*Nota: As etapas esboçadas acima devem ser usadas de modo flexível e adaptativo. Alguns testes estatísticos
usarão todas as etapas referidas, outros apenas uma ou duas.
Revisitando o estudo de Bushman (1998)
H : µ = 5.65 H :µ 5.65 (teste/hipótese bilateral)

• 0 1
Use z (Distribuição normal reduzida) [fundamentando-se no TLC]. Assumimos que a distribuição de

amostragem da variável (população) será normal, i.e., N(0,1). Decida a probabilidade de erro de Tipo I (nível
de significância, ou alfa ) ;Obtenha os valores críticos (i.e., ± zc) : Calcule p(média da amostra = 7.10, se µ
= 5.65 (H )). Tome uma decisão (Rejeitar vs. Não Rejeitar H )
0 0
Teste z :
Compare z calculado/observado (i.e., a Estatística de Teste) com a distribuição de amostragem (in
casu, a distribuição normal reduzida)
Os resultados devem parecer consistentes, com essa distribuição se a hipótese nula for verdadeira
Lógica do teste
Calcular a probabilidade de obter aquela média se a hipótese nula for verdadeira (note que se trata de
uma probabilidade condicional).
Rejeite a hipótese nula se a probabilidade for muito pequena (p < ).
Etapa 1
• Formule as hipóteses:

 
 

≠

 
 

𝛼
 

• Escolha o nível de significância:

• = .05 5% (teste bilateral)
Usando o teste z Para Testar H
0
• Calcule z
• Decisão:
Se z > ± 1.96 (ou mais geralmente, se z > ± 1.96 ), então rejeite H
0
Ora, como 3.22 > 1.96, então, A diferença é estatisticamente significativa (rejeita-se a hipótese nula).
Calcule p(média da amostra H )

0
Atualmente é habitual apresentar a probabilidade p de obter um valor maior ou igual do que foi
observado (estatística de teste) se a hipótese nula for verdadeira.
• Neste caso, p = .001.
• Escreveria (estilo APA): z = 3.22, p = .001

𝛼
𝑜
𝑢

EXERCÍCIOS: Distribuição Normal Dois Tipos de Problemas Práticos

De onde provêm os valores das áreas (percentagens/probabilidades); Por exemplo:
P(z _>+1.14) = 12.71% ; P(z _>+2.00) = 2.28% ; (z _<3.00) = 0.13%
Exercício 1:
Suponha que a variável X segue uma distribuição N(50,8)*, e queremos obter as seguintes probabilidades:
• a) Observar um valor que quando muito (i.e., que no máximo) seja igual a 56?
• b) Observar um valor que no mínimo seja igual a 52.8?
• c) Observar um valor compreendido entre 40.8 e 48.3?
*Leia-se, X segue uma distribuição normal, com µ = 50 e σ = 8!
Resolução: “Observar um valor que quando muito (i.e., que no máximo) seja igual a 56?
a) Trata-se de obter a probabilidade acumulada do valor 56, e para tanto basta estandardizar/tipificar/reduzir
esse valor e procurar, na tabela da distribuição normal reduzida, a proporção da área que se encontra à sua
esquerda. Ou seja:
P(X ≤ 56) = ?
• [estandardize] P(z ≤(56-50)/8) = 0.75
• [Leia valor na tabela z; ver slide seguinte] P(z ≤ 0.75) = 0.7734.
Donde .77 da área está abaixo de 56 (ou, a probabilidade de obter um valor inferior ou igual a 56,
nas condições dadas, é de .77, depois de arredondar.) [Pode apresentar o resultado em %; neste caso:
P(X ≤ 56) = 77%.]
b) No segundo caso trata-se de obter a probabilidade que corresponde à área extrema (cauda) da distribuição
normal reduzida que 52.8 tem acima de si.
Uma vez que a tabela da distribuição normal que estamos a usar nos dá essa área diretamente, basta
que transformemos o valor de X numa pontuação tipificada (z) e depois ler diretamente da tabela. Assim:
• P(X ≥ 52.8) = P(z ≥ (52.8−50)/ 8) = = P(z ≥ 0.35) = 0.3632.
Donde .3632 da área da curva está acima de 52.8 (ou, a probabilidade de obter um valor maior ou
igual a 52.8, nas condições dadas, é de .36, depois de arredondar.) [Pode apresentar o resultado em %; neste
caso: P(X ≥ 52.8) = 36%.]
c) No terceiro caso trata-se de obter a área da curva normal limitada pelos valores 40.8 e 48.3.
Trata-se de encontrar a diferença entre a probabilidade abaixo de 48.3 da que se encontra abaixo do valor
40.8 (Dada a forma da tabela que utilizamos, temos que ter em conta o conceito de simetria subjacente à
distribuição normal). Assim:
P(40.8 ≤ X ≤ 48.3) = P((40.8−50)/8) ≤ z ≤ (48.3−50)/8)) = P(−1.15 ≤ z ≤ −0.21)
[por simetria, uma vez que ambos os valores estão no lado esquerdo da curva, use de seguida os valores
positivos e leia as proporções respetivas na Tabela z.
Assim, área acima de 0.21 --> 0.4168 e acima de 1.15 --> 0.1251. Subtraindo, então 0.4168-0.1251 =
0.2917] = 0.2917 ≤ 0.29
Donde .2917 da área da curva normal está entre 40.8 e 48.3 (ou, por outras palavras, a probabilidade
de obter um valor no intervalo 40.8-48.3, nas condições dadas, é de .29, depois de arredondar.) [Pode
apresentar o resultado em %; neste caso: P(40.8 ≤ X ≤ 48.3) = 29%.]

 
 

Exercício 2:
Suponha que, continuamos interessados em estudar a variável X que, tal qual foi dito, segue uma distribuição N(50,8),
e queremos obter os valores desta variável (X) para os quais se que cumprem as seguintes condições:
a) Aquele valor de X para o qual a probabilidade de observar um valor quando muito igual (no máximo) a ele é 0.1736.
Dica: Trata-se de encontrar X que delimita a área de 0.1736 (probabilidade acumulada, por isso localizada na cauda
[metade] esquerda da curva.)
b) Aquele valor de X para o qual a probabilidade de observar um valor que seja no mínimo igual a ele é 0.9207.
Dica: Trata-se de encontrar o X que deixa acima (à direita da curva) 0.9207 da área, ou por outro lado, que deixa abaixo
de si 1 – 0.9207 = 0.0793 da área da curva.)
c) Os dois valores de X que incluam a metade central (i.e., 0.50 ou 50%), da distribuição normal.
Resolução :
a) Aquele valor de X para o qual a probabilidade de observar um valor quando muito igual a ele (ou seja, no
máximo) é 0.1736.
Neste caso usamos a fórmula: X = z σ + µ
Trata-se de obter a probabilidade acumulada do valor (i.e., o valor que deixa à sua esquerda) a área
de 0.1736.
Recorrendo ao procedimento de conversão na variável reduzida e socorrendo-se da tabela normal
reduzida, z (e, também, a propriedade de simetria da curva), comprovará que se trata do valor z = −0.94.
Agora basta reconverter este valor usando a média e o desvio padrão da distribuição populacional:
ou seja, sendo z = −0.94, então X = (− 0.94*8) + 50 = 42.48.
0.1736
b) Aquele valor de X para o qual a probabilidade de observar um valor no mínimo igual a ele é 0.9207.
No segundo caso trata-se de obter o valor de X que deixa uma área à sua direita de 0.9207.
Esse valor pode ser obtido na tabela da distribuição reduzida que utilizamos neste curso (Tabelas da
Universidade de Vassar, EUA), subtraindo 1 - 0.9207 = 0.0793. (i.e., 0.073 é o valor da área no extremo, ou
na cauda esquerda da distribuição e, o valor de z [lido na tabela, usando a simetria] que lhe corresponde é
1.41).
Por simetria, o valor que deixa à sua esquerda 0.0793 da área da distribuição Normal é z = -1.41.
Então, convertendo para N(50,8), teremos:
X = (-1.41*8) + 50 = 38.72.
c) Os dois valores de X que incluem a metade central (0.50 ou 50%) da área da distribuição normal.
Trata-se de obter as duas pontuações que deixam à sua esquerda e direita, respetivamente, áreas
iguais a 0.25 (Trata-se, afinal, de obter os valores dos 1o e 3o quartis da distribuição normal).
Segundo a Tabela da distribuição normal reduzida essas pontuações correspondem aos valores
típicos (ou reduzidos), respetivamente, -0.67 e 0.67*. Reconvertendo esses valores, teremos, respetivamente:
X = (−0.67*8) + 50 = 44.64 X = (+0.67*8) + 50 = 55.36
Donde, aproximadamente, .50 (ou 50%) da área da curva está entre 44.64 e 55.36 (ver slide
seguinte).
*Uma vez que a área 0.25 não está inscrita na tabela, usámos, neste caso, uma aproximação,
aceitando o primeiro valor de z cuja área excede
(ultrapassa) a área requerida (.25), ou seja, 0.67 (Na tabela z a área acima deste valor é 0.2514).
Outra alternativa: Usar a semissoma dos valores de z entre os quais a área pretendida (.25) está
compreendida. No caso, os dois valores de z são, respetivamente, .67 e .68, donde (0.67+.68)/2 dá .675.
Assim, poderia igualmente usar ±.675 na fórmula acima!

 
 

Exercícios Adicionais
1. Se os resultados estão normalmente distribuídos com uma média de 30 e um desvio padrão de 5,

qual a percentagem de resultados (a) que é maior ou igual do que 30? (b) que é maior ou igual do
que 37? (c) que está entre 28 e 34?
2. (a) Qual é a média e o desvio padrão da distribuição normal padronizada? (b) Qual seria a média e o
desvio padrão de uma distribuição criada multiplicando a distribuição normal padronizada por 10 e
adicionando 50?
3. A distribuição normal é definida por dois parâmetros. Quais são?
4. (a) Que proporção de uma distribuição normal está dentro de um desvio padrão da média? (b) Que
proporção está acima de 1.8 desvios padrão da média? (c) Que proporção está entre +1 e +1.5
desvios padrão?
5. Um teste está normalmente distribuído com uma média de 40 e um desvio padrão de 7. (a) Qual o
resultado que seria necessário para um estudante estar no percentil 85? (b) Qual o resultado que
corresponde ao percentil 22?
6. Assuma uma distribuição normal com uma média de 90 e um desvio padrão de 7. Que limites
(scores) incluiriam 65% dos dados do centro da distribuição?

 
 
 

 
 
 
Aula 6: Probabilidade, Distribuições de Probabilidade e Curva Normal
Elementos da Teoria da Probabilidade :

Probabilidade é a base da inferência estatística, mas o que é probabilidade?
Perspetiva Clássica ou lógica de Perspetiva empírica ou Perspetiva subjetiva ou

probabilidade frequentista de probabilidade personalista de probabilidade
Aprobabilidadedeum Probabilidade,nesta perspetiva, é
acontecimento, A, é dada pelo A probabilidade do acontecimento a medida da força da nossa
número de acontecimentos A, p(A), é o número aproximado expectativa (crença subjetiva) de
favoráveis a A, n , dividido pelo pela razão n /n à medida que o que um acontecimento ocorrerá.
A A
número total de observações, n, Por ex.: “É pouco provável que
número total de acontecimentos
tende para o infinito. consiga viver até aos 100 anos.”
igualmente prováveis, n .
s
Propriedades formais (Axiomas) da probabilidade
• A cada ponto do espaço experimental podemos atribuir um número designado por probabilidade de Ei tal
que:
• (1) 0 ≤ p(Ei) ≤ 1 - a probabilidade atribuída a um acontecimento é um número maior ou igual a 0 e menor
ou igual a 1
• (2) p(E )=1 - soma das probabilidades relativas ao espaço experimental é igual a 1
• (3) p(s) = 1 - a probabilidade do acontecimento certo, s, é sempre 1.
Distribuições de probabilidade
“é uma função matemática que faz corresponder uma probabilidade de ocorrência a cada uma das realizações
duma determinada variável aleatória”
•
Distribuições de Probabilidade Discretas e Contínuas (interesse para a psicologia)
• Distribuições de uma variável aleatória discreta (p. ex., Binomial, Multinomial, Hipergeométrica, Poisson)
• Distribuições de uma variável aleatória contínua (p. ex., Normal, Qui-quadrado, t de Student, F de
Snedecor)
Distribuição Normal e Curva Normal

1730 - Abraham Moivre (matemático francês)
Curva normal – caraterísticas essenciais

• É simétrica, têm um único pico (unimodal) e apresenta uma forma de sino.
• Tem uma área exatamente igual a 1 (ou a 100%) abaixo dela.
• a área é a proporção (ou percentagem) de todas as observações que se incluem nesse intervalo.
• a curva de densidade exata para uma distribuição normal particular é caracterizada (completamente)
pela sua média, µ e seu desvio padrão, σ.
Parametrização da curva normal [1] (obtidos diretamente de tabelas)

• uma variável aleatória distribui-se segundo um modelo normal, com parâmetros µ e σ, se a sua função
de densidade de probabilidade para qualquer valor de x vem dada por:

onde∏ = 3.1416...e e = 2.718....
• Pode representar-se : x—> N(µ,σ ) (não será necessário usá-la diretamente neste curso)
A Distribuição Normal Reduzida [2] (obtidos diretamente de tabelas)

Formula para variáveis tipificadas, ou reduzidas a função de densidade de probabilidade pode ser
simplificada, dado que o desvio padrão é 1 e a média é 0. Se uma variável X tem distribuição normal com
média µ e desvio padrão σ, (i.e., N(µ,σ) ) então a variável reduzida:

A distribuição normal reduzida é um caso especial da distribuição normal. É a distribuição
que se obtém quando uma variável aleatória normal tem média zero e desvio-padrão 1.
Distribuição Normal Reduzida [3] (obtidos diretamente de tabelas)
Inserindo [2] na fórmula [1] e simplificando, então teremos a seguinte representação final:
Substituindo diferentes valores de z em [3], diferentes valores de Y serão

calculados.
0
Quando z = 0, Y = 1/√2∏ = .3899. Isso decorre de e = 1. Portanto a ordenada
na média da curva normal reduzida é dada pelo número .3899.
Para z = +1, Y = .2420, para z = +2, Y = .0540, etc.
Recorrendo ao cálculo diferencial e integral é possível obter a área da curva
entre as ordenadas na média e diferentes valores de z. (obtidos diretamente de
tabelas, calculadoras e de vário tipo de software)
Distribuição Normal: Cálculo de Probabilidades - construíram-se

tabelas específicas
Cálculo de probabilidades – Distribuição Normal (DN)

Dois tipos de problemas essenciais com a DN:
1. Probabilidade de obter um score (ou mais do que um score)
numa variável, assumindo que esta segue uma DN
Suponha que a variável X segue uma distribuição N(50, 8).
Calcule a probabilidade de obter um score que quando muito (i.e., no
máximo) seja 56?

2. Calcular o score (ou mais do que um score), numa variável que segue a DN, correspondente a
uma dada probabilidade.
Suponha que a variável X segue uma distribuição N(50, 8). Calcule o valor de X cuja probabilidade
de ser obtido é quando muito (i.e., no máximo) de .1736.
A regra 68―95―99.7
Usar a curva Normal de modo descritivo. Na distribuição N(µ, σ), aproximadamente:
• 68% das observações estão no intervalo ±1σ da média µ.
• 95% das observações estão no intervalo ±2σ de µ.
• 99.7% das observações estão no intervalo ±3σ de µ.
• Nota: Na verdade os valores exatos são 68.27% (±1 σ), 95.45% (±2σ), 99.73% (±3σ), respetivamente.
Avaliação da normalidade de uma distribuição de frequências

• Como podemos julgar, informalmente, se os dados estão distribuídos de modo aproximadamente
normal?
• Diagramas de caule-e-folha e histogramas podem revelar as características distintamente não-
normais de uma distribuição (outliers, assimetria acentuada, lacunas/vazios ou aglomerados em
pontos específicos da distribuição).
• Poderá, ainda, usar a seguinte estratégia: marque os pontos média, média ± 1 desvio padrão, média ±
2 desvios padrão e média ± 3 desvios padrão no eixo dos X. O que nos dá a escala natural para a
distribuição normal. Compara-se depois a contagem (percentagem) das observações em cada
intervalo com a regra 68―95―99.7.
• NB: Conjuntos de dados pequenos raramente se adaptam à regra 68―95―99.7 de uma forma
perfeita. Isto é verdadeiro mesmo para observações extraídas de uma população maior que tenha
realmente uma distribuição normal!

 
Aula 7: Inferência Estatística em Psicologia
Conceito de Inferência Estatística: Conceitos e métodos de inferir (i.e., extrair conclusões acerca de) uma
característica numérica de uma população quando apenas se dispõe de informação da amostra.
Probabilidade é a base da inferência estatística

Desde que possa admitir que uma variável assume uma dada distribuição teórica (e.g., distribuição
normal-DN), podemos facilmente relacionar qualquer tipo de scores estandardizados (e.g., notas z, no caso
da DN) com probabilidades e proporções.
Em geral, um teste de hipóteses é um procedimento matemático usado para gerar a probabilidade
(i.e., o valor-p) de se obter os resultados que se apuraram, ou outros ainda mais extremos, se a hipótese nula
for verdadeira.
Assim, as probabilidades podem ser associadas aos scores se a distribuição teórica desses scores for
conhecida. A probabilidade de um dado valor t, por exemplo, pode calcular-se se a distribuição dos valores t
possíveis é conhecida.
Uma inferência pressupõe sempre uma margem de erro e uma probabilidade de erro
A. Estimação (pontual ou intervalar)

Baseia-se na distinção entre amostra e população. Consiste em (“adivinhar”) o valor de uma medida
populacional (i.e., um parâmetro) quando apenas o valor da amostra (i.e., uma estatística) é conhecido.
Os inquéritos de opinião (sondagens) baseiam-se sempre em estimações. O inquérito de opinião é
conduzido numa amostra representativa e os resultados obtidos são generalizados para a população com uma
margem de erro e uma probabilidade de erro.
Um objetivo da estatística é fazer inferências acerca de uma população com base na informação
contida na amostra.
Populações são caracterizadas por medidas descritivas numéricas denominadas parâmetros.
Parâmetros populacionais típicos são a média µ, o desvio padrão σ, a correlação p e a proporção ∏.
Habitualmente, estimaremos alguns destes parâmetros, mas a média populacional (µ) é seguramente
o parâmetro mais frequentemente estudado na psicologia.
Métodos de estimação
Os problemas típicos de inferência associados com a estimação resumem- se a estimar (predizer) o
valor do parâmetro populacional de interesse. Donde, estimação é a resposta à questão “Qual é o valor do
parâmetro populacional?” Duas respostas possíveis: estimação pontual versus estimação intervalar
Estimador: Um estimador é uma regra, com a fórmula tal como ∑x/n, que nos diz como calcular
uma estimativa de um parâmetro da população utilizando a informação contida numa amostra.
Estimador pontual: um único número, a estimativa, a um ponto numa linha de números.
Estimador intervalar: envolve dois números e os pontos que lhe estão associados definem um
intervalo numa linha de pontos.
B. Teste de Hipóteses: Testes de Significância Estatísticos (Paramétricos Não-paramétricos, ou de

distribuição livre)
Baseia-se igualmente na distinção entre a amostra e população, mas o processo está invertido.
Formula-se uma hipótese acerca de um parâmetro de uma população. Com base na hipótese
predizemos um intervalo de valores que a variável pode provavelmente assumir numa amostra
representativa. De seguida realizamos a investigação e obtemos uma medida da variável numa amostra. Se o
valor obtido se situar dentro do intervalo que prevíamos concluímos que a hipótese era razoável. Se, pelo o
contrário, o valor se situar fora do intervalo esperado (previsto) rejeitaremos a hipótese

Testes Estatísticos Paramétricos e Não- Paramétricos

A estatística inferencial oferece-nos dois tipos de testes de hipóteses – paramétricos e não-
paramétricos; no SPSS temos estas duas opções disponíveis
O tipo de teste apropriado para os dados depende não apenas do nível de medida dos dados
(nominal, ordinal, ou intervalo/razão), mas ainda dos pressupostos respeitantes às populações e às medidas
de dispersão, ou variabilidade (variância)
Os testes paramétricos são usados para analisar dados de intervalo (scale), enquanto os não-
paramétricos são usados para analisar dados de ordens (ranks) e dados nominais (categoriais).
Muitos testes paramétricos, tal como o teste t, são bastante robustos, ou seja, mesmo que os
pressupostos não sejam completamente verificados nos dados, os resultados serão mesmo assim viáveis e
suscetíveis de uma interpretação estatística válida.
Os dois métodos de inferência – Estimação Vs Hipóteses

Faz-se estudos onde se utilizam os resultados encontrados numa amostra para
generalizar sobre a população, por exemplo:
Se a média da amostra é 6.0, a média da população também deverá ser 6.0.
Mas na verdade o método não funciona assim e o que de facti se faz é colocar a questão de outra
forma:
SE O PESO MÉDIO DAS TARTARUGAS É 2.0KG,QUE PERCENTAGEM DE VEZES SE PODE
ESPERAR ENCONTRAR UMA AMOSTRA DIFERENTE DA MÉDIA DA POPULAÇÃO?
Em ambos os casos desejamos fazer inferências acerca de parâmetros, no entanto podemos:
Estimar o valor do parâmetro populacional ou
Testar uma hipótese acerca do valor do parâmetro populacional o ambos os procedimentos
(estimação e teste de hipóteses) envolvem procedimentos diferentes
O objectivo da estatística é fazer inferências acerca da população com base na informação contida na
amostra.
Populações são caracterizadas por medidas descritivas numéricas denominadas parâmetros. Os
parâmetros populacionais típicos são: Média; Desvio Padrão; Proporção
Ilustração de problemas de estimação: Os parâmetros de interesse eram os seguintes:
Média de PCF na população de enfermeiras

Desvio padrão da PCF na população e a proporção de enfermeiras com PCF maior do que 50%
Ilustração de Problemas de Inferência

 
 

Usando uma versão mais simplificada deste último estudo, um estudo com um grupo é mais fácil
realizar que um estudo com dois grupos. Assim , suponha-se que:
As pessoas normalmente oferecem 5,65 associações agressivas a palavras homónimas (parâmetro
populacional)
Um grupo que viu um vídeo violento produziu, em média, 7,10 associações agressivas (estatística
amostral)
É esta diferença (suficientemente) maior do que a esperada para se concluir que o vídeo teve um
efeito no comportamento observado? A diferença entre 7.10 e 5.65 (=1.45) é suficientemente grande para nos
levar a concluir de que ela é uma diferença real (isto é, não fortuita / aleatória)? Por outras palavras,
esperaríamos uma diferença da mesma espécie (magnitude e direção) se repetíssemos esta experiência muitas
vezes ou pelo contrário é esta uma diferença devido ao erro de amostragem?
Distribuição da Amostragem
A distribuição da amostragem é a distribuição de uma estatística (média, desvio padrão, proporção,

etc.) obtida com amostragem repetida de uma população especificada, com o exemplo da violência nos
media, mostra as espécies de médias que esperamos encontrar quando as pessoas não veem vídeos violentos.
Pode concluir-se que quando as pessoas não veem um vídeo violento, as suas médias de
interpretações agressivas de homónimos se situam predominantemente entre os 4.5 e os 6.5. O grupo do
vídeo violento obteve uma média de 7.10 interpretações agressivas (as respostas afastaram-se da distribuição
normal, produzida com base em µ=5,65). Podemos concluir, provisoriamente, que o vídeo com conteúdos
violentos conduziu ao aumento de respostas com teor violento.
Distribuições Teóricas
Na prática, para se encontrar a probabilidade de um dado valor, ou evento, recorre-se a distribuições

matemáticas / teóricas. No Exemplo anterior, a distribuição normal ou a distribuição t de Student seriam
duas possibilidades para enquadrar estatisticamente o problema.
1- Define-se (estatisticamente) a hipótese nula
2- Decide-se o que se espera encontrar se a hipótese nula for verdadeira o 3- Observa-se o que se
encontrou, na realidade
Rejeita-se a hipótese nula(H0) se o que se encontrou NÃO é o que se esperava, aceitando-se a
hipótese alternativa (H1)
Hipótese Nula – É a hipótese de que os nossos sujeitos vieram de uma população de participantes
normais (assunção). Por exemplo, a hipótese de que ver um vídeo violento não muda o número médio de
interpretações agressivas.
É habitualmente a hipótese que queremos rejeitar.
Tipos de Erros:
Quando se testa uma hipótese, extrai-se
conclusões que podem ser correctas ou não: o Erro
de Tipo I – quando se rejeita a hipótese nula
quando esta, na realidade, é
correcta.
A probabilidade é estabelecida ao nível de
alfa (α), que normalmente é fixado em 0,05, de
onde a probabilidade do erro de tipo I = 0,05
o Erro de Tipo II – quando se retém a hipótese nula
quando, na verdade, esta é falsa.
A probabilidade é denominada de Beta (β). Por outro lado, ainda existe a potência de um teste, isto é,
a probabilidade de corretamente rejeitar uma hipótese nula falsa -> Potência= (1- β)

 

 
 

 
 

Valores Críticos:
Os valores críticos representam o ponto a partir do qual se decide rejeitar a hipótese nula. Por
exemplo, pode-se decidir rejeitar a hipótese nula quando (p | nula) < 0.05. Ou seja, se um teste estatístico tem
um certo valor com p.= 0.05, rejeita-se H0 quando o teste excede esse valor crítico.
Teorema do Limite Central

Pode-se assumir, para já, que a variável em estudo estava distribuída normalmente na população.
Todavia, quando se trata de estimar a média (populacional) e se dispõe de muitas amostras do
mesmo tamanho, sabemos que a distribuição de todas as médias provenientes de todas essas amostras
(distribuição de amostragem da média) será aproximadamente normal, mesmo quando a população parental
não é normal – essa convergência será mais rápida em função do tamanho da amostra (quanto maior,
melhor).
Tudo isto está formalizado automaticamente em um famoso teorema da estatística – Teorema do
Limite Central.
Testes uni e Bi-laterais ou uni vs Bi-Caudais (one vs Two Tailed)

Testes unilaterais: rejeitam a hipótese nula se o valor obtido é muito baixo (ou muito alto) e apenas
se deixa de parte uma direção para a rejeição. Ex: Violência nos Media
Rejeitar a hipótese nula se o grupo do vídeo violento apresenta mais associações agressivas
do que o esperado
Teste bilaterais: rejeitam a hipótese nula quando o valor obtido é muito extremo em uma das
direcções. Ex: Violência nos Media
Rejeitar a hipótese nula se o grupo do vídeo violento apresentar um número extremo de
associações agressivas, quer muitas quer poucas

Aula 8: Componentes de um teste de Hipóteses Mario F. Triola
A Hipótese Nula :A Hipótese nula (denotada por H ) é uma afirmação sobre o valor de um parâmetro
0
populacional (como a média), deve conter a condição de igualdade e deve escrever-se =, ≤, ≥. (N.B. ao
fazermos efetivamente o teste, trabalhamos com a hipótese de que o parâmetro é igual a um valor
específico). Para a média, temos três formas possíveis para a hipótese nula:
• H : µ = algum valor; H : µ ≤ algum valor; H : µ ≥ algum valor
0 0 0
• Por exemplo, a hipótese nula correspondente à suposição geral de que o QI é 100 se expressa como
H : µ = 100.
0
Testa-se a hipótese nula diretamente no sentido de que, supondo-se verdadeira, procuramos chegar a uma
conclusão que nos leve a rejeitar H , ou não rejeitar H .
0 0
A Hipótese Alternativa : A Hipótese alternativa (denotada por H ) é uma afirmação que deve ser verdadeira
1
se a hipótese nula é falsa. Para a média, a hipótese alternativa comporta uma de três formas:
• H1: µ algum valor; H0: µ < algum valor; H0: µ > algum valor
• Note que H é o oposto de H . Por exemplo, se H é dada como H : µ = 10, então hipótese alternativa é
1 0 0 0
H : µ 100.
1
Nota sobre o uso de ≤ ou ≥ na Hipótese Nula : Mesmo que por vezes expressemos H com o símbolo
0
≤ ou ≥, como em H : µ ≤ 100 ou H : µ ≥ 100, fazemos o teste supondo que µ = 100 seja verdadeira.
0 0
Devemos ter um valor fixo único para µ, de modo que possamos trabalhar com uma única distribuição com
média específica (Alguns livros e programas de computador usam uma notação em que H sempre contém
0
apenas o símbolo de igualdade.)
Nota sobre como proceder para formular as suas próprias hipóteses : Se o estudante está a realizar
um estudo e deseja usar um teste de hipóteses para apoiar a sua afirmação, essa afirmação deve ser
formulada de maneira que se torne a hipótese alternativa, não podendo, assim, conter a condição de
igualdade. Por exemplo, se o estudante acha que a sua intervenção psicológica gera um nível médio de
autoestima acima do valor médio de 15 pontos obtido numa forma de intervenção habitual, formule a
afirmação como µ > 15, onde µ é a pontuação média no tratamento rival. N.B. Neste contexto de procurar
apoiar o objetivo de estudo, a hipótese alternativa é às vezes designada como hipótese de investigação ou
hipótese experimental. Ainda neste contexto supõe-se verdadeira a hipótese nula para se fazer o teste de
hipótese, mas espera-se que a conclusão seja pela rejeição da hipótese nula, de forma a apoiar a hipótese
alternativa.
Erro de Tipo I e Tipo II

Ao testarmos a hipótese nula, chegamos a uma conclusão binária: rejeitá-la ou não rejeitá-la. Tais
conclusões ora são corretas, ora são incorretas (mesmo quando fazemos o estudo e o teste de forma
irrepreensível). Há dois tipos diferentes de erro que podemos cometer num teste de hipóteses. Em geral, em
um teste de hipóteses há quatro diferentes possibilidades: tomamos uma decisão correta quando, ou
rejeitamos uma hipótese nula que é falsa, ou deixamos de rejeitar uma hipótese nula que é verdadeira.
Tomamos uma decisão incorreta quando, ou rejeitamos uma hipótese nula quando ela é verdadeira (este é o
erro de Tipo I), ou não rejeitamos a hipótese nula quando ela é falsa (este é o erro de Tipo II).

≠
≠

 
 

Erro de Tipo I : O erro de Tipo I não é um cálculo

matemático defeituoso ou uma fase do processo de
decisão mal executada; é um erro que pode decorrer
como consequência casual de um acontecimento raro.
A probabilidade de rejeitar a hipótese nula quando ela
é verdadeira é também chamada nível de significância
e se denota por -alfa. O valor de alfa é tipicamente pré-
determinado; são comuns as escolhas de alfa = 0.05 e
alfa = 0.01.
Erro de Tipo II : Usa-se o símbolo -beta- para
representar probabilidade de um erro de Tipo II.
Estatística de Teste: É uma estatística amostral, ou

um valor baseado nos dados amostrais. Utiliza-se uma
estatística de teste para tomar uma decisão sobre a
rejeição da hipótese nula. Por exemplo, para testar uma
hipótese sobre a média de uma (única) população
(grandes amostras, i.e., n > 30) e com desvio-padrão
populacional (σ) conhecido; pode-se aplicar o Teorema do Limite Central e utilizar a distribuição normal.
• Neste caso quererá obter a estatística de teste z da seguinte forma:
Região Crítica : É o conjunto de todos os valores da estatística de teste que levam à rejeição da
hipótese nula. Para o nível de significância de 0.05 (teste z, bilateral) a região crítica é representada pela
parte situada nas duas caudas (à esquerda e à direita, respetivamente, das duas linhas vermelhas verticais
mostradas na figura* do próximo slide) e consiste nos valores da estatística de teste inferiores a z = -1.96 ou
superiores a z = 1.96.
Regiões críticas para a estatística de teste z, quando alfa = 0.05; teste bilateral
Valor Crítico : É o valor, ou valores, que separa(m) a região crítica dos valores da estatística de teste
que não levam à decisão de rejeição da hipótese nula.
• Os valores críticos dependem da natureza da hipótese nula, da distribuição de amostragem usada e do nível
de significância .
• No slide anterior (ver Critical z Values, no topo da figura), os valores críticos z = -1.96 e z = 1.96 separam
as regiões críticas.
Conclusões no Teste de Hipóteses :Já vimos que no teste de hipóteses a conclusão será sempre uma
das seguintes:
1. Não rejeitar a hipótese nula H
0
2. Rejeitar a hipótese nula H
0
Mas como devemos formular (escrever) estas afirmações, de modo a descrever de forma clara (não-
técnica) a consequência prática dos dados e dos cálculos? A linguagem deve ser precisa; as
implicações de palavras ou expressões como “apoiar” e “não rejeitar” são muito diferentes (veja o
próximo slide que mostra como formular corretamente a conclusão final).

 
 

 
Terminologia das conclusões no teste de hipóteses
Desenvolvendo as ideias subjacentes à terminologia usada anteriormente
Note que apenas um caso conduz a uma frase que indica que os dados amostrais apoiam
(“sustentan”) a conclusão. Se queremos justificar uma afirmação, devemos formulá-la de maneira a que ela
se torne a hipótese alternativa; esperamos então que a hipótese nula seja rejeitada.
Por exemplo, se queremos justificar a afirmação de que o QI de um grupo de crianças sobredotadas é
diferente de 100, fazemos a afirmação µ 100.
Esta afirmação será uma hipótese alternativa que será apoiada se rejeitarmos a hipótese nula H : µ =
0
100. Se, por outro lado, alegamos que µ = 100, ou rejeitamos ou não rejeitamos a afirmação; em qualquer
caso não apoiaremos a afirmação original.
Porque não dizemos “aceitar a hipótese nula”?
• Até agora reafirmamos que a formulação certa é “não rejeitar a hipótese nula”.
• Em geral, quer usemos aceitar ou não rejeitar (esta é a expressão que recomendamos), devemos
reconhecer que não estamos provando a hipótese nula; estamos apenas dizendo que a evidência
obtida na amostra não é suficientemente forte para recomendar a rejeição da hipótese nula.
• É algo parecido ao procedimento adotado por um júri ao decidir que não há evidência suficiente para
condenar um acusado.
• A palavra aceitar pode ser enganosa, porque parece implicar incorretamente que a hipótese nula foi
provada. A expressão não rejeitar diz mais corretamente que a evidência que dispomos não é
bastante forte para recomendar a rejeição de H .
0
• Neste curso recomendamos a conclusão não rejeitar H em lugar de aceitar H .
0 0

≠

Advertências sobre o uso inadequado dos testes de hipóteses estatísticos

Avisos sobre a interpretação dos resultados do teste de hipóteses
Nunca conclua de um teste de hipóteses que diferenças numa variável causam diferenças numa outra
a menos que esteja a analisar dados provenientes de uma experiência cuidadosamente controlada. Por
exemplo, não pode concluir que por prolongar os seus estudos isso diminuiu o risco de contrair uma doença
coronária. Pode ser que ter um melhor rendimento económico lhe permita aderir a um ginásio e a aumentar o
exercício físico. Ou pode ser que as pessoas mais novas tenham maior nível educacional e que sejam também
menos propensas a desenvolver uma doença do coração.
Nunca equacione a significância estatística com importância prática
Quando rejeita a hipótese nula, não é necessariamente verdade que a diferença ou a associação que
encontrou é importante ou notória. Em grandes amostras, mesmo diferenças muito pequenas nas médias
podem ser estatisticamente significativas. Por exemplo, se encontrou um tratamento que prolonga a vida por
uma semana quando comparado com outro, mesmo que tenha coligido dados suficientes para tornar a
diferença estatisticamente significativa, ela tem pouca importância prática. É por isso que deve sempre
examinar a diferença realmente observada ou a magnitude das medidas de associação e focar apenas aquelas
que sejam tanto estatisticamente significativas como praticamente relevantes. Reporte sempre a diferença
observada ou o coeficiente obtido, bem como o nível de significância observado.
Nunca equipare falhar a rejeição da hipótese nula com a hipótese nula é verdadeira. Falhar a rejeição
da hipótese nula não significa que a hipótese nula é verdadeira. Pode simplesmente querer dizer que não
obteve suficientemente evidência para a rejeitar. Se o tamanho da sua amostra é pequeno, pode não conseguir
(e, por isso, falhar) a rejeição da hipótese nula mesmo quando a diferença populacional é grande. Por isso é
importante que antes de enveredar num estudo, determine quão grande precisa de ser a amostra de que
necessita para detetar o que considera ser uma diferença importante.
Nunca use a frase “aceitar a hipótese nula” porque isso implica que acredita que a hipótese nula é
verdadeira. Pode legitimamente rejeitar a hipótese nula mas não pode aceitá-la. (Isto parece injusto, mas é
assim mesmo, todavia.)
Nunca equipare a rejeição da hipótese nula com a certeza de que a hipótese nula é falsa
Nunca atribua probabilidades à hipótese nula ou hipótese alternativa sendo verdadeira ou falsa. A
hipótese nula ou é verdadeira ou é falsa. Não pode saber qual. A hipótese alternativa ou é verdadeira ou é
falsa. Não pode saber qual.
Nunca alegue que o nível de significância observado é a probabilidade de que a hipótese nula seja
verdadeira. O valor-p diz-lhe que a probabilidade de ver resultados pelo menos tão extremos como os que
observou se a hipótese nula é verdadeira. A hipótese nula ou é verdadeira ou não é.
Nunca alegue que o valor p é a “probabilidade que os resultados sejam devidos ao acaso”. Não pode
falar sobre a probabilidade de os resultados serem devidos ao acaso a menos que saiba que a hipótese nula é
verdadeira.

Aula 8: Testes de Hipóteses sobre a Média: Uma Amostra e Duas Amostras
Testes Paramétricos: A maioria dos testes paramétricos (como os da família dos testes-t que vamos
expor seguidamente) requerem que se assuma uma dada forma da distribuição da variável de resposta na
população (e.g., normal). A escala de medida de intervalo é requerida para a inferência estatística
Os testes paramétricos são, em geral, mais potentes do que os testes não- paramétricos. Dados contínuos
(scores) e Distribuição normal para todos os grupos
Testes não paramétricos: A maioria dos testes não-paramétricos tem assunções menos restritivas
que os modelos paramétricos. A maioria dos testes paramétricos trabalhará com dados ordinais, e algumas
técnicas serão adequadas para dados de escalas nominais. Embora, geralmente, menos poderosos que os
testes paramétricos, podem ser mais poderosos quando as assunções dos modelos paramétricos estiverem
erradas (i.e., não se pode assumir que os dados sigam a lei normal). Dados nominais (frequências em
categorias), ou Dados ordinais (postos), ou distribuições não normais de dados contínuos.
Variedade dos testes t:

1. t uma amostra: Se há uma única amostra, se a amostra é pequena (n < 30) e é desconhecido, então
não podemos assumir que a estimativa (i.e., o erro padrão da média) seja uma estimativa não enviesada
do parâmetro populacional:
• Assuma que σ é desconhecido;
• Substitua σ por ;
• Agora pode usar o teste z ou t, mas se a sua amostra é pequena (n < 30), então apenas t deve
ser usado;
• Vamos usar o teste t de Student (mais geral do que o teste z, pois, pode usá- lo tanto com
pequenas como com grandes amostras);
• Compare t (i.e., a estatística de teste) com os valores obtidos na tabela desta nova
distribuição (t de Student).
Distribuição de Amostragem de t: A distribuição de amostragem de t é a distribuição de

probabilidade dos valores que ocorreriam se todas as amostras de um tamanho fixo n fossem extraídas da
população definida pela hipótese nula. Dá-nos (1) todos os diferentes valores de t possíveis para amostras de
tamanho n e (2) a probabilidade de obter cada valor se a amostragem é aleatória da população da hipótese
nula.
Graus de Liberdade, gl ( ) : No teste t temos duas variáveis aleatórias ҧ e s. A assimetria da
distribuição de amostragem da variância (importante porque agora a variância figura no denominador do
rácio-t) diminui à medida que n aumenta.
• t diferirá menos de z à medida que n aumenta.
• No entanto, há necessidade de ajustar t em correspondência com este facto
e, por isso, usamos os graus de liberdade. Para o teste t de uma média,
• gl = n - 1
• O(s) valor(es) de t crítico(s) estão baseado(s) nos gl (e no nível de significância, α)
Assunções do teste t : O teste t (uma amostra) é apropriado quando a investigação tem apenas uma
amostra, é especificada, é desconhecido e a média da amostra é usada como estatística básica. Tal como
o teste z, t requer que a distribuição de amostragem de ҧ seja normal. Para que a distribuição de ҧ seja
normal, n ≥ 30 ou a população dos scores deve ser normal.
 

 
𝑥
𝜎

 
𝑥
Estruturalmente idêntica à fórmula de z exceto que s (i.e., o desvio-padrão amostral) é inserido no lugar de .
Intervalo de
Confiança: A média
da amostra é uma
estimação pontual. Desejamos uma estimação intervalar, i.e., a
probabilidade de que o intervalo inclua seja, por exemplo, igual a 0.95 (ou, 95%)
Tamanho do efeito usando o d de Cohen: É desejável que ao fazer inferência estatística além de obter
o valor-p, considere ainda a precisão da estimativa (através do IC, slide anterior) e a magnitude do efeito
obtido (i.e., o tamanho do efeito). Jacob Cohen (1988) disponibilizou um método muito simples para
determinar a grandeza de um efeito real. Quando aplicado ao teste t, o método baseia-se da existência de uma
relação direta entre o tamanho do efeito real e o tamanho da diferença da
média (à média de H ).
0
No caso aqui considerado:
Use para os cálculos Effect Size Calculator for t test
(psychstat.org)); Para interpretar : 0.00-0.20 efeito pequeno; 0.21-0.79
efeito médio; ≥ .80 efeito grande
2. t duas amostras dependentes (Paired-Samples t test): é usado quando se comparam as médias de dois
grupos dependentes ou correlacionados. Este teste é adequado se procura a medir os mesmos
participantes em duas condições experimentais ou tratamentos (i.e., cada participante executa uma tarefa
enquanto ouve música e, também, mais tarde, em silêncio). Repare que também podem ser diferentes
participantes que foram previamente emparelhados/pareados antes de serem atribuídos aleatoriamente a
uma das condições experimentais.
Testes t da diferença de duas Amostras : Problemas com uma única amostra são pouco frequentes
em psicologia, muito mais frequentes são os problemas que envolvem a comparação de duas amostras/duas
médias. Por exemplo, homens vs. mulheres, doentes vs. saudáveis, admitidos vs. recusados, aprovados vs.
reprovados, neuróticos vs. normais, etc. Em alguns casos entre as duas amostras há uma relação de
dependência (e.g., pais e filhos, gémeos, ou os mesmos participantes em ambas as amostras) e noutras
admite-se que as amostras são completamente independentes. Podemos também dizer, no primeiro caso, que

𝜎
 
temos um design intra-grupos (within-groups) enquanto, no segundo caso, falamos de um design inter/entre-
grupos (between- groups). Os procedimentos de teste de hipóteses com o teste t serão diferentes consonante
admita que as amostras em estudo são dependentes ou independentes.
Testes t da diferença de duas Amostras dependentes : Este teste é apenas apropriado quando as
amostras estão de algum modo relacionadas. Vários planos de investigação produzem dados apropriados para
o teste t de duas médias dependentes/relacionadas:
Designs de Medidas repetidas : Plano simultâneo (Recordação de uma lista mista incluindo palavras
emocionais e neutras. Se os dois tipos de palavras estão misturados aleatoriamente isso assegura que nenhum
dos tipos detém uma vantagem temporal sobre o outro). Plano sucessivo (Os protótipos são o plano antes-
depois (pré- pós-teste) e o desenho contrabalançado (usado para eliminar os efeitos de ordem simples.) )
Designs Emparelhados : Plano dito experimental (O experimentador cria os pares baseando-se quer
num pré-teste, quer em qualquer outro tipo de dados disponíveis (e.g., sexo, idade, QI). Plano dito natural
(Neste plano os pares ocorrem naturalmente e o investigador limita- se a selecioná-los para o estudo (e.g.,
maridos e esposas; mães e filhas, gémeos monozigóticos)).
Fundamentação lógica do teste t amostras dependentes: No caso mais simples, todos os participantes
são medidos duas vezes com o mesmo instrumento com algum tempo mediando entre ambas as medições. A
técnica de correlação (que estudaremos adiante), habitualmente, revelará que os pares de scores covariam
(i.e., variam conjuntamente e por isso revelam uma relação de dependência). A correlação entre os dois
conjuntos de scores pode ser usada vantajosamente pelo teste t. Por exemplo, com amostras relacionadas,
esperamos que alguém com score alto numa medida (T1) provavelmente venha a obter um score elevado na
segunda medida (T2), i.e., tenderá a manter a mesma posição relativa no grupo. Esta variação
intraindividual pode ser “descontada” do erro de amostragem (ver slide seguinte).
Erro padrão da diferença de duas amostras dependentes : A correlação expetável entre scores de
amostras dependentes acarreta uma mudança na estatística que podemos usar para medir a dispersão ou
variabilidade nas distribuições (i.e., no erro padrão de amostragem – fator que se encontra no denominador
do rácio t). O erro-padrão da diferença de duas médias relacionadas é como se segue (onde r12 é o
coeficiente que mede a força da correlação):
O rácio t é dado por:
Fórmula de t para duas amostras dependentes baseada nos scores

diferenciais: É muito mais comum conceber o teste t aqui em análise como
se tratasse de um teste t para uma única amostra; Essa semelhança é
evidente se a análise for efetuada nos scores das diferenças, , entre as duas
médias (_X1 − _x2 = ); neste caso apenas terá uma amostra (i.e., a
amostra das diferenças). Portanto, a fórmula de t será a que segue:
Assunções do teste t para duas amostras dependentes: A diferença entre os dois scores obtida para
cada sujeito (par) deve estar distribuída normalmente (excessiva assimetria e outliers tornam o teste menos
robusto/fiável); A variável dependente/resposta é medida ao nível de intervalo ou de razão; Os scores foram

𝐷

obtidos por amostragem aleatória da população.
3. t duas amostras independentes (Independent-samples t test): Este teste é apropriado quando se

compararam as médias de dois grupos que representam populações independentes (e.g., níveis de
colesterol de vegetarianos e de pessoas que comem carne). No exemplo acima há uma variável
quantitativa/contínua (scores de colesterol) e uma variável dicotómica (representando os dois grupos).
Teste t para Duas Amostras Independentes

O tipo mais básico de investigação usa, habitualmente, um design para grupos/amostras
independentes. No design de grupos independentes, os sujeitos são selecionados aleatoriamente da
população-alvo e depois aleatoriamente alocados quer à condição/grupo experimental, quer à condição/grupo
controlo (designs mais complicados, p. ex., envolvendo mais de dois grupos, são possíveis e frequentemente
usados no estudo do comportamento, mas nesse caso já não pode aplicar o teste t de Student.). No caso dos
designs com grupos independentes importa reter que na fase de análise dos dados, uma vez que os sujeitos
foram aleatoriamente distribuídos pelas condições, não se dispõe de qualquer base para emparelhar os scores
de ambas as condições. Pelo contrário, uma estatística é calculada separadamente em cada grupo e as duas
estatísticas dos dois grupos são comparadas para se determinar se o acaso apenas é uma explicação razoável
para as diferenças entre as estatísticas dos dois grupos.
Lógica do teste t para dois grupos independentes (através de um exemplo): Considere a seguinte
experiência sobre o efeito da hormona X no comportamento sexual (Pagano, 2013, p. 367): Uma
psicofisióloga conjetura que a hormona X é importante na produção de comportamento sexual. Para
investigar a hipótese, 20 ratos machos foram aleatoriamente escolhidos e depois aleatoriamente atribuídos a
dois grupos. Os animais do grupo 1 foram injetados com a hormona X e depois colocados num habitáculo
individual com uma fêmea sexualmente recetiva. Os animais no grupo 2 foram submetidos a um tratamento
parecido, mas com a exceção de que foram injetados com uma solução placebo. Contou-se o número de
acasalamentos, num período de 20 minutos.
Mais uma vez o problema consiste em saber: como estão distribuídas as diferenças das médias de
duas amostra, se H
0 é verdadeira? Para responder à questão necessitamos de conhecer a distribuição de
amostragem das diferenças entre duas médias; esta distribuição pode ser determinada teoricamente ou
empiricamente; Independente da forma como determinamos esta distribuição, a distribuição de amostragem
da diferença entre as duas médias amostrais (vide figura à direita no slide seguinte) tem as seguintes
caraterísticas:
(1) Se população de onde tomamos as amostras é normal, então a distribuição de amostragem das
diferenças entre as médias das amostras é também normal.
(2)
(3)
Distribuição de Amostragem das Diferenças entre as Médias de Scores das Amostras :

A distribuição de amostragem teórica da diferença das médias de duas amostras – Distribuição
t de Student
Segundo Cohen e Lea, se extrairmos amostras aleatórias da população, uma amostra de cada vez e se
para calcularmos um score Z usamos o DP obtido na amostra, em vez do da população, pode demonstrar-se

(Gosset, 1908) que os scores Z seguem uma distribuição que tem mais valores extremos do que a DN (caudas
mais grossas) e mais valores no centro da distribuição (mais pontiaguda que a DN). Esta distribuição é a
distribuição t de Student.
Esta condição generaliza-se à amostragem de duas (ou +2) amostras sempre que desconhecermos e
tivermos de usar os DP amostrais para o estimarmos.
Matematicamente, a distribuição t é descrita através de um único parâmetro que é uma
função do tamanho N da amostra, os graus de liberdade, .
Os graus de liberdade para o teste t de duas amostras independentes são:
gl = n + n – 2 (ou identicamente, fazendo n + n = N, N – 2 gl).
1 2 1 2
Assunções para o teste t de amostras independentes :

A distribuição de_X −_X é normal
1 2
Há homogeneidade da variância. O teste t assume que a variável independente afeta as médias das
2 2
populações mas não os desvios-padrão ( 1 = 2 ). Sendo a variância apenas o quadrado do desvio padrão,
o teste t assume que as variâncias das duas populações são iguais, i.e., = .
2 2
Se as variâncias das amostras usadas na experiência ( 1 . = 2 . ) são muito diferentes (e.g., se uma
variância é mais de 4 vezes maior do que a outra), então as duas amostras provavelmente não são amostras
2 2
aleatórias de populações com 1 = 2 .
Se isto é verdade, então, como refere Pagano, o pressuposto da homogeneidade da variância é
2 2
violado ( 1 . 2 .). V
2 2
Variantes do teste t (grupos independentes) em função da validade da assunção de 1 = 2
2 2
Se as variâncias são iguais ( = ), i.e., o princípio da homogeneidade das variâncias é válido,
então usará o teste t para variâncias combinadas (Pooled- Variances t test), como se segue:
2 2
Violando-se o pressuposto da homogeneidade das variâncias ( 1 2 ), então pode usar o teste t para
variâncias separadas (Separate-Variances t test), como se segue: com gl difíceis de calcular.

𝜎
≠
𝜎

𝜎
𝜎
𝜎
𝜎

𝜎
𝜎

𝑠
𝜎

𝑠
≠
𝜎
𝜎
𝜎

 
𝜎

𝜎
𝜎

Verificação (teste) da assunção da homogeneidade das variâncias : O teste utilizado mais

1
frequentemente para verificar esta assunção é o teste de Levene p. ex.: o SPSS testa automaticamente a
2 2 2 2 2
assunção e imprime o valor-p para o teste de H0: 1 = 2 contra H1 : 1 2 ); Habitualmente usará o
teste t variâncias combinadas se a estatística de teste de Levene tem p > .05, caso contrário (i.e., p < .05)
usará o teste t para variâncias separadas;
2
1. O teste de Levene é apropriado mesmo quando pretende testar mais de duas variâncias (e.g., H0: 1 =
2 2
2 = … = k ).
2. Se além da heterogeneidade das variâncias, também tiver suspeitas acerca da normalidade da VD e,
ademais, os n’s são pequenos, então pondere usar um teste não-paramétrico, por ex., o teste U de Mann-
Whitney.
Intervalo de Confiança e Tamanho do efeito:

• Obtenha o intervalo de confiança para a diferença de duas médias independentes, como se segue:
• Obtenha o tamanho do efeito d de Cohen, como se segue:
Use para os cálculos Effect Size Calculator for t test (psychstat.org)); Para interpretar :
0.00-0.20efeitopequeno; 0.21-0.79efeitomédio; ≥.80efeitogrande

𝜎

𝜎
≠
𝜎
𝜎
𝑑
Aula 9: Testes de Hipóteses Estatísticos: Análise da Variância Unifatorial (k > 2 Amostras Independentes)
Análise da Variância (Analysis of Variance)/ANOVA: Não há uma única técnica ANOVA, uma
família de técnicas. A ANOVA foi concebida, pelo estatístico do Reino Unido Sir Ronald Fisher, para testar
diferenças entre as médias dos resultados de vários grupos (k > 2) e está baseada na análise dos fatores
conhecidos e desconhecidos que contribuem para a variabilidade dos resultados (i.e., para a variabilidade
observada na variável de resposta, ou variável dependente).
A ANOVA unifatorial para grupos independentes é uma ampliação do teste t de Student para duas
amostras independentes a k > 2 amostras. É uma técnica usada para investigar quanta variabilidade de um
conjunto de observações pode ser atribuída a diferentes causas (Roger Porkess). Na ANOVA unifatorial, ou
de uma via/critério/fator (também dita, one-way ANOVA) extraem-se várias amostras e, subsequentemente,
testam-se os dados para ver se a variabilidade (tal como é medida pela variância) é completamente aleatória,
ou se parte dela é o resultado de diferenças sistemáticas entre as amostras. Em termos gerais, a variabilidade
total num conjunto de dados pode separar-se em variância sistemática e variância de erro. A variância
sistemática é aquela parte da variância total causada pelos fatores que levam os resultados numa dada direção
(e.g., aumentar) e a variância de erro é a porção da variância total causada por flutuações aleatórias/casuais
nas medidas que foram efetuadas. A ANOVA envolve a partição e subsequente análise das duas variâncias
referidas, a variância sistemática (entre, ou inter-grupos) e a variância do erro (dentro, ou intra- grupos),
conforme pode ver-se no diagrama lateral. Os métodos usados na partição da variabilidade diferem, estando
dependentes do plano de investigação usado e, é por isso, que existem diferentes ANOVAs. As diferenças
entre as médias dos grupos de resultados são testadas através do cálculo de uma razão F a qual compara a
estimativa da variância entre (inter) com a estimativa da variância dentro (intra) grupos:
Relação entre o teste t e a ANOVA (k = 2): O teste t de Student (amostras independentes) é uma
instância particular deste tipo de ANOVA. De facto, há uma relação estreita entre as duas estatísticas de teste,
2
assim quando o número de condições, grupos ou amostras é igual a 2, t = √ , e F = t . O valor-p, obtido em
ambos testes estatísticos é, no caso em apreço (2 grupos independentes), exatamente igual. De qualquer
modo, quando tem apenas grupos (k = 2) ou dois níveis/condições da variável independente, recomenda-se
que calcule e apresente o teste t de Student.
Hipóteses Estatísticas: Neste caso, a hipótese nula e a hipótese alternativa são formuladas do
seguinte modo: H : µ
0 1 = µ2 = µ3; H1: negação de H0. Ou seja, admitimos (H0) que o intervalo
entre o casamento e o nascimento do primeiro filho não é afetado pela classe social do pai. A hipótese
alternativa (H
1 ) é a sua negação, significando que pelo menos um par de médias é diferente.
Estatísticas habitualmente calculadas na ANOVA unifatorial para amostras independentes :
Soma dos Quadrados (SQ), gl, Médias Quadráticas (MQ), F, valor-p, tamanhos dos efeitos. • Essa
informação é apresentada numa tabela como a que se segue, habitualmente referida como “Tabela da
ANOVA” (ANOVA Table) ou Tabela Fonte da ANOVA:
N o final do seu trabalho,


apesar de ter calculado todos os elementos da tabela acima, do ponto de vista do teste de hipóteses
estatístico, apenas lhe interessa obter o valor-p para o rácio F (última coluna da direita). Se, o valor-p < ,
rejeita H (e aceita H ), se o valor-p > , não rejeita H (nem aceita H ).
0 1 0 1
Teste HSD (Honestly Significant Difference) de Tukey:
O objetivo do teste HSD de Tukey é oferecer proteção completa - ou seja, manter EW no valor
escolhido pelo investigador independentemente do número de grupos comparados. Na literatura confirma-se
que os testes post hoc se localizam num contínuo de liberalidade-conservadorismo; o teste HSD de Tukey é
um bom compromisso nesta dimensão (nem excessivamente liberal, nem demasiadamente conservador). A
lógica deste teste é a seguinte: Se o investigador espera encontrar pelo menos um par de médias que seja
estatisticamente significativo então a sua maior vantagem está em comparar a média maior com a menor,
afinal se as médias que mais diferem não forem estatisticamente significativas, nenhum dos outros pares
será. O teste HSD de Tukey foi delineado com base na distribuição de uma estatística chamada studentized
range statistic e se tivesse de fazer os cálculos, então teria de ter a tabela com os valores desta estatística;
neste curso deixaremos ao computador essa tarefa!
Teste de Scheffé’s:
No contínuo liberal-conservador, o teste de Scheffé’s está comprovadamente entre os procedimentos
mais conservadores disponíveis (i.e., em igualdade de condições, é mais difícil rejeitar H com este teste, do
0
que com qualquer outro disponível). Além disso, o teste de Scheffé’s pode ser usado para testar hipóteses
complexas e fazer comparações planeadas (i.e., decididas a priori pelo/a investigador/a); por isso, é um
procedimento flexível.

𝛼
𝛼
Aula 10: Correlação Linear
Diagramas de Dispersão
Diagramas (gráficos) que representam a relação entre duas variáveis, como o que apresentamos para
o estudo de Aron et al (2000), são uma ferramenta importante para apreendermos o tipo de relação entre duas
variáveis;
Para desenhar um diagrama de dispersão (scatterplot) a propriedade (numérica) de uma das variáveis
é representada no eixo do X (abscissa) e a outra no eixo do Y (ordenada).
Também podemos obter, na mesma apresentação, matrizes combinando diagramas de dispersão e os
respetivos r’s (coeficientes de correlação)
O coeficiente de correlação produto-momento, r : Caraterísticas do coeficiente de correlação de

Pearson
O coeficiente de correlação de Pearson é um número entre -1 e 1 traduzindo o grau em que duas
variáveis estão correlacionadas linearmente.
- Se existe uma relação linear perfeita com uma diagonal positiva entre as duas variáveis, então
teremos um coeficiente de correlação de +1; se existir uma correlação positiva, sempre que numa variável
um caso tiver um valor elevado (baixo), também o terá na outra.

- Se existir uma relação linear perfeita com um declive negativo entre as duas variáveis, então
teremos um coeficiente de correlação de -1; se existir uma correlação negativa, sempre que uma variável
tiver um valor elevado (baixo), a outra tem um valor baixo (elevado).
- Um coeficiente de correlação de 0 significa que não existe relação linear entre as variáveis
Coeficiente de Correlação, r
O sinal (+ ou -) revela a direcção da relação
(positiva, negativa).
O valor numérico indexa a magnitude/força da
relação
O grau/magnitude da relação situa-se num intervalo
específico (i.e., -1 ≤ r ≤ 1)

    

 
Interpretação do r:
Correlação, r = .71
O sinal é positivo, isso significa que quando X (tabagismo) aumenta, Y (doença coronária) também
aumenta (e vice-versa).
A correlação não permite inferir que X causa Y; conclua que as duas variáveis variam conjuntamente.
(Não esqueça que relações de causa-efeito dependem da validade de várias alegações; a correlação é
apenas uma delas. Ou seja, é um fator necessário, mas não suficiente, para afirmar uma relação de
causalidade entre duas variáveis.)
Como interpretar o r [obtido]?

Utilize um sistema de classificação convencional para a magnitude do r • Calcule o coeficiente de
2 2
determinação: r (ou r %)
Calcule a significância estatística do r
Utilize um esquema de classificação convencional

Cohen (1988) propôs um sistema bastante usado na prática [neste sentido pode considerar o r como
uma medida do tamanho do efeito] :0.1 é um efeito pequeno ; 0.3 é um efeito médio ; 0.5 é um efeito grande.
2 2
Calcule o coeficiente de determinação: r (ou o r %): Aplicando ao exemplo de Landwehr & Watkins:
2 2
r = .71, logo, r = (.71) = .504;
2 2
r % = (.71) x100% = 50.4%, ou seja, aproximadamente, 50.4% da variabilidade na mortalidade por
doença coronária é partilhada com n.o de cigarros consumidos por dia (e vice-versa). Também pode dizer
que cerca de 50.4% da variância da mortalidade por doença coronária é explicada pelo número de cigarros
fumados por dia.
Repare que 49.6% (= 100% – 50.4%) da variabilidade total deve ser atribuída a outras variáveis; isto
2 2
é, a variância não explicada pela relação entre as duas variáveis. Chama-se a esta estatística, =1− ,
coeficiente de não determinação.
Testar o r de Pearson quanto à significância estatística:

Parâmetro populacional, p (lê-se ró)
Hipótese nula, H : p = 0 :Teste da independência linear
0
entre as duas variáveis
Hipótese alternativa, H : p 0
1
Bilateral (no caso presente) - (também, poderá testar
hipóteses unilaterais: p> 0 ou p < 0)
Use o teste t de Student seguinte para testar a H :

0
Com gl = N - 2 (N = número de pares de observações.)

≠
 

𝑘
𝑟
Aula 11: Regressão Linear
Regressão e Correlação: são duas faces da mesma moeda. Tal como a regressão linear, a correlação
ocupa-se com a relação entre duas (ou mais) variáveis. A regressão habitualmente distingue-se por usar a
relação para efeitos de previsão. A correlação, por sua vez, preocupa-se em descobrir se há uma relação, e se
houver, em determinar a sua força (magnitude) e direção (Weaver, 2004).
Usa-se a regressão linear para fazer previsões: Predizer o comportamento constitui o núcleo
essencial das ciências do comportamento. A regressão generaliza esta lógica dos indivíduos para as
populações e formaliza o processo medindo a variação sistemática num contexto. Em geral, o procedimento
começa por obter medidas das pessoas (se de pessoas se tratar) em duas variáveis (e.g., ansiedade e
rendimento escolar), criando uma equação de predição a partir desses dados, e depois usando a equação para
predizer um acontecimento futuro (e.g., média geral no ensino secundário) a partir do acontecimento passado
(e.g., score no inventário de ansiedade). Obviamente, a previsão do comportamento não interessa apenas aos
cientistas do comportamento, de certa maneira todas as pessoas sairiam beneficiadas se fossem capazes de
predizer (estatisticamente) o que as pessoas irão fazer, mesmo que isso seja apenas um pouco melhor do
aquilo que habitualmente conseguimos fazer intuitivamente.
Regressão Linear Simples e Múltipla: O mais simples de todos os modelos de regressão postula
uma única VI (preditor), e podemos designá-lo de modelo de regressão linear simples (MRLS), ou regressão
bivariada. Em contrapartida uma equação de regressão múltipla tem sempre duas ou mais VI’s, neste caso
falamos em modelo de regressão linear múltipla (MRLM). Para além da regressão linear há muitas mais
técnicas de regressão (e.g., não lineares) que, eventualmente, poderão revelar-se úteis na sua investigação.
Regressão Linear Simples:

A regressão linear simples (bivariada) é uma das técnicas mais utilizadas na análise de dados
em ciências sociais; Está estreitamente associada ao r de Pearson (partilha muitas das assunções que o r
igualmente requer, como por exemplo as que se referem ao facto das relações entre as variáveis terem que ser
lineares e que todas as variáveis são quantitativas, ou, pelo menos, dicotómicas); É um instrumento adequado
para resumir a natureza da associação entre variáveis e para fazer previsões acerca dos valores prováveis da
variável dependente (ou critério), mas geralmente constitui uma boa introdução aos MRLM, bastante mais
poderosos.
Objectivos:
é sintetizar, ou sumariar a associação entre duas variáveis, produzindo uma linha que se
aproxime dos dados recolhidos: a linha (ou reta) de regressão; Só há uma reta que minimiza os desvios de
todos os pontos do diagrama de dispersão em relação a essa linha – a reta dos mínimos quadrados; A
regressão permite determinar, com precisão, a reta que melhor se acomoda aos pontos*. Conhecida a reta
podemos fazer previsões sobre valores prováveis da VD.
Equação:
Para se perceber como funciona a reta de regressão é necessário considerar a equação que
rege esse funcionamento e o modo como a utilizar para fazer previsões. A equação é a seguinte (outros
símbolos são frequentemente utilizados): Y=a+bX+e Nesta equação, Y e X são, respetivamente,
a variável dependente (critério) e a independente (preditor); a e b (são coeficientes) e referem-se a
características da própria reta • Por fim, e é o termo de erro. A equação anterior diz-nos que a variável Y é
uma função aditiva linear da variável X, mais uma constante (o valor fixo representado por a) mais o erro
(representado por e). O principal interesse reside na influência de X em Y, o coeficiente de regressão
representado por b. Para obter estimativas numéricas para os valores a e b, ajusta-se uma linha reta nas
observações de Y em X, recorrendo ao método dos mínimos quadrados ordinários (OLS)

Ordenada na origem e Declive:

No modelo de regressão linear simples (ou regressão bivariada), MRLS, a equação de
regressão é completamente definida por dois coeficientes, ditos de regressão; Os “coeficientes” são a e b
(como se viu antes) • b = declive (i.e., mudança no valor estimado de Y por cada unidade de mudança em X.)
a = ordenada na origem (interceção) (i.e., valor de Y quando X = 0.)

  
  

Métodos Estatísticos: Fundamentos

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Métodos Estatísticos: Fundamentos

Enviado por

Direitos autorais:

Formatos disponíveis

Aspetos e Conceitos Fundamentais da Investigação Quantitativa

Licenciatura em Psicologia Edição 2022-2023

Aula 2: O processo de investigação

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 1 de 39

Denominamos e classi camos as variáveis de muitas maneiras diferentes

Classi cação Matemática das Variáveis (Kirk, 1978)

Tipo de Variável Características

Classi cação das Variáveis pelo Nível/Escala de Medida:

Escalas de medidas (Stevans, 1946)

Ordinal: Os números indicam colocação ou ordem (números, indicam a posição de classes

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 3 de 39

Distribuição de frequências & Grá cos

Distribuição de frequências: Primeiro passo na análise de dados

Efeito do tipo de dados/variáveis nas distribuições de frequências e grá cos

Variáveis qualitativas (nível nominal) e Variáveis qualitativas (nível ordinal)

Variáveis quantitativas (TABELAS E GRÁFICOS)

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 4 de 39

Numa apresentação formal, habitualmente apenas

Plano de investigação Entre-grupos

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 5 de 39

Plano de investigação Intra-grupos

Como construir uma distribuição com classes? (Martins, 1980, p. 39):

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 6 de 39

Aula 4: Descrição das distribuições através de números

Medidas de Tendência Central

média uma distribuição precisamos de atribuir um peso diferente às distintas

média comparar várias populações/amostras, ou para descrever como uma variável

Mediana, “valor da variável que ocupa a posição central da sucessão de observações ou

Moda, É a modalidade da variável estudada que se obtém com maior frequência.

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 7 de 39

Medidas Função Fórmula

Dispersão iz-nos se uma grande proporção dos dados está concentrada na

Soma dos utilizada noutras técnicas estatísticas mais avançadas.

Coeficiente de Uma medida absoluta de dispersão, por vezes dada como

Medidas de Localização/Posição _ Não Centrais

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 8 de 39

25% da população/amostra tem um resultado menor ou

Decis, Centis/Percentis: semelhante, podemos

Medidas de dispersão baseadas nos quantis

• Amplitude Semi-Interquartílica (ou, Interquartis),

NÃO USADAS NESTE CURSO

Distribuições simétricas e mesocúrticas – critério de decisão convencional

Diagramas derivados da Análise Exploratória de Dados

Aula 5: Medidas de localização/Posição Relativa

Percentis, P e Rank Percentílico (PR: Posto Percentílico)

Método usado no SPPS (default)

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 10 de 39

Dois métodos (complementares) de cálculo dos percentis

Ao calcular-se os percentis parte-se de uma certa No cálculo da OP parte-se de um resultado/medida

Legendas: P = Percentil/Ponto percentílico

Resultados z, típicos, padronizados, ou Resultados T

Um resultado típico, ou resultado z, informa-nos Para eliminar os inconvenientes de resultados

z = resultado padrão x = resultado bruto M = média Onde:

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 11 de 39

Um grupo (n = 100) viu excertos de cenas

Resultados quantitativos obtidos no estudo:

Etapas para Testar uma Hipótese* (Dunn)

Revisitando o estudo de Bushman (1998)

H : µ = 5.65 H :µ 5.65 (teste/hipótese bilateral)

Use z (Distribuição normal reduzida) [fundamentando-se no TLC]. Assumimos que a distribuição de

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 12 de 39

• Escolha o nível de significância:

Calcule p(média da amostra H )

Métodos Estatísticos: Fundamentos Ana Rita Cadima Reis Página 13 de 39