Você está na página 1de 21

Estatística

Introdução à Estatística na Psicologia


Estatística descritiva vs. inferencial
A estatística divide-se em duas grandes áreas:
- Estatística descritiva:
• Resumir:
- Tabelas de frequências
- Medidas de tendência central (média, moda, mediana, quantis)
- Medidas de dispersão (desvio-padrão, amplitude interquartil, desvio absoluto à mediana)
- Medidas de forma (assimetria ou skeweness, achatamento ou kurtose)
- Medidas de associação (coeficiente de correlação de Pearson, Spearman..)
• Representar informação através de gráficos
- Estatística inferencial:
• O objetivo é generalizar resultados de uma amostra para a população

Amostragem
Conjunto de procedimento estatísticos usados para selecionar amostras das populações em
estudo.
Existem 2 tipos de amostragem:
• Amostragem aleatória, casual ou probabilística
• Amostragem não aleatória ou não probabilística
Amostragem aleatória, casual ou probabilística
Método de amostragem em que cada elemento da população tem uma probabilidade
conhecida e igual de ser selecionado para a amostra e todas as amostras são igualmente
prováveis. Ou seja, as amostras são obtidas de forma aleatória e todos os N indivíduos da
população têm a mesma probabilidade de serem selecionados para a amostra

Pode ser:
- Amostragem Aleatória Simples
Todos os elementos da amostra são selecionados ao acaso, usando métodos como sorteios
aleatórios ou números aleatórios (nem sempre resulta em amostras representativas, podendo sub-
representar grupos minoritários
- Amostragem Aleatória Estratificada
A população é dividida em subgrupos homogéneos ou estratos (grupos etários, sexo…). Em
seguida, uma amostra aleatória é selecionada de cada estrato garantindo que cada subgrupo da
população seja representado proporcionalmente na amostra final (garante a representação de
grupos minoritários na população)
- Amostragem aleatória sistemática
Os elementos são escolhidos a intervalos regulares, começando de forma aleatória. Por exemplo,
podemos selecionar um indivíduo a cada 10 premiados num determinado jogo de azar (indivíduo
1, 11, 21, 31…)
- Amostragem aleatória por clusters
A população é dividida em grupos chamados clusters, e alguns clusters são selecionados
aleatoriamente para formar a amostra. Essa abordagem é útil quando a população é
naturalmente agrupada em clusters (freguesias)
- Amostragem aleatória Multi-etapas
Combina 2 ou mais dos métodos descritos acima.

Amostragem não aleatória ou não probabilística


Métodos de amostragem em que não segue um processo aleatório e não garante que todos os
elementos da população tenham uma chance igual de serem recolhidos. Em vez disso, os
participantes são selecionados com base em critérios específicos ou por conveniência.
Podem ou não ser representativas tornando a realização de inferências para a população
complicadas!

Podem ser:
- Amostragem de Conveniência
Os elementos da amostra são recolhidos de forma não sistemática, com base na conveniência
- Amostragem Objetiva
Os elementos são selecionados com base em critérios específicos ou objetivos predefinidos, como
pacientes com determinado critério de inclusão (indivíduos que sofreram ataques cardíacos ou
pacientes com episódios de demência)
- Amostragem Modal
Envolve a recolha de elementos que representam os tipos mais frequentes ou comuns na
população (clientes típicos, eleitores típicos ou pacientes típicos)
- Amostragem de Especialistas
Os elementos da amostra são especialistas em uma área específica, como um painel de
comentadores ou um painel de médicos, sendo selecionados pela sua experiência e
conhecimento especializado
- Amostragem de Bola de Neve
Os elementos da amostra são identificados inicialmente e, em seguida, sugerem novos elementos
para a amostra (clientes com crédito à habitação sugerindo amigos nas mesmas condições)

Variáveis de medida
Variável: Formalmente a definição de variável é uma entidade estatística cuja manifestação
assume pelo menos dois atributos. Pode
ser qualitativa ou quantitativa e normalmente é representada por x, y, z

Variáveis qualitativas
- Nominal
Qualidades onde não é possível estabelecer qualquer tipo de ordenação entre as mesmas
- Ordinal
Categorias/qualidades onde é possível estabelecer uma determinada ordem através segundo
uma relação descritível, mas não quantificável -> é possível ordenar, mas não quantificar (Estatuto
socioeconómico, risco de incêndio, grau de satisfação, nível de dor)

Variáveis quantitativas
- Intervalares
Valores mensuráveis que podem ser discretos ou contínuos, apresentando distâncias fixas entre os
valores na escala. No entanto, essas escalas não possuem um zero absoluto (QI, temperatura). Ou
seja, embora as diferenças entre os valores sejam consistentes, a ausência de um zero absoluto
implica que zero não indica a completa ausência da característica medida
- Razão
Valores mensuráveis que podem ser discretos ou contínuos, apresentando distâncias fixas entre os
valores na escala, incluindo um zero absoluto (velocidade, peso e altura). A presença de um zero
absoluto nessas escalas significa que o zero indica a ausência completa da característica medida,
tornando essas variáveis mais robustas para análises e interpretações numéricas.
Estatística descritiva e Representação Gráfica
Estatística Descritiva
Pretende descrever os dados. Quando temos bases de dados com muitas observações não as
conseguimos compreender sem algum tipo de resumo. Por isso, precisamos de ferramentas que nos
permitam resumir e descrever os dados
Importante: Como em qualquer resumo perdemos informação e às vezes pode ser informação
importante. O que devemos fazer é olhar para
diferentes resumos dos dados, que nos informam sobre aspetos diferentes, para chegar a um meio
termo entre simplicidade e nível de detalhe

• Frequência
Informam-nos sobre o total ou a percentagem de observações com um determinado valor. São
geralmente organizadas em tabelas de frequências.
Frequência Absoluta (ni) – quantidade – total de observações com um determinado valor
Frequência Relativa (fi) – percentagem de observações
Acumuladas:
(necessário ordenar os valores da variável por ordem crescente – só devem ser usadas para
variáveis qualitativas ordinais ou superiores)
Absoluta (NI): Soma das frequências absolutas até um determinado valor
Relativa (FI): Soma das frequências relativas até um determinado valor
Não seria possível calcular frequências acumuladas para variáveis nominais uma vez que não é
possível ordenar
Seria relativamente fácil realizar a mesma tabela para variáveis quantitativas discretas (que só
assumem valores inteiros)

• Medidas de tendência central


Como o nome indica tentam estimar o centro meio da distribuição da variável
- Moda (Mo - mode)
É o valor mais frequente de todas as observações
Calças largas, justas, largas, largas, justas - moda – calças largas
So podemos usar a moda na variável nominal – não dá para pôr ordem, não dá para quantitativas
- Mediana (Me - median)
É o centro das nossas observações. Por outras palavras é o valor central d0s valores ordenados por
ordem crescente, se n for ímpar. Se não for par, fazemos médias dos dois valores centrais.
Preferível quando se tem uma variável ordinal e quantitativa
- Media aritmética simples (M - mean)
Ponto central da distribuição. Somamos todas as observações e dividimos pelo número de
observações
Tem a desvantagem de ser pouco robusta-muito sensível a valores extremos
Apenas pode ser calculada com variáveis quantitativas
- Quantins/Quartis – ordinal e quantitativas
Pontos que se separa, a amostra em x partes, fazendo com que uma dada percentagem de
observações esteja entre valores de cada quantil
Quartis: partem a amostra em quartos (0-25, 25-50, 50-75, 75-100) parte em apenas 4
Q1 – 25, q2 – 50, a mediana, q3 – 75
Percentis: partimos a amostra em cem partes
Jasp – regras do programa!
Bolinhas – nominal
Barras – ordinal
Régua (scale) – quantitativa

• Medidas de dispersão
Estimar o quão distantes os dados estão uns dos outros (quão dispersos estão). Acabam por ser
medidas da largura da distribuição
- Amplitude
Diferença entre o máximo e o mínimo de observadores -> A = max – min
Exemplo: 50, 1, 6, 18, 39
➔ 50 - 1 = 49
Pode ser calculada para variáveis qualitativas ordinais ou superiores
- Amplitude interquatilica
Diferença entre o quartil 3 e o quartil 1 -> AIQ = Q3 – Q1
Exemplo: Q1 = 3,5, Q2 = 6, Q3=8,5
Pode ser calculada para variáveis ordinais ou superiores
- Desvio padrão
É a raiz da média de distâncias quadradas de cada participante à média. Diz nos quão distantes
as observações tendem a estar na média. Geralmente, valores elevados indicam que as pessoas
diferem muito umas das outras. Tal como a media, esta na mesma unidade de medida que a
variável.
Assim como a media é muito sensível e pouco robusto a valores extremos
Variável quantitativa e ordinal

• Medidas de forma
A distribuição de um conjunto de observações, alem do ponto central e da dispersão, pode ainda
ser caracterizada quanto à sua forma
- Simetria/assimetria – enviesamento – skewness (sk)
Desejabilidade social
Assimétrica à direita (enviesada à esquerda)
➔ Enviesamento positivo (sk>0)
➔ Cauda para a direita e centro para a esquerda
Simétrica
➔ Sem assimetria (sk = 0)
➔ Entre -3 e 3 é considerado simétrica
Assimétrica à esquerda (enviesamento à direita)
➔ Enviesamento negativo (sk < 0)
➔ Cauda para a esquerda e centro para direita
A sk pode ser calculada para variáveis quantitativas ordinais ou superiores
- Achatamento – kurtosis (ku)
Leptocúrtica (ku > 0)
Distribuição muito próxima do ponto central
Mesocúrtica (ku = 0) –> de -7 a 7
Platicúrtica (ku < 0)
Distribuição afastada do ponto central

Resumo (Medidas de Tendência Central e de Dispersão)


Representação gráfica
- Gráficos circulares
Representa as frequências relativas de uma determinada
variável
Usado para representar variáveis qualitativas nominais ou
variáveis qualitativas ordinais
- Gráfico de barras
Representa as frequências relativas de uma
determinada variável
As barras normalmente estão separadas para se
distinguir de um histograma
Usado para representar variáveis qualitativas nominais,
variáveis qualitativas ordinais, ou variáveis quantitativas
discretas
Ver a quantidade certa – usar gráfico de barrar em vez do circular
- Histograma (gráfico de distribuição)
Representa as frequências relativas absolutas de uma
determinada variável
Temos de definir intervalos ou classes
As barras devem parecer coladas para evitar confusões
com gráficos de barras
Usado para representar variáveis quantitativas contínuas
- Densidade
Semelhante ao histograma, mas representa a
distribuição ao longo dos seus valores
Muito útil para percebermos a distribuição dos dados
Pode ser utilizado como histograma.
Usado para representar variáveis quantitativas
contínuas
- Caixa de bigodes ou boxplot – vai sair no exame
A caixa é delimitada pelo q1 e q3, aparecendo o q2
(mediana) como um risco algures na caixa. Quando o risco
não está ao centro podemos ter assimetria
A caixa representa a amplitude interquartil
Pontos são outliers!
Os bigodes podem corresponder ao mínimo e máximo, ou as
barreiras para deteção de outliers
Usado para representar variáveis qualitativas ordinais ou superiores
Mais dispersão interquartilica no da esquerda
Caixa – 50 por cento da amostra - q3-q1
Bigodes – amplitude máxima aceitável, vão indicar quão dispersos estão os dados
Traço a negrito – mediana – quem tem mais naquela variável
- Violino
Representa a distribuição de uma variável ao longo de
um conjunto de valores
Pode incluir as linhas dos quartis, representando a
mesma informação que o boxplot, enquanto mostra a
distribuição dos dados
Muitas vezes inclui um boxplot sobreposto no meio do
violino, pontos com o valor das observações e/ou um ponto com a média
Usado para representar variáveis quantitativas contínuas
- Diagrama de dispersão (scatterplot)
Representa duas variáveis qualitativas ordinais ou superiores,
uma em função da outra
Muito útil quando falamos de correlações ou regressões
Tbm dá para ver outliers.

Resumo (Representação gráfica)


Probabilidades e Modelos probabilísticos
Probabilidades
Definição - Possibilidade de observação de um acontecimento
Formas de expressar probabilidade:
➔ Definição analítica/clássica
A probabilidade da ocorrência do evento A é o número de vezes que o evento A ocorreu a dividir
pela some do número de vezes que ele ocorreu e não ocorreu
A
𝑃(𝐴) =
A+B
➔ Definição frequencista
Probabilidade é a frequência relativa de um evento A num grande número de observações do
mesmo fenómeno. Ou seja, a probabilidade é definida com base num grande conjunto de eventos
anteriores e na percentagem de vezes que A é observado (probabilidade a longo prazo)
𝑛𝐴
𝑃(𝐴) = lim
𝑛
Exemplos de abordagem frequencista (aleatória):
• Registar o nível de felicidade de uma amostra aleatória de 50 pessoas.
• Registar o número observado em 100 lançamentos de um dado
• Medir a número de sacadas visuais de 20 pessoas na leitura de um texto.
• Registar o aumento de peso de 20 pessoas após uma nova medicação

Distribuição de probabilidade
Definição – tabela ou função que indica a probabilidade de ocorrência de um ou vários eventos
de uma variável aleatória (v. a.). Ou seja, é algo que representa a probabilidade para cada
possível evento de um v. a.
➔ v.a. discreta – se os valores possíveis forem valores discretos (valores finitos ou infinitos
• Com estas variáveis podemos estudar a probabilidade de ocorrer um evento específico ou
estudar a probabilidade de certos intervalos de valores.
• É um valor exato
• Utiliza-se normalmente o gráfico de barras
• Exemplos - se alguém cai ou não das escadas; probabilidade de reportar “muitíssimo” numa
escala sobre depressão)
➔ v.a. contínua – se os valores possíveis forem valores contínuos (valores finitos ou infinitos)
• Com estas variáveis podemos apenas falar na probabilidade de um evento estar dentro de um
determinado intervalo de valores.
• Pode conter várias casas decimais.
• Utiliza-se normalmente o gráfico com intervalos infinitesimais (gráfico de densidade).
• Exemplos - Qual a probabilidade de uma pessoa ter entre 82kg e 83kg?; Qual a probabilidade
de uma pessoa ter 75 kg ou menos?)

Distribuição binomial
➔ Aplicada a variáveis aleatórias discretas.
➔ Indica a probabilidade de sucessos (p) esperados num conjunto de ensaios/tentativas (n).
➔ Verifica-se quando a experiência em causa tem apenas 2 eventos possíveis (sim ou não,
feminino ou masculino; grávida ou não grávida) Isto é conhecido como ensaio/experiência de
Bernoulli
➔ A probabilidade do “target/sucesso” (resultados de interesse) em cada ensaio é representado
por p. A probabilidade do outro resultado (insucesso) é representado por q. O n representa o
número de observações
➔ Propriedades gerais
•p=1–q
•p+q=1
•q=1–p
➔ A média (ou proporção esperada de sucessos) é representado por:
E(X) = n x p
➔ Já a variância é representada por:
V(X) = n x p x q

Distribuição binomial JASP

Exemplos práticos (JASP):


➔ Imagine que 2 em cada 10 pessoas toma medicação antidepressiva.
Num questionário aleatório de 80 pessoas:
A) Qual a probabilidade de 20 pessoas estarem a tomar antidepressivos?
B) Qual a probabilidade de pelo menos 15 pessoas tomarem antidepressivos.
C) Qual a probabilidade de não haver mais do que 10 pessoas a tomar antidepressivos?

Neste cenário, 2 em cada 10 pessoas toma medicação antidepressiva. Logo p = 2/10 = 0.2
Além disto, todos os problemas envolvem recolher 80 pessoas. Logo n = 80

A) Qual a probabilidade de 20 pessoas estarem a tomar antidepressivos?

B) Qual a probabilidade de pelo menos 15 pessoas tomarem antidepressivos.

C) Qual a probabilidade de não haver mais do que 10 pessoas a tomar antidepressivos?


Distribuição Normal
➔ Grande parte das variáveis de resposta (outcomes) que encontramos apresentam (ou
assumimos que apresentam) esta distribuição.
➔ Relevante para o conceito do Teorema do Limite Central
➔ A maioria dos testes estatísticos usados na investigação em psicologia (com variáveis de
resposta contínuas) assumem que esta variável tem uma distribuição normal.

➔ Probabilidade de obter-se intervalos de valores (JASP)


Exemplo - Por exemplo, sabemos que a população adolescente portuguesa apresenta numa
escala de ansiedade contínua uma média de 15, com desvio padrão de 5.
Dada esta informação, e sabendo que está variável apresenta uma distribuição normal na
população, qual a probabilidade de um adolescente, escolhido aleatoriamente, ter um nível de
ansiedade igual ou superior a 25?
Distribuições amostrais
➔ Distribuição amostral - Distribuição de probabilidades de uma determinada estatística (ex.
média). É uma distribuição que demonstra a probabilidade de obtermos uma estatística em
particular (por exemplo, que a média é 15) em várias possíveis amostras retiradas
independentemente da população.
➔ Erro amostral - Representa a variabilidade encontrada entre as várias amostras no que respeita
essa estatística. Ou seja, o quanto a estatística (ex. média) varia de amostra para amostra,
retiradas sempre da mesma população.
➔ Erro padrão - O desvio padrão da distribuição amostral. Mede o quão precisa é a estimativa da
nossa estatística.

Teoria do Limite Central


Teorema do Limite Central (TLC) diz que, independentemente do tipo de distribuição da nossa
população, a distribuição amostral da média (i.e., distribuição das médias de várias amostras),
tendem a seguir uma distribuição normal à medida que o tamanho da amostra aumenta.
➔ Ou seja, se tivermos uma amostra decentemente grande (regra de polegar - n > 30), então

podemos invocar o TLC e dizer que a média da nossa amostra segue provavelmente uma
distribuição aproximadamente normal:

➔ É importante que se trate de uma amostra simétrica e com um achatamento pouco elevado.
➔ Através do TLC é possível obter uma precisão sobre a estatística estudada
➔ Além disto, esta propriedade permite-nos, sabendo a média e desvio padrão da população, fazer
estimativas sobre a média que esperamos obter (e com que confiança) quando recolhemos novas
amostras.
Introdução à estatística inferencial
A estatística inferencial permite-nos, a partir da nossa amostra, estimar o valor de parâmetros
(Teoria da Estimação) e tomar decisões (com recurso a testes de hipóteses) relativas a esses
mesmos parâmetros na população teórica (Teoria da Decisão)
Nota: Da filosofia sabemos que inferência diz sempre respeito a generalizar a partir dum caso
específico para algo mais geral.
Em estatística queremos generalizar de uma dada amostra que recolhemos para uma população
que queremos estudar. Se o nosso interesse fosse apenas na amostra, não precisaríamos de
estatística inferencial, apenas descritiva.

Teoria da Estimação
Teoria da Estimação – visa estimar parâmetros populacionais a partir de estimativas amostrais,
utilizando estimadores apropriados.

➔ Estimação pontual
Infere-se o valor do parâmetro na população com base no valor da estatística obtida numa ou
em várias amostras representativas. Pode ser tão simples como que estimar a média
populacional é 4 porque a média amostral é 4.
Nível de significância – percentagem de erro – ex: 0,05%
Nível de confiança – o que sobra do erro – ex: 99,95%
Problema! – não possui nenhum grau de certeza associado à estimativa obtida. Diferentes
amostras conduzem a diferentes estimativas do parâmetro populacional que é único.

➔ Estimação intervalar
Estima-se o valor dos parâmetros populacionais com recurso a intervalos de confiança (IC), ou
seja, um IC é uma estimativa estatística que fornece um intervalo de valores dentro da qual é
razoável supor que o verdadeiro valor de um parâmetro desconhecido esteja.
A amplitude desse intervalo dá-nos uma ideia da precisão da nossa estimação. Quanto mais
variabilidade (pouco N) (erro de medida, diferenças interpessoais…) maior o intervalo, logo
menos precisa é a estimativa.

• Diferenças interindividuais – alteram a precisão


• Mais N – menos variabilidade - intervalo pequeno (menos amplitude) – mais precisão!
Consoante o parâmetro a estimar (e.g., média, proporção) recorre-se a diferentes
procedimentos. Escolhendo o procedimento adequado pode-se até usar os intervalos de
confiança para perceber se diferenças entre grupos na amostra existirão ou não na população.
• Os ICs constroem-se a partir da estimativa amostral do parâmetro, da variância dessa
estimativa na amostra (ex: erro padrão) e do valor da distribuição amostral do estimador do

parâmetro no percentil 1-a/2.

• Se já estimamos o IC:
Margem de Erro = metade da amplitude do IC
Ou seja
Margem de Erro = (Limite Superior – Limite Inferior) / 2

Em psicologia trabalha-se com 95% de confiança


Margem de erro de 5%

Estimação intervalar no JASP

NOTA!
Todos os pontos negros têm o 0 incluído
Os vermelhos não têm
Gráfico 1 e 3 – 5 valores não têm o zero incluído – 5 em 100 logo 95% de IC!
Como estimar parâmetros populacionais no JASP - Média

Como estimar parâmetros populacionais no JASP - Proporção

Teoria da Decisão
Teoria da Decisão – Toma-se decisões relativas aos parâmetros populacionais, a partir das
observações amostrais
➔ Testes de hipóteses – é um procedimento estatístico que nos permite decidir sobre a
plausibilidade de hipóteses relativas a parâmetros populacionais a partir de amostras
representativas da população do estudo. Essas decisões são tomadas com um determinado
nível de confiança ou probabilidade de erro.

Ou seja, não conseguimos ter a certeza que foi decidido corretamente, mas recorremos a
procedimentos que controlam erros, dando-nos alguma confiança na decisão tomada (95%)
Nesta UC apenas são importantes as abordagens de Fisher e Neyman-Pearson (frequências
clássicas)!

➔ Etapas do Teste de Hipóteses:


1 – Definir hipóteses estatísticas
2 – Computar a estatística de teste
3 – Decidir
4 – Concluir e reportar resultados

1. Definir hipóteses estatísticas


Uma hipótese é uma preposição acerca de um acontecimento de natureza aleatória, cujo
resultado não se conhece à priori -> É uma predição sobre um determinado acontecimento

Uma hipótese de investigação dá sempre origem a 2 hipóteses estatísticas:

Hipótese Nula (H0): Hipótese Alternativa (H1):


Ausência de efeito, o que aconteceria se Alternativa à H0, aquela que geralmente
a teoria estiver errada. Assumida como pretendemos que seja verdadeira. Ou
verdadeira até prova significativa em seja, é o efeito esperado, o que
contrário aconteceria se a teoria estiver correta.

Ex. Os alunos de psicologia não têm scores Ex. Os alunos de psicologia têm scores no
no STICSA diferentes dos alunos de direito STICSA diferentes dos alunos de direito

Existe igualdade! Não existe igualdade!

Nota! Nos exercícios fala-se sempre em rejeitar ou não rejeitar H0, nunca rejeitar H1!

A forma das hipóteses define o tipo de teste:

Teste Bilateral: Teste Unilateral à Esquerda: Teste Unilateral à direita:

Testar se os alunos de Testar se os alunos de Testar se os alunos de


psicologia têm scores no psicologia têm scores no psicologia têm scores no
STICSA diferentes dos STICSA inferiores dos alunos STICSA superiores dos alunos
alunos de direito de direito de direito

2. Computar a estatística teste:


A estatística de teste (E.T.) representa a distância relativa (em unidades de desvio-padrão, ou
similar) entre o parâmetro populacional hipotético (previsto pela H0) e a estimativa amostral.

• Se a E.T. for um valor elevado, então a média observada na amostra (x̅) é muito diferente
da média da população (μ) prevista pela H0. Logo, rejeitamos H0.
• Se a E.T. for um valor pequeno, então a média observada na amostra (x̅) não é muito
diferente da média da população (μ) prevista pela H0. Logo, não rejeitamos H0.

3. Decidir
Existem 2 formas:

Região de Rejeição (Neyman & Pearson):

Para um determinado nível de significância a (ou probabilidade de erro de rejeitar H0 se H0


for verdadeira – erro tipo I) é possível criar uma região da distribuição amostral para a qual
é pouco plausível observar o valor da E.T. (ou um valor mais extremo) sob H0.

Esta região da distribuição amostral designa-se por região de rejeição do teste ou região
crítica do teste

Regra - Rejeitar H0 se ET está contida na região de rejeição

Ou

P – value (R. Fisher)

Conhecendo a distribuição amostral da estatística de teste (distribuição de probabilidades


dos valores que a ET pode tomar na população) é possível determinar quão plausível é o
valor calculado da ET, ou um valor mais extremo, para a amostra em estudo.

Regra - Rejeitar H0 se p-value _< a

P-value -> probabilidade de obter um valor igual ou maior do que a


estatística de teste se a H0 for verdadeira e é calculado diretamente pelo
software quando realizados testes estatísticos

Para decidir sobre a plausibilidade das hipóteses comparamos a probabilidade (p-value)


de obter os resultados que obtivemos, ou mais extremos, se não houvesse efeito (H0), com
a proporção máximo de falsos positivos que estamos dispostos a tolerar (a).

Quando o p-value é igual ou inferior a a, rejeitamos a ausência de efeito (rejeitamos H0)

Nota! a -> proporção máxima de falsos positivos que estamos dispostos a aceitar. É a
probabilidade de eu rejeitar H0 quando ela é verdadeira = P (erro tipo I)
Contudo a decisão de rejeitar H0 pode estar errada:

Decisão do teste
Rejeitar H0 Não rejeitar H0

Decisão correta Erro tipo II


(o efeito está presente (efeito presente, mas
Efeito presente!
e foi detetado) não foi detetado)
(H0 é falsa)
Probabilidade = 1 – B Probabilidade (Erro

tipo II) = B
(potencia do teste)
População
Erro tipo I
Decisão correta
(efeito detetado, mas
Sem efeito presente! (o efeito não existe e
não existe)
(H0 é verdadeira) não foi detetado)
Probabilidade (erro
Probabilidade = 1 - a
tipo I) = a

p-value - Simulação em JASP para compreendermos o conceito


4. Concluir e reportar os resultados:
A rejeição ou não rejeição de H0 permite concluir sobre a validade da hipótese de
investigação relativamente ao parâmetro populacional.
Os resultados devem ser comunicados ao potencial leitor de forma clara o suficiente para
leitores com menos conhecimento estatístico compreenderem, mas com detalhe suficiente
para leitores mais conhecedores poderem avaliar os resultados e os procedimentos estatísticos
Devem ser descritos seguindo as convenções/guias de estilo da área de investigação e da
revista. Na psicologia, na grande maioria das vezes, seguimos as normas APA.

Você também pode gostar