Você está na página 1de 111

Fundamentos em

Estatística
Dr Tauily Taunay
Curso de Psicologia
Conteúdo
• Conceito de Estatística (valor de P: <0,05)
• População / Censo
• Amostra / Amostragem
• Variáveis / Tipos de Variáveis
• Delineamentos de estudos
• Intergrupo & intragrupo
• Tipos de estatística
• Estatística descritiva
• Estatística inferencial
Conteúdo
• Estatística descritiva
• Medidas de tendencia central
• Medidas de dispersão
• Medidas de frequência (histograma / curva normal)
• Curva Normal
• Testes paramétricos
• Testes não-paramétricos
• Teste de hipóteses
• Hipóteses de pesquisa (experimental), nula e alternativa
• Erro tipo I (falso positivo) e erro tipo II (falso negativo)
• Análise de correlação (valor de p, direção e força)
• Parte da matemática aplicada que fornece
métodos para a coleta, organização, descrição,
análise e interpretação de dados para a
utilização dos mesmos na tomada de decisões

• Método de análise de dados da pesquisa


quantitativa que busca demonstrar o quanto
os resultados encontrados são derivados do
Estatística acaso

• Valor de P (probabilidade de o resultado ser


derivado do acaso)

• Valor de P < 0,05 (5%)


Definições
básicas
Tipos de
amostragem
Variáveis
• Qualitativas (categóricas)
• Dicotômica (sim ou não/
tem ou não tem)
• Politômica (muitas opções)
Tipos de
variáveis • Quantitativas (numéricas)
• Discretas (valor inteiro)
• Contínuas (“valor
quebrado”)
Tipos de variáveis de acordo com a
relação com outras variáveis

Variáveis independentes Variáveis dependentes


(preditiva/causa) (desfecho/efeito)

Variáveis moderadoras Variáveis de confusão


Tipos de variáveis de acordo com as
propriedades matemáticas

Variáveis nominais

Variáveis ordinais

Variáveis intervalares

Variáveis de razão
Tipos de delineamento
Correlacional (relação mútua entre variáveis; transversal)

Experimental (causa-efeito; longitudinal; alocação aleatória de


participantes)

Quase-experimental (causa-efeito; longitudinal; não tem alocação


aleatória de participantes)
Tipos de delineamento (pesquisa)
Tipos de delineamento
Entre participantes

Dentre participantes
Tipos de delineamento (participantes)
1. Descritiva: função de apresentar
melhor os dados, em gráficos,
tabelas, medidas representativas

2. Inferencial: função de explorar


2 Tipos de estes dados, empregando
Estatísticas cálculos matemáticos para
observar como se relacionam,
buscando associações,
explicações ou predições
• As três principais características de um conjunto de
dados são:
1. Um valor representativo do conjunto de dados:
uma média (Medidas de Tendência Central)
2. Um valor de variabilidade do conjunto de dados:
um desvio padrão (Medidas de Dispersão)
3. A natureza ou forma da distribuição dos dados:
sino, uniforme, assimétrica,... (tabelas de
frequência e histogramas)
• Determina a característica de agrupamento de um conjunto de dados

❖Média

❖Mediana

❖Moda
Medidas de
tendência central
• São valores que trazem consigo informações resumidas dos dados estatísticos
(populações ou amostras)
• Elas nos dão um panorama do comportamento geral das observações estudadas
• São como valores de referência, em torno dos quais os outros se distribuem
• Podem ser denominados parâmetros ou estatísticas (estas não são valores fixos, pois
dependem dos elementos da amostra particular que foi escolhida)
Medidas de
tendência central
• Média é uma medida que funciona como o ponto de “equilíbrio” de um conjunto de
dados

• É a medida de tendência central mais popular (quem não se lembra?) e pelas suas
propriedades matemáticas é bastante usada

Média (µ) = ∑x / n
Medidas de
tendência central
• Mediana (Md) é definida como o valor que ocupa a posição central em um conjunto de
dados ordenados
• Tem a propriedade de dividir um conjunto de observações em duas partes iguais
quanto ao número de seus elementos: 50% dos valores coletados estão abaixo da
mediana e 50% estão acima
Obs.: ao contrário da média, a mediana não é influenciada por valores extremos
• Assim, se algum valor for demasiado grande ou pequeno – valores extremos –, estes
não afetarão o cálculo da mediana, já que não alterarão a ordem. No entanto, a média
é afetada e deixa de ser representativa do conjunto de dados
Ex.: A = { 1, 2, 1000 } e B = { 1, 2, 10 }.
Medidas de
tendência central
• A Moda de um conjunto de dados é o valor que aparece mais vezes (com maior
freqüência): podemos ter distribuições bimodais (duas modas), trimodais ou
multimodais
• Também pode não haver moda quando todos os elementos tenham apresentado
exatamente o mesmo número de ocorrências (amodal)
• Dentre as três medidas de tendência central, a moda é a única que pode ser usada
quando as variáveis são qualitativas nominais (ex.: gênero em sala de aula)
Medidas de tendência central
• Determina a característica de
variação de um conjunto de dados

❖Amplitude
Medidas de ❖Desvio
❖Desvio médio ou desvio absoluto
dispersão ❖Desvio padrão
❖Variância
❖Amplitude interquartil (dados
qualitativos)
Medidas de dispersão
❖Amplitude: diferença entre o
menor e o maior valor

❖Desvio

❖Desvio médio
❖Desvio padrão de uma amostra

❖Desvio padrão de uma


população
• O desvio padrão indica a dispersão dos dados

• Quanto mais dispersos, maior o desvio padrão

• Variância é APENAS o desvio padrão ao quadrado


• Seja o seguinte conjunto de preços de geladeiras
em 7 lojas distintas
750,00 800,00 790,00 810,00 820,00 760,00 780,00
Média = 787,14 / desvio padrão = 25,63
• Seja o seguinte conjunto de preços de
liquidificadores nas mesmas lojas acima
50,00 45,00 55,00 43,00 52,00 45,00 54,00
Média = 49,14 / desvio padrão = 4,81
• Qual dos produtos têm uma maior variabilidade de
preços?
• O Coeficiente de Variação indica a
magnitude relativa do desvio-padrão
quando comparado com a média do
conjunto de valores
CV = desvio-padrão / média

• O Coeficiente de Variação é útil para


compararmos a variabilidade
(dispersão) de dois conjuntos de
dados de ordem de grandezas
diferentes
• Considere alguém que obtém 40
pontos num teste de aprendizagem
verbal (cujo resultado varia de 20 a
60) e obtém 20 pontos num teste
Medidas de de fluência verbal (cujo resultado
dispersão varia de 10 a 30), como saber em
qual dos testes a pessoa foi melhor?
• Número de desvios-padrão pelo qual um valor
Escore Z dista da média (para mais ou para menos)
Análise de
Frequência
Frequência
absoluta (FA)
Contagem bruta de
elementos pertencentes a
um certo intervalo de dados
Frequência
relativa (FR)
• É a frequência absoluta
transformada em porcentagem
Ex: Frequência absoluta (Fi)
Quantidade de dados (n) ⇒
Frequência relativa = Fi/n
Frequência
cumulativa (FC)
• Na frequência cumulativa soma-se,
em ordem crescente, o valor de
uma frequência relativa de uma
classe com todas as classes com
valores inferiores, conforme a
tabela
Descrição gráfica
dos dados
O que faz um
bom gráfico?
Forma de apresentar dados
12 50

45

10
40

Número de pesadelos em uma semana


Número de pesadelos em uma semana

35
8

30

6 25

20

4
15

10
2

0 0
queijo sem queijo queijo sem queijo
Importante
Histograma
Gráfico de distribuição dos dados
Histograma
• Gráfico de distribuição dos dados
Distribuição dos Temperamentos Dentre
Estudantes de Psicologia
100

90

80

70

60

50

40

30

20

10

0
Histograma
• É uma representação gráfica na
qual um conjunto de dados é
agrupado em classes uniformes,
representado por um retângulo
cuja base horizontal são as classes
e seu intervalo e a altura vertical
representa a frequência com que
os valores desta classe estão
presente no conjunto de dados
Frequência
cumulativa
Polígono das
Frequências
Gráfico de barras
euphoric
males
hyperthymic
females
disinhibited
irritable
euthymic *
volatile
dysphoric
cyclothymic
*
obsessive
apathetic
anxious
depressive
0 5 10 15
%
Gráfico de
barras
Polígono das Frequências
• Histograma representado por linha de acordo com o
valor das frequências absolutas
Polígono das Frequências
• Histograma representado por linha de acordo com
o valor das frequências absolutas
Polígono das
Frequências
Histograma representado por
linha de acordo com o valor
das frequências absolutas
Gráfico de
colunas
São usados para comparar
médias
Semelhantes ao histograma
Mais fáceis de produzir manualmente
O caule indica as dezenas e as folhas, as unidades

Diagrama de Caule Folhas

caules e 0 11222555

folhas 1 2222444455588
2 44444455555558888888
3 22333344444455555
4 222334
Boxplots (Caixa
e Bigodes)
Boxplots • Mostra graficamente a posição
central dos dados (mediana) e a
(Caixa e tendência.
• Promove algum indicativo de simetria
Bigodes) ou assimetria dos dados.
• Ao contrário de muitas outras formas
de mostrar os dados, o Boxplot
mostra os outliers.
• Utilizando o Boxplot para cada
variável categórica de lado-a-lado no
mesmo gráfico, pode-se facilmente
comparar os dados
Distribuição dos temperamentos dentre
Gráfico de estudantes de psicologia
Depressivo
3%

pizza Eufórico
9%
Ansioso
7%
Apático
4% Ciclotímico
2%
Disfórico
Mostrar a distribuição Desinibido Lábil 2%
percentílica de diferentes 8% 2%
classes de dados Irritável
8%
Obsessivo
14%

Hipertímico
17%

Eutímico
24%
Gráfico de pizza
• Mostrar a distribuição percentílica de
diferentes classes de dados
Distribuição por afiliação religiosa de estudantes de
psicologia e medicina
não informaram
gnósticos 7%
espiritas 2%
ateístas e 3%
agnósticos
8%

sem religião
8%

católicos
evangélicos
60%
12%
Gráfico de
pizza
Mostrar a distribuição de
cada categoria em termos
percentuais
Gráficos de dispersão
• Gráficos que mostram a relação
entre duas ou mais variáveis

➢ Exemplos:
➢ Defesa de
Deslocamento (y)
➢ Disforia
(não disforia)
➢ Somatização (x)
Gráficos de dispersão
• Gráficos que mostram a relação entre duas
ou mais variáveis

➢Exemplos:
➢Depressão (y)
➢Hipertimia (- - - -)
➢Defesa Imatura (x)
Relação entre Estilo de Defesa Maduro e Sintomas
Depressivos e Temperamento Hipertímico
Relação entre Estilo de Defesa Maduro e Sintomas
Depressivos e Temperamento Eutímico
Relação entre Estilo de Defesa Imaturo e Sintomas
Depressivos e Temperamento Eutímico
Gráfico Radial
Teste de dominância
cerebral de Ned Herrmann
Relações entre Temperamentos
Afetivos e Estilo de Defesa
Maduro
Relações entre Temperamentos
Afetivos e Estilo de Defesa
Neurótico
Relações entre Temperamentos
Afetivos e Estilo de Defesa
Imaturo
Relação entre Temperamentos
Afetivos e Sintomas Depressivos
Relação entre Estilos de Defesa e
Sintomas Depressivos
Relação entre Temperamentos
Afetivos e Sintomas Somáticos
Relação entre Mecanismos de Defesa e
Sintomas Somáticos
Distribuição
normal
Distribuição de dados naturais,
em geral
Testes paramétricos
(curva normal)
X
Testes não-paramétricos
Testes paramétricos e não paramétricos
TESTES DE
CORRELAÇÃO
Testes de Correlação
• Estudar a relação entre
personalidade e saúde mental
• Estudar a relação entre cognições e
comportamentos
Para quê serve • Estudar a relação entre aspectos
um teste de psicológicos, fisiológicos e sociais
• Estudar a relação entre diferentes
correlação? comportamentos
• Estudar a relação entre diferentes
variáveis
Testes de Correlação
Correlação não
implica
causação
Coeficientes de Correlação
Ao analisar dados de correlação entre
variáveis, precisamos verificar:
• Se as variáveis estão correlacionadas de forma
significativa entre si (p<0,05);
• Havendo significância, verificamos, então, a direção
Análise de desta correlação: se há variação no mesmo sentido
(correlação positiva “+”) ou em sentido contrário
Correlação (correlação negativa, presença do sinal de “-”);
• Por fim, precisamos verificar a força da correlação:
se fraca, isto é, com presença de muitas exceções ao
padrão observado (numeral do coeficiente variando
de 0 a 0,299...); se moderada (numeral variando de 0
a 0,3 a 0,699...); se forte, isto é, com poucas
exceções ao padrão (numeral variando de 0,7 a 1)
Exemplo: a correlação entre sintomas
depressivos e religiosidade
encontrada foi de -0,2, sendo p<0,01.
Interpretação:
Análise de • Houve correlação significativa, pois p<0,05;
Correlação • A direção da correlação se dá em sentido
contrário (correlação negativa, presença do
sinal de “-”);
• A força da correlação é fraca, isto é, com
presença de muitas exceções ao padrão
observado (numeral do coeficiente variando
de 0 a 0,299...).
Diagramas
de dispersão
Religiosidade intrínseca

Estudantes Pacientes
Universitários Psiquiátricos
Validação de r P r P
critério do Religiosidade 0,6 <0.01 0,6 <0.01
Inventário de organizacional

Religiosidade Religiosidade 0,6 <0.01 0,6 <0.01

Intrínseca não-organizacio.

Religiosidade 0,8 <0.01 0,7 <0.01


intrínseca*

Espiritualidade 0,7 <0.01 0,5 <0.01


Teste-reteste do T0 T1

Inventário de Média DP Média DP


Spearman rho

Religiosidade Item 1 4,51 0,94 4,45 1,05 .946***

Item 2 3,82 1,22 3,74 1,27 .925***


Intrínseca Item 3 3,99 1,23 3,80 1,29 .826***

Item 4 3,82 1,33 3,72 1,34 .873***


• ***. P<0.001 (bicaudal).
Item 5 3,78 1,21 3,58 1,18 .770***

Item 6 3,50 1,24 3,46 1,32 .739***

Item 7 3,88 1,30 3,99 1,20 .823***

Item 12 4,00 1,22 3,95 1,20 .867***

Item 13 4,00 1,22 3,95 1,20 .867***

Item 14 4,14 1,22 4,20 1,16 .797***


BHS BDI BAI WHOQOL-bref
DUREL-RO -0,175** -0,118* -0,026 0,157**
Correlação entre medidas de
religiosidade e espiritualidade e DUREL-RNO -0,165** -0,130* -0,033 0,119*
medidas de saúde mental e
qualidade de vida em DUREL-RI -0,273** -0,202** -0,036 0,203**
estudantes universitários
(n=323) DUREL -0,242** -0,176** -0,033 0,186**

IRI-UFC -0,248** -0,166** 0,004 0,220**

WHOQOL-SRPB -0,346** -0,225** -0,065 0,311**

*p<0.05; **p<0.01
Domínio Domínio
Domínio Domínio 2 Domínio
3 (Rel. 4 (M.
1 (Físico) (Psicológico) Geral
Correlação entre medidas de Soc.) Amb.)
religiosidade e espiritualidade e Duke OR .138** .179** .076 .073 .064
domínios da WHOQOL-bref em
Duke NOR .106* .157** .040 .041 .133**
estudantes universitários
(n=323) Duke RI .140** .259** .151** .113* .190**

DUREL .141** .234** .112* .092* .159**

IRI-UFC .144** .290** .174** .122* .212**

WHOQOL-
SRPB .217** .426** .253** .179** .226**

*p<0.05; **p<0.01
Depressão Ansied. Qual. de Vida

Relig. Org. -0,191* -.323** .130

Relig. Não-Org. -.131 -.204* .033

Relig. Intrínseca -.127 -.187* .119


Correlação entre medidas de
religiosidade e Religiosidade -.160 -.248** .111
espiritualidade e medidas de
saúde mental e qualidade de
Rel. Intrínseca (T) -0,245** -.213* .147
vida em pacientes
psiquiátricos (n=102)
Espiritualidade -.363** -.297** .491**

*p<0.05; **p<0.01
Domínio Domínio
Domínio Domínio 2 3 (Rel. 4 (M. Domínio
Correlação entre medidas de religiosidade 1 (Físico) (Psicológico) Soc.) Amb.) Geral
e espiritualidade e domínios da WHOQOL- Duke OR .012 .049 -.114 -.017 -.023
bref em pacientes psiquiátricos (n=102) Duke NOR .027 .064 .061 .029 .065

Duke RI .068 .112 .086 .039 .075

DUREL .047 .093 .035 .025 .057

IRI-UFC -.009 .053 .053 .018 .053

WHOQOL-
SRPB .428** .511** .181 .376** .400**

**p<0.01
• A CORRELAÇÃO, MESMO QUANDO
ALTA, NÃO IMPLICA CAUSAÇÃO
(RELAÇÃO DE CAUSA-EFEITO)

• Se duas variáveis, X e Y, estão


correlacionadas, pode ser porque X
Coeficientes de causa Y, porque Y causa X, ou porque
uma terceira variável, Z, causa tanto
Correlação X quanto Y

• Este truísmo é frequentemente


ignorado, e correlações moderadas a
altas são apresentadas como se
fossem prova da relação causal
entre as variáveis
• Correlações altas nos permitem fazer predições

• Embora a correlação não implique causação, ela


implica uma certa quantidade de variação
comum ou compartilhada
Coeficientes de
Correlação • O conhecimento do grau em que as coisas
variam em relação umas às outras é
extremamente útil
Pergunta • Para quê serve um teste de
correlação? É útil para ampliar
inicial o conhecimento em
Psicologia?
• Qual dos seguintes
coeficientes representa o grau
mais forte de correlação entre
duas variáveis?
Pergunta
intermediária a)
b)
-0,80
-0,20
c) +0,20
d) +0,60
• Qual dos seguintes
coeficientes representa o grau
mais forte de correlação entre
duas variáveis?
Pergunta
intermediária a)
b)
-0,80
-0,20
c) +0,20
d) +0,60
• Nós podemos inferir uma
relação causal entre duas
variáveis com base em um teste

Pergunta de correlação?

final a) SIM

b) NÃO
• Nós podemos inferir uma
relação causal entre duas
variáveis com base em um teste

Pergunta de correlação?

final a) SIM

b) NÃO
p<0,20
Valor de p ou
p<0,001
Existe
relação não
casual entre
as seguintes
variáveis?
Significância
Estatística
X
Significância
Psicológica
Valor de p (<0,05)

Tamanho do efeito
(r, rho ou π)

Você também pode gostar