Você está na página 1de 8

ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 1

(Ver Aula 01 e Caderno)

VARIÁVEIS ESTATÍSTICAS BIDIMENSIONAIS

 Organização da informação
 Interpretação

Tabela de contingência ou dupla entrada (uma variável em linha e outra em coluna – as


frequências cruzam-se)

DISTRIBUIÇÕES CONDICIONADAS – leitura de uma variável condicionada por outra

1. Ex: 14,9% dos inquiridos com menos que o liceu, são liberais – PERCENTAGEM EM
COLUNA (mais usual)
2. Ex: 19,7% dos inquiridos que são liberais, têm menos que o liceu – PERCENTAGEM EM
LINHA
3. Ex: 2,6% dos inquiridos são liberais e têm menos que o liceu – PERCENTAGEM
TOMANDO COMO TOTAL A DIMENSÃO DA AMOSTRA

Frequências/Distribuições Marginais – totais de cada uma das categorias

Conceitos a reter:

 Frequências observadas
 Frequências esperadas
 Resíduos Usa-se para nos vermos o grau de
 Qui-quadrado x2 associação que existe entre as variáveis
 Graus de liberdade – gl ou df

Homens Mulheres Total


Azul 20 20 40
Rosa 50 10 60 Frequências observadas
Total 70 30 100

Homens Mulheres Total


28
Azul 12 40 (ni)
(40x70)/100 Frequências esperadas
Rosa 42 18 60
Total 70 (nj) 30 100 (n)
ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 2

Resíduos = Observados – Esperadas


Homens Mulheres Total
Azul -8 (20-28) 8 (20-12) 0
Rosa 8 -8 0
Total 0 0 0

Quando é a para calcular o qui-quadrado é a SOMA, devo construir uma tabela deste
tipo para não induzir em erro:

Frequências observadas

Frequências esperadas

TABELA QUI-QUADRADO

O TOTAL SOMA É 44,46

INDEPENDÊNCIA – Uma variável não tem influência na outra

Homens Mulheres Total


Azul 25 25 50
Rosa 25 25 50 Frequências esperadas
Total 50 50 100
ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 3

DEPENDÊNCIA – Uma variável depende da outra

Homens Mulheres Total


Azul 50 0 50
Rosa 0 50 50
Total 50 50 100

SERÁ QUE EXISTE DEPENDÊNCIA? PARA SABER FAZ-SE O TESTE DO X2

Homens Mulheres Total


Azul 35 15 50 Tabela para fazer o teste
Rosa 15 35 50
Total 50 50 100 FREQ. OBS.

Homens Mulheres Total


Azul 25 25 50 Frequências esperadas
Rosa 25 25 50
Total 50 50 100

1. Escrever as hipóteses – nula e alternativa


a. Hipótese nula = H0 – as variáveis são independentes
b. Hipótese alternativa = H1 – as variáveis são dependentes
2. Calcular a estatística do qui-quadro

(35−25)𝑥 2 (15−25)𝑥 2 (15−25)𝑥 2 (35−25)𝑥 2


x2 = + + + = 16
25 25 25 25

3. Calcular os graus de liberdade (gl)

gl = (l-1) x (c-1) = (2-1) x (2-1) = 1

l = linhas / c = colunas

4. Definir a significância estatística, e consultando a tabela encontrar o qui-quadrado


crítico

α = 0,05 x2c (qui-quadrado crítico) = 3,841

5. Tomar a decisão relativa às hipóteses


a. Se o x2 for maior do que o x2c, então rejeita-se a hipótese nula = As variáveis
são dependentes
b. Se o x2 for menor do que o x2c, então não se rejeita a hipótese nula
ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 4

MEDIDAS DE ASSOCIAÇÃO ENTRE VARIÁVEIS COMPLEMENTA TESTES ESTATÍSTICOS:

Variáveis Nível 3 - Razão

Variáveis Nível 2 – Ordinal

Variáveis Nível 1 – Nominais

 Quando temos variáveis de natureza diferente usamos as medidas adequados ao nível


inferior
 Se tivermos 1 variáveis ordinal e 1 variável nominal, usamos valores de Φ (phi), C
(coeficiente de contingência de Pearson) e V de Cramer

Homens Mulheres Total Este teste do x2 já não pode ser


Azul 3 2 5 aceite, porque mais de 20% das
Rosa 2 3 5
células têm Fe inferior a 5
Total 5 5 10

COEFICIENTE PHI – Resultado mais próximo 0 = menor associação

Resultado mais próximo 1= maior associação

COEFICIENTE CONTINGÊNCIA:

COEFICIENTE V CRAMER:

Devemos usar o valor mínimo de linhas ou colunas

Previsões são feitas com a observação das variáveis – associação entre variáveis
Y – Peso –
Variável
Dependente

X – Altura – Variável Independente


ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 5

 Gráfico de dispersão – associação entre variáveis


 Quanto mais alto, mais peso – Associação Positiva
 Quanto mais de uma variável, menor da outra
 Associação entre variáveis quantitativas:
o Existência
o Força
o Direção
o Natureza
 Ordinais:
o D Somers
o Rho Spearman
 Quantitativas ou Razão:
o R Pearson
 Quanto mais próximo de 1, mais a associação, é mais forte

Nº total de pares

Nº pares concordantes Obtenção de medidas


RPE obriga o cálculo
Nº pares discordantes destes
Nº pares empatados

Elevada Média Baixa Total


Elevada 136 110 54 300
Média 96 106 118 320
Baixa 60 74 142 276
Total 292 290 314 896

1. Nº TOTAL DE PARES (T) = N x (N-1)/2


a. 896 (896-1)/2 = 400960
2. PARES CONCORDANTES (NC) – Soma das células abaixo e à direita – não usamos
dados da mesma célula

Elevada Média Baixa Total


Elevada 136 110 54 300
Média 96 106 118 320
Baixa 60 74 142 276
Total 292 290 314 896

a. 136 x (106 + 118 + 74 + 142) + 96 x (74 + 142) + 110 x (118 + 142) + 106 x (142)
= 124228
ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 6

3. PARES DISCORDANTES (ND) - Soma das células abaixo e à esquerda

Elevada Média Baixa Total


Elevada 136 110 54 300
Média 96 106 118 320
Baixa 60 74 142 276
Total 292 290 314 896

a. 54 x (106 + 96 + 60 + 74) + 118 x (74 + 60) + 110 x (96 + 60) + 106 x (60) =
57476
4. PARES EMPATADOS NA VARIÁVEL INDEPENDENTE (TX) – Ir a cada uma das células e
somar o que está abaixo dessa
a. 136 x (96 + 60) + 96 x (60) + 110 x (106 + 74) + 106 x (74) + 54 x (118 + 142) +
118 x (142) = 85416
5. PARES EMPATADOS NA VARIÁVEL DEPENDENTE (TY) – Ir a cada célula e somar o que
está à direita
a. 136 x (110 + 54) + 96 x (106 + 118) + 110 x (54) + 106 x (118) + 60 x (74 + 142) +
74 x (142) = 85724
6. PARES EMPATADOS EM AMBAS AS VARIÁVEIS
a. Txy = ∑ (fi x (fi – 1)) / 2
b. Txy = (54 x 53) / 2 + (110 x 109) / 2 …. = 48116
7. Nº TOTAL PARES (T) = 400960
a. 400960 = 124228 + 57476 + 85416 + 48116

 Temos de ter o nº de pares para calcular as medidas de associação entre variáveis


o D Somers
o Rho Spearman
o R Pearson

A M B T
A 45 23 12 80
M 37 11 18 66
B 22 19 34 75
T 104 53 64 221

1. (T) = 24310
2. (NC) = 7221
3. (ND) = 3405
4. (TX) = 5604
5. (TY) = 4934
6. (TXY) = 3146

VER AULA 5

 Coeficiente tau-a de Kendall

 Coeficiente Gamma de Goodman e Kruskal


ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 7

 Coeficiente d de Somers

 Coeficiente tau-b de Kendall

Despenalização do Extrema esquerda Centro- Centro- Extrema-


consumo drogas leves e esquerda esquerda direita direita e direita
Desaprovação 60 60 90 95
Indiferença 16 8 18 18
Aprovação 104 73 82 55
Total 180 141 190 168

1. (T) = 679 x (679-1) / 2 = 230181


2. (NC) = 37636
3. (ND) = 62565
4. (TX) = 32709
5. (TY) = 72017
6. Tau – a = - 10,8%
7. Gamma = - 24,9%
8. Dyx = - 14,5%
9. Dxy = - 18,6%
10. Tau – b = - 16,4%

SPEARMAN – medida de associação, mas com uma


especificidade de correlação – baseado na ordenação das
observações

Ass. Da República Tribunais


Extrema Esquerda 2,06 2,11
Esquerda 2,33 2,32
Esquerda Moderada 2,19 2,48
Centro 2,34 2,43
Direita Moderada 2,52 2,32
Direita 2,15 2,41
Extrema Direita 2,57 2,90

Primeiro fazemos a ordenação da variável

Quando há empate, fazemos a média aritmética das ordens e não nos valores ((5+6)/2)
ANÁLISE DADOS QUANTITATIVOS II | Lúcia Costa 8

D = diferença entre as ordens

Você também pode gostar