Você está na página 1de 25

Estatística Aplicada I

Regente: Prof. Doutor Miranda Muaualo

2o Ano - ISCIM

Cursos: Gestão Empresarial & Contabilidade e Auditoria

Turmas: GED2A, GED2B e CAD2A

Correlação Linear Simples

30 e 31 de Maio de 2022
Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 1 / 25
Sumário

„ Correlação Linear Simples

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 2 / 25
Correlação Linear Simples

Relação entre variáveis


„ Peso X Altura

„ Peso X Idade
„ Consumo X Renda
„ Venda X Gastos promocionais
„ Demanda X Preço
Objectivo da correlação
„ Verificar a existência da relação entre variáveis

„ Verificar o grau da relação entre variáveis

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 3 / 25
Correlação Linear Simples
Correlação Linear Positiva

0 < rXY < 1

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 4 / 25
Correlação Linear Simples
Correlação Linear Negativa

−1 < rXY < 0

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 5 / 25
Correlação Linear Simples
Correlação Linear Perfeita Positiva

rXY = 1

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 6 / 25
Correlação Linear Simples
Correlação Perfeita Negativa

rXY = −1

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 7 / 25
Correlação Linear Simples
Correlação Nula

rXY = 0

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 8 / 25
Correlação Linear Simples

Medida de correlação para duas variáveis quantitativas


„ Coeficiente de correlação de Pearson
P P
( X)( Y)
XY −
P
n
rXY = vu" P 2# " P 2#
u P
2 ( X) P 2 ( Y)
t X − n Y − n

onde n = número de observações Campo de variação do rXY


„ Coeficiente de correlação de Pearson

−1 ≤ rXY ≤ 1

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 9 / 25
Correlação Linear Simples

Grau de Correlação

|rXY | Tipo
0 Nula
0.0 a 0.49 Fraca
0.5 a 0.69 Regular
0.7 a 0.99 Forte
1 Perfeita

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 10 / 25
Correlação Linear Simples

Correlação Espúria
„ Se duas variáveis X e Y forem independentes o coeficiente de correlação será
nulo.
„ Porém, algumas vezes, mesmo X e Y sendo variáveis independentes o
coeficiente apresenta um valor próximo de ±1. Nesse caso a correlação é
Espúria.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 11 / 25
Correlação Linear Simples
Cálculo Prático do Coeficiente de Correlação Linear
„ Exemplo: Calcule o Coeficiente de correlação linear entre as variáveis X e Y
dos seguintes dados:

Y 10 8 6 10 12
X 2 4 6 8 10

Resolução: n = 5

Y X X2 Y2 XY
10 2 4 100 20
8 4 16 64 32
6 6 36 36 36
10 8 64 100 80
12 10 100 144 120
46 30 220 444 288

X2 = 220; Y2 = 444;
P P P P P
Logo: Y = 46; X = 30; XY = 288; n = 5
Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 12 / 25
Correlação Linear Simples

Cálculo Prático do Coeficiente de Correlação Linear


„ Exemplo: Como vimos no Slide anterior:
P P P 2 P 2 P
Y = 46; X = 30; X = 220; Y = 444; XY = 288; n = 5
„ Coeficiente de correlação de Pearson
P P
P ( X)( Y)
XY − n
rXY = s P 2 P 2
P 2 ( X) P 2 − ( Y)
X − n
Y n

„ Substituindo os valores teremos:

(30)(46)
288 − 5
rXY = rh ih i = 0.416
2
(46)2
220 − (30)
5
444 − 5

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 13 / 25
Correlação Ordinal

Coeficiente de Spearman
„ Uma medida alternativa da correlação é dada pelo Coeficiente de Spearman
„ Leva em conta as posições que os valores das variáveis ocupam quando
ordenados na forma crescente ou decrescente
6 d2i
P
rs = 1 −
n (n2 − 1)
onde di =diferença entre um i =ésimo par e n=número de observações.
Exemplo:Calcular o coeficiente de correlação de Spearman entre o peso e a
altura de 10 estudantes do sexo masculino selecionados ao acaso.
Peso(Kg) 80 60 75 56 60 78 80 73 80 82
Altura(Cm) 175 170 174 163 165 175 180 170 170 168

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 14 / 25
Correlação Ordinal

Coeficiente de Spearman
Resolução:
„ Colocar em ordem crescente. Se houver empates, atribuir a posição média a
cada um deles.

Pesos 56 60 60 73 75 78 80 80 80 82
Ordens 1o 2,5o 2,5o 4o 5o 6o 8o 8o 8o 10o

Alturas 163 165 168 170 170 170 174 175 175 180
Ordens 1o 2o 3o 5o 5o 5o 7o 8,5o 8,5o 10o

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 15 / 25
Correlação Ordinal
Coeficiente de Spearman

Pesos Alturas Posicões dos pesos Posições das alturas d2i


80 175 8o 8,5o 0,25
60 170 2,5o 5o 6,25
75 174 5o 7o 4,00
56 163 1o 1o 0
60 165 2,5o 2o 0,25
78 175 6o 8,5o 6,25
80 180 8o 10o 4,00
73 170 4o 5o 1,00
80 170 8o 5o 9,00
82 168 10o 3o 21,00
··· ··· ··· ··· 52,00

6x52
rs = 1 − = 0, 68
10 (100 − 1)

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 16 / 25
Associação entre duas variáveis qualitativas

Tabela de dupla entrada


Analisemos o comportamento dos seguintes conjuntos:
„ X - Grau de instrução

„ Y - Região de proveniência

Y/X Ensino Fundamental Ensino Médio Ensino Superior Total


Sul 4 5 2 11
Centro 3 7 2 12
Norte 5 6 2 13
Total 12 18 6 36

Observação: As Tabelas de dupla entrada também são denominadas de Tabelas


de contingência ou Cross Table. Elas são úteis para analisar a associação entre
duas variáveis qualitativas.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 17 / 25
Associação entre duas variáveis qualitativas

Tabela de dupla entrada


„ Construir tabelas de frequências relativas

„ Existem várias possibilidades de construção e depende do objectivo do problema

Y/X Ensino Fundamental Ensino Médio Ensino Superior Total


Sul 4(11%) 5(14%) 2(6%) 11(31%)
Centro 3(8%) 7(19%) 2(6%) 12(33%)
Norte 5(14%) 6(17%) 2(6%) 13(36%)
Total 12(33%) 18(50%) 6(17%) 36(100%)

„ 11% dos indivíduos vêm do Sul e tem ensino fundamental.

„ 31% dos indivíduos vêm do Sul, 33% do Centro e 36% do Norte.


„ 33% têm ensino fundamental, 50% ensino médio e 17% ensino superior.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 18 / 25
Associação entre duas variáveis qualitativas
Tabela de dupla entrada
„ Pode-se comparar a distribuição da proveniência conforme o grau de instrução.

Y/X Ensino Fundamental Ensino Médio Ensino Superior Total


Sul 4(33%) 5(28%) 2(33%) 11(31%)
Centro 3(25%) 7(39%) 2(33%) 12(33%)
Norte 5(42%) 6(33%) 2(33%) 13(36%)
Total 12(100%) 18(100%) 6(100%) 36(100%)

„ Entre os indivíduos com instrução até o ensino fundamental, 33% vêm do Sul,
25% vêm do Centro e 42% vêm do Norte.
„ Entre os indivíduos com ensino médio, 28% vêm do Sul, 39% vêm do Centro
e 33% vêm do Norte.

„ Entre os indivíduos com ensino superior, 33% vêm do Sul, 33% vêm do Centro
e 33% vêm do Norte.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 19 / 25
Associação entre duas variáveis qualitativas

Teste Qui-quadrado
„ Qui-quadrado de independência, uma estatística de teste sugerida por Pearson,
em 1904.
r Xc 2
X (Oij − Eij )
χ2 =
i=1 j=1
Eij

„ onde Oij são os valores observados, Eij são os valores esperados, r é o número
de linhas e c é o número de colunas.
„ Assim, com valores pequenos da estatística de teste, χ2 , pode-se afirmar que
há evidências que existe independência entre as duas variáveis. Ao passo que,
valores grandes denotam discrepâncias entre alguns valores observados e os
respectivos valores esperados e, assim, pode-se afirmar que existe dependência
entre as duas variáveis.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 20 / 25
Associação entre duas variáveis qualitativas
Tabela de dupla entrada
„ Pode-se comparar a distribuição do grau de instrução conforme a proveniência.

Y/X Ensino Fundamental Ensino Médio Ensino Superior Total


Sul 4(36%) 5(46%) 2(18%) 11(100%)
Centro 3(25%) 7(58%) 2(17%) 12(100%)
Norte 5(39%) 6(46%) 2(15%) 13(100%)
Total 12(33%) 18(50%) 6(17%) 36(100%)

„ Independente da região de proveniência, 33% dos indivíduos têm o ensino


fundamental, 50% têm o ensino médio e 17% têm o ensino superior.
„ Deve-se observar em cada região como essas proporções são distribuidas.
Caso haja maior disparidade com as marginais, haverá forte indício de
dependência (associação). Caso contrário, haverá forte indício de
independência (não associação).

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 21 / 25
Associação entre duas variáveis qualitativas

„ Pode-se comparar a distribuição do grau de instrução conforme a proveniência.

Y/X Ensino Fundamental Ensino Médio Ensino Superior Total


Sul 4(36%) 5(46%) 2(18%) 11(100%)
Centro 3(25%) 7(58%) 2(17%) 12(100%)
Norte 5(39%) 6(46%) 2(15%) 13(100%)
Total 12(33%) 18(50%) 6(17%) 36(100%)

„ Se não houvesse associação, esperaríamos que em cada região tivéssemos 33%


de Ensino Fundamental, 50% de Ensino Médio e 17% de Ensino Superior.
„ Dessa forma, o número esperado de pessoas com Ensino Fundamental na
Região Sul seria 11x0.33 = 3.6, no Centro 12x0.33 = 3.96 e no Norte
13x0.33 = 4.29 e, assim sucessivamente para outros níveis de ensino.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 22 / 25
Associação entre duas variáveis qualitativas

Y/X Ensino Fundamental Ensino Médio Ensino Superior Total


Sul 4(3.6) 5(5.5) 2(1.87) 11(100%)
Centro 3(3.96) 7(6) 2(2.04) 12(100%)
Norte 5(4.29) 6(6.5) 2(2.21) 13(100%)
Total 12(33%) 18(50%) 6(17%) 36(100%)

„ Observa-se que não há fortes discrepâncias entre os valores observados (Oij ) e


esperados (Eij ) assumindo que as variáveis não fossem associadas.
„ Uma medida de afastamento global pode ser dada pela soma de todas essas
medidas (Qui-quadrado de Pearson).
r X
c 2 2 2
X (Oij − Eij ) (4 − 3.6) (2 − 2.21)
χ2 = = + ··· + = 0.675
i=1 j=1
Eij 3.6 2.21

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 23 / 25
Bibliografia

„ Geraldo L. Toledo and Ivo I. Ovalle, Estatística Básica, 2a edição,


Atlas, São Paulo, 2015; e
„ Wilton De O. Bussab and Pedro A. Morettin, Estatística Básica, 8a
edição, Saraiva, São paulo, 2013.

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 24 / 25
OBRIGADO

Regente: Prof. Doutor Miranda Muaualo (ISCIM) Estatística Aplicada I 30 e 31 de Maio de 2022 25 / 25

Você também pode gostar