Você está na página 1de 32

Probabilidade e Estatstica

Correlao e Regresso Linear

Correlao
Existe uma correlao entre duas
variveis quando uma delas est, de
alguma forma, relacionada com a
outra.
Grfico ou Diagrama de Disperso o
mtodo grfico feito sobre dois
eixos, x e y, que representa a
correo entre as variveis.

Diagramas de Disperso
Um diagrama de disperso mostra a relao
entre duas variveis quantitativas, medidas
sobre os mesmos indivduos.
Os valores de uma varivel aparecem no
eixo horizontal, e os da outra, no eixo
vertical.
Cada indivduo aparece como o ponto do
grfico definido pelos valores de ambas as
variveis para aquele indivduo

Variveis
Varivel: caractersticas ou itens de
interesse de cada elemento de uma
populao ou amostra

Tambm chamada parmetro, posicionamento,


condio...

Duas variveis esto relacionadas se a


mudana de uma provoca a mudana na
outra.
Exemplo: velocidade x consumo combustvel

O eixo x geralmente um parmetro.

Exemplos
Fabricao

Nmero de peas produzidas e nmero de peas defeituosas

Construo

Nmero de falhas em uma obra e a satisfao mdia dos


produtivos
Dias de atraso de entrega x nmero de dias chuvosos

Financeiro

Mdia de tempo de atraso de pagamento e nmero de erros de


fatura

Vendas

% de imveis vendidos na data de entrega da obra x satisfao


mdia dos clientes nos ltimos 10 empreendimentos.

Exemplo - Peso x altura


Altura
(m)

80

1,80

85

1,83

50

1,65

70

1,90

55

1,60

77

1,80

85

1,78

93

1,86

65

1,70

60

1,65

Peso x Altura

Pesos

Peso
(kg)

2
1,9
1,8
1,7
1,6
1,5
40

50

60

70
Altura

80

90

100

Exemplo Peso x Altura


Estratificando

Altura
Mulheres
(m)

80

1,80

---

85

1,83

---

50

---

1,65

70

---

1,90

55

---

1,60

77

1,80

---

85

---

1,78

93

1,86

---

65

1,70

---

60

---

1,65

Homens

Peso x Altura (por sexo)

Mulheres

110
90
70
50
30
10

Pesos

Altura
Peso (kg) homens
(m)

1,5

1,6

1,7

1,8
Alturas

1,9

Dicas
Eixo x

Varivel que alterada por uma modificao no


processo (varivel independente)
Geralmente uma possvel causa de um problema

Eixo y

Varivel que pode mudar de acordo com a


mudana da varivel em x (varivel
dependente)
Geralmente um indicador de qualidade ou efeito
gerado por uma causa.

Analisando Diagramas de
Disperso
Os aspectos abaixo so relevantes na
anlise dos Diagramas:
DIREO
FORMA (linear, no-linear, aglomerados)
PONTOS DISCREPANTES

Interpretando
Padres de Disperso

Quanto maior a correlao, mais prxima de


uma reta a 45o ou 135o ser a distribuio.

Interpretando
Grau de Relacionamento

Problemas da Anlise Grfica


A anlise grfica da relao entre
variveis importante, mas os olhos
nem sempre so um bom juiz da
intensidade de uma relao linear.
Os diagramas a seguir ilustram
precisamente os mesmos dados, mas o
grfico inferior menor em um campo
mais amplo.

Problemas da Anlise Grfica


Nossos olhos podem ser enganados
por uma mudana de escalas, ou pela
quantidade de espao em branco em
torno do aglomerado dos pontos.
Deve-se, ento, utilizar uma medida
numrica para suplementar o grfico.
Coeficiente de Correlao Linear (r)

Coeficiente de Correlao Linear


r mede o grau de relacionamento linear
entre valores emparelhados x e y em uma
amostra.
Mede a intensidade e a direo da relao

linear entre duas variveis quantitativas


Chamado tambm de Coeficiente de
Correlao de Pearson (Karl Pearson, 18571936).

Coeficiente de Correo Linear


ou Coeficiente de Pearson
n

S xx = ( xi x ) 2
i =1

S yy = ( yi y ) 2
i =1

S xy = ( xi x )( yi y )
i =1

r =

Sxy
S xx . S yy

S xx = n( xi2 ) ( xi ) 2

S yy = n( y ) ( yi )
2
i

S xy = n xi . yi ( xi )( yi )
-1 r 1

Coeficiente de Correo Linear


ou Coeficiente de Pearson
r=

n ( xi yi ) ( xi )( yi )

n x ( xi ) n y ( yi )

1 r 1

2
i

2
i

Interpretando o
Coeficiente de Correlao Linear
r sempre ser um valor entre
-1 r 1
Quanto mais prximo de 1: maior correlao
negativa
Quanto mais prximo de 1: maior correlao
positiva
Quanto mais prximo de 0: menor a correlao
linear

Interpretao do Valor de r

valor de r

-1

0
correlao
negativa
forte

correlao
correlao
negativa
positiva
fraca
fraca
ausncia
de
correlao

+1
correlao
positiva
forte

Propriedades do Coeficiente de
Correlao de Pearson
-1 r +1
O valor de r no varia se todos os valores
de qualquer uma das variveis so
convertidos para uma escala diferente.
O valor de r no afetado pela escolha de
x ou y. Permutando x e y, r permanece
inalterado.
r s mede a intensidade ou grau de
relacionamentos lineares. No serve para
medir intensidade de relacionamentos nolineares.

Ex.: Alturas e Pesos de Ursos


Siberianos
C om pr i m ent o ( pol .) Peso ( l b.)
x
y
x.y
53,0
80
4.240
67,5
344
23.220
72,0
416
29.952
72,0
348
25.056
73,5
262
19.257
68,5
360
24.660
73,0
332
24.236
37,0
34
1.258
Tot ai s

517

x2
2.809,00
4.556,25
5.184,00
5.184,00
5.402,25
4.692,25
5.329,00
1.369,00

y2
6.400
118.336
173.056
121.104
68.644
129.600
110.224
1.156

2.176 151.879 34.525,75

728.520

Ex.: Alturas e Pesos de Ursos


Siberianos
r=
r=

n ( xi yi ) ( xi )( yi )

n x ( xi ) n y ( yi )
2
i

2
i

8(151.879) (516,5)(2.176)
8(34.525,75) (516,5) 2 8(728.520) (2.176) 2

91.128
=
= 0,897
9433,75 1.093.184

Reta de Regresso Linear


Diferentes retas podem ser traadas, a
olho nu, e um diagrama de disperso
Cada pessoa ter uma tendncia diferente

Nenhuma reta passar exatamente por


todos os pontos (se a correlao no for
mxima)
Precisamos encontrar uma reta que esteja
to prxima dos pontos quanto possvel
Os erros de predio para a reta so erros
em y (direo vertical)

Reta de Regresso Linear


Se um diagrama de disperso sugere uma
relao linear, de interesse representar
este padro atravs de uma reta
Usa-se o mtodo dos mnimos quadrados
para ajustar uma reta de regresso ao
conjunto de pontos do diagrama
A reta de regresso descreve como uma
varivel resposta (dependente) y varia em
relao a uma varivel explanatria
(independente) x

Variveis
Varivel resposta (y) (dependente)
Mede um resultado em um estudo

Varivel explanatria (x) (independente)


Procura explicar os resultados observados

Varivel independente (x)

Varivel dependente (y)

Temperatura do forno (oC)

Resistncia mecnica da cermica


(MPa)

Quantidade de aditivo (%)

Octanagem da gasolina

Renda (R$)

Consumo (R$)

Memria RAM (GB)

Tempo de resposta do sistema (s)

Definio
Dada uma coleo de dados amostrais
emparelhados, a seguinte equao de
regresso descreve a relao entre as duas
variveis

y = a + bx
O grfico da equao chamado reta de
regresso (ou reta de melhor ajuste, ou
reta de mnimos quadrados)

Definio
y = a + bx
b=

n( xi yi ) ( xi )( yi )

n x ( xi )
2
i

(
y )( x ) ( x )( x y )

a=
n( x ) ( x )
y b x

a=
2
i

2
i

b: coeficiente
angular
a: ponto onde a
reta intercepta
eixo y

Exemplo
Considere um experimento em que se
analisa a octanagem da gasolina (Y) em
funo da adio de um aditivo (X).
Para isto, foram realizados ensaios
com os percentuais de 1, 2, 3, 4, 5 e
6% de aditivo. Os resultados seguem.

X
1
2
3
4
5
6

Y
80,5
81,6
82,1
83,7
83,9
85,0

ndice de Octanagem

Exemplo
85,5
85,0
84,5
84,0
83,5
83,0
82,5
82,0
81,5
81,0
80,5
80,0
0

Quantidade de Aditivo (%)

Exemplo
Calculando a equao de regresso...
xi

Soma

1
2
3
4
5
6
21

yi
xi
xiyi
80,5
1
80,5
81,6
4 163,2
82,1
9 246,3
83,7
16 334,8
83,9
25 419,5
85,0
36 510,0
496,8
91 1.754,3

6(1754,3) (21)(496,8) 93
b=
=
= 0,886
2
6(91) (21)
105
496,8 (0,886)(21)
a=
= 79,7
6
y = 79,7 + 0,886 x

Exemplo

ndice de Octanagem

y = 79,7 + 0,886 x
85,5
85,0
84,5
84,0
83,5
83,0
82,5
82,0
81,5
81,0
80,5
80,0
0

Quantidade de Aditivo (%)

Você também pode gostar