Você está na página 1de 32

Probabilidade e Estatstica

Correlao e Regresso Linear


Variveis

Varivel: caractersticas ou itens de


interesse de cada elemento de uma
populao ou amostra
Tambm chamada parmetro,
posicionamento, condio...
Duas variveis esto relacionadas se a
mudana de uma provoca a mudana na
outra.
Exemplo: velocidade x consumo combustvel
Correlao

Correlao entre duas variveis


Quando uma delas est, de alguma forma,
relacionada com a outra.
Quando a alterao no valor de uma
varavel (dita independente) provoca
alteraes no valor da outra varivel
(dita dependente)
Diagramas de Disperso

Um diagrama de disperso mostra a relao


entre duas variveis quantitativas, medidas
sobre os mesmos indivduos.
Os valores de uma varivel aparecem no
eixo horizontal, e os da outra, no eixo
vertical.
Comumente, coloca-se no eixo x um parmetro
Cada indivduo aparece como o ponto do
grfico definido pelos valores de ambas as
variveis para aquele indivduo
Exemplos

Fabricao
Nmero de peas produzidas e nmero de peas defeituosas
Construo
Nmero de falhas em uma obra e a satisfao mdia dos
construtores
Dias de atraso de entrega x nmero de dias chuvosos
Financeiro
Mdia de tempo de atraso de pagamento e nmero de erros de
fatura
Vendas
% de imveis vendidos na data de entrega da obra x satisfao
mdia dos clientes nos ltimos 10 empreendimentos.
Exemplo - Peso x altura
Peso Altura Peso x Altura
(kg) (m)
80 1,80 1,95
1,9
85 1,83 1,85
50 1,65 1,8

Altura
70 1,90 1,75
1,7
55 1,60
1,65
77 1,80 1,6
85 1,78 1,55
40 50 60 70 80 90 100
93 1,86
Peso
65 1,70
60 1,65
Exemplo Peso x Altura
Estratificando...
Altura Altura Homens
Peso (kg) homens Mulheres Peso x Altura (por sexo)
(m) (m)
Mulheres
80 1,80 --- 110
85 1,83 --- 90
50 --- 1,65 70

Pesos
70 --- 1,90 50
55 --- 1,60 30
77 1,80 --- 10
85 --- 1,78 1,5 1,6 1,7 1,8 1,9 2
93 1,86 ---
Alturas
65 1,70 ---
60 --- 1,65
Dicas

Eixo x
Varivel que alterada por uma modificao no
processo (varivel independente)
Geralmente uma possvel causa de um problema
Eixo y
Varivel que pode mudar de acordo com a
mudana da varivel em x (varivel
dependente)
Geralmente um indicador de qualidade ou efeito
gerado por uma causa.
Analisando Diagramas de
Disperso
Os aspectos abaixo so relevantes na
anlise dos Diagramas:
DIREO (crescente, decrescente)
FORMA (linear, no-linear, aglomerados)
PONTOS DISCREPANTES
Interpretando

Padres de Disperso

Quanto maior a correlao, mais prxima de


uma reta a 45o ou 135o ser a distribuio.
Interpretando

Grau de Relacionamento

Escala?...
Problemas da Anlise Grfica

A anlise grfica da relao entre


variveis importante, mas os olhos
nem sempre so um bom juiz da
intensidade de uma relao linear.
Os diagramas a seguir ilustram
precisamente os mesmos dados, mas o
grfico inferior menor em um campo
mais amplo (escala diferente).
Problemas da Anlise Grfica

Nossos olhos podem ser enganados


por uma mudana de escalas, ou pela
quantidade de espao em branco em
torno do aglomerado dos pontos.
Deve-se, ento, utilizar uma medida
numrica para suplementar o grfico.
Coeficiente de Correlao Linear (r)
Coeficiente de Correlao Linear

r mede o grau de relacionamento linear


entre valores emparelhados x e y em uma
amostra.
Mede a intensidade e a direo da relao
linear entre duas variveis quantitativas.
Chamado tambm de Coeficiente de
Correlao de Pearson (Karl Pearson, 1857-
1936).
Coeficiente de Correo Linear
ou Coeficiente de Pearson
n
S xx = ( xi x ) 2 S xx = n( xi2 ) ( xi ) 2
i =1
n
S yy = ( yi y ) 2 S yy = n( y ) ( yi )
2
i
2

i =1
n
S xy = ( xi x )( yi y ) S xy = n xi . yi ( xi )( yi )
i =1

Sxy
r = -1 r 1
S xx . S yy
Coeficiente de Correo Linear
ou Coeficiente de Pearson

n ( xi yi ) ( xi )( yi )
r=
n x ( xi ) n y ( yi )
2 2 2 2
i i

1 r 1
Interpretando o
Coeficiente de Correlao Linear
r sempre ser um valor entre
-1 r 1
Quanto mais prximo de 1: maior correlao
negativa
Quanto mais prximo de 1: maior correlao
positiva
Quanto mais prximo de 0: menor a correlao
linear
Interpretao do Valor de r

valor de r

-1 0 +1

correlao correlao correlao correlao


negativa negativa positiva positiva
forte fraca fraca forte
ausncia
de
correlao
Propriedades do Coeficiente de
Correlao de Pearson
-1 r +1
O valor de r no varia se todos os valores
de qualquer uma das variveis so
convertidos para uma escala diferente.
O valor de r no afetado pela escolha de
x ou y. Permutando x e y, r permanece
inalterado.
r: s mede a intensidade ou grau de
relacionamentos lineares. No serve para
medir intensidade de relacionamentos no-
lineares.
Ex.: Alturas e Pesos de Ursos
Siberianos
C om pr i m ent o ( pol .) Peso ( l b.)
x y x.y x2 y2
53,0 80 4.240 2.809,00 6.400
67,5 344 23.220 4.556,25 118.336
72,0 416 29.952 5.184,00 173.056
72,0 348 25.056 5.184,00 121.104
73,5 262 19.257 5.402,25 68.644
68,5 360 24.660 4.692,25 129.600
73,0 332 24.236 5.329,00 110.224
37,0 34 1.258 1.369,00 1.156

Tot ai s 517 2.176 151.879 34.525,75 728.520


Ex.: Alturas e Pesos de Ursos
Siberianos

n ( xi yi ) ( xi )( yi )
r=
n x ( xi ) n y ( yi )
2 2 2 2
i i

8(151.879) (516,5)(2.176)
r= =
8(34.525,75) (516,5) 2 8(728.520) (2.176) 2
91.128
= = 0,897
9433,75 1.093.184
Reta de Regresso Linear

Diferentes retas podem ser traadas, a


olho nu, e um diagrama de disperso
Cada pessoa ter uma tendncia diferente
Nenhuma reta passar exatamente por
todos os pontos (se a correlao no for
mxima)
Precisamos encontrar uma reta que esteja
to prxima dos pontos quanto possvel
Os erros de predio para a reta so erros
em y (direo vertical)
Reta de Regresso Linear

Se um diagrama de disperso sugere uma


relao linear, de interesse representar
este padro atravs de uma reta
Usa-se o mtodo dos mnimos quadrados
para ajustar uma reta de regresso ao
conjunto de pontos do diagrama
A reta de regresso descreve como uma
varivel resposta (dependente) y varia em
relao a uma varivel explanatria
(independente) x
Variveis

Varivel resposta (y) (dependente)


Mede um resultado em um estudo
Varivel explanatria (x) (independente)
Procura explicar os resultados observados
Varivel independente (x) Varivel dependente (y)
Temperatura do forno (oC) Resistncia mecnica da cermica
(MPa)
Quantidade de aditivo (%) Octanagem da gasolina
Renda (R$) Consumo (R$)

Memria RAM (GB) Tempo de resposta do sistema (s)


Definio

Dada uma coleo de dados amostrais


emparelhados, a seguinte equao de
regresso descreve a relao entre as duas
variveis
y = + x
O grfico da equao chamado reta de
regresso (ou reta de melhor ajuste, ou
reta de mnimos quadrados)
Definio

y = + x : coeficiente
angular
n ( xi yi ) ( xi )( yi ) : ponto onde a
=
n ( x ) ( xi )
2 2
reta intercepta
eixo y
i

=
( i ) ( i ) ( xi )( xi yi )
y x 2

n ( x ) ( xi )
2 2
i

= y x
i i

n
Exemplo

Considere um experimento em que se


analisa a octanagem da gasolina (Y) em
funo da adio de um aditivo (X).
Para isto, foram realizados ensaios
com os percentuais de 1, 2, 3, 4, 5 e
6% de aditivo. Os resultados seguem.
Exemplo

85,5
X Y 85,0
84,5
ndice de Octanagem

1 80,5
84,0
2 81,6 83,5
3 82,1 83,0
4 83,7 82,5
82,0
5 83,9 81,5
6 85,0 81,0
80,5
80,0
0 1 2 3 4 5 6 7
Quantidade de Aditivo (%)
Exemplo

Calculando a equao de regresso...


2
xi yi xi xiyi
1 80,5 1 80,5
2 81,6 4 163,2
3 82,1 9 246,3
4 83,7 16 334,8
5 83,9 25 419,5
6 85,0 36 510,0
Soma 21 496,8 91 1.754,3
6(1754,3) (21)(496,8) 93
= = = 0,886
6(91) (21) 2
105
496,8 (0,886)(21)
= = 79, 7
6
y = 79, 7 + 0,886 x
Exemplo

y = 79,7 + 0,886 x
85,5
85,0
84,5
ndice de Octanagem

84,0
83,5
83,0
82,5
82,0
81,5
81,0
80,5
80,0
0 1 2 3 4 5 6 7
Quantidade de Aditivo (%)

Você também pode gostar