Você está na página 1de 48

UNIDADE III

Estatística Aplicada

Prof. Mauricio do Fanno


Correlação e regressão lineares

Correlação:
 Existência ou não de relação de causalidade entre duas variáveis.

Regressão:
 Modelo matemático que relaciona duas variáveis que se correlacionam.

Funções matemáticas:
 Linear.
 Quadrática.
 Logarítmica.
 Exponencial.
 Etc.
Correlação linear

 Definição
Exemplos:
 O salário de um trabalhador está relacionado à escolaridade dele, ou seja, em que
grau a variável, “salário médio de um trabalhador”, está ligada à variável
“escolaridade do trabalhador”?

 A quantidade de livros que uma pessoa já leu está relacionada à sua


escolaridade?

 Em que grau o peso de uma pessoa está relacionado à


sua altura?
Correlação linear

 A estatura de uma pessoa está relacionada à sua alimentação?


 A lucratividade de uma empresa está relacionada ao grau de escolaridade de seus
executivos?
 A capacidade de aprender estatística está relacionada ao sexo do aluno?

 Variáveis independentes (x) e dependentes (y).


 Correlação perfeita, forte, fraca e inexistente.
Correlação linear

Fonte: autoria própria


Correlação linear

 Medida da correlação: coeficiente de Pearson.


Correlação linear

Correlação de acordo com o coeficiente r:


r = -1,00: correlação negativa perfeita
r = -0,75: correlação negativa forte
r = -0,50: correlação negativa média
r = -0,25: correlação negativa fraca
r = 0,00: correlação linear inexistente
r = +0,25: correlação positiva fraca
r = +0,50: correlação positiva média
r = +0,75: correlação positiva forte
r = +1,00: correlação positiva perfeita
Correlação linear

 Um engenheiro agrônomo afirma que a produção de leite está relacionada com o


volume de chuvas no período considerado. Para provar a sua tese ele montou a
tabela abaixo referente a nove anos consecutivos. Existe correlação entre essas
duas variáveis? E de que tipo se existir?
Índice Produção em
Ano pluviométrico milhões de
em mm litros
2009 19 23
2010 30 27
2011 24 26
2012 23 25
2013 25 24
2014 32 30
2015 28 26
2016 22 25
2017 20 24
Correlação linear

Índice Produção em
n Ano pluviométrico milhões de xi 2 yi2 xi.yi
em mm (xi) litros (yi)

1 2009 19 23 361 529 437


2 2010 30 27 900 729 810
3 2011 24 26 576 676 624
4 2012 23 25 529 625 575
5 2013 25 24 625 576 600
Fonte: autoria própria
6 2014 32 30 1024 900 960
7 2015 28 26 784 676 728
8 2016 22 25 484 625 550
9 2017 20 24 400 576 480
Somatórios 223 230 5683 5912 5764
Correlação linear

n Ano xi yi x i2 yi2 xi.yi


Somatórios 223 230 5683 5912 5764

Fonte: autoria própria


Correlação linear

Correlação positiva forte


Interatividade

Estatisticamente, aferimos a existência da correlação entre duas variáveis utilizando


o coeficiente de correlação de Pearson. Suponha que tenhamos calculado esse
coeficiente para uma determinada situação prática e ele resultou no valor -0,687. A
partir dessa informação, podemos afirmar:

a) A correlação entre as variáveis é forte e, quando a variável x aumenta, a variável


y diminui.
b) A correlação entre as variáveis é média e, quando a variável x aumenta, a
variável y também aumenta.
Interatividade

c) A correlação entre as variáveis é média e, quando a variável x aumenta, a


variável y diminui.

d) A correlação entre as variáveis é fraca e, quando a variável x aumenta, a


variável y diminui.

e) A correlação entre as variáveis é forte e, quando a variável x diminui, a


variável y também diminui.
Resposta

Estatisticamente, aferimos a existência da correlação entre duas variáveis utilizando


o coeficiente de correlação de Pearson. Suponha que tenhamos calculado esse
coeficiente para uma determinada situação prática e ele resultou no valor -0,687. A
partir dessa informação, podemos afirmar:

c) A correlação entre as variáveis é média e, quando a variável x aumenta, a


variável y diminui.
Correlação linear

O gerente de logística de uma transportadora defende que existe correlação entre a


quantidade de carga transportada e os consumos de combustível. Para demonstrar
seu ponto de vista, montou a tabela a seguir. Existe correlação e, se existir,
de que tipo?
Carga transportada (toneladas) Consumo de combustível (km/L)
75 4,7
69 5,1
56 4,9
100 3,7
Fonte: autoria própria 88 4
106 3,4
81 4,1
127 3,5
72 4,9
114 3,3
Correlação linear

Carga Consumo de
n transportada combustível xi 2 yi2 xi.yi
(xi) (yi)
1 75,0 4,7 5625,0 22,1 352,5
2 69,0 5,1 4761,0 26,0 351,9
3 56,0 4,9 3136,0 24,0 274,4
4 100,0 3,7 10000,0 13,7 370,0
5 88,0 4,0 7744,0 16,0 352,0
6 106,0 3,4 11236,0 11,6 360,4
Fonte: autoria própria
7 81,0 4,1 6561,0 16,8 332,1
8 127,0 3,5 16129,0 12,3 444,5
9 72,0 4,9 5184,0 24,0 352,8
10 114,0 3,3 12996,0 10,9 376,2

Somat. 888,0 41,6 83372,0 177,3 3566,8


Correlação linear

Consumo de
Carga
n combustível xi 2 yi2 xi.yi
transportada (xi)
(yi)

Somat. 888,0 41,6 83372,0 177,3 3566,8

Fonte: autoria própria


Correlação linear

Correlação negativa forte


Regressão linear

Fonte: autoria própria


Regressão linear

 y = variável dependente
 x = variável independente
 a = coeficiente angular dado por:

 b = termo independente dado por:


Regressão linear
Regressão linear

 Um engenheiro agrônomo afirma que a produção de leite está relacionada com o


volume de chuvas no período considerado. Calculou o coeficiente de correlação(
r=0,887) e confirmou sua tese. Determinar agora a reta de regressão linear.
Índice pluviométrico Produção em milhões
Ano
em mm de litros
2009 19 23
2010 30 27
2011 24 26
Fonte: autoria própria 2012 23 25
2013 25 24
2014 32 30
2015 28 26
2016 22 25
2017 20 24
Regressão linear

 Cálculo da média e do desvio padrão de x.


n xi d i2
1 19 33,6
2 30 27,0
3 24 0,6
4 23 3,2
5 25 0,0
Fonte: autoria própria 6 32 51,8
7 28 10,2
8 22 7,8
9 20 23,0
Somatórios 223 157,2
Regressão linear

 Cálculo da média e do desvio padrão de y.


n yi d i2
1 23 6,8
2 27 2,0
3 26 0,2
4 25 0,4
5 24 2,6
Fonte: autoria própria 6 30 19,4
7 26 0,2
8 25 0,4
9 24 2,6
Somatórios 230 34,6
Regressão linear

Em que:
Regressão linear
Regressão linear

Fonte: autoria própria


Interatividade

Na reta de regressão linear, temos dois coeficientes caracterizadores: o coeficiente


angular e o termo independente. Acerca desses dois componentes, podemos
afirmar que:

a) O termo independente determina a inclinação da reta e, se for positivo, a


reta será crescente.

b) O coeficiente angular determina o ponto no qual a reta cruza o eixo


vertical e, se for positivo, a reta será crescente.
Interatividade

c) O termo independente determina o ponto no qual a reta cruza o eixo vertical


e, se for positivo, a reta será crescente.

d) O coeficiente angular determina a inclinação da reta e, se for positivo, a


reta será crescente.

e) O coeficiente angular determina a inclinação da reta e, se for negativo, a


reta será crescente.
Resposta

Na reta de regressão linear, temos dois coeficientes caracterizadores: o coeficiente


angular e o termo independente. Acerca desses dois componentes, podemos
afirmar que:

d) O coeficiente angular determina a inclinação da reta e, se for positivo, a


reta será crescente.
Regressão linear

O gerente de logística de uma transportadora sabe que existe correlação entre o


peso de carga transportada e o consumo de combustível, com um índice de
correlação de -0,921. Ele quer prever o consumo correspondente a uma carga de
140 toneladas. Como fazer? Carga transportada (toneladas) Consumo de combustível (km/L)
75 4,7
69 5,1
56 4,9
100 3,7
Fonte: autoria própria 88 4
106 3,4
81 4,1
127 3,5
72 4,9
114 3,3
Regressão linear

 Cálculo da média e do desvio padrão de x.


n xi d i2
1 75 190,4

2 69 392,0
3 56 1075,8
4 100 125,4
5 88 0,6
6 106 295,8
Fonte: autoria própria 7 81 60,8
8 127 1459,2
9 72 282,2
10 114 635,0
Somatórios 888 4517,2
Regressão linear

 Cálculo da média e do desvio padrão de y.


n yi di2
1 4,7 0,25
2 5,1 0,81
3 4,9 0,49
4 3,7 0,25
5 4 0,04
6 3,4 0,64
Fonte: autoria própria 7 4,1 0,01
8 3,5 0,49
9 4,9 0,49
10 3,3 0,81
Somatórios 41,6 4,28
Regressão linear

Em que:
Regressão linear
Regressão linear

Fonte: autoria própria


Regressão linear

Fonte: autoria própria


Regressão linear
Interatividade

O gráfico visto a seguir relaciona, como vimos, a produção de leite com o índice
pluviométrico anual. Baseando-se nele, podemos dizer que, para um índice
pluviométrico de 25 mm, estima-se a produção de leite em:
a) 27,0 milhões de litros.
b) 25,6 milhões de litros.
c) 28,8 milhões de litros.
d) 24,0 milhões de litros.
e) 27,8 milhões de litros.

Fonte: autoria própria


Resposta

O gráfico visto a seguir relaciona, como vimos, a produção de leite com o índice
pluviométrico anual. Baseando-se nele, podemos dizer que, para um índice
pluviométrico de 25 mm, estima-se a produção de leite em:
a) 27,0 milhões de litros.
b) 25,6 milhões de litros.
c) 28,8 milhões de litros.
d) 24,0 milhões de litros.
e) 27,8 milhões de litros.
25,6

Fonte: autoria própria


Regressão linear – séries históricas

 A produção de uma empresa química do produtos XPRO, em milhões de


toneladas, nos últimos 11 anos está relacionada no quadro a seguir. Desejamos
estimar a produção para os próximos dois anos.

Ano Produção Ano Produção

2008 66,6 2014 93,2

2009 84,9 2015 111,6

Fonte: autoria própria 2010 88,6 2016 88,3

2011 78,0 2017 117,1

2012 96,8 2018 115,2

2013 105,2
Regressão linear – séries históricas

 Também se usa o método dos mínimos quadrados, com adaptações.

Vários métodos, por exemplo:


Regressão linear – séries históricas

x y x2 xy
2008 -5 66,6 25 -333,0
2009 -4 84,9 16 -339,6
2010 -3 88,6 9 -265,8
2011 -2 78,0 4 -156,0
2012 -1 96,8 1 96,8
2013 0 105,2 0 0
2014 1 93,2 1 93,2
Fonte: autoria própria
2015 2 111,6 4 223,2
2016 3 88,3 9 264,9
2017 4 117,1 16 468,0
2018 5 115,2 25 576,0
Somatórios 0 1045,4 110 434,1
Regressão linear – séries históricas
Regressão linear – séries históricas

2012 0
2014 1
2015 2
2016 3
2017 4
2018 5
2019 6
2020 7
Fonte: autoria própria
Interatividade

Considerando-se a série histórica que acabamos de calcular, podemos estimar a


produção dessa empresa para 2025 em, aproximadamente:

a) 131 milhões de toneladas.


b) 118 milhões de toneladas.
c) 142 milhões de toneladas.
d) 151 milhões de toneladas.
e) 121 milhões de toneladas.
Resposta

Considerando-se a série histórica que acabamos de calcular, podemos estimar a


produção dessa empresa para 2025 em, aproximadamente:

a) 131 milhões de toneladas.


b) 118 milhões de toneladas.
c) 142 milhões de toneladas.
d) 151 milhões de toneladas.
e) 121 milhões de toneladas.
ATÉ A PRÓXIMA!

Você também pode gostar