Você está na página 1de 13

134

11 ANLISE DE REGRESSO
11.1 Introduo
Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais atributos
ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada
elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada uma
das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores (Xi; Yi).
Objetivo visado quando se registra pares de valores (observaes) em uma amostra, o
estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos em que a variao de um
atributo sensivelmente dependente do outro atributo.
O problema consiste em estabelecer a funo matemtica que melhor exprime a relao
existente entre as duas variveis. Simbolicamente a relao expressa por uma equao de
regresso e graficamente por uma curva de regresso.
11.2 Regresso Linear Simples
Modelo: Yi = + xi + i
Pressuposies:
a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais em Y
e a razo de crescimento constante).
b) Os valores de X so fixados arbitrariamente (X no uma varivel aleatria).
c) Y uma varivel aleatria que depende entre outras coisas dos valores de X.
d) i o erro aleatrio, portanto uma varivel aleatria com distribuio normal, com mdia zero
e varincia 2. [ i N (0, 2)]. i representa a variao de Y que no explicada pela varivel
independente X.
e) Os erros so considerados independentes.

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

135

11.2.1 Estimativas dos Parmetros e


As estimativas dos parmetros e dadas por a e b, sero obtidas a partir de uma
amostra de n pares de valores (xi, yi) que correspondem a n pontos no diagrama de disperso.
Exemplo:
xi
0
1
2
3
5
6

yi
3
3
5
4
6
7

Obtemos ento: y i a bxi


Para cada par de valores (xi, yi) podemos estabelecer o desvio: e i y i y i = yi-(a+bxi)
Mtodo dos Mnimos Quadrados
O mtodo dos mnimos quadrados consiste em adotar como estimativa dos parmetros
os valores que minimizem a soma dos quadrados dos desvios.
S n ei 2 =
i 1

n [y
i=1

- a - bxi ] 2

S = f(a, b)
Essa soma, funo de a e de b, ter mnimo quando suas derivadas parciais em
relao a a e b forem nulas.
Para facilitar a escrita, considera-se
z
a

z
a

2 y

a bxi 1 0

2 y

a bxi xi 0

n
i1

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

136

y a bx 0
x y ax bx 0

y na b x 0
x y a x b x
i

2
i

Da obtm-se as equaes normais da reta.


na b xi

a x i b xi
2

x y
i

Resolvendo-se esse sistema, obtm-se:

x x y
b
x x
i

i
2

x y
i

2
i

x y
i

e a partir da 1 equao normal a y bx


No exemplo:
xi
0
1
2
3
5
6
17

97

xiyi
0
3
10
12
30
42
97

xi2
0
1
4
9
25
36
75

17 28

75

yi
3
3
5
4
6
7
28

17 2

0,66

17
28
0,66
2,8
6
6

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

yi2
9
9
25
16
36
49
144

137

Decomposio da Varincia Total


A disperso da variao aleatria Y pode ser medida atravs da soma dos quadrados dos
desvios em relao a sua mdia Y . Essa soma de quadrados ser denominada Soma de
Quadrados Total (SQ. Total).
SQ. Total Yi Y

A SQ. Total pode ser decomposta da seguinte forma:

Yi Y

Yi Yi

Essa relao mostra que a variao dos valores de Y em torno de sua mdia pode ser
dividida em duas partes: uma

que explicada pela regresso e outra

devido ao fato de que nem todos os pontos esto sobre a reta de regresso, que a parte no
explicada pela regresso ou variao residual.
Assim:
SQ. Total = SQ. Regresso + SQ. Resduo
A estatstica definida por r 2

~
SQ. Regressao
SQ. Total

, e denominada coeficiente de

determinao, indica a proporo ou percentagem da variao de Y que explicada pela


regresso.
Note que 0 r2 1.
Frmulas de Clculo:
SQ Total

Y Y
i

Yi

, com (n-1) graus de liberdade.

SQ Regresso Y i Y b

x y
i

x y
i

com (n-2) graus de liberdade.

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

138

11.3.

Anlise de Varincia da Regresso


A soma de Quadrados da Regresso (SQ Regresso), segue uma distribuio de x2 (qui-

quadrado) com um grau de liberdade, enquanto que a Soma de Quadrados do


Resduo (SQ Resduo) segue a mesma distribuio, porm com (n-2) graus de liberdade.
~
SQ Regress~
ao / 1 QM Regressao
, segue uma distribuio F de

SQ Residuo / n - 2
QM Residuo

Portanto, o quociente

Snedecor com 1 e (n-2) graus de liberdade.


Esse fato nos permite empregar a distribuio F de Snedecor para testar a significncia
da regresso, atravs da chamada Anlise de Varincia, sintetizada no quadro abaixo:
Anlise de Varincia
Causas de Variao
GL
SQ
QM
F
Regresso
1
SQ Regresso
QM Regresso/1 QM Regresso
Resduo
n-2
SQ Resduo
QM Resduo /n-2
QM Resduo
Total
n-1
SQ Total
onde QM representa Quadrado Mdio e obtido pela diviso da Soma de Quadrados pelos
respectivos graus de liberdade.
Para testar a significncia da regresso, formula-se as seguintes hipteses:
H0: =0 contra H1: <>0, onde representa o coeficiente de regresso paramtrico.
Se o valor de F, calculado a partir do quadro anterior, superar o valor terico de F com 1
e (n-2) graus de liberdade, para o nvel de significncia , rejeita-se H0 e conclui-se que a
regresso significativa. Ou seja, se F calc. > F [1,(n-2)], rejeita-se H0.
Para o exemplo anterior:

~ =b
SQ Regressao

x y
i

x y
i

17 28

~
SQ Regressao
= 0,66 97
6

= 11,66

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

139

SQ Total =

yi

y
i

28 2

= 144 -

= 13,33

SQ Residuo = SQT - SQR = 13,33 - 11,66 = 1,67

Anlise de Varincia
Causas de Variao
Regresso
Resduo
Total

GL
1
4
5

SQ
11,66
1,67

QM
11,66
0,42

F
27,76

H0: =0 contra H1: <>0


Como F calculado = 27,76 > 21,20 = F0,01 (14)
Conclui-se que a regresso de Y sobre X segundo o modelo Y i 2,8 0,66 X i
significativa ao nvel de 1%. Uma vez estabelecida e testada a equao de regresso, a mesma
pode ser usada para explicar o relacionamento entre as variveis e tambm para fazer previses
dos valores de Y para valores fixados de X.
Exemplo: Se quisermos saber o valor estimado de Y para X igual a 4, procederamos da
seguinte maneira:
2,8 0,66 4
Y

= 5,44
Y

Esse procedimento poderia ser empregado para qualquer valor fixado de X.


11. 4 Exerccios
1. Com os dados de 50 poedeiras de cada um de 10 lotes da raa White Leghorn:
Peso mdio
4,6
5,1
4,8
Consumo de rao
87,7 93,1 89,8
a) Fazer o diagrama de disperso dos dados.

4,4
91,4

5,9
99,5

4,7
92,5

5,1
95,5

5,2
99,3

b) Achar a equao da regresso linear.


c) Estimar o peso mdio das poedeiras para o consumo de rao de 97 libras.

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

4,9
93,4

5,1
94,4

140

Estabelecer o coeficiente de correlao e test-lo.


d) Interpretar o coeficiente de determinao.
2. Considerando as atividades iniciais e residuais da FAO(Fosfatase alcalina ssea), em pH 9,2
em ausncia e em presena de uria 3M:
Sem uria (UI)
66,2
60,6
68,9
Com uria (UI)
13,8
11,0
13,8
a) Fazer o diagrama de disperso dos dados.

9,10
22,0

68,9
13,8

63,4
16,5

49,6
8,2

46,9
5,5

b) Determinar a equao de regresso linear.


c) Estabelecer o coeficiente de correlao e test-lo.
d) Interpretar o coeficiente de determinao.
e) Achar o intervalo de confiana para a mdia de Y. Dado X 0 = 75 UI (atividade inicial da
FAO).
f) Testar a significncia do coeficiente de regresso linear.
g) Calcular e interpretar o I.C. para o coeficiente de regresso.
3. Abaixo esto relacionados os comprimentos X e as larguras Y de 10 folhas tiradas ao acaso
de determinada pastagem:
Folha (n)
1
2
3
4
5
Comprimento (cm) 12
15
11
16
13
Largura (cm)
10
14
9
13
10
a) A correlao significativa entre os dois atributos.

6
12
12

7
10
8

8
9
7

9
17
13

10
15
14

b) Que porcentagem da variao total permanece no explicada, quando se admite uma relao
linear entre X e Y?
4. Abaixo esto relacionados os coeficientes de eficcia proticas das concentraes proticas
de peixe (FPC) elaborados pelos mtodos americano e experimental:
Mtodo Americano (Y)
3,405
3,436
Mtodo experimental (Y)
3,436
3,405
a) Fazer um diagrama de disperso dos pontos.

3,427
3,407

3,407
3,427

Estabelecer o coeficiente de correlao e test-lo atravs do teste t.


b) Calcular o coeficiente de regresso e test-lo.
c) Testar o coeficiente de regresso linear atravs do teste t.
d) Determinar o intervalo de confiana para o coeficiente de regresso.
Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

3,406
3,436

3,436
3,407

141

e) Determinar o intervalo de confiana para mdia de Y dado o coeficiente: X0 = 3,423.


f) Interpretar o coeficiente de determinao.
g) Determinar a equao d regresso linear.
5. Com os dados de 50 poedeiras de cada um de 10 lotes da raa White Leghorn:
Peso mdio (libras)
4,6
5,1
4,8
4,4
5,9
4,7
5,1
5,2
4,9
5,1
a) Fazer o diagrama de disperso dos dados.

Consumo de rao (libras)


87,7
93,1
89,8
91,4
99,5
92,1
95,5
99,3
93,4
94,4

b) Determinar a equao de regresso linear.


c) Estimar o peso mdio das poedeiras para um consumo de rao de 97,0 libras.
d) Determinar e interpretar o intervalo de confiana para o coeficiente de regresso.
e) Testar atravs do teste t a significncia estatstica do coeficiente de regresso.
f) Determinar e interpretar o intervalo de confiana para a mdia de Y dado o consumo de rao
igual a 95,0 libras
g) Estabelecer o coeficiente de correlao e test-lo atravs do teste t.
h) Interpretar o coeficiente de determinao.
i) Conferir os clculos usando o SAS.
6. Valores referentes ao pinheiro brasileiro
X dimetro (cm)
11,5
16,5
Y altura (m)
8
12
a) Elaborar o diagrama de disperso dos dados.

21,5
16

26,5
17

31,5
19

b) Determinar a equao de regresso linear e tra-la.


c) Interpretar o coeficiente de regresso.
d) Se o dimetro 22 cm qual a estimativa de altura?
7. Considerando Y a tonelagem produzida de um certo cereal e X a rea plantada em hectares,
conforme os dados constantes da tabela abaixo:
Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

142

Y
11
14
13
20
15
24
20
27
23
33
a) Construa o diagrama de disperso.

X
10
11
11
15
14
18
20
21
20
30

b) Encontre a reta que ajuste os dados


c) Encontre o coeficiente de correlao de Pearson
d) Encontre o coeficiente de correlao de Sperman

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

143

8.

O nmero de capsulas de um regulador da presso arterial consumido por hipertenso


relacionado com o fluxo urinrio, conforme a quantidade de medicamentos ingerida em um
certo intervalo de tempo, temos.

Paciente
1
2
3
4
5
Medicamento (n de capsulas)
3
5
6
7
8
Fluxo urinrio (volume)
20 22 23 24 26
a) Calcular o coeficiente de correlao de Pearson. Explicar

6
7
8
9
10
9
11 12 13 16
29 30 34 37 40
o significado do resultado

encontrado.
b) Encontrar a reta de regresso, atravs do mtodo dos mnimos quadrados. Calcular o
coeficiente de determinao. Interpretar os dados.
9. Uma empresa est estudando como varia a demanda de certo medicamento em funo de seu
preo de venda. Para isso levantou-se as seguintes informaes:
Meses
J
F
M
A
M
J
J
A
S
O
Unidades vendidas
248 242 234 216 230 220 213 205 198 195
Preo de Venda/Unid. 162 167 165 173 170 176 178 180 182 187
a) Calcular o coeficiente de correlao de Pearson. Explicar o significado do resultado obtido.
b) Construir o Diagrama de Disperso dos dados.
c) Calcular o Coeficiente de Determinao (rxy2). Interpretar o coeficiente.
10. Considere o seguinte conjunto de dados abaixo:
Cultivo de Milho ( Hectares )
Quantidade de Herbicida (1)
Fonte: Ministrio da Agricultura

2
3,5

3
5,7

5
9,9

8
16,3

10
19,3

12
25,7

A quantidade de herbicida varia da rea de cultivo de milho.


Calcule
a) O coeficiente de correlao. Explique o resultado obtido.
b) Encontre a Reta de Regresso. Utilize o Mtodo dos Mnimos Quadrados.
c) Calcule o coeficiente de determinao. Interprete-o.

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

14
28,2

15
32,6

144

11. Uma cooperativa informa a relao existente entre a produo (kg) e a irrigao (polegada)
Produo (kg)
120 190 240 140 180 280 150 115 215
Irrigao (Pol.) 2,5
6,5
11,0 4,0
8,5
14,0 6,0
5,0
10,0
a) Calcule o coeficiente de correlao de Person. Explique o resultado obtido.

220
13,5

320
16,0

b) Construa o Diagrama de Disperso dos Dados.


c) Encontre a Reta de Regresso, atravs do Mtodo dos Mnimos Quadrados.
d) Calcule o coeficiente de determinao. Interprete o resultado Obtido.
12. Abaixo esto relacionados os comprimentos e as larguras de 10 folhas tiradas ao acaso de
determinada pastagem:
Folha n
1
2
3
4
5
6
7
8
Comprimento (cm)
12
15
11
16
13
12
10
9
Largura (cm)
10
14
9
13
10
12
8
7
a) Calcule o coeficiente de correlao de Pearson. Explique o resultado obtido

9
17
13

10
15
14

b) Construa o Diagrama de Disperso dos Dados.


c) Encontre a Reta de Regresso, atravs do Mtodo dos Mnimos Quadrados.
d) Calcule o coeficiente de Determinao. Interprete o resultado obtido.
13. Um grupo de 10 alunos realizou vrios exerccios de matemtica como preparao para uma
prova. O nmero de exerccios feitos pelos alunos e sua respectiva nota na prova se acham
relacionados abaixo:
N de Exerccios
3
6
7
10
11
14
18
Nota da Prova
1,0 2,5
2,0
3,0
3,0
3,5
3,0
a) Calcule o coeficiente de correlao. Explique o resultado obtido

20
3,5

21
4,5

22
4,0

b) Construa o Diagrama de Disperso dos dados


c) Encontre a Reta de Regresso, atravs do Mtodo dos Mnimos Quadrados
d) Calcule o Coeficiente de Determinao. Interprete o resultado obtido.
14. Os dados codificados a seguir representam o resultado qumico Y para a determinao de
diferentes temperaturas, X.
X
-2
-1
0
1
2
Y
4
3
3
2
1
a) Calcular o coeficiente de correlao linear de Pearson. Explicar o resultado obtido;
b) Construir o Diagrama de Disperso dos Dados;
c) Calcular o Coeficiente de Determinao. Interpretar o coeficiente;
Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

145

d) Encontrar a reta de regresso, atravs do Mtodo dos Mnimos Quadrados.


15. Dada a tabela:
Paciente
N de anos/fumou
Grau
de
afeco

1
25
dos 55

2
36
60

3
22
50

4
15
30

5
48
75

6
39
70

7
42
70

8
31
55

9
28
30

10
33
35

pulmes
a) Calcular o coeficiente de correlao. Explicar o resultado obtido;
b) Construir o Diagrama de Disperso;
c) Encontrar a Reta de Regresso, atravs do Mtodo dos Mnimos Quadrados;
d) Calcular o coeficiente de determinao. Interpretar o resultado obtido.
16. Uma experincia foi realizada, com vistas a observar o efeito do aumento da temperatura
sobre a potencialidade de um antibitico. Trs pores de uma unidade de antibitico foram
armazenadas, durante igual perodo de tempo sob as condies abaixo:
Resultado de Potencialidade Mdio (Y)
36,7
30,3
Temperatura (X)
30
50
a) Calcular o coeficiente de correlao. Explicar o resultado obtido;

23,0
70

b) Construir o diagrama de disperso dos dados;


c) Encontrar a reta de regresso, atravs do Mtodo dos Mnimos Quadrados;
d) Calcular o coeficiente de determinao. Interpretar o resultado Obtido.

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

18,0
90

146

17. Dada a tabela:


Peso dos pais (x)
65 63 67 64 68 62 70 66 68
Peso dos filhos (y) 68 66 68 65 69 66 68 65 71
a) Calcular o coeficiente de correlao de Pearson. Explique o resultado;

67
67

69
68

71
70

b) Construir o diagrama de disperso dos dados;


c) Encontrar a reta de regresso atravs do mtodo dos mnimos quadrados
d) Calcular o coeficiente de determinao. Interpretar o resultado obtido.
18. Foi realizado um experimento para verificar a variao do calor especfico de um certo
produto qumico com sua temperatura
Temperatura
50
60
70
80
90
Calor especfico
1,60
1,63
1,67
1,70
1,71
a) Calcular o coeficiente de correlao de Pearson. Explique o resultado;
b) Construir o diagrama de disperso de dados;
c) Encontrar a equao de regresso, atravs do Mtodo dos Mnimos Quadrados;
d) Calcular o coeficiente de determinao. Interpretar o resultado obtido.

Prof. Joo Eduardo Pereira -ESTATSTICA BSICA - Dep. Estatstia

100
1,71

Você também pode gostar