Você está na página 1de 39

Horrio: Teras 16:00

Prof. Emerson M. Vieira


e-mail (Emerson): emvieira@unb.br

Delineamento Experimental

AULA

Regresso Linear & Correlao


Estudo do comportamento
conjunto entre duas variveis

l REGRESSO LINEAR - Investiga a


variao de uma varivel y (tambm
chamada resposta ou dependente) em
funo de uma varivel x (tambm
chamada de explanatria ou
independente)
Regresso x Correlao
l Regresso: A relao entre duas variveis
tem dependncia funcional ex: nmero de
anis de crescimento x idade da rvore.
l Correlao: A relao entre duas variveis
no de dependncia, elas simplesmente
covariam ex: tamanho do brao x tamanho
da perna
REGRESSO OU
CORRELAO?
l Relao entre biomassa de insetos comedores de
folhas e produo de frutos em uma floresta
l Comprimento da asa e idade
l Presso sangunea e peso
l Atividade de moscas e atividade de minhocas
l Anis de crescimento e idade
l Tamanho de antena e tamanho de asa de borboleta

l O que determina o que?


l H uma varivel dependente? Qual ? Qual influencia
(ou determina) qual?
l Dica Faz sentido inverter as variveis?
Teste de REGRESO
l Exemplos de relaes entre variveis
que podem ser entendidas utilizando
regresso: -
Comprimento da asa (y) e idade (x)
- Presso sangunea (y) e peso (x)
- Atividade de moscas (y) e temperatura
(x) - Anis de crescimento (y) e
idade (x)
- Qual a chance da variao
conjunta dessas variveis ocorrer ao
acaso?
Regresso Simples
l Por que simples? - Resume a relao
entre duas variveis, em geral atravs de
um nmero grande de dados.
l Trs parmetros so estimados:
l A frao da variao em y que pode ser
explicada por x (coeficiente de
determinao = r2)
l O ngulo ( ou b) = taxa em que y varia
em relao a x.
l O intercepto ( ou a) = valor de y quando
x=0
Primeiro passo colocar os valores em um grfico x-y
Diagrama de disperso
grfico no qual cada ponto representa um par de
valores (x;y). Os valores de X so colocados no eixo
horizontal e Y no vertical.
a= intercepto

b = ngulo ou taxa *
em que y varia em relao a x
* *
*
r2 = frao da variao em y *
*
que pode ser explicada por x *
*
*
*


b = x.y
x2 *

* *
*
a = Ymed (b . Xmed) *
*
*
*
*
* b
r2 = SQ regresso
a
SQ total
A relao entre y e x pode explicar uma poro significativa
da variao total encontrada em torno da mdia geral
dos dados ?
Y
X
X
X
X
mdia X

X
X
X
X

X
A variao total em torno da mdia
Soma dos quadrados total SQT

Y
X
X
X
X
mdia X

X
X
X
X

X
A reta de regresso posicionada de forma a
minimizar os desvios dos dados em relao a reta
= Soma dos quadrados mnimos
Y
X
X
X
X
mdia X

X
X
X
X

X
SQR (Soma dos Quadrados da Regresso)

Y
X
X
X
X
mdia X

X
X
X
X

X
SQR (Soma dos Quadrados da Regresso)

Y
X
X
X
X
mdia X

X
X
X
X

X
E qual o erro?
Y
X
X
X
X
mdia X

X
X
X
X

Quanto maior a disperso dos pontos em torno da reta,


menor o ajuste da regresso!!
REGRESSO: Procedimento

l Formular hipteses nula (H0), e alternativa


(H1)
l Calcular o valor do teste F (testar se b 0)
l Comparar o valor do F com um valor
crtico da tabela
l Se o valor de F for maior que o valor
crtico da tabela rejeita-se hiptese nula
(H0)
FORMULAO DAS HIPTESES

l Ho:
O comprimento da asa do
pssaro no relacionado a sua
idade (b = 0)

l H1:
O comprimento da asa do
pssaro relacionado a sua idade
(b 0)
Procedimento estatstico para teste de hiptese

l Formular hipteses nulas H0, e


alternativas H1
l Calcular b, a, r2 e o valor do teste
estatstico F.
l Comparar o valor do F com um valor
crtico da tabela
l Se o valor do F for maior que o valor
crtico da tabela rejeita-se hiptese nula
(H0)
Efeito do tempo sobre o tamanho da asa de um
pssaro
Idade (dias) Comprimento da asa (cm)

3,0 1,4
4,0 1,5
5,0 2,2
6,0 2,4
8,0 3,1
9,0 3,2
10,0 3,2
11,0 3,9
12,0 4,1
14,0 4,7
15,0 4,5
16,0 5,2
17,0 5,0
O que significam a inclinao e o
coeficiente?
O que significam a inclinao e o
coeficiente?
Para que pode servir a frmula da
regresso
l Previses
qual o tamanho da asa de um
pssaro com 25 dias de idade?
Procedimento estatstico para teste de hiptese

l Formular hipteses nulas H0, e


alternativas H1
l Calcular o valor do teste estatstico
l Comparar o valor do teste estatstico com
um valor crtico da tabela
l Se o valor do teste for maior que o valor
crtico da tabela rejeita-se hiptese nula
(H0)
Procedimento estatstico para teste de hiptese

l Formular hipteses nulas H0, e


alternativas H1
l Calcular o valor do F
l Comparar o valor do F com um valor
crtico da tabela
l Se o valor do F for maior que o valor
crtico da tabela rejeita-se a hiptese nula
(H0)
Clculo
Para o clculo do F utiliza-se como base:
SOMA DOS QUADRADOS (SQ)
SQtotal = y2
SQ regresso = (xy)2
x2
SQtotal = SQ regresso + SQ erro
TABELA DE REGRESSO

Fonte de Variao gl SQ MQ F Prob.

Regresso (R) 1 SQR SQA/1 MQR/MQE

Erro N-2 SQE SQE/(N-2)

N-1 SQT
Total

N= nmero de rplicas ou nmero de pontos em seu grfico


y = Desvio de yi em relao
ao y mdio

x = Desvio de xi em relao a
mdia de todos os xs
6
Comprimento da asa (cm)

5
Y = b.X +a
4
Y = 0.270 X + 0.715

3 R2 = 0.973 (square multiple)


Aceita-se H1, O comprimento da asa
2 do pssaro relacionado
positivamente idade
1
0 5 10 15 20
Idade (dias)
Outro exemplo...
H relao entre a dureza da folha e taxa de
herbivoria?

Area herbivorada
Dureza (cm2)
130 18.00
131 17.00
132 16.00
133 15.00
134 15.00
135 14.50
136 14.30
137 14.00
139 13.50
140 13.00
O Que preciso para montar a
tabela da regresso?
ANOVA
ANOVA
d.f. d.f. SSSS MS
MS F
F p-nvel
p-nvel
Regresso 1. 19.88064 19.88064 75.7228 0.00002
Regresso
Residual ? 8. ? 2.10036 ? 0.26254 ? ?
Total 9. 21.981

Residual ? ? ?

Total ? ?
Como calcular?

SQ TOTAL 21.981
SQtotal = y2
SQ regresso = (xy)2
(a) S(x y)2 1990.0521
(b) S x2 100.1 x2
SQtotal = SQ regresso + SQ
erro
SQ REG (a/b) 19.88
b=-44.61/100.1
b=-0.445
r2 = SQ Reg/SQ tot b = x.y a = Ymed (b . Xmed)
r2 19.88/21.981
x2 a=15-(0.445*134.7)
r2 0.904446584 a= 75.02
Estatstica de regresso

R 0.95102
R- 0.90445
quadrado
R- 0.8925
quadrado
ajustado

S 0.51239
Nmero 10
total de
casos
Area herbivorada (cm2) = 75.0596 - 0.4457 * Dureza

ANOVA
d.f. SS MS F p-nvel
Regresso 1. 19.88064 19.88064 75.7228 0.00002
Residual 8. 2.10036 0.26254
Total 9. 21.981

Coeficiente Erro- LCL UCL Estado p-nvel H0 (5%)


s padro rejeitado?
Intercepto 75.05964 6.90037 59.14737 90.97191 10.87763 0. Sim
Dureza -0.44565 0.05121 -0.56375 -0.32756 -8.70189 0.00002 Sim
Valores crticos de F para teste
de significncia da Regresso

l Qual
a probabilidade limite para se
considerar que um b 0 ocorreu por
acaso?

l EmBiologia usa-se como padro P<0,05


ou 5% de chance das diferenas serem
dadas por acaso
6
Comprimento da asa (cm)

1
0 5 10 15 20
Idade (dias)
Clculo do Coeficiente de Correlao de
Pearson (r)

Interpretando p :
0.70 para mais ou para menos = forte correlao.
0.30 a 0.7 positivo ou negativo = correlao moderada.
0 a 0.30 = Fraca correlao.