Você está na página 1de 30

Aula – Análise de regressão

(regressão linear)
• Até agora todas as nossas avaliações foram com relação a determinar
qual o melhor ou pior fator que um determinado experimento
apresentou.

• Mas quando eu quero saber qual a melhor dose de aplicação de um


produto?

• Até que dose de um nutriente eu tenho ganho de produtividade de


uma planta?
• Dois tipos de variável a serem avaliadas

• Qualitativas x Quantitativas

• Qualitativas  Variedades de uma planta, raça, tipos de herbicidas,


tipos de fertilizantes, etc...

• Quantitativas  doses de fertilizantes, quantidades de ração, doses


de herbicida, etc...
• Classificação de variáveis estudadas

• Dependente  variável experimental que depende dos valores da(s)


outra(s) variáveis para se alterar

• Independente  variável que interfere diretamente nos valores da(s)


outra(s) variáveis mas não depende destas para variar os resultados
• Ex: Foi realizado um experimento para avaliar a perda de peso em
quilos de cavalos de corrida submetidos a diferentes doses de um
medicamento. Foram aplicadas as doses de 20, 25, 30, 35, 40, 45 e 50
mg do medicamento e medido a perda de pesa do animal em quilos.
PERDA DE
DOSES PESO
20 1
25 2,2
30 3,5
35 5
40 6,4
45 7
50 7,2
• Para que serve uma análise de regressão?

• Para criar um modelo matemático que consiga demonstrar o mais


próximo possível a relação entre duas variáveis.

• Para permitir a previsão dos valores da variável dependente para cada


variação da variável independente  modelo de previsão de valores.

• Ex: a variação da produtividade de soja em função da variação da


aplicação de diferentes micronutrientes.
• Outra possibilidade é determinar o quanto acarreta de variação na
variável dependente o aumento ou a redução de uma unidade na
variável independente.

• Ex: Quanto ficaria a produtividade de soja se eu diminuísse em 10% a


aplicação de nitrogênio em uma determinada área.

• Estudos técnicos x estudos técnicos e econômicos.


• O que é a regressão linear?
• É um modelo matemático que representa a relação entre variáveis e
que pode ser representado como uma reta.
Modelo de regressão linear
• Existem basicamente 2 tipos de regressão linear:

• Simples  quando somente uma variável independente influencia no


valor da outra variável

• Múltipla  quando mais de uma variável é avaliada e possui


influencia no resultado da variável dependente
• Modelo de regressão linear simples.

• Baseada na equação da reta do primeiro grau  Y = ax + b

• Modelo de estudo  Y = β0 + β1x + €

• β0  menor valor de intercepto do eixo y


• Β1  coeficiente da variação Y em função da variação de 1 unidade de X
• €  erro experimental do modelo
• Ex: Avaliação do rendimento de carcaça e peso corporal para o abate
de cordeiros da raça Hampshire Down aos 4 meses de idade.

Peso (kg) Rendimento Carcaça (kg)


49 24
65 40
45 25
40 23,5
55 33,5
45 22
44 22,5
47 23,5
50 25
56 35
• Pede-se:

• a) Construa o gráfico de pontos da relação entre o peso e o rendimento de


carcaça dos animais

• b) Determine a equação de regressão que melhor representa a relação


entre as variáveis

• c) Determine a significância do modelo de regressão linear e se a variável


peso pode explicar a variação da variável rendimento de carcaça
rendimento de carcaça x peso
50
40
30
20
10
0
40 45 50 55 60 65
rendimento de carcaça x peso
45
40
35
30
25
y = 0,8068x - 12,619
20 R² = 0,8677
15
10
5
0
40 45 50 55 60 65
• Equação de regressão linear:

• Y = -12,61 + 0,81x

• Com R = 0,87 ou 87% de precisão.

• Os valores de construção da equação são obtidos nos coeficientes do


teste t realizado no excel.
ANOVA
Significance
df SS MS F F
Regression 1 312,7263947 312,7263947 52,47790974 8,85549E-05
Residual 8 47,67360533 5,959200666
Total 9 360,4

Coefficients Standard Error t Stat P-value


Intercept -12,61865112 5,577936775 -2,262243484 0,053534597
Peso (kg) 0,806827644 0,111376228 7,24416384 8,85549E-05
Resultados que indicam que a regressão
linear é indicada para este modelo
• Anova:
• F >= ao F tabelado e F significância for <= 0,05:
• Eu rejeito a hipótese de que o modelo não consegue explicar a
relação entre as variáveis.

• Teste t student:
• Se p valor <= 0,05
• Eu aceito a hipótese de que a variável independente consegue
explicar as variações da variável dependente.
• Coeficiente de Determinação ou R2

• Indica o nível de capacidade de determinação do modelo de


regressão calculado em prever o valor da variável dependente.

• R2 = SQresíduo / SQ total

• Alguns autores aceitam modelos acima de 80% como bons modelos


de previsão.
Regression Statistics
Multiple R 0,931515054
R Square 0,867720296
Adjusted R Square 0,851185333
Standard Error 2,441147408
Observations 10
Exercício 1
• Determinar o modelo de regressão que mais se explica a variação da
perda de peso de perda de peso em quilos de cavalos de corrida
submetidos a diferentes doses de um medicamento.
• Limites do modelo de regressão linear:

• Somente é aplicado quando a variação entre os valores da variável


dependente ou independente é constantemente positiva ou negativa
ou se o valor de Y permanece estável.

• Se a dispersão entre os resultados da avaliações for muito grande, o


modelo irá gerar muito resíduo e perderá a capacidade de predição.
Regressão linear em experimentos com
repetições
• Como determinar a regressão linear em um experimento com várias
repetições?

• O primeiro passo é realizar a ANOVA para determinar se as médias dos


tratamentos são diferentes.

• Segundo passo é realizar o modelo de regressão em função das médias das


repetições dos tratamentos.

• Terceiro passo avaliar os coeficientes da análise de regressão e determinar


se o modelo é eficiente ou não.
• Ex: Em um experimento buscou-se avaliar o resultado da aplicação de boro
foliar em pés de alface e a sua relação com o diâmetro das cabeças de
alface americana formadas. Foram feitas 3 repetições para cada dosagens e
testadas as dosagens de 0, 0,5, 1, 1,5 e 2 mg de boro e foram medidos os
diâmetros das cabeças uma semana após a aplicação. Os resultados do
experimento estão na tabela a seguir.

• Com base nestes resultados pergunta-se:


• a) Há diferença significativa entre os tratamentos
• b) Qual o modelo de regressão que melhor explica a variação do diâmetro
das cabeças de alface e a aplicação de boro foliar.
Tratamentos R1 R2 R3 R4 Média
0 5 6 5 7 5,75
0,5 8 10 10 11 9,75
1,0 10 12 12 11 11,25
1,5 11 13 12 12 12
2,0 14 13 13 12 13
Exercício 2
• Imagine que foi instalado um experimento para avaliar a influência do
Tiametoxam® no desenvolvimento das sementes de soja. Para isso, foi
realizado um estudo no laboratório de sementes com cinco doses
diferentes, mais a testemunha, totalizando seis tratamentos com
quatro repetições.

• Neste experimento foi avaliado o comprimento da raiz submetida a


diferentes doses do Tiametoxam.
tratamentos rep1 rep2 rep3 rep4 total medias
testemunha 5,79 3,18 3,9 5,26 18,13 4,53
2 ml 6,88 6,44 7 6,78 27,1 6,78
4 ml 8,05 6,44 5,29 9,49 29,27 7,32
6 ml 6,54 7,74 6,2 6,57 27,05 6,76
8 ml 9,79 8,9 10,05 11,72 40,46 10,12
10 ml 11,52 8,03 9,86 8,71 38,12 9,53
• a) Há diferença significativa entre os tratamentos?

• b) Monte o gráfico de dispersão dos tratamentos

• c) determine o modelo de regressão linear e se há significância no


modelo adotado

• d) analise os valores do teste F e do R2 para determinar a eficiência do


modelo de regressão.
RESULTADO DA ANÁLISE
ANTERIOR
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 83,47137 5 16,69427 11,0628 5,5E-05 2,772853
Dentro dos grupos 27,16283 18 1,509046

Total 110,6342 23
médias tratamentos valor DMS
m1 8ml 10,12 2,76
m2 10ml 9,53
m3 4ml 7,32
m4 2ml 6,78
m5 6ml 6,76
m6 test 4,53

m1 m2 m3 m4 m5 m6
m1 x 0,59 2,8 3,34 3,36 5,59
m2 x x 2,21 2,75 2,77 5
m3 x x x 0,54 0,56 2,79
m4 x x x x 0,02 2,25
m5 x x x x x 2,23
m6 x x x x x x

Você também pode gostar