Você está na página 1de 29

Regressão linear múltipla e

regressão não linear


REGRESSÃO LINEAR MÚLTIPLA
• Quando mais de uma variável independente pode explicar o
comportamento da variável dependente avaliada.

• O modelo de regressão linear deve considerar todas as variáveis


explicativas

• Podendo ser positivas ou negativas

• X1, x2, x3, x4......xn


• Modelo de regressão linear simples:

• Y = β0 + β1x + €

• Modelo de regressão linear múltipla:

• Y = β0 + β1x + β2x + β3x + ....... βnx + €


• Hipóteses do modelo linear múltiplo  ANOVA

• H0 = β1 = β2 = β3 = βn = 0

• H1 = β1 ≠ β2 ≠ β3 ≠ βn

• Na ANOVA devem ser feitos os testes de significância do modelo de


regressão e de cada variável independente.
• Ao invés do modelo linear simples, a ANOVA no modelo múltiplo não
responde se todas as variáveis independentes conseguem responder
o comportamento da variável dependente  somente se o modelo
de regressão é significativo ou não.

• Complemento  teste t student

• Com este teste faz-se a análise individual de cada variável e


determina-se quais são significativas para constar no modelo linear.
• Ex1: Em uma produção de suínos buscou-se avaliar a importância do
peso vivo (kg) e da espessura da camada de gordura (mm) no peso
final das carcaças abatidas. Para isso, montou-se um experimento
com a medição destes parâmetros em 10 animais escolhidos
aleatoriamente. No momento do abate e limpeza dos animais foi feita
a medição final do peso das carcaças em quilos. Com base nos
resultados da tabela a seguir responda:

• a) As variáveis peso vivo e espessura da camada de gordura


apresentam significância em relação ao peso final das carcaças?
• b) Qual o modelo matemático que melhor relaciona estas variáveis?
X2 = espessura de Y = peso de carcaça
Observações X1 = peso vivo gordura limpa
1 16 2 8
2 19 3 9
3 36 12 11
4 40 16 13
5 54 29 15
6 62 38 17
7 58 33 17
8 82 32 10
9 86 28 11
10 80 33 11
Estatísticas da Regressão
Múltiplo R 0,923998149
R quadrado 0,85377258
R quadrado ajustado 0,811993317
Erro padrão (médio) 1,383289644
Observações 10

ANOVA
Gl SQ QM F Significância F
Regressão 2 78,20556832 39,10278416 20,43531936 0,001195641
Resíduo 7 13,39443168 1,91349024
Total 9 91,6
Coeficientes Erro Padrão t Stat p-valor
Intercepto 11,01163831 1,07333578 10,25926697 1,80678E-05
X1 = Peso vivo -0,160707364 0,037196792 -4,320463066 0,003478215
X2 = Esp. gordura 0,431595761 0,071028792 6,076349486 0,000502678

Y = 11,0116 - 0,1607x1 + 0,4316x2


• Ex2: Em uma produção de batata buscou-se avaliar a influencia da
aplicação de micronutrientes na produtividade das plantas. Para isso
desenvolveu-se um experimento variando-se a aplicação de 3
micronutrientes (B, Mo e Zn) e mediu-se a produtividade ao final da
colheita das plantas em ton/ha.

• Os resultados do experimento encontram-se na tabela a seguir.


Observações B Mo Zn Produtividade
1 0 1 2 22
2 0,2 1,2 2,2 24
3 0,4 1,4 2,4 25
4 0,6 1,6 2,6 26
5 0,8 1,8 2,8 28
6 1 2 3 29
• Com base nestes resultados responda:

• a) Qual o modelo que melhor explica a produtividade da batata em


função da dosagem destes micronutrientes

• b) Todos os micronutrientes tem relação significativa com a


produtividade da batata?
• Note que os resultados estatísticos podem mostrar um cenário
diferente da realidade biológica do sistema analisado.

• Cabe ao avaliador determinar a relevância ou não da presença de


uma variável no modelo de regressão.

• Mesmo não havendo significância estatística para tal.


REGRESSÃO NÃO LINEAR
• Quando a relação observada entre as variáveis de um experimento
não apresenta relação linear de crescimento, decréscimo ou
estabilidade, deve-se adotar um modelo não linear para se tentar
explicar o fenômeno observado.

• A maioria dos casos em estudos agronômicos de campo é explicada


por modelos não lineares.

• Pode-se verificar  a máxima produtividade, a mínima


produtividade, a máxima eficiência econômica, técnica, etc...
• São vários os modelos de regressão não lineares que podem ser
adotados em cada avaliação.

• Os principais  quadrático, cúbico, logarítmico, exponencial

• Em cada modelo, as variáveis independentes apresentarão expoentes


ou acessórios matemáticos para se ajustarem melhor a forma como
os dados observados se comportam.
Modelo linear
18
16
14
12
10
8
6
4
y = 0,1642x + 8,4897
R² = 0,4638
2
0
0 5 10 15 20 25 30 35 40
Modelo Exponencial
18
16
14
12
10
8
6
4 y = 8,6709e0,0138x
2
R² = 0,4983
0
0 5 10 15 20 25 30 35 40
Modelo logarítmico
18
16
14
12
10
8
6
4 y = 2,0355ln(x) + 6,5323
2 R² = 0,4591
0
0 5 10 15 20 25 30 35 40
Modelo polinomial de 3ª ordem
18
16
14
12
10
8
6 y = 0,0009x3 - 0,0525x2 + 0,976x + 6,2911
4 R² = 0,5783
2
0
0 5 10 15 20 25 30 35 40
Modelo polinomial de 6ª ordem
18
16
14
12
10
8
6 y = -5E-07x6 + 7E-05x5 - 0,0032x4 + 0,0691x3 - 0,7173x2 +
4 3,5015x + 3,3467
2 R² = 0,607
0
0 5 10 15 20 25 30 35 40
• Quanto mais irregulares forem as distribuições dos resultados das
variáveis  maiores serão os graus que o meu modelo de regressão
terá que possuir.

• Na prática  usa-se modelo polinomial até 3ª ordem  não


apresenta significância estatística além dessa ordem

• Além disso dificulta os cálculos para predição dos valores de Y.


• Exemplo

• Em um experimento foi verificada a influência de 7 doses de Ca na


produtividade de milho (sc/ha). Na tabela a seguir estão os resultados
do experimento.
Tratamentos Doses R1 R2 R3 R4
T1 0 205 212 208 211
T2 5 345 334 346 341
T3 10 265 279 264 277
T4 15 275 290 284 278
T5 20 246 256 243 251
T6 25 257 256 278 256
T7 30 287 281 278 269
• Pergunta-se:

• a) há diferença significativa entre os tratamentos?

• b) Qual o melhor modelo que prevê o comportamento dos valores


médios de cada tratamento?
• Quando determinamos os modelos que representam o
comportamento das variáveis dependentes, podemos utilizá-los para
determinar os possíveis resultados que a combinação de todas as
variáveis pode ter.
• Ex: Através da equação do modelo não linear da relação entre doses
de cama de frango ( ton/ha) e a produtividade do trigo ( kg/ha)
determine a produtividade esperada do trigo para as doses de cama
de frango de 5 e 7 ton/ha.

Y = 4855,68 + 23,84X - 0,70X2


• Exercício: Foi realizado um experimento onde se avaliou o numero de
sementes de milho por metro linear e a produtividade esperada da cultura.
A equação que representa o modelo de avaliação da produtividade é:

Y = 81,8181 + 9,87x – 0,57x2

a) Calcule a produtividade esperada de milho se forem adotadas 12


sementes por metro linear?
b) Se forem adotadas 14 sementes por m/linear a produtividade será maior
ou menor de acordo com o modelo?
Máxima eficiência esperada
• Podemos usar as equações não lineares para determinar o valor de
máxima eficiência de um insumo  a dose que apresenta a máxima
produção dentro do intervalo de doses avaliado no experimento.

• Para isso faz-se a derivada da equação não linear do modelo

• Qual a quantidade de cama de frango que deve ser aplicada na área


para obtenção da máxima produtividade do trigo de acordo com a
equação obtida no modelo?
• Y = 4855,68 + 23,84X - 0,70X2  modelo não linear

• D(x) = 0 + 1*23,84x1-1 – 2*0,70x2-1

• D(x) = 0 + 23,84 – 1,4x

• X = 23,84/1,4

• X = 17,02 ton/ha
• Exercício:

• Calcule a quantidade de sementes por metro linear que garantiria a


máxima produtividade do milho de acordo com o modelo a seguir

Y = 81,8181 + 9,87x – 0,57x2

Você também pode gostar