Você está na página 1de 28

Universidade Federal do Piauí – Campus

Professora Cinobelina Elvas

ANÁLISE DE REGRESSÃO POR POLINÔMIOS


ORTOGONAIS

Ana Karolina de Oliveira Sá Acevedo

Bom Jesus – PI
2019
➢ ANÁLISE DE REGRESSÃO
• CONCEITOS
• Metodologia estatística que estuda (modela) a relação entre duas ou mais
variáveis;
• É a análise que determina uma função que exprima o relacionamento das variáveis
dependentes e independentes.

Variáveis Quantitativas x Qualitativas

Quando o fator é qualitativo, deve se proceder à análise de variância dos dados e às


comparações entre médias dos níveis do fator usando algum dos procedimentos para
comparações múltiplas, quando o F for significativo
➢ ANÁLISE DE REGRESSÃO
• Como estudar fatores com níveis quantitativos?
FATORES QUALITATIVOS FATORES QUANTITATIVOS
Cultivares de milho (A, B, C e D) Idade de corte de Gramíneas (30,
60 e 90 dias)
Rações (Comum e Premium) Níveis de Estradiol na Ração (0,
20, 40, 60 e 80 mg)
Raças (R1, R2, ...) Temperatura (17°, 22° e 25°C)
Sexo (Macho e Fêmea) Níveis de energia (2800, 3000,
3200, 3400 Kcal/kg)
Irrigação (Presença e Ausência) Doses de Adubo (10, 20, 30, 40 e
50 kg/ha)
Adubação (Química, Orgânica e Testemunha) Porcentagem de proteína (16, 18,
20, 22%)
TCM Regressão
➢ ANÁLISE DE REGRESSÃO
▪ Para que serve saber a relação entre duas variáveis?
❖Para fazer ESTIMATIVAS sobre o comportamento futuro de um fenômeno
atual
Extrapola-se para o futuro o comportamento presente das variáveis:
• Prever a população de uma cidade no futuro;
• Prever a natalidade infantil no ano de 2050;
• Prever a demanda futura por habitação.
▪ Para SIMULAR os efeitos de uma variável X sobre um Y
Avalia-se as relações de causa-efeito entre duas variáveis:
• Simular os efeitos sobre a produtividade (Y) em função de uma dose de
determinado nutriente (X).
➢ ANÁLISE DE REGRESSÃO
❖ Escolha do modelo para equacionar o fenômeno
• O comportamento de Y em relação a X, pode se apresentar de diversas maneiras;
• Deve-se verificar qual modelo mais se aproxima dos pontos plotados no diagrama
de dispersão.

Linear
Simples
Não-linear
Modelo de
regressão
Linear
Múltiplo
Não-linear
➢ ANÁLISE DE REGRESSÃO
❖ Escolha do modelo para equacionar o fenômeno

• O modelo que irá se ajustar deve satisfazer as seguintes condições:

• O modelo selecionado deve ser coerente para representar em termos práticos o


fenômeno em estudo;

• O modelo deve conter apenas as variáveis que são relevantes para explicar o
fenômeno.
➢ ANÁLISE DE REGRESSÃO
• ESTIMATIVA DOS PARÂMETROS DE REGRESSÃO

• Existem alguns métodos para ajustar uma linha entre as variáveis X e Y o mais
utilizado é o denominado método dos mínimos quadrados (MMQ).

• Os valores de “𝛽0 ” e “𝛽1 ” são obtidos através das seguintes expressões:


➢ ANÁLISE DE REGRESSÃO
• Ajuste de modelos de regressão para fatores quantitativos

• 𝑦 = 𝛽0 + 𝛽1 𝑥 Modelo linear (1º grau): reta


• 𝑦 = 𝛽0 + 𝐵1 𝑥 + 𝛽2 𝑥 2 Modelo quadrático (2º grau): parábola
• 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑥 2 + 𝛽3 𝑥 3 Modelo cúbico (3° grau)

𝛽0 = 𝑦ത − 𝛽1 ∗ 𝑥ҧ

(σ 𝑥 ∗ σ 𝑦)
σ 𝑥𝑦 −
𝛽1 = 𝑛
2
( σ 𝑥)
σ 𝑥2 −
𝑛
• Exemplo: Para verificar se existe relação linear de primeiro grau entre doses de
calcário e produtividade de milho, um pesquisador realizou um experimento com
5 valores diferentes para as doses de calcário, obtendo-se os seguintes dados
(dados hipotéticos).
X = Doses de calcário (t ha-1)
Y = Produtividade de milho (t ha-1)

X Y X² Y² XY
1 3 1 9 3
2 3 4 9 6
4 7 16 49 28
5 6 25 36 30
8 12 64 144 96
Somatório 20 31 110 247 163
Σ𝑋 = 20 Σ𝑌 = 31 Σ𝑋² = 110 Σ𝑌 2 = 247 Σ𝑋𝑌= 163
O método descrito é aceitável para o caso de regressão linear, mas não convém
para casos mais complicados, quando é preferível o método dos polinômios
ortogonais.

Segundo Storck e Lopes (1998), o método dos polinômios ortogonais tem como
objetivo determinar um modelo matemático que explique o comportamento dos
tratamentos, ou seja, se X é a variável independente (variável correspondente aos
tratamentos) e Y é a variável dependente (variável da resposta ao efeito dos
tratamentos), então é possível representar as duas variáveis num modelo polinomial.
EXEMPLO

• Efeito de doses de gesso na cultura do feijoeiro (Phaseolus vulgaris L.);

• Delineamento Inteiramente Casualizado (DIC);

• 4 repetições;

• 7 doses de gesso (Tratamentos) – 0, 50, 100, 150, 200, 250, 300 kg/ha;

• Característica peso de 100 sementes (g).


CROQUI

0 50 200 250 0 50 150


50 300 100 300 300 150 100
100 250 300 50 250 250 200
150 200 0 0 200 150 100
DADOS
Exemplo.

TRATAMENTOS REPETIÇÕES TOTAIS


(Kg/ha)
1 2 3 4
1–0 33,70 34,93 36,90 33,08 138,61
2 – 50 40,43 39,43 37,58 36,18 153,62
3 – 100 40,18 43,18 40,85 40,33 164,54
4 – 150 42,45 42,05 40,18 40,25 164,93
5 – 200 41,43 40,00 39,55 37,75 158,73
6 – 250 42,95 39,33 37,60 40,10 159,98
7 – 300 38,63 40,10 37,20 38,50 154,43
1.094,84
Resumo da Anova preliminar
FV GL SQ QM F (calculado)
Tratamentos 6 121,3378 20,2230 7,66∗∗
Resíduo 21 55,3864 2,6374
Total 27 176,7242

6 x 21 G.L. 5% = 2,57 1%= 3,81

Podemos, porém, isolar cada um dos graus de liberdade para tratamentos a fim de
avaliar separadamente os efeitos de 1° grau ou linear , de 2° grau ou quadrática, de 3°
grau ou cúbico. Isto se torna fácil quando as quantidades que determinam os
tratamentos são igualmente espaçadas, o que acontece no caso presente, em que as
doses de gesso são 0, 50, 100, 150, 200, 250, 300 Kg/ha. Neste caso, temos 7 níveis de
doses de gesso e os coeficientes a serem usados para os componentes estão descritos
nas tabelas seguintes.
Sub divisão dos graus de liberdade dos
tratamentos
Causa da variação G.L. Causa da variação G.L.
Regressão de linear (ou de 1º grau) 1 Regressão de linear (ou de 1º grau) 1
Regressão quadrática (ou de 2º grau) 1 Regressão quadrática (ou de 2º grau) 1
Regressão cúbica (ou de 3º grau) 1 Regressão cúbica (ou de 3º grau) 1
Regressão de 4º grau 1 Desvio de regressão 3
Regressão de 5º grau 1 (Tratamentos) (6)
Regressão de 6º grau 1
(Tratamentos) (6)
Polinômios ortagonais
N = 7 níveis
1º grau 2º grau 3º grau
-3 +5 -1
-2 0 +1
-1 -3 +1
0 -4 0
+1 -3 -1
+2 0 -1
+3 +5 +1
K 28 84 6
M 1 1 1/6
• CONTRASTES E SOMAS DE QUADRADO;
• ANOVA DA REGRESSÃO

FV GL SQ QM F (calculado)
Regressão L. 1 26,39 26,39 10,0∗∗
Regressão Q. 1 80,37 80,37 30,44∗∗
Regressão C. 1 9,72 9,72 3,68𝑛𝑠
Desvio de R. 3 4,86 1,62 0,61𝑛𝑠
Tratamentos 6 121,3378 20,2230 7,66∗∗
Resíduo 21 55,3864 2,6374
Total 27 176,7242

Valores e F tabelado = 1 x 21 G.L. 5% = 4,32 1% = 8,02


3 x 21 G.L. 5% = 3,07 1% = 4,87
• DETERMINAÇÃO DA EQUAÇÃO:
• Verificamos que a regressão linear e quadrática foram significativas (P<0,01),
indicando que é possível estabelecer uma relação funcional entre a dose de gesso
colocada (X) e o peso de 100 sementes de feijoeiro (Y).
• Vejamos a determinação da equação de regressão, para o exemplo que estamos
estudando.
• COEFICIENTE DE DETERMINAÇÃO:
• Representa, em proporção, quanto da variação na resposta é explicada pela
regressão em questão.
OBTENÇÃO DO GRÁFICO
• Podemos fazer uma verificação do ajuste da equação de regressão calculando os
෠ por meio da equação, e os valores observados (𝑌𝑜𝑏𝑠 ) pelas
valores esperados (𝑌),
médias dos tratamentos. ti

Tratamentos (𝑌𝑜𝑏𝑠 ) ෠
(𝑌)
0 34,65 35,18
50 38,41 38,12
100 41,14 40,08
150 41,23 41,06
200 39,68 41,06
250 40,00 40,08
300 38,61 38,12
Σ 273,72 273,70
REPRESENTAÇÃO GRÁFICA
Título do Gráfico
42
41
40
39
38 Y = 35,18 + 0,0686x +0,000196x²
37 R² = 0,88

36
35
34
0 50 100 150 200 250
Observada Estimada Polinomial (Observada)
Exemplo 2. Em um experimento de produção com soja, instalado em blocos
casualizados, se ensaiou a aplicação de doses de NPK.

Blocos Doses de NPK (kg/ha) TOTAIS


0 25 50 75 100
Produtividade de grãos (kg/parcela)
I 7,5 7,7 8,1 9,2 8,3 40,8
II 7,8 7,3 8,2 9,1 8,2 40,6
III 7,9 7,6 7,9 9,2 8,6 41,2
IV 7,7 7,9 8,8 9,3 8,6 42,3
Total 30,9 30,5 33 36,8 33,7 164,9
Polinômios ortagonais

N = 5 níveis
1º grau 2º grau 3º grau
-2 +2 -1
-1 -1 +2
0 -2 0
+1 -1 -2
+2 +2 +1
K 10 14 10
M 1 1 5/6
OBRIGADA