Você está na página 1de 51

UNIVERSIDADE FEDERAL DE CATALÃO

FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Análise de Regressão
Regressão
Regressão pode ser entendido como uma fórmula matemática que explica (faz sentindo físico) para os dados

Um fator qualitativo é aquele onde os seus níveis diferem


por algum atributo qualitativo. Como exemplos têm-se
variedades, tipos de defensivos, métodos de conduzir uma
determinada tarefa....

Por outro lado, um fator quantitativo é aquele onde os


níveis se diferem com relação a quantidade do fator. Como
exemplos têm-se temperatura, umidade, concentração de
um princípio ativo, níveis de insumo, pH....
Regressão

fator QUALITATIVO

proceder à análise de variância dos dados e às


comparações entre médias dos níveis do fator usando
algum dos procedimentos para comparações múltiplas,
quando o F for significativo

fator QUANTITATIVO

deve-se estudar o efeito do fator quantitativo por meio de


uma relação funcional entre o mesmo e a variável
resposta. A técnica indicada neste caso é a análise de
regressão
Regressão

A análise de regressão consiste na realização de uma


análise estatística com o objetivo de verificar se a relação
funcional estabelecida entre um fator quantitativo e uma
variável resposta é significativa.

Obter uma equação que tenta explicar a variação


significativa de uma variável resposta em função da
variação dos níveis de um ou mais fatores quantitativos
Escolha do modelo

Inicialmente pode-se plotar um diagrama de dispersão


para verificar como se comportam os valores da variável
resposta (Y) em função da variação dos níveis do fator
quantitativo (X).
equação linear

equação quadratica

equação logística
Escolha do modelo

Na maioria dos casos, haverá uma


distância entre os pontos e a curva
do modelo proposto.

O fenômeno que está em estudo,


não é um fenômeno matemático e
sim um fenômeno que está sujeito
à inúmeros fatores.

O objetivo da regressão é obter um


modelo matemático que melhor se
ajuste aos valores observados de
Y em função da variação dos
A distância entre o ponto é a reta pode ser denominada erro
níveis da variável X.
Escolha do modelo

O modelo matemático que irá ser ajustado deve satisfazer


as seguintes condições:

- Modelo selecionado deve ser coerente para representar


em termos práticos, o fenômeno em estudo;

- Modelo deve conter apenas as variáveis que são


relevantes para explicar o fenômeno.
Estimação da equação

Método dos Mínimos Quadrados (MMQ)

obter uma equação de forma que as distâncias entre os


pontos observados e a curva do modelo matemático, no
todo, sejam as menores possíveis
UNIVERSIDADE FEDERAL DE CATALÃO
FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Modelo linear de 1º grau


Modelo linear de 1º grau

B0 - intercepto
B1 - coeficiente angular
ei - erro
Modelo linear de 1º grau

Para se obter a equação estimada, vamos utilizar o MMQ,


visando a minimização dos erros. Assim, tem-se que:

-B0-B1x1 é o Y estimado

Elevando o erro (ei) ao quadrado e aplicando o somatório:


Modelo linear de 1º grau
Para se encontrar o mínimo de uma equação deve-se derivar a
equação em relação à variável de interesse, e igualar a
derivada resultante ao valor zero.
Modelo linear de 1º grau
Para se encontrar o mínimo de uma equação deve-se derivar a
equação em relação à variável de interesse, e igualar a
derivada resultante ao valor zero.
Modelo linear de 1º grau
O sistema de equações normais resultante, que permite a
obtenção de estimativas de β0 e β1, que minimizam a soma de
quadrados dos erros.

Após estimar β0 e β1, podemos escrever a equação estimada:


UNIVERSIDADE FEDERAL DE CATALÃO
FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Modelo linear de 2º grau


Modelo linear de 2º grau

Utilizando o MMQ, no modelo de 2º grau, temos o seguinte


sistema de equações normais, para se obter as estimativas
de β0, β1 e β2:

Após estimar β0, β1 e β2 podemos escrever a equação


estimada:
UNIVERSIDADE FEDERAL DE CATALÃO
FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Análise de variância da
regressão
Análise de variância da regressão

A equação obtida, apenas estabelece uma relação


funcional, entre a variável dependente e a variável
independente, para representar o fenômeno em estudo.

Contudo, não responde ao pesquisador se a variação da


variável independente influencia significativamente na
variação da variável dependente.

Para se responder a esta pergunta, é necessário realizar um


teste estatístico – fazendo dessa forma a análise de
variância.
Análise de variância da regressão (sem repetição de X)

B0,B1,B2....B2333

Numero de dados, pontinhos

a regressão tende a média


Análise de variância da regressão

COEFICIENTE DE DETERMINAÇÃO

Estima a proporção da variabilidade da variável dependente


(Y) que é explicada pelo conjunto das k variáveis
independentes do modelo de regressão (X).
Análise de variância da regressão

COEFICIENTE DE DETERMINAÇÃO AJUSTADO

R²adj = 1 – QMRes/QMTot
k = gl da regressão

O R2 ajustado (R2 ou R²adjust) pondera o coeficiente de


determinação (R2) pelo número de variáveis explicativas e pelo
número de observações da amostra.
UNIVERSIDADE FEDERAL DE CATALÃO
FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Análise de variância da
Regressão
Sem repetição em X
Análise de variância da regressão

Considerando os pares de valores (X,Y) dados abaixo, obter


a equação da regressão e a análise de variância, adotando
 = 5%.

X Y
0 34,2
1,5 28,1
3 16,3
4,5 8,1
6 4,2
Análise de variância de regressão – 1ª ordem

### limpando
rm(list = ls())

### dados
y<-c(34.2,28.1,16.3,8.1,4.2)
x<-c(0,1.5,3,4.5,6)
dados<-data.frame(x,y)

### Plotar dispersão simples


plot(x,y)

### Plotar dispersão com eixos, título e outras informações


plot(x=x, y=y, xlab = 'X',ylab = 'Y', pch = 19, main = 'Gráfico de
Dispersão')
Análise de variância de regressão – 1ª ordem

Gráfico de Dispersão

35
30
25
20
Y

15
10
5

0 1 2 3 4 5 6

X
Análise de variância de regressão – 1ª ordem

### definir modelo linear, solicitar anova e verificar coeficientes


mod<-lm(y~x)
anova(mod)
summary(mod)
Análise de variância da regressão – 1ª ordem

Significativa
Recusa H0
ANOVA H0: Bi = 0
Ha: Bi  0

Modelo – y função de x

Resíduos erros, distância dos pontos a


reta

B0 - intercepto
Coeficientes
B1 - X
y=34,18-5,33x

Coeficiente de determinação
Coef. de Det. Ajustado
A diferença entre o R² e R ajustado a diferença pode ser no máximo de 10%. R ajust para o R predito a diferença de no máximo de 10% e entre o
R² e R pred. no maximo de 20%
Verificação dos pressupostos

### homocedasticidade
library(lmtest)
bptest(y~x)

### homogeneidade
shapiro.test(mod$residuals)
Verificação dos pressupostos

homocedasticidade

> 0,05 ok

homogeneidade

> 0,05 ok
UNIVERSIDADE FEDERAL DE CATALÃO
FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Análise de variância da
Regressão
COM repetição em X
ANOVA da regressão – valores de X repetem

FV GL SQ QM F
Regressão p-1 SQreg QMreg QMreg/QMres
Resíduo n-p SQres QMres
Falta de Ajuste k-p SQfa QMfa QMfa/QMep
Erro Puro n-k SQep QMep
Total n-1 SQtot

k = número de elementos X diferentes


ANOVA da regressão – valores de X repetem

O SQRes pode ser agrupado pelos valores repetidos de X

Modelo falha em descrever


adequadamente a relação variação aleatória que pode
funcional entre os fatores causar diferenças entre os
experimentais e a variável de valores de resposta
resposta observados
Análise de variância da regressão
Um experimento foi realizado com 8 diferentes concentrações de
desinfetantes para investigar o efeito dos desinfetantes segundo a
concentração da solução.
Y : número de bactérias sobreviventes após limpeza
X : concentração do desinfetante (de 1% a 8%)
Análise de variância de regressão – 1ª ordem

### limpando
rm(list = ls())

### dados
y<-c(29,31,26,25,21,24,26,28,21,22,14,24,23,15,18,13)
x<-c(1,1,2,2,3,3,3,3,4,4,5,5,6,6,7,8)
dados<-data.frame(x,y)

### Plotar dispersão


plot(x=x, y=y, xlab = 'Concentração de desinfetante - %',ylab = 'Bactérias
sobreviventes - unidade', pch = 19, main = 'Gráfico de Dispersão')
Análise de variância de regressão – 1ª ordem

Gráfico de Dispersão

30
Bactérias sobreviventes - unidade

25
20
15

1 2 3 4 5 6 7 8

Concentração de desinfetante - %
Análise de variância de regressão – 1ª ordem

### definir modelo linear, solicitar anova e verificar coeficientes


mod<-lm(y~x)
anova(mod)
summary(mod)
Análise de variância da regressão – 1ª ordem

Significativa
ANOVA Recusa H0
H0: Bi = 0
Ha: Bi  0

Modelo – y função de x

Resíduos

B0 - intercepto
Coeficientes
B1 - X

Coeficiente de determinação
Coef. de Det. Ajustado
ANOVA considerando repetições em X
ANOVA considerando repetições em X

### modelo e anova considerando repetições em X


mod.fa<-lm(y~factor(x))
anova(mod, mod.fa)
ANOVA considerando repetições em X

ANOVA modelo 1 - simples


ANOVA modelo 2 – rep X

ANOVA modelo 2 Falta de ajuste NÃO Significativa


ANOVA modelo 1
Falta de Ajuste Aceita-se H0
Resíduo da regressão
H0: modelo é adequado
Ha: modelo não é adequado

ANOVA modelo 2 – Erro puro


ANOVA considerando repetições em X

FV GL SQ QM F p
Regressão 1 295,4 295,396 32,157 5,77e-05*
Resíduo 14 128,6 9,186
Falta de Ajuste 6 16,85 2,808 0,2011 0,9669n.s.
Erro Puro 8 111,75 13,969
Total 15 424 28,267
R² = 0,697 R²adj = 0,675
Verificação dos pressupostos

### homocedasticidade
library(lmtest)
bptest(y~x)

### homogeneidade
shapiro.test(mod$residuals)
Verificação dos pressupostos

homocedasticidade

> 0,05 ok

homogeneidade

> 0,05 ok
UNIVERSIDADE FEDERAL DE CATALÃO
FACULDADE DE ENGENHARIA

Estatística aplicada à experimentos

Análise de variância da
Regressão

Polinomial
Análise de variância da regressão - polinomial

Considerando os pares de valores (X,Y) dados abaixo, obter


a equação da regressão e a análise de variância, adotando
 = 5%.

X Y
1 5
2 8
3 9,5
4 10
5 9
Análise de variância da regressão - polinomial

### limpando
rm(list = ls())

### dados
y<-c(5,8,9.5,10,9)
x1<-c(1,2,3,4,5) ### x
x2<-c(x1^2) ### x^2
m<-cbind(x1,x2) ### matriz
dados<-data.frame(m,y)

### Plotar dispersão


plot(x1,y)
Análise de variância da regressão - polinomial
Análise de variância da regressão - polinomial

### definir modelo polinomial, solicitar anova e verificar coeficientes


mod<-lm(y~m)
anova(mod)
summary(mod)
Análise de variância da regressão - polinomial

Significativa
Recusa H0
ANOVA H0: Bi = 0
Ha: Bi  0

Modelo – y função de x

Resíduos

B0 - intercepto
Coeficientes B1 - X
B2 - X²

Coeficiente de determinação
Coef. de Det. Ajustado
Verificação dos pressupostos

### homocedasticidade
library(lmtest)
bptest(y~m)

### homogeneidade
shapiro.test(mod$residuals)
Verificação dos pressupostos

homocedasticidade

> 0,05 ok

homogeneidade

> 0,05 ok

Você também pode gostar