Você está na página 1de 3

getwd()

dados<-read.table("Bancodedados.txt",h=T)
dados
attach(dados)
area
riqueza
modelo<-lm(riqueza~area)
modelo #HÁ REGRESSÃO
anova(modelo)
plot(area,riqueza,xlab="Area",ylab="Riqueza",main="AreaxRiqueza")
abline(modelo,col="Red")

#(a)-- Normalidade -- (SERVE PARA TESTAR SE É CONFIAVEL OU NÃO)


res<-residuals(modelo)
res
shapiro.test(res)
#CONCLUSÃO: como o p-value < 0,05 (nível de significancia adotado), rejeita a Ho,
ou seja,
# os resíduos não têm distribuição normal

#(b)--Homocedasticidade da variancia--(PRECISA DE REPETIÇÕES )


#Ho:as variancias são iguais( Sigma(i) = Sigma(j))
#Ha:pelo menos uma das variancias difere das demais
bartlett.test(area,riqueza)
#CONCLUSÃO:Deve haver ao menos duas observações em cada grupo.

#(C)--Independencia dos erros--


#Ho:os residuos sao independentes
#Ha:os residuos não são independentes
acf(res)
#CONCLUSÃO:os lags NÃO estão dentro da faixa apontada pelo grafico ao nivel de
significancia de 5%
#concluimos que os erros NÃO são independentes, ou seja, estão auto-corelacionados.
#----------------------------------------------------------------------------------
---------------------------------

library(MASS)
#Y^lambda se lambda=/=0
#Log(Y=dados) se lambda=0

boxcox(riqueza~area)#indica qual a melhor transformação pra resolver o problema de


nao normalidade ou não homocedasticidade
#Encontra lambda que maxima o y

lambda<-boxcox(riqueza~area)
lambda
#Encontrar maior $y e encontrar $x na mesma posição
lambda$x[which.max(lambda$y)]#Encontrar $x(mais rapido)
riquezaT<-riqueza^0.26 #Tranforma o dados
riquezaT
modeloT<-lm(riquezaT~area)
modeloT

#(a)-- Normalidade -- (SERVE PARA TESTAR SE É CONFIAVEL OU NÃO)


resT<-residuals(modeloT)
resT
shapiro.test(resT)
#CONCLUSÃO: como o p-value > 0,05 (nível de significancia adotado), NÃO rejeita a
Ho, ou seja,
# os resíduos têm distribuição normal

#(b)--Homocedasticidade da variancia--(PRECISA DE REPETIÇÕES )


#Ho:as variancias são iguais( Sigma(i) = Sigma(j))
#Ha:pelo menos uma das variancias difere das demais
bartlett.test(area,riquezaT)
#CONCLUSÃO:Deve haver ao menos duas observações em cada grupo.

#(C)--Independencia dos erros--


#Ho:os residuos sao independentes
#Ha:os residuos não são independentes
acf(resT)
#CONCLUSÃO:os lags NÃO estão dentro da faixa apontada pelo grafico ao nivel de
significancia de 5%
#concluimos que os erros NÃO são independentes, ou seja, estão auto-corelacionados.

summary(modeloT)

plot(area,riquezaT)
abline(modeloT)
#----------------------------------------------------------------------------------
-------------------------------

riquezaL<-log(riqueza)
areaL<-log(area)
plot(areaL,riquezaL)

modeloL<-lm(riquezaL~areaL)
modeloL
plot(areaL,riquezaL,xlab="Area",ylab="Riqueza",main="AreaxRiqueza")
abline(modelo,col="Red")

#(a)-- Normalidade -- (SERVE PARA TESTAR SE É CONFIAVEL OU NÃO)


resL<-residuals(modeloL)
resL
shapiro.test(resL)
#CONCLUSÃO: como o p-value=0.4621 < 0,05 (nível de significancia adotado), rejeita
a Ho, ou seja,
# os resíduos NÃO têm distribuição normal

#(b)--Homocedasticidade da variancia--(PRECISA DE REPETIÇÕES )


#Ho:as variancias são iguais( Sigma(i) = Sigma(j))
#Ha:pelo menos uma das variancias difere das demais
bartlett.test(areaL,riquezaL)
#CONCLUSÃO:Deve haver ao menos duas observações em cada grupo.

#(C)--Independencia dos erros--


#Ho:os residuos sao independentes
#Ha:os residuos não são independentes
acf(resL)

#CONCLUSÃO:os lags estão dentro da faixa apontada pelo grafico ao nivel de


significancia de 5%
#concluimos que os erros são independentes, ou seja, estão auto-corelacionados.
plot(area~riqueza)
identify(riqueza~area)

Você também pode gostar