Você está na página 1de 3

Exercício Escolar

• Karina costa -21555662


A base de dados abaixo consiste em amostras da estrutua finceira de uma empresa,
que se refere ao modo como os ativos fixos são divididos em valor líquido e débito.
Os dados coletados, mostram os indices de retornos no valor líquido usando três
niveis diferentes de alavancagem financeira e um nivel de controle (débito zero) para
24 empresas selecionadas automaticamente.
## Importando a base de dados.
empresadt <- read.csv("~/Analise Sobre/empresadt.txt")
empresadt

## controle baixo medio alto


## 1 2.1 6.2 9.6 10.3
## 2 5.6 4.0 8.0 6.9
## 3 3.0 8.4 5.5 7.8
## 4 7.8 2.8 12.6 5.8
## 5 5.2 4.2 7.0 7.2
## 6 2.6 5.0 7.8 12.0

• Verificando a normalidade dos dados… Uma alternativa para verificar o


pressuposto de normalidade é o teste de Shapiro-Wilk. Notem que a percepção
sobre o resultado do teste também se estrutura em torno do p-valor.
H0: consistem em dizer que há normalidade nos dados; H1: que não há.
Assim, rejeita-se H0 quando p-valor<α, por convenção utiliza-se α= 0,05.
Neste exemplo, os dados da empresa também atendem o pressuposto de normalidade
da ANOVA (p-valor > 0,05).
shapiro.test(empresadt$controle)

##
## Shapiro-Wilk normality test
##
## data: empresadt$controle
## W = 0.916, p-value = 0.477

shapiro.test(empresadt$baixo)

##
## Shapiro-Wilk normality test
##
## data: empresadt$baixo
## W = 0.94716, p-value = 0.7172
shapiro.test(empresadt$medio)

##
## Shapiro-Wilk normality test
##
## data: empresadt$medio
## W = 0.94178, p-value = 0.6736

shapiro.test(empresadt$alto)

##
## Shapiro-Wilk normality test
##
## data: empresadt$alto
## W = 0.9117, p-value = 0.4477

• Aplicando a ANOVA..
fit<-aov(controle ~ baixo + medio + alto, empresadt)
fit

## Call:
## aov(formula = controle ~ baixo + medio + alto, data = empresadt)
##
## Terms:
## baixo medio alto Residuals
## Sum of Squares 14.585422 0.068656 8.643732 0.830524
## Deg. of Freedom 1 1 1 2
##
## Residual standard error: 0.6444082
## Estimated effects may be unbalanced

summary(fit)

## Df Sum Sq Mean Sq F value Pr(>F)


## baixo 1 14.585 14.585 35.123 0.0273 *
## medio 1 0.069 0.069 0.165 0.7237
## alto 1 8.644 8.644 20.815 0.0448 *
## Residuals 2 0.831 0.415
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Notem que o p-valor estimado foi igual (Pr(>F)). Isto nos leva a rejeitar a hipótese
nula em favorecimento à hipótese alternativa.
Antes de verificar qual ou quais niveis são distintas entre sí, é importante verificar o
pressuposto de independência das observações. Este pressuposto pode ser avaliado
através da análise dos resíduos do modelo ANOVA.
Aplicando a função genérica plot() do R aos resíduos do modelo, que podem ser
acessados pela função residuals() ao objeto que armazena os resultados do modelo
ANOVA pode-se visualizar a distribuição dos resíduos e sua independência à cada
observação. Outra forma de visualizar esta independência dos dados sobre a análise
dos resíduos de um modelo esta centrada na distribuição dos mesmos. Espera-se que
os resíduos de um modelo bem ajustado possua uma distribuição normal, centrada em
0 e variância constante.
### Para verificar a dependência nas observações, podemos analisar os
### residuos do modelo ANOVA.
par(mfrow = c(1, 3))
plot(residuals(fit), xlab = "Indice da observação",
ylab = "Resíduos", ylim = c(-1, 1))
hist(residuals(fit), include.lowest = TRUE, right = FALSE,
main = "", xlab = "Resíduos", ylab = "Frequência",
col = "gray")

Outro resultado importante de um modelo pode ser acessado pelo cálculo do


coeficiente de explicação r2. O coeficiente de explicação de um modelo ANOVA é
dados pela razão entre a Soma dos Quadrados dos Resíduos entre os Grupos (SQEnt)e
a Soma dos Quadrados dos Resíduos Totais (SQT). Utilizando a saída da
função_anova()_ fica mais simples acessar os valores para estimar o r2.
fit$"Sum Sq"[1]/sum(fit$"Sum Sq")

## numeric(0)

```

Você também pode gostar