Escolar Documentos
Profissional Documentos
Cultura Documentos
obtenção de estatísticas.
Um conjunto de n observações é
dividido aleatoriamente em cinco
grupos não sobrepostos. Cada um
desses 5 grupos atua como um
conjunto de validação e o restante
como um conjunto de treinamento.
FATEC Adamantina, profa Camila Gonçalves 7
FATEC Adamantina, profa Camila Gonçalves 8
O método é aplicado em cada etapa – calcula-se o erro de
validação (EQM de validação) em cada etapa e depois a média
desses erros.
𝑘
1
Erro de 𝐶𝑉(𝑘) = 𝐸𝑄𝑀𝑖
validação 𝑘
𝑖=𝑖
1
= 𝐸𝑄𝑀1 + 𝐸𝑄𝑀2 + 𝐸𝑄𝑀3 + ⋯ . +𝐸𝑄𝑀𝑘
𝑘
Caso linear
• As estimativas de erro padrão para 𝛽መ0 e 𝛽መ1 obtidas usando as fórmulas são
0,717 para o intercepto (𝛽መ0 ) e 0,0064 para a inclinação (𝛽መ1 ).
• São um pouco diferentes das estimativas obtidas usando o bootstrap. Isso
indica um problema com o bootstrap? Na verdade, sugere o contrário. As
fórmulas padrão dependem de certas suposições. Por exemplo, eles
dependem do parâmetro desconhecido 𝜎 2 , a variância do ruído.
• A abordagem bootstrap não depende de nenhuma dessas suposições e,
portanto, provavelmente fornece uma estimativa mais precisa dos erros
padrão de 𝛽መ0 e 𝛽መ1 do que a função summary().
FATEC Adamantina, profa Camila Gonçalves 36
• Observe na
figura que os
dados indicam
algum tipo de
relação não
linear, o que
insere mais
algum tipo de
erro quando
usando
regressão
linear.
Caso
quadrático
Amostra de 100
árvores
Amostra
FATEC Adamantina, profa Camila Gonçalves 48
Uso do comando boot para a média
• boot(data = nome_vetor, statistic = nome_funcao, R = num_repeticoes)
• Comparando