Escolar Documentos
Profissional Documentos
Cultura Documentos
Geoes t a t ís t ica
• Introdução
• Distribuição do erro
• Referências bibliográficas
G
Introdução
A validação cruzada é a técnica que permite, através da
comparação entre valores reais e estimados das informações
disponíveis, escolher entre diferentes procedimentos de
estimativa, entre diferentes estratégias de busca ou entre
diferentes modelos variográficos.
G
Cross validation x Jacknife
Extremamente laborioso.
?
v* 449 v* 449
G
Arquivo de saída típico na validação cruzada.
G
Distribuição do erro
Erro = r = v* - v
G
Média do erro negativa, refletindo uma
tendência geral de ocorrências de
subestimativas.
G
Outra feição que gostaríamos de observar em nossas distribuições
de erro é um pequeno espalhamento. Na figura, são apresentadas
duas distribuições de erro: em (a) uma distribuição não-
tendenciosa, mas com um grande espalhamento ou variância ao
redor da média e em (b) uma distribuição com muito menos
variância, mas com um leve viés.
(a)
(b)
G
Histograma de freqüência de resíduos para
estimativa por KO no Walker Lake dataset.
G
Distribuição bivariada de valores
verdadeiros e estimados
Um scatterplot de valores
verdadeiros versus valores
estimados fornece uma
evidência adicional do
nível de acerto atingido
pelo método de
estimativa. No caso de
uma estimativa “perfeita”,
os valores verdadeiros e
os estimados plotariam
segundo uma reta a 45o
no scatterplot.
G
No entanto, na prática, teremos sempre que conviver com algum
nível de erro em nossas estimativas e nossos scatterplots de
valores verdadeiros versus estimados aparecerão sempre como
uma nuvem de pontos.
G
Validação como ferramenta qualitativa
G
Mapa dos resíduos mostrando a não-existência de áreas em que
ocorram preferencialmente subestimativas ou superestimativas
G
para o Walker Lake dataset, obtidos por estimativas por KO.
Checagem da não tendencionidade do modelo
800
600
e(u)
400
200
0
0 200 400 600 800 1000 1200
-200
z*(u)
-400
-600
-800
Checando as realizações simuladas
i. L realizações
ii. Estimado por lK diretamente
iii. Usando modelo MG com média, variância e
normalização (back)
Exemplo:
Se o valor real está na mediana dos valores da ccdf então F(ui,Z(ui)
[n(ui)]=0,5
(1 p ) (1 p )
pinf psup
2 2
Cálculo da precisão PI-p
1 n
(ui , p)
n i 1
Essa expressão define a proporção de locais onde o valor real está
inserido no PI-p
Interpretando a precisão e acuracidade da
simulação (ccdf)
Gráfico da acuracidade
( p)
( p) p
p Acurado mas impreciso
( p) p
p
( p) p
p Acurado e preciso
Referências bibliográficas
G