Você está na página 1de 33

Faculdade de Cincias da Universidade de Lisboa

Trabalho Prtico - Estudo da Condutividade Hidrulica


Cadeira de Geomatemtica

Moreira C.; Carvalho C.; Nunes I.; Quintela M.


Maio de 2012

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Resumo
Este relatrio foi realizado no mbito da disciplina de Geomatemtica do 3ano, 2 semestre da licenciatura de Geologia, da Faculdade de Cincias da Universidade de Lisboa. Teve como principal objetivo a aplicao de conhecimentos adquiridos ao longo do semestre nesta cadeira, para a anlise da distribuio espacial da condutividade hidrulica num reservatrio petrolfero, onde foi efetuada uma extensa campanha de amostragem que incluiu a determinao desta propriedade em 178 locais. Para tal foram utilizados mtodos determinsticos e geoestatsticos, para analisar a nossa amostragem e, assim, compreender como funciona cada um e identificar qual deles se ajusta melhor nossa amostragem.

Abstract
This report was conducted within the subejct of Geomathematic of the 3rd year students, 2nd semester of Geology, applied, in the Faculty of Science, from the University of Lisbon. The main goal was the application of knowledge acquired during the semester in this subject to analyze the spatial distribution of hydraulic conductivity in a petroleum reservoir, which was done an extensive sampling campaign which included the determination of this property at 178 locations. For this purpose we used deterministic and geostatistical methods to analyse our sample and, to better understand how each method works and identify which one fits the best.

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

ndice
1. 2. Introduo Estatstica Descritiva
2.1 2.2 2.3 2.4 2.5 Conceitos Tericos Boxplot Histograma Teste normalidade QQ-plot

4 5
5 6 9 11 11

3.

Representar
3.1 3.2 3.2.1 3.2.2 Tendncia Mtodo do vizinho mais prximo Average Nearest Neighbor Distance Diagrama de Voronoi

12
13 14 14 15

4.

Mtodos de Interpolao
4.1 4.2 4.3 Ajuste Polinomial Global Mtodo do Inverso do Quadrado da Distncia. Krigagem

16
16 18 19

5. 6. 7. 8.

Erros Validao Concluso Bibliografia

22 23 31 33

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

1. Introduo
Neste relatrio iro ser utilizados mtodos determinsticos e mtodos geoestatsticos para melhor perceber e identificar qual o mtodo de interpolao espacial que melhor se ajusta distribuio da condutividade hidrulica. Os mtodos determinsticos tm como principal objetivo a interpolao espacial dos valores observados. A sua base so critrios geomtricos, para situaes em que os valores estimados so contraditrios com a estrutura espacial da grandeza a estimar. No se obtm qualquer intervalo de incerteza para a estimao. Incluem a anlise polinomial e o inverso do quadrado da distncia. Os mtodos geostatsticos so utilizados para ultrapassar as limitaes dos mtodos determinsticos usados, pois estes quantificam a estrutura espacial da varivel em estudo e avaliam a incerteza associada caracterizao espacial, Dentro desta seco de mtodos, foi utilizado s o mtodo de krigagem, com os Modelos Esfrico, Gaussiano e Exponencial. Neste relatrio temos uma estrutura que pode ser melhor compreendida pelo diagrama abaixo apresentado; assim inicialmente analismos a estatstica descritiva dos nossos dados em Excel, representamo-los em Arcgis, e usamos as suas ferramentas para realizar os diferentes mtodos de interpolao (Ajuste Polinomial, Inverso do Quadrado da Distncia e Krigagem) tendo com este concluindo quais as suas vantagens, em relao ao tratamento de dados da condutividade hidrulica.

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

2. Estatstica descritiva
2.1 Conceitos tericos:
Mediana - uma medida de tendncia central, um nmero que caracteriza as observaes de uma determinada varivel de tal forma que este nmero (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, populao ou distribuio de probabilidade, da metade superior. Mais concretamente, 1/2 da populao ter valores inferiores ou iguais mediana e 1/2 da populao ter valores superiores ou iguais mediana. Moda a moda o valor que detm o maior nmero de observaes, ou seja, o valor ou valores mais frequentes, ou ainda "o valor que ocorre com maior frequncia num conjunto de dados, isto , o valor mais comum"

Mdia - o valor que aponta para onde mais se concentram os dados de uma distribuio. Pode ser considerada o ponto de equilbrio das frequncias, num histograma.

Varincia- a varincia de uma varivel aleatria uma medida da sua disperso estatstica, indicando quo longe em geral os seus valores se encontram do valor esperado.

Desvio-padro- define-se como a raiz quadrada da varincia. definido desta forma de maneira a dar-nos uma medida da disperso que: 1.seja um nmero no-negativo; 2.use a mesma unidade de medida dos dados fornecidos inicialmente. Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel aleatria, e o desvio padro de um subconjunto em amostra. Distribuio normal inteiramente descrita por seus parmetros de mdia e desvio padro, ou seja, conhecendo-se estes consegue-se determinar qualquer probabilidade em uma distribuio Normal. A Distribuio Normal serve de aproximao para o clculo de outras distribuies quando o nmero de observaes fica grande. Essa importante propriedade provm do Teorema do Limite Central que diz que "toda soma de variveis aleatrias independentes de mdia finita e varincia limitada aproximadamente Normal, desde que o nmero de termos da soma seja suficientemente grande" .

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 1 Esquema de uma distribuio normal.

A estatstica descritiva consiste na recolha, anlise e interpretao de dados numricos atravs da criao de instrumentos adequados: quadros, grficos e indicadores numricos Pode ser considerada como um conjunto de tcnicas analticas utilizado para resumir o conjunto dos dados recolhidos numa dada investigao, que so organizados, geralmente, atravs de nmeros, tabelas e grficos. Para a Estatstica descritiva dos dados recorreu-se ao Excel, para realizar um boxplot e um histograma, com o intuito de verificar a existncia de valores anmalos.

2.2 Boxplot
O boxplot um grfico que possibilita representar a distribuio de um conjunto de dados com base em alguns de seus parmetros descritivos : a mediana, o quartil inferior, o quartil superior e do intervalo interquartil. Para desenharmos o Boxplot precisamos de calcular a mediana e os quartis, a partir destes valores determinamos as barreiras de Outliers B.O: BII= (Q
3/4+1,5(Q 3/4-Q 1/4)) 1/4-1,5(Q 3/4-Q 1/4)

; BIS= Q

e a partir destas os pontos Adjacente Inferior (AI) e o ponto Adjacente

Superior(AS); AI o menor valor da amostra que maior ou igual a Q 1/4-1,5(Q 3/4-Q 1/4). AS o maior valor da amostra que menor ou igual a Q 3/4+1,5(Q 3/4-Q 1/4). Valores fora das barreiras de outliers so considerados candidatos a outliers.

Para fazermos a anlise dos dados atravs do mtodo do boxplot recorrermos anlise da Estatstica Descritiva, no Excel, para retirar os valores dos quartis, Q
1/4,

3/4

e da mediana.

Representmos a amostra com valores anmalos e sem valores anmalos. Anmalos 0,954000 0,908000 0,888500 0,866000 -1,000000 Normais 0,954000 0,908000 0,889000 0,867500 0,808000

Mximo Q3 Mediana Q1 Mnimo

Calculmos tambm as barreiras: a barreira interna superior (BIS) e a barreira interna inferior (BII).

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 2 Boxplot com Outliers.

Ilustrao 3 Boxplot sem Outliers.

A representao em ambos os casos praticamente igual, excepo do Boxplot com os valores anmalos, onde esto representados os outliers, verificando-se uma grande discrepncia entre os valores dos anmalos (outliers) e os valores normais da amostra.

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Dado os valores anmalos serem valores negativos, e como no existem valores de condutividade hidrulica negativa, no sero tidos em conta este valores no resto do trabalho; (apenas no histograma ainda ser apresentado um grfico com os valores e outro sem os valores.) Estes valores anmalos, poderam ser provenientes de uma m leitura na amostragem, ou erros durante a amostragem.

Dada a tabela acima apresentada conseguimos obter vrias estatsticas da nossa amostra, sendo a mdia de 0.8878. Obtivemos, ainda, uma mediana de 0.889, a qual optamos por verificar, visto esta ser uma estatstica resistente ao contrrio da mdia, no sendo por isso to influenciada por valores extremos. Em relao disperso dos dados de observar o valor do desvio-padro (0.026688), a varincia (0.001), assim como a amplitude interquartil (0.415). Esta ltima uma medida resistente da disperso dos dados, contrariamente s duas mencionadas anteriormente. Em resumo, considerou-se a amostra com uma reduzida disperso em torno da mdia.

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

2.3 Histograma
O histograma a representao grfica da distribuio de frequncias acumuladas. As observaes originais so acumuladas em intervalos de classe predefinidos, conforme algum critrio. As frequncias numricas das classes so transformadas em frequncias porcentuais e lanadas no eixo das ordenadas em funo dos intervalos de classe que so representados por barras de largura proporcional ao tamanho do intervalo. O nmero de classes calculado pelo (k). E o seu intervalo calculado pelo (IC).

Frmula 1 Frmula 2 Frmula 3

Para elaborarmos o histograma recorremos a uma ferramenta do Excel chamada Anlise de Dados, escolhemos a opo Estatstica Descritiva que nos fornece vrios parmetros estatsticos sobre a amostra. Optmos por fazer o histograma com e sem os valores anmalos para podermos analisar a sua influncia na amostra. Para a amostra com os valores anmalos, construmos dois histogramas com nmeros de classes diferentes. O nmero de classes foi calculado segundo as frmulas acima mencionadas. Com a frmula 2, obtivemos um k = 23 classes, e um intervalo de classes 0,084957, com a frmula 1 obtivemos um k muito mais pequeno, (k=8) com um intervalo de classes 0,24425.

Ilustrao 4 - Histograma com 23 classes

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 5 - Histograma com 8 classes

Em ambos os histogramas verifica-se que existe uma ausncia de dados em vrias classes, evidenciando uma maior concentrao dos dados nos extremos, principalmente no extremo direito onde se encontram os dados no anmalos. Observmos que nestes dois histogramas, o de 23 classes o mais adequado visto que tem uma distribuio ligeiramente maior que o de 8 classes. Contudo o histograma no deixa de ser um mtodo pouco adequado para representar amostras com dados anmalos.

Ilustrao 6 - Histograma com 8 classes

Para a elaborao do histograma sem dados anmalos, verificmos que 8 classes seriam apropriadas para representar os dados da amostra. Constatamos tambm que a distribuio dos dados se assemelha a uma distribuio normal.
10

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Conclumos com a elaborao destes dois mtodos (histograma vs boxplot), que o boxplot seria mais indicado para representar amostras com valores anmalos.

2.4 Teste Normalidade


Realizou-se um teste normalidade (Kolmogorov-Smirnov) para determinar se o conjunto de dados da condutividade hidrulica numa uma dada varivel aleatria, bem modelada por uma distribuio normal ou no.

Frmula 4, para o clculo do p-value.

Recorremos ao programa SPSS, este permitiu-nos calcular o nvel de significancia (pvalue) para ambas as amostras, com e sem valores anmalos. Admitimos um =0,05, correspondendo a um intervalo de confiana de 95%, embora tambm pudessemos utilizar =0,01 e =0,1. Consideramos como hiptese nula (H0) a distribuio ser normal, e consideramos como hiptese alternativa (H1) a distribuio no ser normal. Quando tivermos p-value rejeitamos H0, e quando p-value no rejeitamos H0.

Tests of Normality Kolmogorov-Smirnov Statistic k ,425 df 178


a

Shapiro-Wilk Sig. ,000 Statistic ,166 df 178 Sig. ,000

a. Lilliefors Significance Correction

Tests of Normality Kolmogorov-Smirnov Statistic k ,049 df 176


a

Shapiro-Wilk Sig. ,200


*

Statistic ,992

df 176

Sig. ,402

a. Lilliefors Significance Correction *. This is a lower bound of the true significance.

Para a amostra com os valores anmalos, temos p-value< (Sig=0,00), logo rejeitamos H0, ou seja os dados no seguem uma distribuio normal. Para a amostra sem os valores anmalos, temos p-value> (Sig=0,200), logo no rejeitamos H0, ou seja os dados seguem uma distribuio normal.

11

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

2.5 QQ-plot
Uma outra forma de calcular um teste normalidade usando um QQ-plot, este um grfico de disperso que confronta os quartis da amostra com os quartis de uma distribuio. Apresenta os valores observados no eixo horizontal, e os valores esperados no eixo vertical. Se a amostra tiver sido retirada de uma populao com aquela distribuio ao grfico deve assemelhar-se a um conjunto de pontos mais ou menos dispostos sobre uma recta, e assim a distribuio normal, qualquer desvio dos pontos da recta apresentada, representa um desvio da normalidade.

Ilustrao 7 QQ-plots com e sem valores anmalos.

Com podemos constatar pelo QQ-plots obtidos pelo programa SPSS, no primeiro caso sem o valores anmalos, os dados apresentam-se dispostos sobre a recta, seguindo assim uma distribuio normal. No segundo caso com os valores anmalos, os dados no apresentam qualquer tipo de correlao com a recta, logo a distribuio no normal.

3. Representar no Mapa
Recorreu-se representao espacial em Arcgis para verificar, a disposio dos pontos, observando assim uma anlise espacial do tipo aleatria. O referencial de coordenadas que utilizamos foi o WGS84 49N (Qatar). Observamos que nesta representao temos valores de condutividade menores na zona Oeste e a Sul do mapa, sendo que os valores maiores aumentam para Este.

12

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

3.1 Tendncia
A Tendncia a diferena entre a mdia das medidas de uma grandeza e o valor de referncia para a grandeza medida. A tendncia pode ser: Isotropia - a tendncia de variao funo apenas da distncia de um ponto amostrado. Anisotropia - a tendncia de variao funo tanto da distncia quanto da direo a partir de um ponto com valor conhecido. Para fazermos a anlise da tendncia dos nosso dados, recorreu-se GeoStatistical Toolbar, no Trend Analysis. Selecionamos o nosso atributo (k), e testmos os vrios graus de polinmios disponveis, 1, 2 e 3.

Ilustrao 8 1 Grau

Ilustrao 9 2 Grau

13

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 10 3 Grau

Como se pode verificar pela ilustrao 10, chegamos concluso que o polinmio que mais se adequava distribuio dos dados era o de 3 grau. Podemos concluir que os valores de k tendem a aumentar ao longo do plano XZ, medida que o valor de x aumenta. Tendem tambm a aumentar ao longo do plano YZ medida que o valor de y aumenta.

3.2 Mtodo do Vizinho mais prximo. 3.2.1 Average Nearest Neighbor Distance
Mtodo do vizinho mais

O Teste uniformidade efectudado em ArgGis pelo prximo, em Average Nearest Neighbor Distance.

No mtodo do vizinho mais prximo, o valor estimado ser o mesmo do ponto amostrado mais prximo. Neste mtodo calcula-se a matriz de distncias entre os n indivduos da populao, em seguida os indivduos mais prximos so agrupados. A realizaao deste teste muito importante, uma vez que efectua a desagregao das amostras, ao contrrio de outros mtodos de interpolao. Utilizando o mtodo da distncia Euclidiana , constatamos que para =0.05, o valor crtico de 9,150948 e a distribuio uniforme (Dispersed), possundo uma densidade de pontos constante.
14

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 11- Average Nearest Neighbor Summary

3.2.2 Diagrama de Voronoi


Com o mtodo dos poligonos de influncia ou Voronoi, o espao descretizado em poligonos centrados em cada amostra. A dimenso dos polgonos determinada pela distncia das amostras entre si e uma medida de influncia espacial de cada uma delas para a inferncia de valores locais ou globais. Assim todos os pontos que pertencem a um poligono tomam o valor da amostra do centro do polgono.

Ilustrao 12 Voronoi

Com o Voronoi Map Simple, analismos a distribuio espacial dos dados da amostra sem os valores anmalos, podendo concluir que os valores mais elevados se encontram a NE, e os mais reduzidos a SW.

15

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

4. Mtodos de Interpolao
A interpolao espacial a tcnica de interpolar uma varivel para locais espaciais. Existem interpoladores globais e locais, exatos e aproximados, estocsticos e determinsticos, e ainda graduais e abrutos. Globais usam todos os pontos, e tendem a fornecer superficies mais suaves. Locais s usam uma vizinhana do ponto a estimar. Exactos honram as observaes. Aproximados no honram as observaes. Estocsticos, para alm de fornecerem a estimativa do ponto, fornecem tambm a estimativa do erro. Determinsticos, um interpolador que s fornece a preciso. Gradual, apresenta uma superfice continua no espao. Abrupto, apresenta uma descontinuidade na interpolao.

4.1 Ajuste Polinomial Global


Mtodo pela qual, atravs de critrios de regresso por mnimos quadrados, uma superfcie continua ajustada aos pontos. Trata-se de um interpolador global e aproximado pois utiliza todos os dados para a estimao e no honra as observaes, isto , tem como base a distncia dos mnimos quadrados, tentando minimiz-la. uma medida quantitativa do grau da tendncia existente na amostra. O seu resultado o ajuste de uma superficie lisa, definida por uma funo polinomial e que representa a tendncia nos pontos amostrados.

Ilustrao 13 - Comparao RMS e Declive dos vrios graus do polinmio

16

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Analisando a ilustrao 14, conseguimos inferir que o grau polinomial com melhor ajuste o de grau 3. Pelo facto de no s ter o menor RMS, mas tambm, por ter um declive de ajuste recta terica, que embora seja ligeiramente mais reduzido, encontra-se dentro da mesma gama de valores, no sendo contudo, significativa a sua variao.

Ilustrao 14 - Recta terica e experimental para o grau de polinnimo 1, 2,3,6 respectivamente

Ilustrao 15 - Representao

Como visivel na ilustrao 15, optamos por uma simbologia para representar os pontos amostrados, onde o aumento do tamanho coincide com o aumento da condutividade hidraulica. J na interpolao espacial, teve-se em conta que a condutividade aumenta do azul para o vermelho, dado isto, concluimos, ser o polinmio de grau 3 que verifica um melhor ajuste pontos cor.

17

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

4.2 Mtodo do Inverso do Quadrado da Distncia

Este um mtodo exacto. Utiliza os valores dos vizinhos mais prximos para calcular o ponto a interpolar. Atravs deste mtodo o valor estimado ser igual ao valor observado. Generalizando pode dizer-se que quanto maior for a potncia usada, maior ser a influncia da amostra mais prxima.

Ilustrao 16 - Interpolao Espacial pelo Mtodo do Inverso da Distncia (IDW)

Neste mtodo o nosso objectivo estudar a influncia que cada amostra tem no ponto a estimar para diferentes graus de potncia, sendo estes: 1, optimizado (2.7499461400616605), 4, 6, 40, 80. No achamos significativo proceder a nenhuma outra alterao, devido ao facto de apenas se verificar um ligeiro aumento do RMS, focando-nos, assim, somente no valor da potncia. A ponderao de cada amostra vai ser proporcional ao inverso da distncia elevado ao valor de uma potncia escolhida. Como resultado, com o aumento da distncia, a ponderao decresce rapidamente, isto , pontos mais prximos tem um maior peso na ponderao do que pontos mais distantes. Como tal, se o incremento da potncia for muito elevado, apenas os valores mais prximos integram a interpolao.

18

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 17 - Comparao do RMS e Declive para os vrios graus de potncia

Com a anlise da tabela podemos observar que o menor valor para o RMS apresentado pela potncia optimizada. Verificamos, ainda, que quanto maior a potncia melhor a atenuao recta terica com a consequncia do aumento do RMS.

4.3 Krigagem
um mtodo de regresso usado em geoestatstica para aproximar ou interpolar dados, que usa o conhecimento da correlao espacial obtida pelo variograma para fazer uma estimao da varivel. A krigagem assenta num modelo de variograma que tem necessariamente de traduzir as principais caracteristicas estruturais e de homogeneidade do atributo na rea na qual se vai processar a estimao-efeito de pepita,[] ele acima de tudo uma medida da continuidade e da homogeneidade estrutural do processo espacial, do qual conhecemos apenas um conjunto de amostras.(Soares,2000) Pode-se dividir em 3 tipos: Krigagem Simples, assume que as mdias locais so relativamente constantes e com um valor muito semelhante mdia da populao que conhecida. Krigagem Ordinria, as mdias locais no so necessriamente prximas da mdia da populao usando-se apenas os pontos vizinhos para a estimao. Co-krigagem, uma extenso da Krigagem Ordinria a situaes em que duas ou mais variveis so espacialmente dependentes e a varivel que se quer estimar no est amostrada com a intensidade com que esto as outras variveis dependentes, utilizando-se os valores destas e as suas dependncias para estimar a varivel requerida. Vantagens da Krigagem: - Considera o nmero de pontos necessrio para se calcular uma mdia local. - Integra as caractersticas espaciais dos pontos amostrais (tamanho, orientao e forma da distribuio).
19

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

- Otimiza a interpolao atravs do uso de pesos. - Aponta a incerteza atravs da estimativa da confiabilidade da superfcie interpolada. O Variograma um instrumento que descreve quantitativamente a variao no espao de um fenmeno regionalizado; a sua base conceitual se os pontos so muito

correlacionados a varincia das diferenas ser menor. Quando esta representada em funo da distncia (h) fica demonstrada a correlao espacial (covarincia) de um fenmeno regionalizado e torna-se possvel a construo de um variograma. Um variograma apresenta as seguintes caracteristcas: Alcance distncia mxima que o variograma atinge, a partir do qual o variograma inicia a horizontalizao, ou seja, o alcance corresponde ao valor a partir do qual atinge o patamar. Patamar valor mximo que o variograma atinge quando as distncias se tornam elevadas. Ponto a partir do qual os dados se tornam independentes. Efeito Pepita o valor do variograma nulo, h=0. Na prtica h um valor mnimo de h entre amostras para o qual pode ser quantificado o valor de Quando esse valor elevado, significa que h uma grande variabilidade

pequena escala, isto referente s menores distncias entre amostras ou observaes. Pode acontecer no tender para zero quando h tende para zero. Existe na realidade

uma inflexo ou descontinuidade no andamento do variograma a uma escala no captada pelas amostras, isto , entre h=0, e .

Nestas situaes, o variograma modelizado por uma ordenada na origem igual a uma constante C0 denominada por efeito de pepita. Entretanto quando no assim, este efeito pode ser atribudo variao espacial dos dados em distncias inferiores ao intervalo de amostragem ou a erros de medio, ou s duas simultaneamente. O efeito de pepita vai assim indicar a correlao entre os pontos, sendo que esta correlao tanto maior quanto menor o efeito de pepita. Quando se tem o efeito de pepita nulo, o valor estimado igual mdia e o efeito de pepita representado atravs de uma recta.

Ilustrao 18 Efeito De Pepita

20

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Dentro da Krigagem foram utilizados os Modelos Esfrico (ESF), Exponencial (EXP) e Gaussiano (GAU), com os quais se construram variogramas. ESF, a forma esfrica a mais utilizada, possui patamar, e um limite superior para o

qual tendem os valores do variograa com o aumento dos valores de h, e a amplitude de h=a. A amplitude mede a distncia a partir do qual os valores de Z(x) deixam de estar correlacionados. EXP, utilizado quando a autocorrelao espacial decresce exponencialmente com o

incremento da distncia, apresenta patamar sendo este o valor para o qual o variograma tende assimptoticamente. O valor da amplitude a distncia em que o modelo atinge 95% do patamar. GAU, apresenta um comportamento parablico na origem. Tal como o modelo

exponencial, a amplitude a distancia para a qual o modelo atinge 95% do patamar.

Ilustrao 19 Modelos de Variogramas.

Consideraes sobre o estimador da Krigagem Resumem-se em 2 fatores, um o factor da distncia estrutural [M] entre amostras e o ponto a estimar, o segundo o factor desagregao [K] originado pela matriz de covarincias entre as amostras, quanto mais correlacionadas estiverem as amostras maior o efeito de agrupamento ou redundncia e menor ser o seu peso individual na construo do estimador.

Este estimar uma soluo ptima para a inferncia das caractersticas mdias globais ou locais de um recurso natural, o que torna o modelo ideal para 1 visualizao das caractersticas do recurso, assim um bom estimador no sentido da minimizao do erro de estimao, mas um mau estimador no sentido da sua varincia.

21

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

No entanto tratando-se de um filtro aplicado ao conjunto de dados experimentais, a krigagem , naturalmente, um atenuador deste conjunto de dados

5. Erros
Erro mdio (MEAN); corresponde mdia da soma dos erros para cada valor estimado, pelo que se calcula dividindo a soma dos erros pelo nmero de observaes. Significa isto que o valor ideal deste erro zero.

Erro mdio quadrtico (RMS); calcula-se fazendo a raiz quadrada da soma dos erros a dividir nmero de observaes. Mede a disperso dos pontos em torno da recta.

Erro mdio quadrtico padronizado (EMQP); calcula-se fazendo a raiz quadrada da soma dos erros a dividir pela varincia da populao. Diz-se que para valores maiores que 1 h substimao do valor real e que para valores menores que 1 h uma sobrestimao do valor real, portanto, o valor ideal 1.

Mdia do desvio Padro de estimao (MDPE)- Average Standart Error;

22

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

6. Validao
A validao cruzada uma tcnica de estatstica no paramtrica para avaliar a capacidade de generalizao de um modelo, a partir de um conjunto de dados . O processo consiste em retirar-se uma amostra Z(x0) do conjunto de dados e estimar-se (utilizando, por exemplo o estimador linear de krigagem) no local da amostra o valor [Z(x0)]*. No processo de estimao da validao cruzada intervm basicamente 3 fatores que esto de tal modo relacionados que se torna difcil julgar qual a sua influncia nos valores dos estatsticos globais dos desvios: as hipteses de estacionariedade/homogeneidade espacial, o modelo do variograma e o prprio processo de estimao, (Soares, 2000). Um teste de validao cruzada com bons ndices finais no significa necessariamente que estamos perante um modelo adequado ao fenmeno em anlise. Pretende-se acima de tudo, que ele reflita em termos mdios, os principais padres de continuidade espacial do conjunto de amostras (Soares, 2000).

O objetivo pretendido era determinar se existiria alguma relao entre as alteraes efetuadas com os efeitos que podemos visualizar na interpolao espacial. Como tal, procedemos a alteraes no patamar (sill), alcance (range) e no efeito de pepita (nugget effect). Poderamos, ainda, ter alterado o nmero de classes (number of lags) e, a amplitude de classes (Lag size). Contudo, conclumos que iria aumentar muito ligeiramente os erros e diminuir o declive da recta quando testamos estes parmetros (number of lags e lag size), ficando por isso, o trabalho apenas com alteraes nos trs parmetros iniciais. De forma a verificar os efeitos das alteraes na interpolao espacial, monitorizamos as mudanas nos valores dos erros, tais como, o Erro Mdio Quadrtico (EMQ ou RMS), o Erro Mdio Quadrtico Padronizado (EMQP ou RMSS) e, o Average Standard Error (ASE). Com o propsito de verificar a diferena entre o valor medido e o estimado, deu-se igualmente importncia ao declive da recta de regresso ajustada aos dados. O seu valor ir darnos uma noo da correlao dos dados. Sendo que, quanto mais prximo o valor for de 1 melhor ser a correlao. Inicialmente, ponderamos se seria necessrio realizar uma transformao, como por exemplo, a logartmica, sem alterao das definies por defeito do ArcGis.

23

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 20 - Variograma e interpolao espacial sem transformao e, modelo Stable optimizado

Ilustrao 21 - Variograma e interpolao espacial com transformao logaritmica e, modelo Stable optimizado

Ilustrao 23 - Comparao entre a transformao logartmica e nenhuma

Ilustrao 22 - Comparao das rectas experimentais sem transformao e com transformao logartmica, respectivamente

24

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Como podemos verificar pela tabela 23 e pelas ilustraes 20, 21 e 22 para esta srie de dados no se justifica efectuar a dita alterao logartmica. Uma vez que o RMS aumenta ligeiramente, a atenuao recta terica e o RMSS decresce, logo decidimos no proceder a nenhuma transformao. Na krigagem, foi necessria a escolha de um modelo para efectuarmos as alteraes. Para tal, comparamos os modelos a estudar (Esfrico, Exponencial e Gaussiano) optimizados.

Ilustrao 24 - Variograma e interpolao espacial do Modelo Gaussiano optimizado

Ilustrao 25 - Variograma e interpolao espacial do Modelo Exponencial optimizado

Ilustrao 26 - Rectas experimentais e tericas do modelo exponencial, gaussiano e esfrico respectivamente

25

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 27 - Erros e declive dos vrios modelos optimizados

Pela ilustrao 27 podemos verificar que o modelo que melhor se ajusta o exponencial, tanto por ter o menor RMS e um RMSS razovel. Em relao anlise do variograma experimental conclumos que no modelo Gaussiano ilustrao 24, este tem um incremento mais lento junto origem, mostrando uma grande continuidade espacial nesse local, sendo que tanto o exponencial (ilustrao 25) como o esfrico (ilustrao 26) tem um incremento mais rpido e tendem assimptoticamente para o patamar. Para uma melhor deciso, utilizamos o Prediction/Validation verificando que o modelo com menor erro associado o exponencial, corroborando o atrs dito. De seguida, avaliamos se justificaria a remoo de tendncia, sabendo ns a priori que a nossa varivel no estacionria e, j tendo verificado a existncia de uma tendncia de terceiro grau no Trend Analysis.

Ilustrao 28 - Comparao do modelo exponencial optimizado com uma tendncia de 3 grau e sem

Podemos verificar atravs da ilustrao 28 que o RMS melhor com a remoo da tendncia, estando o RMSS mais prximo de 1 (ideal), havendo, ainda uma melhor atenuao recta terica. Seguidamente tentmos, atravs da alterao do nmero de sectores no Sector Type, ter um melhor ajuste da interpolao.

Ilustrao 29 - Comprao do modelo exponencial optimizado sem tendncia com 4 ou 8 sectores no sector type

26

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Neste caso da ilustrao 29, embora aumente ligeiramente o RMS, ficamos com um RMSS quase ideal e, a mudana do declive no muito significativa. Dado isto, achamos que neste caso os 8 sectores sero mais adequados. Dada a remoo da tendncia e a alterao do sector type, achmos que seria melhor certificarmo-nos se se manteria ainda o modelo exponencial, como aquele que tem um melhor ajuste. Para tal, apresentamos a seguinte tabela.

Ilustrao 30 - Com remoo da tendncia de 3 grau e 8 sectores

Desta (ilustrao 30) conclumos que se mantem o dito anteriormente, ou seja, o modelo exponencial o melhor com a remoo da tendncia e com 8 sectores.

Alteraes no modelo exponencial


Patamar optimizado e fixo de 0.0002333277179601476, com alteraes no alcance.

Ilustrao 31 - Interpolao espacial do patamar fixo e incremento do alcance

27

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 32 - Erros e declive do incremento do alcance

Aps a anlise da ilustrao 32, apuramos que o alcance com o menor RMS o optimizado como seria esperado. Apresentando, ainda a melhor atenuao recta terica e, tanto um declive como um ASE, dentro da gama de valores dos outros alcances. Em termos das interpolaes espaciais (ilustrao 31) podemos ver uma ligeira expanso da rea vermelha (maior condutividade hidrulica) com o sucessivo aumento do alcance. E ainda, um aparecimento de manchas de cor mais clara (menor condutividade) sobre cores mais escuras, que se vo expandindo com o aumento do alcance. Esta situao deriva do facto de em reas com elevada densidade de amostras ser minimizada a influncia dos valores semelhantes. Passando a dar-se uma maior relevncia aos valores mais baixos e mais altos (valores extremos), que geram depresses e elevaes, respectivamente. Um exemplo de uma depresso visvel na zona ENE, onde temos um valor muito mais reduzido de condutividade hidrulica em relao aos valores dessa rea.

Alcance optimizado e fixo de 281.33295079442735, com alteraes no patamar

Ilustrao 33 - Interpolao espacial do alcance fixo e incremento do patamar

28

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 34 - Variao dos erros e declive com o incremento do patamar

Com as interpolaes espaciais obtidas (ilustrao 34) e, atravs da sua comparao constatamos que no existe alteraes em nenhuma delas. Em relao aos erros (ilustrao 33), o RMS e o declive da recta experimental permanecem iguais com a alterao do patamar. Contudo, existe uma grande alterao no RMSS e no ASE, que esta interligada. Isto , o RMSS obtido, como dito anteriormente, atravs da razo entre os valores observados e os valores estimados, isto quer significar que quanto maiores foram os valores estimados menor ser o valor do RMSS. esta a situao que verificamos, tendo o RMSS a diminuir enquanto o ASE (valores estimados) aumenta. Aumento este, devido ao facto de com o acrscimo do patamar, aumentar a distncia entre o variograma terico e os pontos mdios para cada classe (+).

Alcance e patamar optimizados e fixos, com alteraes no efeito de pepita

Ilustrao 35 - Interpolao espacial do alcance e patamar fixos e incremento do efeito de pepita

29

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Ilustrao 36 - Variao dos erros e declive com o incremento do efeito de pepita

Aps a anlise da ilustrao 36, apuramos que o RMS mantm-se relativamente constante, sendo a maior variao para o RMSS e o ASE. Neste caso, ocorre o inverso do que sucede na variao do alcance. Ou seja, no efeito de pepita podemos visualizar (ilustrao 35) que com o acrscimo do seu valor desaparecem as manchas claras, ou seja, as depresses, ficando a interpolao espacial mais uniforme. Em termos da interpolao espacial, a partir de um certo valor de efeito de pepita esta vai estabilizar, no verificando nenhuma alterao na imagem. Quanto maior o efeito de pepita, maior a influncia do conjunto total de amostras e, consequentemente, os mapas resultam mais atenuados.

30

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

7.Concluso
Com a realizao deste trabalho conseguimos compreender a problemtica da anlise de dados, atravs dos mtodos determinsticos e geostatisticos e, a importncia da tomada de decises que vo condicionar os resultados obtidos. Para uma primeira anlise mais geral dos dados, os mtodos determinsticos so bastante teis porque permitem apurar qual o tipo de distribuio com o teste normalidade (Kolmogorov-Sminorv e QQ Plot). Possibilitam-nos tambm verificar se existem dados anmalos a partir da anlise do histograma ou do box-plot (outliers). Para realizarmos uma anlise tendncia da amostra recorremos ao Variograma. Aps a experimentao dos vrios graus, 1, 2 e 3, deduzimos que o polinmio de 3 grau seria o que melhor se ajusta aos pontos. O mtodo Voronoi permitiu-nos visualizar a distribuio espacial dos dados da amostra, e assim, inferir sobre os locais onde estes apresentam maior ou menor concentrao. Para uma anlise primria, mais geral, o Inverso da Distncia um bom interpolador, uma vez que se trata de um mtodo rpido e exacto, no qual no necessrio tomar muitas decises em relao aos parmetros. Contudo, sensvel a amostras agrupadas, pois no capaz de as desagregar promovendo o enviesamento, no sendo este o nosso caso. Em relao Interpolao Polinomial Global, embora seja um mtodo rpido tem a desvantagem de suavizar os dados. Sendo, por isso, mais utilizado em superfcies que se alteram de forma gradual e lenta. Quanto Krigagem ordinria podemos constatar que um mtodo trabalhoso e, que requer um elevado nmero de decises que tem de ser tomadas, sendo esta a sua desvantagem. Decises estas, que consistem na modificao dos parmetros e, consequente teste aos mesmos, at se conseguir a melhor superfcie interpolada possvel. Uma vez que este mtodo tem em conta a estimativa da incerteza, do declive e do erro vantajoso, uma vez que os parmetros que podemos modelar vo influencia-los. Para os nossos dados, conclumos que o melhor modelo para a interpolao era o exponencial. Tendo sido, ainda, aplicada a remoo da tendncia, uma vez que a krigagem assume a estacionariedade da amostra, e a nossa no o era, logo foi necessrio este passo. Sendo este um mtodo que nos d os valores estimado e a incerteza associada aos mesmos, por isso considerado mais fivel, permitindo-nos tomar decises com bases mais slidas e confiveis.

31

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

Em relao aos parmetros, podemos concluir que para uma krigagem mais exacta necessrio remover o efeito de pepita e, ainda, que o parmetro onde podemos ver maior influencia na interpolao o incremento do alcance. Finalmente, comprovamos que realmente necessria a remoo da tendncia de 3 grau, para termos uma interpolao mais exacta.

32

Trabalho Prtico - Estudo da Condutividade Hidrulica Maio de 2012

8. Bibliografia
Apontamentos das Aulas de Geomatemtica
Apontamentos das aulas de Mtodos Estatsticos

Amndio Cordeiro, Sistemas de Informao Geolgica, Fcul- Engenharia G. Pedro Trocado, Manual de ArcGis 9, IST. Soares, A Geoestatstica para as Cincias da Terra e do Ambiente. IST Press; 2000

http://www.igc.usp.br/geoestatistica/glossario/ http://www.esri.com/software/arcgis/index.html http://www.topografia.ufsc.br/Ajustamento.pdf

33

Você também pode gostar