Você está na página 1de 86

/  ë O 

Parte 4A

p 


   

 

 
/  ë O 
Ô trodução

Medidas geológicas em sequê cias:

Neste bloco de assu tos iremos co siderar os modos de se exami ar


dados que são caracterizados por sua posição ao lo go de uma
li a. Ôsto é, eles formam uma sequê cia e a posição a qual
cada dado ocorre de tro da sequê cia é importa te. Co u tos
de dados deste tipo são comu s em geologia e i cluem, e tre
outros:
- sucessões de litologias ide tificadas;
- e saios geoquímicos e mi eralógicos em perfis,
tri ceiras, testemu os de so dagem, etc.
- registros geofísicos em poços ou em perfis a
superfície.
/  ë O 
Ô trodução

Medidas geológicas em sequê cias:

Também estão esta categoria os registros efetuados ao lo go do


tempo, tais como:

- vazão de dre age s ao lo go de um período;


- produção de uma mi a ao lo go do a o;
- variação do campo mag ético em BSB a última
década, etc, etc.
/  ë O 
Ô trodução

!"# :

$%&registros basta te precisos

Sequê cias basta te precisas ta to o registro da variável que é


medida como a escala ao lo go da qual as seguidas
observações são alocadas.

Exemplo: Registros geofísicos em perfis.


Histórico de produção de um poço de petróleo
/  ë O 
Ô trodução

!"# :

$% &registros pouco precisos

Nós podemos co siderar uma sequê cia estratigráfica


co sisti do de tipos de rocas e co tradas ao lo go de uma
seção sedime tar. Tal sequê cia poderia ser um ciclotema de
calcário-folelo-calcário-folelo-are ito-carvão-folelo-
calcário. Nós estamos i teressados a sig ificâ cia da sucessão,
mas ão podemos associar a ela e uma escala.
/  ë O 
Ô trodução

!"# :

 %!'&ou a variável ou a escala ão são precisas.

No caso a terior poderíamos medir algum atributo dos


difere tes tipos de roca. Por exemplo, poderíamos medir o teor
de cumbo em cada litologia. Neste caso a variável, teor de
cumbo, estaria registrada em escala de i tervalo refere ciada a
uma escala omi al (litologias).
/  ë O 
Ô trodução

  
 
 

  
      
  
V 
   
 ·!
 ·$

 
 
  ·" ·#
   ·#
 ·%

   ·&
  

  ·#
·' 


·%
 (

 

   
 ·#   ·& 
 
  
)*

  ·V   


/  ë O 
Ô trodução

[(") % !:

- São as observações aleatórias ou elas co tém evidê cia de


i  ou padrão ?
- Podem ciclos e repetições ser detectados e medidos ?
- Podem ser feitas previsões ou estimativas a partir dos dados ?
- Podem as variáveis estar relacio adas e tre si ?

Embora estas questões possam ão ser explicitame te colocadas em


todas os problemas, você deverá exami ar a atureza das
téc icas, pe sar a sua aplicabilidade e tipos de estudos que
poderão ser solucio ados. Os exemplos que veremos são ape as
sugestões. Muitos outros poderiam ser usados.
/  ë O 
Ô trodução

 *% !":

Qua do co fro tado com um problema e volve do dados ao


lo go de uma sequê cia, as segui tes questões devem ser feitas
para audar o pla eame to:

- Que questão (ou questões) eu quero respo der ?

- Qual a atureza de mi as observações ?

- Qual a atureza da sequê cia a qual as


observações ocorrem ?
/  ë O 
Ô terpolação

+,  -. +,&

Muitas das téc icas usadas em a álise de seqüê cias de dados


dema dam que os valores esteam igualme te espaçados. As
observações devem ser coletadas em i tervalos regulares ao
lo go de uma li a ou perfil, ou igualme te espaçadas ao lo go
do tempo.

Esta regularidade a amostragem é, em muitos casos, impossível de


ser obtida. Precisaremos, porta to, estimar o valor da variável
em a álise, em po tos regularme te espaçados, a partir dos
valores co ecidos irregularme te espaçados.
/  ë O 
Ô terpolação

+,  -. +,&

Embora existam muitos métodos através dos quais dados


regularme te espaçados podem ser estimados de dados
irregularme te espaçados. Co sideraremos, primeiro, a
 /0   e tre um par de po tos.

Supo a que y1 e y2 seam valores observados os po tos x1 e x2.


Supo a, agora, que deseamos estimar o valor de y¶ o po to
x¶.
/  ë O 
Ô terpolação
/  ë O 
Ô terpolação

+,  -. +,&

Se podemos supor que exista uma relação li ear e tre os dois


po tos, valores i termediários podem ser calculados a partir de
relações geométricas:

·

·2 ·1   1
Ë ·1
2 1

Em outras palavras, a difere ça e tre valores de dois po tos


adace tes pode ser represe tada por uma fu ção da distâ cia que os
separa.
/  ë O 
Ô terpolação

+,  -. +,&


Embora a i terpolação li ear sea simples, ela gera algu s
problemas em muitas aplicações.

Se o úmero de po tos igualme te espaçados é aproximadame te o


mesmo que o de po tos origi ais e se estes possuem
espaçame to u iforme, a téc ica produz resultados satisfatórios.

Co tudo, se existem muito mais po tos origi ais que i terpolados,


a maioria dos dados origi ais será ig orada, pois some te dois
po tos vizi os defi em um valor i terpolado.
/  ë O 
Ô terpolação

+,  -. +,&


Se os dados origi ais possuem uma gra de compo e te aleatória
que faz com que os valores variem forteme te, os valores
i terpolados podem variar de forma i aceitável.
Se os dados origi ais são esparsos e diversos valores devem ser
estimados e tre cada par de observações, a i terpolação li ear
operará adequadame te, desde que a suposição de variação
li ear e tre po tos sea razoável.

Em qualquer problema de i terpolação, precisamos lembrar sempre


que ão podemos criar dados por estimação por qualquer
téc ica. A validade do resultado depe de sempre dos dados
origi ais.
/  ë O 
Ô terpolação

+,  -. ,+ +&

Um aume to o tama o da vizi a ça para a determi ação de um


valor i terpolado pode, em algu s casos, mi orar problemas
observados a i terpolação li ear simples. O i terpolador de
Lagra ge procura atuar este co texto.
/  ë O 
Ô terpolação

+,  -. ,+ +&

Neste i terpolador mais de dois po tos podem ser utilizados a


defi ição de um valor i terpolado. Assim temos:
 ë 
†  
 
· 

š  
 ë
š
 

O de é o úmero de po tos co secutivos co siderado a


estimativa de um valor.
/  ë O 
Ô terpolação

+,  -. ,› ›&

›  matemático é restrito a passar por po tos defi idos, porém


e tre os po tos ele se flexio a resulta do uma li a
suaveme te variável.

Os   ão são fu ções a alíticas em são modelos estatísticos


como a regressão poli omial. Os  são purame te
arbitrários e vazios de base teórica, exceto aquelas que defi em
as características da própria li a.
/  ë O 
Ô terpolação

+,  -. ,› ›&

Os spli es são segme tos de poli mios que são restritos a


possuírem derivada co tí ua a u ção e tre segme tos.

O spli e mais comum co siste de poli mios cúbicos do tipo:

Y = ö 1 + ö 2 X + ö 3 X2 + ö 4 X3

A curva defi ida por uma poli omial cúbica pode passar
exatame te por 4 po tos, porém para austar uma sequê cia
maior de po tos é ecessário usar uma sucessão de segme tos
de poli mios.
/  ë O 
Ô terpolação

+,  -. ,› ›&

Para gara tir que ão ocorram muda ças abruptas a i cli ação ou
curvatura e tre segme tos, a fu ção ão é austada aos 4 po tos
e, sim, a some te 2. Ôsto permite usar restrições adicio ais que
assegurarão que o   te a:
1 ± co ti uidade da 1ª derivada e tre segme tos (a i cli ação
da li a é a mesma em ambos os lados de uma u ção),
2 ± co ti uidade da 2ª derivada (a taxa de variação ão muda
através da u ção).
/  ë O 
Ô terpolação
/  ë O 
Ô terpolação
/  ë O 
Ô terpolação
/  ë O 
Teste de corridas

! &
O tipo mais simples de seqüê cia é aquele co sisti do de uma
sucessão de observações colocadas em ordem de ocorrê cia,
o de as observações são !!
%% $1.

Co sidere, por exemplo, uma seção através de uma lâmi a delgada


a qual registramos a ocorrê cia de mi erais opacos ou ão.
Nossa a álise dará origem a uma seqüê cia de dois estados
mutuame te exclusivos.

Podemos criar experime talme te seções similares oga do, por


exemplo, uma moeda e registra do a ocorrê cia de caras e
coroas.
/  ë O 
Teste de corridas

Por exemplo, uma sequê cia com 2š te tativas poderia resultar em:

-----------

Nós, i tuitivame te, esperamos, é claro, que cerca de 1š caras


apareçam a seqüê cia. Podemos, i clusive, calcular a
probabilidade de se obter este ou qualquer outro úmero de
caras. Resultados deste tipo de experime to seguem a
distribuição bi omial.

Um aspecto que ão co sideramos até agora, co tudo, é a ordem a


qual ocorrem as caras e coroas.
/  ë O 
Teste de corridas

Co sideraríamos a seqüê cia do tipo

-----------

como se do muito estra a, embora a probabilidade do úmero de


caras ão te a mudado. Ôgualme te estra a seria a alter â cia
regular de caras e coroas:

-----------
O que parece estra o as duas sequê cias ão é a proporção de caras e
coroas, mas a ordem a qual elas ocorrem. No experime to, ós
supomos que as caras e coroas ocorrerão aleatoriame te. Nestes
dois exemplos acima existe um claro padrão de regularidade.
/  ë O 
Teste de corridas

Podemos testar seqüê cias deste tipo para verificar se a ordem de


ocorrê cia dos dois estados é aleatória ou ão. O teste é baseado
o exame do úmero de  . Co   são defi idas como
uma seqüê cia ão i terrompida de um mesmo estado.

A primeira seqüê cia observada teria as segui tes corridas:

-----------
23456789   2 3
/  ë O 
Teste de corridas

Nós podemos calcular a probabilidade de que uma dada sequê cia de


corridas foi criada pela ocorrê cia aleatória de dois estados. Ôsto
é feito e umera do-se todas as possíveis ma eiras de se arra ar
1 ite s do tipo 1 e 2 ite s do tipo 2. O úmero total de corridas
uma seqüê cia é camado de U. Tabelas de valores críticos de
U, para especificados valores de 1 e 2, são dispo íveis.
Co tudo, se 1 e 2 excedem 1š, a distribuição U pode ser
aproximada pela distribuição ormal e podemos usar a tabela Z.
/  ë O 
Teste de corridas

O úmero médio esperado de corridas uma seqüê cia gerada


aleatoriame te com 1 ite s do estado 1 e 2 ite s do estado 2 é:
_
U = [(2 . 1 . 2)/( 1 + 2)] + 1

A variâ cia esperada o úmero médio de corridas será:


2 212 212 ë 1 ë 3

 
1  2 2 1  2 ë1
Com estas equações podemos determi ar o úmero médio de
corridas e o erro padrão o úmero médio de corridas, em todos os
arra os possíveis de 1 e 2 ite s.
/  ë O 
Teste de corridas

A estatística Z para verificar se 1 ite s do tipo 1 e 2 do tipo 2 estão


distribuídos aleatoriame te uma sequê cia é dada por:

¢ ¢


¢

Reco ecemos, logo, que este é o formato da estatística z usada


a teriorme te.
/  ë O 
Teste de corridas

A ipótese ula que estabelece a ão difere ça e tre o úmero de


corridas observado e o úmero médio esperado uma seqüê cia
aleatória é:
_
H š: U = U
a alter ativa _
H1: U ó U

Usa do um ível de sig ificâ cia = 5%, temos os valores críticos


de + 1.96 e ± 1.96. Vamos, agora, testar para as seqüê cias vistas.
/  ë O 
Teste de corridas

As seqüê cias têm 1 = 11 ite s e 2 = 9. Porta to,

2.11.9
¢ Ë 1  1š.9
11 Ë 9


2

2.11.9 2.11.9 11 9
 4.6
¢
9 Ë 11 2 9 Ë 11 1
/  ë O 
Teste de corridas

Para a primeira seqüê cia temos U = 13 e a estatística z será:


¢ ë ¢ 13 ë 1š.9
   1.š

¢ 2.1

Como z é me or que o valor crítico aceitamos Hš. Para as outras


duas sequê cias teremos:
2 ë 1š.9 19ë1š.9
 ë 4.2 e   3.9
2.1 2.1

em ambos os casos reeitamos a ipótese ula.


/  ë O 
Sequê cias de Markov

"# !p:1&

Em muitas pesquisas geológicas, seqüê cias de dados podem ser geradas


co stitui do de sucessões orde adas de estados mutuame te exclusivos.
Com exemplo, poderíamos co siderar uma seção tra sversal através de uma
lâmi a delgada com a ide tificação sucessiva dos mi erais.

Seções estratigráficas medidas também possuem a forma de seqüê cias de


litologias. Observações ao lo go de um perfil podem ser feitas em i tervalos
regulares ou toda vez que ouver muda ça de litologia (estado). No primeiro
caso, esperamos observar seqüê cias repetidas de um mesmo estado. No
segu do caso seqüê cias repetidas ão podem ocorrer, pois as observações
são feitas o de as muda ças ocorrem.
/  ë O 
Sequê cias de Markov

"# !p:1&

Em algu s problemas estamos muito mais i teressados a atureza de tra sições


de um estado para outro, do que a posição relativa dos estados a seqüê cia.
Podemos, este caso, empregar téc icas que sacrificam toda i formação
sobre posição das observações a seqüê cia, mas for ecem, por outro lado,
i formação sobre a te dê cia de um estado seguir outro.

Os dados a seguir represe tam uma seção estratigráfica os quais as rocas


sedime tares foram classificadas um i tervalo de 1 m. As litologias i cluem
quatro estados mutuame te exclusivos: are ito (A), calcário (B), folelo (C)
e carvão (D).
/  ë O 
Sequê cias de Markov
/  ë O 
Sequê cias de Markov

Uma matriz 4 x 4 poderia ser co struída mostra do o úmero de


vezes que uma roca é sucedida por outra. Uma matriz deste
tipo é camada de %;!"<# ! /(

A seção estratigráfica medida tem 62 observações e terá, porta to,


( -1) = 61 tra sições.

A matriz é lida das li as para as colu as sig ifica do, por
exemplo, que as tra sições dos estado A para o estado C
e trarão a matriz como eleme to a1,3.
/  ë O 
Sequê cias de Markov

Matriz de frequê cia de tra sições:

para
A B C D total
A 17 š 5 š 22
de B š 5 2 š 7
C 5 2 17 3 27
D š š 3 2 5
total 22 7 27 5 61

Porta to, observa do os dados vemos que existem 5 tra sições


i dica do muda ça do estado A para o estado C.
/  ë O 
Sequê cias de Markov

A matriz de freqüê cia de tra sições é uma ma eira co cisa de


expressar a i cidê cia de um estado se seguir a outro. Observe
que os totais as li as e colu as são os mesmos, desde que a
seção comece e termi e com o mesmo estado. Observe,
também, que esta matriz ão é simétrica.

A te dê cia de um estado suceder um outro pode ser e fatizada, a


matriz, co verte do as freqüê cias para frações decimais ou
perce tage s.
/  ë O 
Sequê cias de Markov

Se cada eleme to a 
 li a for dividido pelo total desta li a, o
resultado i dicará o úmero relativo de vezes que o estado é
seguido de outros estados.

Num se tido probabilístico, estas são estimativas da probabilidade


co dicio al, p ( l ), isto é, a probabilidade de que o estado 
será o próximo a ocorrer, dado que o estado prese te é .
/  ë O 
Sequê cias de Markov

Assim, temos:
para
A B C D total
A š,77 š š,23 š 1,šš
de B š š,71 š,29 š 1,šš
C š,19 š,š7 š,63 š,11 1,šš
D š š š,6š š,4š 1,šš

Que uma matriz de probabilidades de tra sições.


/  ë O 
Sequê cias de Markov

Aqui, por exemplo, vemos que se estamos o estado C um dado


po to, a probabilidade é de 63% de que o próximo estado sea
também C. A probabilidade é de 19% de que o próximo sea A,
7% que sea B e 11% que sea D. Como os quatro estados são
mutuame te exclusivos e são as ú icas opções (mutuame te
exaustivos), a litologia deve ser umas das quatro e a soma das
li as é de 1,šš ou 1šš%. Esta seria uma %; !
!! !  /(.
/  ë O 
Sequê cias de Markov

Se ós dividirmos o total de cada li a da matriz de frequê cia de


tra sições, pelo úmero total de tra sições observado a
seqüê cia, obtemos as proporções relativas das quatro litologias
prese tes a seção. Esta operação gera o 1!
!!% $:

A š,37
B š,11
C š,44
D š,š
Este vetor mede a probabilidade de se ter tra sições associadas com
os 4 estados.
/  ë O 
Sequê cias de Markov

Vimos a teriorme te que para dois eve tos A e B que compartilam


amostras temos:

p (A } B) = p (B Ň A) x p (A)
Ou,
p (B Ň A) = p (A } B) / p (A)

Assim, a probabilidade de que o estado B seguirá o estado A é a


probabilidade co dicio al de ambos ocorram dividido pela
probabilidade de que o estado A ocorra.
/  ë O 
Sequê cias de Markov

Co tudo, se os estados ocorrem i depe de teme te u s dos outros


a seqüê cia teremos que:

p (A } B) = p (A) . p (B)
e porta to:
p (B Ň A) = p (A) . p (B) / p (A) = p (B)
/  ë O 
Sequê cias de Markov

Podemos co cluir que a probabilidade de que o estado B seguirá o


estado A é simplesme te a probabilidade de que o estado B
ocorra a seção. Este valor é dado pelo eleme to apropriado o
1!!!$, visto a teriorme te.

Se as ocorrê cias de todos os estados a seção são i depe de tes, a


mesma relação é válida para todas as possíveis tra sições,
e tão:

p (B Ň A) = p (B Ň B) = p (B Ň C) = p (B Ň D) = p (B)
/  ë O 
Sequê cias de Markov

Ôsto os permite prever como deveria ser a matriz de probabilidades


de tra sições, caso a ocorrê cia de um estado litológico um
dado, po to da seqüê cia, for completame te i depe de te da
litologia que imediatame te o a tecede.
/  ë O 
Sequê cias de Markov

Assim, podemos co struir uma %;!!!!


 /(! que terá a forma:

para

A B C D total
A š,37 š,11 š,44 š,š 1,šš
de B š,37 š,11 š,44 š,š 1,šš
C š,37 š,11 š,44 š,š 1,šš
D š,37 š,11 š,44 š,š 1,šš
Esta é a matriz de probabilidade de tra sições que esperaríamos
observar se todos os estados fossem i depe de tes u s dos
outros.
/  ë O 
Sequê cias de Markov

Nós poderíamos comparar a %;!!!!


 /(! com a %;!!!!
 /(1! para a seqüê cia e testar a ipótese de
que os estados são i depe de tes daqueles que imediatame te
os precedem.

Para efetuar o teste, primeiro co vertemos a %;!


!!! /(! uma %;!
"# ! /(!Ôsto é feito multiplica do
cada eleme to da matriz esperada pelo total de tra sições
correspo de te.
/  ë O 
Sequê cias de Markov

Assim temos:
para
A B C D total
A š,37 š,11 š,44 š,š 1,šš x 22
de B š,37 š,11 š,44 š,š 1,šš x7
C š,37 š,11 š,44 š,š 1,šš x 27
D š,37 š,11 š,44 š,š 1,šš x5

Opera do teremos a %;!"# ! /(!


/  ë O 
Sequê cias de Markov

Assim temos:
para
A B C D
A ,1 2,4 9,7 1,
de B 2,6 š, 3,1 š,6
C 1š,š 3,š 11,9 2,2
D 1,9 š,6 2,2 š,4

Que é a %;!"# ! /(!


/  ë O 
Sequê cias de Markov

A comparação e tre as duas matrizes é feita com o auxílio de um


teste `2. A distribuição `2 é também baseada em propriedades da
distribuição ormal.

Uma curva `2 típica é mostrada abaixo. Observe que, como o caso


da distribuição F, os valores a distribuição `2 vão de š a
i fi ito ão te do valores egativos. Os testes serão sempre
realizados a extremidade superior da curva.
/  ë O 
Sequê cias de Markov

No problema estamos testa do a ipótese:

Hš: as litologias (estados) são i depe de tes umas das outras a


seqüê cia.

Co tra a alter ativa:

H1: existe a te dê cia de uma litologia ser seguida de outra.


/  ë O 
Sequê cias de Markov

A estatística `2 é dada por:

` †2  ë÷
2

O de cada eleme to da matriz de frequê cia de tra sições


co stitui uma categoria com um valor observado (O) e um valor
esperado (E) ( de tra sições).
/  ë O 
Sequê cias de Markov

Este teste tem (m-1)2 graus de liberdade, o de m é o úmero de


estados a seqüê cia. O teste dema da que cada categoria te a
um valor esperado de pelo me os 5 tra sições. Este ão é o caso
o exemplo, porém ão impede sua fi alização.

Categorias com valor esperado me or do que 5 devem ser


combi adas até que ati am o limite. Podemos, assim, combi ar
as categorias correspo de tes à li a B e à li a D, em duas
outras categorias com valor acima de 5. A quatro resta tes (duas
de A e duas de C) uma categoria com valor acima do limite
defi ido.
/  ë O 
Sequê cias de Markov

Assim, temos:
2 
17ë ,1 5 ë 1š,š
2
Ë Ë
5 ë 9,7 Ë 17ë11,9
2 2 2

,1 1š,š 9,7 11,9

7 ë 7 2 Ë 5 ë 5 2 Ë 5 ë 9, 2
 2š
7 5 9,

O valor crítico de 2 para 9 graus de liberdade ( = (4 ± 1)2) e um


ível de sig ificâ cia, , de 5% é igual a 16,92.
/  ë O 
Sequê cias de Markov

O valor obtido para `2 é maior que o valor crítico e, porta to,


caímos a área de reeição da ipótese Hš. Assim, co cluímos
que a ipótese de i depe dê cia e tre os estados está i correta.
Existe uma te dê cia estatisticame te sig ifica te de certos
estados serem seguidos prefere cialme te de outros.

Uma seqüê cia a qual um estado, em dado po to, é parcialme te


depe de te , o se tido probabilístico, de um estado precede te
é camada de  !p:1. Uma seqüê cia que possui
a propriedade de Markov é i termediária e tre seqüê cias
determi ísticas e seqüê cias completame te aleatórias.
/  ë O 
Mí imos quadrados e regressão

p+ p[,+= ,,.

Em muitos tipos de problemas, ós estamos i teressados ão


some te as muda ças ao lo go de uma seqüê cia mas,
também, em o de estas muda ças ocorrem. Para exami ar estes
problemas, ós precisamos ter um co u to de medidas de uma
variável e precisamos co ecer os locais dos po tos de medidas.
Ta to a variável como a escala ao lo go da sequê cia devem
estar possuir mag itude (escalas de razão ou i tervalo).
/  ë O 
Mí imos quadrados e regressão

p+ p[,+= ,,.

Na maioria dos problemas ós estamos i teressados a te dê cia


geral dos dados. Esta te dê cia pode ser usada para i terpolar
e tre po tos, extrapolar além da seqüê cia de dados, i ferir a
prese ça de te dê cias ou estimar outras características de
i teresse do geólogo.

Se certas características são observadas as populações amostradas,


testes estatísticos camados de  '!0 podem ser
efetuados.
/  ë O 
Mí imos quadrados e regressão
/  ë O 
Mí imos quadrados e regressão

Os valores aprese tados a tabela represe tam medidas de umidade


efetuadas em amostras retiradas em i tervalos regulares de
profu didade.

O valor de 47,75 i dicado a figura represe ta a umidade média o


co u to de dados. Este valor é um ú ico úmero em tor o do
qual existe a me or variâ cia.

Vimos a teriorme te que a média é um estimador eficie te e ão


te de cioso da média da população. É claro, que o osso
problema a média ão represe ta adequadame te os dados.
/  ë O 
Mí imos quadrados e regressão
/  ë O 
Mí imos quadrados e regressão

Ôsto ocorre porque os dados foram obtidos seqüe cialme te e,


porta to, ão são i depe de tes. Ao co trario de uma
estimativa po tual (tipo média) precisamos de uma fu ção que
expresse a relação e tre umidade e profu didade, através da
faixa de variação de ambas as variáveis.

É i tuitivame te razoável co struir uma li a de tal modo que os


desvios medidos a partir dela seam mi imizados de alguma
ma eira.
/  ë O 
Mí imos quadrados e regressão

Uma escola poderia ser a de mi imizar a soma dos desvios


quadrados a partir da li a, usa do uma a alogia com a média
(lembre que a média é o valor em tor o do qual a variâ cia, isto
é a soma dos desvios quadrados, é me or). Poderíamos,
porta to, co struir uma li a em tor o da qual a variâ cia seria
mí ima.

Se o valor de tal li a for subtraído dos valores origi ais, os


po tos apropriados, aprese tarão média zero e variâ cia me or
que qualquer outro co u to de desvios, produzidos por outra
li a traçada através dos dados.
/  ë O 
Mí imos quadrados e regressão

Existem, co tudo, várias ma eiras de se defi ir e medir os desvios


(ver tra sparê cias).

Se mi imizamos os desvios o co teúdo de umidade a partir da


li a austada, estamos dize do que a li a resulta te é o
melor estimador de umidade para profu didades especificadas.
No caso co trário, se mi imizamos desvios em profu didade,
estaremos estima do profu didade a partir do co teúdo de
umidade.
/  ë O 
Mí imos quadrados e regressão
/  ë O 
Mí imos quadrados e regressão

No problema em a álise as profu didades são co ecidas (variável


fixa) e o co teúdo de umidade é a variável aleatória. Porta to,
as i certezas estão associadas com estimativas de umidade e
devemos mi imizar os desvios com relação a esta variável.
Deste modo, o co teúdo de umidade Y é a variável aleatório e X
é a variável fixa. O problema será, porta to, prever Y a partir de
X. Y é camada de 1'1! ! !! e X a
1'1 ! ! 
/  ë O 
Mí imos quadrados e regressão

A fu ção mais simples que podemos passar pelos po tos é a reta


que tem a equação:
·    š Ë 1 

O de  é a i terseção e  é a i cli ação. Os valores de yi capéu


são os valores estimados de · para valores especificados de 

Os desvios que estamos co sidera do são:

·  ë · 
e o problema passa a ser o de e co trar um método de calcular a
reta de modo que: 2
 ·

 1  ·  ë ëo
/  ë O 
Mí imos quadrados e regressão

Os valores de bš e b1 são obtidos resolve do o sistema camado de


"/( %aprese tado abaixo:

{ † 1 † 1
 
 1
·   š   

†  ·   š † 1  1 † 1
   2
 1  
/  ë O 
Mí imos quadrados e regressão

O de:




 1  

· ë 1

 

· /
 1 

ë 
1 2
 2 
  1   1 
/

† †
 
 1
·  1 
š  ë 1   ë 1 
 
/  ë O 
Mí imos quadrados e regressão

As duas equações ormais podem ser escritas em forma matricial


como:


†  .     † 
š

†  †     †  
2
1

Para o problema em a álise teremos:


14š  š  3 2 
14š 35šš.   3 7š
   1  

Resolve do temos bš = 94,67 e b1 = -2,6 .


/  ë O 
Mí imos quadrados e regressão

Podemos usar a reta obtida para estimarmos valores de umidade em


várias profu didades. Os valores estimados ·  os locais de
amostragem for ecem uma medida de quão bem a reta de
mí imos quadrados se austa aos dados origi ais.

Se a reta passasse exatame te sobre cada po to amostrado a soma


dos desvios seria zero. O que ão é o caso em pauta.
/  ë O 
Mí imos quadrados e regressão

Podemos defi ir 3 termos que expressam variação da variável


depe de te. O primeiro é medido pela %!
"!! (SST) de Y:

››  †  1 ·
 2
ë

†

 1
·
2



/  ë O 
Mí imos quadrados e regressão

O segu do termo é a %!"!!!1!>0


(SSR):

››   †  1 ·
 2
ë

†

 1
· 
2



/  ë O 
Mí imos quadrados e regressão

O terceiro é a %!"!!!1!!1 (SSE):

SSE = SST ± SSR


Ou:
2
››    1 · 

·
A "!!!* da reta pode ser obtida pelo í dice:

R2 = SSR / SST
Ou pelo  !/0%? R = (R)1/2.
/  ë O 
Mí imos quadrados e regressão

A adequação do auste da reta aos dados pode ser avaliada com o


apoio da téc ica de a álise de variâ cia. No caso estaremos
testa do a ipótese:

Hš: ȕ1 = š (a regressão ão é sig ifica te)

Co tra a alter ativa:

H1: ȕ1  š (a regressão é sig ifica te)


/  ë O 
Mí imos quadrados e regressão

A tabela ANOVA para realizar o teste é dada por:


ö           ö

    

       

     


 
 
/  ë O 
Mí imos quadrados e regressão

Para o problema em pauta SSR = 7546, , o SSE = 1962,62 e SST =


95š9,5š. Os graus de liberdade correspo de tes serão,
respectivame te 1, - 2 = 6 e - 1 = 7.

Teremos, assim, MSR = 7546, e MSE = 327,1. O teste F será,


porta to, MSR/ MSE = 23,š7. O valor crítico para Į = 5%, Ȟ1 = 1
e Ȟ2 = 6 é Fc = 5,99.

O valor de teste ultrapassa o valor crítico e reeitamos Hš. Existe,


porta to, uma relação sig ifica te e tre umidade e profu didade
represe tada pela reta austada aos dados.
/  ë O 
Mí imos quadrados e regressão

Como vimos o exemplo o auste li ear aos dados é releva te.


Co tudo, embora a te dê cia li ear sea estatisticame te
sig ifica te, o gráfico dos dados sugere a possibilidade de
melor auste.

Os desvios observados ao austarmos uma reta aos dados têm duas


orige s: uma delas está associada à variação existe te a
população que for eceu os dados outra à adequação da fu ção
austada aos po tos.
/  ë O 
Mí imos quadrados e regressão

Para podermos avaliar adequadame te a origem dos desvios é ecessário termos


outras amostras de dados. Supo a que a cerca de 1š m efetuamos outro
co u to de medidas de umidade em difere tes profu didades:
'   + , -  + 
./01233 
4
 ,
353 26753
853 9:53
2353 8353
2853 6/53
/353 /953
/853 /653
6353 /353
6853 2953
/  ë O 
Mí imos quadrados e regressão

Com esta ova amostra possuímos um co u to de réplicas para


ossos valores de · permiti do uma estimativa de variâ cia da
população. Poderemos, e tão, determi ar se a ão muito precisa
correlação li ear, e tre o co teúdo de umidade e profu didade,
é devido à variação a população ou à i adequação da fu ção
usada.
/  ë O 
Mí imos quadrados e regressão

Calcularemos SST, SSR e SSE exatame te da mesma ma eira como


á vimos. Como agora possuímos um co u to de réplicas
podemos calcular a % ! "!! !1! >  !
*, SSLF, e a % ! "!! !1! > 1/0 
/0 (erro puro), SSPE.
O de,
SSE = SSLF + SSPE
Se do,
››   1 / 2 1 ·  ,1
 2
·  ,2

O valor de SSLF é obtido por difere ça.


/  ë O 
Mí imos quadrados e regressão

A tabela de a álise de variâ cia para o problema terá o formato:


+@&,0 %%)
------------------------------------------------------------------------------------------------------
Fo te da Soma dos Graus de Quadrados Teste
Variação Quadrados Liberdade Médios F
-------------------------------------------------------------------------------------------------------
Regr. Li ear SSR 1 MSR F1 = MSR/MSE

Desvio SSE -2 MSE


-------------------------------------------------------------------------------------------------------
Falta de auste SSLF ( -2) - k MSLF F2 = MSLF/MSPE

Erro puro SSPE k MSPE


--------------------------------------------------------------------------------------------------------
Variação
Total SST -1
--------------------------------------------------------------------------------------------------------
/  ë O 
Mí imos quadrados e regressão

O de:
= úmero total de observações (furo 1) =
= úmero total de observações (observações do furo 1 +
observações do furo2) =16
k = úmero de observações do furo 1com réplicas ( o caso
todas têm réplicas, porta to k= )
F1 = MSR/MSE = teste para a qualidade do auste (some te
dados do furo 1)
F2 = MSLF/MSPE = teste para a adequação da fu ção (reta) ao
co u to de dados (dados do furo 1 e furo 2)
/  ë O 
Mí imos quadrados e regressão

Além da qualidade do auste é possível testar, agora, a adequação da


fu ção. O teste para verificar se a fu ção utilizada para austar
os dados ( o caso uma reta) é adequada é dado por:
F2 = MSLF / MSPE
A ipótese se do testada é:
Hš: o modelo (fu ção) é adequado
e a alter ativa:
H1: o modelo ão é adequado
/  ë O 
Mí imos quadrados e regressão

Se o teste cair de tro da região crítica reeitamos Hš e podemos


co cluir que o modelo ão é adequado para o auste dos dados.
A região crítica a curva F será determi ada a partir de um ivel de
sig ificâ cia Į estabelecido e os graus de liberdade do
umerador e de omi ador, i dicados a tabela ANOVA.

Para os dados do problema em a álise, se calculado F2 , veremos


que Hš será reeitada. Ôsto é, a reta ão é a melor fu ção para
se austar aos dados.