Você está na página 1de 50

ANLISE E TRATAMENTO

DE DADOS EXPERIMENTAIS




M. N. Berberan e Santos
Laboratrio de Qumica-Fsica









2013

Anlise e Tratamento de Dados Experimentais

1








A experincia a nica fonte de verdade: s ela nos pode ensinar
alguma coisa, s ela nos pode dar a certeza.

Henri Poincar (1854-1912)



uma boa regra no confiar demasiado nos resultados
experimentais que nos so apresentados, at que estes sejam
confirmados pela teoria.

Arthur S. Eddington (1882-1944)

Anlise e Tratamento de Dados Experimentais

2

ERROS E INTERVALOS DE INCERTEZA

1. Definies

Consideremos a determinao experimental quantitativa (ou medio) de uma dada
grandeza X, com valor numrico x
e
*. Suporemos que a medio poder, caso se queira, ser
repetida um nmero muito grande de vezes, e sempre essencialmente nas mesmas condies.
S neste caso far sentido a anlise estatstica do problema **.
Em cada medio, o valor experimental (medida) x
i
(i=1, 2,...) diferir em geral do
valor exacto x
e
, que por hiptese desconhecido. Alm disso, os valores obtidos em medies
sucessivas no sero tambm, em geral, todos iguais (Figura 1).
Figura 1 - Representao da frequncia de ocorrncias de um valor x aps quatro
medies. Quando o valor extrado de um intervalo contnuo, a
probabilidade de duas medidas coincidirem desprezvel.

O erro associado a cada medida simplesmente a diferena entre os valores exacto e
medido
Ax
i
=

x
e
- x
i
(i=1, 2, ...) (1)

A preciso do mtodo experimental ser boa se os erros tiverem valores bastante
prximos nas vrias determinaes, i.e., se a sua funo de distribuio estiver concentrada
em torno de um dado valor, ainda que distinto de x
e
(Figura 2). A exactido do mtodo
experimental depende da assimetria de distribuio em relao a x
e
(Figura 2). Assim, a
distribuio do mtodo b (na Figura 2) implica uma exactido inferior do mtodo a, j que

*
Em determinadas experincias, a grandeza X uma varivel aleatria, pretendendo-se nesse caso determinar a
sua funo de distribuio. Tal assunto no ser aqui desenvolvido.

**
Isto numa perspectiva frequencista.

Anlise e Tratamento de Dados Experimentais

3
leva a valores de x que esto sistematicamente subestimados, isto , que tm valores
inferiores a x
e
.


Figura 2 - Duas funes de distribuio de erros correspondentes a mtodos experimentais distintos
para a determinao da mesma grandeza. A preciso de b superior de a, mas a sua
exactido inferior.

A exactido de um mtodo, ao contrrio da preciso, no determinvel pela anlise de
um conjunto de medidas, e exige a comparao com o resultado de mtodos bem
estabelecidos (i.e, de exactido muito elevada) ou a utilizao de padres, i.e., de amostras
cujo valor x
e
conhecido. O erro sistemtico pode ter vrias causas: defeitos e limitaes da
aparelhagem de medida (erros instrumentais); erros no processo de medio, como os de
leitura, calibrao e contaminao de amostras (erros operacionais); erros devidos ao
emprego de relaes matemticas aproximadas (erros de mtodo); e ainda erros devido a
valores numricos de constantes que se afastam dos valores correctos (erros iniciais).
Podemos dizer que a noo de exactido est directamente relacionada com o momento
de 1 ordem* da funo de distribuio f(Ax), que o seu valor mdio: quanto mais este se
afastar de zero, maior o erro sistemtico, i.e., menor a exactido do mtodo. Por sua vez, a
noo de preciso est directamente relacionada com o momento (centrado) de 2 ordem da
funo de distribuio f(Ax), que a sua varincia (ou a raz quadrada desta, que o desvio
padro): quanto mais espraiada for f(Ax), maior ser o seu desvio padro e portanto menor a
preciso do mtodo. Um exemplo bidimensional permite esclarecer melhor estes aspectos: a
qualidade de um atirador pode ser julgada pela forma como os seus disparos se dispem num
alvo, quando se lhe fornece uma arma que este no conhece. O que conta a disperso dos

*
Recordemos que o momento de ordem n de uma distribuio se define por < x
n n
x > =

}
f x dx ( ) , e, no
caso de ser centrado, por <(x-)
n
> em que o valor mdio, =<x>.


Anlise e Tratamento de Dados Experimentais

4
impactos, e no a sua posio absoluta em relao mouche. Com efeito, os impactos podem
concentrar-se todos numa regio bastante afastada do centro do alvo, e ainda assim o atirador
ser excelente. Nesse caso, a mira da arma ter um desvio sistemtico. Como o atirador o
desconhece, no tenta corrigi-lo, e o conjunto homem-arma apresenta um desvio sistemtico
tambm. O tiro pode assim ser pouco exacto mas preciso.
Em geral, a funo de distribuio f(Ax) no fica definida se apenas indicarmos o valor
mdio e o desvio padro. Excepo a distribuio normal, como veremos adiante. Com
efeito, para especificarmos f(Ax) necessitamos de todos os seus momentos, em nmero
infinito*. Assim, a caracterizao completa de um mtodo de medida implica o conhecimento
de f(Ax). Na prtica, e porque esta distribuio muitas vezes gaussiana, ou quase, bastam os
dois primeiros momentos, a mdia e o desvio padro o.
O erro Ax , como vimos, uma varivel aleatria com distribuio f(Ax), e pode ser
escrito como
Ax = s+r (2)

em que s uma constante e r uma varivel aleatria de valor mdio nulo. Distingue-se assim o
erro sistemtico s, com o mesmo valor em todas as determinaes, do erro puramente
aleatrio r, que toma valores positivos e negativos com igual probabilidade. Esta separao
formal sempre possvel, mas na realidade o factor ou factores responsveis por s=0 afectam
frequentemente tambm a distribuio de r, que pode por esse facto ser no gaussiana.
Por mais medies que se efectuem, no h maneira de as usar em conjunto para
eliminar a componente sistemtica. Por outro lado, com a acumulao das determinaes, a
componente aleatria vai perdendo importncia: os valores positivos e negativos tendem a
compensar-se quando tratamos um grande nmero de medies.
A anlise estatstica permite quantificar em certa medida a componente aleatria r do
erro total, mas no a componente sistemtica s. No que se segue supr-se- que s=0. Caso
s=0, os resultados permanecem vlidos, mas o valor exacto x
e
dever ser substitudo por x
e
+s.





*
A transformada de Fourier da funo de distribuio, dita funo caracterstica, dada por
( )
( )
( ) e d
!
0
n
ik
iku n
F k f u u x
n
n

= = <A > }

=

sendo <Ax
n
> o momento de ordem n de f(Ax). A transformada inversa de Fourier d-nos f(Ax) em funo de
F(k)
1
( ) e ( ) d
2
ik x
f x F k k
t

A
A =
}


pelo que o conhecimento dos momentos <Ax
n
> (n = 1, 2, ...) equivalente ao da funo de distribuio f(Ax).


Anlise e Tratamento de Dados Experimentais

5
2. Quantificao da incerteza

O objectivo de uma srie de medies , como se referiu, a determinao de x
e
a partir
das observaes x
1
, x
2
, ..., x
n
. Sendo
x = x
e
+ Ax (3)


e tendo Ax valor mdio nulo por hiptese, vem, tomando mdias,

x
= x
e
(4)

isto , o valor mdio de x coincide com o valor desejado x
e
. Contudo, o valor mdio de x
define-se pela equao

x
x f x =

}
( )dx (5)

e, na prtica, dispe-se de um nmero finito de valores (x
i
). Por este motivo, deixamos de
querer obter o valor exacto x
e
, e passamos a tentar obter ao menos uma estimativa deste.
Como calcular ento aproximadamente o integral da eq. 5 com base nas determinaes?
Uma resposta a seguinte relao


1
1
n
x i
i
x x
n

=
=

(6)

Esta mdia amostral x obtm-se da eq. 5 substituindo a funo de distribuio exacta
f(x) pela funo de distribuio experimental

( ) f x
n
x x
n
i
n
i
( ) =
=
1
1
E o (7)

Tal substituio envolve uma aproximao. Para n elevado, f
n
(x) ser prxima de f(x), e
portanto a aproximao assimptoticamente correcta (em termos estatsticos, diz-se que x
uma estatstica convergente). Mas, e para n pequeno?
necessrio analisar em pormenor a varivel aleatria x dada pela eq. 6. Com efeito,
nada garante a priori que ela seja uma boa aproximao para
x
quando n pequeno, pois
f
n
(x) no nestas condies uma boa aproximao de f(x), e todas as discrepncias entre as
duas funes ver-se-o reflectidas nos respectivos momentos. Uma exigncia razovel a fazer
a x ser que o seu valor mdio seja
x
para qualquer n. Mostra-se que assim , dizendo-se por
isso que x uma estimativa no tendenciosa (ou no enviesada) de
x
. Esta propriedade
assegura alguma similitude entre x e
x
para n pequeno. Fica ainda por saber a funo de

Anlise e Tratamento de Dados Experimentais

6
distribuio de x que, uma vez conhecida, nos permitir estabelecer a incerteza associada
estimativa de
x
que x . O conhecimento desta incerteza importante, pois de outro modo
no saberemos qual a confiana a depositar em x .
A forma da funo de distribuio da varivel aleatria x depende do nmero de
medies n e tambm da funo de distribuio dos erros Ax que, repete-se, se supe ter
mdia nula.
Em muitos casos, uma boa aproximao admitir que f(Ax) uma lei normal (ou de
Gauss):
( ) f x
x
A
A
=
|
\

|
.
|

(
(
1
2
1
2
2
to
o
exp (8)

Trata-se de uma observao experimental que fundamentvel teoricamente pelo
teorema do limite central, que se pode enunciar assim: "a soma de um grande nmero de
variveis aleatrias independentes tem, em condies bastante gerais, uma distribuio
normal, independentemente da forma das distribuies das variveis aleatrias individuais".
Deste modo, e admitindo que o erro aleatrio Ax a composio do resultado de um nmero
elevado de causas independentes, segue-se que a sua distribuio deve ser quase sempre
gaussiana.
Se f(Ax) for realmente dado pela eq. 8, pode demonstrar-se que x tem tambm
distribuio normal, com mdia x
e
e desvio padro o/ n ,

( )
f x
n
x x
n
e
=

|
\

|
.
|

(
(
1
2
1
2
2
t o o /
exp
/
(9)

Note-se que, para n, f( x )o( x -x
e
), i.e., a incerteza torna-se nula. A acumulao de
medies leva a que a distribuio do valor mdio seja cada vez mais estreita, uma vez que o
desvio padro o/ n . Infelizmente, o decrscimo com n lento, pelo que, no planeamento
de uma experincia, h que dispor sobretudo de aparelhagem de preciso elevada, i.e., de
pequeno o, que nos permita obter medidas individuais com pequena incerteza. No obstante,
vrios instrumentos de aquisio automtica de dados tiram partido da variao com 1/ n ,
repetindo e acumulando muitas vezes a medida, como o caso dos espectrmetros de
ressonncia magntica nuclear (n~10
3
) e dos espectrofotmetros de infravermelho por
Transformada de Fourier (n~10
2
). Veremos adiante (eq. 58) que a dependncia fulcral com
1/ n no exclusiva da distribuio normal, sendo antes completamente geral.
A anlise da incerteza associada estimativa experimental x da grandeza X, e cujo
valor exacto x
e
, no estar concluda antes de se ter tambm uma estimativa para o desvio
padro de x , e que o/ n .

Anlise e Tratamento de Dados Experimentais

7
Tal como se fez para o valor mdio, tambm para estimar o se substitui a equao de
definio
( ) ( )
2
2
d x f x x o

=
}
x
(10)
pela relao aproximada
( )
( ) S x x f x
n
2
2
=

}
dx (11)
o que vem a dar

( )
S
n
x x
i
n
i
2
1
2 1
=
=
E
(12)

Esta estatstica continua a ser convergente, i.e., S
2
o
2
quando n. Mas, ao contrrio
de x , tendenciosa: tende a subvalorizar o para n pequeno. Em geral tem-se para o valor
mdio de S
2

o
S
n
2
=
|
\

|
.
|
2
1
1
(13)

pelo que uma estimativa no enviesada a varincia amostral s
2


( )
s
S
n
x x
i
n
i
2
1
2 1
1
=


=
2
1
1
n
E (14)

A diviso por n-1, em vez de n, pode ser entendida como o resultado de os n pontos j
terem sido utilizados para calcular x , e portanto apenas n-1 serem independentes, i.e., apenas
haver n-1 graus de liberdade. Claro que para n relativamente elevado a substituio de n por
n-1 irrelevante, do ponto de vista do resultado numrico. Mostra-se que s
2
obedece
distribuio
( )
( )
| |
( ) ( )
f s
n
n
s
n
s
n
n
n
2
2
1
2
2
2
1
2
1
2
2
1 1
2
1
2
1 1
1
2
=

|
\

|
.
|

(
(


|
\

|
.
|

(
(


/ /
/
exp
/
o
o o
I
(15)

Esta distribuio tem por valor mdio o
2
e por desvio padro ( )
( )
2 1
2
/ n o . Assim, a
funo tende para o(s
2
-o
2
) quando n, pelo que, para n elevado, o erro cometido em
aproximar o
2
por s
2
desprezvel. Para n pequeno, interessa-nos determinar um majorante de
o
2
, pois o objectivo estabelecer a incerteza associada a x .
O valor calculado para s
2
a partir dos dados experimentais pode ser maior, menor, ou at
igual a o
2
(s
2
uma varivel aleatria que obedece distribuio dada pela eq. 15). Mas se o

Anlise e Tratamento de Dados Experimentais

8
multiplicarmos por uma constante c>1, a probabilidade de s
2
ser maior do que o
2
aumenta.
Com efeito, o valor mdio da distribuio de cs
2
agora co
2
, i.e., a distribuio deslocada
para a direita, e tanto mais quanto maior for c. Podemos assim impor

( )
P cs p
2 2
> = o (16)

sendo p um certo valor, e.g., 95%. A relao 16 uma equao em c, i.e, para cada (p, n) h
um valor de c que a satisfaz.
A eq. 16 pode ser posta na forma

( )
P
s
n
n
c
p
2
2
1
1
o /
>

|
\

|
.
|
|
= (17)

Como a varivel aleatria s
2
/[o
2
/(n-1)] segue uma distribuio do qui-quadrado (Figura
3) com n-1 graus de liberdade (compare-se com a eq. 15), ou seja

Figura 3 - Distribuio do qui-quadrado para vrios graus de liberdade.

( ) f u
n
u u
n
n
=

|
\

|
.
|

|
\

|
.
|


1
2
1
2
1
2
1
2
1
2
1
I
exp (18)
com

Anlise e Tratamento de Dados Experimentais

9
u
s
n
=

2
2
1 o / ( )
(19)
a eq. 17 transforma-se em
f u p
n
c
( ) du =

}
1
(20)
A soluo numrica desta equao para vrios valores de p e de n dada na Tabela 1.

Tabela 1 - Constante c pela qual s
2
deve ser multiplicado
para garantir que cs
2
>o
2
com probabilidade p.

p

n

0,90

0,95

0,99

2
3
4
5
63,29
9,48
5,14
3,76
254,45
19,42
8,52
5,62
6369,43
99,50
26,09
13,47
6
7
8
9
3,11
2,72
2,47
2,29
4,37
3,67
3,23
2,93
9,03
6,88
5,65
4,86
10
15
20
30
2,16
1,80
1,63
1,47
2,71
2,13
1,88
1,64
4,31
3,00
2,49
2,03

Como seria de esperar, c decresce com n, e para um mesmo n menor para o menor p.
Vemos que para n pequeno necessrio multiplicar s
2
por valores bastante elevados. Para 4
determinaes, por exemplo, vem c=8,52 para p=95%, ou seja, 8 52 , s=2,92 s um
majorante de o com 95% de probabilidade. Determinado um majorante para o, ficamos com a
funo de distribuio de x definida a menos do seu valor mdio x
e
. Dispomos ainda de uma
estimativa de x
e
, que precisamente o valor numrico x calculado com os resultados
experimentais pela eq. 6. Qual a probabilidade p de este valor no se afastar de x
e
mais do que
um certo valor k?

( ) ( )
P x x k f x x p
e
x k
x k
e
e
s = =
}
-
+
d (21)


Anlise e Tratamento de Dados Experimentais

10
Como a distribuio gaussiana, sabemos que se p for, respectivamente, 90, 95 e 99%,
o valor de k de 1,645o / n , 1,960o/ n e 2,576o/ n . Se, pelo contrrio, escolhermos k
igual a o, 2o, ou 3o vem, respectivamente, p=68,27, 95,45 e 99,73%. Diremos assim, por
exemplo, que x
e
est contido no intervalo x2,58cs/ n com um nvel de confiana no
inferior a 99% (dizemos no inferior pois, como o foi substitudo por um majorante, cs, a
probabilidade real superior a p). Isto est de acordo com a regra emprica dita dos trs
sigmas, segundo a qual o intervalo de valores provveis para uma grandeza aleatria 3o.
Se os erros no tiverem uma distribuio normal, esta regra permite estimar imprecisamente o
intervalo como sendo x3cs/ n .
Note-se que x
e
fixo. o intervalo determinado que aleatrio, variando de srie de
determinaes para srie de determinaes. Poderemos dizer, embora com alguma falta de
rigor, que, para um nvel de confiana de 99%, em cada 100 sries de determinaes, 99
intervalos contero x
e
e apenas um intervalo no conter x
e
.
Note-se agora que a eq. 21 se pode escrever, no caso gaussiano,

( )
P x x k P x x
n
P
x x
n
p
e e
e
s = s
|
\

|
.
|
=

s
|
\

|
.
|
|
= |
o
o
|
/
(22)

em que | um parmetro que depende do nvel de confiana p (toma os valores dados atrs:
1,645 para p=90%, etc.). Se agora substituirmos o por s, desvio padro amostral, fica

P
x x
s n
t p
e

s
|
\

|
.
|
|
=
/
(23)

em que t um parmetro diferente de | para um mesmo nvel de confiana p. Com efeito, a
varivel aleatria ( x x
e
) / (s n / ) j no obedece a uma distribuio normal, pois o
quociente de duas variveis aleatrias ( x x
e
e s n / ). Mostra-se que a funo de
distribuio desta varivel a chamada distribuio de Student, com n-1 graus de liberdade

( )
( )
f u
n
n
n
u
n
n
=
|
\

|
.
|

|
\

|
.
|

+

|
\

|
.
|
|

I
I
2
1
2
1
1
1
2
2
t
/
(24)

Esta funo no difere muito da de Gauss (Figura 4) e tende para esta quando n
elevado (consideram-se equivalentes para n>30).
A eq. 23 pode ser reescrita como

Anlise e Tratamento de Dados Experimentais

11
f u p
t
t
( ) du =

}
(25)

O clculo numrico desta equao, para vrios valores de n e de p fixos, conduz a
valores da constante t (parmetro t de Student) tais que

x x
s n
t
e

s
/
(26)
para um certo nvel de confiana (p) e um certo nmero de graus de liberdade (n-1), conforme
a Tabela 2.
Figura 4 - Distribuio do t de Student.

Note-se que para um nmero infinito de graus de liberdade se recuperam os parmetros
| da distribuio normal.
Assim, o intervalo de confiana para x
e
vem dado por

x ts n / (27)

Verifica-se que este intervalo inferior ao dado pelas eqs. 17 e 21, pelo que lhe deve
ser preferido. Por exemplo, para p=95% e n=5 (4 graus de liberdade), vem, pelo primeiro
mtodo, que c=5,62 (Tabela 1), donde

196 196
5
196
5 62
5
, , ,
, o o
n
s = < (28)





Anlise e Tratamento de Dados Experimentais

12
Tabela 2 - Parmetro t de Student em funo do nmero de graus de liberdade e para vrios
nveis de confiana.



p


n-1

68,27


70


90


95


95,45


99


99,73

1
2
3
4
1,837
1,321
1,197
1,142
1,963
1,386
1,250
1,190
6,314
2,920
2,353
2,132
12,706
4,303
3,182
2,776
13,968
4,527
3,307
2,869
63,657
9,925
5,841
4,604
235,8
19,21
9,219
6,620
5
6
7
8
1,111
1,091
1,077
1,067
1,156
1,134
1,119
1,108
2,015
1,943
1,895
1,860
2,571
2,447
2,365
2,306
2,649
2,517
2,429
2,366
4,032
3,707
3,500
3,335
5,507
4,904
4,530
4,277
9
10
11
12
1,059
1,053
1,048
1,043
1,100
1,093
1,088
1,083
1,833
1,812
1,796
1,782
2,262
2,228
2,201
2,179
2,320
2,284
2,255
2,231
3,250
3,169
3,106
3,055
4,094
3,957
3,850
3,764
13
14
15
16
1,040
1,037
1,035
1,032
1,079
1,076
1,074
1,071
1,771
1,761
1,753
1,746
2,160
2,145
2,132
2,120
2,212
2,195
2,181
2,169
3,012
2,977
2,947
2,921
3,694
3,636
3,586
3,544
17
18
19
20
1,030
1,029
1,027
1,026
1,069
1,067
1,066
1,064
1,740
1,734
1,729
1,725
2,110
2,101
2,093
2,086
2,158
2,149
2,141
2,133
2,898
2,878
2,861
2,845
3,508
3,475
3,447
3,422
21
22
23
24
1,024
1,023
1,022
1,021
1,063
1,061
1,060
1,059
1,721
1,717
1,714
1,711
2,080
2,074
2,069
2,064
2,126
2,120
2,115
2,110
2,831
2,819
2,807
2,797
3,400
3,380
3,361
3,345
25
30

1,020
1,017
1,000
1,058
1,055
1,036
1,708
1,697
1,645
2,060
2,042
1,960
2,105
2,087
2,000
2,787
2,750
2,576
3,330
3,270
3,000

ou seja, o intervalo de variao ser
x s 2 1 , (29)

enquanto que, pelo segundo mtodo, t=2,78, ou seja, o intervalo tem quase metade da
extenso do anterior

Anlise e Tratamento de Dados Experimentais

13

x s 1 3 , (30)

fcil justificar a diferena. No segundo caso, a varivel aleatria, por ser um
quociente, admite valores pequenos de s que so compensados por outros igualmente
pequenos de x-x
e
, ao passo que no primeiro mtodo s deve ser superior a o com
probabilidade prxima de 1. Claro que no segundo mtodo no se analisa a relao entre s e o,
mas no esse o objectivo. Ns no pretendemos realmente estimar o, mas sim o intervalo de
incerteza para x
e
.
Em resumo: a partir de uma srie de n medidas, o valor exacto x
e
estimado como
sendo x ; o intervalo de incerteza determina-se calculando s, que ser multiplicado por t/ n ,
sendo t o parmetro de Student para n-1 graus de liberdade e nvel de confiana p. usual
tomar-se para este o valor de 95%. Convm no entanto reflectir um pouco sobre as
consequncias de tal procedimento. Como j se discutiu, o seu significado o de que em 95%
de um grande nmero de casos o valor de x
e
vai estar contido no intervalo determinado.
Dependendo da situao, este nvel de significncia ser adequado ou inadequado. Ser
necessrio ponderar as consequncias de em 5% dos casos o resultado vir a estar fora do
intervalo obtido.


3. Algarismos significativos

O resultado quantitativo de uma medida sempre um nmero racional (i.e., com um
nmero finito de algarismos). Quando o aparelho tem um mostrador digital e a leitura
estvel, ou quando tem uma escala graduada, no h dificuldade em saber onde parar, i.e.,
com quantos algarismos apresentar o resultado. Admite-se nesses casos que a preciso do
aparelho tal que o valor dado com um erro inferior a metade da menor casa decimal
legvel. Assim, uma balana que indique 5,1030 g ter por majorante do erro 510
-5
g. Ao
escrevermos a massa com quatro casas decimais estamos pois a admitir que o ltimo zero
ainda significativo, i.e., que a massa no 5,1038 g nem 5,1032 g, por exemplo. Ao lermos
a escala, por exemplo, de uma proveta graduada em dcimos de mililitro, e se o volume lido
estiver entre 0,8 ml e 0,9 ml, indicaremos 0,85 0,05 ml.
Em concluso: o fabricante do instrumento, ao dot-lo de uma escala graduada ou de um
mostrador digital, est implicitamente a indicar um majorante do desvio padro, i.e., a
preciso do instrumento. Claro que o erro real pode ser superior, por exemplo se o aparelho
tiver folgas mecnicas ou se estiver descalibrado, se houver perdas de substncia durante o
manuseamento, etc. Em geral, deve prestar-se a maior ateno s indicaes dos fabricantes

Anlise e Tratamento de Dados Experimentais

14
que acompanham o equipamento de medio para que este seja utilizado nas condies de
erro mnimo e sem desvios sistemticos significativos.
A preciso inerente ao valor lido limita necessariamente a preciso associada ao valor
mdio discutida anteriormente. Por exemplo, se medirmos a massa de um objecto repetidas
vezes e obtivermos sempre o mesmo resultado, seja este 5,1030 g, ento a aplicao cega da
eq. 14 d s=0 e portanto uma incerteza nula, o que falso, pois esta de 510
-5
g. A
discrepncia resulta de na deduo da eq. 14 (e das restantes equaes da seco anterior) se
admitir implicitamente que as medidas individuais eram desprovidas de incerteza, i.e., que se
obtinham nmeros perfeitamente definidos (figura 1), quando na realidade se obtm intervalos
de variao. Se substituirmos as funes delta da eq. 7 por distribuies rectangulares*

com
uma largura igual ao dobro da incerteza nas leituras (i.e., x
i
Ax
i
), para o valor mdio vem de
novo a eq. 6, mas para a varincia obtm-se a equao

S S
x
n
i
n
i
2 2
1
2
3
= +
=
o
E
A
(31)

em que S
o
2
corresponde a incerteza nula nos x
i
e dado pela eq. 12. Ora Ax
i
2
3 / so as
varincias das distribuies individuais, como resulta da aplicao da eq. 10 distribuio
rectangular, donde
S S
n
i
n
i
2 2
1
2
= +
=
o
E
o
(32)

No exemplo dado as leituras eram todas idnticas, pelo que S
o
2
=0; por outro lado os o
i

eram todos iguais, donde vem simplesmente, como seria de esperar,

S
2 2
= o (33)

As situaes em que a anlise de erros relevante so precisamente aquelas em que h
variao significativa de valores de medio em medio, e no aquelas em que todas as
medies do praticamente o mesmo resultado. Em tais condies, as incertezas associadas
aos valores experimentais so efectivamente desprezveis face sua disperso, e o nmero de
algarismos significativos do resultado final (a mdia) vem necessariamente inferior ao do das
medidas individuais, i.e., o primeiro termo da eq. 32 muito maior do que o segundo termo.
Como determinar ento o nmero de algarismos significativos do resultado final
(mdia) admitindo que a disperso de valores superior incerteza dos resultados

*
Como apenas sabemos que o valor se situa no interior do intervalo x
i
Ax
i
, devemos empregar uma distribuio
uniforme no interior deste, i.e., f(x
i
)=1/(2Ax
i
), se x
i
e[x
i
-Ax
i
, x
i
+Ax
i,
], e f(x
i
)=0, em caso contrrio.


Anlise e Tratamento de Dados Experimentais

15
individuais? Se aceitarmos a conveno de escrever o resultado na forma da eq. 27, o nmero
de algarismos a reter em x - que nunca poder ser superior ou sequer igual ao das leituras
individuais - depende da preciso associada ao produto ts/ n , isto , sobretudo preciso
com que s determinado.
Pode mostrar-se que o nmero de algarismos significativos de s no ultrapassa dois,
podendo at mesmo ser um*. Contudo, como muitas vezes o resultado utilizado em clculos
posteriores, devem manter-se dois algarismos em s, como forma de evitar erros de
arredondamento. Assim, s
2
deve ser apresentado com trs algarismos significativos. A ltima
casa decimal de x a reter ser pois a mesma que a do ltimo algarismo significativo de
ts/ n .


4. Um exemplo numrico

A razo = c
p
/c
v
foi determinada para o rgon a 21C pelo mtodo da expanso
adiabtica, tendo-se realizado quatro ensaios. Os valores calculados pela equao

( )
( )
=
ln /
ln /
p p
p p
1 2
1 3
(E1)

(em que p
1
a presso inicial, p
2
a presso aps a expanso adiabtica e p
3
a presso final
aps aquecimento isocrico), foram os seguintes:

ensaio 1 2 3 4
1,617 1,677 1,625 1,669

Aplicando a eq. 6, o valor mdio

=1 647 , (E2)

e o desvio padro da medida individual , pela eq. 14,

s=0,030 (E3)
sendo o desvio padro da mdia
s/ n =0,015 (E4)


*
O desvio padro de s
2
, dividido pelo valor mdio, vem (veja-se a eq. 15) 2 1 / ( ) n , donde, para n~10, de
~0,5, i.e., a incerteza metade do valor mdio de s
2
.


Anlise e Tratamento de Dados Experimentais

16
Para um nvel de confiana de 95% e 4-1=3 graus de liberdade, t = 3,182 (Tabela 2),
donde ts/ n =0,048, e assim o resultado final

=1,647 0,048 (E5)
ou seja, o intervalo de incerteza
[1,599; 1,695] (E6)

Como o valor previsto pela teoria de 1,667, podemos dizer que h neste caso
concordncia. Note-se que, sendo calculado a partir dos resultados experimentais pela eq.
E1, de esperar que a sua distribuio no seja estritamente normal, sendo pois o intervalo de
incerteza determinado com alguma aproximao.


5. Influncia dos erros no resultado final

Os resultados das medies so muitas vezes utilizados para calcular grandezas
inacessveis directamente, por substituio em relaes mais ou menos complicadas. Claro
que a incerteza associada aos resultados experimentais se vai reflectir no resultado final.
O clculo da funo de distribuio dos erros do resultado final normalmente muito
difcil, pelo que posto de parte um tratamento analtico to aprofundado como o que se
desenvolveu para a distribuio normal. Embora seja possvel (e mais rigoroso!) recorrer a um
mtodo de simulao (Monte-Carlo) para tal fim, normalmente suficiente um tratamento
contemplando apenas o desvio padro. Assim, queremos saber qual o desvio padro do
resultado final, dados os desvios padro das grandezas medidas que intervm na relao a
utilizar.
Admitamos que a grandeza que pretendemos calcular funo de n variveis x
1
, x
2
,.., x
n

y=F(x
1
, x
2
, ..., x
n
) (34)

O valor calculado y vai em geral diferir do valor exacto y
e
pelo facto de os valores das
variveis no serem os exactos x
1e
, x
2e
, ..., x
ne
. Se a diferena y-y
e
no for muito elevada,
podemos desenvolver y em srie em torno de y
e
, e manter apenas os termos lineares

-
1
ie
n
e
i
i
x
i ie
F
y y x x
x
c
c
| |
|
| |
| ~ |
\ .
| =
\ .

E
(35)

O desvio padro de y dado por (veja-se a eq. 10)


Anlise e Tratamento de Dados Experimentais

17
( ) ( ) o
y e n n
y y f x x x
2
2
1 2 1 2
=

} } }
... , ,..., ... dx dx dx (36)

sendo ( ) f x x
n 1 2
, ,..., x a funo de distribuio conjunta destas n variveis.
A substituio da eq. 35 na eq. 36 d

2 2

1 1
ie
je
n n
y ij
i j
i j
x
x
F F
x x
c c
o o
c c
| |
| |
|
|
|
| ~
|
| = =
|
\ .
\ .
E E
(37)
em que

o
ij i ie j je n n
x x x x x x
2
1 2 1 2
=

} } }
... ( )( ) ( , ,..., ) ... f x dx dx dx (38)

Para i=j, esta ltima relao reduz-se a o
i
2
, varincia da varivel x
i
; para i=j, o
ij
2
dita a
covarincia das variveis x
i
e x
j
, e uma medida da sua correlao. De facto, quando as
variveis x
i
e x
j
so independentes

( )
f x f x x x
i j n i j n 1 2 1 2
, ,..., , ,..., ( ) ( ) ( , ,..., ) x x x x f f x x = (39)

seguindo-se da eq. 38 que
o
ij
2
=0 (40)

(Claro que pode suceder que o
ij
2
=0 sem as variveis serem independentes. Isto ser contudo
fortuito). Se todas as variveis so independentes

( ) f x x f x f x f x
n n 1 2 1 2
, ,..., ( ) ( )... ( ) x = (41)
e tem-se
o
ij
2
=0 (i=j) (42)
e portanto a eq. 37 fica
2
2 2

1
ie
n
y i
i
i
x
F
x
c
o o
c
| |
|
|
| =
\ .
=
E
(43)

Na prtica, as derivadas so calculadas no no valor exacto, desconhecido, mas no valor
mdio experimental. Tambm as varincias das variveis x
i
so normalmente substitudas
pelos valores amostrais, pelo que as eqs. 37 e 43 ficam, respectivamente,


Anlise e Tratamento de Dados Experimentais

18
s
F
x
F
x
s
y
i
n
j
n
i j
x j
ij
x
i
2
1 1
2
=
= =
|
\

|
.
|
|
|
\

|
.
|
|
E E

c
c
c
c
(44)

2 2

1
x
i
n
y i
i
i
F
s s
x
c
c
| |
|
|
| =
\ .
=
E
(45)

contudo frequente encontrar a notao dos sigmas para os resultados experimentais.
Em Anlise Numrica usual apresentar-se a chamada frmula fundamental de
propagao dos erros

1
n
i
i
i
F
y x
x
c
c
=
A = A
E
(46)

Esta frmula d intervalos de incerteza significativamente maiores do que a eq. 37.
Porqu? A resposta est no significado de Ay e Ax
i
nesta equao. Estes so, com efeito, as
semi-larguras dos intervalos de variao das respectivas grandezas, e no os desvios padro
respectivos. Mesmo que as grandezas x
i
tenham uma distribuio rectangular e portanto seja,
como vimos,
o
i
i
x
=
A
3
(47)
no se segue que
o
y
y
=
A
3
(48)

pois a distribuio de y j no ser em geral rectangular, e o seu desvio padro vir inferior ao
dado pela eq. 48. Podemos assim escrever

o
c
c
o
y
i
n
i
i
F
x
x
ie
s
=
E
1
(49)

relao que se pode obter da eq. 37 por aplicao da desigualdade de Cauchy-Schwarz

o o o
ij
i j
2
s (50)

A eq. 49 til pois fornece um majorante de o
y
, e deve ser utilizada em substituio da
eq. 37 quando as covarincias o
ij
forem desconhecidas mas houver indcios de poderem ser

Anlise e Tratamento de Dados Experimentais

19
no nulas. S quando houver a certeza de todas as covarincias serem zero adequado
empregar a eq. 43.

Sejam agora alguns casos particulares de aplicao das relaes 37, 43 e 49.

(i) Relao linear y=ax+b
o o
y x
a
2 2 2
= (51)
ou
o o
y
x
a = (52)

(ii) Relao inversa y=a/x
o o o
y
x
x x
a
x
a
x
2
2
2
2
4
2
=
|
\

|
.
|
=
2
(53)

o
o
y
x
a
x
=
2
(54)
(iii) Relao logartmica y=ln x
o o
o
y
x
x
x
x
x
2
2
2
2
2
1
=
|
\

|
.
|
= (55)

o
o
y
x
x
= (56)

(iv) Soma de n variveis independentes y=Ea
i
x
i

o o
y i i
i
n
a =
=
2 2
1
(57)

Note-se que, como a mdia x (definida na seco 2) precisamente a soma de n
variveis independentes com o mesmo desvio padro o, vem

o
o o
x
i
n
n n
= =
=
2
2
1
(58)

que o resultado j obtido para a distribuio normal, mas que se v ser mais geral, como
ento se referiu. Note-se ainda que a aplicao da eq. 49 a este caso d o
x
so, podendo pois o
majorar muito largamente o verdadeiro valor da incerteza de x .

Anlise e Tratamento de Dados Experimentais

20

(v) Soma de duas variveis correlacionadas y=a
1
x
1
+a
2
x
2

o o o o o o
y
a a a a a a = + + s +
1
2
1
2
1 2
12
2
2
2
2
2
1 1 2 2
2

(59)

Uma observao final: a razoabilidade da incerteza final da grandeza y, calculada com
as eqs. 37, 43 ou 49, depende do rigor com que os o
i
so estimados. Sucede frequentemente
que, para uma grandeza y=F(x
1
, x
2
, ..., x
n
), a aplicao das eqs. 37, 43 ou 49 produza um
intervalo de incerteza muito inferior ao que se obtm calculando o desvio padro de y a partir
do resultado de vrias medies (x
1
, x
2
, ..., x
n
), que permitem calcular outros pontos y. Esta
discrepncia deve-se utilizao de incertezas para os x
i
inferiores s reais; muitas vezes
toma-se a preciso instrumental pela incerteza, quando a repetio do ensaio (e no da mera
leitura) leva a variaes muito superiores.

Anlise e Tratamento de Dados Experimentais

21

AJUSTAMENTO DE CURVAS PELO MTODO DOS MNIMOS QUADRADOS

1. Consideraes gerais

Suponhamos que uma experincia tem por fim a verificao de uma certa relao
postulada y=F(x)*. Para tanto, efectuam-se n medies de x (x
1
, x
2
, ..., x
n
) e n medies dos
correspondentes y (y
1
, y
2
, ..., y
n
). Admitamos por ora que apenas a varivel y tem uma
componente aleatria significativa: a varivel x poder ser por exemplo o tempo, i.e., os
pontos experimentais sero os valores de uma certa grandeza y medida em vrios instantes
que se admitem conhecidos sem erro aprecivel.
Devido existncia de um erro em y, uma representao de y em funo de x no
seguir perfeitamente a funo F(x), ainda que essa relao seja obedecida. O processo bvio
de reduzir esses desvios consiste em obter medidas repetidas de y para um mesmo x. Se
efectuadas em grande nmero, a representao dos valores mdios
y

deve realmente obedecer


a y=F(x). Na prtica, isto nem sempre possvel ou cmodo, e dispomos apenas de um ou, no
mximo, de um nmero reduzido de valores de y para cada x. Geralmente a funo F(x)
contm m parmetros a
j
(j=1, 2, ..., m) e, alm de se pretender verificar se y=F(x) obedecido,
queremos ainda estimar os melhores parmetros a
j
a partir dos resultados experimentais.
Como proceder? Suponhamos que o erro em y tem a mesma distribuio para todos os n
pontos, o que constitui o chamado caso homocedstico. Ento as n diferenas y
i
-F(x
i
) so
outras tantas concretizaes da mesma varivel aleatria Ay, que normalmente se admite
seguir uma distribuio gaussiana de valor mdio nulo e desvio padro o
y
. Assim, devemos
impr que as estimativas experimentais destes parmetros se aproximem o mais possvel dos
valores tericos, i.e., que as funes dos parmetros

( ) | |
g a a a y F x
m
i
n
i i
1
1 2
1
, ( ) , ... , =
=

E
(60)

( ) | |
g a a a
n m
y
i
F x
i y
m
i
n
2 1 2
1
2 1
2
, ( ) , ... , =


=
E
o (61)

tomem o valor mais prximo de zero que for possvel. A primeira funo dever ser prxima
de zero, pois o valor mdio de Ay nulo; a segunda funo dever tambm ser prxima de
zero, pois a varincia de Ay o
y
2
e a varincia amostral residual s
y x /
2



*
No abordaremos o caso de funes de vrias variveis.

Anlise e Tratamento de Dados Experimentais

22
s
n m
y F x
y x
i
n
i i
/
( )
2
1
2 1
=


=
E
(62)

em que agora o nmero de graus de liberdade n-m. Note-se que esta varincia s um
estimador de o
y
2
se a relao y=F(x) for exacta, o que a priori desconhecido, e da o seu
nome especfico. Se a distribuio de Ay normal, os dois momentos referidos, mdia e
varincia, so os nicos relevantes. Se a distribuio no normal, poderamos considerar
tambm funes para os momentos de ordem superior. No entanto, bastam as equaes para a
varincia (como veremos) para normalmente definir completamente os parmetros, pelo que
razovel usar a sua estimativa e no a de outros parmetros menos importantes.
Para impr matematicamente estas condies de anulamento, basta igualar as funes a
zero
g
1
= 0 (63)

g
2
= 0 (64)
Enquanto a primeira condio d
( )
E
E
i
n
i
i
n
i
F x y
= =
=
1 1
(65)

relao fcil de satisfazer, a segunda condio d

( )
| |
( )
E
i
n
y
i
F x
i
n m
y
=
=
1
2
2
o (66)

igualdade que raramente atingida, pois o valor mnimo de g
2
normalmente positivo.
Nessas condies, h que procurar o seu mnimo

c
c
g
a
j m
j
2
0 = ( =1, 2, ..., ) (67)
e, usando a eq. 61, vem
E
i
n
i i
j
y F x
F
a
j m
=
=
1
0 ( )
c
c
( =1, 2, ..., ) (68)

tendo-se assim tantas equaes como parmetros. A condio de anulamento do valor mdio,
eq. 63, automaticamente verificada pela condio 67 desde que a funo F(x) se possa
escrever como
F x a G x a a
m
( ) ( , , ..., ) = +
1 2
(69)

Anlise e Tratamento de Dados Experimentais

23

isto , que haja uma constante aditiva a determinar. Nesse sentido, apenas necessrio impr
que a varincia amostral seja o mais prxima possvel da varincia terica, pois o valor mdio
amostral vir prximo de zero sem qualquer imposio explcita nesse sentido. A obteno
dos parmetros pelo sistema de equaes 68 dita mtodo dos mnimos quadrados, embora
um nome mais apropriado fosse mtodo da varincia ptima. Com efeito, o objectivo o
zero da funo g
2
(a
1
, ..., a
m
) e no a minimizao do somatrio dos quadrados dos desvios,
porque este ltimo pode, em princpio, ser arbitrariamente prximo de zero, o que d g
2
~-o
y
2
,
resultado absurdo. Este ponto no nunca referido nas apresentaes do mtodo, embora seja
fundamental: quando a pesquisa do mnimo feita apenas com o somatrio corre-se o risco de
descer abaixo de o
y
2
, caso em que o ajuste "demasiado bom", o que significa que se est a
tomar por significativa uma parte dos erros aleatrios, i.e., se est a ajustar o "rudo". No caso
limite de um somatrio nulo, obtm-se mesmo uma funo interpoladora, que passa
exactamente por todos os pontos experimentais. Normalmente no esse o caso, e o
somatrio no desce abaixo de o
y
2
. Em tal circunstncia, o sistema de equaes 68 aplica-se.
E se este sistema for de difcil resoluo, pode recorrer-se pesquisa numrica do mnimo de

E
i
n
i i
y F x
=

1
2
( )

Mas qualquer destes dois procedimentos incorrecto se conduzir a uma varincia amostral
inferior a o
y
2
. Nessa situao a eq. 66 que define as combinaes ptimas de parmetros,
geralmente em nmero elevado. A escolha de um dado conjunto (a
1
, ... a
m
) no ento
possvel a no ser com recurso a critrios suplementares (e.g. mtodo da mxima entropia).
Quando a distribuio dos erros em y gaussiana, o mtodo dos mnimos quadrados
pode ser deduzido a partir do mtodo da mxima verosimilhana, sendo a funo a minimizar
o somatrio do quadrado dos desvios. Mas o mtodo dos mnimos quadrados aplicvel ainda
que a distribuio dos erros no seja normal, ao contrrio do que por vezes se l: essa alis
uma das razes para a sua larga utilizao.

2. Medidas da qualidade do ajustamento

Uma medida da qualidade ou bondade do ajuste dada por g
2
(a
1
, ..., a
m
) em que F(x)
calculada com os valores ptimos dos parmetros. O ajuste ser tanto melhor quanto mais
prxima de zero for esta funo. Para tornar o critrio universal, divide-se g
2
por o
y
2
, vindo
para um bom ajustamento


Anlise e Tratamento de Dados Experimentais

24
| |
( )
E
i
n
i i
y
y F x
n m
=

~
1
2
2
1 0
( )
o
(70)

Assim, o ajustamento perfeito se a quantidade, dita qui-quadrado reduzido do ajuste,

| |
( )
_
o o
n m
i
n
i
i
y
y x
y
y F x
n m
s

=
=

=
2 1
2
2
2
2
E
( )
/
(71)

for igual unidade, e ser tanto pior quanto mais afastado desta o qui-quadrado estiver.
Note-se que o qui-quadrado uma varivel aleatria, pelo que o ajuste pode ainda ser
aceitvel para valores diferentes da unidade, especialmente para um nmero reduzido de
pontos. Se Ay tem uma distribuio normal, ento _
2
n-m
obedece a uma distribuio do qui-
quadrado reduzido com n-m graus de liberdade, e da o seu nome. Esta distribuio tem por
valor mdio 1 e por desvio padro 2 / ( ) n m

(cf. eq. 15).
Normalmente o valor de o
y
no conhecido, pelo que no possvel calcular o qui-
-quadrado. Mas, dispondo de mais do que um valor de y para pelo menos um valor de x,
possvel estimar o
y
2
por uma equao anloga eq. 14. Se tivermos n
i
valores de y
i
(y
i1,
y
i2
,
..., y
in
i
), vem
( )
s
y y
n
y
i
n
j
n
ij
i
i
n
i
i
2
1 1
2
1
1
=

= =
=
E E
E
(72)
em que
y
n
y
i
i
i
n
ij
i
=
=
1
1
E
(73)

Forma-se ento o quociente (muito raramente inferior a 1)

F
s
s
y x
y
=
/
2
2
(74)

e, tal como para o qui-quadrado, o ajuste ser tanto melhor quanto mais prximo da unidade
for F. Como agora quer o numerador, quer o denominador so variveis aleatrias, de
esperar que o valor numrico de F se possa afastar bastante mais da unidade que o de _
2
n-m
,

Anlise e Tratamento de Dados Experimentais

25
ainda que o ajuste seja aceitvel. Claro que para um grande nmero de pontos repetidos
tem-se s
y
2
o
y
2
, e a distribuio de F reduz-se do qui-quadrado reduzido. A funo de
distribuio de F, dita (do F) de Snedecor, resulta do quociente de duas varincias amostrais
independentes da mesma distribuio normal de mdia nula, e dada por

f F
m
m
m m
m m
F
m
m
F
m
m
m m
( )
'
'
' '
'
=
|
\

|
.
|
+
|
\

|
.
|
|
\

|
.
|
|
\

|
.
|
+
|
\

|
.
|


+
2
2
2
2
2
2 2
1
I
I I
(75)

sendo m e m' os graus de liberdade do numerador e do denominador, respectivamente.
Impondo que seja de p (convencionalmente 95 ou 99%) a probabilidade de F ser inferior
a um certo valor F
o
, obtm-se este valor F
o
para um certo nmero de graus de liberdade do
numerador e do denominador da eq. 74. Estes valores encontram-se na Tabela 3.
Assim, por exemplo, se dispusermos de 18 pontos experimentais, aos quais vamos
ajustar uma recta, dos quais dois foram medidos trs vezes cada um, o nmero de graus de
liberdade do numerador (m) de 18-2=16, pois a recta contm 2 parmetros, e o nmero de
graus de liberdade do denominador 23-1=5. Ento o valor crtico F
o
para p=99% vem da
Tabela 3 como sendo F
o
=9,68. Se o F calculado com os dados experimentais for superior a
esse valor, devemos concluir que ajuste no aceitvel (considera-se desprezvel a
probabilidade de o nosso caso corresponder ao 1% das situaes em que F>F
o
). Como se
disse, quando o nmero de graus de liberdade do denominador tende para infinito, m',
recuperamos a distribuio do qui-quadrado reduzido.
Para o exemplo anterior, o valor crtico que se obtm da Tabela 3 _
0
2
=1,99, pelo que o
ajustamento seria agora de rejeitar se o _
2
experimental viesse superior a este valor.
De mencionar que quando no se dispe nem de o
y
2
, nem de quaisquer medidas
repetidas que permitam estimar o
y
2
, ainda possvel ter uma ideia aproximada de o
y
2
se o
ajustamento puder ser considerado "bom", de forma subjectiva; faz-se ento, por hiptese

_
n m
~
2
1 (76)
donde, pela eq. 71


( )
| |
o
y y x
i
n
i i
s
y F x
n m
2 2 1
2
~ =

=
/
E
-
(77)



Anlise e Tratamento de Dados Experimentais

26
Tabela 3 - Valores de F
0
para nveis de confiana de 95% e 99% em funo de m e m'.

m
m' 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75
1

2

3

4

5


6

7

8

9

10


11

12

13

14

15


16

17

18

19

20


21

22

23

24

25


161
4,02
18,51
98,49
10,13
34,12
7,71
21,20
6,61
16,26

5,99
13,74
5,59
12,25
5,32
11,26
5,12
10,56
4,96
10,04

4,84
9,65
4,75
9,33
4,67
9,07
4,60
8,86
4,54
8,68

4,49
8,53
4,45
8,40
4,41
8,28
4,38
8,18
4,35
8,10

4,32
8,02
4,30
7,94
4,28
7,88
4,26
7,82
4,24
7,77
3,84
6,64
200
4,999
19,00
99,00
9,55
30,82
6,94
18,00
5,79
13,27

5,14
10,92
4,74
9,55
4,46
8,65
4,26
8,02
4,10
7,56

3,98
7,20
3,88
6,93
3,80
6,70
3,74
6,51
3,68
6,36

3,63
6,23
3,59
6,11
3,55
6,01
3,52
5,93
3,49
5,85

3,47
5,78
3,44
5,72
3,42
5,66
3,40
5,61
3,38
5,57
2,99
4,60
216
5,403
19,16
99,17
9,28
29,46
6,59
16,69
5,41
12,06

4,76
9,78
4,35
8,45
4,07
7,59
3,86
6,99
3,71
6,55

3,59
6,22
3,49
5,95
3,41
5,74
3,34
5,56
3,29
5,42

3,24
5,29
3,20
5,18
3,16
5,09
3,13
5,01
3,10
4,94

3,07
4,87
3,05
4,82
3,03
4,76
3,01
4,72
2,94
4,68
2,60
3,78

225
5,625
19,25
99,25
9,12
28,71
6,39
15,98
5,19
11,39

4,53
9,15
4,12
7,85
3,84
7,01
3,63
6,42
3,48
5,99

3,36
5,67
3,26
5,41
3,18
5,20
3,11
5,03
3,06
4,89

3,01
4,77
2,96
4,67
2,93
4,58
2,90
4,50
2,87
4,43

2,84
4,37
2,92
4,31
2,80
4,26
2,78
4,22
2,76
4,18
2,37
3,32

230
5,764
19,30
99,30
9,01
28,24
6,26
15,52
5,05
10,97

4,39
8,75
3,97
7,46
3,69
6,63
3,48
6,06
3,33
5,64

3,20
5,32
3,11
5,06
3,02
4,86
2,96
4,69
2,90
4,56

2,85
4,44
2,81
4,34
2,77
4,25
2,74
4,17
2,71
4,10

2,68
4,04
2,66
3,99
2,64
3,94
2,62
3,90
2,60
3,86
2,21
3,02
234
5,859
19,33
99,33
8,94
27,91
6,16
15,21
4,95
10,67

4,28
8,47
3,87
7,19
3,58
6,37
3,37
5,80
3,22
5,39

3,09
5,07
3,00
4,82
2,92
4,62
2,85
4,46
2,79
4,32

2,74
4,20
2,70
4,10
2,66
4,01
2,63
3,94
2,60
3,87

2,57
3,81
2,55
3,76
2,53
3,71
2,51
3,67
2,49
3,63
2,09
2,80
237
5,928
19,36
99,34
8,88
27,67
6,09
14,98
4,88
10,45

4,21
8,26
3,79
7,00
3,50
6,19
3,29
5,62
3,14
5,21

3,01
4,88
2,92
4,65
2,84
4,44
2,77
4,28
2,70
4,14

2,66
4,03
2,62
3,93
2,58
3,85
2,55
3,77
2,52
3,71

2,49
3,65
2,47
3,59
2,45
3,54
2,43
3,50
2,41
3,46
2,01
2,64
239
5,981
19,37
99,36
8,84
27,49
6,04
14,80
4,82
10,27

4,15
8,10
3,73
6,84
3,44
6,03
3,23
5,47
3,07
5,06

2,95
4,74
2,85
4,50
2,77
4,30
2,70
4,14
2,64
4,00

2,59
3,89
2,55
3,79
2,51
3,71
2,48
3,63
2,45
3,56

2,42
3,51
2,40
3,45
2,38
3,41
2,36
3,36
2,34
3,32
1,94
2,51
241
6,022
19,38
99,38
8,81
27,34
6,00
14,66
4,78
10,15

4,10
7,98
3,68
6,71
3,39
5,91
3,18
5,35
3,02
4,95

2,90
4,63
2,80
4,39
2,72
4,19
2,65
4,03
2,59
3,89

2,54
3,78
2,50
3,68
2,46
3,60
2,43
3,52
2,40
3,45

2,37
3,40
2,35
3,35
2,32
3,30
2,30
3,25
2,28
3,21
1,88
2,41

242
6,056
19,39
99,40
8,78
27,23
5,96
14,54
4,74
10,05

4,06
7,87
3,63
6,62
3,34
5,82
3,13
5,26
2,97
4,85

2,86
4,54
2,76
4,30
2,67
4,10
2,60
3,94
2,55
3,80

2,49
3,69
2,45
3,59
2,41
3,51
2,38
3,43
2,35
3,37

2,32
3,31
2,30
3,26
2,28
3,21
2,26
3,17
2,24
3,13
1,83
2,32

243
6,082
19,40
99,41
8,76
27,13
5,93
14,45
4,70
9,96

4,03
7,79
3,60
6,54
3,31
5,74
3,10
5,18
2,94
4,78

2,82
4,46
2,72
4,22
2,63
4,02
2,56
3,86
2,51
3,73

2,45
3,61
2,41
3,52
2,37
3,44
2,34
3,36
2,31
3,30

2,28
3,24
2,26
3,18
2,24
3,14
2,22
3,09
2,20
3,05
1,79
2,24
244
6,106
19,41
99,42
8,74
27,05
5,91
14,37
4,68
9,89

4,00
7,72
3,57
6,47
3,28
5,67
3,07
5,11
2,91
4,71

2,79
4,40
2,69
4,16
2,60
3,96
2,53
3,80
2,48
3,67

2,42
3,55
2,38
3,45
2,34
3,37
2,31
3,30
2,28
3,23

2,25
3,17
2,23
3,12
2,20
3,07
2,18
3,03
2,16
2,99
1,75
2,18

245
6,142
19,42
99,43
8,71
26,92
5,87
14,24
4,64
9,77

3,96
7,60
3,52
6,35
3,23
5,56
3,02
5,00
2,86
4,60

2,74
4,29
2,64
4,05
2,55
3,85
2,48
3,70
2,43
3,56

2,37
3,45
2,33
3,35
2,29
3,27
2,26
3,19
2,23
3,13

2,20
3,07
2,18
3,02
2,14
2,97
2,13
2,93
2,11
2,89
1,69
2,07
246
6,169
19,43
99,44
8,69
26,83
5,84
14,15
4,60
9,68

3,92
7,52
3,49
6,27
3,20
5,48
2,98
4,92
2,82
4,52

2,70
4,21
2,60
3,98
2,51
3,78
2,44
3,62
2,39
3,48

2,33
3,37
2,29
3,27
2,25
3,19
2,21
3,12
2,18
3,05

2,15
2,99
2,13
2,94
2,10
2,89
2,09
2,85
2,06
2,81
1,64
1,99
248
6,208
19,44
99,45
8,66
26,69
5,80
14,02
4,56
9,55

3,87
7,39
3,44
6,15
3,15
5,36
2,93
4,80
2,77
4,41

2,65
4,10
2,54
3,86
2,46
3,67
2,39
3,51
2,33
3,36

2,28
3,25
2,23
3,16
2,19
3,07
2,15
3,00
2,12
2,94

2,09
2,88
2,07
2,83
2,04
2,78
2,02
2,74
2,00
2,70
1,57
1,87

249
6,234
19,45
99,46
8,64
26,06
5,77
13,93
4,53
9,47

3,84
7,31
3,41
6,07
3,12
5,28
2,90
4,73
2,74
4,33

2,61
4,02
2,50
3,78
2,42
3,59
2,35
3,43
2,29
3,29

2,24
3,18
2,19
3,08
2,15
3,00
2,11
2,92
2,08
2,86

2,05
2,80
2,03
2,75
2,00
2,70
1,98
2,66
1,96
2,62
1,52
1,79

250
6,258
19,46
99,47
8,62
26,50
5,74
13,83
4,50
9,38

3,81
7,23
3,38
5,98
3,08
5,20
2,86
4,64
2,70
4,25

2,57
3,94
2,46
3,70
2,38
3,51
2,31
3,34
2,25
3,20

2,20
3,10
2,15
3,00
2,11
2,91
2,07
2,84
2,04
2,77

2,00
2,72
1,98
2,67
1,96
2,62
1,94
2,58
1,92
2,54
1,46
1,69
251
6,286
19,47
99,48
8,60
26,41
5,71
13,74
4,46
9,29

3,77
7,14
3,34
5,90
3,05
5,11
2,82
4,56
2,67
4,17

2,53
3,86
2,42
3,61
2,34
3,42
2,27
3,26
2,21
3,12

2,16
3,01
2,11
2,92
2,07
2,83
2,02
2,76
1,99
2,69

1,96
2,63
1,93
2,58
1,91
2,53
1,89
2,49
1,87
2,45
1,40
1,59
252
6,302
19,47
99,48
8,58
26,35
5,70
13,69
4,44
9,24

3,75
7,09
3,32
5,85
3,03
5,06
2,80
4,51
2,64
4,12

2,50
3,80
2,40
3,56
2,32
3,37
2,24
3,21
2,18
3,07

2,13
2,96
2,08
2,86
2,04
2,78
2,00
2,70
1,96
2,63

1,93
2,58
1,91
2,53
1,88
2,48
1,86
2,44
1,84
2,40
1,35
1,52
253
6,323
19,48
99,49
8,57
26,27
5,68
13,61
4,42
9,17

3,72
7,02
2,29
5,78
3,00
5,00
2,77
4,45
2,61
4,05

2,47
3,74
2,36
3,49
2,28
3,30
2,21
3,14
2,15
3,00

2,09
2,89
2,04
2,79
2,00
2,71
1,96
2,63
1,92
2,56

1,89
2,51
1,87
2,46
1,84
2,41
1,82
2,36
1,80
2,32
1,28
1,41



Anlise e Tratamento de Dados Experimentais

27
em que F(x
i
) calculada com os valores obtidos para os parmetros. Esta relao permite
estimar, embora sem grande rigor, o desvio padro do erro Ay. Com efeito, se o ajustamento
no na realidade bom, ento s
2
y/x
>>o
y
2
e obtm-se um majorante de o
y
2
.
Um critrio de qualidade do ajuste complementar dos anteriores e que no numrico
(na sua forma mais simples) o da representao dos resduos y
i
-F(x
i
) (ou de [y
i
-F(x
i
)]/s
y/x
),
em funo de x
i
. Para que o ajuste possa ser considerado satisfatrio, estes devero ter uma
distribuio aleatria em torno de zero (para um exemplo grfico, veja-se a seco 6 abaixo).
A representao tanto mais conclusiva quanto maior for o nmero de pontos experimentais.
Com poucos pontos torna-se difcil decidir se existe um desvio em relao a uma distribuio
completamente aleatria e no correlacionada (rudo branco). Existem testes estatsticos
associados representao dos resduos (alternncia de sinal, autocorrelao, etc.) mas o
exame visual normalmente conclusivo.
A aplicao do mtodo dos mnimos quadrados no termina com a determinao dos
parmetros ptimos e da qualidade do ajuste. ainda necessrio, e essencial, obter a incerteza
associada a cada um dos parmetros. Veremos como o fazer nas seces seguintes.

3. A linha recta

Se a funo de ajuste a linha recta,
y=mx+b (78)
vem da eq. 68 que
m
x y x y
x x
i
n
i
n
i i
i
n
i
i
n
i
i
n
i
n
i
i
n
i
=

|
\

|
.
|
= = = =
= = =
E E E E
E E E
1 1 1 1
1 1
2
1
2
1
1
(79)

b
x y x x y
x x
i
n
i
i
n
i
i
n
i
i
n
i i
i
n
i
n
i
i
n
i
=

|
\

|
.
|
= = = =
= = =
E E E E
E E E
1
2
1 1 1
1 1
2
1
2
1
(80)
que podem ser reescritas como

( )( )
( )
m
x
x
y
y
x
x
i
n
i i
i
n
i
=

=
=
E
E
1
1
2
(81)

b
y
mx = (82)


Anlise e Tratamento de Dados Experimentais

28
Esta ltima relao indica que a recta passa pelo ponto (
x y
, ). Note-se que m e b so variveis
aleatrias, que se mostra obedecerem a uma distribuio normal bidimensional, no sendo
independentes (vejam-se as eqs. 91 e 96 e os comentrios subsequentes). O desvio padro
amostral residual
( )
| |
s
y F x
n
y x
i
n
i i
/
=

=
E
1
2
2
(83)
vem
( ) ( ) ( )( )
| |
s
x x y
y
x x y
y
n
y x
i
n
i
i
n
i
i
n
i i
/
=

= = =
E E E
1
2
1
2
1
2
2
(84)

Finalmente, os desvios padro do declive m e da ordenada na origem b obtm-se das
eqs. 81 e 82 (ou 79 e 80) por aplicao da frmula de propagao da incerteza, eq. 44, que se
reduz a
s
m
y
s
m
y
s
m
y
m
y
s
m
i
n
i
y
y
y
y
i
n
i
y y
y
y
i
i
i
i
2
1
2
2
2
2
1
2
2
2 =
|
\

|
.
| +
|
\

|
.
| +
|
\

|
.
|
|
\

|
.
|
= =
E E
c
c
c
c
c
c
c
c
(85)

pois os y
i
so independentes. Tem-se

( )
c
c
m
y
x x
x x
i
i
i
n
i
=

=
E
1
2
(86)

s s
y y x
i
2 2
~
/
(87)

aproximao j discutida na seco anterior, e

c
c
m
y
= 0 (88)
donde
( )
s
s
x x
m
y x
i
n
i
2
2
1
2
=

=
/
E
(89)

De forma semelhante, vem para a ordenada na origem, a partir da eq. 82

Anlise e Tratamento de Dados Experimentais

29
s
b
y
s
b
m
s
b
y
y
m
m
2
2
2
2
2
=
|
\

|
.
| +
|
\

|
.
|
c
c
c
c
(90)
ou
s
s
n
x s
b
y x
m
2
2
2
2
= +
/
(91)
ou, finalmente,
( )
s
s
x x
x
n
s
x
n
b
y x
i
n
i
i
n
i
m
i
n
i
2
2
1
2
1
2
2 1
2
=

=
|
\

|
.
|
|
|
|
=
= =
/
E
E
E
(92)

Da eq. 92 vemos que a incerteza na ordenada na origem tanto maior quanto mais longe
da origem estiverem os pontos. Usando o parmetro t de Student para um determinado nvel
de confiana e n-2 graus de liberdade, os intervalos de incerteza para m e b so mts
m
, bts
b
.
Numa anlise mais pormenorizada, mostra-se que necessrio considerar a distribuio con-
junta de m e b, que define, no um rectngulo, mas sim uma elipse, dita de confiana
conjunta.
Como determinar o erro associado ao valor y
o
=mx
o
+b correspondente a um dado x
o
? E,
dado um valor y
o
determinado com um certo erro, como obter o intervalo de incerteza
associado a x
o
=(y
o
-b)/m? A resposta a estes dois problemas est mais uma vez na aplicao da
eq. 44.
No primeiro caso, como se admite a inexistncia de incerteza em x, a incerteza
associada a y
o
=mx
o
+b obtm-se facilmente, escrevendo, com o auxlio da eq. 82,

( ) y mx b m x x y
o o o
= + = + (93)
donde
s
y
m
s
y
y
s
y
m
m
y
y o
o o 2
2
2
2
2
=
|
\

|
.
| +
|
\

|
.
|
c
c
c
c
(94)
ou seja,
( )
( )
s s
n
x x
x x
y y x
i
n
i
o
/
o
2 2
2
1
2
1
= +

(
(
(
(
=
E
(95)

Note-se que para x
o
=0 esta equao se reduz eq. 92. Por outro lado, v-se que a
incerteza mnima para x
o
=x , e aumenta medida que x
o
se afasta de x . A relao 95 define
assim uma hiprbole de incerteza (Figura 5).

Anlise e Tratamento de Dados Experimentais

30

Figura 5 - Hiprbole de incerteza e intervalo de incerteza de y
o
para um dado x
o
.

Note-se que se usssemos y
o
=mx
o
+b, a incerteza em y
o
viria dada por

s
y
m
s
y
m
y
b
s
y
b
s
y
m
m
m b
mb
b
b
o
o o o o 2
2
2
2
2
2
2
2 =
|
\

|
.
|
+
|
\

|
.
|
|
\

|
.
|
+
|
\

|
.
|
c
c
c
c
c
c
c
c
(96)

e seria necessrio conhecer a co-varincia de m e b (que pode ser calculada igualando as eqs.
95 e 96).
Para obter o intervalo de incerteza associado a x
o
, dado um certo y
o
, usa-se

( ) x x
m
y
y
o o
= +
1
(97)
donde
s
x
m
s
x
y
s
x
y
s
x
m
m
y
y
y
y
o
o
o
o o
o
2
2
2
2
2 0
2
2
=
|
\

|
.
| +
|
\

|
.
| +
|
\

|
.
|
c
c
c
c
c
c
(98)
ou

( )
s
y y
m
s
m
s
m
s
n
x
m
y
y x
o o
o
2
2
4
2
2
2
2
2
1 1
=

+ +
/
(99)

Se y
o
foi obtido pela mdia de l determinaes,

Anlise e Tratamento de Dados Experimentais

31
s
s
l
y
y x
o
2
2
=
/
(100)
donde finalmente fica
( )
( )
s
s
m
n l
y y
m x x
x
y x
n
i
o
o
i
2
2
2
2
2
1
2
1 1
= + +

(
(
(
(
=
/
E
(101)

que define nova hiprbole de incerteza (Figura 6), sendo o erro uma vez mais mnimo para
y
o
=y .

Figura 6 - Hiprbole de incerteza e intervalo de incerteza de x
o
, para um dado y
o
,

conhecido com erro.

Se os erros em y seguirem uma lei normal, tem-se mais uma vez para o intervalo de
incerteza de x
x ts
x o
o
(102)

em que o parmetro t se refere a um determinado nvel de confiana e a n-2 graus de
liberdade. Este segundo caso (obter x
o
a partir de y
o
) o mais importante, pois corresponde ao
procedimento a seguir quando se usa uma recta de calibrao.
Existem vrios critrios para avaliar a qualidade (bondade) do ajustamento por uma
recta. Na seco anterior foram j mencionados dois critrios numricos importantes,
qui-quadrado e F, bem como um critrio no numrico complementar dos anteriores: a
representao dos resduos. Existe ainda outro critrio numrico, especfico da linha recta, o

Anlise e Tratamento de Dados Experimentais

32
chamado coeficiente de correlao linear, que no mais do que a covarincia de x e y
"normalizada"
( )( )
( ) ( )
r
x x y y
x x y y
i
n
i i
i
n
i
i
n
i
=

(
=
= =
E
E
E
1
1
2
1
2
1 2 /
(103)

e que toma valores entre -1 e 1. Um valor prximo de 1 indica uma correlao linear entre y e
x de declive positivo. Um valor prximo de -1 indica tambm uma correlao linear entre y e
x mas de declive negativo. Valores prximos do zero indicam ausncia de correlao linear.
No entanto, trata-se de um parmetro pouco sensvel, obtendo-se valores prximos da unidade
mesmo para casos em que h curvaturas significativas e os parmetros do qui-quadrado ou de
F so inaceitveis. Comparando a eq. 103 com as eqs. 81 e 89, segue-se que

s
m
r
n
m
=

1
1
2
2
(104)

equao que mostra a relao directa entre o erro relativo do declive (ou coeficiente de
variao) e o coeficiente de correlao. Desta relao podemos concluir duas coisas: (i) para
assegurar um mesmo erro relativo para o declive, o coeficiente de correlao deve, em
mdulo, ser tanto mais prximo da unidade quanto menor for o nmero de pontos; (ii) a
qualidade do ajuste - julgada por esta forma - fica igualmente especificada pelo erro relativo
do declive.
A eq. 104 tem alguma utilidade prtica, por muitas mquinas de calcular darem
directamente r e m mas no s
m
e s
b
. A partir da eq. 104 calcula-se ento s
m
e depois s
b
, pelas
eqs. 91 ou 92.
Se no houver qualquer correlao entre os valores de x e os valores de y, a funo de
distribuio do coeficiente de correlao amostral vem dada por

( )
f r
n
n
r
n
( ) =

|
\

|
.
|

|
\

|
.
|

1
1
2
2
2
1
2
2
2
t
I
I
(105)

sendo n o nmero de pontos experimentais. A probabilidade de obter um valor superior a r
o
,
ou inferior a -r
o
(r
o
>0) para um dado n, impe o valor de r
o
. Estes encontram-se na Tabela 4,
em funo da probabilidade de ,r,>r
o
e do nmero de pontos n.


Anlise e Tratamento de Dados Experimentais

33
Tabela 4 - Valores crticos r
o
em funo de p e de n.

p

n

0,5 0,8 0,9 0,95 0,98 0,99 0,995 0,998 0,999

3
4
5

6
7
8
9
10

11
12
13
14
15

16
17
18
19
20

22
24
26
28
30

32
34
36
38
40

42
44
46
48
50

60
70
80
90
100

0,707 0,951 0,988 0,997 1,000 1,000 1,000 1,000 1,000
0,500 0,800 0,900 0,950 0,980 0,990 0,995 0,998 0,999
0,404 0,687 0,805 0,878 0,934 0,959 0,974 0,986 0,991

0,347 0,608 0,729 0,811 0,882 0,917 0,942 0,963 0,974
0,309 0,551 0,669 0,754 0,833 0,875 0,906 0,935 0,951
0,281 0,507 0,621 0,707 0,789 0,834 0,870 0,905 0,925
0,260 0,472 0,582 0,666 0,750 0,798 0,836 0,875 0,898
0,242 0,443 0,549 0,632 0,715 0,765 0,805 0,847 0,872

0,228 0,419 0,521 0,602 0,685 0,735 0,776 0,820 0,847
0,216 0,398 0,497 0,576 0,658 0,708 0,750 0,795 0,823
0,206 0,380 0,476 0,553 0,634 0,684 0,726 0,772 0,801
0,197 0,365 0,458 0,532 0,612 0,661 0,703 0,750 0,780
0,189 0,351 0,441 0,514 0,592 0,641 0,683 0,730 0,760

0,182 0,338 0,426 0,497 0,574 0,623 0,664 0,711 0,742
0,176 0,327 0,412 0,482 0,558 0,606 0,647 0,694 0,725
0,170 0,317 0,400 0,468 0,543 0,590 0,631 0,678 0,708
0,165 0,308 0,389 0,456 0,529 0,575 0,616 0,662 0,693
0,160 0,299 0,378 0,444 0,516 0,561 0,602 0,648 0,679

0,152 0,284 0,360 0,423 0,492 0,537 0,576 0,622 0,652
0,145 0,271 0,344 0,404 0,472 0,515 0,554 0,599 0,629
0,138 0,260 0,330 0,388 0,453 0,496 0,534 0,578 0,607
0,133 0,250 0,317 0,374 0,437 0,479 0,515 0,559 0,588
0,128 0,241 0,306 0,361 0,423 0,463 0,499 0,541 0,570

0,124 0,233 0,296 0,349 0,409 0,449 0,484 0,526 0,554
0,120 0,225 0,287 0,339 0,397 0,436 0,470 0,511 0,539
0,116 0,219 0,279 0,329 0,386 0,424 0,458 0,498 0,525
0,113 0,213 0,271 0,320 0,376 0,413 0,446 0,486 0,513
0,110 0,207 0,264 0,312 0,367 0,403 0,435 0,474 0,501

0,107 0,202 0,257 0,304 0,358 0,393 0,425 0,463 0,490
0,104 0,197 0,251 0,297 0,350 0,384 0,416 0,453 0,479
0,102 0,192 0,246 0,291 0,342 0,376 0,407 0,444 0,469
0,100 0,188 0,240 0,285 0,335 0,368 0,399 0,435 0,460
0,098 0,184 0,235 0,279 0,328 0,361 0,391 0,427 0,451

0,089 0,168 0,214 0,254 0,300 0,330 0,358 0,391 0,414
0,082 0,155 0,198 0,235 0,278 0,306 0,332 0,363 0,385
0,077 0,145 0,185 0,220 0,260 0,286 0,311 0,340 0,361
0,072 0,136 0,174 0,207 0,245 0,270 0,293 0,322 0,341
0,068 0,129 0,165 0,197 0,232 0,256 0,279 0,305 0,324


Para utilizar a Tabela 4, compara-se o valor amostral r com o valor crtico r
o
. Se r<r
o
,
considera-se que no h correlao linear.

Anlise e Tratamento de Dados Experimentais

34

4. Pontos anmalos

Acontece por vezes que certos pontos saem completamente fora da tendncia geral
(Figura 7).
Figura 7 - Exemplo de pontos experimentais obtidos e funo y=mx+b ajustada.
O ponto assinalado nitidamente anmalo.

So os chamados pontos anmalos ou pontos discrepantes. Estes pontos no devem ser
utilizados no clculo dos parmetros do ajustamento, isto , devem ser desprezados. Por esta
razo, imprescindvel fazer-se sempre uma representao grfica prvia dos pontos.
Os pontos anmalos resultam de uma ou mais causas estranhas ao conjunto dos dados
experimentais, no se lhes aplicando pois a distribuio de erros admitida, mas sim a
composio desta com outra (diz-se que a distribuio est contaminada), que ter
necessariamente um desvio padro muito maior ou valor mdio no nulo, uma vez que tais
pontos esto afastados da tendncia global. As causas fsicas podem ser diversas, desde um
erro de leitura a uma variao momentnea da corrente elctrica, a uma termostatizao
insuficiente, a um erro de preparao de concentrao, etc.
Como a distribuio a que os pontos anmalos obedecem diferente da dos restantes
pontos, e nada se sabe sobre as suas caractersticas, seria incorrecto incorpor-los nos
clculos. esta a razo pela qual devem ser omitidos. A grande dificuldade est claramente
em decidir quais so os pontos anmalos. Quando se dispe de um nmero reduzido de pontos
experimentais, ou quando a disperso destes elevada, pode no ser fcil decidir qual ou
quais os pontos a eliminar. E se o ajustamento do nosso modelo no satisfatrio, podemos
ser tentados a conservar apenas os poucos pontos que seguem a variao esperada, o que
incorrecto, para no dizer fraudulento. Um primeiro critrio de identificao de pontos

Anlise e Tratamento de Dados Experimentais

35
anmalos est no nmero e distribuio dos pontos duvidosos. Eles devem ser obviamente em
nmero muito reduzido em relao ao nmero total de pontos, de outra forma ser melhor
repetir a experincia ou reformular o modelo! Tambm a representao dos resduos relativos
a todos os pontos (depois de feito o ajustamento apenas com os pontos insuspeitos) permitir
verificar se os pontos desprezados apresentavam algum tipo de desvio sistemtico, o que, a
acontecer, implicar uma reanlise, com eventual reformulao do modelo.
Se a distribuio dos erros seguir uma lei normal, mas existirem pontos anmalos, um
histograma dos resduos apresentar uma cauda demasiado alongada. Existem testes
estatsticos para quantificar essa discrepncia. Por outro lado, a distribuio dos erros pode
no ser gaussiana ou, sendo-o, ter um desvio padro varivel de ponto para ponto, o que
dificulta a aplicao do teste.

5. Dados heterocedsticos

A incerteza na varivel y nem sempre independente de y. Quando h uma dependncia
de f(Ay) com y, os dados dizem-se heterocedsticos (por oposio ao caso homocedstico).
Um exemplo simples desta situao o seguinte: na determinao da entalpia de vaporizao
de lquidos puros, AH
v
, pelo mtodo do ponto de ebulio, recorre-se equao de Clausius-
-Clapeyron
d
d
v
lnp
T RT
H
=
A
2
(E7)

em que p a presso de vapor temperatura T. Admitindo que AH
v
independente da
temperatura no intervalo em estudo, obtm-se

p p
S R H RT
=

o
v v
e e
A A / /
(E8)

sendo p
o
=1 atm e AS
v
a entropia de vaporizao temperatura de ebulio normal. A
determinao de AH
v
faz-se normalmente pela representao de ln p em funo de 1/T. No
entanto, nada obsta a que o ajustamento seja feito directamente a p em funo de T.
Admitindo que o erro em p constante, e.g., 1 Torr (e que o erro em T desprezvel), a
linearizao

lnp
H
RT
C = +
v
A
(E9)

(sendo C uma constante) produz dados heterocedsticos, pois, pela eq. 56, tem-se


Anlise e Tratamento de Dados Experimentais

36
o
o
lnp
p
p
= (E10)

e assim, embora na primeira representao todos os pontos tenham as mesmas barras de erro
(por conveno o), na segunda so os pontos de menor p a apresentar maior incerteza.
intuitivo que nesta segunda representao os pontos de menor p devam ser os menos
determinantes no ajustamento, por serem os de menor preciso. Isso conseguido pela
introduo de um factor de peso no qui-quadrado. Este factor pode ser obtido usando um
argumento de invarincia.
Com efeito, o qui-quadrado reduzido, definido para os dados homocedsticos como

| |
( )
_
o
n m
i
n
i i
y
y F x
n m

=
=

2 1
2
2
E ( )
(71)

deve ser independente de uma mudana de varivel, pois a incerteza associada aos dados a
mesma, qualquer que seja a transformao que se lhes aplique.
Suponhamos ento que os dados so homocedsticos em y, e que mudamos de varivel,
z=f(y). O qui-quadrado escreve-se, em termos desta ltima,

( )
| |
_
n m
i
n
i i i
n m
u z G x

=
=


2
1
2 1
E
(106)

em que os u
i
so os factores de peso a determinar e G(x
i
)

( ) ( )
| |
G x f F x
i i
= (107)

Ora os valores exactos verificam, por hiptese,

( ) y F x
ie i
= (108)
e
( ) ( ) z f y G x
ie ie i
= = (109)
donde
( ) y F x y
i i i
= + A (110)
e
( ) z G x y
z
y
i i i
y
i
~ +
|
\

|
.
| A
c
c
(111)

Anlise e Tratamento de Dados Experimentais

37
ou seja
_
c
c
n m
i
n
i i
y
n m
u y
z
y
i

=
~

|
\

|
.
|
2
1
2
1
E
A
2
(112)
ou, usando a eq. 110,
( )
| |
_
c
c
n m
i
n
i
y
i i
n m
u
z
y
y F x
i

=
=

|
\

|
.
|
2
1
2
2 1
E
(113)
e comparando com a eq. 71,
u
z
y
i
y y
i
c
c
o
|
\

|
.
| =
2
2
1
(114)
ou
u
z
y
i
y
i
=
|
\

|
.
|
1
2
2
c
c
o
y
(115)
que, pela eq. 43, fica
u
i
i
=
1
2
o
z
(116)

e assim a forma geral do qui-quadrado ser

( )
_
o
n m
i
n
i i
i
n m
y F x

=
=

(
(
2
1
2
1
E
(117)

Atendendo definio do qui-quadrado reduzido

_
n m
y x w
y
s
s

=
2
2
2
( / )
(118)
em que agora o
y
2
uma varincia mdia

o
o
o
o o
y
i
n
i
i
i
n
i
i
n
i
n
2 1
2
2
1
2
1
2
1
1
1
1 1
= =
=
= =
E
E E
(119)

segue-se que a varincia amostral residual mdia ser


Anlise e Tratamento de Dados Experimentais

38
( )
| |
s
n m
w y F x
y x w
i
n
i i i ( / )
2
1
2 1
=


=
E
(120)
em que
w
n s
i
i
i
n
i
y
i
= =
=
1
1 1
2
1
2
2
2
o
o
o
E
(121)

Este factor de peso reduz-se unidade no caso homocedstico. Atendendo a que do mtodo
dos mnimos quadrados resulta agora a equao

( )
| | E
i
n
i i i
j
w y F x
F
a
j m
=
=
1
0 1 2
c
c
( = , , ... , ) (122)

que uma generalizao da eq. 68, as relaes da recta mantm-se vlidas desde que em todos
os somatrios se introduza o factor w
i
dado pela eq. 121, ficando assim

( )( )
( )
m
w x
x
x y
w x
x
i
n
i i
w
i
w
i
n
i i
w
=

=
=
E
E
1
1
2
(123)
e
b y m
x
w
=
w
(124)

em que
x
w
e y
w
so as mdias pesadas
x
n
w x
x
w
i
n
i i
i
n
i
i
i
n
i
= =
=
=
=

1
1
1
1
2
1
2
E
E
o
o
(125)

y
n
w x
y
w
i
n
i i
i
n
i
i
i
n
i
S
= =
=
=
=
1
1
1
1
2
1
2
E
E
o
o
(126)

A recta dos mnimos quadrados pesados passa agora pelo ponto (
x
y
w
w
, ), como resulta
da eq. 124.

Anlise e Tratamento de Dados Experimentais

39
O clculo do erro associado ao declive e ordenada na origem d agora, em vez das eqs.
89 e 92,
( ) ( )
o
o
o
m
i
n
i
i
w
i
n
i
i
n
i i
w
x
x
n
w x
x
2
1
2
2
1
2
1
2
1
1
1
1 1
=

=
=
=
E
E
E
(127)
e
o
o
o
b
y
w m
n
x
2
2
2
2
= + (128)

Vemos que agora, ao contrrio do caso homocedstico, imprescindvel conhecer as
varincias individuais para obter estimativas dos erros

( )
s
s
x
x
m
i
n
i
i w
2
1
2
2
1
1
=

=
E
(129)
e
s
s
n
x
s
b
y x
w m
2
2
2
2
~ +
/
(130)

Os dados heterocedsticos no decorrem necessariamente de uma transformao de
varivel aplicada a dados homocedsticos. Os prprios dados experimentais podem s-lo, por
exemplo quando os erros so proporcionais ao prprio valor ou quando se tratam duma s vez
vrios conjuntos de dados obtidos com instrumentos de diferente preciso. Admitiremos que
nestes casos a eq. 122 continua a ser vlida.
Muitas vezes o valor absoluto de o
i
desconhecido, mas conhecemos a relao entre os
erros dos vrios pontos. Por exemplo, se por uma mudana de varivel z=f(y) passarmos de
dados homocedsticos para dados heterocedsticos, teremos

o
c
c
o
z
y
y
f
y
= (131)
Ora o factor de peso

Anlise e Tratamento de Dados Experimentais

40
w
n
f
y
n
f
y
z
z
i
n
z
y
y
i
n
y
y
i
i
i
= =
= =
1
1 1
1
1 1
2
1
2
2
2
1
2
2
o
o
c
c
o
c
c
o
E E
(132)
Como o denominador constante, pode ser posto em evidncia na eq. 122 e feito
desaparecer (fica o factor de peso u
z
i
dado pela eq. 116). Tambm o
y
constante, pelo que se
pode pr ainda
u
f
y
z
y
i
'
=
1
2
c
c
(133)

Contudo, para o clculo dos erros associados aos parmetros, necessrio usar u
i
ou w
i
.
Em termos de complexidade de clculo, mais simples admitir que todos os pontos tm
o mesmo peso. Mas se os dados so heterocedsticos, estaremos a introduzir um erro na
determinao dos parmetros. Esse erro ser tanto maior quanto maior for a variao do factor
de peso w
i
para os pontos experimentais.
Tambm a representao dos resduos deve, no caso heterocedstico, ser de [y
i
-F(x
i
)]/o
i

para que estes tenham valor absoluto semelhante para todo o x
i
.
No fcil escolher entre o tratamento directo dos dados y
i
=F(x
i
), suposto
homocedstico, e uma sua linearizao, heterocedstica. Se no segundo caso o tratamento
matemtico consideravelmente mais simples, h tambm mais aproximaes envolvidas.
Por exemplo, se os erros Ay so importantes, a eq. 112 pode no ser suficientemente precisa, o
que acarreta a introduo de um erro sistemtico em pelo menos alguns parmetros
determinados por linearizao. Tambm a utilizao dos valores experimentais em lugar dos
valores exactos nos factores de peso (e.g. na eq. E10) uma nova fonte de erro, inexistente no
qui-quadrado original.

6. Um exemplo numrico

A cintica de hidrlise em meio bsico do corante violeta de cristal foi estudada a 26 C
medindo a transmitncia a 590 nm de uma soluo 7,610
-5
M em corante, em funo do
tempo. A concentrao de NaOH era de (15,2 0,4)10
-3
M e a de KCl de (2,00 0,01)10
-2
M. Obtiveram-se os seguintes resultados:

t/s 188 360 548 720 903 1083 1263 1448 1625 1802
%T 33,5 41,5 50,5 58,0 65,0 70,5 76,0 80,0 83,5 86,5

Anlise e Tratamento de Dados Experimentais

41

Nas condies experimentais o modelo cintico o de uma reaco de pseudo-primeira
ordem. Sendo o corante a nica espcie absorvente a 590 nm, tem-se

A A
kt
=

o
e (E11)

em que A a absorvncia (A=-log
10
T), A
o
a absorvncia inicial, k a constante de velocidade
de pseudo-primeira ordem (k=k
2
[OH
-
]), e t o tempo. Note-se que, se por razes de calibrao
deficiente ou absoro residual a absorvncia no for nula quando t, estaremos a
introduzir um erro sistemtico, que, de acordo com a classificao apresentada no incio, um
erro de mtodo.
Sendo a incerteza instrumental de A%T = 0,5, tem-se (eq. 47) o
T
= AT/ 3=2,910
-3
.
Deste modo, quer o ajustamento directo de A em funo de t, quer o de lnA em funo
de t, so heterocedsticos, pois
o
o
A
T
T
=
ln 10
(E12)

o
o
ln
ln
A
T
T T
= (E13)

Construimos assim o seguinte quadro e a Figura 8:

t/s % T A o
A
lnA o
lnA
w
A
w
lnA

188
360
548
720
903
1083
1263
1448
1625
1802
33,5
41,5
50,5
58,0
65,0
70,5
76,0
80,0
83,5
86,5
0,4750
0,3820
0,2967
0,2366
0,1871
0,1518
0,1192
0,0969
0,0783
0,0630
0,0038
0,0030
0,0025
0,0022
0,0019
0,0018
0,0016
0,0016
0,0015
0,0014
-0,7445
-0,9625
-1,2150
-1,4415
-1,676
-1,885
-2,127
-2,334
-2,547
-2,765
0,0079
0,0079
0,0084
0,0092
0,010
0,012
0,014
0,016
0,019
0,023
0,241
0,387
0,558
0,720
0,996
1,076
1,362
1,362
1,549
1,779
1,808
1,808
1,599
1,333
1,128
0,783
0,576
0,441
0,312
0,213

Vemos que na representao de A em funo de t, o erro decresce com t, ao passo que na
representao de lnA em funo de t se d o contrrio: o erro aumenta com t. Nos dois casos a
variao no muito pronunciada. S-lo-ia mais se as absorvncias cobrissem uma maior

Anlise e Tratamento de Dados Experimentais

42
Figura 8 - Absorvncia e logaritmo da absorvncia em funo do tempo. As barras
de erro so demasiado pequenas para serem visveis na escala utilizada,
o que traduz a preciso elevada das medidas.

gama, i.e., se tivessem sido feitas leituras para tempos mais longos. Mesmo assim, o peso
relativo do primeiro ponto (t=188 s) em relao ao ltimo (t=1802 s) de 0,14 para a primeira
representao e de 8,5 na segunda representao! Aplicaremos agora o mtodo dos mnimos
quadrados aos dois conjuntos de dados.

(i) Logaritmo da absorvncia em funo do tempo

Neste caso usam-se os resultados para a linha recta, isto , as eqs. 123 e 124 com o
factor de peso w
i
nos somatrios (eq. 121), e as eqs. 129 e 130 para os erros. Vem

= =

m k 1 266 10
3 1
, s (E14)

s
m
=

8 10
6 1
s (E15)


Anlise e Tratamento de Dados Experimentais

43
b A = = ln ,
o
0 5154 (E16)

s
b
= 0 0064 , (E17)

_ _
o o
se
2 2
1 74 1 94 95 = = = , ( , , %) p (E18)

donde, para p=95%, tem-se k=(1,27 0,02)10
-3
s
-1
e A
o
=0,597 0,009, encontrando-se os
resduos representados na Figura 9.
Figura 9 - Resduos do ajuste de ln A em funo de t.

A ttulo de comparao, os mesmos dados tratados com o factor de peso w
i
=1 do

= =

m k 1 251 10
3 1
, s (E19)

r = 0 9997657 , (E20)
donde, pela eq. 104
s
m
=

1 10
5 1
s (E21)

e portanto k=(1,25 0,03)10
-3
s
-1
para p=95%. Obtm-se assim uma diferena relativamente
pequena (~ 2%) entre as constantes de velocidade calculadas pelos dois processos. Embora os
erros associados aos parmetros sejam pequenos e o qui-quadrado aceitvel, a representao
dos resduos (Figura 9) sugere a existncia de uma pequena discrepncia entre o modelo
matemtico usado (eq. E11) e os dados experimentais, que poder ser devida a uma
absorvncia residual no nula, cujas causas devero ser investigadas.



Anlise e Tratamento de Dados Experimentais

44
(ii) Absorvncia em funo do tempo

Nesta representao o problema no linear, e somos forados a procurar
numericamente o mnimo do qui-quadrado,
_
o
8
2
1
10
2
1
8
( , ) A k
A A
i
i
kt
A
i
i
o
o
e
=

(
( =

E
(E22)

Este qui-quadrado uma funo de duas variveis, pelo que a pesquisa do seu mnimo
algo morosa. No entanto, como a funo linear num dos parmetros (A
o
), podemos tirar
partido desse facto favorvel, pois a minimizao do qui-quadrado em relao ao A
o
d

c_
c o o
8
2
1
10
2
8
0
A
A A
i
i
kt
A
kt
A
i
i
i
i
o
o
e e
=

(
(

(
(
=
=

E
(E23)
ou seja
A
A
i
i
kt
A
i
kt
A
i
i
i
i
0
1
10
2
1
10
2
2
=
=

E
E
e
e
o
o
(E24)

e portanto _
8
2
apenas funo efectiva de k, e a eq. E22 pode ser substituda por

_ o
o
o
8
2
1
10
2
1
10
2
1
10
2
2
1
8
( ) k A
A
i
A
i
kt
j
j
kt
A
j
kt
A
i
i
j
j
j
j
=

(
(
(
(
(
(
(
=
=

E
E
E
e
e
e
-
(E25)

Representando agora _
8
2
(k) em funo de k (Figura 10) obtemos facilmente o mnimo para

k =

1 267 10
3 1
, s (E26)

A
o
= 0 597 , (E27)

_
8
2
1 73 = , (E28)


Anlise e Tratamento de Dados Experimentais

45
A representao dos resduos pesados idntica da Figura 9, uma vez que, da
invarincia do qui-quadrado, se segue tambm (em mdulo) a dos resduos pesados.
Concluimos assim que os valores dos parmetros obtidos pelo mtodo no linear e pelo
mtodo linear com factores de peso adequados so os mesmos; e que existe uma diferena -
neste exemplo pequena - quando se faz a aproximao w
i
=1 na representao linear.
Figura 10 - _
2
reduzido em funo de k.

7. A funo linear nos parmetros

O caso geral de uma funo linear nos parmetros constitui uma extenso simples dos
resultados obtidos para a linha recta. A funo escreve-se

y a f x
i
m
i i
=
=
E
1
( ) (134)

sendo f
i
(x) funes quaisquer de x, por exemplo da forma 1, x, x
2
, ..., caso em que a funo
um polinmio de ordem m, ou da forma sen ix, ou polinmios ortogonais, etc.
O sistema de equaes de minimizao do qui-quadrado continua a ser linear e tem pois
soluo nica (a hipersuperfcie do _
2
um parabolide com a concavidade voltada para
cima). Pode pr-se na forma matricial


Anlise e Tratamento de Dados Experimentais

46
| | | | | |
| | | | | |
| | | | | |
| |
| |
| |
f f f f f f
f f f f f f
f f f f f f
a
a
a
yf
yf
yf
m
m
m m m m
m
m
1 1 1 2 1
2 1 2 2 2
1 2
1
2
1
2


. . . . . . . . . . . . . .



...
...
...

(
(
(
(
(

(
(
(
(
(
=

(
(
(
(
(

(135)

em que se usa a notao abreviada
f f f x f x
j k
i
n
i
j i k i
=
=
E
1
2
1
o
( ) ( ) (136)

yf y f x
j
i
n
i
i j i
=
=
E
1
2
1
o
( ) (137)

A inverso da matriz, que pode exigir alguns cuidados, conduz aos coeficientes a
i
(i=1,
2, ..., n). Se a matriz inversa for C, ento

| |
a c yf c
y f x
j
k
m
jk k
k
m
i
n
jk
i k i
i
= =
= = =
E E E
1 1 1
2
( )
o
(138)

A varincia do coeficiente, o
j
2
, vem, por aplicao da eq. 43 eq. 138,

o
j
jj
c
2
= (139)

isto , os elementos diagonais da matriz inversa so as incertezas dos coeficientes. Mostra-se
tambm que os elementos no diagonais so as covarincias

o
ij
2
.
No caso homocedstico, os somatrios 136 e 137 podem ser calculados sem a diviso
por 1/o
2
. Como resulta da eq. 135, os coeficientes a
j
vm inalterados. Para o seu erro,
contudo, ser necessrio multiplicar os c
jj
assim obtidos por o
2
, que poder ser aproximado
por s
2
y/x
, como foi j referido.


8. A funo no linear nos parmetros

Se a funo de ajuste contm pelo menos um parmetro no linearizvel, ento a
pesquisa do mnimo do qui-quadrado tem de ser feita por um processo numrico, em geral
iterativo. Uma situao deste tipo foi j vista no ltimo exemplo. O caso no linear
consideravelmente mais complexo do que o linear, porque a hipersuperfcie do qui-quadrado,

Anlise e Tratamento de Dados Experimentais

47
_
2
=_
2
(a
1
, a
2
, ..., a
m
), apresenta geralmente vrios mnimos locais, ao contrrio do caso
linear, onde, como se referiu, h um s mnimo (Figura 11).
Figura 11- Superfcie do qui-quadrado no caso linear, com 2 parmetros.

Deste modo, as buscas do mnimo podem terminar em mnimos locais ou, existindo
uma correlao importante entre parmetros, no haver soluo nica mas sim uma
"trincheira" na hipersuperfcie, que poder no ser revelada em toda a sua extenso. Tambm
em certos casos, e por razes de simetria da funo de ajuste, haver mais de um mnimo
absoluto. Por exemplo, a funo de 4 parmetros

y a a
x x
= +

1 2
1 2
e e

(E29)

ter necessariamente dois valores ptimos para cada parmetro. Com efeito, suponhamos que
um conjunto ptimo (a
1
o
, a
2
o
,
1
o
,
2
o
). Ento (a
2
o
, a
1
o
,
2
o
,
1
o
) igualmente ptimo, pois o
qui-quadrado no afectado por esta permutao. Um caso concreto interessante desta
situao discutido na ref. 7.
O procedimento mais seguro para a determinao do mnimo absoluto do qui-quadrado
evidentemente o clculo e representao pormenorizada de toda a hipersuperfcie. Contudo,
mesmo com dois ou trs parmetros, e dependendo da forma da funo, o tempo de clculo
pode revelar-se j proibitivo. Deste modo, recorre-se com mais frequncia a mtodos falveis
de pesquisa numrica iterativa, como o de Marquardt, que necessitam de boas aproximaes
iniciais para os parmetros. A convergncia da pesquisa sempre para a mesma soluo, dadas
aproximaes iniciais bastante diferentes, um dos ndices empricos de o mnimo absoluto

Anlise e Tratamento de Dados Experimentais

48
ter sido encontrado. A determinao rigorosa dos erros associados aos parmetros exige neste
caso recurso a tcnicas mais sofisticadas, como a simulao de Monte-Carlo.
No mtodo de Monte-Carlo, e uma vez obtidos os parmetros de ajuste e a varincia
amostral residual (eq. 62), procede-se da seguinte forma: Com os valores de x correspondentes
aos pontos experimentais, x
i
(i=1, 2,.., n) calculam-se os correspondentes y
i
calc
(i=1, 2,.., n)
utilizando a funo de ajuste com os parmetros determinados. Em seguida recalculam-se os
valores de y
i
, somando-se-lhes concretizaes de uma varivel aleatria o com distribuio
normal, cujo valor mdio nulo e cuja varincia igual varincia amostral residual,

y
i
(1)
= y
i
calc
+ o
i
(1)
(i=1, 2,.., n) (140)

Para estes novos dados experimentais (na realidade simulados, tambm ditos dados
sintticos) (x
i
, y
i
(1)
) (i=1, 2,.., n), determina-se agora um segundo conjunto de parmetros de
ajuste pelo mtodo dos mnimos quadrados. Repete-se depois todo o procedimento um certo
nmero m de vezes (por exemplo 100 vezes). Fica-se assim com m valores para cada
parmetro de ajuste. Calcula-se depois para cada parmetro uma varincia, e portanto um
intervalo de incerteza, usando a eq. 27.
Outros dois mtodos de clculo das incertezas associadas aos parmetros so o jackknife
(eliminao sequencial) e o bootstrap (substituio sequencial). No primeiro, retira-se um
ponto de cada vez ao conjunto dos dados experimentais. Para cada conjunto reduzido com n-1
pontos obtm-se os parmetros de ajuste pelo mtodo dos mnimos quadrados. Fica-se assim
com n conjuntos de parmetros, sendo o desvio padro de cada parmetro
i
a dado por


( )
2
( )
1
1
1
n
j
i i i
j
a a
n
o
=
| |
=
|
\ .

(141)

em que os
( ) j
i
a (j=1, 2, ..., n) so os valores obtidos para esse parmetro e
i
a a sua mdia.
No mtodo de bootstrap criam-se conjuntos de dados sintticos realizando um grande
nmero de amostragens com reposio dos dados experimentais. Trata-se essencialmente de
um mtodo de Monte-Carlo aproximado.
Qualquer dos trs mtodos descritos pode ser facilmente aplicado a conjuntos pequenos
de dados, vejam-se as refs. 8 e 9.

Anlise e Tratamento de Dados Experimentais

49
COMENTRIO FINAL

Os erros experimentais assemelham-se a uma nvoa que se interpe entre objecto e
observador. Se esta cerrada, pouca confiana poderemos ter nos dados extrados, ainda que
com recurso a mtodos exaustivos. Ser ento prefervel, se possvel, mudar de ponto de
observao, i.e., modificar a tcnica experimental; regra bem conhecida no valer a pena
desperdiar bons raciocnios com maus dados. Por outro lado, se os erros so pouco
importantes no contexto das observaes, e para as concluses pretendidas, pode no se
justificar levar o tratamento de erros muito longe. na regio intermdia das duas
mencionadas que os mtodos discutidos so significativos. Ainda assim, deve ter-se presente
que uma confiana excessiva no valor absoluto dos erros calculados ilusria, pois resultam
de vrias aproximaes (por exemplo uma distribuio normal para os erros) e, at,
convenes (e.g. nveis de confiana).


BIBLIOGRAFIA SELECCIONADA

1. A. M. Mood, F. A. Graybill, D. C. Boes, Introduction to the Theory of Statistics (3
a
ed.),
McGraw-Hill, 1983.
2. W. H. Press, S. A. Teukolsky, W. T. Vetterling, B. P. Flannery, Numerical Recipes - The
Art of Scientific Computing, Cambridge U.P., 3 ed., 2007.
3. R. de Levie, When, Why and How to use Weighted Least-Squares, J. Chem. Educ. 63
(1986) 10.
4. M. D. Pattengill, D. E. Sands, Statistical Significance of Linear Least-Squares Parameters,
J. Chem. Educ. 56 (1979) 245.
5. J. Ross MacDonald, W. J. Thompson, Least-Squares Fitting when Both Variables Contain
Errors: Pitfalls and Possibilities, Am. J. Phys. 59 (1992) 66.
6. W. J. Thompson, J. Ross McDonald, Correcting Parameter Bias Caused by Taking Logs of
Exponential Data, Am. J. Phys. 59 (1991) 854.
7. R. H. Bisby, E. W. Thomas, Kinetic Analysis by the Method of Nonlinear Least Squares, J.
Chem. Educ. 63 (1986) 990.
8. D. C. Harris, Nonlinear Least-Squares Curve Fitting with Microsoft Excel Solver, J. Chem.
Educ. 75 (1998) 119.
9. M. S. Caceci, Estimating Error Limits in Parametric Curve Fitting, Anal. Chem. 61 (1989)
2324.
10. P. Ogren, B. Davies, N. Guy, Curve Fitting, Confidence Intervals and Envelopes,
Correlations, and Monte Carlo Visualizations for Multilinear Problems in Chemistry: A
General Spreadsheet Approach, J. Chem. Educ. 78 (2001) 827.