Você está na página 1de 22

Física Laboratorial Ano Lectivo 2003/04

INTRODUÇÃO À ANÁLISE DE DADOS


NAS MEDIDAS DE GRANDEZAS FÍSICAS

1. Introdução..................................................................................................................2
2. Erros de observação: erros sistemáticos e erros fortuitos ou acidentais ...................2
3. Precisão e rigor .........................................................................................................4
4. Erro absoluto e erro relativo ......................................................................................4
5. Estimativa do verdadeiro valor de uma grandeza e da confiança no resultado.........5
5.1 Caso de uma só medição da grandeza ...............................................................6
5.1.1 Leitura de escalas. Intervalo de imprecisão. Limite superior do erro.......6
5.1.2 Algarismos significativos .........................................................................6
5.2 Caso de muitas medições da grandeza................................................................8
5.2.1 Distribuição de resultados ........................................................................8
5.2.2 Estimativa do verdadeiro valor. Média Aritmética......................................................10
5.2.3 Estimativa do intervalo de imprecisão. Desvio padrão
dos resultados e da média .......................................................................................11
6. Grandezas de medição directa e indirecta. Combinação de erros ...........................14
7. Ajuste de uma função a dados experimentais..........................................................16
7.1 Representação gráfica dos pontos experimentais e “barras de erro”................17
7.2 Ajuste de uma curva ........................................................................................18
7.3 Ajuste de rectas por método analítico ..............................................................20
7.3.1 Ajuste de uma recta da forma y = kx aos pontos experimentais...................20
7.3.2 Ajuste de uma recta da forma y = ax + b aos pontos experimentais.............21
8. Avaliação da qualidade do ajuste de uma função aos dados experimentais.
Teste do qui-quadrado ............................................................................................22

Bibliografia..................................................................................................................22

Notas baseadas nos apontamentos “Análise de Dados”


do Prof. Dr. Nuno Ayres de Campos

Departamento de Física da FCTUC 1/22


Física Laboratorial Ano Lectivo 2003/04

1. INTRODUÇÃO

É um facto de observação corrente que, se repetirmos a medição de uma grandeza física em


condições supostamente idênticas, não obteremos sempre o mesmo resultado mas sim um conjunto
de valores diferentes uns dos outros. Cada um destes valores constitui um valor medido da referida
grandeza mas só por um acaso algum deles corresponderia ao seu verdadeiro valor. De facto, as
medições realizam-se sempre com imprecisões, quer devido a limitações da aparelhagem, quer
devido, por vezes, ao próprio experimentador. Como exemplo de limitações da aparelhagem, temos
o caso de um medidor digital que, por construção, leia 12,567 quando o valor da grandeza se
encontra entre 12,5671 e 12,5679, truncando, simplesmente o último dígito. O contributo do
experimentador para a imprecisão da medida acontece quando, por exemplo, os seus reflexos
intervêm na utilização de cronómetros manuais para a leitura de intervalos de tempo. Os valores
medidos são, assim, aproximações do valor verdadeiro.
Ao realizar uma medição não basta indicar o número que se obteve como resultado: é necessário
fazê-lo acompanhar de uma outra informação que indique em que medida o experimentador tem
confiança no valor que apresenta. Por exemplo, ao medir-se a distância focal f de uma lente, o
resultado final pode ser apresentado como f = 256 ± 2 mm. Significa isto que, dadas as condições
em que foi efectuada a medição, o experimentador considera que há uma probabilidade elevada (ou
a certeza, consoante as condições da estimativa deste intervalo) de o verdadeiro valor da distância
focal estar compreendido entre 254 mm e 258 mm, sendo 256 mm o valor mais provável. A este
intervalo chamaremos mais adiante intervalo de imprecisão (ou limite superior do erro, no caso da
certeza).
Os alunos de Física Laboratorial realizam trabalhos práticos visando obter resultados
experimentais. Necessitam, por isso, forçosamente, de ter algumas noções sobre análise de dados
para trabalharem e interpretarem correctamente os resultados obtidos.

2. ERROS DE OBSERVAÇÃO: ERROS SISTEMÁTICOS E ERROS FORTUITOS OU ACIDENTAIS

A preocupação fundamental do experimentador que realiza uma medição é, naturalmente, a de


tomar todas as precauções para reduzir os erros durante a experiência. Apesar disso, todas as
medições são afectadas por um erro experimental devido às inevitáveis limitações dos aparelhos de
medida ou àquelas impostas pelos nossos sentidos (visão, audição, etc.) que registam a informação.
Representemos por x o verdadeiro valor de uma grandeza que, não sendo possível conhecer,

Departamento de Física da FCTUC 2/22


Física Laboratorial Ano Lectivo 2003/04
postulamos no entanto existir. Ao fazer uma medição não obtenho o verdadeiro valor x, como regra.
O valor obtido x0 difere geralmente daquele. Chamamos erro de observação e muitas vezes
simplesmente erro à diferença entre ambos:
δx = x 0 − x

δx não é conhecido por não haver maneira de determinarmos o valor verdadeiro de x. Contudo, há
casos em que podemos estimar um limite superior para o valor do erro δx.

Os erros (de observação) são de duas naturezas: erros sistemáticos e erros fortuitos ou
acidentais.
Suponhamos que medimos o período de um pêndulo com o auxílio de um cronómetro e que
repetimos várias vezes a medição. Os atrasos ou antecipações do experimentador ao ligar e desligar
o cronómetro e os erros na estimativa das divisões da escala provocam variações nos resultados das
sucessivas medições e podem ser considerados erros acidentais. As pequenas irregularidades no
movimento dum pêndulo real, como por exemplo um desalinhamento em relação ao plano do
movimento, podem também contribuir para os erros acidentais, apesar de não serem provocados
pelas limitações dos aparelhos de medida. Se não se manifestarem outros erros, algumas das
medidas apresentam um valor mais elevado e outras um valor mais baixo, dispersas em torno dum
valor médio.
Por outro lado, se além disso o cronómetro tiver, por exemplo, tendência para se atrasar, todos os
resultados virão reduzidos dum valor constante. Ao contrário, as forças de atrito podem ser
suficientes para aumentar visivelmente dum valor constante os resultados da medição dos tempos.
Trata-se assim de erros sistemáticos. Relativamente aos erros sistemáticos, muitas vezes difíceis de
detectar, não existe qualquer teoria generalizada que permita o seu estudo. No entanto, e ao
contrário dos erros acidentais, são, na maior parte dos casos, susceptíveis de correcção, podendo
mesmo ser eliminados. De facto, os cuidados do experimentador, o perfeito conhecimento das
condições em que realiza a experiência e do método que está a seguir, uma permanente
desconfiança dos aparelhos de medida e, sobretudo, uma larga prática, permitem compensar ou
evitar este tipo de erros.
Os erros acidentais, dado o carácter aleatório com que se apresentam, podem ser submetidos a
um tratamento matemático baseado na Teoria das Probabilidades. É deles que nos ocuparemos nos
parágrafos que se seguem.
Interessa salientar, porém, que a fronteira entre erros sistemáticos e erros acidentais não é, por
vezes, bem definida e que, se há erros que facilmente podemos identificar como sistemáticos, outros
existem que, estando ligados a incertezas difíceis de esclarecer, tornam impraticável distinguir se

Departamento de Física da FCTUC 3/22


Física Laboratorial Ano Lectivo 2003/04
pertencem a uma ou a outra destas categorias.

3. PRECISÃO E RIGOR

Convém também distinguir os conceitos de precisão e de rigor numa medida. Diremos que uma
medição é feita com grande precisão se os erros acidentais são pequenos quando comparados com o
valor da grandeza medida; diremos que uma medição é feita com rigor (ou exactidão) se os erros
sistemáticos são pequenos.
O termo precisão é usado para caracterizar a reprodutibilidade dos resultados, indicando a
dispersão em torno do valor médio; exactidão é o termo que se utiliza para exprimir o afastamento
do valor médio relativamente ao verdadeiro valor da grandeza. A precisão é tanto maior quanto
menor for a dispersão das medidas em torno do valor médio; a exactidão é tanto maior quanto mais
próximo do verdadeiro valor estiver o valor médio, no limite dum número de medidas infinito. A
precisão pode ser aumentada reduzindo os erros acidentais; a exactidão pode ser aumentada
corrigindo os erros sistemáticos.

4. ERRO ABSOLUTO E ERRO RELATIVO

Note-se ainda que um erro, seja ele de que tipo for, pode ser expresso de duas maneiras
diferentes: o “erro absoluto” ou o “erro relativo”.
Chamamos erro absoluto de um resultado medido ou calculado à diferença, já apresentada
anteriormente, entre esse resultado e o valor verdadeiro da grandeza. Se designarmos por x0 o
referido resultado e por x o valor verdadeiro da grandeza, o erro absoluto será:
δx = x 0 − x .

Chamamos erro relativo ao valor do quociente entre o erro absoluto e o valor verdadeiro da
grandeza:
x0 − x δx
= .
x x

Analisando dimensionalmente as equações anteriores verifica-se que o erro absoluto se exprime


nas unidades da grandeza, enquanto o erro relativo é uma grandeza adimensional. Estas duas formas
de exprimir um erro distinguem-se ainda pela natureza das informações que fornecem.

Departamento de Física da FCTUC 4/22


Física Laboratorial Ano Lectivo 2003/04

Note-se agora o seguinte: não sendo possível conhecer o verdadeiro valor de uma grandeza x, é
possível fazer uma estimativa a partir de um conjunto de medidas. Assim, embora não se possa
conhecer o verdadeiro valor x, podemos trabalhar com a noção de erro absoluto δx para cada uma
das medidas realizadas. Por outro lado, como duma medida realizada obtivemos um valor x0,
δx
podemos usar a noção de erro relativo calculando .
x0

Considere-se o exemplo seguinte: um resultado de 2505 kg/cm2 na leitura de uma pressão cujo
valor verdadeiro é 2500 kg/cm2 representa um erro absoluto de 5 kg/cm2; se a pressão a medir for
20 kg/cm2 e o resultado da medida tiver sido 25 kg/cm2, o erro absoluto será novamente de
5 kg/cm2. Pelo contrário, os erros relativos cometidos em cada um dos casos serão, respectivamente,
5 5
= 0.002 e = 0.25 . Ou seja, enquanto o erro absoluto é independente do maior ou menor
2500 20
valor da grandeza a medir, o erro relativo é largamente dependente desse valor, revelando a
precisão da medida feita: um erro de 2 cm na medida de uma distância de 200 m representa uma boa
precisão, enquanto o mesmo erro de 2 cm na medida de uma distância de 10 cm revela uma fraca
precisão.
O erro relativo exprime-se, por vezes, em termos de percentagem e define, então, a chamada
percentagem de erro ou erro percentual. No último exemplo apresentado, os erros relativos
percentuais seriam, respectivamente

2 2
x100 = 0.01% e x100 = 20% .
20000 10

5. ESTIMATIVA DO VERDADEIRO VALOR DE UMA GRANDEZA E DA CONFIANÇA NO RESULTADO

O propósito de qualquer medida ou conjunto de medidas de uma grandeza é o conhecimento do


seu verdadeiro valor. Na impossibilidade de o atingir temos, como já foi dito atrás, de fazer a nossa
melhor estimativa desse verdadeiro valor, ou seja, obter o nosso “melhor verdadeiro valor”. Por
outro lado, temos também de estimar um intervalo de valores que corresponda à confiança que
temos no melhor verdadeiro valor, ou seja, estimar a imprecisão do resultado. Nos parágrafos
seguintes tratamos dos métodos de fazer estas estimativas.

Departamento de Física da FCTUC 5/22


Física Laboratorial Ano Lectivo 2003/04
5.1 Caso de uma só medição da grandeza

Nos casos em que só é possível realizar uma medida única de uma grandeza, a melhor estimativa
que temos para o verdadeiro valor da grandeza é o próprio resultado obtido na medida. No entanto,
não deixamos por isso de necessitar de apresentar informação sobre a confiança que temos nesse
resultado, ou seja sobre o erro com que apresentamos o resultado.

5.1.1 Leitura de escalas. Intervalo de imprecisão. Limite superior do erro.

Quando se trata da leitura da escala de um aparelho (uma régua, um voltímetro digital, o


écran de um osciloscópio, por exemplo), é costume tomar-se como imprecisão na medida metade
da menor divisão da escala. Admite-se então que o verdadeiro valor da grandeza (x, por
exemplo) se encontra no intervalo [x-∆x, x+∆x], onde ∆x é metade da menor divisão da escala em
causa. Neste intervalo de valores, designado por intervalo de imprecisão, temos a certeza de estar
o verdadeiro valor da grandeza, sendo por isso ∆x chamado limite superior do erro.
Se as menores divisões da escala forem tão afastadas que facilmente se divide o seu
intervalo em 4 partes, pode tomar-se a imprecisão como ¼ da menor divisão da escala. De modo
contrário, se as divisões forem tão pequenas que seja difícil ler metade da menor divisão deve
tomar-se como limite superior do erro a menor divisão da escala.
Assim, por exemplo, se estivermos a medir um dado comprimento com uma régua graduada
em milímetros (a menor divisão é de 1 mm) e o valor do comprimento estiver situado entre 14.1
cm e 14.2 cm, diremos, sendo razoável tomar como imprecisão metade da menor divisão da
escala (0.5 mm), que o verdadeiro valor do comprimento está entre 14.05 cm e 14.15 cm ou, de
modo condensado, que o comprimento é de 14.10 ± 0.05 cm.

5.1.2 Algarismos significativos

Suponhamos o caso de um voltímetro digital que permite leituras da tensão até à milésima de
volt. Então, o voltímetro dá pouca informação sobre décimos milésimos de volt, embora dê alguma.
Se o verdadeiro valor da tensão for, por exemplo, 23.5647 V, o voltímetro indicará 23.565
(admitindo que ele está construído para fornecer o valor mais próximo da sua escala, ao que se
chama “arredondar para o valor mais próximo”). Se o verdadeiro valor fosse antes, por hipótese,
23.5654 V ele marcaria de novo 23.565. Em resumo, a indicação 23.565 corresponde a um valor
compreendido entre 23.5645 e 23.5655.

Departamento de Física da FCTUC 6/22


Física Laboratorial Ano Lectivo 2003/04
Esta situação é muito comum e convencionou-se que, em alternativa a escrever explicitamente o
intervalo de imprecisão como atrás (23.5650 ± 0.0005), o último algarismo indica que o verdadeiro
valor está num intervalo de amplitude igual à unidade dessa ordem e centrado no valor dado, ou
seja, corresponde ao valor ± meia unidade da ordem seguinte. O limite superior do erro é esta meia
unidade da ordem seguinte. Apresenta-se o resultado da medição como sendo 23.565 em que os
algarismos tomam o nome de “algarismos significativos”. O último algarismo tem um significado
especial, como se viu no exemplo do voltímetro, pois indica qual a incerteza no valor medido. Pode,
por isso, ser um zero. Por exemplo, utilizando esta convenção 7.4200 tem 5 algarismos
significativos e indica que o verdadeiro valor está entre 7.41995 e 7.42005. Se o resultado é
expresso por um número sem parte decimal, escreve-se em notação científica e usa-se a convenção
acima. Exemplo: 670000 com 3 algarismos significativos escreve-se 6.70x105.

Ao efectuar operações com números nesta convenção, devem também adoptar-se algumas regras
para apresentação dos resultados. Vamos ilustrar com exemplos.
Seja o primeiro multiplicar 5.74 por 3.8 em que estes valores obedecem à convenção dos
algarismos significativos. O produto dá 21.812 mas como o primeiro factor indica um valor
qualquer compreendido entre 5.735 e 5.745 e o segundo um valor entre 3.75 e 3.85, só podemos
afirmar que o produto estará entre:
5.735 x 3.75 = 21.50625 e 5.745 x 3.85 = 22.11825.

Se quisermos representar o produto dentro da convenção dos algarismos significativos devemos


adoptar apenas o número 22. Evidentemente que, ao proceder assim, estamos a afirmar que o valor
está entre 21.5 e 22.5 o que, sendo verdade, alarga porém a imprecisão. A vantagem está na
simplificação que advém da adopção neste caso de uma regra simples como a que se segue:

Multiplicação, divisão e raiz quadrada: o número total de algarismos significativos do resultado é o


número total de algarismos significativos do factor que tiver menor número deles.
Ex: 56.25 x 5.37 = 302.0625 mas como 5.37 tem 3 algarismos significativos há que arredondar o
resultado para 302.

Adição e subtracção: o número de casas decimais significativas do resultado é o da parcela que tiver
menor número delas.
Ex: 4.17 + 1.6 = 5.77 mas como 1.6 tem 1 casa decimal significativa há que arredondar o resultado
para 5.8.

Departamento de Física da FCTUC 7/22


Física Laboratorial Ano Lectivo 2003/04
5.2 Caso de muitas medições da grandeza.

Sabemos já que, em virtude dos erros acidentais, se repetirmos a medição de uma mesma
grandeza física em condições supostas idênticas obtemos um conjunto de resultados diferentes. No
entanto, se não houver erros de procedimento experimental, cada medida contribui com o seu
resultado para aumentar a informação sobre o verdadeiro valor, aumentando ainda em consequência
a precisão do resultado final obtido a partir do conjunto de resultados.

5.2.1 Distribuição de resultados


Um processo gráfico para exprimir os diferentes resultados obtidos consiste em desenhar um
histograma.

Para construir um histograma procede-se do seguinte modo:


1. Marcam-se no eixo das abcissas os valores máximo e mínimo das leituras obtidas;
2. Divide-se o intervalo assim obtido num número conveniente de sub-intervalos iguais;
3. Tendo por base cada um desses sub-intervalos constroem-se rectângulos cujas alturas sejam
proporcionais ao número de leituras de valor compreendido em cada sub-intervalo.

Suponhamos que um determinado comprimento é medido 30 vezes. Os sucessivos resultados


obtidos, x1, x2, ..., x30, estão representadas na Tabela I. Os valores mínimo e máximo desses
resultados são respectivamente,
99.2 e 113.0 mm.
Pode, assim, traçar-se o histograma para o intervalo [99, 113]. Dividindo este intervalo em, por
exemplo, sete sub-intervalos, pode estabelecer-se a Tabela II.
Tabela I
x1 = 105.2 mm x11 = 109.3 mm x21 = 107.3mm
x2 = 103.6 mm x12 = 105.9 mm x22 = 106.6mm
x3 = 110.3 mm x13 = 103.9 mm x23 = 105.3mm
x4 = 102.0 mm x14 = 104.0 mm x24 = 105.8mm
x5 = 101.5 mm x15 = 110.8 mm x25 = 104.5mm
x6 = 109.4 mm x16 = 113.0 mm x26 = 106.3mm
x7 = 103.6 mm x17 = 108.2 mm x27 = 106.1mm
x8 = 99.2 mm x18 = 102.4 mm x28 = 103.2mm
x9 = 108.0 mm x19 = 104.3 mm x29 = 106.9mm
x10 = 107.6 mm x20 = 109.3 mm x30 = 106.6mm

Departamento de Física da FCTUC 8/22


Física Laboratorial Ano Lectivo 2003/04
Tabela II
Intervalos Nº de leituras em cada intervalo
99-101 1
101-103 3
103-105 7
105-107 9
107-109 4
109-111 5
111-113 1

O histograma correspondente a estes resultados vem representado na fig.1.


Nº de leituras em cada intervalo

0
98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114

Comprimento/cm

Figura 1

Imaginemos agora que continuávamos a fazer medições até obter um número de resultados N
muito elevado. O histograma desta colecção hipotética de resultados tende, quando N → ∞ , a
tomar uma forma estável, que se designa por distribuição. O conjunto dos N resultados constitui
uma amostra da distribuição. Se o número N for efectivamente muito elevado, podemos escolher
intervalos com largura muito pequena e ter ainda um número apreciável de resultados em cada
intervalo. Se considerarmos que a grandeza pode tomar qualquer valor real dentro do seu domínio
(ou seja, é uma variável contínua), podemos considerar intervalos com largura infinitamente
pequena dx, e a linha poligonal correspondente ao contorno do histograma tende para uma curva
contínua. (fig. 2). Cada ponto da curva representa o número de resultados que caem em cada
intervalo infinitesimal (x, x+ dx).

Departamento de Física da FCTUC 9/22


Física Laboratorial Ano Lectivo 2003/04

f(x)

Figura 2

Podemos definir a função f(x), conhecida por função de distribuição, em que (após conveniente
+∞
norma1ização, ∫−∞
f ( x )dx = 1 ), f(x)dx representa a fracção dos resultados que se situa no intervalo

de x a x+dx. Por outras palavras, f(x)dx é a probabi1idade de que o resultado duma única medida se
situe no intervalo (x, x + dx).
Quando estas curvas são simétricas relativamente a uma recta paralela ao eixo das ordenadas e
que passa pelo seu máximo a média da distribuição coincide com o valor mais provável da
grandeza. A distribuição normal ou de Gauss é um exemplo de uma distribuição simétrica aplicável
a um vasto universo de situações em Física.

5.2.2. Estimativa do verdadeiro valor. Média aritmética.

Suponhamos que fazemos N medições sucessivas de uma mesma grandeza física e que estas
medições foram efectuadas sem que se verificasse qualquer erro sistemático ou de procedimento
experimental. Sejam x1, x2, ..., xN os resultados obtidos. A melhor estimativa do verdadeiro valor da
grandeza é dada pela média aritmética das leituras obtidas, ou seja, por:

(x1 + x2 + ... + x N ) ∑x i

x= = i =1
. (1)
N N

Admite-se que quanto maior o número de medidas realizadas mais o valor da média aritmética se
aproxima do verdadeiro valor da grandeza. A média aritmética tende para o verdadeiro valor no

Departamento de Física da FCTUC 10/22


Física Laboratorial Ano Lectivo 2003/04
limite de N → ∞ .
Por vezes não atribuímos igual confiança (ou peso) a todas as medidas realizadas. Isso não
significa que se devam desprezar as medidas de menor confiança pois elas contribuem também com
informação válida sobre o verdadeiro valor. Então, há que extrair o valor mais aproximado do
verdadeiro valor a partir de um conjunto de medidas não atribuindo a todas o mesmo peso. A média
pesada de um conjunto de N resultados xi, cada um com peso ωi é:
N

∑ω x i i

x= i =1
N
. (2)
∑ω
i =1
i

O peso ωi pode surgir em duas situações:


1ª: Se nas N medidas se obtiverem vários resultados com o mesmo valor xi, o peso é
simplesmente o número de medidas ni com esse resultado.
2ª: Se as diferentes medidas foram feitas com instrumentos diferentes ou em condições
experimentais diferentes, é natural que as dispersões de resultados com cada instrumento ou cada
situação experimental (se fizéssemos muitas medidas em cada um) fossem diferentes umas das
outras, ou seja, os intervalos de imprecisão σi são diferentes. Pressupõe-se naturalmente que se
conhecem ou podem ser estimados estes intervalos de imprecisão. Neste caso, embora se aproveite
toda a informação sobre o verdadeiro valor presente em cada resultado xi, vamos dar mais peso
àqueles para os quais a confiança é maior, ou seja, para os que têm um σi menor, segundo a
expressão:
N
xi
∑σ
i =1
x= N
i
(3)
1

i =1 σ i

5.2.3 Estimativa do intervalo de imprecisão. Desvio padrão dos resultados e da média.

Resta esclarecer qual o erro que se comete ao tomar a média aritmética como a melhor estimativa
do valor verdadeiro [1]. Este erro deve estar correlacionado com a dispersão de resultados. Por

[1] Repare-se que quantas mais vezes se repetir uma medida tanto maior é a probabilidade de reduzir os
efeitos dos erros acidentais ao considerar a média aritmética dos valores obtidos. Porém, por mais medidas
que se façam não se consegue aumentar o número de algarismos significativos de cada resultado. No entanto,
se conhecermos a forma da distribuição de probabilidades (p.ex. Gaussiana) e tivermos um mínimo de
valores possíveis para o resultado (barras no histograma de dispersão – quatro para a Gaussiana),
continuamos na situação de aproximação da média ao valor verdadeiro no limite de um número infinito de
medidas.
Departamento de Física da FCTUC 11/22
Física Laboratorial Ano Lectivo 2003/04
outro lado, uma vez que a média tende para o verdadeiro valor no limite de um número infinito de
medidas, esse erro deve ser definido também em função do número de medidas.
Adoptando a média aritmética como a melhor estimativa do verdadeiro valor, a noção de erro de
observação de uma dada medida individual vem agora substituída pela de “desvio” ou “resíduo” de
cada resultado do conjunto de medidas.
Seja x o valor verdadeiro da quantidade a medir e que evidentemente desconhecemos. O erro
absoluto δxi na leitura de ordem i é
δx i = x i − x .

Do mesmo modo, o erro δx na média aritmética será


δx = x − x .
Porém, estas duas expressões pressupõem o conhecimento do valor verdadeiro x. Para tornear essa
dificuldade trabalhamos em termos de “desvios” ou “resíduos”. O desvio da leitura i é definido por
d i = xi − x ,

quantidade que é já possível calcular.

Admitindo que se realizam N medidas experimentais da mesma grandeza, cada resultado obtido
apresenta um certo desvio (afastamento) relativamente ao valor médio calculado. Precisamos, então,
de um parâmetro que caracterize a dispersão das N medidas efectuadas. Um critério imediato
pareceria ser o de adoptar a simples média dos desvios, mas não pode ser utilizado pois dá sempre
zero. Com efeito:

N N N
1 1 1
d =
N
∑ ( xi − x ) =
i =1 N

i =1
xi −
N
∑x = x − x =0.
i =1

Este resultado é devido, evidentemente, às definições correlacionadas de média e desvio,


conduzindo a que haja desvios positivos e negativos cuja soma é nula. Isto sugere que, em vez dos
desvios, usemos os seus módulos ou os seus quadrados, por exemplo.
O desvio padrão dos resultados σN é a média quadrática dos desvios, ou seja, é a raiz quadrada
do valor médio dos quadrados dos desvios:

N
1
σN =
N
∑d
i =1
i
2
. (4)

A variância dos resultados é o valor médio dos quadrados dos desvios. É, portanto, o quadrado do
desvio padrão dos resultados:
Departamento de Física da FCTUC 12/22
Física Laboratorial Ano Lectivo 2003/04
N
1
σ N2 =
N
∑d
i =1
i
2
. (5)

Utilizam-se, também, o desvio padrão relativo ou o desvio padrão percentual:

σN σN
σ Nr = (6) ou σ N% = x100 (7),
x x
respectivamente.

O desvio padrão dos resultados σN não é ainda, no entanto, o melhor estimador da dispersão dos
resultados. Reparemos que na sua definição entramos com todos os N resultados para definir a
média, reduzindo assim em 1 o número de variáveis independentes. Não faz sentido, por outro lado,
definir um desvio padrão com N = 1. Utiliza-se então para estimador da dispersão de resultados o
chamado desvio padrão ajustado:

1 N 2
sN = ∑ di
N − 1 i =1
(8)

Para um número de medidas muito grande, os dois algoritmos dão resultados muito aproximados.
Há ainda que notar que, assim como a média tende para o valor verdadeiro da grandeza quando N
tende para infinito, também este sN tende para o desvio padrão da distribuição de probabilidades
subjacente às limitações do sistema e condições de medida.

Desvio padrão e variância da média - A própria média é uma variável aleatória que está também
sujeita a uma distribuição de probabilidade cuja variância, σ m2 , será tanto menor quanto maior for o

número N de determinações. Pensemos que se fizermos várias amostras de N medidas cada, não
vamos obter sempre a mesma média, e ainda que a dispersão destas médias se vai tornando cada vez
menor à medida que aumentarmos o número N de medidas, sendo mesmo nula no limite de N
infinito. Definimos assim o desvio padrão da média σm, cujo estimador é de novo um desvio padrão
ajustado:

sN
sm = . (9)
N
O intervalo x ± s m é adoptado como intervalo de imprecisão da estimativa ( x ) que se fez do

Departamento de Física da FCTUC 13/22


Física Laboratorial Ano Lectivo 2003/04

verdadeiro valor, sendo s m designado por erro mais provável. Note-se mais uma vez que este erro

é nulo quando N é infinito, ou seja, a média tende para o verdadeiro valor. Se considerarmos uma
distribuição Gaussiana para as médias resulta que o verdadeiro valor da grandeza tem uma
probabilidade de 68% de estar contido neste intervalo.

6. GRANDEZAS DE MEDIÇÃO DIRECTA E INDIRECTA. COMBINAÇÃO DE ERROS

Muitas vezes a medida de uma grandeza não pode ser realizada directamente e o seu valor tem
de ser calculado a partir da medida directa de outras grandezas com as quais se relaciona. Neste
caso, como as medidas realizadas directamente virão necessariamente afectadas por um erro
experimental, a questão que se coloca é saber como podemos estimar a imprecisão que afecta a
grandeza calculada a partir da imprecisão associada às medidas experimentais. Por exemplo,
poderemos medir a densidade d do material que constitui uma peça paralelipipédica medindo a sua
massa M e as dimensões a, b, e c da peça. A relação funcional entre a quantidade que pretendemos,
d, e as quantidades primárias M, a, b, e c é expressa por
M
d= .
a .b.c
Como as quantidades primárias são inevitavelmente medidas com um certo erro, interessa-nos
esclarecer de que maneira esses erros individuais se propagam ao resultado d.

Generalizando, designemos por Z a quantidade final e por A, B, C, etc. as quantidades primárias.


Suponhamos que cada uma destas quantidades primárias foi medida várias vezes. Então, no caso de
A teremos o valor mais provável A e o respectivo desvio padrão σ A . Do mesmo modo teremos B

e o desvio padrão σ B , e assim sucessivamente. Partimos do princípio de que as medidas das

quantidades primárias são independentes e, portanto, que os erros nelas cometidos são também
independentes. Seja então a função

Z = Z (A, B, C, ...)

e sejam σ A , σ B , etc. os desvios padrão em A , B , etc., respectivamente. Demonstra-se que o erro

em Z, σ Z , é dado pela expressão (fórmula de propagação dos erros):

2 2
 ∂Z   ∂Z 
(σ Z )2
=  σ A  +  σ B  + ... (10)
 ∂A   ∂B 
Departamento de Física da FCTUC 14/22
Física Laboratorial Ano Lectivo 2003/04

Apresenta-se a seguir uma tabela que indica as expressões de Z para algumas das relações mais
comuns entre Z e A, B, etc.:
Função Relação entre erros
Somas e Diferenças Z = A + B + ... (σ Z )2 = (σ A )2 + (σ B )2 + ...
Z = A − B + ...
Produto e quociente Z = A.B 2 2
σ Z  σ A  σ B 
2

Z = A/ B   =  + 
 Z   A  B 
2 2 2
σ Z  2σ  2σ 
  =n  A  +m  B 
Potências Z = A n xB m  Z   A  B 

Exemplo: Dada uma função Z = A − 2 B , onde A e B são medidas independentes, pretende-se


calcular a valor de Z e do seu erro σ Z a partir dos seguintes valores médios de A e de B:

A = 100 ± 3 m; B = 45 ± 2 m
Resolução:
O cálculo de Z é imediato: basta considerar que Z = A − 2 B e então Z = 100 − 2 x 45 = 10 m .
Para calcular σ Z , recorremos à expressão geral,
2 2

(σ Z )2 =  ∂Z σ A   ∂Z 
+  σ B  + ... ,
 ∂A   ∂B 

∂Z ∂Z
e como =1 e = −2
∂A ∂B

vem σ Z = 5 .
O resultado final será pois
Z = 10 ± 5 m .
Este resultado presta-se a algumas considerações. Verificamos assim que, embora os valores das
quantidades A e B estejam afectados de um desvio padrão relativamente baixo (< 5%), o mesmo não
acontece com o resultado final, onde o erro é quase tão elevado como o próprio valor de Z (o erro
relativo é de 50%!). Este exemplo indica que, se pretendermos que a imprecisão no resultado final
não exceda um valor prefixado temos de, utilizando a fórmula de propagação dos erros, determinar
quais os limites superiores do erro a admitir em cada uma das quantidades primárias. O processo de
medida duma (ou mais) dessas quantidades poderá ser crucial para que o erro final possa estar
Departamento de Física da FCTUC 15/22
Física Laboratorial Ano Lectivo 2003/04
dentro dos limites pretendidos.

7. AJUSTE DE UMA FUNÇÃO A DADOS EXPERIMENTAIS

Um problema geral da Física no estudo de um dado fenómeno é identificar as grandezas em jogo


e descobrir relações analíticas entre elas. Quando o faz diz que “explica” o fenómeno.
Concretizemos num exemplo propositadamente simples, para fixar ideias. Suponhamos que o
fenómeno é a passagem da corrente num condutor filiforme e as grandezas identificadas são por
exemplo a tensão aos seus extremos e a corrente que o atravessa. (Notar que a descrição do
fenómeno está deliberadamente estilizada, pois poderíamos fazer entrar como grandezas envolvidas
a temperatura do condutor, as dimensões, as propriedades elásticas, etc... .)

A 1ª questão que se põe ao físico é discernir qual o tipo de variação. Será do tipo linear, parabólico,
sinusoidal?...
No exemplo em causa, Ohm propôs uma dependência linear do tipo V = aI em que a é um
parâmetro a determinar experimentalmente. Àquele parâmetro empírico chamou-se resistência R e
foi possível, como se sabe, relacioná-lo com características geométricas e físicas do material
condutor:
l
a=R=ρ
s
em que ρ é um parâmetro a determinar experimentalmente.

De uma forma geral tenta-se descobrir o tipo de variação com base em várias considerações,
algumas de ordem física, outras por analogias com outros fenómenos, muitas vezes
semiempiricamente por simples análise dos resultados experimentais (teoria da correlação), que
mais tarde se procura interpretar. Como exemplo, recordar a fórmula empírica proposta por
Rydberg para a determinação das riscas do espectro do hidrogénio, mais tarde explicada por Bohr a
partir do seu modelo do átomo.

A 2ª questão é determinar quanto valem os parâmetros característicos do tipo de variação proposto

Ainda no exemplo em causa, para um dado condutor há que medir experimentalmente um certo
número de pares de valores das grandezas correlacionadas (Vi, Ii) e utilizar um critério para a
determinação do melhor verdadeiro valor para R. Veremos adiante como proceder por via analítica
para casos simples de variação linear como este.

A 3ª questão é formular um juízo de valor sobre as opções anteriores

Departamento de Física da FCTUC 16/22


Física Laboratorial Ano Lectivo 2003/04
Por exemplo, a variação linear da tensão com a intensidade da corrente não se verifica senão em
primeira aproximação. Depende, por exemplo, do aquecimento do condutor que por sua vez é
função da corrente (Lei de Joule). É por isso quase sempre necessário limitar a gama de valores das
grandezas para as quais as relações propostas são válidas, e com que aproximação elas são válidas.
Veremos que há critérios para testar quantitativamente a “qualidade” das opções escolhidas.

7.1 Representação gráfica dos pontos experimentais e “barras de erro”

Exemplifiquemos com um caso simples de um conjunto de 7 pontos experimentais representando


os resultados de 7 pares de medidas de duas grandezas correlacionadas y e x. Admitamos que os
erros na medição de x são desprezáveis em relação aos erros na medição de y.
Na figura 3 estão marcados os pontos
26

24
experimentais correspondentes a cada par

22
(xi, yi), e representados os desvios padrão

20 recta σi das medidas yi, sob a forma de

18 segmentos verticais (chamadas barras de


Y
16 erro) centrados nos pontos experimentais
14 e de comprimento 2σi. Esta representação
12 define completamente e de uma forma
10 compacta a gaussiana de distribuição de
0 1 2 3 4 5 6 7
cada um dos resultados yi, significando
X
que há um probabilidade de 68% do
Figura 3
verdadeiro valor da grandeza y estar
dentro do intervalo definido pela barra de erro, para o correspondente valor xi da grandeza x.

Nota 1 – Na figura admitiu-se que os desvios padrão dos diferentes valores yi eram todos iguais.
Não tem de ser forçosamente assim. Na medição do valor da grandeza y correspondente a um dado
valor da grandeza x as condições experimentais não são forçosamente as mesmas do que para outro
valor.

Nota 2 – Há ainda casos em que a distribuição de probabilidade dos valores de y não é gaussiana e
outras vezes nem sequer é simétrica, pelo que as barras de erro não são simétricas em relação ao
ponto representado, não se lhe atribuindo exactamente o mesmo significado que o indicado acima.

7.2 Ajuste de uma curva

Departamento de Física da FCTUC 17/22


Física Laboratorial Ano Lectivo 2003/04
Para esclarecer ideias procuremos, após analisarmos a figura, responder às questões formuladas
atrás, ou seja, estimar uma correlação entre os valores de x e os valores correspondentes de y, isto é
uma função da forma y = f(x) que pareça descrever da melhor maneira a dependência que y tem de
x. Vamos fazê-lo a sentimento para ilustrar o princípio do processo.
Tentando responder à primeira questão formulada tentou-se primeiro uma recta passando pela
origem. Com o cuidado de maximizar a proximidade da recta do conjunto de todos os pontos
experimentais desenhou-se a recta da Fig. 3 a que corresponde uma determinada expressão
matemática. Fez-se o que se chama uma tentativa de ajustamento ou ajuste de uma curva teórica
(neste caso uma recta) a dados experimentais, ou seja, respondeu-se à segunda questão formulada
atrás.
Seguindo para a terceira questão, por simples inspecção da figura é-se levado a opinar que o
ajuste de uma recta é mau. O grande afastamento da recta em relação ao extremo das barras de erro
para tantos pontos leva a crer que a probabilidade de ter obtido aquele conjunto de resultados dum
modo aleatório seria muito baixa se a correlação real fosse de facto uma recta.

Volta-se então de novo a formular a


primeira questão, tentando-se agora 26

uma parábola, e pode ver-se (Fig. 4) 24

que o ajuste de uma parábola é bastante 22

melhor, pois a curva já se aproxima ou 20


parábola
mesmo intersecta um número razoável 18
Y
de barras de erro, fazendo supor uma 16

probabilidade elevada para o conjunto 14

de resultados. 12

O processo de, após adopção de um 10


0 1 2 3 4 5 6 7
tipo de curva, obter a curva que melhor X
se ajusta deve evidentemente ser de
forma analítica, sistemática, e não a Figura 4
sentimento. Trataremos disso em
seguida para o caso das rectas. A ideia de qualidade do ajustamento necessita evidentemente de ser
quantificada e por isso trataremos no capítulo seguinte de um dos critérios mais usados para
caracterizar numericamente a qualidade do ajustamento (teste do qui-quadrado), determinando um
número de mérito para cada ajuste.

Recapitulando e generalizando, o problema do ajuste de curvas surge habitualmente de duas


Departamento de Física da FCTUC 18/22
Física Laboratorial Ano Lectivo 2003/04
maneiras:

1) – No primeiro caso está em estudo uma grandeza y que se supõe dependente de várias outras
y = f(x, u, v, z...) mas desconhece-se esse tipo de relação funcional e trata-se de induzir
empiricamente essa relação a partir da análise sistemática de um conjunto de medidas de x,
u, v, z, etc. e do correspondente valor de y.

2) Noutro caso constrói-se uma teoria a partir da qual se tenta prever qual a referida
dependência.

Quase nunca se está em posição de propor a expressão analítica de y mas sim o tipo de relação
analítica, isto é, se se trata de uma recta, de uma parábola ou outra curva qualquer, desconhecendo-
se em geral “ab initio” o valor dos parâmetros que contenha, os quais devem ser determinados a
partir dos dados experimentais. No caso de uma recta que passe pela origem, há um só parâmetro
desconhecido.

Proposta uma dependência funcional y = f(x, u, v, z..., a, b, c, ...) em que a, b, c, ... são os
parâmetros, há portanto que determinar o melhor conjunto de valores desses parâmetros para que os
valores
y = f(xi, ui, vi, zi... a, b, c, …)

(os muitas vezes chamados valores “teóricos”, que advêm para y por intermédio da função proposta
quando x, u, v, z, ... tomarem o conjunto de valores medidos xi, ui, vi, zi, ...), não se afastem
globalmente muito dos valores medidos yi correspondentes (ou como se diz muitas vezes “para que
a curva proposta se ajuste o melhor possível aos pontos experimentais”). O método que conduz à
escolha desses parâmetros decorre do princípio de máxima probabilidade, que diz (dum modo
abreviado) “Um conjunto de resultados é o mais provável”.

Em seguida é necessário verificar se essa melhor curva do tipo proposto se ajusta bem ou mal aos
pontos experimentais. Se se ajusta mal terá de se propor um novo tipo de curva.

7.3 Ajuste de rectas por método analítico

Estudaremos as variações do tipo y = kx e do tipo y = ax + b . Nestes casos é possível obter


fórmulas para os melhores valores dos parâmetros e respectivos intervalos de imprecisão, deduzidas

Departamento de Física da FCTUC 19/22


Física Laboratorial Ano Lectivo 2003/04
de uma vez para sempre a partir do princípio de máxima probabilidade. Algumas calculadoras de
bolso já contém os algoritmos respectivos pelo que basta fornecer-lhes os pares de valores (xi, yi)
para que indiquem os melhores valores para os parâmetros k ou a e b e seus desvios padrão.
Tratamos aqui dos casos em que se desprezam os erros nas medidas de x e em que se consideram os
erros nas medidas de y todos iguais a σy.

7.3.1 Ajuste de uma recta da forma y = kx aos pontos experimentais

Admita-se que a relação entre as grandezas x e y é da forma y = kx . Se as medidas não viessem


y1
afectadas de erro bastaria achar um par de valores (x1, y1) para se obter logo k = . Na realidade,
x1
os valores medidos têm erros e torna-se necessário melhorar a precisão aumentando a informação
disponível mediante mais medições de pares (x, y). O melhor verdadeiro valor para o parâmetro k é
dado pela expressão, aplicável a todos os casos enquadráveis nas aproximações descritas:

∑x y i i
k= i =1
N
(11)
∑x
i =1
2
i

Admitindo que o erro associado a todos os yi é o mesmo, como se referiu, o desvio padrão das
medidas yi é
N
1
∑ (y − kxi )
2
σ = i (12)
N i =1

e o erro mais provável associado ao parâmetro k é

σ y2
σk = . (13)
∑x i
2
i

7.3.2 Ajuste de uma recta da forma y = ax + b aos pontos experimentais

De novo por aplicação do princípio de máxima probabilidade, obtêm-se expressões para os


melhores valores verdadeiros dos parâmetros a e b, válidas para qualquer caso enquadrado nas
Departamento de Física da FCTUC 20/22
Física Laboratorial Ano Lectivo 2003/04
aproximações descritas:
    
N  ∑ xi y i  −  ∑ xi  ∑ y i 
a=  i   i  i
2
 (14)
   
N  ∑ xi2  −  ∑ xi 
 i   i 

     
 ∑ y i  ∑ xi2  −  ∑ xi y i  ∑ xi 
b=  i   i  i .
i
2
(15)
   
N  ∑ xi2  −  ∑ xi 
 i   i 

Neste caso, o desvio padrão dos valores de y é dado por:

N
1
∑ [ y − (ax + b )]
2
σ = i . (16)
N i =1

E o desvio padrão dos parâmetros a e b vem dado por:

N 2
σa = σy (17)

∑x 2
i
σb = i
, (18)

2
   
onde ∆ = N  ∑ xi2  −  ∑ xi 
 i   i 

8. AVALIAÇÃO DA QUALIDADE DO AJUSTE DE UMA FUNÇÃO AOS DADOS EXPERIMENTAIS. TESTE DO


QUI-QUADRADO

Trata-se de arranjar um número cujo valor permita estabelecer juízos padronizados sobre a
qualidade do ajustamento da recta, ou de qualquer outra função, aos dados experimentais. Esse
número denomina-se “qui-quadrado”, χ2, e é dado por:

Departamento de Física da FCTUC 21/22


Física Laboratorial Ano Lectivo 2003/04

χ2 = ∑
N
[ y( xi ) − yi ]2 , (19)
i =1 σ i2

onde y(xi) são os valores de y obtidos a partir do ajuste da recta y = ax + b aos N pares de valores
(xi, yi) e σi são os desvios padrão nos valores medidos yi.

No entanto, um dado valor de χ2, por si só, não indica se se trata de um bom ou mau ajuste. Esta
indicação é fornecida pelo qui-quadrado normalizado, χ 2n , ou seja, pelo quociente entre o χ2 e o nº

de graus de liberdade ν:
χ2
χ =
2
n , com ν = N − r − 1 , em que N é o número de pares de valores experimentais e r é o
ν
número de parâmetros a ajustar. No caso da recta há 1 (k) ou 2 (a e b) parâmetros a ajustar.

Um bom ajuste caracteriza-se por um valor de χ 2n muito próximo de 1. Quanto mais χ 2n se afaste de
1, pior será a qualidade do ajuste.

Bibliografia

- N. Ayres de Campos, Análise de Dados, Coimbra, Departamento de Física da Universidade


(2003/04).

- P.R. Bevington e D.K. Robinson, Data reduction and error analysis for the physical sciences, 2ª
edição, WCB/McGraw-Hill (1992).

Departamento de Física da FCTUC 22/22