Você está na página 1de 154

Anlise da Incerteza

Uma Introduo ao Estudo das Incertezas


nas Medies de Engenharia

Marco Antnio Ribeiro

Anlise da Incerteza
Uma Introduo ao Estudo das Incertezas nas
Medies de Engenharia

Marco Antnio Ribeiro


Quem pensa claramente e domina a fundo aquilo de que fala, exprime-se claramente e de modo
compreensvel. Quem se exprime de modo obscuro e pretensioso mostra logo que no entende muito
bem o assunto em questo ou ento, que tem razo para evitar falar claramente (Rosa Luxemburg)

2002, Tek Treinamento & Consultoria Ltda


Salvador, Vero 2002

Prefcio
O presente trabalho foi escrito como suporte de um curso ministrado a engenheiros e tcnicos
ligados, de algum modo, medio de alguma grandeza fsica. Ele uma continuao natural do curso
de Metrologia Industrial, que enfoca os aspectos tcnicos, fsicos e matemticos da incerteza da
medio de uma grandeza fsica. Ele apresenta mtodos e aplicaes para clculo da incerteza na
medio.
Na primeira parte, h cinco captulos tratando dos seguintes assuntos:
1. Descrio Preliminar da Anlise da Incerteza
2. Como Reportar e Usar Incertezas
3. Propagao das Incertezas
4. Anlise Estatstica das Incertezas Aleatrias
5. Distribuio Normal ou de Gauss
Na segunda parte do trabalho, quando se tem um maior aprofundamento terico e uma maior
exigncia de matemtica, so apresentados sete captulos:
6. Rejeio de Dados
7. Mdias Ponderadas
8. Mtodo dos Mnimos Quadrados
9. Covarincia e Correlao
10. Distribuio Binomial
11. Distribuio de Poisson
12. Teste do Qui Quadrado para uma Distribuio
H ainda quatro apndices, apresentando tabelas de probabilidades,
1. Apndice A: Integral do Erro Normal, I
2. Apndice B: Integral do Erro Normal, II
3. Apndice C: Probabilidades para Coeficientes de Correlao
4. Apndice D: Probabilidades para Qui Quadrado
H, em separado, um outro trabalho com problemas propostos sobre cada captulo, com trs
diferentes graus de dificuldade e trabalho.
O trabalho dever ser revisto logo, quando sero melhorados os desenhos, editadas figuras
melhores e eliminados os inmeros e pequenos erros aleatrios de datilografia e alguns eventuais
erros sistemticos.
Sugestes e crticas destrutivas so benvindas ao endereo do autor: Rua Carmen Miranda 52, A
903, CEP 41810-670, Fone 55 71 3452-4286 e Celular 55 71 9979 9955, Skype Marcotek27 ou
e-mail: marcotek@uol.com.br
Marco Antnio Ribeiro
Salvador, BA, vero 2002

Autor
Marco Antnio Ribeiro nasceu em Arax, MG, no dia 27 de maio de 1943, s 7:00 horas A.M..
Formou-se pelo Instituto Tecnolgico de Aeronutica (ITA), em Engenharia Eletrnica, em 1969.
Foi professor de Matemtica, no Instituto de Matemtica da Universidade Federal da Bahia (UFBA)
(1974-1975), professor de Eletrnica na Escola Politcnica da UFBA (1976-1977), professor de
Instrumentao e Controle de Processo no Centro de Educao Tecnolgica da Bahia (CENTEC)
(1978-1985) e professor convidado de Instrumentao e Controle de Processo nos cursos da Petrobrs
(desde 1978).
Foi gerente regional Norte Nordeste da Foxboro (1973-1986). J fez vrios cursos de
especializao em instrumentao e controle na Foxboro Co., em Foxboro, MA, Houston (TX) e na
Foxboro Argentina, Buenos Aires.
Possui dezenas de artigos publicados em revistas nacionais e anais de congressos e seminrios;
ganhador do 2o prmio Bristol-Babcock, no Congresso do IBP, Salvador, BA, 1979.
Desde agosto de 1987 diretor da Tek Treinamento & Consultoria Ltda, firma dedicada
instrumentao, controle de processo, medio de vazo, aplicao de instrumentos eltricos em reas
classificadas, Implantao de normas ISO 9000 e integrao de sistemas digitais.
Suas caractersticas metrolgicas so:
altura: (1,70 01) m;
peso correspondente massa de (76 2) kg;
cor dos olhos: castanhos (cor subjetiva, no do arco ris)., cor dos cabelos (sobreviventes):
originalmente negros, se tornando brancos;
tamanho do p: 40 (aplicvel no Brasil, adimensional).
Gosta de xadrez, corrida, fotografia, msica de Beethoven, leitura, trabalho, curtir os filhos e a vida.
Corre, todos os dias, cerca de (10 2) km e joga xadrez relmpago (5 min para cada jogador) todos os
fins de semana. provavelmente o melhor jogador de xadrez entre os corredores e o melhor corredor
entre os jogadores de xadrez, o que no nenhuma vantagem.

Contedo
Parte 1
1. Introduo

11
1

1.1. Introduo
1
1.2. Erro ou incerteza
1
1.3. Inevitabilidade da incerteza
1
1.4. Importncia de se conhecer as incertezas
1.5. Estimativa da incerteza e escalas
3
1.6. Incerteza em medies repetidas
4
2. Expresso da Incerteza

2.1. Introduo
6
2.2. Melhor estimativa incerteza
6
2.3. Algarismos significativos
7
2.4. Discrepncia
8
2.5. Comparao dos valores medido e aceito
2.6. Comparao de dois nmeros medidos10
2.7. Verificando relaes com grficos 12
2.8. Incertezas relativas
15
2.9. Algarismo significativo e incerteza relativa
2.10. Multiplicao de duas medies 16
Definies e Equaes do Cap. 2
Formas para expressar incertezas
Discrepncia
Incerteza Relativa
3. Propagao da Incerteza

16

18
18
18
18
19

3.1. Introduo
19
3.2. Incertezas nas medies diretas
19
3.3. Regra da raiz quadrada para uma contagem
3.4. Somas e diferenas; produtos e quocientes
3.5. Dois casos especiais importantes
23
3.6. Incertezas independentes na soma 25
3.7. Mais acerca de incertezas independentes
3.8. Funes arbitrrias de uma varivel 28
3.9. Propagao passo a passo
30
3.10. Exemplos
31
3.11. Frmula geral para propagao da incerteza
Definies e Equaes do Captulo 3
38
Regra da raiz quadrada para contagem
38
Regras para propagao da incerteza
38
Somas e diferenas
38
Produtos e quocientes
38
Quantidade medida vezes nmero exato 38
Incerteza na potncia
38
Incerteza em uma funo de uma varivel38
Frmula geral para propagao da incerteza 38

20
21

27

34

4. Incertezas Aleatrias

39

4.1. Introduo
39
4.2. Incertezas aleatrias e sistemticas 39
4.3. Mdia e desvio padro
41
4.4. Desvio padro como incerteza em uma medio isolada
4.5. Desvio padro da mdia
45
4.6. Incertezas sistemticas
47
Principais Definies e Equaes do Captulo 4
Mdia

50

Desvio padro
Desvio padro da mdia

50
50

5. Distribuio de Gauss

50

51

5.1. Introduo
51
5.2. Histogramas e distribuies
51
5.3. Distribuies limites
54
5.4. Distribuio normal
56
5.5. Desvio padro como limite de confiana de 68% 59
5.6. Justificativa da mdia como melhor estimativa 60
5.7. Justificativa da soma quadrtica
62
5.8. Desvio padro da mdia
65
5.9. Aceitao de um resultado medido 67
Principais Definies e Equaes do Captulo 5
Distribuies limites
70
Distribuio normal ou de Gauss
70
Estimando X e de N valores medidos 70
Aceitao de um resultado medido
71
Parte 2

72

6. Rejeio de Dados

73

6.1. Introduo
6.2. Problema da rejeio de dados
6.3. Critrio de Chauvenet
6.4. Discusso

70

73
73
74
75

Principais definies e equaes do Captulo 6


7. Mdias Ponderadas
7.1. Introduo
7.2. Problema de combinar medies
7.3. Mdia Ponderada
7.4. Um exemplo

76

77
77
77
77
79

Principais definies e equaes do Captulo 7

80

44

8. Mnimos Quadrados

81

8.1. Introduo
81
8.2. Dados que devem se adequar reta 81
8.3. Clculo das constantes A e B
82
8.4. Incertezas nas medies de y
84
8.5. Incertezas nas constantes A e B
85
8.6. Exemplo: Medio do zero absoluto com um termmetro de gs a volume constante 86
8.7. Encaixe dos mnimos quadrados em outras curvas
88
Principais Definies e Equaes do Captulo 8
91
Linha reta atravs da origem (y = Bx); pesos iguais 91
Encaixe ponderado para uma linha reta, y = A + Bx 91
Outras curvas
92
9. Covarincia e Correlao

93

9.1. Introduo
93
9.2. Reviso de propagao da incerteza 93
9.3. Covarincia na propagao da incerteza 94
9.4. Coeficiente de correlao linear
97
9.5. Significado quantitativo de r
99
9.6. Exemplos
101
Principais Definies e Equaes do Captulo 9
Covarincia
102
Coeficiente de correlao
102
10. Distribuio Binomial

102

103

10.1. Introduo
103
10.2. Distribuies
103
10.3. Probabilidade no lanamento de dados 103
10.4. Definio da distribuio binomial104
10.5. Propriedades da distribuio binomial 106
10.6. Distribuio de Gauss para incertezas aleatrias 107
10.7. Aplicaes e teste de hiptese
108
Principais Definies e Equaes do Captulo 10
112
Distribuio Binomial
112
Aproximao gaussiana para a distribuio binomial 112
11. Distribuio de Poisson

113

11.1. Introduo
113
11.2. Definio da distribuio de Poisson113
11.3. Propriedades da distribuio de Poisson
11.4. Aplicaes
117
11.5. Subtraindo um background
118

115

Definies e Equaes do Captulo 11


120
Distribuio de Poisson
120
Aproximao gaussiana para a distribuio de Poisson
Subtraindo o rudo
120

120

12. Teste do Qui-Quadrado

121

12.1. Introduo
121
12.2. Introduo ao Qui Quadrado
121
12.3. Definio geral do Qui Quadrado 123
12.4. Graus de liberdade e 2 reduzido 126
12.5. Probabilidades para qui quadrado 127
12.6. Exemplos
130
Principais Definies e Equaes do Captulo 12.
Definio de qui quadrado
133
Graus de liberdade e qui quadrado reduzido 133
Probabilidades para qui quadrado.
133
Apndice A

134

Integral do Erro Normal I

134

Apndice B

136

Integral do Erro Normal, II

136

Apndice C

138

Probabilidades para Coeficientes de Correlao


Apndice D

140

Probabilidades para Qui Quadrado (2) 140

10

133

138

Parte 1
1. Descrio Preliminar da Anlise da Incerteza
2. Como Reportar e Usar Incertezas
3. Propagao das Incertezas
4. Anlise Estatstica das Incertezas Aleatrias
5. Distribuio Normal
A Parte 1 introduz as idias bsicas da anlise da
incerteza como elas so necessrias em um curso tpico de
Clculo de Incerteza na indstria. Os primeiros dois captulos
descrevem
1. o que anlise da incerteza
2. porque ela importante
3. como ela pode ser usada nos relatrios de uma oficina
de instrumentao
O Captulo 3 descreve a propagao da incerteza, desde
que as incertezas nas medies originais se propagam atravs
de clculos para causar incertezas nos resultados finais
reportados. Captulos 4 e 5 introduzem os mtodos estatsticos
atravs dos quais as incertezas aleatrias podem ser
calculadas.

11

1. Introduo
Esta medio grosseira tem certamente uma
grande incerteza. Se pressionado, o carpinteiro
poderia expressar a incerteza admitindo que a
altura poderia estar entre 200 e 220 cm. Se
fosse exigida uma medio mais exata, o
carpinteiro usaria uma fita mtrica e poderia
achar a altura de 211,6 cm. Esta medio
certamente mais exata e confivel que a
primeira estimada, mas mesmo assim ela
possui ainda uma incerteza, pois impossvel
para o carpinteiro saber se a altura
exatamente 211,600 ou 211,601 cm, por
exemplo.
Esta incerteza residual pode ter vrias
fontes, algumas das quais sero discutidas
neste trabalho. Algumas causas podem ser
facilmente eliminadas, se o carpinteiro tomar
alguns cuidados normais e especiais. Por
exemplo, alguns cuidados que eliminariam as
incertezas seriam:
1. usar uma fita mtrica de boa qualidade
2. fazer a medio em local de boa
iluminao para que no haja engano
3. fazer a medio com cuidado, sem
enrolar a fita, colocando as
extremidades nos pontos corretos
H porm outras fontes de incertezas que
so inerentes ao processo de medio e nunca
podem ser eliminadas inteiramente. Por
exemplo, se o carpinteiro usar uma fita mtrica
graduada de um em um centmetro,
provavelmente os pontos extremos da medio
no coincidiro exatamente com a marcao
da fita e o carpinteiro deve estimar onde a
extremidade cai entre duas marcaes. Mesmo
se a extremidade do comprimento medido cair
em cima da marcao, a marcao possui uma
determinada espessura de alguns milmetros.
Em qualquer caso, o carpinteiro deve estimar
onde a extremidade da porta cai em relao s
marcaes da fita e isto causa alguma
incerteza na medio.
Usando-se uma fita com melhor qualidade
e com maior nmero de marcaes, por
exemplo de um em um milmetro, o problema
se repete. Em vez de ter uma incerteza de
frao de centmetro, tem-se agora uma
incerteza de frao de milmetro. Se o
carpinteiro tiver uma obsesso em determinar a
altura da porta com a maior preciso
tecnicamente possvel, ele poderia usar um
interfermetro a laser (que poderia custar o
preo do apartamento onde se quer colocar a
porta). Mas mesmo com esta sofisticada

1.1. Introduo
A anlise da incerteza o estudo e clculo
da incerteza na medio. A experincia mostra
que nenhuma medio, mesmo aquela feita
com o maior cuidado possvel ou com o melhor
instrumento possvel, pode ser completamente
livre de incertezas. Como a estrutura e
aplicao da cincia dependem das medies,
a habilidade de avaliar estas incertezas e
mant-las em um valor mnimo muito
importante.
Este primeiro captulo descreve algumas
medies simples que ilustram a ocorrncia
inevitvel de incertezas experimentais e mostra
a importncia de se conhecer os valores destas
incertezas. O captulo descreve como o
tamanho das incertezas experimentais pode
ser estimado de modo realista, s vezes por
meio de mtodos simples.

1.2. Erro ou incerteza


Na instrumentao, a palavra erro tem
vrios significados, que geralmente no tem a
conotao usual de engano ou desacerto. Erro
na teoria de controle a diferena entre a
medio e o ponto de ajuste. Erro na teoria da
medio significa a incerteza inevitvel que
est presente em todas as medies. Em
metrologia, erro no engano. O erro na
medio no pode ser eliminado, mesmo
sendo cuidadoso e atencioso. O melhor que se
pode esperar na medio garantir que os
erros associados sejam razoavelmente
pequenos e estimar com confiana que eles
estejam dentro de determinados intervalos.
Normas e textos especializados apresentam
definies complexas de erro. Por enquanto,
erro usado exclusivamente no sentido de
incerteza e as duas palavras, erro e incerteza,
so usadas indistintamente e podem ser
intercambiveis.

1.3. Inevitabilidade da incerteza


Para ilustrar como a incerteza da medio
inevitvel e pode assumir diferentes valores,
seja, por exemplo, um carpinteiro que quer
saber a altura de uma buraco para instalar uma
porta. Como uma primeira estimativa, sem usar
nenhum instrumento de medio e baseado em
sua experincia ele poderia simplesmente olhar
o buraco e estimar que sua altura de 210 cm.

Introduo
parafernlia de medio, o resultado final ainda
teria incerteza, agora da ordem de 10-6 m.
Mesmo que o carpinteiro consiga agora medir a
altura da porta com uma preciso fantstica,
ele ainda no sabe a altura exata da porta.
Quando o carpinteiro se esfora para
conseguir preciso maior, ele ainda encontra
um importante problema de medio. Ele logo
saber que a altura da porta diferente em
pontos diferentes. Mesmo se ele considera
apenas um ponto, a altura ir variar com a
temperatura e umidade relativa do ambiente. A
altura depende da sujeira e poeira depositada
no ponto de medio. Resumindo, o carpinteiro
conclui que no existe a coisa chamada de
altura da porta. Este tipo de problema
chamado de problema de definio: a altura
da porta no uma quantidade bem definida.
A experincia do carpinteiro ilustra um
ponto verdadeiro: nenhuma quantidade fsica
(comprimento, tempo, massa, temperatura,
presso, corrente eltrica, por exemplo) pode
ser medida com certeza completa. Com
cuidado, pode-se diminuir algumas incertezas e
eliminar outras incertezas, de modo que a
incerteza resultante final seja extremamente
pequena porm, eliminar todas as incertezas
impossvel. Neste trabalho, sero vistas as
incertezas que podem ser eliminadas ou
diminudas e as que so inevitveis e
intrnsecas medio.
Felizmente, nem toda incerteza
importante ou de interesse prtico. Por
exemplo, quando se diz que a distncia entre a
casa e a escola de aproximadamente 2
quilmetros, se esta distncia significa algo
entre 1,5 e 2,5 km ou algo entre 1,99 ou 2,01
km geralmente no tem nenhuma importncia
prtica. Outras vezes, as incertezas so
importantes, porm, mesmo nestes casos ela
pode ter valores aceitveis. Quando o
carpinteiro instala a porta, ele deve conhecer
sua altura com uma incerteza de alguns
milmetros. Esta pequena incerteza pode ser
administrada e a porta instalada sem problema.
Se a incerteza for muito grande, o trabalho
para instalar a porta ser muito maior,
quebrando tijolos e cimento para aumentar o
espao ou colocando tijolos e cimento para
diminuir o espao. E assim que o carpinteiro
instala corretamente a porta, seu interesse pela
incerteza da altura da porta acaba totalmente.

Seja o problema que Arquimedes defrontou


h muito tempo atrs. O rei mandou o ourives
fazer uma coroa de ouro e entregou-lhe uma
determinada quantidade de ouro. Quando a
coroa estava pronta o rei queria garantir que
todo o ouro entregue foi usado para fazer a
coroa ou se o ourives substituiu o ouro por
cobre ou outro metal mais barato. Arquimedes
percebeu que o caminho do experimento era
atravs das densidades do ouro e da liga da
coroa. Sabendo que a densidade do ouro puro
de
ouro = 15,5 g/cm3
e medindo-se a densidade da liga da coroa,
possvel decidir se a coroa realmente de
ouro, comparando-se as duas densidades.
Supondo que a densidade da coroa seja de
coroa = 13,8 g/cm3
Sejam duas medies da densidade da
coroa. A primeira medio obtida de
coroa = 15 2 g/cm3
Esta medio garante que a densidade est no
intervalo de 13 a 17 g/cm3
A segunda medio obtida de
coroa = 13,9 0,2 g/cm3
Esta medio garante que a densidade est no
intervalo de 13,7 a 14,1 g/cm3
Os dois resultados so mostrados
graficamente na Fig. 1.1.
O primeiro ponto a notar nestes resultados
que, embora a segunda medio seja mais
precisa, a primeira medio provavelmente
tambm correta. Cada medio possui uma
faixa de valores dentro da qual se espera que a
densidade caia e estes valores se sobrepem,
de modo que perfeitamente possvel e
mesmo provvel que ambos os resultados
sejam corretos.
Os resultados da primeira medio
possuem incerteza to grande que ela no
til para resolver o problema da falsificao. As
densidades do ouro e da liga da coroa, ambas
caem dentro da faixa medida, de 13 a 17 g/cm3
, de modo que nenhuma concluso pode-se
tirar destas medies.
Por outro lado, a segunda medio indica
claramente que a coroa no de ouro puro,
pois a densidade da liga suspeita, 13,8 g/cm3
cai confortavelmente dentro da faixa estimada
de 13,7 a 14,1 g/cm3 e a densidade do ouro,

1.4. Importncia de se conhecer as


incertezas
O exemplo do carpinteiro medindo a altura
da porta ilustra como as incertezas esto
sempre presentes nas medies. Agora ser
visto como importante conhecer o tamanho
real das incertezas.

Introduo
15,5 g/cm3 est longe desta faixa. Como as
medies so feitas para se permitir uma
concluso, as incertezas experimentais no
podem ser muito grandes. Porm, as
incertezas no precisam ser extremamente
pequenas. Neste aspecto, este exemplo
tpico de muitas medies cientficas, para os
quais as incertezas devem ser razoavelmente
pequenas mas no precisam ser extremamente
pequenas.

O ponto mais importante com relao s


duas medies acima: 15 2 g/cm3 e 13,7
0,2 g/cm3 este: como a maioria das medies
industriais, elas devem ser inteis se elas no
inclurem afirmaes confiveis de suas
incertezas. De fato, se as duas medies forem
simplesmente 15 e 13,7 g/cm3, sem nenhuma
incerteza associada,
1. no se pode tirar nenhuma concluso
vlida das duas medies
2. pode-se realmente cometer um engano,
achando que a primeira medio parece
sugerir que a coroa genuna.

Densidade
3
(g/cm )

1.5. Estimativa da incerteza e escalas


Toda medio possui incertezas e
importante quantific-las. Porm, ainda no foi
visto como isto pode ser feito. Tal clculo pode
ser complicado e o principal objetivo deste
trabalho. Felizmente, a estimativa razovel da
incerteza de algumas medies simples pode
ser fcil, s vezes usando apenas o bom
senso.
O entendimento do exemplo simples
permite comear o entendimento da anlise da
incerteza nas medies industriais e de
laboratrio e forma a base para discusses
posteriores.
Seja a medio do comprimento de uma
barra, atravs de duas rguas diferentes. As
duas rguas tem o mesmo comprimento,
porm, a segunda escala possui maior nmero
de divises.

17

16
Ouro
a

1 medio

15
14

2 medio

Liga
13

Fig. 1.1. Duas medies da densidade de uma coroa


suposta de ouro. Os dois pontos mostram as melhores
estimativas das duas medies. As duas barras verticais
mostram suas margens de incerteza ou intervalos dentro
dos quais se acredita que as densidades provavelmente
caem. A incerteza da primeira medio to grande que
as densidades da coroa suspeita e ouro caem dentro de
suas margens de incerteza, de modo que esta medio
no determina qual material usado. A incerteza da
segunda medio dez vezes menor e sua medio
mostra que a coroa no feita de ouro.

Fig. 1.2. Medio com rgua com divises de 1 cm

Como a deciso se baseia na segunda


medio, 13,9 0,2 g/cm3, este resultado deve
ter suporte suficiente para garantir sua
validade. Em outras palavras, quem fez esta
medio deve justificar a faixa de valores
obtidos. Este ponto muitas vezes esquecido
pelo instrumentista que simplesmente
apresenta suas incertezas mas omite qualquer
justificativa. Sem uma breve explicao de
como a incerteza foi estimada, o resultado
quase intil.

Para medir o comprimento de uma barra,


inicialmente deve se colocar uma extremidade
no zero da rgua e depois decidir onde a outra
extremidade da barra cai na escala da rgua.
Assumindo que a rgua confivel (todas as
divises so iguais e esto uniformemente
distribudas), a medio consiste em decidir
onde um certo ponto cai em relao s divises
da rgua. Se a rgua no confivel, deve-se
considerar esta incerteza. A confiabilidade da
rgua obtida calibrando-a contra outra rgua
garantidamente confivel.

Introduo

Quando se mede o comprimento da mesma


barra, usando uma rgua do mesmo tamanho
porm com divises de 1 mm, o resultado
estar entre 62 e 63 mm e portanto razovel
atribuir o resultado da medio como 62,0 pois
a leitura cai entre as divises 2 e 3, porm
muito mais prximo de 2 do que de 3. Tambm
poderia ser lido 6,21 ou 6,22, que seria
igualmente aceitvel.
Assim, o resultado expresso como:

sem qualquer incerteza associada, presume


significar que x cai entre 62,05 e 62,15 cm.
Neste trabalho, esta conveno no
usada, pois a incerteza sempre ser indicada
explicitamente. De qualquer modo, deve-se
conhecer e entender esta conveno e saber
que ela aplicada a qualquer resultado sem
uma incerteza associada, especialmente
quando se usa mquina de calcular ou
computador, que fornecem a quantidade de
algarismos significativos que se quiser. Quando
se escreve o resultado obtido de uma
calculadora usada para computar as medies
de um instrumento, como 139,357 sem
qualquer qualificao, o leitor deste resultado
ir pensar que a medio resultou em 6
algarismos significativos, o que muito
improvvel.
O processo de estimar posies entre
divises da escala chamado de interpolao,
tcnica que pode ser melhorada com a prtica.
Pode-se discordar das estimativas dadas
pelos resultados anteriores. H quem ache que
o melhor resultado da medio da rgua
graduada em mm seria 62 mm e que
exagerado escrever 62,0 mm.
De qualquer modo, estes resultados so
estimativas razoveis de comprimentos
medidos e de suas incertezas provveis
associadas. A estimativa aproximada das
incertezas relativamente fcil quando o nico
problema fazer a leitura de um instrumento
analgico, que consiste em localizar o ponteiro
na escala graduada.

melhor estimativa dda medio = 6,20 cm

1.6. Incerteza em medies repetidas

As divises da rgua na Fig. 1.2 so


distantes 1 cm. Pode-se razoavelmente decidir
que o comprimento mostrado est, sem dvida,
mais prximo de 6 cm do que de 7 cm e um
resultado razovel 6,2 cm. Nenhuma leitura
mais precisa possvel. Neste caso, o
resultado pode ser expresso como:
melhor estimativa da medio = 6,2 cm
faixa provvel = 6,15 a 6,25 cm

Fig. 1.3. Medio com rgua com divises de 1 mm

Muitas medies incluem incertezas que


so mais difceis de estimar do que aquelas
associadas com a localizao de pontos em
uma escala graduada. Por exemplo, quando se
mede intervalo de tempo com um cronmetro,
a principal fonte de incerteza no a
dificuldade da leitura do dial mas a prpria
reao desconhecida em partir e parar o
cronmetro. Esta incerteza pode variar de 0,2 a
0,5 segundo. s vezes, estes tipos de
incertezas podem ser estimados com
confiana, quando se repetem as medies
vrias vezes. Por exemplo, seja a medio de
um intervalo, cujo primeiro resultado de 2,3 s.
De uma nica medio no se pode dizer nada
acerca da incerteza experimental da medio.
Mas, se a medio do mesmo intervalo de
tempo de 2,4 s razovel assumir que a
incerteza de 0,1 s. Se uma seqncia de 4
medies d os resultados:

faixa provvel = 6,195 a 6,205 cm


e pode-se dizer que o comprimento foi medido
at o milmetro mais prximo.
Este tipo de concluso - que a medio
est mais prxima de uma marca do que de
outra marca vizinha muito comum. Por esta
razo, o metrologista introduz a conveno que
a afirmao L = 62 mm, sem qualquer outra
qualificao, presume significar que L est
mais prximo de 62 do que de 61 ou 63. Assim,
L = 62 mm
significa
61,5 mm < L < 62,5 mm
Do mesmo modo, um resultado de
x = 62,1 cm

2,3 s

2,4 s

2,5 s

2,4 s

Introduo
pode-se ento comear a ter uma estimativa
mais realista.

um padro confivel, para detectar a incerteza


sistemtica.
Os exemplos discutidos mostram que
algumas incertezas experimentais podem ser
facilmente estimadas. Porm, h muitas
medies com incertezas que no so
facilmente calculadas. Tambm, s vezes, se
quer valores mais precisos para as incertezas
do que as simples estimativas discutidas.

1. A hiptese natural que a melhor


estimativa do tempo seja o valor mdio, 2,4
s.
2. Outra hiptese segura que o tempo
correto fique entre o valor menor, 2,3 e o
maior, 2,5. Assim, pode-se razoavelmente
concluir que:
melhor estimativa = mdia = 2,4 s
faixa provvel = 2,3 a 2,5 s
Sempre que se puder repetir a mesma
medio vrias vezes, o espalhamento dos
valores medidos d uma indicao valiosa da
incerteza das medies. Sero vistos mtodos
estatsticos para tratar tais medies repetidas.
Sob condies corretas, estes mtodos
estatsticos do uma estimativa mais exata da
incerteza do que apenas o bom senso. Um
tratamento estatstico tambm tem a vantagem
de dar um valor objetivo para a incerteza,
independente do julgamento individual do
observador.
O tratamento estatstico tambm fornece
uma incerteza menor do que simplesmente a
faixa de valores entre a menor e a maior
medio. Assim, olhando as quatro medies
anteriores, julga-se que o tempo est
provavelmente em algum ponto entre 2,3 e 2,4
s. O mtodo estatstico correto mostra que,
com uma confiana de 70% o tempo fica entre
2,36 e 2,44 s.
Medies repetidas, como as mostradas no
exemplo anterior, nem sempre revelam as
incertezas, de modo confivel.
Deve-se garantir que a quantidade medida
sempre a mesma em todas as medies. Por
exemplo, quando se mede o ponto de ruptura
de dois fios supostamente iguais, atravs de
um teste e se obtm dois resultados diferentes,
esta diferena pode indicar que as medies
esto incorretas ou que os dois fios no eram
realmente iguais. Por si, a diferena entre os
dois resultados no diz nada acerca da
confiabilidade das medies.
Mesmo quando se tem a garantia que a
quantidade medida seja igual para cada
medio, as medies repetidas nem sempre
revelam as incertezas. Por exemplo, se o
instrumento de medio tiver uma incerteza
sistemtica, as medies repetidas no iro
revelar esta deficincia. As incertezas
sistemticas afetam todas as medies do
mesmo modo e difcil detect-las. Neste
caso, a soluo calibrar o instrumento contra

2. Expresso da Incerteza
1. a melhor estimativa do observador para
a quantidade medida o nmero
xestimado.
2. o observador est confiante que a
quantidade medida caia em algum
ponto entre xestimado - x e xestimado + x
O nmero x chamado de incerteza, erro,
margem de erro, tolerncia, desvio da medio
de x. Por convenincia, o nmero x sempre
positivo, de modo que xestimado - x sempre o
menor valor provvel da quantidade medida e
xestimado + x sempre o maior.
O significado da faixa xestimado - x a
xestimado + x foi deixado vago de propsito, mas
ele pode ser tornado mais preciso. Em uma
medio simples, como a da altura da porta,
pode se dizer com absoluta certeza que uma
faixa xestimado- x a xestimado + x inclui a
quantidade medida. Porm em muitas
medies industriais e cientficas esta
afirmao difcil de ser feita e garantida. Em
particular, para estar absolutamente certo que
a quantidade medida cai entre xestimado - x e
xestimado + x, deve-se escolher um valor to
grande para x que ele se torna intil. Para
evitar esta situao, pode-se s vezes escolher
um valor para x que se possa estabelecer
com uma certa percentagem de confiana que
a quantidade real caia dentro da faixa xestimado
x. Por exemplo, as pesquisas de votos
prximas s eleies geralmente estabelecem
que determinado candidato A tem 60% dos
votos do eleitorado, com uma margem de
3%, com limites de confiana de 95%. Isto
significa que o Instituto de Pesquisa est 95%
confiante que a percentagem de votos para o
candidato A est entre 57 e 63%. Depois das
eleies, pode-se esperar a resposta correta
para estar dentro das margens estabelecidas
de erro 95% do tempo e fora destas margens
somente 5% do tempo.
No se pode estabelecer uma percentagem
de confiana nas margens de erro at que se
entenda as leis estatsticas que governam o
processo da medio. Este assunto ser
tratado adiante. Por enquanto, basta definir a
incerteza x de modo que se esteja
razoavelmente certo que a quantidade medida
caia dentro do intervalo xestimado - x e xestimado +
x.

2.1. Introduo
Aps a leitura do Captulo 1, tem-se alguma
idia da importncia das incertezas
experimentais e como elas aparecem. Deve-se
tambm entender como as incertezas podem
ser estimadas em algumas poucas situaes
simples. Neste captulo, vai-se aprender
algumas regras e notaes bsicas da anlise
da incerteza e estudar exemplos de seu uso
em medies tpicas da indstria e laboratrio.
O objetivo familiarizar-se com o vocabulrio
bsico da anlise da incerteza e seu uso no
laboratrio e na oficina de instrumentao.

2.2. Melhor estimativa incerteza


J foi visto que o modo correto de
apresentar o resultado da medio dar a
melhor estimativa da medio e a faixa dentro
da qual se tem a confiana que a quantidade
fica. Por exemplo, o resultado dos intervalos de
tempo discutidos em 1.6 foram reportados
como
melhor estimativa de tempo = 2,4 s

faixa provvel: 2,3 a 2,5 s

(2.1)

Aqui, a melhor estimativa 2,4 s cai na


metade da faixa estimada de valores provveis,
2,3 a 2,5 s e isto acontece em todos os
exemplos. Esta relao natural e acontece na
maioria das medies. Ela permite que o
resultado da medio seja expresso em forma
compacta. Por exemplo, a medio do intervalo
de tempo usualmente estabelecido como:
valor medido do tempo = 2,4 0,1 s

(2.2)

Esta nica expresso (2.2) equivalente s


duas afirmaes anteriores da (2.1).
Em geral o resultado de qualquer medio
de uma quantidade x estabelecido como
valor medido de x = xestimado x

(2.3)

Esta expresso significa:

Expresso da Incerteza
proporcional muito grande de modo que
razovel reter dois algarismos significativos
para expressar x = 0,14. O mesmo argumento
poderia ser usado se o primeiro nmero for 2,
porm a reduo no to grande (metade da
reduo se o algarismo fosse 1).
Assim que a incerteza na medio
estimada, os algarismos significativos do valor
medido devem ser considerados.
Uma expresso como

Probleminha rpido 2.1.


(a) Um instrumentista mede o comprimento
de uma barra e reporta sua melhor estimativa
como 110 mm e a faixa em que o comprimento
provavelmente cai como 108 e 112 mm .
Reescrever este resultado na forma padro.
(b) Se outro instrumentista reporta sua
medio de corrente eltrica como sendo de
4,00 0,02 A; qual a faixa dentro da qual a
corrente provavelmente cai?

velocidade = 6 051,78 30 m/s (2.7)


certamente bem ridcula. A incerteza de 30
significa que o dgito 5 pode ser realmente to
pequeno quanto 2 ou to grande quanto 8.
Claramente, os dgitos 1, 7 e 8 que vem depois
do 5 no tem nenhum significado prtico.
Assim, a expresso correta seria

Resposta:
(a) 110 2 mm
(b) Entre 3,98 a 4,02 A

velocidade medida = 6050 30 m/s

(2.8)

2.3. Algarismos significativos


A regra geral esta

Devem ser estabelecidas algumas regras


para determinar as incertezas para que todas
informaes contidas na expresso sejam
entendidas universalmente e de modo
consistente entre quem escreve e quem l.
Como a quantidade x uma estimativa de
uma incerteza, obviamente ela no deve ser
estabelecida com preciso excessiva. Por
exemplo, estupidez expressar o resultado da
medio da acelerao da gravidade g como
gmedida = 9,82 0,0312 956 m/s2

Regra para expressar resultados


O ltimo algarismo significativo em
qualquer expresso de resultado deve ser
usualmente da mesma ordem de grandeza
(mesma posio decimal) que a incerteza.
(2.9)
Por exemplo, para uma expresso de
resultado 78,43 com uma incerteza de 0,04
seria arredondada para

(2.4)

78,43 0,04

A expresso correta seria


gmedida = 9,82 0,03 m/s2

Se a incerteza fosse de 0,4 ento ficaria

(2.5)

78,4 0,4
Regra para expressar incertezas
Se a incerteza fosse de 4, a expresso
ficaria

Incertezas industriais devem ser quase


sempre arredondadas para um nico algarismo
significativo
(2.6)

78 4
Finalmente, se a incerteza fosse de 40,
seria

Uma conseqncia prtica desta regra


que muitos clculos de erros podem ser feitos
mentalmente, sem uso de calculadora ou
mesmo de lpis e papel.
Esta regra tem somente uma exceo
importante. Se o primeiro algarismo na
incerteza x 1, ento recomendvel se
manter dois algarismos significativos em x.
Por exemplo, se um clculo resulta em uma
incerteza final de x = 0,14, um
arredondamento para x = 0,1 uma reduo

80 40
Para reduzir incertezas causadas pelo
arredondamento, quaisquer nmeros usados
nos clculos intermedirios devem
normalmente reter, no mnimo, um algarismo a
mais do que o finalmente justificado. No final
dos clculos, faz o ltimo arredondamento para
eliminar o algarismo extra insignificante.

Expresso da Incerteza
A incerteza em qualquer quantidade
medida tem a mesma dimenso que a
quantidade medida em si. Assim, escrevendo
as unidades (m/s2, g/cm3, A, V, oC ) aps o
resultado e a incerteza mais claro e mais
econmico.
Exemplo

(2.10)
Mais especificamente, cada uma das duas
medies consiste da melhor estimativa e uma
incerteza e a discrepncia definida como a
diferena entre as duas estimativas. Por
exemplo, se dois instrumentistas medem a
mesma resistncia como:

densidade medida = 8,23 0,05 g/cm3

Instrumentista A: 15 2
Instrumentista B: 25 4

ou
densidade medida = (8,23 0,05) g/cm3

A discrepncia entre as duas medies


discrepncia = 25 15 = 10

Quando se usa a notao cientfica, com


nmeros associados a potncias de 10,
tambm mais simples e claro colocar o
resultado e a incerteza na mesma forma.
Por exemplo:

A discrepncia pode ser significativa ou no


significativa (desprezvel).
Por exemplo, a discrepncia de 10 entre as
medies de 15 2 e 25 4 significativa
porque nenhum valor da resistncia compatvel
com as duas medies. Obviamente, no mnimo
uma das duas medies incorreta e deve se
pesquisar o que est de errado com ela.

corrente medida = (2,54 0,02) x 10-6 A


mais fcil de ler e interpretar do que na
forma:
corrente medida = 2,54 x 10-6 2 x 10-8 A

Em outro exemplo, com as duas medies


iguais a
Instrumentista C: 16 8
Instrumentista D: 26 9

Probleminha rpido 2.2.


Reescrever cada uma das seguintes
medies em sua forma mais apropriada:
(a) 8,123 456 0,031 2 m/s
(b) 3,123 4 x 104 2 m

Quando se fazem duas medies da


mesma quantidade, sempre h uma diferena
entre elas. Esta diferena chamada tambm
de discrepncia das duas medies.
Numericamente, a discrepncia entre duas
medies definida como a sua diferena:

Neste caso, a discrepncia contnua sendo


de 10 , porm insignificante, pois as
margens de erro das duas medies se
sobrepem confortavelmente e as duas
medies podem ser ambas consideradas
corretas.
Como concluso, a discrepncia entre duas
medies da mesma quantidade classificada
no apenas por seu valor absoluto mas pelo
seu valor comparado com as incertezas nas
medies.
Em laboratrio de Metrologia necessrio
medir quantidades que tem sido medidas
cuidadosamente muitas vezes antes e que
possuem um determinado valor aceito que
conhecido e publicado, como a constante
universal dos gases (R), tenso da clula de
Weston, carga do eltron. Este valor aceito no
exato, pois resultado de medies e como
toda medio, ele tambm possui incerteza
associada. Geralmente este valor aceito
muito mais preciso do que o conseguido nas
medies industriais. Por exemplo, o valor
aceito para a constante universal dos gases, R,

discrepncia = diferena entre dois valores


medidos da mesma quantidade

R aceito = 8,314 51 0,000 07 J/(mol.K)


(2.11)

(c) 5,678 9 x 10-7 3 x 10-9 kg

Respostas:
(a) 8,12 0,03 m/s
(b) (3,123 4 0,000 2) x 104 m ou 31 234 2 m
(c) (5,68 0,03) x 10-7 kg

2.4. Discrepncia

Expresso da Incerteza
No h nenhuma razo para duvidar que ambas as
medies so corretas, embora tenham incertezas muito
grandes.

Como esperado, este valor incerto, porm


sua incerteza extremamente pequena,
comparada com os padres da maioria dos
laboratrios de Metrologia. Assim, quando se
compara o valor medido desta constante com o
valor aceito, pode-se considerar o valor aceito
como exato.
H excees, principalmente em
laboratrios qumicos, quando se tem valores
publicados de ndices de refrao de vidros,
coeficientes isentrpicos de gases, onde os
valores publicados so pouco precisos, com
dois ou trs algarismos significativos.
Embora muitas experincias exijam
medio de uma quantidade cujo valor aceito
conhecido, poucas requerem medio de uma
quantidade cujo valor verdadeiro conhecido.
Por exemplo, quando se mede a relao da
circunferncia do crculo com seu dimetro, o
resultado verdadeiro exatamente . De fato o
valor verdadeiro de uma quantidade medida
pode quase nunca ser conhecido exatamente e
por isso difcil de definir tal valor verdadeiro.
O que existe o valor verdadeiro convencional,
fornecido por um padro rastreado.

2.5. Comparao dos valores medido e


aceito
Fazer uma experincia sem tirar algum tipo
de concluso tem pouca utilidade. Algumas
poucas experincias podem ter resultados
qualitativos, porm a maioria absoluta levam a
concluses quantitativas, que so expressas
como resultados numricos. O resultado de
uma nica medio geralmente no tem
interesse. Afirmaes de que a densidade de
algum metal foi medida e vale 9,3 0,2 g/cm3
ou que a temperatura medida de 25 3 oC
no tm interesse prtico. O que se quer, na
realidade, comparar dois ou mais nmeros:
uma medio e um valor aceito, uma medio
com um valor teoricamente esperado ou vrias
medies para mostrar que elas esto
relacionadas com outra de acordo com alguma
lei fsica ou curva de calibrao terica.
Quando de comparam dois nmeros, a anlise
da incerteza importante.
Talvez a experincia mais simples consista
na medio de uma quantidade cujo valor
aceito conhecido. O procedimento envolve:
1. medio da quantidade
2. estimativa da incerteza experimental
3. comparao destes valores com o valor
aceito
Por exemplo, seja a medio da velocidade
do som no ar, nas condies normais de
presso e temperatura. O metrologista A pode
obter:

Resistncia
()
40

40

30
B = 25 4
discrepncia = 10

20

D = 26 9

30

discrepncia = 10

20

A = 15 2
10

10

0
(a)

velocidade medida = 329 5 m/s

A = 16 8

(2.12)

comparada com o
valor aceito = 331 m/s

(b)

(2.13)

Esta medio do metrologista A parece


satisfatria, pois o valor aceito cai dentro dos
limites estabelecidos pelas margens de
incerteza da medio feita.
O significado da incerteza x que o valor
correto de x provavelmente cai entre xestimado
x e xestimado + x e certamente possvel que o
valor correto cai levemente fora desta faixa.
Deste modo, uma medio pode ser
considerada satisfatria mesmo se o valor
aceito caia levemente fora da faixa estimada do
valor medido.
Se no mesmo exemplo, o metrologista B
encontra o valor:

Fig. 2.1. (a) Duas medies da mesma quantidade.


Cada medio inclui uma melhor estimativa, mostrada por
um ponto e uma faixa de valores provveis, mostrada por
uma barra vertical de incerteza. A discrepncia, diferena
entre as duas melhores estimativas de 10 e
significativa porque muito maior do que a incerteza
combinada das duas medies. Com certeza, uma das
duas medies est incorreta.
(b) Duas medies diferentes da mesma resistncia.
A discrepncia ainda de 10 mas neste caso,
insignificante porque as margens do erro se sobrepem.

Expresso da Incerteza
provavelmente cai (1,50 a 1,62) e por isso,
estes momentos so consistentes com a
conservao dos momento. Se, ao contrrio,
as duas faixas provveis no forem
suficientemente prximas para haver
superposio, as medies so inconsistentes
com a lei da conservao do momento e deve
se procurar os erros nas medies ou clculos
ou erros sistemticos do mtodo usado (por
exemplo, gravidade ou atrito) que fazem as
medies se afastarem entre si.
conveniente repetir os pares de medies
(antes e depois) vrias vezes e fazer uma
tabela para a comparao direta dos
resultados. As incertezas geralmente diferem
um pouco de uma medio para outra e por
isso pode-se padronizar uma nica incerteza
para a medio anterior (p) e posterior (q)
como p = 0,03 e q = 0,06 kg.m/s.

velocidade medida = 325 5 m/s


ele poderia considerar que sua medio
consistente com o valor aceito de 331 m/s.
Porm, se o valor aceito est muito fora
das margens de erro (a discrepncia maior
que o dobro das incertezas, por exemplo), h
razo para supor que h algo errado. Por
exemplo, se o metrologista C encontra
velocidade medida = 345 2 m/s
comparada com a

(2.14)

velocidade aceita = 331 m/s

(2.15)

A discrepncia do metrologista C 14 m/s,


que 7 vezes maior que a incerteza da
medio, 2 m/s. Ele precisa verificar sua
medio e clculos para descobrir o que est
errado.
Infelizmente, a pesquisa do erro do
metrologista C pode ser complexa e demorada
porque h vrias causas e possibilidades:
1. o erro pode estar na medio
2. o erro pode estar nos clculos
3. a incerteza pode estar mal estimada
4. o valor aceito pode estar errado
5. as condies de temperatura e presso
da medio podem ser diferentes das
condies na qual o valor aceito
expresso
6. os instrumentos de medio podem
estar descalibrados e com erros
sistemticos
7. os procedimentos de medio podem
estar incorretos

Tab. 2.1. Momentos medidos (kg.m/s)


Medio Momento inicial p
(p 0,03)
1
1,49
2
3,10
3
2,16

Momento final q
(q 0,03)
1,56
3,12
2,05

Para cada par de medies, a faixa


provvel de valores para p sobrepe (ou quase
sobrepe) a faixa de valores provveis para q.
Se esta superposio acontece para todas as
medies, os resultados podem ser
considerados consistentes com a conservao
do momento. A recomendao fazer o maior
nmero possvel de medies com as
incertezas cada vez menores e verificar que os
resultados continuam consistentes com a
teoria.
Para uma grande quantidade de medies,
a comparao entre as duas medies, inicial e
final, pode se tornar tediosa e por isso
tambm conveniente acrescentar uma quarta
coluna tabela, colocando a diferena (p q).
Se o momento conservado, estas diferenas
devem ser consistentes com zero. No se deve
esquecer de computar a incerteza da diferena
(p q).
A computao para o clculo da incerteza
da diferena de duas medies feita do
seguinte modo. Sejam duas medies:

2.6. Comparao de dois nmeros


medidos
Muitas experincias envolvem a medio
de dois nmeros que so teoricamente iguais.
Por exemplo, a lei da conservao do momento
estabelece que o momento total de um sistema
isolado constante. Para comprovar esta lei,
pode-se fazer experincias com dois corpos
que colidem quando se movem ao longo de
uma pista sem atrito. Medem-se os momentos
totais dos dois corpos antes (p) e depois (q) da
coliso e verifica se p = q dentro das incertezas
da experincia. Para um simples par de
medies, os resultados podem ser:
momento inicial p = 1,49 0,03 kg.m/s

p medido = pestimado p

momento final q = 1,56 0,06 kg.m/s


e

q medido = qestimado q

Aqui a faixa em que p provavelmente cai


(1,46 a 1,52) sobrepe a faixa em que q

10

Expresso da Incerteza
Os nmeros pestimado e qestimado so as
melhores estimativas para p e q (por exemplo,
a mdia de vrias medies). Assim, a melhor
estimativa para a diferena (p q) (pestimado qestimado). Para encontrar a incerteza desta
diferena, deve-se tomar os maiores e
menores valores provveis de (p q). O maior
valor provvel para (p q) resulta de maior
valor de p (pestimado + p) menos o menor valor
de q (qestimado - q). Do mesmo modo, o menor
valor provvel para (p q) resulta do menor
valor de p (pestimado - p) menos o maior valor de
q.( qestimado + q). Assim, o maior valor provvel
da diferena vale:

p q (kg.m/s)
-0,20

-0,10

-0,10

valor esperado (zero)

-0,20

maior valor = (pestimado - qestimado) + (p + q)


(2.16)
Do mesmo modo,
Fig. 2.4. Trs diferenas de medies em um teste
de conservao do momento. O metrologista mediu o
momento total de dois corpos antes e depois de sua
coliso (p e q, respectivamente). Se o momento
conservado, as diferenas (p q) devem ser todas iguais
a zero. O grfico mostra o valor de (p q) com sua barra
de erro para cada diferena. O valor esperado zero est
dentro das margens de erro das diferenas 1 e 2 e est
um pouco fora da diferena 3. Pode-se concluir que estes
resultados so consistentes com a lei da conservao do
momento.

menor valor = (pestimado - qestimado) - (p + q)


(2.17)
Combinando as duas equaes, v-se que
a incerteza na diferena (p q) a soma das
incertezas de cada medio (p + q). Por
exemplo, se
p = 1,49 0,03 kg.m/s
q = 1,56 0,06 kg.m/s
ento
p q = -0,07 0,09 kg.m/s
Agora, pode se ver rapidamente se os
resultados so consistentes com a
conservao do momento, verificando se os
nmeros na coluna final so consistentes com
zero (so iguais a zero dentro da incerteza de
0,09). Outro mtodo mais eficiente plotar os
resultados em um grfico e verificar
visualmente os afastamentos e superposies
das medies.
Ainda outro mtodo alternativo, em vez de
fazer a diferena entre p e q, com valor
esperado (p q = 0), fazer a diviso entre p e
q, com o valor esperado p/q = 1. No caso da
diviso de duas medies, a incerteza final
diferente da subtrao de duas medies e
isso ser visto posteriormente.

A discusso sobre a incerteza em (p q)


se aplica diferena de quaisquer dois
resultados de medies. Quando se tem
quaisquer dois resultados de medies, x e y e
se usam estes dois nmeros para computar a
diferena (x y), a incerteza resultante na
diferena a soma das incertezas separadas
de x e y. Tem-se assim a seguinte regra
provisria (provisria porque ser visto, na
frente, que a incerteza mais provvel menor
que esta soma).

Incerteza na Diferena
(Regra provisria)
Se duas quantidades x e y so medidas
com incertezas de x e y e se os valores
medidos x e y so usados para se calcular a
diferena q = x y, a incerteza em q a soma
das incertezas em x e y:
x x + y

Tab. 2.2. Momentos medidos (kg.m/s)


#
1
2
3

Momento p
(p 0,03)
1,49
3,10
2,16

Momento q
(q 0,03)
1,56
3,12
2,05

Diferena
[(p - q) 0,09]
-0,07
-0,02
0,11

(2.18)

11

Expresso da Incerteza
Esta regra provisria (pessimista) ser
substituda posteriormente por outra regra
melhorada (otimista) onde a incerteza da soma
ser dada pela raiz quadrada da soma dos
quadrados das incertezas.
Tambm se pode considerar que h mais
de um modo de tratar a composio de
incertezas, quando se faz a soma ou subtrao
de vrias incertezas individuais. Os dois mais
usados so:
1. A incerteza da soma ou subtrao de
duas ou mais incertezas igual soma
aritmtica das incertezas individuais.
2. A incerteza da soma ou subtrao de
duas ou mais incertezas igual raiz
quadrada da soma dos quadrados das
incertezas individuais.
Quando se usa a regra da soma aritmtica:
1. mais fcil de entender
2. na maioria dos casos, ela mais
conservativa (maior) que a outra
3. em alguns casos a diferena entre as
duas pequena.
A regra provisria sobre a incerteza da
diferena entre duas medies a primeira de
uma srie de regras para a propagao da
incerteza. Para calcular a diferena entre duas
medies em termos das quantidades
individuais, necessrio conhecer como as
incertezas individuais se propagam para causar
a incerteza na diferena.

1. Lei de Ohm: V = R i (tenso igual ao


produto da resistncia pela corrente
eltrica)
2. Lei de Hooke: F = kx (fora igual
extenso da mola vezes uma
constante)
3. Lei de Newton: F = ma (fora aplicada
a um corpo igual ao produto da
massa por sua acelerao)
Quando uma quantidade y proporcional a
outra quantidade x, uma grfico de y contra x
uma linha reta passando pela origem. Assim,
para testar se uma quantidade y proporcional
a outra x, pode-se plotar os valores medidos de
y contra os de x e notar se os pontos
resultantes formam uma linha reta passando
pela origem. Como a linha reta facilmente
reconhecvel, este mtodo um modo simples
e efetivo para verificar a proporcionalidade.
Para ilustrar este uso de grficos, seja uma
experincia para testar a lei de Hooke: F = kx.
Um mtodo simples consiste em
1. dependurar verticalmente uma mola
2. colocar vrias massas m na mola
3. medir os deslocamentos x
Assim, a fora F o peso mg da carga e a
extenso x dada por:
x=

mg g
= m
k
k

(2.19)

A extenso da mola, x, deve ser


proporcional carga m e um grfico de x
contra m deve ser uma linha reta passando
pela origem.
Quando se medem os vrios valores de x
para uma variedade de cargas e colocam-se os
pontos no grfico, na prtica, todos os pontos
no formam uma reta perfeita e cada ponto
medido possui uma determinada incerteza.
A questo colocada : os resultados da
experincia se afastam da reta por causa das
incertezas experimentais, de erros de mtodo
ou da possibilidade de x no ser proporcional a
m. A resposta desta questo depende
basicamente da anlise das incertezas
envolvidas.

Probleminha rpido 2.3.


Quando se mede o calor latente do gelo,
um metrologista adiciona gelo gua e
observa a variao da temperatura quando o
gelo se derrete. Para determinar a massa de
gelo adicionado, o metrologista pesa o
vasilhame de gelo antes e depois de adicionar
o gelo e depois toma a diferena, obtendo os
seguintes resultados:
massa vaso + gua = m1 = 203 2 g
massa vaso + gua + gelo = m2 = 246 3 g
Encontrar a massa de gelo, m2 m1 , com sua
incerteza, usando a regra provisria.

Tab. 2.3. Carga e extenso da mola

Resposta: 43 5 g

Carga m, g
m (exata)
200
300
400
500
600
700
800

2.7. Verificando relaes com grficos


Muitas leis fsicas implicam que uma
quantidade linearmente proporcional outra.
Exemplos clssicos:

12

Extenso x, cm
x 0,3
1,1
1,5
1,9
2,8
3,4
3,5
4,6

Expresso da Incerteza
900

gerada pela placa de orifcio proporcional ao


quadrado da vazo volumtrica. Assim, no
caso genrico tem-se

5,4

Como sempre, as quantidades medidas,


extenso x e massa m, so sujeitas
incertezas. Como foi usada uma balana muito
precisa para medir as massas, a incerteza da
massa pode ser considerada desprezvel em
relao incerteza da medio do
comprimento, onde se usou uma rgua. Para a
medio do comprimento tem-se uma incerteza
de 0,3 cm. Para uma carga de 300 g, por
exemplo, tem-se a extenso de 1,5 0,3 cm.
Para este ponto, a extenso est na faixa de
1,3 a 1,8 cm. Esta faixa indicada, no grfico,
por uma barra de incerteza atravs de cada
ponto para indicar a faixa em que ele
provavelmente cai. Teoricamente, se espera
uma linha reta passando pela origem e por
todos os pontos medidos. Na prtica, a linha
reta passa atravs ou prxima de todos os
pontos. O problema consiste em concluir se a
extenso x linearmente proporcional carga
m e, caso afirmativo, qual este fator de
proporcionalidade (constante da mola).
Pela equao terica, a inclinao da curva
g/k. Medindo-se esta inclinao pode-se
determinar a constante da mola.
Se a maioria das faixas de pontos (valor
estimado e sua incerteza) est sobre a reta, os
dados podem ser considerados consistentes e
a lei de Hooke comprovada
experimentalmente.
Quando a maioria dos pontos cai fora da
linha reta, os dados so inconsistentes e x no
pode ser considerado proporcional a m. Neste
casos, as medies, clculos, mtodos e teoria
devem ser reconsiderados para se verificar por
que x no pode ser considerado linearmente
proporcional a m. Tambm pode acontecer que
um determinado conjunto de pontos caia dentro
da linha reta e outros pontos so inconsistentes
e neste caso a lei de Hooke vale somente para
determinados valores de m, por exemplo, at
600 gramas. Alm deste ponto a mola j no
segue a lei de Hooke. Nesta experincia, foi
considerada significativa apenas a incerteza do
comprimento da extenso da mola e foi
considerada desprezvel (em relao do
comprimento) a incerteza da massa e por isso
foram usadas barras verticais (com o valor
mais provvel no meio e com a incerteza
associada). Caso as duas incertezas sejam
significativas, usam-se quadrados ou duas
barras, uma vertical e outra horizontal,
mostrando as respectivas incertezas
associadas.
Um pouco mais complicado quando uma
quantidade proporcional ao quadrado de
outra. Por exemplo, a presso diferencial

y = A x2

(2.20)

onde A uma constante e o grfico de y contra


x d uma parbola, com a forma geral da Fig.
2.7 (a). Quando se faz uma srie de medies
de valores de y e x e colocam-se os pontos em
um grfico, obtm-se uma curva parecida com
a mostrada na Fig. 2.7 (b). Infelizmente, julgar
se os pontos pertencem parbola no to
fcil como a deciso com relao linha reta.
Porm, para verificar se y proporcional a x2
pode-se plotar y contra x ao quadrado,
obtendo-se uma reta, que mais facilmente
verificvel.
Do mesmo modo, se y = Axn (onde n
qualquer potncia), um grfico de y contra xn
deve dar uma linha reta e plotando os valores
medidos de y contra xn, pode-se verificar
facilmente se os pontos pertencem curva.
Existem ainda outras vrias situaes em que
uma relao no linear pode ser convertida em
linear, simplesmente pela escolha adequada
das variveis a plotar. Posteriormente sero
mostrados outros meios de linearizao.
Muitas vezes, a varivel y depende
exponencialmente de outra varivel x:
y = Ae Bx
onde A e B so constantes e e a base dos
logaritmos naturais (associados fenmenos
da Natureza) ou de Euler. Por exemplo, a
atividade da radioatividade depende
exponencialmente do tempo e a carga de um
capacitor depende exponencialmente da
corrente. Para a relao exponencial, o
logaritmo natural de x linear com y, de modo
que um grfico de ln(y) contra x d uma linha
reta para uma relao exponencial.

13

Expresso da Incerteza

5
x (cm)

0
0

500

1000

m (g)

Fig. 2.6. Medies com incertezas nas duas variveis,


mostradas com cruzes formadas com as incertezas de
cada varivel.

(a)
5
x (cm)

500

m (g)
1000

(b)

(a)

x
(b)

(c)

5
x (cm)

Fig. 2.7. (a) Se y proporcional a x2, um grfico de y


contra x d uma parbola com esta forma geral.
(b) Um grfico de y contra x para um conjunto de
valores medidos difcil de verificar visualmente se os
pontos se ajustam parbola.
(c) Um grfico de y contra x2 d uma linha reta
passando pela origem, que fcil de verificar.

m (g)
500

1000

(c)
Fig. 2.5. Grficos da extenso x da mola contra carga m.
(a) Os dados da Tab. 2.3 sem barras de incertezas.
(b) Os mesmos dados com barras de incertezas com
as incertezas em x. As incertezas em m so assumidas
desprezveis em relao s incertezas em x. Estes dados
so considerados consistentes com a proporcionalidade
esperada de x e m.
(c) Um diferente conjunto de dados, que so
inconsistentes com x sendo proporcional a m.

H muitos outros mtodos no grficos


para verificar a proporcionalidade de duas
quantidades. Por exemplo, se y linearmente
proporcional a x, a relao y/x deve ser uma
constante. Assim, tendo-se tabulado os valores
medidos de y e x, pode-se adicionar uma
coluna com as relaes y/x e verificar se estas
relaes so constantes dentro das incertezas
experimentais. H mtodos envolvendo o
coeficiente de correlao para mostrar se um
conjunto de medies est conforme uma linha
reta. Mesmo havendo tantos mtodos, o grfico
o modo mais simples e evidente de verificar a
adequao dos pontos diferentes curvas e
principalmente linha reta.

14

Expresso da Incerteza
qualidade de uma medio, qualquer que seja
o tamanho da quantidade medida. Ela
tambm chamada de preciso da medio.
Incertezas relativas de 10% so
usualmente caractersticas de medies
grosseiras. Esta incerteza ocorre quando se
mede um comprimento de 10 cm e h uma
incerteza de 1 cm ou quando se mede uma
distncia de 10 km com incerteza de 1 km.
Incertezas relativas da ordem de 1 a 2% so
caractersticas de medies razoavelmente
cuidadosas e so a melhor esperana de um
instrumentista em medies industriais ou de
um metrologista em seu laboratrio. Incertezas
relativas da ordem de 0,1 a 0,2% so muito
difceis de serem conseguidas e so raras em
medies industriais.
Obviamente esta classificao superficial.
Algumas medies simples podem ser feitas
com incertezas de aproximadamente 0,1%. Um
bom paqumetro pode medir distncias com
aproximadamente 0,1%, um bom cronmetro
pode medir o perodo de uma hora com uma
incerteza aproximada de um segundo ou
0,03%. Porm, a maioria das medies das
variveis de processo (temperatura, vazo,
nvel, presso e anlise) possuem medies
com incertezas tpicas de 1 a 10%. Grande
incerteza relativa no significa
necessariamente que a medio seja intil.
Mesmo na histria da Fsica e Qumica, muitas
incertezas experimentais so da ordem de
10%.
Outro aspecto relacionado com o valor da
incerteza o custo para obter pequenas
incertezas. Quanto menor a incerteza, maior
o custo do instrumento de medio e maiores
so os cuidados requeridos para fazer as
medies.

2.8. Incertezas relativas


A incerteza x em uma medio
xmedido = xestimado x
indica a confiabilidade ou preciso da medio.
Porm, a incerteza x em si no conta toda a
histria. Uma incerteza de 1 metro em uma
distncia de 1 quilmetro indica uma medio
muito precisa, porm, uma incerteza de 1
metro em uma distncia de 3 metros indica
uma estimativa grosseira. Assim, a qualidade
de uma medio indicado no apenas pela
incerteza x mas pela relao entre x e
xestimado. Esta relao entre a incerteza e o valor
da medio chamado de incerteza relativa.
A incerteza x chamada de incerteza
absoluta, para evitar confuso com a relativa.

incerteza relativa =

x
x estimado
(2.21)

Nesta definio, o smbolo |xestimado| denota


o valor absoluto de xestimado.
Na maioria das medies srias, a
incerteza x muito menor que o valor medido
xestimado. Como a relao x/xestimado muito
pequena, comum expressar a incerteza em
percentagem, multiplicando a incerteza relativa
por 100%. Assim, a medio
comprimento L = 50 1 cm

(2.22)
Probleminha rpido 2.4.
Converter as incertezas absolutas nas
seguintes medies em relativas ou
percentuais.
(a) 55 2 oC
(b) 20 2 oC
(c) Uma massa vale m = 4,58 kg 2%.
Reescrever a expresso com incerteza
absoluta.
(Como as incertezas devem ser dadas com
um algarismo significativo, fazer os clculos de
cabea, sem usar calculadora ou lpis e papel).

tem uma incerteza relativa de


L
L estimado

1 cm
= 0,02
50 cm

e a incerteza em percentagem vale 2% do valor


medido. Por isso, o resultado da medio
poderia ser dado tambm como:
comprimento L = 50 cm 2%

Resposta:
(a) 55 oC 4%
(b) 20 oC 10%
(c) (4,58 0,09) kg

Embora a incerteza absoluta tenha a


mesma unidade da quantidade medida, a
incerteza relativa dimensional, sem unidades.
Este um critrio para ser usado para evitar o
erro comum de confundir incerteza absoluta
com incerteza relativa.
A incerteza relativa uma ferramenta
simples para indicar aproximadamente a

15

Expresso da Incerteza
Infelizmente, esta correlao somente
aproximada. Por exemplo, a afirmao x = 10,
com dois algarismos significativos, significa

2.9. Algarismo significativo e incerteza


relativa
O conceito de incerteza relativa est muito
associado com a noo familiar de algarismos
significativos. De fato, o nmero de algarismos
significativos em uma quantidade uma
indicao aproximada da incerteza relativa
desta quantidade.
Para um matemtico, a expresso x = 21
tem dois algarismos significativos e isto
significa que x est mais prximo de 21 do que
de 20 ou 22, de modo que o nmero 21 com
dois algarismos significativos significa 21 0,5.
Para o metrologista, os nmeros so
conseguidos de leituras de instrumentos
diretamente ou atravs de algum clculo. Se
um indicador digital apresenta dois algarismos
significativos e indica 21, isto pode significar 21
0,5, mas pode tambm significar 21 1 ou
at 21 5. (Para eliminar esta ambigidade,
deve-se consultar o catlogo do instrumento
fornecido pelo fabricante). Nestas
circunstncias, a afirmao que um nmero
medido tenha dois algarismos significativos
somente uma indicao grosseira de sua
incerteza. Pode-se adotar o critrio de definir
que 21, com dois algarismos significativos
significa 21 1 e mais genericamente que um
nmero com n algarismos significativos tem
uma incerteza de 1 no ensimo dgito.
Sejam dois nmeros:

v = 10 1 ou 10 10%
No outro extremo, w = 99 (tambm com
dois algarismos significativos) significa:
w = 99 1 ou 99 1%
Portanto, a incerteza relativa associada
com dois algarismos significativos pode variar
de 1 a 10%, dependendo do primeiro dgito do
nmero considerado.
A correspondncia aproximada entre
algarismos significativos e incertezas relativas
pode ser resumida como mostrado na Tab. 2.4.
Tab. 2.4. Correspondncia aproximada entre
algarismos significativos e incertezas relativas
Nmero de
algarismos
significativos

1
2
3
4

Incerteza relativa correspondente est


entre

aproximadamente

10 e 100%
1 e 10%
0,1 e 1%
0,01 e 0,1%

50%
5%
0,5%
0,05%

2.10. Multiplicao de duas medies


Talvez a maior importncia da incerteza
relativa esteja na multiplicao de nmeros
conseguidos de medies. Por exemplo, para
achar a tenso de um circuito, pode-se medir a
corrente i e sua resistncia R e ento
multiplic-las para se obter v = Ri. Tanto a
medio de R e i esto sujeitas a incertezas,
que devem ser estimadas. O problema, ento,
determinar a incerteza na tenso v que
resulta das incertezas conhecidas em R e i.
A forma padro

x = 21
y = 0,21
ambos com as precises certificadas de dois
algarismos significativos. De acordo com a
conveno recm adotada, estes valores
significam
x = 21 1
y = 0,21 0,01
Embora os dois nmeros tenham ambos
dois algarismos significativos, eles tem
incertezas absolutas muito diferentes, porm
com mesma incerteza relativa de 5%:

valor medido de x = xestimado x


em termos da incerteza relativa tem-se

x
valor medido de x = x estimado 1

x estimado

x y 1
0,1
=
=
=
= 0,05 = 5%
x
y 21 0,21

(2.23)

Por exemplo, se a incerteza relativa de

Evidentemente, a afirmao que os


nmeros 21 e 0,21 (ou 210 ou 2,1 ou 0,0021)
tem dois algarismos equivalentes equivalente
a dizer que eles tem incerteza de 5%. Do
mesmo modo, 21,0 (com trs algarismos
significativos) tem incerteza aproximada de
0,5%.

3%
3

valor medido de x = x estimado 1

100

ou seja, incerteza de 3% significa que x cai


provavelmente entre 0,97 e 1,03 vezes xestimado,

16

Expresso da Incerteza
0,3
i
=
= 0,03 = 3%
iestimado 9,1

0,97 xestimado < x <1,03 xestimado


Este um modo til de pensar acerca de
um nmero medido que deve ser multiplicado.
Voltando ao problema de calcular a
incerteza de v = Ri, quando R e i tem sido
medidos:

R
R medido = Restimado 1

R estimado

A incerteza relativa em v ento a soma:


v
= 2 % + 3 % = 5%
v estimado

(2.24)

Para se ter a incerteza absoluta em v,

i
i medido = iestimado 1

iestimado

v =

(2.25)

v
v estimado

v estimado = 0,05 4,82 = 0,241

Depois dos arredondamentos devidos e


usando-se o nmero correto de algarismos
significativos, chega-se a

Como Restimado e iestimado so a melhor


estimativa para R e i, respectivamente, a
melhor estimativa para v = Ri

valor de v = 4,8 0,2 V ou 4,8 V 5%.

melhor estimativa de v = vestimado

O procedimento anterior se aplica a


qualquer produto de duas quantidades
medidas. Tem-se assim a segunda regra geral
provisria para a propagao de erros. Quando
se medem duas quantidades x e y e forma-se
seu produto xy, as incertezas nas duas
quantidades originais se propagam para causar
uma incerteza em seu produto. Esta incerteza
dada pela seguinte regra provisria:

vestimado = Restimado iestimado


Os valores provveis maiores de R e i
fornecem o maior valor provvel de v = Ri. Com
alguma computao, chega-se a
R
i
valor de v = R estimadoiestimado 1
+

R estimado iestimado

(2.26)
Incerteza no Produto
(Regra provisria)

Comparando com a forma geral

v
valor de v = v estimado 1

v estimado

Se duas quantidades x e y so medidas


com pequenas incertezas de x e y e se os
valores medidos x e y so usados para se
calcular a produto q = xy, ento a incerteza
relativa em q a soma das incertezas relativas
em x e y:
q
x
y

+
q estimado
x estimado
y estimado

chega-se incerteza relativa de v, em funo


das incertezas de R e de i:
v
R
i
=
+
v estimado
R estimado
iestimado

Se, por exemplo, as medies de R e i


forem

(2.28)
Como a regra da incerteza na soma, esta
regra tambm provisria, pois posteriormente
ela ser substituda por uma regra mais
precisa.
Duas outras caractersticas devem ser
realadas nesta regra:
1. as incertezas relativas em x e y devem
ser pequenas, de modo que o seu
produto seja desprezvel. Esta
exigncia geralmente verdade na
maioria das aplicaes prticas.
Quando as incertezas forem grandes, a
regra no se aplica.
2. mesmo quando x e y tiverem
dimenses diferentes, a regra se aplica

R = 0,53 0,01
e
i = 9,1 0,3 A
a melhor estimativa para v = Ri
vestimado = 0,53 x 9,1 A = 4,82 V
Para calcular a incerteza de v, calculam-se
as incertezas relativas de R e de i:
R
0,01
=
= 0,02 = 2%
R estimado 0,53

17

Expresso da Incerteza
pois as incertezas relativas so
adimensionais.
Em instrumentao, freqente a
multiplicao de dois nmeros obtidos de
medies e a regra proposta para achar a
incerteza no produto ser uma ferramenta
importante na anlise da incerteza. Para o
momento, o principal objetivo enfatizar que a
incerteza em qualquer produto q = xy
expressa mais facilmente em termos da soma
das incertezas relativas.

Incerteza Relativa
Se x medido na forma padro
xestimado x, a incerteza relativa

incerteza relativa =

x
x estimado

A incerteza percentual a incerteza relativa


expressa como percentagem, ou seja,
multiplicada por 100%.
Foram determinadas duas regras
provisrias para a propagao da incerteza:
1. a incerteza absoluta na diferena de duas
quantidades medidas igual soma das
duas incertezas absolutas individuais.
2. a incerteza relativa no produto de duas
quantidades medidas igual soma das
duas incertezas relativas individuais.
Posteriormente, estas duas regras
provisrias sero substitudas por outras mais
refinadas.

Probleminha rpido 2.5.


Encontrar a rea de uma superfcie
retangular, cujos lados medidos so 9,1 0,1
cm e 3,3 0,1 cm. Expressar estas incertezas
como incertezas percentuais e depois achar o
melhor resultado para a rea com sua
incerteza (Primeiro achar a incerteza
percentual e depois convert-la para incerteza
absoluta. Fazer todos os clculos de cabea,
sem usar calculadora, lpis e papel).
Respostas:
Lados 9,1 1% e 3,3 3%
rea aproximada = 30 4% ou 30 1 cm2

Definies e Equaes do Cap. 2


Formas para expressar incertezas
A forma padro para expressar uma
medio de uma quantidade fsica x :
valor medido de x = xestimado x
onde
xestimado = melhor estimativa de x
e
x = incerteza ou erro na medio
Este resultado expressa a confiana de que
o valor correto de x provavelmente caia (ou
fique prximo) da faixa determinada por
xestimado x e xestimado + x.

Discrepncia
A discrepncia entre dois valores medidos
da mesma quantidade fsica :

discrepncia = diferena entre dois valores


medidos da mesma
quantidade

18

3. Propagao da Incerteza
problemas na propagao da incerteza podem
ser resolvidos usando-se apenas trs regras
simples. Uma nica regra, mais completa e
complicada, tambm ser apresentada para
cobrir todos os casos e da qual as trs regras
simples so derivadas.
Este captulo longo, porm seu
comprimento simplesmente reflete sua grande
importncia. A propagao da incerteza uma
tcnica que ser usada repetidamente na
Instrumentao, Laboratrio de Metrologia e
Laboratrio Qumico.

3.1. Introduo
Muitas quantidades fsicas no podem ser
medidas diretamente, em um nica medio,
mas so encontradas em dois passos:
1. so medidas uma ou mais quantidades
que podem ser encontradas
diretamente
2. os valores medidos destas quantidades
so usados para calcular a quantidade
de interesse.
Por exemplo, para achar a rea de um
retngulo:
1. medem-se o comprimento L e a altura
H
2. calcula-se a rea A = LH
Outro exemplo, para achar a vazo
volumtrica de um fluido passando por uma
tubulao:
1. medem-se o volume acumulado em um
intervalo de tempo, V, e o intervalo de
tempo.
2. calcula-se a vazo volumtrica F = V/t.
Muitos outros exemplos poderiam ser
apresentados para mostrar que a maioria das
medies prticas envolve estes dois passos
distintos de medies diretas seguidas por
clculos.
Quando a medio envolve estes dois
passos, a estimativa das incertezas tambm
envolve dois passos:
1. so estimadas as incertezas individuais
das quantidades medidas diretamente
2. determina-se como as incertezas se
propagam atravs dos clculos para
produzir uma incerteza no resultado
final.
Esta propagao das incertezas o
principal objetivo deste captulo.
J foram vistos exemplos e apresentadas
regras provisrias relacionados com a
propagao da incerteza, quando so feitas as
medidas e depois elas so combinadas em
uma subtrao ou em um produto.
Antes de se tratar da propagao das
incertezas, ser discutida rapidamente a
estimativa de incertezas em quantidades
medidas diretamente. Alguns mtodos j
vistos sero revistos, melhorados e outros
novos mtodos sero apresentados para
estimar a incerteza nas medies diretas.
Finalmente ser vista a propagao das
incertezas. Ser visto que quase todos os

3.2. Incertezas nas medies diretas


A maioria das medies diretas envolve a
leitura de uma escala (em uma rgua, relgio,
voltmetro, velocmetro, termmetro,
manmetro) ou de um display digital. s vezes,
as principais fontes de incerteza esto na
leitura da escala e na necessidade de
interpolar a leitura entre duas marcaes da
escala. Nestes casos, a determinao da
incerteza fcil: razovel estimar a incerteza
da leitura como a metade da menor diviso.
Assim, se a menor diviso da escala 1 mm, a
incerteza da indicao de 0,5 mm; se a
menor diviso 2 oC, a incerteza de 1 oC.
Quando o display digital e nenhuma outra
informao adicional fornecida, razovel
supor que a incerteza , no mnimo, igual a 1
dgito (o menos significativo).
Infelizmente, h outras fontes de incertezas
presentes e mais importantes que as
dificuldades em ler a escala. Na medio de
distncia, por exemplo, o principal problema
decidir onde as duas extremidades realmente
esto. Como a incerteza aparece porque os
dois pontos que determinam o comprimento
no so claramente definidos, este tipo de
dificuldade chamado de problema de
definio.
Este exemplo ilustra um srio perigo na
avaliao da incerteza. Quando se considera
apenas a escala e se esquece de outras fontes
de incerteza, a incerteza est sendo
subestimada. Quando no se consideram
todas as fontes de incerteza, a incerteza pode
ser subestimada por fatores de 10 ou mais. O
caso oposto considerar incertezas em
excesso, superestimando a incerteza final. O
ideal considerar todas as fontes possveis de
incertezas e estimar seus efeitos exatamente, o
que geralmente difcil e trabalhoso.

19

Propagao da Incerteza
Superficialmente, fazer a leitura de um
medidor digital muito mais fcil do que fazer a
interpolao da leitura em escala analgica. A
no ser que o medidor esteja com defeito, o
display digital apresenta somente algarismos
significativos. Por isso, comum se afirmar que
o nmero de algarismos significativos em um
display digital exatamente o nmero de
dgitos apresentados. Porm, nem sempre o
significado exato de algarismos significativos
claro. Assim, o display de um voltmetro digital
igual a 93 mV significa 93 1 mV, no mnimo.
H catlogos de instrumentos que definem
exatamente qual a incerteza do display.
possvel se ter incertezas de 5 ou 10 dgitos.
A incerteza da medio envolve outras
fontes, como mtodo, operador, condies
ambientais, alm do sistema de medio em si.
Por exemplo, se um metrologista usa um
cronmetro digital para medir um intervalo de
tempo e obtm um resultado de 8,01
segundos, razovel supor que o tempo vale
t = 8,01 0,01 s

3.3. Regra da raiz quadrada para uma


contagem
Outro tipo diferente de medio direta tem
uma incerteza que pode ser facilmente
estimada. Algumas experincias requerem uma
contagem de eventos que ocorrem
aleatoriamente, mas tm uma taxa mdia
definida. Por exemplo, os instrumentos
defeituosos em uma oficina de instrumentao
chegam de um modo aleatrio, porm, ao
longo de um ms ou ano, h uma mdia
definida de instrumentos defeituosos. Se um
instrumentista quiser saber esta taxa, ele pode
contar 32 instrumentos defeituosos em um
ms, na oficina. A no ser que tenha havido um
engano, o nmero 32 exato, pois a
contagem dos instrumentos defeituosos que
chegaram oficina. Como os instrumentos
aparecem de modo aleatrio, porm, 32 pode
no ser igual ao nmero mdio real de
instrumentos em todos os meses. Talvez este
nmero possa ser 31, 29 ou mesmo um
nmero fracionado, como 29,8 ou 32,6.
Evidentemente, a incerteza neste tipo de
experincia no est no nmero contado (32
por exemplo). Em vez disso, a incerteza est
em como este nmero observado se aproxima
do nmero mdio verdadeiro. O problema
estimar qual o valor desta incerteza. A teoria
ser vista na frente, porm j se pode dizer que
a incerteza em qualquer nmero contado de
eventos aleatrios, como uma estimativa do
nmero mdio verdadeiro, a raiz quadrada
do nmero contado. No exemplo, o
instrumentista contou 32 instrumentos
defeituosos em um perodo de um ms. Assim,

(3.1)

Outro metrologista medindo o mesmo


intervalo de tempo, aparentemente nas
mesmas condies, pode conseguir 8,41, ou
seja
t = 8,41 0,01

(3.2)

H uma grande discrepncia entre as duas


medies (0,40 s), muito maior que a incerteza
considerada (0,01 s). Tomando-se os dois
resultados, muito mais realista apresentar o
resultado como

a incerteza de 32 6 e o resultado final


pode ser expresso como:

t = 8,2 0,2 s

nmero de instrumentos com defeito, no


perodo de um ms = 32 6.

Esta incerteza (0,2 s) 20 vezes maior que


a sugerida inicialmente (0,01 s).
Sempre que uma medio puder ser
repetida, ela deve ser feitas vrias vezes. O
espalhamento das vrias medies repetidas
uma boa indicao das incertezas e a mdia
dos valores medidos quase sempre tem mais
confiabilidade do que uma nica medio.
Posteriormente sero vistos os tratamentos
estatsticos das medies mltiplas. Agora, o
que deve ser enfatizado que se uma medio
repetitvel, ela deve ser repetida, para
1. se obter um resultado mais confivel
2. se ter uma estimativa das incertezas.
Porm, nem sempre a repetio da
medio revela incertezas. Se um cronmetro
estiver com um erro sistemtico, de modo que
todos seus resultados possuem um atraso
sistemtico, o espalhamento das medies
repetidas no revela esta incerteza sistemtica.

Para tornar esta afirmao mais geral,


suponha que se tenha contado o nmero de
ocorrncias aleatoriamente, mas com uma
mdia definida. Suponha que se conte para um
determinado intervalo de tempo escolhido T
(como um ms) e se tenha obtido o nmero de
eventos observado (letra grega
correspondente ao n latino, n de nmero).
Baseado nesta experincia, a melhor
estimativa para o nmero mdio de eventos no
tempo T o nmero observado e a incerteza
nesta estimativa a raiz quadrada de , .
Assim, a melhor expresso para o nmero
mdio de eventos aleatrios no tempo T
nmero mdio de eventos em T =

20

Propagao da Incerteza
(3.2)

menor valor provvel. O maior e menor valores


provveis de x so xestimado x e os de y so
yestimado y. Assim, o maior valor provvel da
soma x + y

Este resultado pode ser chamado de Regra


da Raiz Quadrada para a Contagem.
Experimentos envolvendo contagem so
freqentes em laboratrios qumicos. Por
exemplo, o estudo do decaimento radioativo,
onde cada ncleo decai em um tempo
aleatrio, mas o decaimento em uma grande
amostra ocorre em uma taxa mdia definida.
Para encontrar esta taxa, simplesmente se
conta o nmero de decaimentos em
determinado intervalo de tempo.

xestimado + yestimado + (x + y)
e o menor valor provvel
xestimado + yestimado - (x + y)
Ento, a melhor estimativa para q = x + y
qestimado = xestimado + yestimado
e a sua incerteza

Probleminha rpido 3.1.


(a) Para verificar a atividade de uma
amostra radioativa, coloca se a amostra em um
contador de cintilao lquida para contar o
decaimento em um intervalo de dois minutos e
se obtm 34 contagens. Como este resultado
apresentado como o nmero de decaimentos
produzidos pela amostra em dois minutos?
(b) Agora, suponha que se tenha
monitorado a mesma amostra durante 50
minutos e obtido uma contagem de 907. Como
pode ser apresentado este resultado de
decaimentos em 50 minutos?
(c) Achar a incerteza percentual destas
duas medies e comentar a utilidade de uma
contagem para um perodo maior, como em
(b).

q x + y

(3.3)

De modo similar, pode-se mostrar que a


incerteza na diferena x y dada pela
mesma frmula (3.3). Ou seja, a incerteza na
soma x + y ou na diferena x y a soma das
incertezas x + y de x e y. Genericamente,
com vrias variveis x, y, ..., z, tem-se a regra
provisria:

Incerteza nas Somas e Diferenas


(Regra provisria)
Se as quantidades, x, y, ...w, so
medidas com incertezas x, y, ... w e os
valores medidos so usados para computar

Resposta:
(a) 33 6 contagens ou 33 contagens 18%
(b) 907 30 contagens ou 907 contagens 3%
(c) 33 18% e 907 3%. Em grandes contagens a
incerteza percentual fica muito menor,
compensando a desvantagem de demorar a
contagem.

q = x + y + ...+ z (u + v + ... + w),


ento, a incerteza no valor computado de q
a soma de todas as incertezas originais:

q = x + y + ...+ z + u + v + ... + w

3.4. Somas e diferenas; produtos e


quocientes

Em outras palavras, quando se soma ou


subtrai qualquer nmero de quantidades, as
incertezas absolutas destas quantidades
sempre se somam. Esta regra provisria e
ser substituda por uma mais realista, na
frente.

Seja a medio de uma ou mais


quantidades, x, y, ... com incertezas
correspondentes de x, y, ... e que se queira
usar os valores medidos de x, y, ... para
calcular a quantidade q = f(x, y, ...). O clculo
de q direto. O problema como as incertezas
x, y, ... se propagam atravs dos clculos e
resultam em uma incerteza q no valor final de
q.

Exemplo: adio e subtrao de massas


Misturam-se vrias massas de lquidos em
dois frascos, tendo se medido suas massas
separadas , com frascos cheios e vazios,
obtendo-se

Somas e diferenas
No Captulo 2 foi discutido o que acontece
quando se medem duas quantidades x e y e se
calcula sua soma, x + y ou sua diferena x - y.
Para estimar a incerteza na soma ou diferena,
devia-se apenas decidir acerca do maior e

M1 = massa 1o frasco e contedo = 540 10 g


m1 = massa 1o frasco vazio = 72 + 1 g
M2 = massa 2o frasco e contedo = 940 20 g
m2 = massa 2o frasco vazio = 97 + 1 g

21

Propagao da Incerteza
e ler, a partir de agora ser abreviado e
simplificado, escrevendo-se simplesmente
incerteza relativa em x = x

Para calcular a massa total do lquido temse

O resultado de medir qualquer quantidade x


pode ser expresso em termos de sua incerteza
relativa x como

M = M1 m1 + M2 m2
= (540 72 + 940 97) g = 1 311 g

Aplicando a regra provisria, a incerteza


deste resultado a soma de todas as quatro
incertezas:

valor de x = xestimado (1 + x/ x )
O valor de q = x/y pode ser escrito:

M M1 + m1 + M2 + m2

valor de q = x estimado 1 x / x
y estimado 1 y / y

= 10 + 1 + 20 + 1 g = 32 g
Assim, o resultado final, arredondado
massa total do lquido = 1 310 + 30 g

Agora, pensando em termos de valores


mximo e mnimo e considerando que o ltimo
fator na expresso anterior tem a forma de

Deve se notar que as incertezas muito


pequenas das massas nos frascos vazios
praticamente no contribuem com a incerteza
final e por isso elas poderiam ser desprezadas.
Este efeito importante e ser discutido mais
tarde. Com experincia e bom senso, pode-se
identificar, a priori, as incertezas dominantes e
desprezveis e deve-se separ-las, eliminando
as desprezveis, para simplificar os clculos.

(1 + a)
(1 b)

e considerando que os nmeros a e b so


normalmente pequenos, ou seja, muito
menores que 1, e simplificando
1
1+ b
1 b

Produtos e Quocientes
J foi discutido como a incerteza se
propaga no produto q = xy de duas
quantidades medidas. Foi visto que, desde que
as incertezas relativas individuais fossem
pequenas, a incerteza relativa no produto a
soma das incertezas relativas individuais. Alm
de rever esta regra, aqui ser discutido o caso
do quociente q = x/y. Ser visto que a incerteza
relativa no quociente tambm ser igual
soma das incertezas relativas individuais,
exatamente como no produto.
Como as incertezas nos produtos e
quocientes so melhor expressas em termos
de incertezas relativas, uma notao
simplificada para a incerteza relativa til.
De novo, a medio de uma quantidade x
:
valor medido de x = xestimado x

(3.6)

tem-se
(1 + a)
(1 + a)(1 + b) = 1 + a + b + ab
(1 b)

Desprezando o termo ab, em relao a a e b,


tem-se
1+a+b
Chega-se, finalmente a:
qestimado =

x estimado
y estimado

e a incerteza relativa

e a incerteza relativa em x definida como


incerteza relativa em x =

(3.5)

q x y

+
q
x
y

x
x estimado

(3.7)

Como concluso: na multiplicao ou


diviso de duas quantidades medidas x e y, a
incerteza relativa no resultado a soma das
incertezas relativas individuais em x e y. Temse ento:

O valor absoluto no denominador garante


que a incerteza relativa sempre positiva,
mesmo quando xestimado for negativo. Como o
smbolo x/xestimado complicado para escrever

22

Propagao da Incerteza
Incerteza nos Produtos e Quocientes
(Regra provisria)
Probleminha rpido 3.2.
Seja a medio de trs quantidades x, y e z:

Se vrias quantidades, x, y, ...w, so


medidas com pequenas incertezas x, y, ...w
e os valores medidos so usados para
computar
q=

x = 8,0 0,2
y = 5,0 0,1
z = 4,0 0,1
Expressar as incertezas dadas como
percentagens e depois calcular q = xy/z com
sua incerteza q, como dado pela regra
provisria.

x y ... z
u v ... w

ento, a incerteza relativa no valor


computado de q a soma de todas as
incertezas relativas originais:

Resposta:
x/x = 2,5%
y/y = 2%
2,5%
q = 10 7% ou 10 0,7 (tambm 10 1)

z u
q x y
w

+
+ ... +
+ ... +
q
x
y
z
u
w

z/z =

3.5. Dois casos especiais importantes


De modo resumido: quando as quantidades
so multiplicadas ou divididas, as incertezas
relativas se somam.

Hs dois casos que merecem estudo


isolado:
1. produto de dois nmeros, sendo um
deles exato (sem incerteza)
2. potncia (como x2) de um nmero
medido.

Exemplo
Em topografia, s vezes um comprimento
inacessvel (altura de um edifcio)
determinado pela medio de outros trs
comprimentos acessveis. Tem-se

L=

Quantidade medida vezes constante


Seja uma quantidade x cujo valor medido
multiplicado por uma constante:

L1L 2
L3

q = Bx

Foram obtidas as seguintes medies:


onde B constante, ou seja, no tem incerteza.
Por exemplo, pode se medir o dimetro d de
um circulo e multiplic-lo por para se obter
sua circunferncia c:

L1 = 200 2 m
L2 = 5,5 0,1 m
L3 = 10,0 0,4 m

c = x d.

A melhor estimativa de L

L estimado =

200 5,5
m = 110 m
10,0

Outro exemplo: mede-se a espessura T de


500 folhas idnticas e se quer calcular a
incerteza da espessura de uma folha individual,
t, onde

As incertezas relativas so:

t = T/500
De acordo com a regra provisria, a
incerteza relativa em q = Bx a soma das
incertezas relativas em B e em x. Como B = 0,
tem-se

L1/L1 = 2/200 = 1%
L2/L2 = 0,1/5,5 = 2%
L3/L3 = 0,4/10 = 4%
de modo que a incerteza final de L/L vale 7%
e o resultado final expresso como
L = 110 m 7% ou (110 8) m

q x

q
x

A incerteza relativa em q = Bx, com B


constante, a mesma que a incerteza relativa

23

Propagao da Incerteza
de x. Multiplicando-se ambos os termos por q ,
chega-se a

Incerteza na Potncia
Se uma quantidade x medida com
incerteza x e o valor medido usada para
computar a potncia

q = B x

Quantidade Medida Vezes Nmero Exato


(Regra provisria)

q = xn

ento a incerteza relativa em q n vezes a


incerteza relativa em x,
x
q
(3.10)
=n
q
n

Se uma quantidade x medida com


incerteza x e usada para computar o produto
q = Bx

onde B no tem incerteza, ento a


incerteza absoluta em q B vezes a incerteza
absoluta em x,

Probleminha rpido 3.4.


Achar o volume de um dado cubo, cuja
medio do lado

q = B x

(3.9)

2,00 0,02 cm.

Esta regra muito til quando se tem algo


muito pequeno para se medir mas possvel
fazer a medio de um conjunto, tal como a
espessura de uma folha fina. Quando se mede
a espessura de 500 folhas:

Expressar esta incerteza em percentagem


e em valor absoluto.
Resposta:
x = 2,00 cm 1%
q = 8,0 cm3 3% ou (8,0 0,2) cm3

espessura 500 folhas = T = 13,0 0,1 cm


segue-se imediatamente que a espessura de
uma nica folha, t, :

Exemplo: Medio da gravidade


Seja a medio da gravidade do local, pela
medio do tempo t em que uma pedra cai de
uma altura h. Depois de vrias medies
chega-se a

espessura de uma folha = t = 1/500 x T


= 0,026 0 0,000 2 cm

t = 1,6 0,1 s
h = 13,9 0,1 m
Como

Probleminha rpido 3.3.


Seja a medio do dimetro de um circulo:

h=

d = 5,0 0,1 cm

1 2 tem-se
2h
gt
g= 2
2
t

Aplicando os valores, tem-se

Atravs deste valor, calcular a


circunferncia c = d, com sua incerteza
associada.

g=

2 13,9 m
= 10,9 m / s2
1,6 1,6 s2

Resposta: 15,7 0,3 cm

A incerteza deste resultado dada por:


g h
t
=
+2
g
h
t

Potncias
O outro caso especial se refere ao clculo
da potncia de alguma quantidade medida. Por
exemplo, pode-se medir a velocidade v de um
corpo de massa m e ento achar a sua energia
cintica, mv2 , atravs de v2. Como v2 o
produto de v por v, segue que a incerteza
relativa em v2 duas vezes a incerteza relativa
de v.

0,1
h
=
= 0,7%
h 13,9

t 0,1
=
= 6,3%
t 1,6

incerteza final = 0,7% + 2 x 6,3% = 13,3%


O resultado pode ser expresso como:

24

Propagao da Incerteza
3. Do mesmo, o menor valor provvel
para q era
xestimado + yestimado - x - y
(3.12)

g = 10,9 m/s2 13%


ou
g = (10,9 1,5) m/s2 11 2 m/s2

4. Concluiu-se que o valor de q


provavelmente caia entre estes dois
nmeros e a incerteza em q era

Este exemplo ilustra como, s vezes,


simples estimar as incertezas de um resultado.
Ele tambm ilustra como a anlise da incerteza
pode determinar o tamanho das incertezas e
tambm reduzi-lo. O exemplo tambm mostra
que a incerteza dominante a devida
medio do tempo e a incerteza da medio da
distncia desprezvel. Se se quiser melhorar
a incerteza da medio da acelerao da
gravidade, deve-se melhorar a medio do
tempo. Qualquer tentativa de melhoria da
medio da distncia perda de tempo e
esforo. Finalmente, o valor aceito
arredondado para g de 10 m/s2 e o resultado
acima est consistente com este valor
esperado, embora no seja muito preciso
(13%).

q x + y
Para verificar que esta frmula
provavelmente superestima q, considere-se
como o valor real de q poderia ser igual ao
maior valor provvel. Obviamente, isto ocorre
se x foi subestimado pelo valor total de x e y
foi subestimado pelo valor total de y, que um
evento pouco provvel. Se x e y so medidos
independentemente e as suas incertezas so
naturalmente aleatrias, tem-se uma chance de
50% de subestimar x acompanhado de
superestimar y ou vice versa. Claramente, a
probabilidade de se subestimar tanto x como y
pelos valores totais de x e y relativamente
pequena. Deste modo, o valor q x + y
ultrapassa a incerteza provvel.
Qual a melhor estimativa de q? A
resposta depende precisamente o que
significam as incertezas (isto , o que significa
a afirmao que q est provavelmente em
algum ponto entre qestimado + q e qestimado q).
A resposta tambm depende das leis
estatsticas que governam as incertezas na
medio. Posteriormente, ser vista a
distribuio normal ou de Gauss, que descreve
o comportamento das medies sujeitas s
incertezas aleatrias. As leis mostram que se
as medies de x e y so feitas
independentemente e ambas so governadas
pela distribuio normal, ento a incerteza em
q = x + y dada por

3.6. Incertezas independentes na soma


As regras apresentadas at agora podem
ser facilmente resumidas como:
1. Quando as quantidades medidas so
somadas ou subtradas, as incertezas
absolutas se somam.
2. Quando as quantidades medidas so
multiplicadas ou divididas, as
incertezas relativas se somam.
Ser visto, agora e aqui, como as
incertezas calculadas, sob certas condies e
usando-se estas regras, podem ficar
desnecessariamente muito grandes.
Especificamente, ser visto que, quando se
tem incertezas aleatrias e independentes, o
modo mais realista e melhor de estimar a
incerteza resultante final pela raiz quadrada
da soma dos quadrados das incertezas
individuais.
Seja a soma de dois nmeros x e y, q = x +
y, que foram medidos e expressos na forma
padro:
valor medido de x = xestimado x
e
valor medido de y = yestimado y
O argumento usado anteriormente era:
1. A melhor estimativa de q era
claramente
qestimado = xestimado + yestimado

q = (x ) 2 + (y ) 2

(3.13)

Quando se combinam dois nmeros,


tirando-se a raiz quadrada da soma de seus
quadrados, os nmeros so somados em
quadratura. Assim, a regra atrs da equao
anterior pode ser dita como: se as medies de
x e y so independentes e ambas so sujeitas
apenas a incertezas aleatrias, ento a
incerteza q no valor calculado da soma q = x +
y a soma em quadratura ou a raiz
quadrada da soma dos quadrados das
incertezas x e y.

2. Como os maiores valores provveis


para x e y eram xestimado + x e yestimado +
y, o maior valor provvel para q era
xestimado + yestimado+ x + y

25

Propagao da Incerteza
incerteza sistemtica e portanto no so
independentes.
Posteriormente, ser mostrado que a
incerteza na soma q = x + y, com medies
aleatrias ou no aleatrias, certamente no
maior que a soma x + y:

a2 + b2

q x + y

Ou seja, a expresso antiga que expressa


a incerteza na soma igual soma das
incertezas, realmente um limite superior que
ocorre em todos os casos. Quando se tem
razes para suspeitar que x e y no so
independentes e aleatrias, no se justifica
usar a raiz quadrada da soma dos quadrados.
Por outro lado, o limite garante que q
certamente no pior que x + y e deve-se usar
a velha regra da soma aritmtica

Fig. 3.1. Como qualquer lado de um tringulo


sempre menor que a soma dos outros dois, a
desigualdade a2 + b2 < a + b sempre verdadeira.

Comparando-se a eq. (3.13) para a


incerteza em q = x + y com a expresso antiga
:
q x + y

(3.15)

q x + y

(3.14)
Muitas vezes, as incertezas calculadas com
a soma aritmtica ou com a raiz quadrada da
soma dos quadrados so muito parecidas. Por
exemplo, sejam x e y comprimentos medidos
com incertezas x = y = 2 mm. Se as
incertezas forem independentes e aleatrias, a
incerteza na soma ser a raiz quadrada da
soma dos quadrados:

percebe-se que:
1. A expresso da raiz quadrada
sempre menor que a expresso da
soma aritmtica (isto pode ser
facilmente visto considerando um
tringulo retngulo com os catetos
iguais a x e y e onde cada lado
sempre menor que a soma dos outros

x 2 + y 2 < x + y.
2. A expresso da raiz quadrada reflete a
possibilidade que uma superestimativa
de x ser cancelada por uma
subestimativa de y ou vice versa.
Porm, h medies onde este
cancelamento no possvel.
Seja por exemplo, a soma de dois
comprimentos x e y medidos com uma mesma
rgua metlica, q = x + y. Suponha-se que a
principal fonte de incerteza seja o medo que a
rgua tenha sido projetada para uso em
temperatura diferente que a real. Se a
temperatura da medio no conhecida ou se
no se tem um padro de comprimento para
calibrao da rgua, ento a medio possui
uma incerteza sistemtica, para menos ou para
mais. Esta incerteza pode ser facilmente
determinada (desde que se conhea o
coeficiente de expanso termal da rgua
metlica e as temperaturas de referncia e
real). O ponto, porm, que a medio estar
sempre superestimando ambos x e y ou
sempre subestimando x e y e nunca haver um
cancelamento, que justifique a soma em
quadratura de x e y para computar a incerteza
na soma q = x + y. Em outras palavras, as
medies de x e y tem uma componente de
dois, tem-se

(x )2 + (y )2 = 4 + 4 mm = 2,8 mm 3 mm

Porm, se h suspeita que x e y sejam


dependentes ou haja incertezas sistemticas,
deve-se usar a soma aritmtica:
x + y (2 + 2) mm = 4 mm
Em algumas situaes, a estimativa das
incertezas to grosseira que a diferena entre
os dois resultados no importante. Em outras
situaes, a raiz quadrada da soma dos
quadrados significativamente menor que a
soma aritmtica. Tambm, a soma em
quadratura geralmente mais fcil de ser
computada que a soma aritmtica.

26

Propagao da Incerteza
Se as incertezas em x, y, ... z, u, ...w, so
conhecidamente independentes e aleatrias,
ento, a incerteza no valor computado de q a
raiz quadrada da soma dos quadrados das
incertezas individuais:

Probleminha rpido 3.5.


Sejam dois volumes medidos em dois
frascos como

V1 = 130 6 mL
V2 = 65 4 mL

q =

( x ) 2 + ... + ( z ) 2 + ( u )2 + ...( w )2

(3.16)
Em qualquer caso, q nunca
maior que a soma aritmtica,

e o contedo do segundo frasco colocado


cuidadosamente no primeiro. Qual a previso
para o volume total V = V1 + V2 e a incerteza
V,
(a) assumindo que as incertezas sejam
independentes e aleatrias
(b) suspeitando que as incertezas sejam
dependentes ou haja causa
sistemtica.

q x + y + ...+ z + u + v + ... + w
(3.17)

Incerteza nos Produtos e Quocientes

Se vrias quantidades, x, y, ...w, so


medidas com pequenas incertezas x, y, ...w
e os valores medidos so usados para
computar

Resposta:
(a) V = 195 7 mL ou 195 mL 4%
(b) V = 195 10 mL ou 195 mL 5%

q=
3.7. Mais acerca de incertezas
independentes

x y ... z
u v ... w

Se as incertezas em x, y, ... z, u, ...w, so


conhecidamente independentes e aleatrias,
ento, a incerteza relativa no valor computado
de q a raiz quadrada da soma dos quadrados
das incertezas relativas individuais:

Na seo anterior, foi discutido como


incertezas aleatrias independentes em duas
quantidades x e y se propagam para causar
uma incerteza na soma x + y. Para este tipo de
incerteza, as duas incertezas individuais
podiam ser combinadas na raiz quadrada da
soma dos quadrados. Estas consideraes
podem ser estendidas para diferenas,
produtos e quocientes. Como ser visto na
frente, em todos os casos, as regras
provisrias anteriores podem ser modificadas,
substituindo se as somas aritmticas por razes
quadradas da soma dos quadrados. As
expresses com as somas aritmticas
provaram ser os limites superiores que sempre
ocorrem, qualquer que seja o tipo das
incertezas, aleatrio ou sistemtico,
dependente ou independente. Assim, as
verses finais das duas regras provisrias so
as seguintes:

q
x
z
u
w
= ( )2 + ...( )2 + ( )2 + ... + ( )2
q
x
z
u
w
(3.18)
Em qualquer caso, a incerteza relativa
nunca maior que a soma aritmtica,

q x y
w
z u

+
+ ... +
+ ... +
q
x
y
z
u
w
(3.19)
Note se que ainda no foi justificado o uso
da raiz quadrada da soma dos quadrados para
incertezas aleatrias e independentes. Foi
apenas sugerido que, quando as vrias
incertezas forem independentes e aleatrias,
h uma grande probabilidade de haver
cancelamentos de incertezas e que a incerteza
resultante sempre menor que a obtida com a
soma aritmtica das incertezas originais. A raiz
quadrada da soma dos quadrados tem esta
propriedade. A justificativa ser feita no Cap. 5.
Os limites sero provados no Cap. 9.

Incerteza nas Somas e Diferenas

Se vrias quantidades, x, y, ...w, so


medidas com incertezas x, y, ...w e os
valores medidos so usados para computar
q = x + y + ...+ z (u + v + ... + w),

27

Propagao da Incerteza
desprezveis) e a incerteza em t significativa
( predominante). Tem-se:

Exemplo: Soma aritmtica vs soma em


quadratura
s vezes, no h diferena significativa
entre as incertezas computadas pela soma em
quadratura e as computadas pela soma
aritmetica. Na maioria das aplicaes, porm,
h uma grande diferena e,
surpreendentemente, a soma em quadratura
geralmente mais simples para computar. Para
comprovar como esta situao ocorre, seja o
seguinte exemplo:
Quer se achar a eficincia de um motor cc
usando-o para levantar uma massa m atravs
de uma altura h. O trabalho realizado mh e a
energia eltrica entregue pelo motor Vit, onde
V a tenso aplicada, i a corrente e t o
tempo em que o motor funciona. A eficincia
ento:
eficiencia =

e t

e
t

Esta grande simplificao facilmente


entendida. Quando os nmeros so somados
em quadratura, eles so elevados ao quadrado
e depois somados. O processo de elevar ao
quadrado aumenta exageradamente a
importncia dos nmeros grandes. Assim, se
um nmero 5 vezes maior que outro, seu
quadrado 25 vezes maior que o quadrado do
outro.
Este exemplo ilustra como combinar
incertezas em quadratura usualmente melhor
e geralmente mais fcil do que combin-las em
soma aritmtica. O exemplo tambm ilustra o
tipo de problema em que os erros so
independentes e aleatrias, quando se justifica
usar a raiz quadrada da soma dos quadrados.
As cinco unidades (massa, comprimento,
tenso, corrente e tempo) so quantidades
fsicas totalmente diferentes, com diferentes
unidades e so medidas por processos
inteiramente independentes. Por isso
inconcebvel que uma fonte cause incerteza em
duas quantidades simultaneamente.

trabalho feito pelo motor


energia entregue ao motor

ou
e=

mgh
Vit

As medies de m, h, V e i so feitas com


incerteza de 1%. A medio do tempo tem
incerteza de 5%. A medio de g tem
incerteza desprezvel (ou g considerada
constante conhecida).
Usando-se a regra antiga de considerar a
incerteza relativa no resultado final igual
soma aritmtica das incertezas relativas
individuais, tem-se:

Probleminha rpido 3.6


Sejam os resultados de trs medidas

e m h V i t
=
+
+
+ +
e
m
h
V
i
t

x = 200 2 (200 1%)


y = 50 2
( 50 4%)
z = 20 + 1
( 20 5%)
onde as trs incertezas so independentes e
aleatrias.
(a) Qual o valor e incerteza para
q=x+yz
(b) Qual o valor e incerteza para r = xy/z

= (1 + 1 + 1 + 1 + 5)% = 9%
Se h confiana que todas as incertezas
sejam independentes e aleatrias, pode-se
computar a incerteza resultante como a raiz
quadrada da soma dos quadrados:
e
m 2 h 2 V 2 i 2 t 2
= (
) +( ) +( ) +( ) +( )
e
m
h
V
i
t

Resposta:

(a) 230 3 ou 230 9%


(b) 500 30 ou 500 6,5%

= (1%)2 + (1%)2 + (1%)2 + (1%)2 + (5%)2


= 29% 5%

3.8. Funes arbitrrias de uma varivel


J foi visto como as incertezas,
dependentes ou independentes, sistemticas
ou aleatrias, insignificantes ou predominantes,
se propagam atravs de somas, diferenas,
produtos e quocientes. Porm, h aplicaes
que envolvem operaes mais complicadas,

Claramente, a raiz quadrada da soma dos


quadrados uma estimativa muito menor para
e. Para um algarismo significativo, as
incertezas em m, h, V e i praticamente no
contribuem para a incerteza em e (so

28

Propagao da Incerteza
como clculos trigonomtricos ou raiz
quadrada e por isso necessrio saber como
as incertezas se propagam nestes casos.
Como exemplo, seja a medio de vazo
com placa de orifcio, onde a presso
diferencial gerada pela placa e medida pelo
transmissor proporcional ao quadrado da
vazo. Para se calcular a vazo, deve-se
extrair a raiz quadrada desta presso
diferencial medida.
Um modo simples de visualizar o clculo
desenhar um grfico de q(x), como na Fig. 3.2.
A melhor estimativa de q(x) qestimado =
q(xestimado) e os valores xestimado e qestimado so
mostrados ligados por linha cheia.
Para decidir qual a incerteza q,
empregado o argumento usual. O valor mais
provvel de x xestimado x. Usando o grfico,
pode-se encontrar imediatamente o maior valor
provvel de q, que mostrado como qmax. Do
mesmo modo, procede-se com o menor valor
provvel, como mostrado. Se a incerteza x
pequena (o que geralmente acontece), ento o
trecho da curva envolvido nesta construo
aproximadamente linear e qmax e qmin esto
igualmente espaados em torno de qestimado . A
incerteza q pode deduzida do grfico e podese expressar o valor de q na forma padro
qestimado q.

dq
u
dx

Assim, desde que a incerteza x


pequena, como quase sempre acontece, temse
q =

dq
x
dx

(3.21)

Assim, para se achar a incerteza q,


calcula-se a derivada dq/x e a multiplica pela
incerteza x.
A regra (3.21) ainda no est na sua forma
final. Ela foi derivada para uma funo, como a
mostrada na Fig. 3.2, onde a inclinao
sempre positiva. Curva com inclinao negativa
fornece derivada negativa. Aqui, o mximo
valor provvel qmax obviamente corresponde ao
valor mnimo de x, de modo que
q =

dq
x
dx

(3.22)

Como dq/dx negativa, pode se escrever


dq/dx como |dq/dx| e tem-se a seguinte regra
geral.

Incerteza em Qualquer Funo


de Uma Varivel

q(x)

qmax
qestimado
qmin

q(x + u) q(x) =

q
q

Se a quantidades x medida com incerteza


x e usada para calcular a funo q(x), ento
a incerteza q dada por
xestimado - x

xestimado + x

q =

xestimado

Fig. 3.2. Grfico de q(x) versus x. Se x medido


como xestimado x, ento a melhor estimativa para q(x)
qestimado = q(xestimado). Os valores mximo e mnimo de q(x)
correspondem aos valores
xestimado x de x.

dq
x
dx

(3.23)

Esta regra geralmente permite encontrar q


fcil e rapidamente. Ocasionalmente, quando
q(x) for muito complexa, calcular sua derivada
pode ser difcil e recomendvel e mais fcil
usar (3.20). Quando se usa uma calculadora
programvel ou um programa de computador
para achar q(x), ento achar q(xestimado + x) e
q(xestimado) e sua diferena pode ser mais fcil
que derivar q(x) explicitamente.

Da Fig. 3.2. pode-se ver que


q = q(xestimado + x) q(xestimado)
Agora, uma aproximao bsica de clculo
garante que, para qualquer funo q(x) e
qualquer pequeno incremento u,

Exemplo: Incerteza em um cosseno


Como aplicao simples da regra geral,
seja o angulo medido como:

29

Propagao da Incerteza
isto , a incerteza relativa em q = xn |n| vezes
a incerteza relativa de x. Para o caso particular

= 20 3o

da raiz quadrada, q = x onde n = ,

e se quer encontrar cos . A melhor estimativa


de cos cos 20o = 0,94 e de acordo com a
regra, a incerteza
d cos

(cos) =
d
= |sen | (radiano)

q 1 x
=
q 2 x

isto , a incerteza relativa em x a metade


da incerteza relativa de x. De modo anlogo, a
incerteza relativa de 1/x = x-1 a mesma que a
incerteza relativa em x.
A regra da incerteza da potncia um caso
especial da regra da incerteza da multiplicao
(potenciao uma multiplicao de vrios
fatores iguais entre si). Porm, por sua
importncia, pode-se enunciar uma regra
separada para a potncia, como:

(3.24)

indicado expressar x em radiano,


porque a derivada de cos sen somente
se for expresso em radiano. Como = 3o e
= 0,05 rad, tem-se
(cos ) = (sen 20o) x 0,05
= 0,34 x 0,05 = 0,02

Incerteza na Potncia
Se a quantidades x medida com incerteza
x e usada para calcular a potncia q(x) = xn,
onde n um nmero fixo e conhecido) ento a
incerteza relativa em q |n| vezes a incerteza
relativa em x, ou seja

Assim, o resultado final


cos = 0,94 + 0,02

q
x
=n
q
x

Probleminha rpido 3.7


Seja o resultado de uma medida x igual a
3,0 0,1. Calcular q = ex, com sua incerteza. (A
derivada de ex ex).

Probleminha rpido 3.8


Seja o resultado de uma medida x igual a

Resposta: q = e3 e3 x 0,1 = 20 2

100 6. Calcular q =

x , com sua incerteza.

Resp.: Como a medio 100 6%, q = 10,0 3% ou 10,0 0,3

Como outro exemplo da regra, pode-se


rederivar e generalizar um resultado
encontrado em (3.5). Seja a medio da
quantidade x e se queira calcular q = xn, onde n
um nmero conhecido, exato, positivo ou
negativo. De acordo com a regra, a incerteza
resultante em q :
q =

(3.26)

3.9. Propagao passo a passo


Tem-se agora ferramentas suficientes para
resolver quase qualquer problema com
propagao de incertezas. Qualquer clculo
pode ser dividido em uma seqncia de
passos, cada passo envolvendo um dos
seguintes tipos de operao:
1. somas e subtraes
2. produtos e quocientes
3. potenciao e ndices
4. funo transcendental, como xn, senx,
ex.

dq
x = nx n1 x
dx

Se ambos os lados forem divididos por


q = x n , tem-se:

q
x
=n
q
x

Por exemplo, o clculo de

30

Propagao da Incerteza
q = x(y z sen u)

trabalhar quase sempre com apenas


um algarismo significativo, de modo
que os clculos possam ser feitos
mentalmente e muitas incertezas muito
pequenas possam ser desprezadas
completamente.
3. Existem aplicaes envolvendo
funes q(x) cuja incerteza no pode
ser encontrada com confiabilidade
aplicando-se o mtodo do passo-apasso mostrado. Estas funes sempre
envolvem, no mnimo, uma varivel que
aparece mais de uma vez.
Exemplo de funo que no pode ter
incerteza calculada pelo mtodo anterior

a partir das quantidades medidas x, y, z e u,


pode ser feito atravs dos seguintes passos:
1. computar a funo sen u
2. fazer o produto z sen u
3. fazer a diferena y z sen u
4. fazer o produto x com (y z sen u)
Sabem-se como as incertezas se
propagam atravs de cada operao separada.
Assim, como as vrias quantidades envolvidas
so independentes entre si, pode-se calcular a
incerteza no resultado final fazendo-se o
mesmo roteiro do clculo da quantidade. Por
exemplo, se as quantidades medidas x, y, z e u
foram medidas com incertezas
correspondentes de x, y, z e u, calcula-se
a incerteza em q assim:
1. calcular a incerteza em sen u
2. achar a incerteza no produto
z sen u
3. achar a incerteza na diferena
y z sen u
4. finalmente, calcular a incerteza no
produto completo x(y z sen u)

q = y x (sen y)
Esta funo a diferena de dois termos: y
e (x sen y), porm estes dois termos no so
independentes, pois y aparece em ambos.
Assim, para achar a incerteza no resultado,
deve-se somar aritmeticamente as incertezas e
no usar a raiz quadrada da soma dos
quadrados. Em algumas aplicaes, este
tratamento pode resultar em incertezas
maiores que as verdadeiras. Para evitar esta
superestimativa da incerteza ser desenvolvido
outro mtodo

Probleminha rpido 3.9


Sejam os resultado de trs medidas

x = 200 2
y = 50 2
z = 40 2

3.10. Exemplos
Sero apresentados, agora e aqui, trs
exemplos do tipo de clculo encontrado em
laboratrio. Nenhum dos exemplos
complicado; de fato, poucos problemas reais
so mais complicados que estes exemplos.

(200 1%)
(50 4%)
(40 5%)

onde as trs incertezas so independentes e


aleatrias. Usar a propagao passo-a-passo
para achar a quantidade q = x/(y-z) com sua
incerteza. [Primeiro achar a incerteza na
diferena (y z) e depois no quociente x/(y-z)].

Exemplo 1: Medio de g com pndulo


Seja a medio da acelerao da
gravidade, g, usando um pndulo simples, de
comprimento L. O perodo T do pndulo vale:
L
T = 2
g

Resposta:

1. (y z) = 10 3 = 10 30% (Usado o
algoritmo da soma em quadratura)
2. x/(y-z) = 20 (1% + 30%) = 20 6

Assim, a partir das medies de T e L,


pode-se determinar g, como:

Devem ser enfatizados trs pontos gerais


na propagao das incertezas:
1. Como as somas e subtraes
envolvem incertezas absolutas (como
x) e os produtos e quocientes
envolvem incertezas relativas (como
[x/|x|]), os clculos exigem a
passagem de incertezas relativas para
absolutas e vice-versa.
2. Uma caracterstica importante e
simplificadora de todos os clculos
nestas incertezas que se deve

g=

4 2L
T2

Esta expresso envolve o produto e


quociente de trs fatores: 42, L e T2. Se todas
as incertezas so aleatrias e independentes, a
incerteza relativa do resultado a raiz
quadrada da soma dos quadrados das
incertezas de cada fator. O fator 42 no tem
incerteza e a incerteza relativa de T2 o dobro
da incerteza relativa de T.

31

Propagao da Incerteza
2. incerteza do quociente dos senos
ou seja,

Assim, a incerteza relativa de g dada como:


2

g
L T
= + 2

g
L T

n
sen i sen r
=
+

n
sen i sen r

Foram feitas medies de 25 oscilaes,


com um cronmetro com incerteza de 0,1 s e
obtidos os seguintes resultados:

L = 92,95 + 0,01 cm
T = 1,936 0,004 s

Ar
Vidro

A melhor estimativa para g dada por:


r

gestimado =

4 (92,95 cm)
= 979 cm/s 2
(1,936 s)2
2

Fig. 3.5. Os ngulos de incidncia i e refrao r quando um raio de


luz passa do ar para o vidro

As incertezas relativas de cada fator so:


Para achar a incerteza relativa no seno de
qualquer ngulo , tem-se

L
= 0,1%
L
T
= 0,2%
T
resulta em

sen =

d sen

ou seja
sen = cos (em radianos)

g
= (0,1)2 + (0,2)2 % = 0,4%
g

A incerteza relativa
g = 0,004 x 979 cm/s2 = 4 cm/s2

sen
= cot (rad)
sen

O resultado final :
g = 979 4 cm/s2

Sejam os resultados das medies dos


ngulos i e r, como mostrados nas primeiras
duas colunas da Tab. 3.1, com incertezas de
1o ou 0,02 rad. O clculo de n = sen i/sen r
facilmente feito, como mostrado nas trs
prximas colunas da Tab. 3.1. A incerteza em n
pode ser encontrada como nas ltimas trs
colunas. As incertezas relativas em sen i e em
sen r so calculadas usando cot e finalmente
a incerteza em n obtida.
Antes de fazer uma srie de medies
como as duas mostradas na Tab. 3.1, pode-se
pensar cuidadosamente como melhor registrar
os dados e os clculos. A apresentao
atravs de uma tabela
1. torna mais fcil a visualizao dos
dados
2. reduz o perigo de enganos nos clculos
3. possibilita o seguimento e verificao
dos clculos.

(Comparando-se este resultado com o


valor usual de 981 cm/s2, verifica-se que o
resultado inteiramente satisfatrio).
Exemplo 2: ndice de refrao
Se um raio de luz passa do ar para o vidro,
o angulo de incidncia i e de refrao r so
definidos como na Fig. 3.5 e esto
relacionados pela lei de Snell:

sen i = n sen r
onde n o ndice de refrao do vidro. Assim,
medindo-se os ngulos i e r, pode-se
determinar o ndice de refrao n, como
n=

sen i
sen r

A incerteza do ngulo de refrao


calculada pelos passos:
1. incerteza do seno dos ngulos

32

Propagao da Incerteza
Tab. 3.1. Caminho para determinar ndice de refrao

i (grau)
1o

r (grau)
1o

sen i

sen r

20
40

13
23,5

0,342
0,643

0,225
0,399

1,52
1,61

sen i
| sen i |
5%
2%

sen r
| sen r |
8%
4%

n
n
9%
5%

e aplicando-se os valores numricos, tem-se


Exemplo 3: Acelerao de um corpo no
plano inclinado
Seja um corpo descendo um plano
inclinado com ngulo . A acelerao esperada
de g sen. Medindo-se , pode-se facilmente
determinar a acelerao esperada e sua
incerteza. Pode-se medir a acelerao real a
cronometrando o tempo em que o corpo passa
atravs de duas fotoclulas, como mostrado,
com cada fotoclula ligada a um cronmetro.
Se o corpo em comprimento L e leva um tempo
t1 para passar a primeira fotoclula, sua
velocidade l v1 = L/t1. Do mesmo modo, v2 =
L/t2. Se a distncia entre as fotoclulas s,
ento tem-se:
a=

(2 0,01)2 + (0,02)2 = 0,02 = 2%

fotoclula 1
L
L

fotoclula 2

v 22 v 12
2s

Fig. 3.6. Um carro desce um plano inclinado de


ngulo q. Cada fotoclula ligada a um cronmetro para
medir o tempo quando o carro passa por ela.

ou
L2 1 1
a = 2 2
2s t 2 t 1

Como a incerteza percentual de s muito


pequena em relao s outras incertezas, ela
desprezada. Assim, tem-se:

Usando-se esta frmula e medindo-se os


valores de L, s, t1 e t2, pode-se determinar a
acelerao e sua incerteza.
Foram obtidos os seguintes resultados:

L2
= 0,125 cm 2%
2s

(3.35)

L = 5,00 0,05 cm (1%)


s = 100,00 0,2 cm (0,2%)
t1 = 0,054 0,001 s (2%)
3.34)
t2 = 0,031 0,001 s (3%)

Para calcular o segundo fator e sua


incerteza, procede-se passo a passo. Como a
incerteza relativa em t1 2%, a incerteza em
1/t12 de 4%. Como t1 = 0,054 s,
1/t12 = 343 s-2 4% = 343 14 s-2

Destes valores, pode-se calcular

Do mesmo modo, a incerteza de 1/t22 de 6%


e

L2
= 0,125 cm
2s
A incerteza relativa neste fator :
2

L s
2 +
L s

1/t22 = 1041 s-2 6% = 1041 62 s-2

33

Propagao da Incerteza
Fazendo a subtrao e combinando as
incertezas em raiz quadrada da soma dos
quadrados, tem-se

parea complicada de usar, primeira vista,


ela teoricamente til. Ela tambm resolve o
problema j mostrado, quando se tem uma
quantidade que funo de uma varivel mais
de uma vez e portanto as incertezas so
dependentes.
Para ilustrar este tipo de problema, seja a
quantidade q funo de trs variveis medidas
x, y e z:

1 1

= 698 64 s - 2 = 698 s - 2 9%
t 22 t 12

(3.36)
Finalmente, a acelerao a obtida pelo
produto destes dois fatores e a sua incerteza
obtida pela raiz quadrada da soma dos
quadrados das respectivas incertezas relativas.
Tem-se

q=

(3.38)

onde a varivel x aparece duas vezes. Quando


se calcula a incerteza q em etapas, tem-se:
1. computao da incerteza de x + y
2. computao da incerteza de x + z
3. computao da diviso (x+y)/(x+z)
Procedendo deste modo, perde-se
completamente a chance de que as incertezas
do numerador devidas a x possam, de algum
modo, cancelar as incertezas do denominador
devidas tambm a x.
Para entender como pode haver este
cancelamento, sejam os nmeros x, y e z,
todos positivos e veja-se o que ocorre na
medio de x sujeita incerteza. Quando a
incerteza de x superestimada, as duas somas
(x+y) e (x+z) so igualmente superestimadas
de modo que estas superestimativas sero
canceladas. O mesmo ocorre quando a
incerteza em x subestimada. Deste modo,
qualquer incerteza em x cancelada quando
se faz a diviso (x+y)/(x+z) e este
cancelamento no considerado quando se
procede por passos.
Sempre que uma funo envolve a mesma
quantidade mais de uma vez, algumas
incertezas podem ser canceladas. Quando
ocorre este cancelamento, o clculo feito por
etapas tem incerteza do resultado
superestimada. O nico modo de considerar o
cancelamento e evitar a superestimativa da
incerteza calcular a incerteza em uma nica
etapa, como ser visto agora.
s vezes, uma funo que envolve uma
varivel mais de uma vez pode ser reescrita de
forma diferente, usando a varivel uma nica
vez. Por exemplo,

a = (0,125 cm 2%) (698 s-2 9%)


a = 87,3 cm/s2 9%
ou
a = 87 8 cm/s2

x+y
x+z

(3.37)

Este resultado pode ser comparado com o


obtido atravs de gsen, se disponvel.
Vrias caractersticas interessantes podem
ser observadas neste exemplo:
1. A incerteza de 2% no fator (L2/2s)
desprezvel em relao incerteza de
9% no fator (1/t12) (1/t22). Se forem
necessrios outros clculos para novas
medies, as incertezas de L e s
podem ser ignoradas, pois so
insignificantes.
2. As incertezas de 2% e 3% em t1 e t2
crescem para 9%, quando se
calculam 1/t12 e 1/t22 e a diferena
(1/t12) (1/t22). Este crescimento resulta
parcialmente de elevar ao quadrado os
tempos e fazer a diferena entre dois
nmeros grandes. Se algum pensar
em alterar a experincia, aumentando a
velocidade do corpo (dando-lhe um
empurro inicial), os tempos diminuem
e os efeitos nas incertezas pioram
muito.

3.11. Frmula geral para propagao da


incerteza
At agora foram estabelecidas trs regras
para a propagao das incertezas:
1. para a soma ou subtrao
2. para o produto ou quociente
3. para funes arbitrrias de uma
varivel.
Foi visto tambm, como a computao de
uma funo complexa pode ser quebrada em
passos e a incerteza na funo computada por
passos, usando as trs regras simples.
Aqui e agora, ser dada uma nica forma
para uma regra geral, da qual podem ser
derivadas as trs regras anteriores e atravs
da qual se pode resolver qualquer problema de
propagao de incerteza. Embora esta frmula

q = xy - xz
pode ser reescrita como
q = x(y z)
Neste caso, a primeira expresso no pode
ter a incerteza calculada por etapas, porm, a
segunda expresso pode ter a incerteza
calculada por etapas, sem problema nenhum.

34

Propagao da Incerteza
Sejam duas quantidades x e y, que so
medidas para calcular a funo q(x, y). Esta
funo pode ser to simples como q = x + y ou
to complicada como q = (xy3 senxy)
Para uma funo q(x) de uma nica
varivel x, argumentou que a melhor
estimativa para x o nmero xestimado e por isso
a melhor estimativa para q(x) q(xestimado).
Depois, argumentou-se que os valores
provveis extremos (ou seja, o maior e o
menor) de x so xestimado x e que os valores
extremos correspondentes de q so portanto
q(xestimado x)

q
q
q( x estimado , y estimado )
x +
y
y
x

Isto significa que a incerteza em q(x, y) vale


q

dq
u
dx

q(x, y) = x + y

(3.40)

Tem-se

q q
=
=1
x y

e portanto

(para qualquer incremento pequeno u) para


reescrever os valores provveis extremos
(3.39):
dq
q( x estimado )
x
(3.41)
dx

q = x + y

(3.46)

Aplicando-se esta regra funo tambm


conhecida q(x,y) = xy

onde o valor absoluto para permitir a


possibilidade de dq/dx ser negativa. O
dq
resultado (3.41) significa que q
x .
dx
Quando q funo de duas variveis, q(x,
y), o argumento similar. Se xestimado e yestimado
so as melhores estimativas para x e y,
espera-se que a melhor estimativa para q seja

Tem-se
q
=y
x

e
q
=x
y

Ento

qestimado = q(xestimado, yestimado)

q= yx + xy

como usual. Para estimar a incerteza neste


resultado, necessrio generalizar a
aproximao (3.40) para uma funo de duas
variveis. A generalizao a ser feita
q( x + u, y + v ) q( x, y ) +

(3.43)

Aplicando-se esta regra a uma funo


simples j conhecida da soma x + y,

(3.39)

Finalmente, foi usada a aproximao


q( x + u) = q( x ) +

q
q
x +
y
x
y

Dividindo ambos os termos por xy e sendo


q = xy, tem-se
q x y
=
+
q
x
y

q
q
u+
v (3.42)
x
y

A regra (3.43) pode ser generalizando de


vrios modos. No se deve ficar surpreso se
descobrir que, quando as incertezas dx e dy
so independentes e aleatrias, a soma (3.43)
pode ser substituda pela soma em quadratura.
Se a funo q depende de mais de duas
variveis, ento simplesmente se adiciona
termos extras para cada varivel extra. Deste
modo, chega-se a seguinte regra geral,
irrestrita e completa (cuja justificativa ser
apresentada nos Capitulos 5 e 9).

onde u e v so pequenos incrementos em x e y


e q/x e q/y so as derivadas parciais de q
em relao a x e a y. Ou seja, q/x o
resultado da derivada de q em relao a x,
mantendo-se y constante e q/y o resultado
da derivada de q em relao a y, mantendo x
constante.
Os valores provveis extremos para x e y
so xestimado x e yestimado y. Se estes
valores forem inseridos em (3.42) e lembrando
que q/x e q/y podem ser positivas ou
negativas, para os valores extremos de q,

35

Propagao da Incerteza
Incerteza em funo de muitas variveis

Exemplo para uso da eq. (3.47)


Determinar a quantidade

q = x2y xy2

Sejam as quantidades
x, y, ..., z medidas com incerteza x, y, ..., z,
e usadas para calcular a funo q(x,y,...,z). Se
as incertezas so aleatrias e independentes,
ento a incerteza q dada por
2

q
q
q = x + ... + z
x
z

e sua incerteza, a partir das seguintes


medies:
x = 3,0 0,1
y = 2,0 0,1

(3.47)
A melhor estimativa de q
q = 2,02 x 3,0 2,0 x 3,02 = 6,0

Em qualquer caso, ela nunca maior que a


soma aritmtica:
q

q
q
x + ... +
z
x
z

Para determinar q
1. Acha-se a incerteza qx , incerteza em q
devida apenas a x

(3.48)

q x =

Embora tenha-se o preconceito de achar as


eq. (3.47) e (3.48) muito complicadas, elas
podem ser facilmente entendidas, quando se
pensa em cada termo por vez. Por exemplo,
seja a quantidade q funo das variveis x, y,
... z. Em determinado momento, suponha-se
que todas as variveis, exceto x, sejam
constantes. Neste momento, somente a
varivel x est sujeita incerteza e todas as
outras incertezas, y, ... z so zero. Como a
funo q contem somente uma varivel, sua
incerteza vale:
q =

q
x (se y = ...= z = 0)
x

q
x
x

(3.50)

qx = |2xy y2| x = |12 4| x 0,1 = 0,8

2. De modo anlogo, acha-se


qy = (incerteza em q devida apenas a y)
q y =

(3.49)

q
y
y

(3.51)

qy = |x2 2xy| y = |9 12| x 0,1 = 0,3

O termo |q/x|x a incerteza parcial em q


causada apenas pela incerteza em x. Do
mesmo modo, o termo |q/y|y a incerteza
parcial em q causada apenas pela incerteza
em y. Considerando todas as incertezas
independentes e aleatrias, a incerteza total de
q a raiz quadrada da soma dos quadrados
das incertezas devidas x, y, ..., z.
Assim, quando se tiver uma quantidade
funo de muitas variveis, q(x,y,...,z) e se
quiser calcular a incerteza em q:
1. Calcular as incertezas parciais em q
devidas a x, y, ..., z separadamente.
2. Achar as derivadas parciais de q em
relao a cada varivel
3. Multiplicar cada incerteza pela derivada
parcial correspondente
4. Elevar ao quadrado cada fator
5. Somar todos os fatores
6. Extrair a raiz quadrada da soma.

Acha-se a raiz quadrada da soma dos


quadrados das duas incertezas:
q = (q x ) 2 + (q y ) 2

(3.52)

q = 0,8 2 + 0,3 2 = 0,9


Assim, o resultado final :
q = 6,0 0,9
O uso de (3.47) ou (3.48) para calcular
incertezas razoavelmente direto, quando se
segue o procedimento usado neste exemplo:
1. calcular cada contribuio para x
2. combinar as incertezas para dar a final
O procedimento divide o problema em
pequenos clculos que so mais fceis e onde
dificilmente se comete engano. Tambm se
percebe quais as variveis que contribuem com
incertezas desprezveis e dominantes. No
exemplo anterior, a incerteza de 0,3 quase

36

Propagao da Incerteza
desprezvel quando comparada com 0,8 e
quando ambas so somadas em quadratura.
Resumindo:
1. Quando possvel aplicar o processo
de etapas, ele usualmente mais
simples que a regra (3.47) ou (3.48).
Ele se aplica quando as incertezas
forem aleatrias e independentes.
2. Se a funo q(x, y, ..., z) envolve uma
varivel mais de uma vez, pode haver
cancelamento de incertezas e o
processo por etapas pode dar resultado
muito maior que o razoavelmente
esperado e neste caso recomenda-se
usar a regra (3.47) ou (3.48) em uma
nica etapa.

37

Propagao da Incerteza

Definies e Equaes
do Captulo 3

Quantidade medida vezes nmero exato


Se B considerado uma constante e
q = Bx, ento

Regra da raiz quadrada para contagem

x = |B| x

Se so observadas ocorrncias de um
evento que acontece aleatoriamente mas com
uma taxa definida mdia e contado um
nmero de ocorrncias durante um tempo T,
a estimativa para o nmero mdio verdadeiro
nmero mdio de eventos no tempo T =

ou de modo equivalente,
q x

q
x

[Ver (3.2)]

[Ver (3.9)]

Incerteza na potncia
Se n um nmero exato e

Regras para propagao da incerteza

q = xn , ento

As regras de propagao da incerteza se


referem a uma situao em que se tem vrias
quantidades x, y, ..., w com incertezas x, y,
..., w e ento so usados estes valores para
se calcular a quantidade q. As incertezas em x,
y, ..., w se propagam atravs do clculo para
causar uma incerteza em q como segue:

q
x
=n
q
x

[Ver (3.26)]

Incerteza em uma funo de uma


varivel
Se q = q(x) qualquer funo de x, ento
dq
q =
x
[Ver (3.23)]
dx

Somas e diferenas
Se
q = x + y + ... + z (u + v + ... + w)

s vezes, se q(x) for complicada e se foi


escrito um programa para calcular q(x), ento,
em vez de derivar q(x) em relao a x, pode
ser mais fcil usar o equivalente:

ento
q = (x )2 + ... + (z)2 + (u)2 + ...( w )2

[Ver (3.16)]
desde que todas as incertezas sejam
independentes e aleatrias e sempre

q = q(xestimado + x) q(xestimado)

q x + y + ...+ z + u + v + ... + w
[Ver (3.17)]

Frmula geral para propagao da


incerteza

Produtos e quocientes

Se q = q(x, y, ..., z) qualquer funo de x,


y, ..., z, ento

Se
q=

x y ... z , ento
u v ... w

q
q
q = x + ... + z [Ver (3.47)]
x
z

q
x
z
u
w
= ( )2 + ...( )2 + ( )2 + ... + ( )2
q
x
z
u
w
[Ver (3.18)]
desde que todas as incertezas sejam
independentes e aleatrias. E sempre

desde que todas as incertezas sejam


independentes e aleatrias.
Sempre tem-se
q
q
q
x + ... +
z
[Ver (3.48)]
x
z

q x y
z u
w

+
+ ... +
+ ... +
q
x
y
z
u
w

[Ver (3.19)]

Apostilas\Incerteza

38

JRTaylor2.doc

25 SET 98 (Substitui 29 JAN 98)

Anlise Estatstica das Incertezas Aleatrias

4. Incertezas Aleatrias
fazendo vrias medies diferentes de L e
medindo o perodo correspondente de cada
um. Neste modo, chega-se a vrios valores de
g. Para achar a incerteza nestes valores de g,
pode se proceder de dois modos:
1. pode-se estimar realisticamente as
incertezas nas medies de L e T e
ver como as incertezas se propagam
para achar a incerteza em g.
2. obtidos vrios valores de g, pode-se
analis-los estatisticamente, em
particular seu desvio padro ser uma
boa medio de sua incerteza.
Infelizmente, na realidade no se tem uma
escolha de como achar a incerteza. Se a
incerteza pode ser encontrada por estes dois
modos, na realidade se usam os dois modos
para verificar se os dois resultados so
consistentes, entre si, dando a mesma
resposta.

4.1. Introduo
O melhor modo para aumentar a confiabilidade de
uma medio repeti-la vrias vezes e analisar os
diferentes valores obtidos. Neste captulo, sero vistos os
mtodos para analisar as medies feitas deste modo.

Nem todos os tipos de incertezas


experimentais podem ser tratados por anlise
estatstica baseada em medies repetidas.
Por este motivo, as incertezas so
classificadas em dois tipos:
1. incertezas aleatrias, que podem ser
tratadas estatisticamente
2. incertezas sistemticas, que no
podem.
Esta diferena descrita na seo 4.1.
O resto do captulo trata principalmente das
incertezas aleatrias. A seo 4.2 introduz,
sem justificativa formal, duas definies
importantes relacionadas com sries de valores
medidos x1, x2, ..., xN, todos de alguma nica
quantidade x. definida a mdia de x1, x2, ...,
xN. Sob condies convenientes, a mdia a
melhor estimativa de x baseada nos valores
medidos x1, x2, ..., xN. Depois definido o
desvio padro de x1, x2, ..., xN. A seo 4.4
introduz a noo importante do desvio padro
da mdia. Este parmetro caracteriza a
incerteza na mdia como a melhor estimativa
de x. Finalmente na seo 4.6 trata-se de novo
do problema complicado das incertezas
sistemticas.
Neste captulo, tenta-se justificar os
mtodos usados, baseando-se na idia
importante da distribuio normal.
A relao da anlise estatstica com a
propagao da incerteza merece meno. Do
ponto de vista prtico estes dois assuntos
podem ser vistos separadamente, embora
sejam relacionados. Eles devem ser
planejados, porque a maioria das experincias
requerem o uso dos dois. Em algumas
aplicaes, as regras da propagao da
incerteza e anlise estatstica so
complementares. Ou seja, uma experincia
pode ser analisada usando-se a propagao da
incerteza ou a anlise estatstica. Por exemplo,
seja o clculo da acelerao da gravidade, g,
atravs da medio do perodo T e do
comprimento L de um pndulo simples. Podese calcular a acelerao atravs da frmula
matemtica
(g = 42L/T2). Pode-se repetir a experincia

4.2. Incertezas aleatrias e sistemticas


As incertezas experimentais que podem ser
reveladas pela repetio das medies so
chamadas de aleatrias. As incertezas que
no so reveladas deste modo so as
sistemticas. Para ilustrar esta diferena,
sejam alguns exemplos.
Seja o tempo de revoluo de um tocadiscos que gira em regime permanente. Uma
fonte de incerteza na medio do tempo de
revoluo ser a reao do operador para
acionar o cronmetro na partida e na parada.
Se o tempo de reao do operador fosse
exatamente o mesmo, eles se cancelariam na
partida e parada. Na prtica, porm, o tempo
de reao varia de operador para operador e
at para o mesmo operador. Pode-se ter maior
tempo de reao na partida e por isso
superestimar o tempo medido ou pode-se ter
maior tempo de reao na parada,
subestimando o tempo medido. Como qualquer
possibilidade igualmente provvel, o sinal do
efeito aleatrio. Se as medies so
repetidas vrias vezes, em alguns casos podese superestimar e em outros,, subestimar seus
valores. Assim, a varivel tempo de reao
depende das respostas encontradas.
Analisando o espalhamento em resultados
estatsticos, pode-se ter uma estimativa
confivel do tipo desta incerteza.

39

Anlise Estatstica das Incertezas Aleatrias


Por outro, se o cronmetro estiver
funcionando consistentemente mais devagar,
ento todas as medies sero subestimadas e
nenhum nmero de repeties, com o mesmo
cronmetro, ir revelar este tipo de incerteza.
Este tipo de incerteza chamado de
sistemtico, porque ela atua no resultado
sempre do mesmo modo. Se o cronmetro
anda mais lentamente, h sempre uma
subestimativa; se ele anda mais rapidamente,
uma superestimativa. Incertezas sistemticas
no podem ser descobertas por qualquer tipo
de anlise estatstica disponvel.
Como segundo exemplo de incertezas
aleatrias versus sistemticas, seja a
experincia de medir um comprimento com
uma rgua. Uma fonte de incerteza ser a
necessidade de interpolar a leitura entre duas
marcaes da escala e esta incerteza
provavelmente aleatria. Quando se faz a
interpolao, a probabilidade de fazer
subestimativa e superestimativa a mesma.
Mas h tambm a possibilidade que a rgua
esteja distorcida e esta fonte de incerteza ser
provavelmente sistemtica. Se a rgua estiver
esticada, sempre haver uma superestimativa,
se estiver encolhida, sempre haver uma
subestimativa.
Como nestes dois exemplos, quase todas
as medies esto sujeitas s duas incertezas
aleatrias e sistemticas. Geralmente fcil
distinguir os dois tipos de incertezas. As fontes
de incerteza aleatria so:
1. pequenos erros de julgamento do
operador, como quando faz
interpolao
2. pequenos distrbios do sistema de
medio, como vibrao mecnica
3. problemas de definio da quantidade
medida
A fonte de incerteza sistemtica mais clara
a descalibrao do instrumento de medio,
como ocorre com o cronmetro que atrasa ou
adianta sistematicamente, a rgua de medio
esticada ou encolhida, o instrumento de
medio com erro de zero. Para dar um
entendimento ainda melhor da diferena entre
incerteza aleatria e sistemtica, seja a
analogia mostrada na Fig. 4.1, mostrado o alvo
com tiros. Aqui a experincia uma serie de
tiros em um alvo. Medies exatas so os tiros
que esto no centro ou prximos do centro do
alvo. As incertezas aleatrias so causadas por
qualquer coisa que faa os tiros chegarem
aleatoriamente em pontos diferentes. Por
exemplo, o tremido da mo do atirador,
flutuaes das condies atmosfricas entre o
atirador e o alvo. Incertezas sistemticas
aparecem se algo faz os tiros chegarem no
alvo fora do centro em uma direo

sistemtica, por exemplo sempre para cima e


para a esquerda. Isto acontece se a arma
estiver com a mira fora da posio correta ou
se estiver havendo um vento forte e constante
durante todos os tiros.
Embora a Fig. 4.1 seja uma ilustrao
excelente dos efeitos das incertezas aleatrias
e sistemticas, ele possui uma falha
importante. Como cada figura mostra a
posio do alvo, pode-se dizer rapidamente se
um determinado tiro exato ou no. Em
particular, a diferena entre as duas figuras de
cima imediatamente evidente. Os tiros na
figura esquerda se agrupam em torno do centro
do algo, enquanto os tiros da figura direita se
agrupam em torno de um ponto que est
nitidamente fora do centro. O grau de
disperso aproximadamente o mesmo nos
dois alvos, porem, no alvo esquerda no h
erro sistemtico e no alvo direito h um grande
erro sistemtico. Conhecer a posio do alvo
na Fig. 4.1 corresponde, em um laboratrio de
medio conhecer o valor verdadeiro da
quantidade medida e na grande maioria das
medies reais, no se conhece este valor
verdadeiro. Se o valor verdadeiro fosse
conhecido, ningum iria perder tempo fazendo
sua medio.

(a)
Aleatria: pequena
Sistemtica: pequena

(c)
Aleatria: grande
Sistemtica: pequena

(b)
Aleatria: pequena
Sistemtica: grande

(d)
Aleatria: grande
Sistemtica: grande

Fig. 4.1. Incertezas aleatrias e sistemticas no alvo.


(a) Como todos os tiros esto agrupados, as
incertezas aleatrias so pequenas. Como a distribuio
dos tiros est centrada no centro do alvo, as incertezas
sistemticas so tambm pequenas.
(b) As incertezas aleatrias ainda so pequenas, pois
os tiros continuam agrupados. Porm a distribuio dos

40

Anlise Estatstica das Incertezas Aleatrias


tiros est centrada fora do centro do alvo e por isso as
incertezas sistemticas so grandes.
(c) Aqui, as incertezas aleatrias so grandes pois os
tiros esto muito espalhados. Como a distribuio dos
tiros espalhados contnua centrada no centro do alvo, as
incertezas sistemticas so pequenas.
(d) Aqui ambas as incertezas aleatrias e
sistemticas so grandes: h uma grande disperso dos
tiros e eles esto sistematicamente fora do centro,
sempre para cima e para a direita.

(a)
Aleatria: pequena
Sistemtica: ?

(c)
Aleatria: grande
Sistemtica: ?

sistemticas em outra. Por exemplo, quando o


observador se posiciona esquerda ou
direita do ponteiro para fazer uma leitura na
escala, ele obtm resultados diferentes do
mesmo valor da medio. Este erro, chamado
de paralaxe, significa que um medidor pode ser
lido corretamente, somente se o observador se
posiciona corretamente em sua frente. Porm,
independente da posio de seu corpo, nem
sempre ele posiciona corretamente seus olhos
em frente do medidor, de modo que as
medies possuem uma pequena incerteza
devida ao paralaxe e esta incerteza ser
provavelmente aleatria. Por outro lado, um
observador que se posiciona incorretamente
para fazer estas mesmas medies, introduz
uma incerteza sistemtica nas suas medies,
alm das incertezas aleatrias comuns ao
outro observador. Assim, o mesmo efeito,
paralaxe, pode produzir incertezas aleatrias
em um caso e sistemas em outro.
O tratamento das incertezas aleatrias
diferente do tratamento das sistemticas. Os
mtodos estatsticos a serem descritos nas
sees seguintes do uma estimativa confivel
das incertezas aleatrias e, como ser visto,
fornecem um procedimento bem definido para
trat-las. As incertezas sistemticas so mais
difceis de tratar e mesmo de detectar. O
metrologista experiente deve aprender a
antecipar as possveis fontes de incertezas
sistemticas e garantir que todas as incertezas
sistemticas so muito menores que a preciso
requerida. Esta tarefa pode incluir, por exemplo
1. calibrar os medidores contra padres
rastreados,
2. corrigir as incertezas sistemticas
devidas a m calibrao,
3. comprar melhores instrumentos, se
possvel.
Na seo 4.6 sero vistas as incertezas
sistemticas. Agora, sero discutidas as
experincias em que todas as incertezas
sistemticas foram identificadas e tornadas
muito menores que a preciso requerida.

(b)
Aleatria: pequena
Sistemtica: ?

(d)
Aleatria: grande
Sistemtica: ?

Fig. 4.2. O mesmo experimento da Fig. 4.1, redesenhado


sem mostrar a posio do alvo. Esta situao
corresponde maioria das aplicaes reais em que
no se conhece o valor verdadeiro da quantidade
sendo medida. Aqui, s se pode analisar e
determinar as incertezas aleatrias mas nada pode
ser dito acerca das incertezas sistemticas.

Para melhorar a analogia da Fig. 4.1 com


mais experincias reais, pode-se redesenhar
os tiros, sem os anis que mostram a posio
do alvo, como na Fig. 4.2. Nestes desenhos,
identificar os erros aleatrios continua fcil. Os
dois desenhos (a) e (b) continuam tendo
pequenas incertezas aleatrias e (c) e (d)
continuam tendo grandes incertezas aleatrias.
Porem, neste caso, baseando-se apenas na
Fig. 4.2, impossvel determinar a incerteza
sistemtica. Esta situao a que geralmente
ocorre na prtica. Pela observao da
distribuio dos valores medidos, pode-se
facilmente identificar as incertezas aleatrias
mas no h nenhuma ajuda para determinar as
incertezas sistemticas.
A diferena entre incertezas aleatrias e
sistemticas nem sempre clara e definida e
um problema que causa incertezas aleatrias
em uma experincia pode produzir incertezas

4.3. Mdia e desvio padro


Seja o caso onde se quer medir alguma
quantidade x e onde j foram identificadas
todas as fontes de incerteza sistemtica e
todas foram reduzidas a nveis desprezveis.
Como todas as fontes remanescentes de
incerteza so aleatrias, pode-se detect-las
repetindo se as medies vrias vezes. Podese, por exemplo, fazer cinco medies e obter
os seguintes resultados:
71

41

72

72

73

71

(4.1)

Anlise Estatstica das Incertezas Aleatrias


incerteza mdia das medies x1, x2, ..., xN, e
determinada do seguinte modo.
Dado que a mdia x a melhor estimativa
da quantidade x, natural considerar a
diferena
xi - x = di. Esta diferena, chamada de desvio
ou resduo de xi de x , mostra de quanto a
isima (ia) medio xi difere da mdia x . Se os
desvios di = (xi - x ) so muito pequenos, as
medies ficam todas juntas, h pouca
disperso e o instrumento de medio
presumidamente muito preciso. Se alguns dos
desvios so muito grandes, as medies se
espalham, h grande disperso e o instrumento
de medio presumidamente pouco preciso.

(Por convenincia e simplicidade, foram


omitidas as unidades e por isso podem ser
aplicadas a qualquer grandeza)

A primeira questo a resolver : dadas as


seis medies mostradas, qual a melhor
estimativa para a quantidade x?
Razoavelmente, a melhor estimativa parece ser
a mdia x das cinco medies encontradas e
no capitulo 5 ser provado que esta escolha
normalmente a melhor.
xestimado = x
x=

71 + 72 + 72 + 73 + 71
= 718
,
5

(4.2)

(Para fazer mentalmente esta conta, sem


usar calculadora, e considerando que todos os
nmeros comeam de 70, basta somar os
nmeros 1, 2, 2, 3 e 1 = 9/5 = 1,8 e soma 1,8 a
70, obtendo 71,8).
A segunda expresso simplesmente a
definio de mdia aritmtica ou simplesmente
a mdia dos cinco nmeros considerados.
De um modo geral, quando se tem N
medies da quantidade x, todas obtidas do
mesmo instrumento, mesmo procedimento,
mesmo operador, mesmas condies
ambientais, e se encontram os N valores
x1, x2, ..., xN,

Tab. 4.1. Clculo dos desvios

Medies
i
1
2
3
4
5

(4.3)

mdia, x =

a melhor estimativa para x usualmente a


mdia de x1, x2, ..., xN, ou seja,
xestimado = x

x=

x1 + x 2 +...+ xN
N
xi
N

(4.4)

(4.5)

Nesta ltima linha, introduzida a notao


nova e til, usando a letra grega sigma (), que
significa:
N

x i = x i = x i = x1 + x 2 +...+ xN
i =1

Desvio
di = xi - x
-0,8
0,2
0,2
1,2
-0,8
di = 0,0

1
359
= 718
,
xi =
N
5

Para fixar a idia de desvio padro, sejam


as cinco medies anteriores e seja o clculo
de seu desvio padro. Pode ser observado que
1. Os desvios no so todos do mesmo
tamanho, di pequeno se a ia medio
ficar prxima de x e dj grande se a ja
medio ficar longe de x .
2. H desvios positivos (quando xi > x ),
negativos (quando xi < x ) e tambm
zero (xi = x ).
Para estimar a confiabilidade mdia das
medies x1, x2, ..., xN, pode-se pensar em tirar
a mdia dos desvios di. Infelizmente, isto no
funciona pois a mdia dos desvios zero. (Na
prtica, o desvio prximo de zero, por causa
das incertezas devidas aos arredondamentos).
O melhor meio de evitar este inconveniente
elevar ao quadrado todos os desvios, de
modo que se cria um conjunto de nmeros
todos positivos e depois se tira a raiz quadrada
da sua mdia. Este nmero obtido
1. possui a mesma unidade que x,
2. chama-se desvio padro de x1, x2,..., xN
3. simbolizado como x
4. calculado pela frmula:

onde
x=

Valor medido
xi
71
72
72
73
71
xi = 359

A segunda e terceira expresses so mais


abreviadas e sero usadas neste trabalho
quando no houver risco de confuso.
O conceito de mdia quase certamente
familiar maioria dos leituras. O prximo
conceito, de desvio padro, provavelmente
menos conhecido. O desvio padro de vrias
medies x1, x2, ..., xN, uma estimativa da

42

Anlise Estatstica das Incertezas Aleatrias


x =

1 N
1 N
( di )2 =

( xi x)2
N i=1
N i=1

(4.6)

de aproximadamente 0,7.
Infelizmente, o desvio padro tem uma
outra definio alternativa. H argumentos
tericos para substituir a fator N da eq. 4.6 por
(N 1)e definir o desvio padro x de x1, x2,...,
xN como

Com esta definio, o desvio padro pode


ser descrito como a raiz quadrada da mdia
dos quadrados (RMS = Root Mean Square)
dos desvios das medies x1, x2,..., xN. O
desvio padro prova ser um modo til de
caracterizar a confiabilidade e qualidade das
medies.
Outra possibilidade para verificar a
confiabilidade das medies, seria tomar os
valores absolutos de di, |di| mas a mdia de di2
se mostra mais til. A mdia de |di|
geralmente chamada de desvio da mdia
(nome infeliz!).
Para calcular o desvio padro x, de N
medies, de modo manual, como definido na
eq. 4.6, deve-se
1. computar os desvios di das N medies
2. elevar os desvios ao quadrado
3. tirar sua mdia (dividir por N)
4. tirar a raiz quadrada deste resultado

x =

Desvio
di = xi - x
-0,8
0,2
0,2
1,2
-0,8
di = 0,0

Sem querer provar que a definio com N-1


seja melhor que a definio com N, pode-se
dizer que esta nova definio melhorada do
desvio padro, calculada com N-1,
obviamente um pouco maior do que a obtida
com N e tambm corrige a tendncia da
frmula com N superestimar as incertezas nas
medies
x1, x2,..., xN, principalmente se o nmero de
medies pequeno. Esta tendncia pode ser
percebida, considerando se o caso extremo e
absurdo de N = 1 (caso de se fazer uma nica
medio). Aqui, a mdia x igual nica
medio e o desvio padro automaticamente
zero. Assim, a definio envolvendo N d o
resultado absurdo de x igual a zero. Por outro
lado, a definio com N - 1 d 0/0, que uma
indeterminao, o que reflete realmente a total
ignorncia da incerteza aps uma nica
medio. A definio com N geralmente
chamada de desvio padro da populao,
simbolizado como x e a definio com N-1, de
desvio padro da amostra, simbolizado como
sx.
A diferena entre as duas definies, com
N e com N - 1 quase sempre numericamente
insignificante, principalmente quando N
grande (acima de 20, por exemplo). Deve-se
sempre repetir uma medio muitas vezes (no
mnimo cinco e preferivelmente mais). Mesmo
se forem feitas somente cinco medies, (N =

Quadrado do
desvio, di2
0,64
0,04
0,04
1,44
0,4
2
d
i = 2,80

x = 359 / 5 = 718
,

Para os dados anteriores, parte destes


clculos foi comeada na Tab. 4.1. Na Tab. 4.2
foi acrescentada a 4a coluna, com os
quadrados dos desvios. Somando-se os
nmeros di2 e dividindo por 5, obtm a
quantidade x2 (chamada de varincia das
medies).
1
2,80
i2 = di2 =
= 0,56
(4.7)
N
5
Tirando a raiz quadrada, tem-se o desvio
padro
x 0,7

5), a diferena entre 5 = 2,2 e 4 = 2,0 ,


para muitas aplicaes, insignificante. Por
exemplo, recalculando o desvio padro das
medies anteriores, usando a frmula com N 1, obtm x = 0,8, em vez de x = 0,7, que
uma diferena relativamente pequena. De
qualquer modo, deve-se estar ciente das duas
definies. No laboratrio de Metrologia,
recomendvel usar a definio mais
conservativa (com desvio maior, usando-se N1) e reportar claramente que esta definio
usada, para que todos os envolvidos possam
verificar os clculos, usando sempre a mesma
frmula.

(4.8)

Assim, a incerteza mdia das cinco


medies
71

72

72

73

1 N
( x i x )2
N 1 i =1
(4.9)

Tab. 4.2. Clculo do desvio padro

Medies Valor medido


i
xi
1
71
2
72
3
72
4
73
5
71
xi = 359

1 N
(di )2 =
N 1 i =1

71

43

Anlise Estatstica das Incertezas Aleatrias


valor xestimado , ou seja, 68% das medies iro
cair na faixa xestimado x.
Se feita uma nica medio (usando o
mesmo mtodo), h uma probabilidade de 68%
que o resultado caia dentro x do valor correto
(j conhecido e calculado de outras medies
repetidas). Assim, pode-se adotar x para
significar exatamente o que tem-se chamado
de incerteza. Quando se faz uma medio de
x, a incerteza associada com esta medio
pode ser tomada como sendo:

Probleminha rpido 4.1.


Foi medido o mesmo intervalo de tempo,
obtendo-se 4 resultados, em segundos:

21
24
25
22
Encontrar o tempo mdio e o desvio
padro, usando a frmula com N - 1.
Resp.:

Mdia ou valor mais provvel = 23 s


Desvio padro = 1,8 (ou 2) s

x = x
Para entender a noo de desvio padro,
deve-se ser capaz de calcul-lo para casos
simples como o do probleminha rpido 4.1. A
maioria das calculadoras cientficas possui uma
funo embutida para fazer automaticamente
os clculos (da mdia, desvio padro). Por
exemplo, na calculadora HP 20S, a operao
muito simples:
1. Limpar os dados da memria de
Estatstica acionando a tecla CLS,
amarelo (canto inferior direito, 1a tecla)
2. Entrar com dados, teclando o valor da
medio e apertando a tecla + (canto
direito, superior, 1a tecla direita)
3. Assim que a tecla + acionada,
aparece no visor da primeira o nmero
de ordem do dado, 1o, 2o, , no
4. Depois de entrados todos os dados,
a. teclar Amarelo, ex (para a mdia,
x)
b. teclar Amarelo LN (para o desvio
padro, sx)
5. Quando for entrar com outro conjunto
de dados, deve-se resetar os dados,
mesmo que a mquina tenha sido
desligada (teclar Amarelo CL)
A calculadora HP 20S usa a frmula com
N-1 para calcular o desvio padro.

Com esta escolha, pode-se estar 68%


confiante que a medio esteja dentro x do
resultado correto.
Para ilustrar a aplicao destas idias, seja
uma caixa de molas (teoricamente) iguais, das
quais se quer medir a sua constante de mola,
k. Pode-se medir as constantes de mola
colocando um peso em cada mola e
observando a extenso resultante. Talvez
melhor seja suspender uma massa de cada
mola e medir suas oscilaes. Qualquer que
seja o mtodo escolhido, necessrio
conhecer k e sua incerteza k para cada mola,
porm seria muito desgastante, demorado e
tedioso repetir as medies muitas vezes para
cada mola. Em vez de fazer isso,
recomendvel proceder assim:
1. Se k medido para a primeira mola
vrias vezes (por exemplo, 5 ou 10),
ento a mdia destas vrias medies
uma boa estimativa de k para a
primeira mola.
2. Mais importante, por enquanto, que o
desvio padro x para estas vrias
medies fornece uma estimativa da
incerteza no mtodo de medio de k.
3. Como esperado que as molas sejam
iguais, usa-se o mesmo mtodo para
medir cada uma e se espera a mesma
incerteza em cada medio. Porm,
faz-se somente uma medio para
cada mola subsequente
4. Pode-se estabelecer imediatamente
que a incerteza k o desvio padro k
medido para a primeira mola, com uma
confiana de 68% que o resultado
esteja dentro de k do valor correto.
Para ilustrar numericamente estas idias,
sejam 10 medies da primeira mola, obtendose os seguintes resultados de k (em
newton/metro, N/m):

4.4. Desvio padro como incerteza em


uma medio isolada
O desvio padro x caracteriza a incerteza
mdia das medies x1, x2,..., xN , das quais ela
calculada e no captulo 5 isto ser justificado.
Quando se mede a mesma quantidade x vrias
vezes (N), sempre usando o mesmo mtodo e
mantendo-se todos os outros parmetros
constantes e se todas fontes de incerteza so
pequenas e aleatrias, ento os resultados
sero distribudos em torno do valor verdadeiro
xestimado de acordo com a to falada curva em
forma de sino, caracterstica da distribuio
normal. Em particular, 68% dos resultados iro
cair dentro de uma distncia x de cada lado do

86, 85, 84, 89, 85, 89, 87, 85, 82, 85


(4.10)

44

Anlise Estatstica das Incertezas Aleatrias


x = x =

Destes valores, pode-se calcular


imediatamente a mdia, que a melhor
estimativa
k = 85,7 N/m

(4.15)

Como exemplo, sejam novamente as 10


medies da constante da mola:

(4.11)

86, 85, 84, 89, 85, 89, 87, 85, 82, 85


com mdia destes valores igual a

Usando a definio com N-1, obtm o desvio


padro:

k = 85,7 N/m

x = 2,16 N/m = 2 N/m (4.12)

e desvio padro de

Assim, a incerteza em qualquer medio de


k aproximadamente de 2 N/m. Se depois se
medir uma segunda mola, uma nica vez, e
obter a resposta de k = 71 N/m, pode-se, sem
mais cerimnias,
1. Considerar o mesmo desvio padro
x = k = 2 N/m e
2. Reportar o segundo resultado, com um
grau de confiana de 68%:

k = 2,16 N/m = 2 N/m


Nesta aplicao, o desvio padro da mdia
k =

k
10

2
= 0,7 N/m
3

(4.16)

e o resultado final, baseado nestas 10


medies,
k (para a segunda mola) = 71 2 N/m

k = 85,7 0,7 N/m

(4.13)

Quando se d um resultado como este,


deve-se estabelecer claramente o que os
nmeros significam, ou seja,

4.5. Desvio padro da mdia


Se x1, x2,..., xN so os resultados de N
medies da mesma quantidade x, ento, a
melhor estimativa para a quantidade x sua
mdia x . O desvio padro x caracteriza a
incerteza mdia das medies separadas, x1,
x2,...e xN.
O resultado qestimado = x , porm, representa
uma combinao criteriosa de todas as N
medies e razovel supor que a mdia
mais confivel que qualquer uma das N
medies tomada isoladamente. No captulo 5
ser mostrado que a incerteza final do
resultado dada pelo desvio padro x

85,7 a mdia de 10 medies


0,7 o desvio padro da mdia das medies
de modo que os usurios deste resultado
possam julgar seus significados.
Uma caracterstica importante do desvio
padro da mdia, x , o fator

N no

denominador. O desvio padro x representa a


incerteza mdia nas medies individuais x1,
x2,...e xN . Assim, quando se fazem algumas
medies adicionais, usando a mesma tcnica,
o desvio padro x no deve se alterar
apreciavelmente. Por outro lado, o desvio
padro da mdia, x , diminui lentamente

dividido por N . Esta quantidade chamada


de desvio padro da mdia e simbolizada
por x , onde
x =

(4.17)

(4.14)
N
Outros nomes comuns so erro padro,
incerteza padro, erro padro da mdia.
Assim, baseado em N valores medidos, x1,
x2,..., xN , pode-se estabelecer que o resultado
final para o valor de x como

quando N aumenta. Esta diminuio


justamente o que se espera. Se so feitas mais
medies antes de tirar a mdia, naturalmente
se espera que o resultado final seja mais
confivel e esta melhora de confiabilidade
exatamente o que o denominador N em
(4.15) garante. Esta concluso fornece um
modo bvio para melhorar a preciso das
medies.

valor de x = xestimado x
onde
xestimado = x

Infelizmente, o fator N aumenta


lentamente quando N aumenta. Por exemplo,
quando se quer melhorar a preciso por um
fator de 10, deve-se aumentar o nmero de

45

Anlise Estatstica das Incertezas Aleatrias


medies por um fator de 100, o que no
muito exeqvel, na prtica. Mais ainda, at
agora as incertezas sistemticas esto esto
sendo desprezadas e elas no so diminudas
pelo aumento do nmero de medies. Assim,
na prtica, quando se quiser aumentar muito a
preciso, deve-se cuidar de melhorar o
procedimento, trocar o instrumento e no
simplesmente aumentar o nmero de
medies.

detectar algum engano ou alguma medio


com erro grosseiro). Por exemplo, os dois
desvios padro L e b, que expressam a
incerteza mdia das medies de L e b, devem
ser quase iguais, pois foram medidos com o
mesmo instrumento e usando-se o mesmo
procedimento de medio.
Tendo-se convencido de que os dados so
razoveis, pode-se acabar de fazer os clculos.
A melhor estimativa de cada dimenso sua
mdia e as incertezas mdias so expressas
pelo desvio padro. Finalmente acha-se o
desvio padro das mdias. Os resultados finais
podem ser expressos como:

Probleminha rpido 4.2.


Foi medido o mesmo intervalo de tempo,
obtendo-se 5 resultados, em segundos:

L = 24,245 0,006 mm (ou 0,025%)

15
17
18
14
16
Encontrar a melhor estimativa para o tempo
e o desvio padro da mdia.

b = 50,368 0,008 mm (ou 0,016%)

Resp.:

A melhor estimativa da rea, (A = Lb):


A = (24,245 0,025%) x (50,368 0,016%) =

Mdia ou valor mais provvel = 16 s


x = 1,6 e portanto = 0,7 (1) s
x

= 1221,17 mm2 0,03%

Exemplo: rea de um retngulo


Para a aplicao do desvio padro da
mdia, seja a medio precisa da rea de um
retngulo, com lados aproximados de 2,5 cm e
5,0 cm. As medies so feitas com um
paqumetro com vernier e so feitas 10
medies de cada dimenso, comprimento e
altura. Para levar em conta as irregularidades
do lado, fazem-se medies em diferentes
posies e para considerar os pequenos
defeitos no instrumento, usam-se diferentes
paqumetros (cuidado nos procedimentos!). Os
resultados obtidos so os mostrados na Tab.
4.3.
Tab. 4.3. Comprimento e altura (mm)
Valores medidos
Mdia
L

24, 25, 24, 26, 24,


22, 24, 28, 24, 24,
24, 25, 24, 22, 24,
26, 24, 23, 24,
50,36; 50,35; 50,41;
50,37; 50,36; 50,32;
50,39; 50,38; 50,36;
50,38

24,2

0,02

0,006

50,368

0,024

0,008

= 1221,2 0,4 mm2


(4.18)
Para se chegar ao resultado final de A,
1. foram calculadas as mdias de L e b,
cada uma com uma incerteza igual ao
desvio padro de sua mdia
2. foi calculada a rea A como o produto
de L e b
3. foi achada a incerteza pela propagao
no produto.
Poderia ser feito de outro modo, ou seja:
1. multiplicar o primeiro valor medido de L
pelo primeiro valor de b para dar o
primeiro resultado de A
2. continuar o processo, calculando-se 10
resultados para A
3. aplicar anlise estatstica aos estes 10
resultados, calculando-se a mdia de
A, o desvio padro para cada rea e
finalmente o desvio padro da mdia.
Se as incertezas em L e b forem aleatrias
e independentes e tendo-se um nmero
suficiente de medies, os dois mtodos
devem dar os mesmos resultados finais.

24

Exemplo: outra mola


Seja o caso onde no se pode aplicar
anlise estatstica diretamente s medies,
mas apenas aos resultados finais. Novamente
se quer medir a constante de mola k, pela
medio dos tempos de oscilao de uma
massa m fixada sua extremidade. Sabe-se da
mecnica que o perodo para tais oscilaes

Usando-se os 10 valores observados de L,


pode-se facilmente calcular sua mdia, o
desvio padro de cada medio e o desvio
padro da mdia das 10 medies. Do mesmo
modo, calculam-se a mdia, desvios padres
da largura b do retngulo. Antes de fazer
qualquer conta, examinam-se os dados para
verificar se parecem razoveis ( possvel

46

Anlise Estatstica das Incertezas Aleatrias


T = 2

sistemticas. Quando se medem a massa e o


perodo de tempo de oscilao do pndulo, a
balana poderia estar medindo a massa
consistentemente a mais ou a menos e o
cronmetro poderia estar funcionando
consistentemente mais devagar ou mais
rpido. Nenhuma destas incertezas
sistemticas foi considerada quando se fez a
anlise de seus resultados e incertezas
associadas. Assim, o desvio padro da mdia
de cada medio pode ser considerada como a
componente aleatria da incerteza e nem
sempre a incerteza total. O problema agora
como estimar a incerteza sistemtica e ento
combin-la com a aleatria, para dar a
incerteza total ou completa.
Nenhuma teoria simples diz o que fazer
com as incertezas sistemticas. De fato, a
nica teoria das incertezas sistemticas que
elas devem ser identificadas e reduzidas at
que sejam muito menores que a preciso
requerida. Em um laboratrio de Metrologia,
nem sempre isto conseguido. Os
metrologistas, s vezes, no podem calibrar o
instrumento contra um padro melhor rastreado
ou ento no podem comprar um novo medidor
para substituir o inadequado. Por esta razo,
alguns laboratrios e oficinas estabelecem uma
regra que, na ausncia de informaes mais
especficas, os medidores devem ser
considerados com uma incerteza sistemtica
definida. Por exemplo, a deciso pode atribuir
uma incerteza sistemtica de 0,5% para todos
os cronmetros, 1% para todas as balanas e
3% para multmetros (voltmetro, ampermetro
e ohmmetro).
Estabelecidas regras deste tipo, h vrios
modos de proceder. Nenhum deles pode ser
rigorosamente justificado e ser mostrado aqui
um enfoque. No ltimo exemplo, a constante
de mola k foi encontrada atravs das medies
de uma srie de valores de m e T. Uma anlise
estatstica de vrios resultados para k deu uma
componente aleatria de k como :

m
k

Assim, pela medio de T e m, pode-se


achar k pela frmula:
4 2m
(4.19)
k=
T2
O modo mais simples para determinar k
tomar uma nica e exatamente conhecida
massa m e fazer vrias medies cuidadosas
de T. Por vrias razes, porm, medir T para
vrias massas diferentes pode ser mais
interessante. (Por exemplo, deste modo, podese verificar que T m , bem como medir k).
Obtm-se um conjunto de medies mostrado
na Tab. 4.4.
Tab. 4.4. Medio da constante k da mola
m (kg)
T (s)
k

0,513
1,24
13,17

0,581
1,33
12,97

0,634
1,36
etc.

0,691
1,44

0,752
1,50

0,834
1,59

0,901
1,65

0,950
1,69

Obviamente, no faz sentido tirar a mdia


das vrias massas diferentes ou dos perodos
de tempo medidos, porque no so medies
diferentes da mesma quantidade. Nada pode
ser aprendido acerca da incerteza das
medies, comparando os diferentes valores
de m. Porm, pode-se combinar cada valor de
m com seu correspondente perodo T e
calcular k. Todos resultados de k so medies
da mesma quantidade e portanto podem ser
submetidos anlise estatstica. Em particular,
a melhor estimativa para k a mdia k = 13,16
N/m e a incerteza o desvio padro da mdia
k = 0,06 N/m. Assim, o resultado final
baseado nos dados da Tab. 4.4
constante de mola k = 13,16 0,06 N/m
(4.20)
Se houvesse estimativa razovel das
incertezas nas medies originais de m e T,
podia-se tambm estimar a incerteza em k
usando propagao da incerteza, comeando
com as estimativas das incertezas de m (m) e
T (T). Neste caso, os resultados dos dois
mtodos poderiam ser comparados.

k alea = k = 0,06 N/m

(4.21)

Seja agora o caso de a balana que mede


a massa m ter uma incerteza sistemtica de
1% e o cronmetro que mede o perodo de
oscilao, uma incerteza sistemtica de 0,5%.
Agora deve-se achar a componente sistemtica
de x pela propagao das incertezas. A nica
questo se deve combinar as incertezas em
quadratura ou diretamente. Como as incertezas
em m e T so independentes e algum
cancelamento possvel, mais razovel usar
a soma quadrtica.
Como

4.6. Incertezas sistemticas


At agora, em todas as aplicaes e
exemplos, foi assumido que todas as
incertezas sistemticas so reduzidas a um
nvel desprezvel, antes do incio das medies
srias. Agora sero vistas as incertezas

47

Anlise Estatstica das Incertezas Aleatrias


distribuio normal). De qualquer modo, a
expresso fornece, no mnimo, uma estimativa
razovel da incerteza total da medio, desde
que o instrumento possua incertezas
sistemticas que no possam ser eliminadas.
Em particular, h algo interessante em
reportar o relatrio final combinando a
incerteza sistemtica com a aleatria em soma
quadrtica. Foi visto em 4.5 que o desvio
padro da mdia se aproxima de zero quando
o nmero de medies aumenta. Este
resultado sugere que, quando se tem a
pacincia e condies de se fazer um grande
nmero de medies, pode-se reduzir as
incertezas indefinidamente sem ter que
melhorar o equipamento ou a tcnica. Agora se
percebe que esta afirmao incorreta.
Aumentar o nmero de medies pode apenas
reduzir a componente aleatria da incerteza
total. Quando algum instrumento tiver uma
determinada incerteza sistemtica, esta
incerteza se repete sempre e no reduzida
quando se aumenta o nmero de medies. Da
expresso da incerteza total igual soma
quadrtica das incertezas aleatria e
sistemtica, v-se claramente que h pouco
ganho em se reduzir mais ainda a componente
aleatria, quando esta componente for menor
que a componente sistemtica. Em particular, a
incerteza final nunca pode ser menor que a
componente sistemtica. Este fato
simplesmente refora o que j foi dito: na
prtica, uma grande reduo da incerteza
requer melhoria de tcnica ou de equipamento,
para melhorar tanto a incerteza sistemtica
como a aleatria, em cada medio.
Como visto no Captulo 2, comum se ter a
necessidade de medir quantidades, como
acelerao da gravidade, para as quais j
existe um valor aceito e conhecido com
preciso. Nestas aplicaes, a lgica da
anlise da incerteza um pouco confusa.
Provavelmente, o procedimento mais correto
ignorar o valor aceito conhecido at depois de
feitos todos os clculos do valor medido,
qestimado e sua incerteza q. Depois, pode-se
verificar se o valor aceito conhecido cai dentro
(ou est prximo) da faixa qestimado q. Se o
valor conhecido cair muito fora deste faixa,
deve-se examinar as causas possveis da
grande discrepncia. Por exemplo, se o
resultado da acelerao da gravidade foi
encontrado igual a

4 2m
k=
T2

A incerteza relativa sistemtica total em k :


2

k sist
m sist Tsist
=

+ 2
k
T
m

(1%)2 + (2 0,5%)2 = 1,4%

(4.22)

(4.23)

Portanto,

ksist = kestimado x 1,4%

(4.24)

= (13,16 N/m) x 0,014 = 0,18 N/m


Agora, tm-se as duas incertezas em k,
sistemtica e aleatria e deve-se novamente
decidir como combin-las para se obter a
incerteza total na constante k da mola. Como o
mtodo de combinar a incerteza sistemtica
com a aleatria no totalmente claro, muitos
metrologistas deixam as duas componentes
separadas e d o resultado final como:
valor medido de k = kestimado kalea ksist
(4.25)
No exemplo anterior, o resultado
k = 13,16 0,06 0,18 N/m
H outros metrologistas que sugerem
combinar a incerteza aleatria com a
sistemtica atravs da soma quadrtica, onde
se tem:
k = (k alea )2 + (k sist )2

(4.26)

Novamente no caso da constante k,


k=

0,06 2 + 0,18 2

Finalmente
k = 13,16 0,19 N/m (ou 13,2 0,2 N/m)
A combinao da incerteza aleatria com a
sistemtica atravs da soma quadrtica no
pode ser rigorosamente justificada. Nem o
significado do resultado claro; por exemplo,
no se pode dizer com 68% de confiana que o
resultado final cai dentro da faixa kestimado k.
[A afirmativa de que o resultado final de x caia
dentro da faixa xestimado x, com 68% de
confiana, vlido somente para incertezas
aleatrias, que se distribuem conforme a

gestimado = 9,97 m/s2

com incertezas

48

(4.27)

Anlise Estatstica das Incertezas Aleatrias


galea = 0,02 e gsist = 0,03

arredondamento de 2%, maior que a


incerteza esperada na experincia.
3. Mais difcil para analisar a
possibilidade de uma falha no projeto
da experincia. Por exemplo, se a
acelerao da gravidade medida,
deixando-se cair um objeto de uma
grande altura, a resistncia do ar pode
introduzir uma grande incerteza
sistemtica. Outro exemplo, na
medio da meia-vida de um material
radioativo, se a amostra estiver
contaminada com outro material com
meia-vida menor, o resultado sempre
ser menor.
Obviamente, rastrear as fontes de
incertezas sistemticas uma tarefa difcil, que
desafia os melhores esforos dos
metrologistas. Em todas as aplicaes, porm,
os resultados no sero confiveis, se esta
pesquisa no for feita.

A incerteza total, pela soma quadrtica d

g = 0,04
e o resultado final vale:
g = 9,97 0,04 m/s2
que est muito distante do valor aceito
g = 9,80 m/s2
A discrepncia de 0,17, que 4 x 0,04.
Assim, o resultado 9,97 0,04 m/s2 no
satisfatrio e deve haver anlise adicional.
A primeira coisa a verificar a possibilidade
de ter havido um erro grosseiro no clculo de
gestimado ou nas incertezas galea e gsist. Se h
convico de que as medies e clculos esto
corretos, a prxima possibilidade que o valor
aceito esteja incorreto. No caso de g = 9,80
m/s2 isto improvvel, mas pode ser possvel
em muitas outras aplicaes. Por exemplo, a
densidade do ar depende muito da presso e
temperatura consideradas e por isso possvel
e provvel haver confuso com estes
parmetros.
Uma vez tenham sido eliminadas todas as
suspeitas, resta somente uma possibilidade:
deve ter sido omitida alguma incerteza
sistemtica, de modo que a incerteza total
calculada est muito pequena. Idealmente,
deve-se tentar achar o culpado, mas esta
procura pode ser difcil, pelos seguintes
motivos:
1. Talvez um dos instrumentos tenha uma
incerteza sistemtica maior do que a
calculada. Pode-se investigar esta
possibilidade determinando qual o
tamanho da incerteza sistemtica no
instrumento necessrio para provocar a
grande discrepncia encontrada. Se a
incerteza necessria razoavelmente
pequena, tem-se uma explicao
possvel do problema.
2. Outra possvel causa de incerteza
sistemtica o uso de um valor errado
para algum parmetro necessrio no
clculo. Este tipo de engano
geralmente acontece em laboratrio
quando o metrologista usa um valor
com muito poucos algarismos
significativos (ou seja, com grande erro
de arredondamento). Por exemplo, em
uma experincia que se quer uma
preciso de 1% e se usa a constante
1,7 x 10-27 kg, em vez de
1,67 x 10-27 kg, h um erro de

49

Anlise Estatstica das Incertezas Aleatrias


x =

[Ver (4.14]

Quando se tem modo de estimar a


componente sistemtica da incerteza, xsist,
razovel (mas no rigorosamente justificado)
expressar a incerteza total como a soma
quadrtica de xalea e xsist:

Principais Definies e Equaes do


Captulo 4
Quando se tm N medies x1, x2, ..., xN, da
mesma quantidade x, todas usando o mesmo
mtodo. Desde que as incertezas sejam
independentes e aleatrias, tm-se os
seguintes resultados

x tot = (x alea )2 + (x sist )2

[Ver (4.26)]

Mdia
A melhor estimativa para x, baseado nestas
medies, sua mdia
x=

xi
N

[Ver (4.5)]

Desvio padro
A incerteza mdia das medies individuais
x1, x2, ..., xN, dada pela desvio padro:

x =

1 N
( x i x)2

N 1 i=1

[Ver (4.9)]

Esta definio de desvio padro,


geralmente chamada de desvio padro da
amostra, a mais apropriada para os objetivos
prticos. O desvio padro da populao
obtido, substituindo-se o fator (N 1) por N, no
denominador. Mesmo quando se calcula o
desvio padro atravs de calculadora cientfica,
deve-se estar seguro de qual definio est
sendo usada.
O significado detalhado do desvio padro
x que aproximadamente 68% das medies
de x (usando o mesmo mtodo) devem cair
dentro de uma distncia x do valor verdadeiro.
Este resultado o que permite que x seja
identificado como a incerteza na medio x.

x = x
e com esta escolha, pode se estar 68%
confiante que qualquer uma medio de x ir
cair dentro x do resultado correto.

Desvio padro da mdia


Desde que as incertezas sistemticas
sejam desprezveis, a incerteza na melhor
estimativa de x (normalmente a mdia) a
incerteza padro da mdia, dada por:

Apostilas\Incerteza

50

JRTaylor2.doc

25 SET 98 (Substitui 19 DEZ 97)

5. Distribuio de Gauss
5.1. Introduo
Este captulo continua com a discusso da
anlise estatstica de medies repetidas. O
captulo 4 introduziu as idias importantes de
mdia, desvio padro e desvio padro da
mdia e foram vistos seus significados e alguns
de seus usos.
O primeiro problema que aparece, ao se
discutir as medies repetidas, achar o modo
de manipular e apresentar os valores obtidos.
Um modo conveniente usar uma distribuio
ou histograma, como descrito em 5.2. A seo
5.3 introduz a noo de distribuio limite, a
distribuio de resultados que seriam obtidos
se o nmero de medies se tornasse
infinitamente grande. Na seo 5.4, definida
a distribuio normal ou distribuio de Gauss,
que a distribuio limite de resultados para
qualquer medio sujeita a muitas pequenas
incertezas aleatrias.
Assim que as propriedades matemticas da
distribuio normal sejam entendidas, pode-se
provar facilmente vrios resultados
importantes. A seo 5.5 fornece a prova que,
com antecipado no Captulo 4, cerca de 68%
de todas as medies (todas de uma mesma
quantidade e usando o mesmo procedimento)
devem cair dentro de um desvio padro do
valor verdadeiro. A seo 5.6 prova o
resultado, usado no Captulo 1, que se so
feitas N medies x1, x2, ..., xN da mesma
quantidade x, ento a melhor estimativa xestimado
baseado nestes valores a mdia x = x i / N .
A seo 5.7 justifica o uso da soma quadrtica
quando as incertezas que se propagam so
aleatrias e independentes. Na seo 5.8
prova-se que a incerteza da mdia, quando
usada como a melhor estimativa do resultado
de x, dada pelo desvio padro da mdia,

sobre a distribuio normal (fazendo clculos


com lpis e papel, se necessrio), possvel
seguir o resto do captulo sem dificuldade.

5.2. Histogramas e distribuies


A anlise estatstica sria de um
experimento requer que o experimentador faa
muitas medies. Assim, primeiro necessrio
estabelecer mtodos para registrar e indicar
grande quantidade dos valores medidos. Seja,
por exemplo, 10 medies do mesmo
comprimento x, com resultados (em cm):
26, 24, 26, 28, 23, 24, 25, 24, 26, 25
(5.1)
Escritos deste modo, estes 10 nmeros
fornecem muito pouca informao e se a
quantidade de medies maior, os resultados
podem virar uma grande confuso de nmeros.
Por isso necessrio e conveniente um melhor
sistema de apresentao destes resultados.
Como um primeiro passo, os mesmos
nmeros podem ser ordenados, por exemplo,
em ordem crescente (do menor para o maior):
23, 24, 24, 24, 25, 25, 26, 26, 26, 28
(5.2)
Agora j se tem mais informao, pois
prontamente conhecido o menor resultado (23),
o maior (28), a diferena entre ambos (5), o
mais repetido (24 e 26), o valor do meio (25).
Melhorando mais ainda, em vez de
escrever os nmeros 24 e 26 trs vezes cada,
pode-se registrar que estes valores foram
obtidos trs vezes. Agora, pode-se registrar os
diferentes resultados de x, junto com o nmero
de vezes que cada valor foi encontrado, como
na Tab. 5.1.

x = x / N , como estabelecido no Captulo 4.

Finalmente a seo 5.9 discute como atribuir


uma confiana numrica a resultados
experimentais.
A matemtica usada neste captulo mais
avanada do que a usada at agora. Em
particular, devem ser conhecidos os conceitos
de integrao a integral como a rea sob
uma curva, alteraes de variveis e
ocasionalmente, integrao por partes. Porm,
uma vez que se tenha trabalho at a seo 5.4

Tab. 5.1. Comprimentos medidos x e ocorrncias

xi
ni

23
1

24
3

25
2

26
3

27
0

28
1

51

Distribuio Norma ou de Gauss


A notao xi (i = 1, 2, ...) mostra os vrios
valores de x encontrados: x1 = 23, x2 = 24,
x3 = 25, ... e ni mostra o nmero de vezes que
cada valor foi encontrado; n1 = 1,
n2 = 3, ...
A mdia destes valores, j definida, vale:
x=

23 + 24 + 24 + 24 + 25 + ... + 28
= 25
10

Fazer uma tabela mostrando os escores


diferentes possveis e o nmero de vezes que
foram obtidos, para computar a nota de Jos.
Resposta
Escore
Nmero

0
0

1
2

2
7

3
4

4
7

= 2,7

(5.3)
Tambm pode-se fazer assim:
x=

23 + ( 24 3) + ( 25 2) + (26 3) + 28
= 25
10

ou de um modo genrico:

x=

x in i
i

(5.4)

Na forma original (5.3), somam-se todas as


medies feitas; na nova forma (5.4) somam-se
todos os diferentes valores obtidos,
multiplicados pelo nmero de vezes que eles
ocorrem. As duas somas do o mesmo
resultado, obviamente, mas a eq. (5.4) fornece
mais informao til, principalmente quando se
fazem muitas medies repetidas. A eq. (5.4)
chamada tambm de mdia ponderada, onde
cada valor medido pesado pelo nmero de
vezes que ele ocorre. Isto faz sentido: o valor
medido que aparece repetido mais vezes tem
maior peso. Finalmente, a soma de todos os
nmeros ni d o nmero total de medies, N,
ou seja

As idias anteriores podem ser escritas de


um modo mais conveniente. Em vez de dizer
que o resultado 24 foi obtido 3 vezes, pode-se
dizer que x = 24 foi obtido em 3/10 de todas as
medies. Em vez de usar ni, o nmero de
vezes que o resultado acontece, introduz-se a
frao

ni
N

Fi =

(5.6)

que a frao das N medies que deram o


resultado xi. Diz-se que as fraes Fi so a
distribuio dos resultados, porque elas
descrevem como as medies foram
distribudas entre os diferentes possveis
valores.
Em termos das fraes Fi, pode-se
reescrever a eq. (5.4) para a mdia em forma
compacta:
x=

xF

i i

(5.7)

=N

(5.5)

(Por exemplo, para a Tab. 5.1, esta


equao garante que a soma dos nmeros na
ltima linha vale 10.)

A mdia das medies justamente a


soma ponderada de todos os diferentes valores
xi obtidas com cada xi pesado pela frao de
vezes que ele ocorreu, Fi.
O resultado da eq. (5.5) implica que

F = 1
i

(5.8)

Probleminha rpido 5.1.

Na escola, Jos fez 20 disciplinas, todas


com o mesmo nmero de crditos e tirou 7 L
(louvor), 4 MB (muito bom), 7 B (bom), 2 R
(regular) e nenhum I (insuficiente). Para
computar uma nota, atribui-se a cada nota-letra
um valor numrico:
Nota-letra
Escore

I
0

R
1

B
2

MB
3

L
4

Quando se somam todas as fraes para


todos os resultados possveis xi, obtm-se 1.
Qualquer conjunto de nmeros cuja soma 1
chamado normalizado e a eq. (5.8) chamada
de condio de normalizao.
A distribuio das medies pode ser
mostrada graficamente em um histograma,
como na Fig. 5.1. Esta figura o grfico de Fi
contra xi, em que os valores medidos diferentes
xi so plotados no eixo horizontal e a frao de

52

Distribuio Norma ou de Gauss


vezes que cada valor aparece indicada pela
altura da barra vertical desenhada acima de xi.
(Poderia tambm se fazer um grfico de ni
contra xi, porm este modo menos
conveniente). Os dados mostrados em
histogramas como o da Fig. 5.1 pode ser
compreendido fcil e rapidamente.

Fi

0,3
0,2
0,1
0

22

xi
23

24

25

26

27

28

Fig. 5.1. Histograma com 10 medies de um


comprimento x. O eixo vertical mostra a frao de vezes
Fi que cada valor xi foi observado.

O histograma como o mostrado na Fig. 5.1


pode ser chamado de histograma de barras,
porque a distribuio dos resultados indicada
pelas alturas das barras verticais colocadas
acima do eixo xi. Este tipo de histograma
apropriado quando os valores xi forem
nitidamente espaados, com valores inteiros.
(Por exemplo, notas de alunos, nmero de
eventos). A maioria das medies das variveis
de processo, porm, analgica. Os valores
das quantidades de processo variam
continuamente, assumindo uma infinidade de
valores possveis entre o incio e o fim da faixa
de medio. Assim, quando se fazem 10
medies de temperatura, podem-se obter
resultados como
26,4
23,8

23,9
25,1

25,2
23,9

24,6
23,5

22,7
25,4
(5.9)

Como no h nenhum valor absolutamente


igual a outro, se fosse construir um histograma
de barras, haveria 10 barras, cada uma com
um valor e isso seria intil. Dadas medies de
quantidades analgicas, como as anteriores, o
melhor mtodo dividir a faixa de valores em
nmero conveniente de intervalos e contar
quantos valores caem em cada intervalo. Por
exemplo, os nmeros de medies poderiam
ser divididos em intervalos entre 22 e 23, entre
24 e 25 e assim por diante. Os resultados de
contagem neste modo so mostrados na Fig.
5.2. (Se uma medio cair exatamente no limite
entre dois intervalos, deve-se decidir onde
coloc-la).

Tab. 5.2. Dez medies agrupadas em intervalos

x
n

2223
1

2324
3

2425
1

2526
4

2627
1

2728
0

Os resultados na Tab. 5.2 podem ser


plotados em uma forma chamada de
histograma de intervalos. Neste grfico, a
frao de medies que caem em cada
intervalo pode ser indicada pela rea do
retngulo desenhado acima do intervalo.
Assim, o retngulo acima do intervalo 23-24
tem uma rea 0,3 x 1 = 0,3 indicando que 3/10
de todas as medies caem neste intervalo.
Em geral, denota-se o intervalo do io intervalo
por i. (Os intervalos geralmente tem a mesma
largura, porm, isto no obrigatrio). A altura
fi do retngulo desenhado acima deste intervalo
escolhido de modo que a rea fii seja
fii = frao das medies no io intervalo
Fig. 5.2. Histograma de intervalos mostrando a
frao de 10 medies de x que caem nos intervalos 2223, 23-24, .... A rea do retngulo acima de cada intervalo
d a frao das medies que caem neste intervalo.
Assim, a rea do retngulo hachuriado 0,3, indicando
que 3/10 de todas as medies caem entre 23 e 24.

Assim, em um histograma de intervalos a


rea do retngulo fii tem o mesmo significado
que a altura Fi da ia barra em um histograma de
barra.
Deve-se ter cuidado na escolha da largura
i dos intervalos para um histograma. Se os
intervalos tiverem grande largura, ento todas
as leituras (ou quase todas) caem em um
intervalo e o histograma ter apenas um
retngulo. Se os intervalos tiverem pequena
largura, ento poucos intervalos contem mais
de uma medio e o histograma ser
constitudo de vrios retngulos estreitos,
quase todos da mesma altura. Ento, a largura
do intervalo deve ser escolhida de modo que
vrias medies caiam em cada intervalo.
Assim, quando o nmero total de medies N
pequeno, deve-se escolher larguras de
intervalos relativamente grandes e se o nmero
N aumentado, pode-se escolher intervalos
mais estreitos.

53

Distribuio Norma ou de Gauss

Probleminha rpido 5.2


Uma classe de 20 estudantes faz um
exame, que graduado em 50 pontos e obtmse os seguintes resultados:

26, 33, 38, 41, 49, 28, 36, 38, 47, 41


32, 37, 48, 44, 27, 32, 34, 44, 37, 30

Resposta

5.3. Distribuies limites


Na maioria das aplicaes, quando o
nmero de medies aumenta, o histograma
comea a tomar uma forma definida simples.
Esta curva envolvente claramente visvel nas
Fig. 5.3 e 5.4, que mostram 100 e 1000
medies da mesma quantidade, como na Fig.
5.2. Aps 100 medies, o histograma forma
um nico pico, que aproximadamente
simtrico. Aps 1000 medies, pode-se dividir
os intervalos pela metade e o histograma se
forma mais suave e regular. Estes trs grficos
ilustram uma propriedade importante da
maioria das medies. Quando o nmero de
medies tende para infinito, sua distribuio
tende para alguma curva contnua definida.
Quando isto acontece, a curva contnua
chamada de distribuio limite. Assim, para
medies da Fig. 5.2 at 5.4, a distribuio
limite parece prxima de uma curva simtrica
em forma de sino.

N=1000

0,2
0,1
0

(Estes resultados foram obtidos da ordem


alfabtica dos alunos). Fazer um histograma
de intervalos, usando intervalos com limites de
largura em 25, 30, 35, 40, 45 e 50.

22

23

24 25

26

27

28

xi

Fig. 5.4. Histograma para 1000 medies da mesma


quantidade que a ilustrada na Fig. 5.2. H uma curva
limite superposta ao histograma.

A distribuio limite uma construo


terica que pode nunca ser medida
exatamente. Quanto maior o nmero de
medies feitas, mais o histograma se
aproxima da distribuio limite. Porm,
somente quando se faz um nmero infinito de
medies e se usam intervalos com larguras
infinitesimais pode-se realmente se obter a
distribuio limite. De qualquer modo, h uma
boa razo para se acreditar que cada medio
tem uma distribuio limite para a qual o
histograma se aproxima cada vez mais,
quando se aumenta o nmero de medies.
Uma distribuio limite, como a curva
contnua na Fig. 5.4 define uma funo,
chamada f(x). O significado desta funo
mostrado na Fig. 5.5. Quando se aumenta o
nmero de medies cada vez mais da
quantidade x, o histograma se aproxima da
curva limite f(x). Assim, a frao das medies
que caem em qualquer pequeno intervalo x a x
+ dx igual rea f(x) dx da lista hachuriada na
Fig. 5.5 (a):
f(x)dx = frao da medio que cai
entre x e x + dx
(5.10)
Geralmente, a frao das medies que
caem entre quais dois valores a e b a rea
total sob o grfico entre x = a e x = b, como
mostrado na Fig. 5.5 (b)

Fi
0,4
0,3
N=100

0,2
0,1
0

0,4
0,3

22

23

24 25

26

27

28

xi

Fig. 5.3. Histograma para 100 medies da mesma


quantidade que a ilustrada na Fig. 5.2.

(a)
(b)
Fig. 5.5. Uma distribuio limite f(x).
(a) Aps muitas medies, a frao que cai entre x
e x + dx a rea f(x)dx da faixa estreita.
(b) A frao que cai entre x = a e x = b a rea
hachuriada.

54

Distribuio Norma ou de Gauss


Esta rea definida como a integral
limitada de f(x). Assim, tem-se o resultado
importante que
b

f ( x)dx = frao das medies que caem entre a e b


a

(5.11)
importante entender o significado das
duas expresses eq (5.10) e eq. (5.11). Ambas
dizem qual a frao de medies esperada
cair em algum intervalo aps um grande
nmero de medies. Outro modo muito til
dizer que f(x)dx a probabilidade que uma
nica medio de x d um resultado entre x e x
+ dx.
f(x)dx = probabilidade que qualquer
uma nica medio de x d um
resultado entre x e x + dx.
(5.12)
b

Do mesmo modo, a integral

f ( x )dx diz a

probabilidade que qualquer uma medio de x


caia entre x = a e x = b. Chega-se seguinte
concluso importante: se conhecida a
distribuio limite f(x) para a medio de uma
dada quantidade x com um dado instrumento,
ento se pode saber a probabilidade de se
obter um resultado em qualquer intervalo a x
b.
Como a probabilidade total de se obter um
resultado em qualquer ponto entre - e +
deve ser um, a distribuio limite f(x) deve
satisfazer

finitos, por convenincia os limites so


considerados .
Se as medies consideradas so muito
precisas, todos os valores obtidos esto muito
prximos do valor verdadeiro de x, de modo
que o histograma dos resultados e portanto a
distribuio limite, ter um pico estreito. Se as
medies forem pouco precisas, ento os
valores encontrados se espalham e distribuio
ser larga e o pico pequeno. (Fig. 5.6)
5

3
2

1
0

0
22
23
24
25
26
27
Fig. 5.6. Duas distribuies limites, uma para uma
medio muito precisa (linha contnua) e outra para
medio pouco precisa (linha pontilhada)

A distribuio limite f(x) para a medio de


uma dada quantidade x usando um dado
instrumento descreve como os resultados
seriam distribudos aps um grande nmero de
medies. Assim, se f(x) conhecida, pode-se
calcular o valor mdio de x de pois de muitas
medies. Foi visto (5.7) que a mdia de
qualquer nmero de medies a soma de
todos os valores de xi , cada um com um peso,
que a frao de vezes que ele obtido:

f ( x)dx = 1

(5.13)

x=

Esta identidade a analogia natural da


soma normalizada kFk = 1 e uma funo
satisfazendo (5.13) chamada normalizada.
Os limites na integral (5.13) podem
parecer exticos. Os limites no significam que
realmente se espera obter resultados variando
de - a +. Pelo contrrio, na prtica, todas as
medies iro cair em algum intervalo finito
razoavelmente estreito. Por exemplo, as
medies da Fig. 5.4 todas caem entre x = 21 e
x = 29. Mesmo aps um nmero infinito de
medies, a frao caindo entre fora dos
limites de x = 21 e x = 29 desprezvel. Em
outras palavras, f(x) essencialmente zero fora
desta faixa e no faz diferena se a integral
(5.13) vai de - a + ou de 21 a 29. Como
geralmente no se conhecem estes limites

xF

i i

(5.14)

No presente caso, tem-se um grande


nmero de medies com distribuio f(x). Se a
faixa total de valores dividida em pequenos
intervalos xi a xi + dxi , a frao de valores em
cada intervalo Fi = f(xi) dxi e no limite que
todos os intervalos tendem para zero, (5.14)
fica

x=

xf ( x )dx

(5.15)

Esta frmula d a mdia esperada de x


depois de um nmero infinito de medies.
Do mesmo modo, pode-se calcular o desvio
padro x obtido aps muitas medies. Como
estamos ligados ao limite N
, no faz
diferena qual definio de x usada, com N
ou com (N 1). Em qualquer caso, quando N

55

Distribuio Norma ou de Gauss


, x2 a mdia do quadrado dos desvios (x
- x )2 . Assim, aps algumas medies,

2x =

( x x) f ( x)dx
2

(5.16)

5.4. Distribuio normal


Diferentes tipos de medies tem diferentes
distribuies limites. Nem todas as
distribuies possuem a forma de sino
mostrada na seo 5.2 (por exemplo, a
distribuio de Poisson geralmente
assimtrica). Mesmo assim, a maioria das
medies tem distribuio limite com uma
curva simtrica com formato do sino. No
captulo 10 ser provado que se uma medio
sujeita a muitas pequenas fontes de incerteza
aleatria e com incerteza sistemtica
desprezvel, os valores medidos sero
distribudos de acordo com uma curva com
forma de sino e esta curva ser centrada no
valor verdadeiro de x, como na Fig. 5.7.
Se as medies tiverem incertezas
sistemticas significativas, a curva da
distribuio no ser centrada no valor
verdadeiro. Incertezas aleatrias so
igualmente provveis de puxar as leituras
acima e abaixo do valor verdadeiro. Se todas
as incertezas forem aleatrias, aps muitas
medies o nmero de observaes acima do
valor verdadeiro ser igual ao nmero de
observaes abaixo, e a distribuio dos
resultados ser centrada no valor verdadeiro.
Mas uma incerteza sistemtica (como causada
pela fita esticada ou pelo cronmetro que
atrasa) empurra todos os valores em uma
direo e portanto empurra a distribuio dos
valores observados fora do centro do valor
verdadeiro. Neste captulo, ser assumido que
a distribuio centrada no valor verdadeiro.
Isto equivalente a assumir que todos as
incertezas sistemticas so reduzidas a um
nvel desprezvel.

questo complicada e no tem uma resposta


simples e satisfatria. Como nenhuma medio
pode determinar exatamente o valor verdadeiro
de qualquer varivel contnua (comprimento,
tempo, massa, temperatura, corrente eltrica,
presso, analise), se o valor verdadeiro de tal
quantidade existe no mesmo claro. De
qualquer modo, sempre se faz a hiptese
conveniente de que cada quantidade fsica
tenha um valor verdadeiro.
Pode-se pensar que o valor verdadeiro de
uma quantidade o valor para o qual o
resultado se aproxima cada vez mais quando
se aumenta o nmero de medies feitas com
cuidado. Como tal, o valor verdadeiro uma
idealizao similar s da matemtica, como
ponto sem tamanho, linha sem espessura. O
valor verdadeiro, como o ponto ou linha, uma
idealizao til. Aqui, os valores verdadeiros
das quantidades medidas x, y,..., z so
expressas pelas suas letras maisculas
correspondentes X, Y, ..., Z. Se as medies
de x so sujeitas a muitas pequenas incertezas
aleatrias, mas a incertezas sistemticas
desprezveis, sua distribuio ser uma curva
simtrica, em forma de sino, centrada no valor
verdadeiro X.
grande

pequeno

Fig. 5.8. A funo de Gauss (5.17) tem forma de sino


e centrada em x = 0. A curva do sino larga se
grande e estreita se pequeno. Embora por enquanto
visto como um parmetro que caracteriza a largura da
curva do sino, pode ser mostrado como a distncia do
centro da curva para o ponto onde a curvatura muda de
direo. Esta distncia mostrada em dois pontos.

A funo matemtica que descreve a curva


forma de sino chamada de funo de Gauss
ou distribuio normal. O seu prottipo :
ex

valor verdadeiro de x

Fig. 5.7. A distribuio limite para uma medio


sujeita a muitas pequenas incertezas aleatrias . A
distribuio tem forma de sino e centrada no valor
verdadeiro da quantidade medida x.

Agora, se volta a uma questo que foi


propositadamente evitada: o que o valor
verdadeiro de uma quantidade fsica? Esta

/ 2 2

(5.17)

onde um parmetro fixo, chamado de


parmetro largura. importante ficar
familiarizado com as propriedades desta
funo.
1. Quando x = 0, a funo de Gauss
igual a 1.
2. A funo simtrica em relao a x =
0, porque tem o mesmo valor para x e
x

56

Distribuio Norma ou de Gauss


3. Quando x se afasta de zero em
qualquer direo, x2/22 aumenta,
rapidamente se pequeno, mais
lentamente se grande. Assim,
quando x se afasta da origem, a funo
de Gauss decresce, tendendo para
zero.
A aparncia geral da funo de Gauss
(5.17) como a mostrada na Fig. 5.8. O grfico
ilustra o nome parmetro largura para porque
a forma de sino larga se for grande e
estreita se pequeno.

f ( x)dx =

Ne

( x X )2 / 2 2

dx

(5.21)

Resolvendo este tipo de integral, mudando


variveis para simplificar (fazendo x X = y e
dx = dy), tem-se

= N e y

/ 2 2

(5.22)

dy

Fazendo agora y/ = z (em que dy = dz),

= N e z

/2

(5.23)

dz

Fig. 5.9. A funo de Gauss (5.18) tem forma de sino


e centrada em x = X.

A ultima integral uma das integrais


padro da fsica matemtica e cujo resultado
encontra-se em qualquer bom livro de clculo
matemtico,

z2 / 2

dz = 2

(5.24)

A funo de Gauss (5.17) uma curva em


forma de sino, centrada em x = 0. Para obter
uma curva em forma de sino centrada em x =
X, simplesmente substitui x por (x X), na eq.
(5.17). Assim, a funo

Retornando a (5.21) e (5.23), tem-se

f ( x)dx = N

e ( x X

) / 2 2

(5.18)

tem o mnimo em x = X e se desloca


simetricamente para o lado x = X, como
mostrado na Fig. 5.9.
A funo (5.18) ainda no est em sua
forma final para descrever uma distribuio
limite porque qualquer distribuio deve ser
normalizada, ou seja, deve satisfazer:

f ( x)dx = 1

(5.19)

Como esta integral deve ser igual a 1, o


fator de normalizao N fica
N=

1
2

Com esta escolha para o fator de


normalizao, chega-se forma final para a
funo distribuio normal ou de Gauss, que
denotada pela GX,(x):

Para arranjar esta normalizao, faz-se


f ( x ) = Ne ( x X )

/ 2

(5.20)

(A multiplicao pelo fator N no muda o


formato da curva nem desloca o ponto de
mximo de x = X). Deve-se escolher o fator de
normalizao N de modo que f(x) seja
normalizado como em (5.19). Isto envolve
alguma manipulao elementar de integrais
(que ser mostrada aqui e agora):

Distribuio normal ou de Gauss


2
2
1
G X, ( x ) =
e( x X ) / 2
2
(5.25)

A frmula contm os ndices X e para


indicar o centro e a largura da distribuio. A
funo GX, (x) descreve a distribuio limite de
resultados em uma medio de uma
quantidade x cujo valor verdadeiro X, se a
medio for sujeita apenas a incertezas
aleatrias (com certezas sistemticas
desprezveis). Medies cuja distribuio limite

57

Distribuio Norma ou de Gauss


dada pela funo de Gauss (5.25) so
normalmente distribudas.

Antes de resolver esta equao, sabe-se


que a sua resposta deve ser X, porque a
simetria da funo de Gauss em torno de X
implica que alguns resultados cairo a igual
distncia, acima e abaixo, de x. Assim, a mdia
deve ser X.

x=

xG

X,

( x )dx

Fig. 5.10. Duas distribuies de Gauss

O significado do parmetro largura ser


explicado rapidamente. J foi visto que um
pequeno valor de d uma distribuio com
um pico estreito e alto, correspondendo a uma
medio precisa, enquanto um grande valor de
d uma distribuio com pico largo e baixo,
correspondendo a uma medio pouco precisa.
A Fig. 5.10 mostra dois exemplos de
distribuies de Gauss com diferentes pontos
centrais X e larguras . O fator no
denominador garante que uma distribuio
mais estreita (x menor) automaticamente
maior em seu centro, como deve ser para que
a rea total sob a curva seja igual a 1.

1
2

xe

( x X )2 / 2 2

dx

Fazendo a mudana das variveis y = x


X, dx = dy e x = y + X, tem-se:
x=

y 2 / 2 2

2
2
ye
dy
X
e y / 2 dy
+

(5.28)

A primeira integral exatamente zero,


porque a contribuio de qualquer ponto y
exatamente cancelada pela do ponto y. A
segunda integral a normalizada, encontrada
em (5.22) e tem o valor de 2 . Esta integral
cancela com o 2 do denominador e deixa
apenas o X
x=X

Probleminha rpido 5.3


Esquematizar a funo de Gauss GX,(x)
para X = 10 e x = 1. Usando uma calculadora,
encontrar os valores em 10; 10,5; 11; 11,5; 12
e 12,5. No necessrio calcular os valores
para x < 10 porque sabe-se que a funo
simtrica em relao a X = 10.

Resposta

Foi visto na seo 5.2 que o conhecimento


da distribuio limite para uma medio
permite o clculo do valor mdio esperado
aps vrias medies. De acordo com (5.15),
este valor esperado para a distribuio
gaussiana f(x) = GX,(x)

x=

xG

X,

( x )dx

(5.26)

(5.27)

(5.29)

aps muitas medies. Em outras palavras: se


as medies so distribudas de acordo com a
distribuio de Gauss GX,(x), ento, aps
vrias medies, o valor mdio o valor
verdadeiro, onde a funo de Gauss est
centrada.
O resultado (5.29) exatamente verdade
somente se puder fazer infinitas medies. Na
prtica, quando se fazem muitas medies
(nmero grande, porm finito), a mdia fica
prxima de X.
Outra quantidade interessante para calcular
o desvio padro , aps uma grande
quantidade de medies. De acordo com
(5.16), esta quantidade vale:

2x =

(x x) G
2

X,

( x )dx

(5.30)

Esta integral resolvida facilmente.


Substitui-se x por X, fazem se as substituies
x X = y, y/ = z e finalmente integra-se por
partes para obter o resultado:

58

Distribuio Norma ou de Gauss


x2 = 2

(5.31)

O parmetro largura da funo de Gauss


GX,(s) o desvio padro obtido aps muitas
medies. Isto acontece porque a letra x
usada para o parmetro largura e explica por
que geralmente chamado o desvio padro
da distribuio de Gauss GX,(s).
Rigorosamente falando, porm, o desvio
padro esperado somente aps infinitas
medies. Se so feitas medies de x em
nmero finito (10 ou 20, por exemplo), o desvio
padro observado deve ser alguma
aproximao de x, mas no se tem razo em
pensar que exatamente igual a x. A seo
5.5 mostrar o que significa e qual o desvio
padro depois de um nmero finito de
medies.

5.5. Desvio padro como limite de


confiana de 68%
A funo distribuio limite f(x) de alguma
quantidade x diz qual a probabilidade de se
obter qualquer valor de x. Especificamente, a
integral

Fig. 5.11. A rea hachuriada entre X a


probabilidade de uma medio cair dentro de um desvio
padro de X.

Prob (dentro ) =

e
2

z2 / 2

dz

(5.34)

Igualmente, se poderia achar a


probabilidade de um resultado cair dentro de
2 ou 1,5 de X. Mais geralmente, se poderia
calcular
Prov (dentro t) que significa a probabilidade
para um resultado dentro t de X onde t
qualquer nmero positivo. Esta probabilidade
dada pela rea na Fig. 5.12 e um clculo
idntico a este levando a eq. (5.34) d:
Prob (dentro t) =

e
2

z2 / 2

dz

(5.35)

Fig. 5.12. A rea hachuriada entre X t a

f ( x)dx
a

a probabilidade que qualquer uma medio


d um resultado na faixa de a < x <b. Se a
distribuio limite a funo de Gauss GX,(x),
esta integral pode ser resolvida. Em particular,
pode-se calcular a probabilidade que uma
medio caia dentro de um desvio padro do
valor verdadeiro X. Esta probabilidade :
X+

Prob (dentro ) =

X,

( x )dx

(5.32)

1
2

X+

( x X )2 / 2 2

dx

(5.33)

Esta integral ilustrada na Fig. 5.11. Ela


pode ser simplificada no modo familiar
substituindo (x-X)/ = z. Com esta substituio,
dx = dz e os limites de integrao se tornam z
= 1. Assim,

probabilidade de uma medio cair dentro de t desvio


padro de X.

A integral da eq. (5.35) uma integral


padro da matemtica e geralmente
chamada de funo erro ou funo incerteza
ou integral do erro normal. Ela no pode ser
resolvida analiticamente, mas pode ser
calculada em um computador ou mesmo numa
calculadora cientfica. A Fig. 5.13 mostra esta
integral plotada como uma funo de t e tabula
alguns valores. Uma tabulao mais completa
pode ser encontrada na literatura especializada
ou no Apndice A.

59

Distribuio Norma ou de Gauss

0,25

0,5

0,75

1,0

1,25

1,50

2,0

P(%)

20

38

55

68

79

87

95,4

Probleminha rpido 5.4.


As medies de uma dada distncia x so
distribudas normalmente com X = 10 e x = 2.
(a) Qual a probabilidade que uma medio
isolada caia dentro x = 7 e x = 13.
(b) Qual a probabilidade que ela caia fora da
faixa de x = 7 e x = 13?

Resp.:
(a) entre 7 e 13: 87% (corresponde a 1,5 )
(b) menor que 7 e maior que 13: 13%

5.6. Justificativa da mdia como melhor


estimativa
Fig. 5.13. A probabilidade Prob(dentro t) que uma
medio de x caia dentro t desvios padro do valor
verdadeiro x = X.

Nota-se da Fig. 5.13 que a probabilidade de


uma medio cair dentro de um desvio padro
do valor verdadeiro 68%, como antecipado
no captulo 4. Se o desvio padro das
medies reportado como a incerteza, ou
seja, xestimado x e se toma x = , ento pode
se estar 68% confiante que se est dentro do
resultado correto.
Pode-se ver na Fig. 5.11 que a
probabilidade Prob(dentro t) se aproxima
rapidamente (exponencialmente) de 100%,
quando t aumenta. A probabilidade que uma
medio caia dentro 2 95,4% e para 3
99,7%. Colocando estes resultados de outro
modo: a probabilidade que uma medio caia
fora de um desvio padro grande (32%), que
a medio caia fora de 2 pequena (4,6%) e
que caia fora de 3 muito pequena (0,3%).
Obviamente, nada sagrado com relao
ao nmero 68%, apenas acontece ser a
confiana associada com o desvio padro .
Uma alternativa ao desvio padro o erro
provvel (EP) e definido como a distncia para
a qual h uma probabilidade de 50% de uma
medio cair entre X EP. A Fig. 5.13 mostra
que, para uma medio normalmente
distribuda, o erro provvel
EP 0,67
Alguns metrologistas cotam o erro provvel
como a incerteza em suas medies. Porm, o
desvio padro x a escolha mais popular por
causa da simplicidade de suas propriedades.

As trs ultimas sees discutiram a


distribuio limite f(x), a distribuio obtida de
um nmero infinito de medies de uma
quantidade x. Se f(x) fosse conhecida, se
calcularia a mdia x e o desvio padro
obtido aps um nmero muito grande de
medies e, no mnimo para a distribuio
normal, poderia se conhecer o valor verdadeiro
X. Infelizmente, nunca se conhece a
distribuio limite. Na prtica, tem-se um
nmero finito N de valores medidos (5, 10 ou
talvez 50),
x1, x2, ..., xN
e o problema chegar melhor estimativa de
X e baseado nestes N valores medidos.
Se as medies seguem uma distribuio
normal GX,(x) e j se conhecem os parmetros
X e , pode-se calcular a probabilidade de se
obter os valores x1, x2, ..., xN que foram
realmente obtidos. Assim, a probabilidade de
se ter uma indicao prxima de x1, em um
pequeno intervalo dx1 :
Prob(x entre x1 e x1 + dx1) =
=

1
2

e ( x1 X )

/ 2 2

dx 1

Na prtica, se est interessado no tamanho


do intervalo dx1 (ou o fator 2 ), de modo que
a equao pode ser abreviada para:
Prob(x1) =

1 ( x1 X ) 2 / 2 2
e

(5.36)

A eq. (5.36) se refere probabilidade de se


obter o valor x1, embora rigorosamente seja a

60

Distribuio Norma ou de Gauss


probabilidade de se obter um valor no intervalo
prximo de x1.
A probabilidade de se obter a segunda
indicao x2

1 ( x 2 X )2 / 2 2
e

e do mesmo modo,
Prob(x2) =

Prob(xN) =

1 ( x N X )2 / 2 2
e

(5.37)

(5.38)

As eq. (5.36) at (5.38) do as


probabilidades de se obter cada uma das
medies x1, x2, ..., xN calculadas em termos da
distribuio limite assumida GX,(x) . A
probabilidade que se observe o conjunto inteiro
de N medies o produto destas
probabilidades separadas.
ProbX,(x1,...,xN)

Este procedimento plausvel para achar as


melhores estimativas para X e x chamado
de princpio da mxima probabilidade. Ele
pode ser resumido do seguinte modo:
Dadas N medies feitas x1, x2, ..., xN, as
melhores estimativas para X e so os valores
para os quais os valores observados x1, x2, ...,
xN so mais provveis. As melhores estimativas
para X e so aqueles valores para os quais
ProbX,(x1,...,xN) mxima, dado que aqui

1 (xi X )2 / 22
e
(5.39)
N

Entender o significado das vrias


quantidades em (5.39) muito importante.
1. Os nmeros x1, x2, ..., xN so
conhecidos e fixos.
2. A quantidade ProbX,(x1,...,xN) a
probabilidade de se obter os N
resultados x1, x2, ..., xN, calculados em
termos de X e , (o valor verdadeiro de
x e o parmetro largura desta
distribuio).
3. Os nmeros X e no so conhecidos
e se quer achar as melhores
estimativas para X e baseando-se
nas medies feitas x1, x2, ..., xN.
4. Os ndices X e so colocados na
probabilidade (5.39) para enfatizar que
ela depende dos valores
desconhecidos X e .
Como os valores reais de X e so
desconhecidos, pode-se imaginar os valores X
e e usar estes valores imaginados para
computar a probabilidade ProbX,(x1,...,xN). Se
so imaginados outros nmeros novos, X e
e encontrado que a probabilidade
correspondente ProbX,(x1,..., xN) maior,
deve-se tomar os novos valores X e como
melhores estimativas para X e . Continuando
deste modo, pode-se imaginar a procura de
valores de X e que faam ProbX,(x1,...,xN) to
grande quanto possvel e estes valores so
considerados como as melhores estimativas
para X e .

ProbX,(x1,...,xN)

1 (xi X )2 / 22
e
N

(5.40)

Usando este princpio, pode-se encontrar


facilmente a melhor estimativa para o valor
verdadeiro X. Obviamente, (5.40) mxima se
a soma no expoente mnima. Assim, a
melhor estimativa para X o valor de X para
que
N

( x i X) 2 / 2
i=1

seja mnima. Para localizar este mnimo,


deriva-se a expresso com relao a X e iguala
a derivada a zero, dando:
N

( x X) = 0
i

i =1

ou
melhor estimativa para X =

(5.42)

Ou seja, a melhor estimativa para o valor


verdadeiro X a mdia aritmtica das N
medies, x = xi/N, um resultado que j tinha
sido assumido sem prova, desde o Captulo 1.
Achar a melhor estimativa para , largura
da distribuio limite, um pouco mais difcil,
porque a probabilidade (5.40) uma funo
mais complicada de . Deve-se diferenciar
(5.40) com relao a e fazer a derivada igual
a zero. Este valor d o valor de que maximiza
(5.40) e que a melhor estimativa para ,
como:
melhor estimativa de =

1
N

( x X)

i =1

(5.43)
O valor verdadeiro X desconhecido.
Assim, na prtica, substitui-se X na (5.43) pela
melhor estimativa de X, que a mdia. Esta
substituio fornece a estimativa:

61

Distribuio Norma ou de Gauss


=

1 N
(x i x) 2
N i=1

(5.44)

A melhor estimativa para a largura de


uma distribuio limite o desvio padro de N
medies observadas x1, x2, ..., xN, como
originalmente definido em (4.6)
Pode-se ficar surpreso que a estimativa
(5.44) seja a mesma que a definio original
(4.6), usando N, do desvio padro, em vez da
definio melhorada, usando (N-1). A melhor
estimativa (5.43) envolve o valor verdadeiro X,
enquanto em (5.44) X foi substitudo por x
(melhor estimativa de X). Agora, estes nmeros
geralmente no so iguais e pode ver
facilmente que (5.44) sempre menor ou igual
a (5.43). [Considerando-se (5.43) como uma
funo de X e como esta funo mnima em
X = x , (5.44) sempre ser menor ou igual a
(5.43)]. Assim, passando de (5.43) para (5.44),
est se subestimando de modo consistente a
largura . O Apndice E mostra que esta
subestimativa corrigida, substituindo o
denominador N em (5.44) por (N 1). Ou seja,
a melhor estimativa para a largura
precisamente o desvio padro melhorado ou da
amostra dos valores medidos x1, x2, ..., xN, com
(N 1) no denominador.
melhor estimativa de =

1 N
( x i X)2
N 1 i =1

(5.45)
Agora hora de se fazer algumas revises:
Se as medies de x so sujeitas somente
a incertezas aleatrias, sua distribuio limite
a funo de Gauss, GX,(x) centrada no valor
verdadeiro X e com largura . A largura o
limite de confiana de 68%, em que h uma
probabilidade que qualquer medio ir cair
dentro uma distncia do valor verdadeiro X.
Na prtica, nem X e nem conhecido. Em
vez disso, conhecem-se os N valores medidos
x1, x2, ..., xN, onde N to grande quanto a
pacincia e o tempo o permitirem. Baseandose nestes N valores medidos, a melhor
estimativa do valor verdadeiro X tem sido
mostrado ser a mdia x = xi/N e a melhor
estimativa para a largura o desvio padro
de x1, x2, ..., xN, como definido em (5.45).
Duas questes adicionais aparecem:
1. Qual a incerteza em x como uma
estimativa do valor verdadeiro de X?
Esta questo ser discutida na seo
5.7, onde a incerteza em x ser
mostrada ser o desvio padro da
mdia, como definido no captulo 4.

2. Qual a incerteza em x como uma


estimativa da largura verdadeira . A
frmula para esta incerteza na
incerteza ou desvio padro do desvio
padro derivada no Apndice E. O
resultado prova que h uma incerteza
relativa em x
x
1
(5.46)
=
x
2(N 1)
Este resultado mostra claramente a
necessidade de medies numerosas, antes
que a incerteza seja conhecida com confiana.
Por exemplo, com apenas 3 medies de uma
quantidade (N = 3), o resultado (5.46) implica
que o desvio padro 50% incerto.

Probleminha rpido 5.5.


Para testar a confiabilidade de um
galvanmetro balstico, descarrega se um
capacitor (carregado em uma tenso fixa)
atravs do galvanmetro, trs vezes e mede se
a carga resultante, q, em C. Destas trs
medies, calcula se o desvio padro, que vale
q = 6 C. Usando (5.46),
(a) achar a incerteza q neste parmetro.
(b) O valor verdadeiro do desvio padro
poderia facilmente ser to pequeno
quanto q - q ou to grande quanto
q + q . Quais so estes dois valores
para esta experincia? (Notar bem que
a confiabilidade q somente aps trs
medies).
Resp.:

(a) q = 6 3 C e x =
(b) q dq = 3 C e q + dq = 9 C

5.7. Justificativa da soma quadrtica


Voltando-se ao assunto do Captulo 3,
propagao das incertezas, l foi estabelecido,
sem prova formal, que quando as incertezas
so aleatrias e independentes, elas podem
ser combinadas em soma quadrtica, de
acordo com regras padro, ou com regras
simples em (3.16) e (3.18) ou a regra geral em
(3.47), que inclui as regras simples como casos
especiais. O uso da soma quadrtica pode
agora ser justificado.
O problema da propagao das incertezas
aparece quando se medem uma ou mais
quantidades, x, y, ..., z, todas com incertezas e
ento se usam os valores medidos para
calcular alguma quantidade q(x, y, ..., z). A
principal questo , obviamente, decidir qual a

62

Distribuio Norma ou de Gauss


incerteza no resultado de q. Se as quantidades
x, y, ..., z so sujeitas apenas a incertezas
aleatrias, elas sero normalmente distribudas
com parmetros de largura x, y, ..., z , que
so tomados como as incertezas associadas
com qualquer medio isolada das quantidades
correspondentes. A questo a ser decidida
agora esta: conhecendo se as distribuies
das medies de x, y, ..., z, o que pode se dizer
acerca da distribuio dos valores para q? Em
particular, qual ser a largura da distribuio de
valores de q? Esta questo respondida em
quatro etapas, numeradas de I a IV.
I. Quantidade medida mais nmero fixo
Primeiro, sejam dois casos especiais
simples. Seja uma quantidade medida x e
usada para calcular a quantidade

q=x+A

(5.47)

onde A um nmero fixo sem incerteza (tal


como A = 2 ou A = ). Sejam tambm as
medies de x distribudas normalmente em
torno do valor verdadeiro X, com largura x,
como na Fig. 5.14 (a). Assim, a probabilidade
de se obter qualquer valor x (em um pequeno
intervalo dx) Gx,(x)dx ou
2

probabilidade de obter valor x e ( x X )

/ 2 2x

(5.48)

e [( q A ) X )

/ 2 2x

e [ q ( X + A )]

/ 2 2x

(5.49)

O resultado (5.49) mostra que os valores


calculados de q so normalmente distribudos e
centrados no valor X + A, com largura x, como
mostrado na Fig. 5.14 (b). Em particular, a
incerteza em q a mesma (ou seja, x) da
incerteza em x, justo como a regra (3.16) havia
previsto.
II. Quantidade medida vezes nmero fixo
Como um segundo exemplo simples, seja a
medio x e o clculo da quantidade

q = Bx
onde B um nmero fixo (como B = 2 ou
B = ). Se as medies de x so normalmente
distribudas, ento, raciocinando como antes,
conclui-se que:
probabilidade de obter valor q = probabilidade
de obter x = q/B
2
q

exp X / 2 2x

largura x

(a)
medida
largura x

(b)

A segunda probabilidade dada por (5.48)


e a probabilidade de obter valor q

calculada

Fig. 5.14. Se os valores medidos de x so


normalmente distribudos com centro em x = X e largura
x , os valores calculados de q = x + A (com A fixo e
conhecido) sero normalmente distribudos com centro
em q = x + A e com a mesma largura x.

= exp[ (q BX )2 / 2B 2 2x ]

(5.50)

Em outras palavras, os valores de


q = Bx sero normalmente distribudos, com
centro em q = BX e largura Bx , com mostrado
na Fig. 5.15. em particular a incerteza em q =
Bx B vezes a incerteza em x, justo como a
regra (3.18) j previa.

largura x

(a)
medida

O problema deduzir a probabilidade de se


obter qualquer valor q da quantidade definida
por (5.47). Agora, de (5.47) se v que x = q A
e assim que
probabilidade de obter valor q = probabilidade
de obter x = q A

largura x

(b)
calculada

Fig. 5.15. Se os valores medidos de x so


normalmente distribudos com centro em x = X e largura x
, os valores calculados de q = Bx (com B fixo e conhecido)

63

Distribuio Norma ou de Gauss


sero normalmente distribudos com centro em q = Bx e
com a largura B x.

III. Soma de duas quantidades medidas


Como um primeiro exemplo no trivial de
propagao de incerteza, seja a medio de
duas quantidades independentes x e y e o
clculo de sua soma x + y. Por hiptese, as
medies de x e y so normalmente
distribudas em torno de seus valores
verdadeiros X e Y, com larguras x e y , como
na Fig. 5.16 (a). e se tenta achar a distribuio
dos valores calculados de x + y. Ser
encontrado que os valores de x + y so
normalmente distribudos, que eu centro o
valor verdadeiro X + Y e que a largura de sua
distribuio
2x + 2y

como na Fig. 5.16 (c). Em particular, este


resultado justifica a regra do captulo 3 que diz
se x e y so sujeitas apenas a incertezas
aleatrias e independentes, ento e a incerteza
em x + y a raiz quadrada da soma dos
quadrados das incertezas separadas em x e y.

y2
Prob(y) exp 2
2 y

O problema calcular a probabilidade de


se obter qualquer valor particular de x + y.
Primeiro se observa que, como x e y medidos
independentemente, a probabilidade de obter
qualquer valor x e qualquer valor y justo o
produto de (5.51) e (5.52), ou seja:
1 x 2 y 2
Prob(x,y) exp 2 + 2
2 x y

x
(b)

x 2 y 2 ( x + y )2 (Bx + Ay )2
+
=
+
A B
A +B
AB( A + B)

Fig. 5.16. Se as medies de x e y so independentes e


normalmente distribudas com centros X e Y e larguras x
e x, ento os valores calculados de x + y so
normalmente distribudos com centro em X + Y e com
largura 2x + 2y

Para simplificar a lgebra, assume-se a


priori que os valores verdadeiros X e Y so
ambos iguais a zero. Neste caso, a
probabilidade de ter qualquer valor particular
de x
x2
Prob(x) exp 2
2 x
e a de y

( x + y )2
+ z2
A +B

(5.51)

(5.54)

(5.55)

Na eq. (5.55) foi introduzida a abreviao z2


para o segundo termo da eq. (5.54) porque seu
valor no interessa.
Se substituirmos (5.55) em (5.53), trocando
A por x2 e B por y2, tem-se
( x + y )2
z2
Prob(x,y) exp

2
2
2( x + y ) 2

(c)

(5.53)

Conhecendo se a probabilidade de se obter


qualquer x e qualquer y, pode se ento calcular
a probabilidade para qualquer valor de x + y. O
primeiro passo reescrever o expoente em
(5.53) tem termos da varivel de interesse, x +
y. Este passo pode ser feito usando a
identidade que pode ser facilmente verificada:

(a)

(5.52)

(5.56)

Esta probabilidade para obter determinados


valores de x e y pode ser vista a probabilidade
de obter determinados valores de x + y e z.
Assim, pode-se reescrever (5.56) como
( x + y )2
z2
Prob(x,y) exp
exp

2
2
2
2( x + y )

(5.57)
Finalmente, o que se quer a
probabilidade de obter um determinado valor
de x + y, independente do valor de z. Esta
probabilidade obtida, somando ou melhor,
integrando (5.57) sobre todos os valores
possveis de z, ou seja:

Prob (x + y) =

Pr ob( x + y, z)dz

(5.58)

64

Distribuio Norma ou de Gauss


Quando se integra (5.57) com relao a z,
a integral do fator exp(-z2/2) vale

2 e se tem

( x + y )2
Prob(x + y) exp
2
2
2( x + y )

(5.59)

Este resultado mostra que os valores de (x


+ y) so normalmente distribudos com largura
2x + 2y , como antecipado.

A prova completa para o caso quando os


valores verdadeiros de x e y so ambos zero,
ou seja, X = 0 e Y = 0. Se X e Y so ambos
no-zero, pode-se fazer o seguinte. Primeiro
escreve
x + y = (x X) + (y Y) + (X + Y)

(5.60)

Em (5.60), os dois primeiros termos so


centrados em zero, com larguras x e y, pelo
resultado do passo I. Pela eq. (5.59), a soma
dos dois primeiros termos normalmente
distribuda com largura

2x + 2y . O terceiro

termo em (5.60) um nmero fixo, portanto,


pelo resultado ainda do passo I, ele
simplesmente desloca o centro da distribuio
para (X + Y) mas deixa a mesma largura. Em
outras palavras, os valores de (x + y) como
dado por (5.60) so normalmente distribudos
em torno de (X + Y) com largura

2x + 2y .

Este o resultado que se queria.


IV. Caso geral
Tendo justificado a frmula da propagao
da incerteza para o caso especial de uma
soma (x + y), pode-se justificar a frmula geral
para a propagao da incerteza de modo
surpreendentemente simples. Sejam duas
quantidades independentes x e y, cujos valores
medidos so normalmente distribudos e agora
se quer calcular a quantidade q(x,y) em termos
de x e y. A distribuio dos valores de q(x,y)
facilmente encontrada, usando-se os
resultados dos passos I, II e III, como segue.
Inicialmente, as larguras x e y (incertezas
em x e y) devem ser, como sempre, pequenas.
Esta exigncia significa que est se tratando
apenas com valores de x prximos de X e de y
prximos de Y e se pode usar a aproximao
(3.42) para escrever:
q
q
q( x, y ) q( X, Y ) +
( x X) +
( y Y ) (5.61)
x
y

Esta aproximao boa porque os nicos


valores de x e y que ocorrem significativamente

esto prximos de X e Y. As duas derivadas


parciais so resolvidas em X e Y e so,
portanto, nmeros fixos.
A aproximao (5.61) expressa a
quantidade desejada q(x,y) como a soma de
trs termos:
1. q(X,Y) um nmero fixo, que
simplesmente desloca a distribuio
dos resultados
2. q/x(x X) cuja distribuio tem
largura x, com valores centrados em
zero e largura (q/x)x
3. q/y(y Y) cuja distribuio tem
largura y, com valores centrados em
zero e largura (q/y)y
Combinando os trs termos em (5.61) e
invocando os resultados j obtidos, concluise que os valores de q(x,y) so
normalmente distribudos em volta do valor
verdadeiro (X,Y) com largura
2

q q
q = x + y
x y

(5.62)

Se os desvios padro x e x so
identificados como as incertezas em x e y, o
resultado (5.62) precisamente a regra (3.47)
para a propagao de incertezas aleatrias,
para o caso quando q uma funo de apenas
duas variveis, q(x,y). Quando q depende de
muitas variveis, q(x,y,...,z), o argumento
anterior pode ser estendido imediatamente
para estabelecer a regra geral (3.47) para
funes de muitas variveis. Como as regras
do Captulo 3 relacionadas com a propagao
de incertezas aleatrias podem ser derivadas
de (3.47), todas elas so agora justificadas.

5.8. Desvio padro da mdia


Mais um resultado importante mostrado no
Captulo 4 precisa ser provada. Este resultado
se relaciona com o desvio padro da mdia
x . Foi provado na seo (5.5) que se so
feitas N medies x1, x2, ..., xN de uma
quantidade x, normalmente distribuda, a
melhor estimativa do valor verdadeiro X a
mdia x de x1, x2, ..., xN. No captulo 4, foi
estabelecido que a incerteza nesta estimativa
o desvio padro da mdia,
x =

x
N

(5.63)

Sejam as medies de x normalmente


distribudas em torno do valor verdadeiro X
com parmetro largura x. Agora se quer
conhecer a confiabilidade da mdia das N

65

Distribuio Norma ou de Gauss


medies. Para responder isto, o que se faz
naturalmente repetir as N medies muitas
vezes. Ou seja, faz-se uma seqncia de
experimentos, em cada um se fazem N
medies e calcula se a mdia. Deve-se agora
achar a distribuio destas muitas
determinaes da mdia das N medies.
Em cada experimento se medem as N
quantidades x1, x2, ..., xN, e ento se calcula
x:
x=

x1 + x 2 + ... + x N
N

(5.64)

Como a quantidade calculada x uma


funo simples das quantidades medidas x1, x2,
..., xN, pode-se achar a distribuio dos
resultados de x , usando a frmula da
propagao da incerteza. A nica caracterstica
incomum da funo (5.64) que todas as
medies x1, x2, ..., xN so medies da mesma
quantidade, com o mesmo valor verdadeiro X e
com a mesma largura x.
H vrias observaes interessantes:
1. Como cada quantidade medida x1, x2,
..., xN normalmente distribuda, a
funo x dada por (5.64) tambm
normalmente distribuda.
2. O valor verdadeiro para cada x1, x2, ...,
xN X, de modo que o valor verdadeiro
x como dado por (5.64)
X + X + ... + X
=X
N
Assim, depois de fazer muitas
determinaes da mdia x das N medies, os
muitos resultados para x sero normalmente
distribudos em torno do valor verdadeiro X. A
nica questo que fica, muito importante,
encontrar a largura da distribuio dos
resultados. De acordo com a frmula de
propagao da incerteza (5.62), reescrita para
N variveis, esta largura
2

x
x

x =
x1 +
x 2 + ... +
xN

x
1
2

x
x
x
1
=
= ... =
=
x1 x 2
x N N

Assim, (5.65) se reduz a


2

1
1
x = x + ... + x
N

2x

= x
2
N
N

(5.66)

como se queria demonstrar.


Chegou-se ao resultado desejado (5.66)
to rapidamente que provavelmente
conveniente rever seu significado. Se imaginou
um grande nmero de experimentos, em cada
um se fazendo N medies de x e ento
calculou-se a mdia x destas N medies. Foi
mostrado que, aps repetir este experimento
muitas vezes,
1. os muitos resultados para x sero
normalmente distribudos,
2. eles sero centrados no valor
verdadeiro X
3. a largura de sua distribuio
x = x / N

4. esta largura x o limite de confiana


de 68% para o experimento
5. se foi achada a mdia de N medies
uma vez, pode-se ficar 68% de
confiana que o resultado cai dentro de
uma distncia x do valor verdadeiro X
6. este resultado exatamente o que
deveria significar a incerteza na mdia.
7. ele tambm explica claramente por que
esta incerteza chamada de desvio
padro da mdia.
Com esta prova simples e elegante, todos
os resultados apresentados nos captulos
anteriores referentes a incertezas aleatrias
foram justificados.

(5.65)
Como x1, x2, ..., xN, so todas medies da
mesma quantidade x, suas larguras so iguais
entre si e a x,
x1 = x2 = ... = xN = x
V-se tambm de (5.64) que todas as
derivadas parciais em (5.65) so iguais:

66

Distribuio Norma ou de Gauss

largura

largura

Fig. 5.17. As medies individuais de x so


normalmente distribudas em torno de X com largura x
(curva pontilhada). Se usado o mesmo instrumento para
fazer muitas determinaes da mdia de 10 medies, o
resultado x ser normalmente distribudo em torno de X
com largura = x / 10 .
x

5.9. Aceitao de um resultado medido


Voltando a duas questes j levantadas
mas no completamente respondidas no
Captulo 2:
1. qual o significado da afirmao que
se est razoavelmente confiante que
uma quantidade medida caia na faixa
xestimado x ?
2. quando se compara o valor xestimado com
um valor esperado xesperado (baseado
em uma teoria ou em valor nominal ou
em alguma outra medio), como se
pode decidir se a diferena entre
ambos aceitvel ou no?
Para a primeira questo, a resposta agora
clara: se uma medida x feita vrias vezes,
como geralmente acontece, a mdia x a
melhor estimativa para x e o desvio padro da
mdia uma boa medio de sua incerteza. O
resultado final
valor de x = x x
significa que, baseando se nas medies, se
espera com 68% de confiana, que qualquer
medio de x, feita do mesmo modo, caia na
faixa x x .
Poderia se escolher outro modo para
caracterizar a incerteza; por exemplo,
escrevendo o resultado como
valor de x = x 2 x
Agora, se espera com 95% de confiana
que qualquer medio de x caia nesta faixa
maior. Claramente, o ponto essencial em
reportar qualquer valor medido estabelecer
uma faixa (ou incerteza) e o nvel de confiana

correspondente a esta faixa. A escolha mais


comum dar um desvio padro do resultado,
com o limite de confiana de 68%. Menos
comum, porm tambm usado, dar o
resultado com dois desvios padro,
correspondendo a um limite de confiana de
95%. Tambm possvel encontrar resultados
com trs desvios padro, correspondendo a um
limite de confiana de 99,7%. De qualquer
modo, sempre deve-se informar claramente a
incerteza e o limite de confiana
correspondente.
Como enfatizado no Captulo 2, quase
todas as concluses experimentais envolvem a
comparao de dois ou mais nmeros. Com a
teoria estatstica, pode-se dar agora um
significado quantitativo a muitas tais
comparaes. Aqui ser considerado apenas
um tipo de experincia, em que se chega a um
nmero e se compara este resultado com
algum resultado conhecido esperado. Por
exemplo, na experincia de verificar a
conservao de momento, pode-se medir os
momentos inicial e final, p e p, verificar que p =
p (dentro de incertezas), mas pode-se
igualmente considerar a experincia de achar
um valor para (p p) e comparar esta
diferena com o valor esperado zero.
Geralmente, quando se quer comparar duas
medies que so supostas iguais, pode-se
formar sua diferena e comparar a diferena
com o valor esperado zero. Qualquer
experincia que envolva uma quantidade
medida (como a acelerao da gravidade, g)
para a qual se conhece o valor aceito com
preciso, tambm deste tipo e o resultado
esperado o valor conhecido aceito.
Seja o metrologista que mede alguma
quantidade x (como a diferena de dois
momentos que devem ser supostamente
iguais) na forma:
valor de x = xestimado
onde denota o desvio padro de seu
resultado (que poderia ser o desvio padro da
mdia, se xestimado fosse a mdia de vrias
medies). Agora se quer comparar este
resultado com o resultado esperado xesperado.
No Captulo 2 foi dito que se a discrepncia
|xestimado xesperado| fosse menor ou apenas
pouco maior que , ento o resultado era
considerado satisfatrio, mas se |xestimado
xesperado| fosse muito maior que , o resultado
era insatisfatrio. Estes critrios so corretos
at certo ponto, mas eles no do uma medida
quantitativa de quo boa ou m a
discrepncia. Os critrios tambm no dizem
onde estabelecer os limites de aceitao. Qual
a discrepncia satisfatria: 1,5 ou 2 ?

67

Distribuio Norma ou de Gauss


Pode se responder a estas questes,
agora, desde que as medies do
metrologistas sejam governadas pela
distribuio normal, como certamente
razovel supor. Pode-se comear fazendo
duas hipteses acerca desta distribuio:
1. a distribuio centrada no resultado
esperado xesperado
2. o parmetro largura da distribuio
igual estimativa do metrologista.
A hiptese (1) o que o metrologista
espera ser a verdade. Ele assume que todas
as incertezas sistemticas sejam reduzidas a
um nvel desprezvel, para que a distribuio
seja centrada no valor verdadeiro e que o valor
esperado seja realmente xesperado, de modo que
h razo para esperar que o xesperado seja
correto.
A hiptese (2) uma aproximao porque
deve ter sido uma estimativa do desvio
padro, mas uma aproximao razovel, se o
nmero de medies em que se baseia
grande. Tomadas juntas, as duas hipteses
so iguais, assumindo que os procedimentos e
clculos estejam corretos.
Est se julgando se razovel ou no o
resultado da medio, xestimado, comparando a
diferena |xestimado xestimado| com (estimativa
da largura da distribuio normal
correspondente). Se o nmero de medies em
que foi baseado pequeno, esta estimativa
pode ser pouco confivel e o nvel de confiana
correspondente impreciso (embora ainda seja
um guia superficial til). Com um pequeno
nmero de medies, o clculo preciso dos
limites de confiana requer o uso da chamada
distribuio de Student, t.
Deve-se decidir agora se xestimado um valor
razovel de se obter e se as hipteses foram
corretas. Se a resposta for sim, no h razo
para duvidar da hiptese e tudo est bem. Se a
resposta for no, a hiptese deve ser
questionada e o metrologista deve examinar a
possibilidade de
1. engano nas medies
2. engano nos clculos
3. existncia de erros sistemticos
4. resultado esperado xesperado incorreto
Primeiro se determina a discrepncia,
|xestimado xesperado| e ento
t=

x estimado x esperado

(5.67)

nmero de desvios padro pelo qual xestimado


difere de xesperado . (Aqui, denota o desvio
padro apropriado para xestimado. Se xestimado a
mdia de vrias medies, ento o desvio
padro da mdia). Depois, da tabela da integral

do erro normal no Apndice A, pode-se achar a


probabilidade de se obter um resultado que
difira de xesperado por t ou mais desvios padro,
satisfeitas as hipteses. Esta probabilidade
vale
Prob (fora t) = 1 Prob (dentro t)

(5.68)

Se esta probabilidade grande, a


discrepncia |xestimado xesperado |
perfeitamente razovel e o resultado xestimado
aceitvel. Se a probabilidade em (5.68)
pequena, a discrepncia julgada significativa,
ou seja inaceitvel. E o nosso infeliz
metrologista deve pesquisar o que deu errado.
Seja, por exemplo, a discrepncia |xestimado
xesperado | igual a um desvio padro. A
probabilidade de uma discrepncia igual ou
maior que um desvio padro igual ao familiar
32% (100 68%). Claramente, uma
discrepncia de um desvio padro muito
provvel de ocorrer e , portanto, insignificante.
No extremo oposto, a probabilidade Prob(fora
3) justo 0,3% e, se as hipteses estiverem
corretas, uma discrepncia de 3 muito
pouco provvel. Em outras palavras, se a
discrepncia 3, as hipteses so pouco
provavelmente corretas.
Os limites entre aceitao e no aceitao
dependem do nvel abaixo do qual se julga
uma discrepncia de ser razoavelmente
improvvel. Este nvel uma questo de
opinio, a ser decidida pelo experimentador.
Muitos metrologistas consideram 5% como um
limite correto para improbabilidade no
razovel. Se aceita desta escolha, ento uma
discrepncia de 2 seria inaceitvel, porque
Prob(fora 2) = 4,6% (100 95,4%). De fato,
da tabela do Apndice A, v-se que qualquer
discrepncia maior do que 1,96 inaceitvel
ao nvel de 5% e discrepncias de tal ordem
so chamadas de significativas. Analogamente,
ao nvel de 1%, qualquer discrepncia maior
que 2,58 seria inaceitvel e discrepncias
desta ordem so consideradas altamente
significativas.

Probleminha rpido 5.6


Mede se a carga do eltron e e nota se que
o melhor resultado 2,4 desvios padro
afastado do valor esperado. Esta discrepncia
significativa a 5%? E a 2? E a 1%?
Resp.: Prob (fora 2,4 ) = 1,64%. Assim, discrepncia de 2,4
significativa ao nvel de 5% e 2% mas no o para 1%.

68

Distribuio Norma ou de Gauss


Ainda no se tem uma resposta definitiva
que um certo valor medido xestimado seja
aceitvel ou no. A teoria da distribuio
normal, porm, fornece uma medida clara e
quantitativa se um determinado resultado
razovel ou no, que o melhor que se pode
esperar.
Muitos metrologistas no gastam tempo
debatendo precisamente onde est o limite de
aceitao. Se a discrepncia menor que 2
(por exemplo 1,8 ), ento, para quase
qualquer padro, o resultado julgado
razovel. Se a discrepncia apreciavelmente
muito maior que 2,5, ento por qualquer
padro, ela inaceitvel. Se a discrepncia cai
em uma regio cinza, entre 1,9 e 2,6 , a
experincia simplesmente inconclusiva. Se a
experincia suficientemente importante,
como o teste de uma nova teoria, necessrio
repeti-la, preferivelmente com melhores
tcnicas, at que seja obtido um resultado
conclusivo.

69

Distribuio Norma ou de Gauss

Principais Definies e Equaes do


Captulo 5
Distribuies limites

Estimando X e de N valores medidos


Aps N medies de uma quantidade
normalmente distribuda x,
x1, x2, ..., xN,

Se f(x) uma distribuio limite para a


medio de uma varivel contnua x, ento
f(x)dx = frao da medio que cai
entre x e x + dx
e

a melhor estimativa para o valor verdadeiro X


a mdia das medies
melhor estimativa para X =

f ( x)dx

= probabilidade que qualquer uma

medio d um resultado entre x = a e x = b.


[Ver (5.12)]
A condio de normalizao

f ( x )dx = 1

e a melhor estimativa para a largura o


desvio padro das medies,
melhor estimativa de =

[Ver (5.13)]

1 N
( x i X)2
N 1 i =1

O valor mdio de x esperado aps muitas


medies

x=

xf ( x)dx

As incertezas nestas estimativas so as


seguintes:
A incerteza em x como uma estimativa de
X

[Ver (5.15)]

incerteza em x =
Se medies de x so sujeitas a muitas
pequenas incertezas aleatrias mas a
incertezas sistemticas desprezveis, sua
distribuio limite ser a distribuio normal ou
de Gauss:
G X, ( x ) =

e( x X )

/ 2

[Ver (5.66)]

Distribuio normal ou de Gauss

[Ver (5.25)]

e a incerteza x como a estimativa do valor


verdadeiro de dada por
incerteza relativa em x =

1
2(N 1)

Ver [(5.46)]

onde
X = valor verdadeiro de x
= centro da distribuio
= valor mdio aps muitas medies
e
= parmetro largura da distribuio
= desvio padro aps muitas medies
A probabilidade uma medio isolada cair
dentro de t desvios padro de X
Prob (dentro t) =

e
2

z2 / 2

dz

(5.35)

Esta integral , muitas vezes, chamada de


funo erro ou integral do erro normal. Seu
valor como uma funo de t est tabulado no
Apndice A. Em particular,
Prob (dentro ) = 68,27%

70

Distribuio Norma ou de Gauss

Aceitao de um resultado medido


Seja a medio de uma quantidade x na
forma padro
valor de x = xestimado
onde o desvio padro apropriado.
Suponha-se tambm que, baseado em alguma
teoria ou em alguma outra medio, se
obtenha o valor xesperado. Diz-se que xestimado
difere de xesperado por t desvios padro, onde
t=

x estimado x esperado

Assumindo se x normalmente distribudo


em torno de xesperado, com largura , pode-se
achar do Apndice A, a probabilidade Prob
(fora ) de uma discrepncia to grande ou
maior que a encontrada. Se esta probabilidade
menor que algum nvel escolhido, por
exemplo 1%, julga-se o acordo ser inaceitvel
a este nvel. Por exemplo, se Prob (fora t)
menor que 1%, o acordo inaceitvel ao nvel
de 1%.

Apostilas\Incerteza

JRTaylor2.doc

30 JAN 98 (Substitui 26 DEZ 97)

71

Parte 2
6. Rejeio de Dados
7. Mdias Ponderadas
8. Ajustando aos Mnimos Quadrados
9. Covarincia e Correlao
10. Distribuio Binomial
11. Distribuio de Poisson
12. Teste do Chi-Quadrado para uma Distribuio
Depois de lido e entendido o Captulo 5, est se preparado
para, com surpreendentemente pouca dificuldade, estudar
vrios tpicos mais complicados. Os captulos da Parte 2
apresentam sete destes tpicos, alguns dos quais so
aplicaes da teoria estatstica j desenvolvida e outros so
extenses adicionais desta teoria. Todos so importantes e
devem ser vistos agora ou no futuro. Eles foram arranjados de
modo independente de modo que podem ser estudados de
uma nica vez ou parceladamente.

72

6. Rejeio de Dados
6.1. Introduo
Este captulo discute a questo
desconfortvel de descartar ou no uma
medio que parece duvidosa ou que aparenta
ser um engano. Este tpico controverso;
alguns metrologistas argumentam que
descartar uma medio, justamente porque ela
parece no razovel nunca justificado. De
qualquer modo, h um teste simples que, no
mnimo, pode ser aplicado, quando se defronta
com esta situao. O teste chamado de teste
de Chauvenet e uma bonita aplicao das
idias estatsticas desenvolvidas nos captulos
4 e 5.

6.2. Problema da rejeio de dados


s vezes, uma medio em um conjunto de
medies parece discordar visivelmente das
outras. Quando isto acontece, o
experimentador deve decidir se a medio
anmala resultou de algum engano e deve ser
rejeitada ou uma medio bona fide que deve
ser usada com todas as outras. Por exemplo,
sejam seis medies do perodo de um
pndulo, cujos resultados so os seguintes, em
segundos:

3,8

3,5

3,9

3,4

3,9

1,8
(6.1)

Neste exemplo, o valor 1,8 visivelmente


diferente de todas as outras e deve-se decidir o
que fazer com ela.
Foi visto no Captulo 5 que uma medio
legtima pode se desviar significativamente de
outras medies da mesma quantidade.
Porm, uma discrepncia legtima to grande
quanto a ultima medio em (6.1) muito
improvvel, de modo que se fica inclinado a
suspeitar que o tempo de 1,8 resultou de algum
engano no detectado ou outra causa externa.
Talvez, por exemplo, a ltima leitura tenha sido
mal feita ou o cronmetro deu algum problema
na ltima leitura por causa de falha
momentnea na bateria.
Quando se toma muito cuidado nos
registros, pode-se geralmente ser capaz de
estabelecer a causa definida para a medio
anmala. Por exemplo, os registros poderiam

mostrar que um cronmetro diferente foi usado


na ltima medio em (6.1) e uma calibrao
posterior dele poderia mostrar que este
cronmetro est com atraso sistemtico. Neste
caso, a medio anmala deve ser
definitivamente rejeitada.
Infelizmente, estabelecer uma causa
externa para um resultado anormal
geralmente impossvel. Deve-se ento decidir
rejeitar ou no a anormalidade simplesmente
examinando os resultados e aqui o
conhecimento da distribuio de Gauss se
torna til.
A rejeio de dados controversa, pois h
especialistas que a desaprovam. tambm
uma questo importante. No exemplo anterior,
a melhor estimativa para o perodo do pndulo
muito afetada se a medio 1,8 rejeitada ou
no. A mdia das seis medies 3,4 s
(incluindo a medio suspeita 1,8 s) porm fica
3,7 s quando se rejeita 1,8 s; havendo portanto
uma diferena de 10%.
Alm disso, a deciso de rejeitar ou no ,
no fundo, uma questo subjetiva e o tcnico
que toma esta deciso pode ser razoavelmente
acusado por outros tcnicos de estar dando um
jeitinho nos dados. A situao piora pela
possibilidade da medio anmala poder
refletir algum efeito importante. Realmente,
muitas descobertas cientficas importantes
primeiro apareceram como medies anmalas
que pareciam enganos. Jogando fora o tempo
de 1,8 s, no exemplo (6.1), poderia se estar
jogando fora exatamente o dado mais
interessante.
De fato, quando se tm dados como em
(6.1), o nico procedimento realmente correto
repetir as medies muitas e muitas vezes
mais. Se a anomalia contnua, deve-se ser
capaz de rastrear sua causa, ou como um
engano ou como um efeito fsico real. Quando
isto no ocorre, ento quando se fazem muitas
medies (por exemplo, 100), no haver
nenhuma diferena significativa no resultado
final se a anomalia includa ou no.
Porm, repetir uma medio 100 vezes,
cada vez que um resultado parecer suspeito
geralmente impraticvel e por isso necessrio
algum critrio para rejeitar um resultado
suspeito. H vrios critrios para fazer isso,
alguns mais complicados que outros. O critrio
de Chauvenet fornece uma aplicao simples e
instrutiva da distribuio de Gauss.

73

Rejeio de Dados
6.3. Critrio de Chauvenet
Sejam novamente as seis medies
3,8

3,5

3,9

3,4

3,9

1,8

Se assumido, por um momento, que


estas seis medies de uma quantidade x
sejam legtimas, pode-se calcular a mdia x e
o desvio padro x,
x = 3,4 s

(6.2)

x = 0,8 s

(6.3)

Pode-se agora quantificar a extenso em


que a medio suspeita, 1,8, anmala. Ela
difere da mdia 3,4 por 1,6 vezes ou quase
duas vezes o desvio padro. Se foi assumido
que as medies eram governadas pela
distribuio de Gauss, com centro em x e
largura x, pode-se calcular a probabilidade de
se obter medies que difiram por um mnimo
da mdia. De acordo com as probabilidades
mostradas no Apndice A, esta probabilidade

nmero esperado de medies que se desviam


como medio suspeita menor que , ento
a medio suspeita deve ser rejeitada.
Obviamente a escolha de metade arbitrria,
mas tambm razovel e pode ser defendida.
A aplicao do critrio de Chauvenet a um
problema genrico pode agora ser descrito
facilmente. Sejam N medies feitas
x1, x2, ..., xN
de uma quantidade x. De todas as medies,
calculam-se x e x. Se uma das medies
(chamada agora de xsusp) difere de x de modo
que parea suspeita, ento se tem:

t susp =

x susp x
x

(6.4)

como o nmero de desvios padro pelo qual


xsusp difere de x . Depois, do Apndice A, podese achar a probabilidade
Prob (fora tsusp )

Prob (fora 2) = 1 Prob (dentro 2)


= 1 0,95
= 0,05
Em outras palavras, assumindo que os
valores x = 0,34 s e x = 0,8 x sejam
legtimos, pode-se esperar que uma em cada
20 medies difira da mdia tanto quanto 1,8
diferiu. Quando se fazem 20 medies ou mais,
pode-se realmente esperar que haja uma ou
duas medies como 1,8 s e no h nenhuma
razo para rejeit-la. Porm, como foram feitas
apenas seis medies, o nmero esperado de
medies que tenham desvio como o de 1,8 s
realmente
nmero esperado para desviar como
1,8 = nmero de medies x Prob (fora 2x),
ento = 6 x 0,05 = 0,3
Ou seja, em seis medies, se espera, em
mdia, somente 30% das medies se desviem
como a medio suspeita 1,8 s.
Este resultado fornece a medio
quantitativa necessria do que seja razovel
para a medio suspeita. Se escolhido 33%
das medies como ridiculamente improvvel,
ento se conclui que o valor 1,8 s no uma
medio legtima e deve ser rejeitada.
A deciso de onde estabelecer o limite de
ridiculamente improvvel depende do
experimentador. O critrio de Chauvenet, como
normalmente dado, estabelece que se o

que uma medio legtima difira de x por tsusp


ou mais desvios padro. Finalmente,
multiplicando por N, o nmero total de
medies, d:
n = nmero esperado de desvio como xsusp
n = N x Prob (fora tsusp )
Se n < ,ento, pelo critrio de
Chauvenet, pode-se rejeitar xsusp.
Quando se decide rejeitar a medio
suspeita, deve-se recalcular novamente a
mdia e o desvio padro das medies sem a
suspeita.
Exemplo
Sejam 10 medies de um comprimento x,
cujos resultados, em mm, so os seguintes

46, 48, 44, 38, 45, 47, 58, 44, 45, 43

A medio 58 parece anormalmente


grande. Foi verificado seu registro e no se
achou nenhuma evidncia que o resultado seja
causado por um engano. Aplicando-se o
critrio de Chauvenet, qual a concluso?
Aceitando provisoriamente as 10 medies,
calculam-se:
x = 45,8
e

74

Rejeio de Dados
x = 5,1

6.4. Discusso
A diferena entre o valor suspeito xsusp = 58
e a mdia x = 45,8 12,2 que corresponde a
2,4 desvios padro, isto :
x susp x

58 45,8
= 2,4
x
5,1
Referindo tabela no Apndice A, v-se
que a probabilidade que uma medio difira da
mdia x por 2,4 x ou mais, 98,4%. Ento,
t susp =

Prob (fora 2,4 x) = 1 Prob (dentro 2,4 x)


= 1 0,984
= 0,016
Em 10 medies, deve-se esperar achar
0,16 de uma medio como desviando como
suspeito. Como 0,16 menor que o 0,5
estabelecido pelo critrio de Chauvenet , devese rejeitar a medio 58 mm. Rejeitando esta
medio, deve-se recalcular x e x como
x = 44,4
x = 2,9

Como esperado, a mdia mudou um pouco,


de 45,8 para 44 [variao de (3%) e o desvio
padro variou muito, de 5,1 para 2,9 (variao
de 76%)].

Probleminha rpido 6.1


So feitas 20 medies de uma certa
tenso V e calculados a mdia e o desvio
padro como:
V = 51 V

e
V = 2 V
Na hora de escrever o relatrio, entre as 20
medies foi encontrado o valor suspeito de 56
V.
(a) Qual a probabilidade desta medio
se desviar de V ?
(b) Se decidido usar o critrio de
Chauvenet , o valor deve ser rejeitado?
(c)
Resp.: 98,76% ento Prob = 0,0124 x 20 = 0,25 e por isso deve
ser rejeitado.

H cientistas que acreditam que os dados


nunca devem ser rejeitados sem evidncia
externa que a medio em questo seja
incorreta. Um compromisso razovel usar o
critrio de Chauvenet para identificar dados
que possam ser considerados sujeitos
rejeio. tendo feito esta identificao, pode-se
fazer todo o clculo subsequente duas vezes,
uma vez, incluindo os dados suspeitos e outra,
excluindo-os, para ver de quanto os valores
questionveis afetam a concluso final.
Uma razo para que muitos cientistas
discordem do critrio de Chauvenet que a
escolha de 0,5 como limite de rejeio (na
condio que n < ) arbitrria. Talvez mesmo
mais importante, a no ser que se tenha feito
um grande nmero de medies (N = 50), o
valor de x extremamente incerto como uma
estimativa do desvio padro verdadeiro das
medies. Isto significa, por sua vez, que o
nmero tsusp em (6.4) muito incerto. Como a
probabilidade de uma medio fora t desvios
padro muito sensvel a t, uma grande
incerteza em tsusp causa uma incerteza muito
grande nesta probabilidade e deixa sria
dvida em todo o procedimento. Para os dois
raciocnios, o critrio de Chauvenet deve ser
somente usado como um ltimo recurso,
quando no se pode verificar as medies
atravs de sua repetio.
Foi assumido que somente uma medio
suspeita. O que ocorre quando se tem duas ou
mais medies suspeitas? Dado que o uso do
critrio de Chauvenet para rejeitar uma
medio aberto dvida, claramente seu uso
para rejeitar vrias medies ainda mais
problemtico. Principalmente, se no
possvel de jeito nenhum repetir as medies,
porque todo o equipamento foi desmontado.
Sejam duas medies suspeitas que se
desviam da mdia por um grande valor. Neste
caso, se calcula o nmero esperado de
medies que se desviam e se este nmero
menor que 1 (isto, duas vezes ), ento ambas
as medies devem ser consideradas
candidatas para rejeio. Se h duas medies
suspeitas, x1 e x2 com x2 se desviando mais da
mdia que x1 , primeiro se aplica o critrio de
Chauvenet para x1. Se o nmero esperado
deste desvio menor que 1, deve-se rejeitar os
dois valores. Se este nmero esperado maior
que 1, certamente no de deve rejeitar as duas
medies, mas reaplicar o critrio de
Chauvenet usando x2 e se o nmero esperado
for menor que , deve-se rejeitar apenas x2.
Tendo se rejeitado alguma medio que
no tenha passado pelo critrio de Chauvenet
, deve-se naturalmente recalcular x e x

75

Rejeio de Dados
usando se os dados remanescentes. O valor
resultante de x ser muito menor que o valor
original e com o novo x, algumas medies
podem tambm cair fora pelo critrio de
Chauvenet .Porm, h consenso que o critrio
de Chauvenet no deve ser aplicado uma
segunda vez usando os valores recalculados
de x e x.

Como h vrias objees ao critrio de


Chauvenet , especialmente se N no muito
grande, este teste deve ser usado apenas
como um ltimo recurso, quando as medies
de x no puderem ser repetidas e verificadas.
As objees ao critrio de Chauvenet podem
ser estendidas como descrito na seo 6.3.

Principais definies e equaes do


Captulo 6
Critrio de Chauvenet
Se so feitas N medies

x1, x2, ..., xN


de uma nica quantidade x e se uma das
medies (xsusp, por exemplo) suspeitamente
diferente de todas as outras, o critrio de
Chauvenet um teste simples para decidir
rejeitar ou no este valor suspeito.
Para aplicar este teste, deve-se
1. Computar a mdia e o desvio padro
das N medies
2. Achar o nmero de desvios padro que
xsusp difere da mdia x
t susp =

x susp x
x

3. Achar a probabilidade (assumindo as


medies normalmente distribudas em
torno de x e com largura x) de se
obter um resultado que dentro de X
tx [Entra com t e acha Prob(dentro tx,
no Apndice A)
4. Achar a probabilidade de estar fora
destes limites, ou seja, fazer 1
probabilidade (normalizada)
5. Multiplicar este resultado pelo nmero
da quantidade de medies, obtendose n.
6. Se n < , ento de acordo com o
critrio de Chauvenet , deve-se rejeitar
o valor xsusp.
7. Se n >> que o , a medio suspeita
vlida e no deve ser rejeitada.

76

7. Mdias Ponderadas
7.1. Introduo
Este captulo trata do problema de
combinar duas ou mais medies separadas
e independentes de uma nica quantidade
fsica. Ser visto que a melhor estimativa
desta quantidade, baseando-se em vrias
medies, uma mdia ponderada destas
medies.

7.2. Problema de combinar medies


Muitas vezes, uma quantidade fsica
medida vrias vezes, talvez em locais
separados, por experimentadores diferentes
ou em condies diversas e aparece a
questo de como estas medies podem ser
combinadas para dar uma nica melhor
estimativa. Por exemplo, sejam dois
instrumentistas A e B medindo uma
quantidade x cuidadosamente e obtendo os
seguintes resultados:
Instrumentista A : x = xA A

(7.1)

Instrumentista B : x = xB B

(7.2)

Cada resultado ser provavelmente o


resultado de vrias medies, em que caso
xA ser a mdia de todas as medies de A e
x o desvio padro desta mdia e do mesmo
modo, para xB e B . A questo como
melhor combinar xA e xB para uma nica
melhor estimativa de x.
Antes de examinar esta questo, note
que se a discrepncia |xA xB| entre as duas
medies muito maior que as duas
incertezas A e B , deve-se suspeitar que
alguma coisa est errada, no mnimo, com
uma das duas medies. Nesta situao, dizse que as duas medies so inconsistentes
e deve-se examinar ambas as medies
cuidadosamente para ver se uma delas ou
ambas esto sujeitas a incertezas
sistemticas no detectadas.
Porm, por hiptese, as duas medies
(7.1) e (7.2) so consistentes, ou seja, a
discrepncia |xA xB| no significativamente
maior que A ou B. Ser que a melhor
estimativa xestimado o valor verdadeiro X,
baseando-se nas duas medies? O primeiro
impulso seria usar a mdia aritmtica (xA

xB)/2 das duas medies, dando igual


importncia s duas medies. Alguma
reflexo, porm, sugere que esta mdia no
a mais conveniente se as duas incertezas
A e B forem diferentes, pois o bom senso
parece dizer que a medio mais precisa
deve ter uma maior importncia.
Em todo este captulo ser assumido que
todas as incertezas sistemticas foram
identificadas e reduzidas a um nvel
desprezvel. Assim, todas as incertezas
remanescentes so aleatrias e as medies
de x so distribudas normalmente em torno
do valor verdadeiro X.

7.3. Mdia Ponderada


Pode-se resolver o problema facilmente
usando o princpio da mxima probabilidade,
como foi feito na seo 5.5. Assume-se que
ambas as medies so governadas pela
distribuio de Gauss e que o valor
verdadeiro desconhecido de x X. Assim, a
probabilidade de A obter seu valor particular
xA :
1 ( x A X )2 / 2 2A
e
(7.3)
ProbX(xA)
A
e de B obter seu xB observado

ProbX(xB)

1 ( xB X )2 / 2B2
e
(7.4)
B

O ndice X indica explicitamente que


estas probabilidades dependem do valor real
desconhecido.
A probabilidade que A ache o valor xA e B
o valor xB justo o produto das duas
probabilidades (7.3) e (7.4). Em um modo
que agora seria familiar, este produto envolve
uma funo exponencial cujo expoente a
soma de dois expoentes em (7.3) e (7.4).
Pode se escrever:
ProbX(xA,xB) = ProbX(xA) ProbX(xB)

2
1
e / 2
A B

(7.5)

onde se introduziu o smbolo 2 (qui


quadrado) para o expoente:

77

x X xB X
+

2 = A
A B

(7.6)

Esta quantidade importante a soma dos


quadrados dos desvios de X das duas
medies, cada um dividido por sua
correspondente incerteza.
O princpio da mxima probabilidade
estabelece, justo como antes, que a melhor
estimativa para o valor verdadeiro
desconhecido X o valor para o qual as
observaes reais xA e xB so mais
provveis. Isto , a melhor estimativa para X
o valor para o qual a probabilidade (7.5)
mxima ou, de modo equivalente, o expoente
2 mnimo. (Como maximizar a
probabilidade implica em minimizar a soma
dos quadrados 2, este mtodo para estimar
X geralmente chamado de mtodo dos
mnimos quadrados). Assim, para se achar
a melhor estimativa, simplesmente se deriva
(7.6) com relao a X e faz se a derivada
igual a zero,
x X
x X
2 A 2 +2 B 2 = 0
A
B
A soluo desta equao para X a
melhor estimativa e facilmente resolvida
como:
x A xB
2 + 2

A B

1
1
2 + 2

B
A

(7.7)

Este resultado aparentemente feio fica


mais bem arrumado se forem definidos os
pesos:

wA =

1
1
e wB = 2
2A
B

(7.8)

Com esta notao, pode-se reescrever


(7.7), como a mdia ponderada (denotada
xpond )

quando wA wB, a mdia ponderada (7.9)


diferente da mdia aritmtica. Esta frmula
similar para o centro de gravidade de dois
corpos, onde wA e wB so os pesos reais de
dois corpos e xA e xB suas posies. Em
(7.9), os pesos so os inversos dos
quadrados das incertezas nas medies
originais, como em (7.8). Se a medio de A
mais precisa que a de B, ento A < B e
assim wA > wB de modo que a melhor
estimativa xestimado est mais prxima de xA do
que de xB, como realmente acontece.

Probleminha rpido 7.1


Tem-se os seguintes resultados dos
tempos de vida de determinada partcula:
10,0 0,5 ns
12 1 ns

Combinando-se os resultados,
determinar:
(a) os respectivos pesos?
(b) mdia ponderada obtida e sua
incerteza?
Resposta:

(a) 4 e 1
(b) 10,4 0,4

A anlise das duas medies pode ser


generalizada para cobrir qualquer nmero de
medies. Sejam N medies separadas de
uma quantidade x,
x1 1, x2 2, ..., xN N ,
com as respectivas incertezas 1, 2, ..., N.
Pensando como antes, pode-se achar que a
melhor estimativa baseando-se nestas
medies a mdia ponderada
x pond =

w x
w
i

(7.10)

onde as somas so sobre todas as N


medies,
i = 1, 2, ..., N e os pesos wi de cada medio
o inverso do quadrado de cada incerteza
correspondente.

melhor estimativa X = xpond =


w A x A + w B xB
w A + wB

(7.9)
Se as duas medies originais so
igualmente incertezas (A + B) e assim
wA = wB , ento este resultado se reduz
mdia aritmtica (xA + xB)/2. Em geral,

wi =

1
i2

(7.11)

para i = 1, 2, ..., N.

78

Como os pesos wi = 1/i2 associados com


cada medio envolvem o quadrado da
incerteza correspondente i , qualquer
medio que seja muito menos precisa que
as outras contribui muito menos para o
resultado final (7.10). Por exemplo, se uma
medio 4 vezes menos precisa que o
restante, seu peso 16 vezes menor que os
outros pesos e, na prtica, esta medio
pode simplesmente ser ignorada.
Como a mdia ponderada xpond uma
funo dos valores medidos originais x1, x2,
..., xN, a incerteza em xpond pode ser calculada
usando a propagao da incerteza. Como
pode ser visto facilmente, a incerteza em xpond

pond =

(7.12)
i

Este resultado feio talvez um pouco


mais fcil de lembrar se reescrito como
1

i =

(7.13)
i

Explicando a eq. (7.13), pode-se dizer


que a incerteza em cada medio o inverso
da raiz quadrada de seu peso. Retornando a
(7.12), pode-se ver que a incerteza no
resultado final xpond o inverso da raiz
quadrada da soma de todos os pesos
individuais. Ou seja, o peso total do resultado
final a soma dos pesos individuais wi.

R=

(1 11) + (1 12) + ( 91 10 )
= 11,42
1 + 1 + 91

A incerteza neste resultado dada por


(7.12):
1
= 0,69
pond =
1
1+ 1+
9
O resultado final dado como
R = 11,4 0,7
Para comparao, o resultado com a
terceira medio desprezada, cuja incerteza
trs vezes maior que as duas primeiras e
por isso pouco importante , com um
algarismo a mais
Restimado = 11,50 0,71

O resultado muito prximo do obtido


com as trs medies, 11,42 0,69 ,
tambm com um algarismo a mais e mostra
que realmente a terceira medio tem um
pequeno efeito.

7.4. Um exemplo
Foram feitas trs medies da mesma
resistncia, obtendo-se os seguintes
resultados:
1:
2:
3:

11 1
12 1
10 3

Qual a melhor estimativa de R e sua


incerteza?
As trs incertezas 1, 2 e 3 so 1, 1 e 3.
Os pesos correspondentes so wi = 1/i2
so:
w1 = 1

w2 = 1

w3 = 1/9

A melhor estimativa para R segundo


(7.10)

79

Principais definies e equaes


do Captulo 7
Se x1, x2, ..., xN, so medies de uma
nica quantidade x, com incertezas
conhecidas 1, 2, ..., N, ento a melhor
estimativa para o valor verdadeiro de x a
mdia ponderada:
x pond =

w x
w
i

[Ver (7.10)]

onde as somas so de todas N medies,


i = 1, 2, ..., N e os pesos so os inversos dos
quadrados das incertezas correspondentes:
wi =

1
i2

A incerteza em xpond
1
pond =
wi

[Ver (7.12)]

onde ainda a soma de todas as medies i


= 1, 2, ..., N.

Apostilas\Incerteza

JRTaylor1.doc

25 SET 98 (Substitui 30 JAN 98)

80

8. Mnimos Quadrados
Quando se faz uma srie de medies do
tipo descrito, pode-se fazer duas perguntas:

8.1. Introduo
A discusso da anlise estatstica dos
dados at agora foi focalizada exclusivamente
na medio repetida de uma nica quantidade,
no porque a anlise de muitas medies de
uma quantidade seja um problema mais
interessante, mas porque este problema
simples deve ser bem entendido antes de
qualquer discusso adicional. Agora, h base
para se discutir o primeiro problema, mais
importante e geral.

(a)

(b)

8.2. Dados que devem se adequar reta


Um dos mais comuns e interessantes tipos
de experimento envolve a medio de vrios
valores de duas variveis fsicas diferentes
para investigar a relao matemtica entre as
duas medies. Por exemplo, um
experimentador pode deixar cair uma pedra de
vrias alturas diferentes h1, h2, ..., hN e medir os
tempos correspondentes de queda, t1, t2, ..., tN
para ver se as alturas e tempos esto ligados
pela relao esperada terica h = gt2.
Provavelmente, aplicaes mais
importantes so aquelas que envolvem a
relao linear. Por exemplo, se esperado que
um corpo caindo com acelerao constante g,
tenha sua velocidade v com relao linear com
o tempo t,
v = vo + gt
Mais geralmente, se duas variveis fsicas
x e y sejam ligadas pela relao linear da forma
y = A + Bx

(8.1)

onde A e B so constantes. Infelizmente, h


muitas notaes diferentes usadas para uma
relao linear, como y = ax + b.
Se duas variveis x e y so linearmente
relacionadas como em (8.1), ento um grfico
de y contra x d uma linha reta que tem
inclinao B e corta o eixo y em y = A. Se so
medidos N diferentes valores x1, x2, ..., xN e os
correspondentes valores y1, y2, ..., yN e se as
medies so sujeitas a nenhuma incerteza,
ento cada ponto (xi, yi) cai exatamente na
linha reta y = A + Bx, como na Fig. 8.1(a). Na
prtica, sempre h incertezas e o que se pode
esperar que a distncia de cada ponto (xi, yi)
da linha seja razovel comparada com as
incertezas, como na Fig. 8.1 (b).

Fig. 8.1. (a) Se duas variveis x e y so linearmente


relacionadas como na eq. (8.1) e se no h incertezas
experimentais, ento os pontos medidos (xi e yi) devem
cair exatamente na linha y a A + Bx.
(b) Na prtica, sempre h incertezas nas medies,
que podem ser mostradas como barras de erro e os
pontos (xi, yi) podem ser esperados cair razoavelmente
prximos da reta. Aqui, somente a varivel y sujeita a
incertezas (x tem incertezas desprezveis em relao s
de y)

Se estiver seguro de que y e x so


linearmente relacionados, ento o problema
achar a linha reta y = A + Bx que melhor se
adequa s medies ou seja, achar as
melhores estimativas para as constantes A e B
baseadas nos dados (x1, y1),..., (xN, yN). Este
problema pode ser enfocado graficamente,
como discutido rapidamente na seo 2.6. Ele
tambm pode ser tratado analiticamente, por
meio do princpio da mxima probabilidade.
Este mtodo analtico de achar a melhor linha
reta para compor uma srie de pontos
experimentais chamado de regresso linear,
ou dos mnimos quadrados para a linha e o
principal assunto deste captulo.
Os valores medidos para (x1, y1),..,(xN, yN)
realmente garantem a expectativa de que y
seja linear com x? Para responder esta
questo, primeiro deve-se achar a linha que
melhor agrupa os dados, mas deve-se ento
estabelecer algum critrio para saber como
esta linha est adequada para os dados. Se j
so conhecidas as incertezas nas medies,
pode-se desenhar um grfico como o da Fig.
8.1(b), que mostra a melhor linha reta com os

81

Mnimos Quadrados
dados e os dados experimentais com suas
barras de incerteza. Ento, julga-se
visualmente se a linha passa suficientemente
prxima de todas as barras de incerteza. Se as
incertezas no so conhecidas com confiana,
deve-se julgar como os pontos de adequam
linha reta, examinando a distribuio dos
pontos em si. Esta questo ser tratada no
Captulo 9.

8.3. Clculo das constantes A e B


Voltando questo de achar a melhor linha
reta y = A + Bx para colocar um conjunto de
pontos medidos (x1, y1), ..., (xN, yN) e para
simplificar a discusso, suponha-se que todas
as medies de y tem incertezas apreciveis e
as incertezas nas medies de x sejam
desprezveis. Esta hiptese geralmente
razovel, porque as incertezas em uma
varivel geralmente so muito maiores que as
incertezas em outras, que podem-se
desprezar. Tambm se assume que as
incertezas em y tenham todas o mesmo
tamanho. (Esta hiptese tambm razovel
em muitas aplicaes, mas se as incertezas
forem diferentes, ento a anlise pode ser
generalizada para pesar as medies
apropriadamente. Mais especificamente,
assume-se que as medies de cada yi sejam
governadas pela distribuio de Gauss com o
mesmo parmetro largura x para todas as
medies.
Se as constantes A e B forem conhecidas,
ento, para qualquer valor dados xi (que so
assumidos sem incerteza), pode-se computar o
valor verdadeiro do correspondente yi,
(valor verdadeiro para yi) = A + B xi

(8.2)

A medio de yi governada pela


distribuio normal centrada em seu valor
verdadeiro, com parmetro largura y. Portanto,
a probabilidade de o valor observado yi seja
ProbA,B(yi)

1 ( y i A Bx i )2 / 2 2y
e
y

(8.3)

onde os ndices A e B indicam que esta


probabilidade depende dos valores
desconhecidos de A e B. A probabilidade de se
obter um conjunto completo de medies y1, y2,
..., yN, o produto
ProbA,B(yi,...,yN) = ProbA,B(y1) ... ProbA,B(yN)

1 X2 / 2
e
Ny

(8.4)

onde o expoente dado por:


2 =

i=1

( y i A Bx i )2
2y

(8.5)

No agora modo familiar, ser assumido que


as melhores estimativas para as constantes
desconhecidas A e B, baseadas nas medies
dadas, so os valores de A e B para os quais a
probabilidade ProbA,B(yi,...,yN) mxima, ou
para os quais a soma dos quadrados 2 em
(8.5) um mnimo. Por isso, o mtodo
conhecido como adequao (ou encaixe) aos
mnimos quadrados). Para achar estes
valores, diferencia-se 2 com relao a A e B e
fazem-se as derivadas iguais a zero:
2 2 N
= 2 ( y i A Bx i ) = 0
A
y i =1

(8.6)

2 2 N
= 2 x i ( y i A Bx i ) = 0
B
y i =1

(8.7)

Estas duas equaes podem ser reescritas


como equaes simultneas para A e B:
AN + B x i = y i

(8.8)

e
A

+B

2
i

x y
i

(8.9)

Nestas equaes foram omitidos os ndices


i = 1 at N dos smbolos de somatria , pois
no h perigo de confuso. Tambm ser
usado a forma simplificada xy em lugar de
xiyi
As duas eq. (8.8) e (8.9), s vezes
chamadas de equaes normais, so
facilmente resolvidas para as estimativas de
mnimos quadrados para as constantes A e B,
A=

x y x xy

(8.10)

B=

N xy x y

(8.11)

onde se tem a forma conveniente no


denominador :

82

Mnimos Quadrados
= N x 2

( x )

(8.12)

Os resultados (8.10) e (8.11) do as


melhores estimativas para as constantes A e B
da linha reta y = A + Bx, baseados nos N
pontos medidos (x1, y1), ..., (xN, yN). A linha
resultante chamada de linha de regresso de
y em x e ela agrupa os dados em mnimos
quadrados.
Exemplo
Tem-se uma balana de mola para medir
massas. Suspende-se a balana pelo seu topo,
coloca-se um prato na parte inferior e coloca-se
uma rgua graduada atrs da mola para ler o
comprimento da mola. Antes de qualquer
medio, deve-se calibrar a balana, ou seja,
deve-se achar a relao entre a massa no
prato e o comprimento da mola. Para fazer esta
calibrao, tomam-se cinco massas exatas de
2-kg, que so colocadas no prato, uma a uma,
registrando os correspondentes comprimentos
Li, como mostrado na Tab. 8.1. Assumindo que
a mola obedece a lei de Hooke, deve-se ter a
relao linear entre L e m,

que o comprimento L faz o papel da varivel


dependente y, enquanto a massa faz o papel
da varivel independente x. As constantes A e
B so dadas por (8.10) a (8.12), com as
substituies
xi

mi

yi

Li

(Esta correspondncia indicada pelas


colunas x e y na Tab. 8.1). Para achar A e
B, precisa-se achar as somas mi, Li, mi2 e
miLi.
Calcular as constantes A e B agora
direto. De acordo com (8.12), o denominador

D = N m2 (m)2
= 5 x 220 302 = 200
Depois, de (8.10), acha-se a constante A:

m L m mL
2

A=

220 256,6 30 1622


= 39,0 cm
200
Finalmente, de (8.11), acha-se B:

A=
L = A + Bm

(8.13)

(Aqui, a constante A o comprimento sem


carga da mola e B g/k, onde k a constante
da mola). A equao de calibrao (8.13)
permite achar qualquer massa desconhecida m
a partir do comprimento correspondente L,
assim que sejam conhecidas as constantes A e
B. Para achar estas constantes, usa-se o
mtodo dos mnimos quadrados. Quais so os
resultados de A e B? Plotar os dados de
calibrao e a curva dada pela melhor
adequao de (8.13). Se colocada uma
massa m no prato e se observa o comprimento
de onda L = 53,2 cm, qual a massa m?

B=

B=

Medio
i

x
carga, mi

y
comprimento, Li

1
2
3
4
5

2
4
6
8
10

42,0
48,4
51,3
56,3
58,6

N=5

mi=30

Li=30

mi
4
16
36
64
100

mi =220
2

5 1622 30 256,6
= 2,06 cm/kg
200

Um grfico dos dados e a curva (8.13)


usando estes valores A e B mostrado na Fig.
8.2. Se a massa m estende a mola em 53,2 cm,
ento de acordo com (8.13), a massa vale:
m=

Tab. 8.1. Massas mi (kg) e comprimentos Li (cm)


para a balana com mola. O x e y nas cotas indicam
que variveis fazem os papis de x e y.

N mL m L

L A (53,2 39,0)cm
=
= 6,9 kg
B
2,06 cm/kg

miLi
84
194
308
450
586
miLi=1,622

Como geralmente acontece neste tipo de


problemas, as duas variveis no so
chamadas x e y e deve-se ter cuidado para
identificar quem quem. Comparando (8.13)
com a forma padro y = A + Bx, pode-se ver

83

Mnimos Quadrados

comprimento (cm)
60
50
40
massa (kg)
2

10

Fig. 8.2. Um grfico dos pontos da Tab. 8.1 e a reta de


melhor ajuste (8.13)

uma pedra para diferentes alturas. Assim, no


se tem uma idia de sua confiabilidade
examinando o espalhamento de seus valores.
Mesmo assim, pode-se estimar facilmente
a incerteza y nos nmeros y1, y2, ..., yN. A
medio de cada yi . Por hiptese, as medies
de cada yi so normalmente distribudas em
torno do valor verdadeiro A + Bxi com
parmetro largura y. Assim, os desvios (yi A
Bxi) so normalmente distribudos, todos com
o mesmo valor central zero e com a mesma
largura y . Esta situao imediatamente
sugere que uma boa estimativa para y, seria
dada pela soma dos quadrados com a forma
familiar:
y =

Probleminha rpido 8.1


Achar a curva y = A + Bx atravs dos
mnimos quadrados, conhecidos trs pontos (x,
y) = (-1,0), (0, 6) e (1, 6). Usando papel
quadriculado, plotar os pontos e a curva. [Notar
que, como os trs valores de x (-1, 0 e 1) so
simtricos em relao ao zero, x = 0, que
simplifica o clculo de A e B. Em alguns
experimentos, os valores de x podem ser
arranjados para serem simetricamente
colocados deste modo, o que evita alguns
problemas].
Resp.: O melhor encaixe y = 7,75 1,25 x.
8

6
4
2

x
1

Agora que j sabido como achar as


melhores estimativas para as constantes A e B,
naturalmente se quer achar as incertezas
nestas estimativas. Antes de achar estas
incertezas, porm, deve se discutir a incerteza
y nas medies originais de y1, y2, ..., yN.

8.4. Incertezas nas medies de y


No procedimento de medir os valores y1, y2,
..., yN, pode-se formar alguma idia de suas
incertezas. De qualquer modo, saber como
calcular a incerteza pela anlise dos dados em
si importante. Os nmeros y1, y2, ..., yN, no
so medies da mesma quantidade, mas so
medies de diferentes valores da quantidade,
como, por exemplo, os tempos de queda de

1
( yi A Bx i )2
N

(8.14)

De fato, este resultado pode ser


confirmado por meio do princpio da mxima
probabilidade. Como sempre, a melhor
estimativa para y o valor para o qual a
probabilidade (8.4) de obter os valores
observados y1, y2, ..., yN, mxima. Pode-se
mostrar facilmente que derivando (8.4) com
relao a y e fazendo a derivada igual a zero,
esta melhor estimativa precisamente o
resultado (8.14).
Infelizmente, como se pode suspeitar, a
estimativa (8.14) para y no o fim da
histria. Os nmeros A e B em (8.14) so os
valores verdadeiros desconhecidos para as
constantes A e B. Na prtica, estes nmeros
devem ser substitudos pelas melhores
estimativas para A e B, atravs de (8.10) e
(8.11) e esta substituio reduz ligeiramente o
valor de (8.14). Pode ser mostrado que esta
reduo compensada se o fator N for
substitudo por (N2) no denominador. Assim,
o resultado final para a incerteza nas medies
y1, y2, ..., yN
y =

1
( yi A Bx i )2
N2

(8.15)

Sem pretender justificar o fator (N 2), mas


apenas alguns comentrios:
1.
Sempre que N for grande, a diferena
entre N e (N 2) desprezvel
2.
O fator (N 2) torna-se razoavelmente
claro se consideram-se apenas dois pares
de dados (x1, y1) e (x2, y2). Com somente
dois pontos, sempre se determina uma reta
que passa exatamente atravs dos dois
pontos e o mtodo dos mnimos quadrados
d esta curva. Ou seja, com apenas dois
pares de dados, no se pode
possivelmente deduzir nada acerca da

84

Mnimos Quadrados
confiabilidade das medies. Agora, como
ambos os pontos caem exatamente na
melhor curva, os dois termos da soma em
(8.14) e (8.15) so zero. Assim, a frmula
(8.14) com N = 2 no denominador daria a
resposta absurda de y = 0 enquanto que
(8.15) com (N 2) no denominador d
y = 0/0, indicando corretamente que y
indeterminado aps somente duas
medies.
A presena do fator (N 2) em (8.15)
reminiscncia do (N 1) que apareceu na
estimativa do desvio padro de N medies de
uma quantidade x, na eq. (5.45). L, tinha-se N
medies de x1, x2, ..., xN de uma quantidade x.
Antes de calcular x, usavam-se os N dados
para achar a mdia x . Em um certo sentido,
esta computao deixava somente (N 1)
valores medidos independentes, de modo que
se dizia que, tendo computado x , tem-se
apenas (N 1) graus de liberdade. Aqui, temse N medies mas antes de calcular y, devese computar as duas quantidades A e B. Tendo
feito isto, tem-se apenas (N 2) graus de
liberdade restados. Em geral, define-se o
nmero de graus de liberdade em qualquer
estagio em um clculo estatstico como o
nmero de medies independentes menos o
nmero de parmetros calculados destas
medies. Agora pode-se mostrar que o
nmero de graus de liberdade, no o nmero
de medies, o que deve aparecer no
denominados de frmulas com (8.15) e (5.45).
Este fato explica por que (8.15) contem o fator
(N 2) e (5.45) o fator (N 1).

8.5. Incertezas nas constantes A e B


Tendo se encontrado a incerteza y nos
nmeros medidos y1, y2, ..., yN, pode-se
facilmente retornar s estimativas para as
constantes A e B e calcular suas incertezas. O
ponto que as estimativas (8.10) e (8.11) para
A e B so funes bem definidas dos nmeros
medidos y1, y2, ..., yN. Assim, as incertezas em
A e B so dadas pela propagao da incerteza
em termos das incertezas em y1, y2, ..., yN.
Facilmente se chega a
A = y

(8.16)

e
B = y

= N x 2

onde dado por (8.12), como usual.

(8.12)

Os resultados desta seo e das duas


anteriores foram baseados nas hipteses de
que as medies de y so igualmente incertas
e que qualquer incerteza em x desprezvel.
Embora estas hipteses sejam geralmente
justificadas, deve-se discutir brevemente o que
acontece quando as hipteses no so
satisfeitas.
1. Se as incertezas em y no so iguais,
pode se usar o mtodo dos mnimos
quadrados ponderados
2. Se h incertezas em x mas no em y,
pode-se simplesmente mudar as regras
de x e y na anlise feita
3. O mtodo de fixar os mnimos
quadrados de uma curva geral, no caso
de x e y terem incertezas, mais
complicado e mesmo controverso. No
caso especial importante de uma linha
reta, as incertezas em x e y fazem
pouca diferena, o que
surpreendente.
Suponha-se que as medies de x so
sujeitas a incerteza, mas que as medies de y
no tenham incerteza e seja o ponto medido
particular (x, y). Este ponto e a linha verdadeira
y = A + Bx so mostrados na Fig. 8.3. O ponto
(x, y) no cai na linha por causa da incerteza
(chamada de x) na medio de x. Agora, pode
se ver da Fig. 8.3 que a incerteza x em x, sem
incerteza em y, produz exatamente o mesmo
efeito como se no houvesse erro em x mas
um erro em y. dado por

y(equiv ) =

dy
x
dx

(8.18)

(onde equiv significa equivalente). O desvio


padro x a raiz quadrada da mdia dos
quadrados de x que iria resultar das vrias
repeties desta medio. Assim, de acordo
com (8.18), o problema com incertezas x em x
pode ser substitudo por um problema
equivalente com incertezas em y, dadas por:

y (equiv ) =

(8.17)

( x )

dy
x
dx

(8.19)

O resultado (8.19) verdadeiro, qualquer


que seja a curva de y vs x, mas (8.19)
especialmente simples se a curva uma linha

85

Mnimos Quadrados
reta, porque a inclinao dy/dx a constante B.
Assim para uma linha reta
y (equiv) = B x

(8.20)

erro equivalente em y
(x, y)

y = dx/dy x

erro x em x
x

Fig. 8.3. Um ponto medido (x, y) e a reta y = A + Bx em


que o ponto suposto cair. O erro x em x, com y exato,
produz o mesmo efeito que um erro y(equiv) =
(dy/dx) x em y, com x exato. (Aqui, dy/dx denota a
inclinao da reta esperada.)

Em particular, se todas as incertezas x so


iguais, o mesmo verdade das incertezas
equivalentes y (equiv). Assim, o problema de
fixar uma linha a pontos (xi, yi) com iguais
incertezas em x mas sem incertezas em y
equivalente ao problema de iguais incertezas
em y mas sem incertezas em x. Esta
equivalncia significa que se pode
seguramente usar o mtodo recm descrito
para qualquer problema. [Na prtica, os pontos
no caem exatamente na curva e os dois
problemas equivalentes no do exatamente
a mesma curva. Mesmo assim, as duas curvas
so iguais dentro das incertezas dadas por
(8.16) e (8.17).]
Pode-se agora estender este argumento para o
caso onde x e y ambos tem incertezas. A
incerteza em x equivalente incerteza em y,
como dado por (8.20). Alm disso, y j sujeita
sua prpria incerteza, y. Estas duas
incertezas so independentes e devem ser
combinadas em quadratura. Assim, o problema
original, com incertezas tanto em x como em y,
pode ser substitudo por um problema
equivalente em que somente y tem incerteza,
dada por

y (equiv) = 2y + (B x )2

(8.21)

Desde que todas as incertezas x so


iguais, e igualmente todas as incertezas y, as
incertezas equivalentes (8.21) so todas iguais

e se pode seguramente usar as frmulas (8.10)


at (8.17).
Se as incertezas em x (ou em y) no so as
mesmas, pode-se ainda usar (8.21), mas as
incertezas resultantes no sero todas a
mesma, e preciso usar o mtodo dos
mnimos quadrados ponderados. Se a curva na
qual se quer fixar os pontos no uma linha
reta, aparece uma complicao adicional
porque a inclinao dy/dx no uma constante
e no se pode substituir (8.19) por (8.20). De
qualquer modo, pode ainda usar (8.21), com
dy/dx no lugar de B, para substituir o problema
original (com incertezas em y e em x) por um
problema equivalente em que somente y tem
incertezas, como dado por (8.21).

8.6. Exemplo: Medio do zero absoluto


com um termmetro de gs a volume
constante
Se o volume de uma amostra de um gs
ideal mantido constante, sua temperatura T
uma funo linear desta presso P,
T = A + BP

(8.22)

ou
T A = BP
onde T A a temperatura absoluta. Tem-se
que a temperatura absoluta proporcional
presso, com o volume constante.
Aqui, a constante A a temperatura em
que a presso P cairia para zero (se antes o
gs no condensar em um lquido). Esta
temperatura chamada de zero absoluto da
temperatura e tem o valor aceito de
A = -273,15 oC
A constante B depende da natureza do gs,
sua massa e seu volume. Pela medio de
uma srie de valores para T e P, pode-se achar
as melhores estimativas para as constantes A
e B. Em particular, o valor de A d o zero
absoluto de temperatura.
Um conjunto de cinco medies de P e T
obtido, como mostrado nas primeiras trs
colunas da Tab. 8.2. A medio de P
considerada sem incerteza e a de T tem
incerteza constante, de cerca de alguns graus.
Assumindo que os pontos formem uma linha
reta do tipo (8.22), deve-se calcular a melhor
estimativa para a constante A (o zero absoluto)
e sua incerteza. Que concluses se pode tirar?
Tudo que tem que fazer aqui usar as
frmulas (8.10) e (8.16), com xi substitudo por
Pi e yi por Ti, para calcular todas as
quantidades de interesse. preciso calcular as
somas P, P2, T e PT. Muitas calculadoras

86

Mnimos Quadrados
podem calcular automaticamente estas contas,
mas mesmo sem tais mquinas, pode-se
facilmente manipular estes clculos, se os
dados forem organizados de modo
conveniente. Da Tab. 8.2, pode-se calcular

P = 425
P2 = 37,125
T = 260

T =

1
(Ti A BPi )2 = 6,7
N2

Este resultado est de acordo


razoavelmente com a estimativa da
temperatura ter uma incerteza de alguns graus.
Finalmente, pode-se calcular a incerteza
em A, usando (8.16):

PT = 25 810
A = T

Tab. 8.2. Presso (mm Hg) e temperatura


a volume constante

(oC)

de um gs

Presso

Temperatura

Pi

Ti

65

-20

-22,2

75

17

14,9

85

42

52,0

95

94

89,1

105

127

126,2

A + BPi

Neste tipo de clculo importante manter


um grande nmero de algarismos significativos
porque vo ser feitas subtraes entre grandes
nmeros. Armado com estas somas, pode-se
calcular imediatamente as melhores
estimativas das constantes A e B:

P T P PT
2

= -263,35

e
B=

N PT P T

= 18

Assim, o resultado final, com


arredondamento adequado, deve ser:

Medio

A=

= 3,71

Este clculo fornece a melhor estimativa


para o zero absoluto, A = - 263 oC.
Conhecendo-se as constantes A e B, podese calcular os nmeros A + BPi, a temperatura
esperada na base da melhor fixao relao
T = A + BP. Estes nmeros so mostrados na
quarta coluna da Tab. 8.2 e se espera que
todos estejam conformes com as temperaturas
observadas. Pode-se agora tomar a diferena
entre os dois nmeros das duas ultimas
colunas e calcular:

zero absoluto, A = - 260 20 oC


que combina satisfatoriamente com o valor
aceito de 273 oC.
Como acontece geralmente, este resultado
se torna mais claro se os dados forem
colocados em um grfico, como na Fig. 8.4. Os
cinco pontos, com suas incertezas de 7 oC,
so mostrado no canto direito. A melhor reta
passa atravs de quatro barras de incertezas e
prximo da quinta.
Para achar um valor para o zero absoluto, a
linha foi estendida alm de todos os dados, at
sua interseo com o eixo T. Este processo de
extrapolao (estender uma curva alm dos
pontos de dados que a determinam) pode
introduzir grandes incertezas, como claro da
figura. Uma muito pequena variao na
inclinao da reta ir causar uma grande
alterao no ponto de interseo no eixo T
distante. Assim, qualquer incerteza nos dados
grandemente amplificada se preciso
extrapolar qualquer distncia. Esta
amplificao explica por que a incerteza no
valor de zero absoluto
(18 oC) to maior que a incerteza nas
medies originais da temperatura (7 oC).

T (oC)
100

0
-100

20

40

60

80

100

P (mm Hg)

-200
-300

87

Mnimos Quadrados
Fig. 8.4. Grfico da temperatura T vs presso para um
gs, a volume constante. As barras de incerteza
estendem um desvio padro, x, em cada lado das cinco
pontos experimentais e a reta o encaixe dos mnimos
quadrados. O zero absoluto de temperatura foi
encontrado atravs da extrapolao da reta at seu ponto
de interseo no eixo de T.

largura y. Esta hiptese permite calcular a


probabilidade de se obter os valores
observados y1, y2, ..., yN na forma familiar
Prob(yi,...,yN) e X

i =1

At agora neste captulo, foram


consideradas as observaes de duas
variveis satisfazendo uma relao linear y = A
+ Bx e foi discutido o clculo das constantes A
e B. Este problema importante um caso
especial de uma maior classe de problemas de
adequao ou encaixe de curvas, muitos dos
quais podem ser resolvidos do mesmo modo.
Encaixe de um polinmio
Muitas vezes, uma varivel y esperada
ser expressa como um polinmio de uma
segunda varivel x,

y = A + Bx + Cx2 + Dx3 + ... + Hxn

(8.23)

Por exemplo, a altura y de um corpo caindo


esperada ser proporcional ao quadrado de t,
y = y0 + v0t gt2
onde y0 e v0 so a altura e a velocidade iniciais
e g a acelerao da gravidade. Dado um
conjunto de observaes das duas variveis,
pode se achar a melhor estimativas para as
constantes A, B, ..., H em (8.23), por um
raciocnio exatamente paralelo ao da seo
8.2.
Para simplificar as coisas, seja um
polinmio quadrtico,
y = A + Bx + Cx2

(8.24)

(Pode-se estender a anlise para o caso


geral, se desejvel). Suponha-se, como antes,
que se tenha uma srie de medies (xi, yi), i =
1, 2, ..., N, com todas yi com incertezas iguais e
todos xi sem incertezas (exatos). Para cada xi,
o correspondente valor verdadeiro de yi dado
por (8.24), com A, B e C como j
desconhecidos. Assume-se que as medies
de yi so governadas pelas distribuies
normais, cada uma centrada no valor
verdadeiro apropriado e todas com a mesma

/2

(8.25)

onde agora
2 =

8.7. Encaixe dos mnimos quadrados em


outras curvas

( y i A Bx i Cx i2 )2
2y

(8.26)

[Esta equao corresponde a eq. (8.5) para


o caso linear.] As melhores estimativas para A,
B e C so os valores para os quais Prob (y1,
y2,..., yN) mxima ou 2 mnimo. Derivando
2 com relao a A, B e C e igualando estas
derivadas a zero, obtm-se as trs equaes:
AN + Bx + Cx2 = y
Ax + Bx2 + Cx3 = xy

(8.27)

Ax2 + Bx3 + Cc4 = x2y


Para qualquer conjunto de medies (xi, yi),
estas equaes simultneas para A, B e C
(conhecidas como equaes normais) podem
ser resolvidas para se achar as melhores
estimativas para A, B e C. Com A, B e C
calculadas deste modo, as equaes y = A +
Bx + Cx2 so chamadas de encaixe
polinomial dos mnimos quadrados ou
regresso polinomial para as dadas
medies.
O mtodo de regresso polinomial
generaliza se facilmente para um polinmio de
qualquer grau, embora as equaes normais
resultantes se tornem mais complicadas para
polinmios de maior grau. Em princpio, um
mtodo semelhante pode ser aplicado a
qualquer funo f(x) que dependa de vrios
parmetros desconhecidos A, B, ...
Infelizmente, as equaes normais resultantes
que determinam as melhores estimativas para
A, B, ... podem ser difceis ou impossveis de
se resolver. Porm, um grande nmero de
problemas pode ser resolvido sempre,
principalmente os problemas em que a funo
y = f(x) depende linearmente dos parmetros A,
B, ... Estes incluem todos polinmios mas
tambm incluem muitas outras funes. Por
exemplo, em alguns problemas y pode ser a
soma de funes trigonomtricas, tais como
y = A sen x + B cos x

(8.28)

88

Mnimos Quadrados
Para esta funo e, de fato, para qualquer
funo que seja linear nos parmetros A, B, ...,
as equaes normais que determinam as
melhores estimativas para A, B, ... so
simultaneamente equaes lineares, que
podem sempre ser resolvidas.
Funes exponenciais
Uma das funes mais importantes na
engenharia a funo exponencial

em um eixo so espaadas logaritmicamente.


Tal papel permite plotar log y diretamente, sem
mesmo calcul-lo).
A utilidade da equao linear (8.30) no
encaixe dos mnimos quadrados aparente.
Se garantido que y e x satisfazem a relao y
= AeBx, ento as variveis z = ln y e x devem
satisfazer (8.30), ou
z = ln A + Bx

y=Ae

Bx

(8.29)

onde A e B so constantes. A intensidade I de


radiao, aps passar uma distncia x atravs
de uma blindagem, cai exponencialmente:
I = I0e-x
onde I0 a intensidade original e caracteriza
a absoro pela blindagem.
A carga eltrica em um capacitor em curto
circuito drena exponencialmente:
Q = Q0e-t

Se so feitas muitas medies (xi, yi), ento


para cada yi pode-se calcular zi = ln yi . Assim,
os pares (xi, zi) devem cair na curva (8.31).
Esta curva pode ser encaixada pela mtodo
dos mnimos quadrados para dar as melhores
estimativas para as constantes ln A (da qual se
determina A) e B.
Exemplo: Populao de bactrias
Muitas populaes (de gente, animais, ncleos
radioativos, bactrias, fungos, micrbios)
tendem a variar exponencialmente com o
tempo. Se uma populao N est diminuindo
exponencialmente, se escreve:

N = N0e-t/

onde Q0 a carga original e = 1/RC, onde R


e C so a resistncia e a capacitncia.
Se as constantes A e B em (8.29) so
desconhecidas, naturalmente procura-se
estim-las, baseando-se nas medies de x e
y. Infelizmente, a aplicao direta dos
argumentos anteriores conduz a equaes
para A e B que no podem ser
convenientemente resolvidas. Pode-se, porm,
transformar a relao no linear (8.29) entre y
e x em uma relao linear, para a qual se pode
aplicar o mtodo dos mnimos quadrados.
Para fazer esta linearizao desejada,
simplesmente se toma o logaritmo natural de
(8.29) para dar
ln y = ln A + Bx

(8.31)

(8.30)

V-se, portanto, que embora y no seja


funo linear de x, ln y o . Esta converso de
(8.29) no linear em uma linear (8.30) til em
muitos contextos, ao lado do mtodo dos
mnimos quadrados. Se se quer verificar a
relao (8.29) graficamente, ento um grfico
de y vs x produz uma curva que difcil de
identificar visualmente. Por outro lado, um
grfico de ln y vs x (ou log y vs x) deve dar uma
linha reta, que pode ser facilmente identificada.
(Tal grfico especialmente fcil quando se
usa um papel semi-log, em que as graduaes

onde chamada a vida mdia da populao


[muito relacionado com meia-vida, t, de fato,
t = (ln 2) ]. Um bilogo suspeita que uma
populao de bactrias est diminuindo
exponencialmente como em (8.32) e mede a
populao em trs dias consecutivos, obtendo
os resultados mostrados nas duas primeiras
colunas da Tab. 8.3. Com estes dados, qual
a melhor estimativa para a vida mdia ?
Tab. 8.3. Populao de bactrias

Tempo ti (dia)

Populao Ni

zi = ln Ni

153 000

11,94

137 000

11,83

128

11,76

Se N varia como em (8.32), ento a varivel z =


ln N deve ser linear em t:
z = ln N = ln N0 t/

(8.33)

Podem-se calcular os trs nmeros


zi = ln Ni (i = 0, 1, 2), mostrados na terceira

89

Mnimos Quadrados
coluna de Tab. 8.3. Usando estes nmeros,
faz-se o encaixe dos mnimos quadrados para
a linha reta (8.33) e acham-se as melhores
estimativas para os coeficientes ln N0 e (-1/):
ln N0 = 11,93
(-1/) = -0,089 dia-1
O segundo dos coeficientes implica na
melhor estimativa para a vida mdia
= 11,2 dias
O mtodo descrito atrativamente simples,
especialmente quando se dispe de uma
calculadora com a funo de regresso linear e
freqentemente usado. Mesmo assim, o
mtodo no parece muito lgico. A derivao
do encaixe dos mnimos quadrados para uma
linha reta y = A + Bx foi baseada na hiptese
que os valores medidos y1, y2, ..., yN tinham
incertezas iguais. Aqui, est se fazendo o
encaixe dos mnimos quadrados usando a
varivel z = ln y. Agora, se os valores medidos
yi so igualmente incertos, ento os valores zi =
ln yi no o so. De fato, da propagao de
incerteza se sabe que:

x =

dz
y
dy

(8.34)

Assim, se y o mesmo para todas as


medies, ento z varia (com z maior quando
y for menor). Evidentemente, a varivel z = ln y
no satisfaz a hiptese de iguais incertezas
para todas as medies, se y em si satisfaz.
A soluo deste problema direta. O
procedimento dos mnimos quadrados pode ser
modificado para permitir diferentes incertezas
nas medies, desde que as vrias incertezas
sejam conhecidas. Se as medies y1, y2, ..., yN
tem incertezas iguais, ento a eq. (8.34) diz
como as incertezas em z1, z2, ..., zN variam e
pode-se aplicar o mtodo dos mnimos
quadrados ponderados equao z = ln A +
Bx.
Na prtica, normalmente no se pode
garantir que as incertezas em y1, y2, ..., yN
realmente sejam constantes, de modo que se
possa talvez assumir que as incertezas sejam
constantes e usar o simples mnimo quadrado
no ponderado. s vezes, as variaes nas
incertezas so pequenas e o mtodo usado faz
pouca diferena. De qualquer modo, quando as

incertezas forem desconhecidas, a aplicao


direta do mtodo de encaixe dos mnimos
quadrados simples (no ponderado) um meio
simples e direto para conseguir razoveis (se
no melhores) estimativas para as constantes
A e B na equao y = AeBx, de modo que
frequentemente usado.
Regresso mltipla
Finalmente, at agora s foram discutidas
as aplicaes de duas variveis, y e x e sua
relao. Muitos problemas reais, porm, tm
mais de duas variveis a se considerar. Por
exemplo, o estudo da presso de um gs, a
presso depende do volume e da temperatura
e deve-se analisar a presso como funo de V
e T. O exemplo mais simples de tal problema
quando uma varivel, z, depende linearmente
de outras duas, x e y:

z = A + Bx + Cy

(8.35)

Este problema pode ser analisado por uma


generalizao direta do mtodo das duas
variveis. Quando se tem uma srie de
medies (xi, yi, zi), i = 1, 2, ..., N (com todos os
zi igualmente incertos e com xi e yi exatos),
ento se pode usar o princpio da mxima
probabilidade exatamente como na seo 8.2
para mostrar que as melhores estimativas para
as constantes A, B e C so determinadas pelas
equaes normais na forma:
AN + Bx + Cy = z
Ax + Bx2 + Cxy = xy

(8.36)

Ay + Bxy + Cy2 = yz
As equaes podem ser resolvidas para A,
B e C para dar o melhor encaixe para a relao
(8.35). Este mtodo chamado de regresso
mltipla, mltipla porque h mais de duas
variveis.

90

Mnimos Quadrados
Linha reta atravs da origem (y = Bx);
pesos iguais

Principais Definies e Equaes do


Captulo 8
Neste captulo, foram considerados N
pares de medies (x1, y1), ..., (xN, yN) de duas
variveis x e y. O problema colocado achar
os melhores valores dos parmetros da curva
que um grfico de y vs x esperado encaixar.
Assume-se que somente as medies de y
possuem incertezas, enquanto que as
incertezas em x so desprezveis. [Para o caso
em que ambas x e y possuem incertezas, ver a
discusso depois da eq. (8.17).] Vrias curvas
possveis podem ser analisadas e h duas
diferentes hipteses acerca das incertezas em
y. Os casos mais importantes so os seguintes:
Seja uma linha reta, y = A + Bx, com pesos
iguais e se y esperado cair sobre uma linha
reta, ento y = A + Bx e se as medies de y
todas tem a mesma incerteza, ento as
melhores estimativas para as constantes A e B
so:

x y x xy

B=

xy
x
2

Baseado nos pontos medidos a melhor


estimativa para a incerteza nas medies de y
:
1
( yi Bx i )2
N 1

y =

e a incerteza em B
y

B =

A=

Se y esperado cair sobre uma linha reta


passando pela origem, y = Bx, e se as
medies de y possuem todas a mesma
incerteza, ento a melhor estimativas para a
constante B :

[Ver (8.10)]

Encaixe ponderado para uma linha reta,


y = A + Bx

e
B=

N xy x y

[Ver (8.11)]

onde o denominador :
= N x 2

( x )

Se y esperado cair em uma linha reta


y = A + Bx e se os valores medidos de yi
possuem diferentes incertezas desconhecidas
i , ento se introduzem os pesos wi = 1/x2, e
as melhores estimativas para as constantes A
e B so

[Ver (8.12)]
A=

wx wy wx wxy

B=

w wxy wx wy

Baseando nos pontos observados, a


melhor estimativa para a incerteza nas
medies de y :
y =

1
( yi A Bx i )2
N2

B = y

[Ver (8.15)]
onde
= w wx 2 ( wx )2

As incertezas em A e B so:

A = y

[Ver (8.16)]

[Ver (8.17)]

91

Mnimos Quadrados
As incertezas em A e B so:

A =

wx

e
B =

Outras curvas
Se y esperado ser um polinmio em x,
como
y = A + Bx + Cx2 + ... + Hxn
ento um mtodo exatamente analogo ao
encaixe dos mnimos quadrados pode ser
usado, embora as equaes sejam muito
complexas se n grande. Curvas da forma
y = Af(x) + Bg(x) + ... + Hk(x)
onde f(x), g(x), ..., k(x) so funes conhecidas,
podem tambm ser manipuladas do mesmo
modo.
Se y esperado ser dado pela funo
exponencial,
y = AeBx
ento se pode linearizar o problema, usando a
varivel auxiliar z = ln(y), que satisfaz a
seguinte relao linear:
z = ln (y) = ln (A) + Bx

[Ver (8.31)]

Pode-se ento aplicar o encaixe dos


mnimos quadrados em z como funo de x.
Note-se, porm, que se as incertezas nos
valores medidos de y so todas iguais, o
mesmo certamente no verdade para os
valores de z. Ento, rigorosamente falando, o
mtodo de mnimos quadrados ponderados
deve ser usado.

Apostilas\Incerteza

JRTaylor7.doc

25 SET 98 (Substitui 30 JAN 98)

92

9. Covarincia e Correlao
para a incerteza no valor calculado de q(x, y)
a soma quadrtica.

9.1. Introduo
Este captulo introduz o importante
conceito de covarincia. Como este conceito
aparece naturalmente na propagao de
incerteza, a seo 9.1 comea com uma
rpida reviso de propagao da incerteza.
Esta reviso estabelece o estagio da seo
9.2, que define a covarincia e discute sua
funo na propagao da incerteza. Depois,
a seo 9.3 usa a covarincia para definir os
coeficientes de correlao linear para um
conjunto de pontos medidos (x1, y1), ..., (xN,
yN). Este coeficiente, chamado de r, fornece
uma medida de como os pontos encaixam
em uma linha reta da forma y = A + Bx; seu
uso descrito nas sees 9.4 e 9.5.

9.2. Reviso de propagao da


incerteza
Esta e a prxima seo fornecem uma
viso final na importante questo de
propagao da incerteza. Primeiro, foi
discutida a propagao da incerteza no
Captulo 3, onde foram tiradas vrias
concluses. Foi imaginada a medio de
duas quantidades x e y para calcular alguma
funo q(x,y), tal como q = x + y ou q = xy ou
ainda q = x2 sen y. [De fato, foi discutida a
funo q(x,y,...,z) de um nmero arbitrrio de
variveis x, y, ..., z. Por simplicidade, agora
sero consideradas apenas duas variveis.]
Um argumento simples sugeriu que a
incerteza no resultado de q dada por
q

q
q
x +
y
y
x

(9.1)

Segundo, foi obtida esta aproximao


para os casos especiais de somas,
diferenas, produtos e quocientes. Por
exemplo, se q a soma q = x + y, (9.1) se
reduz familiar q = x + y. O resultado
geral (9.1) foi derivado da eq. (3.43).
Depois se verificou que (9.1)
provavelmente uma superestimativa de q,
porque pode haver cancelamento das
incertezas em x e y. Foi dito, sem prova, que
quando as incertezas em x e y so
independentes e aleatrias, um melhor valor

q q
q = x + y
x y

(9.2)

Foi tambm estabelecido, sem prova, que


se as incertezas forem ou no forem
independentes e aleatrias, a frmula mais
simples (9.1) sempre d um limite superior
em q, isto , a incerteza q nunca pior que
a dada pela (9.1).
O Captulo 5 deu uma definio
apropriada e provou (9.2). Primeiro, foi visto
que uma boa medida da incerteza x em uma
medio dada pelo desvio padro x. Em
particular, foi visto que, se as medies de x
so normalmente distribudas, pode se estar
68% confiante que o valor medido caia dentro
de x do valor verdadeiro. Depois, foi visto
que se as medies de x e y so governadas
pelas distribuies normais independentes,
com desvios padro de x e y, os valores de
q(x, y) so tambm normalmente distribudos
com desvio padro
2

q q
q = x + y
x y

(9.3)

Este resultado justifica a equao (9.2).


Na seo 9.2, ser obtida uma frmula
precisa para a incerteza em q, que se aplica
se as incertezas em x e y forem
independentes e normalmente distribudas ou
no. Em particular, ser provada que (9.1)
sempre fornece um limite superior da
incerteza em q.
Antes de se obter estes resultados, ser
revisto o conceito de desvio padro. O desvio
padro x de N medies x1, x2, ..., xN foi
originalmente definido pela equao
1 N
(9.4)
2x =
( x i x )2
N i =1

Se as medies de x so normalmente
distribudas, ento no limite em que N
grande, a definio (9.4) equivalente a

93

Covarincia e Correlao
definio x como o parmetro largura que
aparece na funo de Gauss
2
2
1
e ( x X ) / 2x
x 2
que governa as medies de x. Como agora
se considera a possibilidade que as
incertezas em x possam ser no
normalmente distribudas, esta segunda
definio no mais vlida. Pode-se e ser
ainda definido x por (9.4). Se a distribuio
de incertezas normal ou no, esta definio
de x d uma medida razovel das incertezas
aleatrias na medio de x. (Como no
Captulo, foi suposto que todas as incertezas
sistemticas foram identificadas e reduzidas
a um nvel desprezvel, de modo que todas
as incertezas residuais so aleatrias).
A ambigidade permanece tanto quando
se usa a definio (9.4) de x ou a definio
melhorada com o fator N no denominador
substitudo por (N 1). Felizmente, a
discusso que se segue se aplica a qualquer
definio, desde que se continue consistente
na aplicao com uma ou outra. Por
convenincia, ser usada a definio (9.4),
com N no denominador, neste captulo.

qi = q(xi, yi)

(9.5)

Nesta expresso, as derivadas parciais


q/x e q/y so tomadas no ponto x = x , y
= y e so portanto as mesmas para todos i =
1, 2, ..., N. Com esta aproximao, a mdia
fica
1
N

q=

1
N

i =1

q( x, y) + x ( x x) + y ( y y)
i

i =1

Esta equao d q como a soma de trs


termos. O primeiro termo q( x, y ) e os
outros dois so exatamente iguais a zero.
[Por exemplo, segue-se da definio x que
(xi - x) = 0]. Assim, tem-se o resultado
tremendamente simples

9.3. Covarincia na propagao da


incerteza
Suponha que se tenha achado um valor
para a funo q(x, y), se tenha medido as
duas quantidades x e y vrias vezes e
obtidos N pares de dados (x1, y1), ..., (xN, yN).
Das N medies x1, x2, ..., xN, pode-se
calcular a mdia x e o desvio padro x do
modo usual. Do mesmo modo, das medies
y1, y2, ..., yN, pode-se computar y e y.
Depois, usando se os N pares de medies,
pode-se computar N valores da quantidade
de interesse:

q
q
(xi x) +
( yi y)
x
y

q( x, y ) +

q = q( x, y )

(9.6)

Ou seja, para achar a mdia q , deve-se


apenas calcular a funo q(x, y) no ponto x =
x, e y = y .
O desvio padro nos N valores q1, q2,...,
qN dado por
2q =

1
(qi q)2
N

Substituindo (9.5) e (9.6), acha-se que:


qi = q(xi, yi), (i = 1, 2, ..., N)
Dados q1, q2, ..., qN, pode-se agora
calcular sua mdia q , que a medida da
incerteza aleatrias nos valores qi.
Ser assumido, como usual, que todas as
incertezas sejam pequenas e assim que
todos os nmeros x1, x2, ..., xN, estejam
prximos de x e que todos y1, y2, ..., yN
estejam prximos de y . Pode-se ento fazer
a aproximao:

2q =

q
1
q
( xi x) +
( y i y )

N x
y

q 1
=
x N

+2

q 1
( x i x )2 +
y N

(y y)
i

q q 1
( xi x)( yi y)
x y N

94

Covarincia e Correlao
Os dois primeiros termos de (9.7) so
aqueles que aparecem na definio dos
desvios padro x e y. A soma final uma
novidade. chamada a covarincia de x e y
e denotada como

xy =

1
N

( x x)( y y)
i

(9.8)

i =1

Com esta definio, a eq. (9.7) para o


desvio padro q se torna
2

q
q q
q
2q = 2x + 2y + 2
xy
x y
x
y

(9.9)

Esta equao d o desvio padro q,


quer as medies de x e y sejam
independentes e normalmente distribudas ou
no.
O nome covarincia para xy (para duas
variveis x e y) corresponde ao nome
varincia para x2 (para uma varivel x).
Para enfatizar esta correspondncia, a
covarincia (9.8) geralmente denotada por
xy2, que no uma notao muito adequada,
porque a covarincia pode ser negativa. Uma
caracterstica conveniente da definio (9.8)
que xy tem a dimenso de xy, assim como
x tem a dimenso de x.
Se as medies de x e y so
independentes, pode se ver facilmente que,
aps muitas medies, a covarincia xy deve
tender para zero, pois qualquer que seja o
valor de yi, a quantidade xi - x tem a mesma
probabilidade de ser negativa ou positiva.
Assim, aps muitas medies, os termos
negativos e positivos em (9.8) provavelmente
se cancelam. No limite de infinitas medies,
o fator 1/N em (9.8) garante que xy zero.
(Aps um nmero finito de medies, xy no
ser exatamente igual a zero, mas deve ser
pequeno, se as incertezas em x e y
realmente so independentes e aleatrias.)
Com xy zero, a eq. (9.9) para q se reduz a
2

q
q
2q = 2x + 2y
x
y

resultado conhecido para incertezas


independentes e aleatrias. Se as medies

de x e y so dependentes, a covarincia xy
no necessariamente zero. Por exemplo,
fcil imaginar a situao em que uma
superestimativa de x ser sempre
acompanhada por uma superestimativa de y
e vice versa. Os nmeros (xi - x ) e (yi - y )
sempre tero o mesmo sinal (ambos
positivos ou ambos negativos) e seu produto
ser sempre positivo. Como todos os termos
na soma (9.8) so positivos, xy ser positivo
(e no zero), mesmo no limite com infinitas
medies. Do modo contrrio, pode-se ter
situaes em que uma superestimativa de x
sempre acompanhada de uma subestimativa
de y e vice versa e neste caso, os nmeros
(xi - x ) e (yi - y ) sempre tero sinal opostos
(um positivo e outro negativo) e xy ser
sempre negativo. Este caso ilustrado no
exemplo abaixo.
Quando a covarincia xy no zero
(mesmo no limite de infinitas medies), diz
se que as incertezas em x e y esto
correlacionadas. Neste caso, a incerteza q
em q(x, y) como dada em (9.9) no a
mesma quando se usa a frmula (9.10) para
incertezas independentes e aleatrias.
Exemplo: Dois ngulos com uma
covarincia negativa
Foram feitas cinco medies dos mesmos
dois ngulos e e encontrados os
resultados nas trs primeiras colunas da Tab.
9.1.
Tab. 9.1. Cinco medies de dois ngulos e
Medida

35

50

-2

-4

31

55

-2

-6

33

51

-1

32

53

-1

-1

34

51

-1

-1

( )( - )

Achar a mdia e o desvio padro de cada


um dos dois ngulos e ento achar a
covarincia como definida por (9.8), ou
seja.
1. Calcular a soma q = + .
(9.10)
2. Achar a melhor estimativa de
q como
dado por (9.6)
3. Achar o desvio padro q por (9.9)
4. Comparar o desvio padro com o que
seria obtido se fosse assumido

95

Covarincia e Correlao
(incorretamente) que as incertezas em
e sejam independentes e que q
foi dado por (9.10).
As mdias so achadas facilmente:
= 33

independentes entre si, ento de acordo com


(9.10), se obteria a resposta incorreta
q = 2 + 2y

2,0 + 3,2 = 2,3

= 52

Com estes valores, acham-se as


diferenas ( - ) e ( - ), como mostrado
na Tab. 9.1 e destes desvios se acham
facilmente:
2 = 2,0
2 = 3,2
[Foi usada (9.4), com N no denominador.]
Pode-se ver da Tab. 9.1 que altos valores
de parecem estar correlacionados com
baixos valores de e vice versa, por que
( ) e ( ) sempre tem sinais opostos.
Esta correlao significa que os produtos
( ) ( ), mostrados na ltima coluna
de Tab. 9.1 so todos negativos ou zero.
Assim, a covarincia com definida por
(9.8) negativa,
=

1
1
( )( ) = ( 12) = 2,4

N
5

A melhor estimativa para a soma q =


+ dada por (9.6) como
qestimado = q = + = 33 + 52 = 85
Para achar o desvio padro usando (9.9),
usam-se as duas derivadas parciais, que so
facilmente encontradas como q/ = q/ =
1. Deste modo, de acordo com (9.9),
q = 2 + 2y + 2

2,0 + 3,2 2 2,4 = 0,6

Se for omitida a correlao entre as


medies de e e elas forem consideradas

Pode se ver, deste exemplo, que uma


correlao do sinal correto pode causar uma
grande diferena em uma incerteza
propagada. Neste caso, pode se ver por que
h esta diferena. As incertezas em cada
ngulo e so aproximadamente um grau,
sugerindo que q = + deveria ter uma
incerteza de alguns graus. Mas, como foi
visto, as incertezas positivas em so
acompanhadas por incertezas negativas em
e vice versa. Assim, quando se somam e
, as incertezas tendem a se cancelar,
deixando uma incerteza apenas de frao de
um grau.

Probleminha rpido 9.1


So feitas trs medies de dois lados x
e y de um retngulo e obtidos os resultados
da Tab. 9.2. Achar as mdias x e y e depois
fazer uma tabela como a Tab. 9.1 para achar
as covarincia xy. Se for calculada q = x + y,
achar o desvio padro q usando a frmula
correta (9.9) e compar-la com o valor obtido
quando se ignora a covarincia e usando
(9.10). (Note que neste exemplo, altos
valores de x parecem se correlacionar com
altos valores de y e vice versa.
Especificamente, parece que a medio C
est superestimada e a medio A,
subestimada. Lembre-se tambm que com
apenas trs medies os resultados de
qualquer clculo estatstico apenas um guia
grosseiro das incertezas relacionadas.)
Tab. 9.2. Trs medies de x e y (mm)

Medio

25

33

27

34

29

38

Resp.: q = 3,7 inclui a covarincia e q = 2,7 ignora a


covarincia.

96

Covarincia e Correlao
Usando a frmula (9.9), pode-se derivar
um limite superior de q que sempre vlido.
fcil provar que a covarincia xy satisfaz a
chamada desigualdade de Schwarz
xy x y

(9.11)

Substituindo-se (9.11) em (9.9) para a


incerteza q, acha-se que
2

q
q q
q
xy
2x + 2y + 2
x
y
x y



2
q

q
q
y
= x +
y
x

ou seja,
q

q
q
x +
y
x
y

(9.12)

Com este resultado, tem-se estabelecido


finalmente o significado preciso da expresso
original

q
q
x +
y
x
y

(9.13)

para a incerteza q. Se adotado o desvio


padro q como medida da incerteza de q,
ento (9.12) mostra que a antiga expresso
(9.13) realmente o limite superior da
incerteza. Se as incertezas em x e y so
independentes e normalmente distribudas ou
no, a incerteza em q nunca exceder o lado
direito de (9.13). Se as medies de x e y so
correlacionadas de modo que |xy| = x y,
seu maior valor possvel de acordo com
(9.11), ento a incerteza em q pode
realmente ser to grande quanto mas nunca
maior que o dado por (9.13).
Em Metrologia, geralmente no se
consideram as covarincias das medies.
Assim, geralmente no se usa o resultado
(9.9) explicitamente. Se, porm, suspeita-se
que duas variveis x e y podem estar
correlacionadas, deve-se usar o limite (9.12),
em vez da soma quadrtica (9.10).

9.4. Coeficiente de correlao linear


A noo de covarincia xy introduzida na
seo 9.2 permite responder a questo
levantada no Captulo 8 de como um
conjunto de medies (x1, y1), ..., (xN, yN) de

duas variveis suporta a hiptese que x e y


sejam linearmente relacionados.
Suponha que sejam medidos N pares de
valores (x1, y1), ...., (xN, yN) de duas variveis
que se suspeita satisfazerem uma relao
linear da forma
y = A + Bx
Note se que x1, x2, ..., xN no so mais
medies de um nico nmero, como era
considerado nas duas sees anteriores,
mas so medies de N diferentes valores de
alguma varivel (por exemplo, N diferentes
correntes na sada de um transmissor para
diferentes valores de temperatura). O mesmo
se aplica a y1, y2, ..., yN.
Usando se o mtodo dos mnimos
quadrados, pode-se achar os valores de A e
B para a curva que melhor encaixa os pontos
(x1, y1), ..., (xN, yN). Se j se tem uma
estimativa confivel das incertezas nas
medies, pode se ver que os pontos
medidos caem razoavelmente prximos da
curva (comparados com as incertezas
conhecidas). Se eles caem, as medies
sustentam a suspeita que x e y sejam
linearmente relacionados.
Infelizmente, em muitas experincias,
obter uma estimativa confivel das incertezas
a priori difcil e devem se usar os dados em
si para decidir se as duas variveis parecem
ser linearmente relacionadas. Em particular,
h um tipo de experincia para a qual
impossvel conhecer a tamanho das
incertezas no incio. Este tipo de experincia,
que mais comum em cincias sociais do
que em metrologia, melhor explicada por
um exemplo.
Seja um professor ansioso em convencer
seus alunos que fazer o dever de casa ir
ajud-los a ir bem nos exames. Ele registra
os resultados dos deveres de casa e dos
exames e coloca estes resultados em um
grfico, como na Fig. 9.1 (notas de exames
vs notas de deveres de casa). Cada ponto (xi,
yi) mostra uma nota do estudante do dever de
casa (xi) e do exame (yi). O professor espera
mostrar que alta nota do exame tende a se
relacionar com alta nota no dever de casa e
vice versa (e o espalhamento dos pontos
sugere que isto aproximadamente acontece).
Este tipo de experincia no tem incertezas
nos pontos, pois as notas dos estudantes so
conhecidas exatamente. A incerteza est,
porm, na extenso em que as notas sejam
correlacionadas e isto deve ser decidido a
partir dos dados.
As duas variveis x e y podem estar
relacionadas por uma funo mais

97

Covarincia e Correlao
complicada do que uma simples reta y = A +
Bx. Por exemplo, h muitas leis fsicas que
levam a relaes da forma y = A + Bx + Cx2.
Mesmo assim, nesta seo a discusso ser
restrita ao problema mais simples de decidir
se um dado conjunto de pontos suporta a
hiptese de uma relao linear y = A + Bx.
A extenso em que um conjunto de
pontos (x1, y1), ...., (xN, yN) sustenta uma
relao linear entre x e y medida por um
coeficiente de correlao linear ou
simplesmente coeficiente de correlao,
r=

xy

(9.14)

xy

onde a covarincia xy e os desvios padro x


e y so definidos exatamente como antes,
nas eq. (9.8) e (9.4). [Note-se porm que
seus significados so diferentes. Por
exemplo, na seo 9.2, x1, x2, ..., xN eram
medies de um nmero e se estas
medies eram precisas, seria pequeno.
No presente caso x1, x2, ..., xN so medies
de diferentes valores de uma varivel e
mesmo que as medies sejam precisas, no
h razo para pensar que x seja pequeno.
Note-se tambm que alguns autores usam o
nmero r2, chamado de coeficiente de
determinao.
Substituindo as definies (9.8) e (9.4) em
(9.14), pode-se reescrever o coeficiente de
correlao como:
r=

( x x)( y y)
(x x) (y y)
i

(9.15)

y i y = B( x i x )
para cada i. Inserindo este resultado em
(9.15), acha-se que

(x x)
(x x) B (x x)
2

r=

B
= 1
B

(9.16)
Ou seja, se os pontos (x1, y1), ..., (xN, yN)
caem perfeitamente em uma linha, ento r =
1 e seu sinal determinado pela inclinao
da reta: r = 1 para B positivo e r = -1 para B
negativo. Se a linha for horizontal B = 0 e
(9.16) d 0/0, que uma indeterminao.
Felizmente, este caso especial no
importante, na prtica, porque ele
corresponde a y ser um constante,
independente de x. Mesmo quando as
variveis x e y realmente so linearmente
correlacionados, no se espera que os
pontos experimentais caiam todos
exatamente em uma linha. Assim, no se
espera que r seja exatamente 1. Na pratica,
espera-se um valor de r que seja prximo de
1, quando se acredita que x e y sejam
linearmente correlacionados.
Suponha-se, por outro lado, que no h
relao entre as variveis x e y. Qualquer
que seja o valor de yi, cada xi teria a mesma
probabilidade de estar acima ou abaixo de x .
Assim, os termos na soma

(x

x )( y i y )

Como ser mostrado diretamente, o


nmero r um indicador de quo bem os
pontos (xi, yi) se encaixam em uma linha reta.
um nmero entre 1 e 1. Se r prximo a
1, os pontos caem prximos a uma linha
reta, se r prximo de zero, os pontos no
tem correlao e tem pouca ou nenhuma
tendncia de cair em uma linha reta.
Para provar estas afirmaes, primeiro se
v que a desigualdade de Schwarz (9.11),
|xy| x y implica imediatamente que |r|
1 ou
-1 r 1
como se queria demonstrar. Agora, suponha
que os pontos (xi, yi) todos caiam exatamente
na linha y = A + Bx. Neste caso, yi = A + Bxi
para todos i e assim y = A + B x . Subtraindo
estas duas equaes, se v que

no numerador de r em (9.15) tem a mesma


probabilidade de ser positivos ou negativos.
Porm, os termos no denominador de r so
todos positivos. Assim, no limite de N
(nmero de medies) tendendo para infinito,
o coeficiente de correlao r ser zero. Com
um nmero finito de pontos de dados, no se
espera que r seja exatamente zero, mas, na
prtica se espera que ele seja muito
pequeno, quando as duas variveis forem
realmente no correlacionadas.
Se duas variveis x e y so tais que, no
limite de N tendendo para infinito, sua
covarincia xy seja zero (e assim r = 0), diz
se que as variveis so incorrelacionadas ou
incorrelatas. Se aps um nmero finito de
medies o coeficiente de correlao
pequeno, a hiptese que x e y sejam
incorrelatas sustentada.
Como exemplo, sejam as notas de exame
e de dever de casa mostradas na Tab. 9.3.
Um simples clculo mostra que o coeficiente

98

Covarincia e Correlao
de correlao para estes 10 pares de notas
r = 0,8. O professor conclui que este valor
razoavelmente prximo de 1 e ento pode
anunciar aos alunos que, por causa das
notas do dever de casa e dos exame
mostrarem boa correlao, importante fazer
o dever de casa.
Tab. 9.3. Notas dos estudantes
Estudante
i

Nota casa
xi

Nota exame
yi

1
2
3
4
5
6
7
8
9
10

90
60
45
100
15
23
52
30
71
88

90
71
65
100
45
60
75
85
100
80

questes so respondidas pelo seguinte


argumento.
Sejam duas variveis x e y realmente no
correlatas, ou seja, no limite de infinitamente
muitas medies, o coeficiente de correlao
r zero. Aps um nmero finito de medies,
r muito provavelmente no igual a zero.
Pode-se, de fato, calcular a probabilidade
que r exceda qualquer valor especfico. Esta
probabilidade escrita como
Prob(|r| ro)
e representa a probabilidade que N medies
de duas variveis no correlatas x e y dem
um coeficiente r maior que qualquer particular
ro. Como a correlao indicada por r
prximo de +1 ou de 1, considera-se a
probabilidade de dar o valor absoluto |r| ro.
Por exemplo, pode-se calcular a
probabilidade
Prob(|r| 0,8)

Se o professor tivesse obtido um


coeficiente de correlao prximo de zero,
ele ficaria numa posio embaraosa de ter
que mostrar que nas notas dos deveres de
casa no tem nenhuma correlao com as
notas dos exames. Se r tivesse dado prximo
de 1, ento a descoberta seria ainda mais
desconcertante, pois mostraria que os
deveres de casa atrapalham as notas dos
exames, ou seja, quem tivesse tirado nota
alta no dever de casa tenderia a tirar uma
nota baixa no exame.
Probleminha rpido 9.2.
Achar o coeficiente de correlao para os
dados do Probleminha rpido 9.1. Note-se
que estas medies mostram uma correlao
positiva, ou seja, alto valor de x corresponde
a alto valor de y e vice versa.

que, aps N medies de duas variveis no


correlatas x e y, o coeficiente de correlao r
seja, no mnimo, to grande quanto 0,8. O
clculo destas probabilidades muito
complicado e no ser visto aqui. Os
resultados para alguns valores significativos
dos parmetros so mostrados na Tab. 9.4.
Tab. 9.4. A probabilidade Prob(|r| ro) que N medies
de duas variveis no correlatas x e y produzam um
coeficiente de correlao com |r| ro Valores dados em
percentagem de probabilidades e espaos em branco
significam valores menores que 0,05%.

Resp.: r = 0,94

9.5. Significado quantitativo de r


O exemplo das notas de dever de casa e
do exame mostra claramente que ainda no
se tem uma resposta completa para a
questo acerca de como os dados sustentam
uma relao linear entre x e y. O professor
achou um coeficiente de correlao r = 0,8 e
julgou este valor razoavelmente prximo a 1.
Porm, como se pode decidir objetivamente o
que razoavelmente prximo a 1? Ser que
0,6 razoavelmente prximo? Ou 0,4? Estas

99

Covarincia e Correlao

ro\N

10

20

50

100

100

100

100

100

0,1

94

85

78

67

49

0,2

87

70

58

40

16

0,3

81

56

40

20

0,4

74

43

25

0.4

0,5

67

31

14

0,6

59

21

0,5

0,7

51

12

0,1

0,8

41

0,5

0,9

29

Embora no se tenha mostrado como as


probabilidades na Tab. 9.4 sejam calculadas,
pode-se entender seu comportamento geral e
coloc-las em uso. A primeira coluna mostra
o nmero de pontos de dados N. (No
exemplo, o professor registrou 10 notas, de
modo que N = 10). Os nmeros em cada
linha mostram a probabilidade em
percentagem que N medies de duas
variveis no correlatas forneam um
coeficiente r, no mnimo, to grande quando
o nmero no incio da linha. Por exemplo, se
v que a probabilidade que 10 dados no
correlatos dem |r| 0,8 apenas 0,5% (no
uma grande probabilidade). O professor pode
ento dizer que muito pouco provvel
(0,5%) que notas no correlatas tenham
produzido um coeficiente
|r| 0,8 que ele obteve. Em outras palavras,
muito provvel (99,5%) que as notas em
trabalho de casa e exames realmente sejam
correlatas.
Vrias caractersticas da Tab. 9.4
requerem comentrios.
1. Todas as entradas na primeira linha
so 100%, porque |r| sempre maior
ou igual a zero; assim a probabilidade
de encontrar |r| 0 sempre 100%.
2. Todas as entradas na ltima linha
so 0%, porque a probabilidade de
encontrar |r| 1 sempre 0%.
3. Os nmeros intermedirios variam
de acordo com o nmero de dados N.
Esta variao tambm facilmente
entendida. Se so feitas apenas trs
medies, a chance delas terem um
coeficiente de correlao com |r|

0,5, por exemplo, obviamente muito


alta (67%, de fato), mas se so feitas
20 medies e as duas variveis
realmente so no correlatas, a
chance de encontrar |r| 0,5 muito
pequena (2%).
Armado com as probabilidades na Tab.
9.4 (ou em uma tabela mais completa,
disponvel na literatura tcnica de
Estatstica), pode se agora ter a resposta
mais completa possvel para a questo de
quo bem N pares de valores (xi, yi)
sustentem uma relao linear entre x e y.
Dos pontos medidos, pode-se primeiro
calcular o coeficiente de correlao
observado ro (o ndice o significa observado).
Depois, usando a Tab. 9.4, pode-se achar a
probabilidade Prob(|r| ro) que N pontos no
correlatos tenham dado um coeficiente, no
mnimo, to grande quanto o coeficiente
observado ro. Se esta probabilidade
suficientemente pequena, conclui-se que
pouco provvel que x e y sejam no
correlatos e assim, muito provvel que x e y
sejam correlatos.
Tem-se ainda de escolher o valor da
probabilidade considerada como
suficientemente pequena. Uma escolha
razovel considerar uma correlao
observada ro como significativa se a
probabilidade de obter um coeficiente r com
|r| |ro| de variveis no correlatas menor
que 5%. Uma correlao , s vezes,
chamada altamente significativa se a
probabilidade correspondente menor que
1%. Qualquer que seja a escolha feita, no
de tem uma resposta definitiva que os dados
sejam ou no sejam correlatos; em vez disso,
tem-se uma medida quantitativa de quo
improvvel que eles sejam no correlatos.

Probleminha rpido 9.3


O professor da seo 9.3 ensina o
mesmo curso no ano seguinte e agora tem
20 alunos. De novo, ele registra as notas do
deveres de casa e dos exames e encontra
um coeficiente de correlao r = 0,6. Esta
correlao significativa ou altamente
significativa.
Resp.: Como Prob20(|r| 0,6) = 0,5%, a correlao significativa e
altamente significativa.

100

Covarincia e Correlao
9.6. Exemplos
Sejam trs pares de valores (xi, yi)
medidos e encontrado um coeficiente de
correlao de 0,7 (ou 0,7). Este valor
sustenta a hiptese que x e y so
linearmente relacionados?
Referindo-se Tab. 9.4, v se que se as
variveis x e y so completamente no
correlatas, a probabilidade 51% de obter |r|
0,7, quando N = 3. Em outras palavras,
inteiramente possvel que x e y sejam no
correlatos, de modo que no se tem
evidencia confivel de correlao. De fato,
com apenas trs medies, obter evidencia
de uma correlao seria muito difcil. Mesmo
um coeficiente observado to grande quanto
0,9 insuficiente, pois a probabilidade de
29% de obter |r| 0,9, de trs medies de
variveis no correlatas.
Se achada uma correlao de 0,7 de
seis medies, a situao um pouco
melhor, mas ainda no suficientemente boa.
Com N = 6, a probabilidade de achar |r| 0,7
de variveis no correlatas 12%. Esta
probabilidade no suficientemente pequeno
para excluir a possibilidade que x e y sejam
no correlatos.
Por outro lado, se achada uma
correlao de r = 0,7 com 20 medies, temse uma forte evidncia de uma correlao,
porque quando
N = 20 a probabilidade de se ter |r| 0,7 de
duas variveis no correlatas de somente
0,1%. Por qualquer padro, isto muito
pouco provvel e pode-se com confiana
dizer que uma correlao indicada. Em
particular, a correlao pode ser chamada
altamente significativa porque a probabilidade
associada menor que 1%.

101

Covarincia e Correlao

Principais Definies e Equaes


do Captulo 9
Covarincia
Dados N pares de medies
(x1, y1),..., (xN, yN) de duas quantidades x e y,
define-se sua covarincia como:

xy =

1
N

( x x)( y y)
i

[Ver (9.8)]

Valores de r prximos de 1 ou 1 indicam


forte correlao linear; valores prximos de 0
indicam pequena ou nenhuma correlao. A
probabilidade ProbN(|r| ro) que N medies
de duas variveis no correlatas dem um
valor de r maior que qualquer valor
observado ro tabulada na Tab. 9.4. Quanto
menor a probabilidade, melhor a evidncia
que as variveis x e y realmente sejam
correlatas. Se a probabilidade menor que
5%, diz se que a correlao significativa; se
for menor que 1% diz se que a correlao
altamente significativa.

i =1

Se agora estes valores medidos so


usados para calcular uma funo q(x, y), o
desvio padro de q dado por:
2

q
q q
q
xy
= 2x + 2y + 2
x y
x
y
2
q

[Ver (9.9)]
Se as incertezas em x e y so
independentes, ento xy = 0 e esta equao
se reduz frmula usual para a propagao
da incerteza. Se as incertezas so
independentes ou no, a desigualdade de
Schwarz (9.11) estabelece o limite superior:

q
q
y
x +
y
x

[Ver (9.12)]

Coeficiente de correlao
Dadas N medies (x1, y1), ..., (xN, yN) de
duas variveis x e y, define-se o coeficiente
de correlao r como

r=

xy
xy

( x x)( y y)
(x x) (y y)
i

[Ver (9.15)]

Uma forma equivalente, que normalmente


mais conveniente,
r=

x y Nx y
( x Nx )( y Ny
i

2
i

2
i

)
Apostilas\Incerteza

JRTaylor8.doc

30 JAN 98 (Substitui 01 JAN 98)

102

Distribuio Binomial

10. Distribuio Binomial


10.1. Introduo
A distribuio de Gauss ou normal o
nico exemplo de uma distribuio estudada
at agora. Neste captulo ser vista a
distribuio binomial e no prximo, a
distribuio de Poisson

10.2. Distribuies
O Captulo 5 introduziu a idia de
distribuio, funo que descreve a proporo
de vezes que uma medio repetida fornece
cada um de seus vrios possveis resultados.
Por exemplo, pode-se fazer N medies do
perodo T de um pndulo e achar a distribuio
dos vrios valores medidos de T ou se pode
medir as alturas h de N baianos e achar a
distribuio das vrias alturas medidas.
Depois se introduziu a noo de
distribuio limite, a distribuio que seria
obtida no limite em que o nmero de medies
N se tornasse muito grande. A distribuio
limite pode ser vista como mostrando a
probabilidade que uma medio assuma
qualquer um dos valores possveis: a
probabilidade que uma medio do perodo
fornea qualquer valor particular T; a
probabilidade que um baiano (escolhido
aleatoriamente) tenha uma particular altura de
1,70 m. Por isso, a distribuio limite tambm
chamada de distribuio probabilidade.
Uma das muito possveis distribuies
limites, a nica que j foi discutida, a
distribuio normal ou de Gauss, que descreve
a distribuio de resultados para qualquer
medio sujeita a muitas fontes de incertezas
que so todas aleatrias e pequenas. Como
tal, a distribuio de Gauss a mais importante
de todas as distribuies limites para o
metrologista. Mesmo assim, vrias outras
distribuies tem grande importncia prtica ou
terica e sero apresentadas duas agora.
Este captulo descreve a distribuio
binomial, que de grande importncia prtica
para o metrologista. Sua simplicidade a torna
uma introduo excelente para muitas
propriedades de distribuies e ela
teoricamente importante, porque se pode
derivar dela a de Gauss.

10.3. Probabilidade no lanamento de


dados
A distribuio binomial pode ser melhor
descrita por um exemplo. Seja a experincia de
lanar trs dados e registrar o nmero de azes
sados. Os resultados possveis da experincia
so os resultados 0, 1, 2 ou 3 dados. Se a
experincia repetida um nmero muito
grande de vezes, acha-se a distribuio limite,
que ir dizer a probabilidade que em qualquer
um lanamento dos trs dados, se obtenha
azes, onde = 0, 1, 2 ou 3.
Esta experincia suficientemente simples
que se pode facilmente calcular a probabilidade
de quatro possveis sadas. Observa-se,
primeiro, que assumindo os dados honestos, a
probabilidade de sair um s quando lanando
um dado 1/6. Seja agora jogar trs dados e
achar a probabilidade de se obter trs azes (
= 3). Como cada dado separada tem
probabilidade de dar um s igual a 1/6, e como
os trs lanamentos so independentes, a
probabilidade para trs azes
3

1
1
Prob (3 azes em 3 dados) = =
216
6

= 0,005 = 0,5%
O clculo da probabilidade para dois dados
( = 2) um pouco mais difcil porque se pode
obter dois azes em trs dados de vrios
modos:
1. A, A e no A (1o e 2o lanamentos)
2. A, no A e A (1o e 3o lanamentos)
3. no A, A e A (2o e 3o lanamentos)
Seja a probabilidade de obter dois azes em
qualquer ordem definida, por exemplo,
(A, A e no ). A probabilidade para o primeiro
dado dar s 1/6 e para o segundo dar s
tambm 1/6 mas a probabilidade para o
terceiro no dar s de 5/6. Assim, a
probabilidade para dois azes nesta ordem
determinada de
2

1
5
Prob (A, A, no A) =
6
6

103

Distribuio Binomial
= 0,069 = 2,3%
A probabilidade para dois azes em
qualquer outra ordem definida a mesma.
Finalmente, h trs ordens diferentes para se
obter dois azes.
Prob (2 azes em 3 lanamentos) =
2

1
5
= 3 =
6
6

(10.1)

= 0,069 = 6,9%
Do mesmo modo, obtm-se as
probabilidades para se obter um s em trs
lanamentos
Prob (1 s em 3 lanamentos) =
2

1 5
3 =
6 6

= 0,347 = 34,7%
e para sair nenhum s em 3 lanamentos:
3

5
Prob (0 s em 3 lanamentos) = =
6

Fig. 10.1. Probabilidade de obter azes lanando trs


dados. Esta funo a distribuio binomial Bn,p(), com
n=3 e p=1/6.

10.4. Definio da distribuio binomial


Para descrever a distribuio binomial
geral, preciso introduzir alguma terminologia.
Seja fazer n testes independentes, tais como
jogar n dados, lanar n moedas ou testar n
produtos finais. Cada teste pode ter vrias
sadas: o dado pode mostrar qualquer um lado
de 1 a 6, a moeda pode mostrar cara ou coroa,
um produto final pode estar bom ou mau. A
sada de interesse chamada de sucesso.
Assim, sucesso pode ser obter um s em um
dado ou uma coroa numa moeda ou ter um
produto rejeitado. Denota-se por p a
probabilidade de sucesso em qualquer teste e
por q = 1 p a de falha (ou seja, obter uma
sada diferente da de interesse). Assim, p = 1/6
para se obter um s em um dado, p = para
coroa em uma moeda e p poderia ser de 5%
para se obter um produto rejeitado na linha de
inspeo.
Armado com estas definies , pode-se
agora calcular a probabilidade de obter
sucessos em n testes. Um clculo mostra que
esta probabilidade dada pela chamada
distribuio binomial:
Prob ( sucessos em n testes) = Bn,p()
=

n(n 1)...(n + 1) n
p q
1 2 ...

(10.2)

= 0,579 = 57,9%
As concluses numricas podem ser
resumidas desenhando a distribuio
probabilidade para o nmero de azes obtido
quando jogando trs dados, como na Fig. 10.1.
Esta distribuio um exemplo da distribuio
binomial.

Aqui, a letra B significa binomial; os ndices


n e p em Bn,p() indicam que a distribuio
depende de n, nmero de testes feitos e p,
probabilidade de sucesso em cada teste.
A distribuio (10.2) chamada de
distribuio binomial por causa de sua ligao
com a bem chamada expanso binomial.
Especificamente, a frao em (10.2) o
coeficiente binomial, geralmente denotado
n n(n 1)...(n +1)
=
=
1 2 ...

57,9%
50%

(10.3)

34,7%

=
6,9%

n!
! (n )!

(10.4)

0,5%

0%

onde foi introduzida a til notao fatorial:


n! = 1 x 2 x ... x n
0

104

Distribuio Binomial
[Por conveno, 0! = 1 e n =1.]
0

O coeficiente binomial aparece na


expanso binomial
(p + q)n = pn + npn-1q + ... + qn
n

p q

(10.5)

=0

que vale para quaisquer dois nmeros p e q e


qualquer inteiro positivo n.
Com a notao (10.3), pode-se reescrever
a distribuio binomial em forma mais
compacta

Distribuio binomial

Exemplo: lanamento de quatro moedas


Suponha o lanamento de quatro moedas
(n = 4) e a contagem de vezes em que cara
obtida, . Qual a probabilidade de se obter os
vrios valores possveis: = 0, 1, 2, 3, 4?
Como a probabilidade de sair cara em um
lanamento de , a probabilidade requerida
simplesmente a distribuio binomial Bn,p( ),
com n = 4, p = q = .
4 1
Prob ( caras em 4 jogadas) =
n 2

Estas probabilidades so facilmente


calculadas. Por exemplo,
4

Prob (n sucessos em n testes) = Bn,p()

1
Prob (0 caras em 4 jogadas) = 1 =
2

n
= p qn

= 0,0625 = 6,25%
(10.6)

onde, como usual, p denota a probabilidade de


sucesso em uma tentativa e q = 1 p, a
probabilidade de falha.
A obteno do resultado (10.6)
semelhante ao exemplo do lanamento de
dados em (10.1),
Prob (2 azes em 3 testes) =

37,5%
25,0%

(10.7)

De fato, se foi estabelecido n = 2, n = 3 e p


= 1/6, obtm-se precisamente (10.7), como
pode ser demonstrado. Alm do mais, o
significado de cada fator em (10.6) o mesmo
que do correspondente fator em (10.7). O fator
p a probabilidade de obter todos sucessos
em qualquer teste definido e qn- a
probabilidade de falhar nos restantes n
testes. O coeficiente binomial n facilmente
0

mostrado ser o nmero de ordens diferentes


em que pode haver sucessos em n testes.
Isto estabelece que a distribuio binomial
(10.6) realmente a probabilidade reclamada.

25,0%
6,25%

6,25%
0%
0

1 5
3
6 6

50%

Fig. 10.2. A distribuio binomial Bn,p() com n = 4, p = .


Ela d a probabilidade de se obter caras quando se
lanam quatro moedas.

Todas as cinco probabilidades esto


mostradas na Fig. 10.2. V-se que o nmero
mais provvel de caras = 2, como era
esperado. Aqui, as probabilidades so
simtricas em relao ao valor mais provvel.
Ou seja, a probabilidade para trs caras a
mesma para uma cara e a probabilidade para
quatro a mesma para nenhuma cara. Como
ser visto, esta simetria s ocorre quando p =
.

105

Distribuio Binomial

Probleminha rpido 10.1.


Se for retirada uma carta aleatoriamente de
um baralho com 52 cartas, a probabilidade de
se obter qualquer um dos quatro naipes .
Se retirada uma carta, substituindo esta carta
em cada tirada, qual a probabilidade de
(a) tirar trs cartas de copas ()? Resp. 1,6%
(b) tirar exatamente duas de copas? Resp.
14,1%
(c)

tirar duas ou mais cartas de copas?.


15,6%

10.5. Propriedades da distribuio


binomial
A distribuio binomial Bn,p( ) d a
probabilidade de se obter n sucessos em
vezes, quando p a probabilidade de sucesso
em uma nica vez. Se a experincia completa
repetida, consistindo de n testes, muitas
vezes, ento natural perguntar qual o nmero
mdio possvel de sucessos. Para encontrar
esta mdia, somam-se todos os valores
possveis de n, cada um multiplicado por sua
probabilidade:
=

n,p

( )

(10.8)

nmero mais provvel de sucessos = 0 e a


probabilidade diminui continuamente para =
1, 2 e 3. Tambm, o nmero mdio de
sucessos ( = 0,5) aqui no o mesmo que o
nmero mais provvel de sucessos ( = 0).
interessante comparar a distribuio
binomial Bn,p( ) com a distribuio mais
familiar, a de Gauss, GX,(x). Talvez a maior
diferena que a experincia descrita pela
distribuio binomial tem sadas dadas por
valores discretos, = 1, 2, ..., n, enquanto as
sadas da distribuio de Gauss so dadas por
valores contnuos da quantidade medida x. A
distribuio de Gauss simtrica, com o pico
centrado no valor mdio x = X, que significa
que o valor mdio X tambm o mais provvel
[para o qual a GX,(x) mxima]. Como visto, a
distribuio binomial simtrica somente
quando p = e, em geral, o valor mdio no
coincide com o valor mais provvel.
Aproximao gaussiana para a distribuio
binomial
Mesmo com suas diferenas, as
distribuies binomial e de Gauss tm uma
importante ligao. Se considerada a
distribuio binomial Bn,p( ) para qualquer
valor fixo de p, ento quando n grande,
Bn,p( ) se aproxima muito da distribuio de
Gauss GX,(x) com a mesma mdia e mesmo
desvio padro, ou seja,

=0

Bn,p( ) GX,(x)

e facilmente calculada como:


= np

(10.9)

Ou seja, se as sries de n tentativas


repetida vrias vezes, o nmero mdio de
sucesso ser a probabilidade de sucesso em
uma tentativa (p) vezes n, como seria
esperado.
Do mesmo modo, pode-se calcular o desvio
padro no nmero de sucessos, dando:
= np(1 p)

(10.10)

Quando p = (como no lanamento de


moeda), o nmero mdio de sucessos n/2.
Mais ainda, fcil provar para p = que
Bn, ( ) = Bn, (n - )

(10.11)

Ou seja, a distribuio binomial com p =


simtrica em relao mdia n/2, como visto
na Fig. 10.2.
Em geral, quando p , a distribuio
binomial no simtrica. Por exemplo, a
Fig. 10.1 claramente no simtrica e o

(n grande)

(10.12)

com
X = np e = np(1 p)
A eq. (10.12) considerada a aproximao
da gaussiana para a distribuio binomial
No ser provado aqui, mas sua verdade
claramente ilustrada na Fig. 10.3, que mostra
como a distribuio binomial para p = e para
trs valores sucessivamente grandes de n (n =
3, 12 e 48). Superposta em cada distribuio
binomial est a distribuio gaussiana com a
mesma mdia e mesmo desvio padro. Com
apenas trs testes, a distribuio binomial
muito diferente da correspondente distribuio
gaussiana. Em particular, a distribuio
binomial nitidamente assimtrica, enquanto a
distribuio gaussiana perfeitamente
simtrica em relao a sua mdia. Porm, para
n = 12, a assimetria da distribuio binomial
muito menos pronunciada e as duas
distribuies esto muito prximas entre si.
Com n = 48, a diferena entre a binomial e a
correspondente distribuio gaussiana

106

Distribuio Binomial
mnima e na prtica as duas podem ser
consideradas iguais.

Para quase todas as aplicaes, esta


aproximao excelente.
A utilidade da aproximao gaussiana at
mais obvia quando se quer a probabilidade de
vrias sadas. Por exemplo, a probabilidade de
obter 23 ou mais caras em 36 lanamentos
Prob (23 ou mais caras) =
Prob (23 caras) + Prob (24 caras) + ... + Prob
(36 caras)

Fig. 10.3. As distribuies binomiais para p = e n = 3,


12 e 48. A curva contnua superposta em cada
desenho a funo de Gauss com a mesma mdia
e o mesmo desvio padro.

A distribuio binomial poder ser


aproximada pela distribuio gaussiana,
quando n for muito grande, muito til, na
prtica. Clculo da funo binomial com n
maior que 20 muito trabalhoso, enquanto que
o clculo da funo de Gauss sempre muito
simples, quaisquer que sejam os valores de X
e . Para ilustrar isto, seja a probabilidade de
se conseguir 23 caras em 36 lanamentos de
uma moeda. Esta probabilidade dada pela
distribuio binomial B36, (). Assim,
Prob(23 caras em 36 jogadas) = B36, (23).
(10.14)
=

36! 1

23!13! 2

36

(10.15)

que, com um clculo complicado d


Prob (23 caras) = 3,36%
Por outro lado, como a mdia da
distribuio np = 18 e o desvio padro
= np(1 p) = 3, pode-se aproximar (10.14) pela
funo de Gauss G18,3(23) e um simples
clculo d
Prob (23 caras) G18,3(23) = 3,32%

uma soma tediosa para se calcular


diretamente. Se a distribuio binomial
aproximada por uma gaussiana, porm, ento
a probabilidade facilmente achada. Como o
clculo das probabilidades gaussianas trata
como uma varivel contnua, a probabilidade
para = 23, 24, ..., 36 mais bem calculada
como ProbGauss(22,5), a probabilidade para
qualquer 22,5. Agora, = 22,5 1,5 desvios
padro acima do valor mdio, 18. (Lembrar, =
3, ento 4,5 = 1,5 ). A probabilidade de um
resultado mais que 1,5 acima da mdia iguala
a rea sob a funo de Gauss mostrada na Fig.
10.4. Ela facilmente calculada com a ajuda
da tabela no Apndice B e se acha
Prob (23 ou mais caras) ProbGauss ( X +
1,5 )
= 6,7%
(Este valor prximo do valor exato de 6,6%).

Fig. 10.4. A probabilidade de um resultado ser maior que


1,5 acima da mdia a rea hachuriada sob a
curva de Gauss.

10.6. Distribuio de Gauss para


incertezas aleatrias
No captulo 5, foi dito que uma medio
sujeita a muitas pequenas incertezas aleatrias
era distribuda normalmente. Agora, h
condio de se provar esta afirmao, usando
um modelo simples para o tipo de medio
considerado.
Seja a medio de uma quantidade x cujo
valor verdadeiro X. Assume-se que as
medies so sujeitas a incertezas
sistemticas desprezveis mas h n fontes

107

Distribuio Binomial
independentes de incerteza aleatria (efeitos
de paralaxe, tempos de reao, condies
ambientais, operador). Para simplificar a
discusso, admite-se que todas estas fontes
produzam incertezas aleatrias do mesmo
tamanho fixo . Isto , cada fonte de incerteza
empurra o resultado para cima ou para baixo
por e estas duas probabilidades ocorrem com
igual probabilidade p = .Por exemplo, se o
valor verdadeiro X e se h apenas uma fonte
de incerteza, os resultados possveis so
x=X
x=X+

funes de Gauss com o mesmo centro e largura


(As escalas verticais so diferentes nos trs
grficos.)

Esta distribuio ilustrada na Fig. 10.5


para n = 1, 2 e 32.
Agora pode-se afirmar que, se o nmero de
fontes de incerteza, n, grande e o tamanho
das incertezas individuais, , pequeno, ento
as medies so normalmente distribudas.
Sendo mais preciso, nota-se que o desvio
padro da distribuio binomial x =
np(1 p) =

ambos com a mesma probabilidade.


Se houver duas fontes de incerteza, uma
medio poderia fornecer
x = X 2 (se as duas fontes forem
negativas)
x = X (duas fontes de incertezas se
cancelam)
x = X + 2 (se as duas fontes forem
positivas)
Estas possibilidades so mostradas nas
Fig. 10.5 (a), (b) e (c).
Em geral, se houver n fontes de incerteza,
os resultados cairo na faixa de
x = X n a x = X + n

n / 4 . Assim, de acordo com

(10.16), o desvio padro das medies de x


x = 2 = n . Por conseguinte, faz-se n

0, de modo que x = n permanece


e
fixo. Duas coisas acontecem com o resultado:
1. a distribuio binomial se aproxima da
distribuio gaussiana com centro em X
e largura x.
0, os resultados possveis
2. Quando
da medio se tornam mais prximos,
de modo que a distribuio discreta se
aproxima de uma contnua, que
precisamente a esperada distribuio
gaussiana.

10.7. Aplicaes e teste de hiptese

Em uma da medio, se fontes


acontecerem de dar incertezas positivas e (n ) incertezas negativas, o resultado ser:
x = X + (n - ) (10.16)
= X + (2 - n)
A probabilidade de este resultado ocorrer
exatamente a probabilidade binomial
Prob( incertezas positivas) = Bn, ()
(10.17)
Assim, os resultados possveis da medio
so simetricamente distribudos em torno do
valor verdadeiro X e as probabilidades so
dadas pela funo binomial (10.17).

(a)
(b)
(c)
Fig. 10.5. Distribuio de medies sujeitas a n incertezas
aleatrias de tamanho e, para n = 1, 2 e 32. As
curvas continuas superpostas sobre (b) e (c) so as

Assim que se sabe como os resultados de


uma experincia so distribudos, pode-se
questionar se os resultados reais da
experincia foram distribudos como esperado.
Este tipo de teste de uma distribuio uma
tcnica importante na metrologia e mesmo em
outras cincias exatas, biolgicas e sociais. Um
teste importante, do 2 (qui quadrado),
assunto do Captulo 12. Aqui, sero dados dois
exemplos de um teste mais simples que pode
ser aplicado a certos problemas envolvendo a
distribuio binomial.
Teste de uma graxa de ski
Seja um fabricante de graxa de ski, que diz
ter desenvolvido uma nova graxa que reduz
grandemente o atrito entre o ski e a neve. Para
testar esta afirmao pode-se tomar 10 pares
de skis e passar graxa neles. Ento, mantmse corridas entre os skis tratados e os no
tratados, deixando-os deslizar abaixo de uma
rampa coberta de neve.
Se os skis tratados ganharem todas as 10
corridas, tem-se obviamente um resultado
claro, mas mesmo quando se faz isso, deve-se
ter uma medida quantitativa da fora desta
evidncia. Assim, devem ser levantadas duas
questes:
1. como se pode quantificar a evidencia
que a graxa funciona (ou no funciona)?

108

Distribuio Binomial
2. onde se coloca a linha divisria? Se os
skis tratados ganharam 9 das 10
corridas, este resultado conclusivo?
Se fossem 8 corridas? Ou 7?
Precisamente estas questes aparecem
em vrios testes estatsticos similares. Se se
quer testar a eficcia de um fertilizante, se
poderia organizar corridas entre plantas
tratadas e no tratadas. Para prever que
candidato vai ganhar a eleio, pode-se
escolher uma amostra aleatria de eleitores e
provocar corridas entre os candidatos com os
participantes da amostra. Tambm, pode-se
testar a ao de remdio entre vrios
pacientes.
Para responder as questes, deve se
decidir mais precisamente o que se espera dos
testes. Na terminologia aceita, deve-se
formular uma hiptese estatstica. No exemplo
da graxa do ski, a hiptese mais simples a
hiptese nula, que a nova graxa realmente no
faz diferena. Fazendo esta hiptese, pode-se
calcular a probabilidade dos vrios resultados
possveis do teste e ento julgar a significncia
de um resultado particular.
Suponha-se que a hiptese tomada que a
graxa do ski no faz diferena. Em qualquer
uma corrida, os skis tratados e no tratados
devem ter a mesma probabilidade de ganhar,
ou seja, a probabilidade para um ski tratado
ganhar
p = . A probabilidade que os skis tratados
ganham das 10 corridas ento a
probabilidade binomial:
Prob( vitrias em 10 corridas) = B10, ()
10

10!
1

! (10 )! 2

(10.18)

De acordo com (10.18), a probabilidade


que os skis tratados ganhem todas as 10
corridas
Prob (10 vitrias em 10 corridas) = ()10 =
0,1%
(10.19)
Isto , se a hiptese de nulo correta, os
skis tratados teriam muito pequena
probabilidade de ganhar todas as 10 corridas.
Pensado de modo contrario, se os skis tratados
ganharam todas as 10 corridas, a hiptese de
nulo pouco provvel de ser correta. De fato, a
probabilidade (10.19) to pequena, que se
pode dizer a evidncia em favor da graxa
altamente significativa.
Suponha-se agora que os skis tratados
tenham ganho 8 de 10 corridas. Aqui, pode-se

calcular a probabilidade de oito ou mais


vitrias:
Prob (8 ou mais vitrias em 10 corridas) =
= Prob (8 vitrias) + Prob (9 vitrias) + Prob
(10 vitrias) = 5,5%
10.20)
Para os skis tratados ganharem oito ou
mais corridas ainda pouco provvel (5,5%),
mas a probabilidade no to pequena como
era de ter 10 vitrias em 10 corridas (0,1%).
Para decidir que concluso tirar das oito
vitrias, deve-se reconhecer que h duas
alternativas, na realidade:
1. a hiptese de nulo correta (a graxa
no faz diferena) mas, pela
probabilidade, aconteceu um evento
pouco provvel (os skis tratados
ganharam 8 corridas em 10).
2. a hiptese de nulo falsa e a graxa faz
diferena.
Em teste estatstico, por tradio, toma-se
uma probabilidade definida (por exemplo, 5%)
para definir o limite, abaixo do qual um evento
considerado inaceitavelmente improvvel. Se
a probabilidade da sada real (oito ou mais
vitrias, no exemplo) estiver abaixo deste
limite, escolhe se a alternativa (2), rejeita a
hiptese e diz que o resultado da experincia
foi significativo.
Por consenso, diz que um resultado
significativo se sua probabilidade menor que
5% e considerada altamente significativa se
sua probabilidade menor que 1%. Como a
probabilidade (10.20) 5,5%, v se que oito
vitrias entre dez para os skis engraxados no
so suficientes para dar uma evidncia
significativa que a graxa funciona. Por outro
lado, se foi visto que a probabilidade de dez
vitrias em dez corridas de 0,1% e como este
valor menor que 1%, pode-se dizer que dez
vitrias constitui uma evidncia altamente
significativa que a graxa ajuda.
Procedimento geral
Os mtodos do exemplo anterior podem ser
aplicados a qualquer conjunto de n testes
(chamados de corridas) semelhantes mas
independentes, cada um deles com as mesmas
duas sadas possveis, sucesso ou falha.
Uma hiptese formulada, aqui
simplesmente um valor assumido para a
probabilidade p de sucesso em qualquer um
teste. Este valor assumido de p determina o
nmero mdio esperado de sucessos, = np,
em n testes. (Como usual, = np o nmero
medido de sucessos esperados se os n testes
forem repetidos muitas vezes). Se o nmero
real de sucessos, , nos n testes prximo de

109

Distribuio Binomial
np, no h evidncia contra a hiptese. (Se os
skis engraxados ganham cinco de dez corridas,
no h evidncia que a graxa faa qualquer
diferena). Se apreciavelmente maior que
np, calcula-se a probabilidade (dada uma
hiptese) de obter ou mais sucessos. Se esta
probabilidade menor que o nvel de
significncia escolhido (por exemplo, 5% ou
1%), argumenta-se que o nmero observado
inaceitavelmente improvvel (se a hiptese
correta) e assim a hiptese deve ser rejeitada.
Do mesmo modo, se o nmero de sucessos
apreciavelmente menor que np, pode-se
argumentar similarmente, exceto que se pode
calcular a probabilidade de obter ou menos
sucessos.
Como esperado, este procedimento no
fornece uma simples resposta que a hiptese
certamente verdade ou certamente falsa. Mas,
ele d uma medida quantitativa de quo
razovel o resultado, sob o ponto de vista da
hiptese, de modo que se pode escolher um
objetivo, porm arbitrrio, critrio para rejeio
da hiptese. Quando um tcnico estabelece
concluses baseadas em seu modo de pensar,
ele deve estabelecer claramente o critrio
usado e a probabilidade calculada, de modo
que os leitores possam julgar, por eles, se as
concluses so razoveis ou no.
Pesquisa eleitoral
Como um segundo exemplo, seja uma
eleio entre dois candidatos, A e B. Suponha
que o candidato A reivindica que uma pesquisa
extensiva estabeleceu que ele favorito por
60% do eleitorado e suponha que o candidato
B queira verificar este resultado (na esperana
de mostrar que o candidato A tem muito menos
votos que 60%).
Aqui, a hiptese estatstica seria que 60%
dos eleitores so favorveis a A, de modo que
a probabilidade que um eleitor aleatoriamente
selecionado seja a favor de A seria p = 0,6.
Reconhecendo que no se pode contar cada
voto individual, seleciona-se uma amostra
aleatria de 600 e pergunta-se sua preferncia.
Se 60% realmente so a favor de A, o nmero
esperado na amostra em favor de A np = 600
x 0,6 = 360. Se, na realidade, houve 330 votos
para A, pode-se duvidar significativamente da
hiptese que 60% so a favor de A?
Para responder esta questo, nota-se que,
de acordo com a hiptese, a probabilidade que
eleitores sejam a favor de A a probabilidade
binomial

Prob ( eleitores de A) = Bn,p()

(10.21)

com n = 600 e p = 0,6. Como n to grande,


uma excelente aproximao para substituir a

funo binomial pela funo de Gauss


apropriada, com centro em np = 360 e desvio
padro
= np(1 p) =
600 0,6 0,4 = 12.

Prob ( eleitores de A) = G360,12()


O nmero mdio esperado em favor de A
360. Assim, o nmero que realmente escolheu
A na amostra (330) 30 menos que o
esperado. Como o desvio padro 12, o
resultado 2,5 desvios padro abaixo da
mdia esperada. A probabilidade de um
resultado baixo assim ou menor (de acordo
com a tabela no Apndice B) 0,6%. Assim, o
resultado altamente significativo e ao nvel de
1%, pode se rejeitar com confiana a hiptese
que A favorecido por 60%.
Este exemplo ilustra duas caractersticas
gerais deste tipo de teste:
Tendo achado que 330 eleitores so
favorveis a A (isto , 30 a menos que o
esperado), calculou-se a probabilidade que o
nmero favorecendo A seria 330 ou menos.
Inicialmente se pensa que se poderia
considerar a probabilidade que o nmero
favorecendo A precisamente = 330. Esta
probabilidade muito pequena (0,15%, de fato)
e mesmo o resultado mais provvel ( = 360)
tem uma pequena probabilidade (3,3%). Para
ter uma medida apropriada de como
inesperado o resultado
= 330, deve-se incluir = 330 e qualquer
resultado que esteja abaixo da mdia.
O resultado = 330 era 30 menos que o
resultado esperado, 360. A probabilidade de
um resultado 30 ou mais abaixo da mdia
geralmente chamado uma probabilidade de
uma ponta (one-tail), porque a rea sob uma
ponta da curva distribuio, como na Fig. 10.6
(a). Em alguns testes, a probabilidade
relevante a probabilidade com as duas
pontas de obter um resultado que difira da
mdia esperada por 30 ou mais em qualquer
direo, isto , a probabilidade de obter < 330
ou 390, como na Fig. 10.6 (b). Se usada
uma probabilidade com uma ou duas
extremidades em um teste estatstico depende
do que se considera a alternativa interessante
para a hiptese original. Aqui, devia-se mostrar
que o candidato A era favorecido por menos do
que o proclamado 60%, de modo que a
probabilidade com uma extremidade era
apropriada. Se devesse mostrar que o nmero
favorecendo A era diferente de 60% (em

110

Distribuio Binomial
qualquer direo, a mais ou a menos), deve-se
usar a probabilidade de duas extremidades. Na
prtica, a escolha de qual probabilidade usar
usualmente fcil. Em qualquer caso, o tcnico
sempre precisa estabelecer claramente a
probabilidade e nvel de significncia escolhido
e o valor calculado da probabilidade. Com esta
informao, os leitores podem julgar a
significncia dos resultados por eles mesmos.

(a)
(b)
Fig. 10.6. (a) A probabilidade de uma extremidade de dar
um resultado de 30 ou mais abaixo da mdia.
(b) A probabilidade de duas extremidades de dar um
resultado que difira da mdia de 30 ou mias em
qualquer direo. (No em escala)

Probleminha rpido 10.2


Se em 12 lanamentos de moeda deu 11
caras, pode-se ter evidncia que a moeda est
viciada em favor da cara? Assumindo que a
moeda seja honesta, a probabilidade de obter
cara em um nico lanamento p = .
Fazendo esta hiptese, encontrar a
probabilidade de haver obtido 11 ou mais caras
em 12 lanamentos.
Resp.: Prob (11 ou 12 caras) = 0,32% e h uma
evidncia significativa (at mesmo altamente significativa)
que a moeda seja viciada em cara.

111

Distribuio Binomial

Principais Definies e Equaes do


Captulo 10
Distribuio Binomial
Considerando um experimento com vrias
possveis sadas e designando a sada
particular em que se est interessado de
sucesso, se a probabilidade de sucesso em
qualquer teste p, ento a probabilidade de
sucessos em n testes dada pela distribuio
binomial:
Prob (n sucessos em n testes) = Bn,p()
n
= p qn

Aproximao gaussiana para a


distribuio binomial
Com n muito grande, a distribuio binomial
Bn,p( ) bem aproximada pela funo de
Gauss com a mesma mdia e mesmo desvio
padro, ou seja:
Bn,p( ) GX,(x)

[Ver (10.12)]

onde
X = np
e

[Ver (10.6)]
= np(1 p)

[Ver (10.13)]

onde n denota o coeficiente binomial



0

n
n!
=
! (n )!

Se o conjunto todo de testes repetido


muitas vezes, o nmero mdio esperado de
sucessos
= np

[Ver (10.9)]

e o desvio padro de
= np(1 p)

]Ver (10.10)]

112

Distribuio de Poisson

11. Distribuio de Poisson


11.1. Introduo
Este captulo apresenta um terceiro
exemplo de uma distribuio limite, a
distribuio de Poisson, que descreve os
resultados de experimentos em que se
contam eventos que ocorrem de modo
aleatrio mas com uma taxa mdia definida.
Exemplos deste tipo de contagem aparecem
em cada rea da cincia, por exemplo, um
socilogo que conta o nmero de crianas
nascidas em um hospital no perodo de uma
semana. Um exemplo importante na fsica,
a contagem de decaimentos de uma amostra
radioativa, como o fsico nuclear que conta o
nmero de partculas alfa desintegradas pela
amostra de Rdio em intervalos de 10 s.
Este tipo de experimento com contagem
foi discutido na seo 3.2, onde foi
estabelecida, mas no provada, a regra da
raiz quadrada. Se contado o nmero de
ocorrncias de um evento deste tipo em um
intervalo de tempo escolhido T e obtido
contagens, ento a melhor estimativa para o
nmero mdio verdadeiro no tempo T e a
incerteza nesta estimativa .
Nas sees 11.1 e 11.2, ser introduzida
a distribuio de Poisson e mostradas
algumas de suas propriedades. Em
particular, ser provado na seo 11.2 que o
desvio padro da distribuio de Poisson a
raiz quadrada do nmero esperado de
eventos. Este resultado justifica a regra da
raiz quadrada da seo 3.2. As sees 11.3 e
11.4 descrevem algumas aplicaes da
distribuio de Poisson.

11.2. Definio da distribuio de


Poisson
Como um exemplo da distribuio de
Poisson, suponha uma dada amostra de
material radioativo e um detector conveniente
para encontrar o nmero de partculas
ejetadas em intervalos de dois minutos. Se o
contador confivel, o valor de no ter
incerteza. Porm, se a experincia
repetida, se obter certamente um valor
diferente para . Esta variao no nmero
no reflete a incerteza nas contagens (que
podem ser isentas de erro), mas reflete o

caracter intrinsecamente aleatrio do


processo de desintegrao radioativa.
Cada ncleo radioativo tem uma
probabilidade definida para decair em
qualquer intervalo de dois minutos. Se so
conhecidos esta probabilidade e o nmero de
ncleos, pode-se calcular o nmero mdio
esperado de decaimentos em dois minutos.
Porm, cada ncleo decai em um tempo
aleatrio e em qualquer intervalo de dois
minutos dado, o nmero de decaimentos
pode ser diferente do nmero mdio
esperado.
Obviamente, a questo que aparece : se
a experincia repetida muitas vezes, que
distribuio ser esperada para o nmero de
decaimentos observados em intervalos de
dois minutos? Foi estudada no Captulo 10 e
apresentada a distribuio binomial. Se h n
ncleos e a probabilidade que qualquer um
ncleo decaia p, ento a probabilidade de
decaimentos justo a probabilidade de
sucessos em n testes ou Bn,p(). Neste tipo
de experimento discutido, porm, h uma
simplificao importante. O nmero de testes
(isto , ncleos) enorme (n circa 1020). Sob
estas condies (n grande e p pequeno), a
distribuio binomial pode se tornar igual a
uma distribuio chamada de distribuio de
Poisson. Especificamente, pode ser mostrado
que:
Prob ( contagens em dado intervalo) = P()
(11.1)
onde a distribuio de Poisson, P(), dada
por
Distribuio de Poisson

P ( ) = e

(11.2)

Nesta definio, um parmetro


positivo ( > 0) que, como ser mostrado
diretamente, justo o nmero mdio
esperado de contagens em um intervalo de
tempo considerado e ! denota a funo
fatorial (com 0! = 1).

113

Distribuio de Poisson
Significncia de como contagem mdia
esperada
A distribuio de Poisson (11.2) no ser
derivada aqui, mas simplesmente ser
afirmado que ela a distribuio apropriada
para o tipo de experimento com contagem
envolvida. Para estabelecer a significncia do
parmetro em (11.2), tem-se somente de

calcular o nmero mdio de contagens, ,


esperado se o experimento de contagem
repetido vrias vezes. Esta mdia
encontrada somando-se todos os valores
possveis de , cada um multiplicado por sua
probabilidade:
=

P ( ) = e

=0

=0

(11.3)
!

O primeiro termo desta soma pode ser


desprezado (porque zero) e /! pode ser
substitudo por 1/(-1)!. Se removido o
fator comum de e-, tem-se
= e

( 1)!

(11.4)

Exemplo: Contagem de desintegrao


radioativa
Foram desenvolvidos mtodos precisos
para a contagem das emisses das
partculas alfa de uma amostra de trio
radioativo uma taxa de 1,5 por minuto. Se
contado o nmero de partculas alfa emitidas
em dois minutos, qual o resultado mdio
esperado? Qual a probabilidade que se
obtenha realmente este nmero? Qual a
probabilidade para observar partculas para
= 0, 1, 2, 3 ou para v 5?
A contagem mdia esperada justo a
taxa mdia de emisses (R = 1,5 por minuto)
multiplicada pelo tempo durante as
observaes (T = 2 minutos):

nmero mdio esperado = = 1,5 x 2 = 3


Este resultado no significa, obviamente,
que esperado observar exatamente trs
partculas em qualquer observao isolada.
Pelo contrario, as probabilidades para
observar qualquer nmero () de partculas
so dadas pela distribuio de Poisson

=1

A soma infinita que permanece


1+ +

2 3
+
+ ... = e
2! 3!

(11.5)

que justo a funo exponencial e (como


indicada). Assim, a exponencial e- em (11.4)
exatamente cancelada pela soma que vale
e e fica apenas
=

(11.6)

Ou seja, o parmetro que caracteriza a


distribuio de Poisson P() simplesmente
o nmero mdio de contagens esperado se a
contagem for repetida muitas vezes.
s vezes, pode-se conhecer a priori a
taxa mdia R em que os eventos so
contados quando ocorrem. Neste caso, o
nmero mdio esperado de eventos em um
tempo T
= taxa x tempo = RT
Por outro lado, se a taxa R
desconhecida, ento pela contagem do
nmero de eventos no tempo T, pode-se ter
uma estimativa para e assim para a taxa R,
como
Restimado = estimado/T

Prob ( partculas) = P3() = e 3

3
!

Em particular, a probabilidade de se
observar exatamente trs partculas de
Prob (3 partculas) = P3(3) = e 3

33
= 0,22 = 22%
3!

Note-se que, embora o resultado mdio


esperado seja de = 3, espera-se obter este
nmero somente em 22%, ou seja, cerca de
uma vez em cada 5 testes.
As probabilidades para qualquer nmero
podem ser calculadas do mesmo modo e
obtm-se
Nmero

Probabilidade, %

15

22

22

17

Estas probabilidades (at = 9) so


plotadas na Fig. 11.1. O modo mais simples
para achar a probabilidade de obter 5 ou
mais contagens somar as probabilidades
para 0, 1, 2, 3 e 4 e depois subtrair a soma
de 100% para dar
Prob ( > 5) = 100% - (5 + 15 + 22 + 22 + 17)%

= 19%

114

Distribuio de Poisson
11.3. Propriedades da distribuio de
Poisson

P3()
20%
=3
10%

1 2

6 7

3 4

Fig. 11.1. A distribuio de Poisson P3() d as


probabilidades de observar eventos em uma
contagem onde a contagem mdia esperada de
3.
Probleminha rpido 11.1.
Em mdia, cada uma 18 galinhas de uma
granja botam 1 ovo por dia. Se verificado a
cada hora o nmero de ovos (para sua
eventual retirada), qual o nmero mdio, ,
de ovos achados em cada visita horria?
Usar a distribuio de Poisson P() para
calcular as probabilidades de encontrar
ovos, = 0, 1, 2, 3 e = 4 ou mais ovos. Qual
a probabilidade de achar exatamente
ovos? Verificar as probabilidades mostradas
na Fig. 11.2.

Desvio padro
A distribuio de Poisson P() d a
probabilidade de se obter o resultado em
um experimento em que os eventos so
contados aleatoriamente mas h uma taxa
mdia definida. Foi visto que o parmetro
precisamente a contagem mdia esperada
, A prxima questo que aparece
naturalmente : qual o desvio padro das
contagens quando o experimento repetido
muitas vezes? O desvio padro de qualquer
distribuio (aps um nmero grande de
testes) justo a raiz quadrada do desvio da
mdia. Isto d
2 = ( )2

ou
2 = 2 ( )2

(11.7)

Para a distribuio de Poisson, j foi


encontrado que = e um clculo similar d
2 = 2 +

Assim, a eq. (11.7) implica que

50%
=0,75

(11.8)

Ou seja, a distribuio de Poisson com

0%
0

Fig. 11.2. A distribuio de Poisson P0,75() d a


probabilidade de se obter eventos em uma
experincia com contagem para a qual
esperada a mdia de 0,75.

contagem mdia tem desvio padro

O resultado (11.8) justifica a regra da raiz


quadrada da seo 3.2. Se feito um
experimento uma vez e obtido o resultado
, pode-se facilmente ver, usando o princpio
da mxima probabilidade, que a melhor
estimativa para a contagem mdia esperada
estimado = . De (11.8), segue-se
imediatamente que a melhor estimativa para
o desvio padro justo . Em outras
palavras, se feita uma medio do nmero
de eventos em um intervalo de tempo T e
obtido o resultado , o resultado para a
contagem mdia esperada no tempo T

(11.9)
Este resultado precisamente a regra da
raiz quadrada apresentada sem prova na eq.
(3.2).

115

Distribuio de Poisson
Exemplo: Mais decaimento radioativo
Uma amostra de trio monitorada por
30 minutos e so contadas 49 partculas alfa.
Qual o resultado para o nmero de
partculas emitidas em 30 minutos? Qual o
resultado para a taxa de emisso, R, em
partculas por minuto?
De acordo com (11.9), o resultado para o
nmero de partculas emitidas em 30 minutos

(nmero emitido em 30 minutos) = 49


= 49 7

49 =

Para achar a taxa em partculas por


minuto, deve-se dividir por 30 minutos.
Assumindo estes 30 minutos sem incerteza,
acha-se
R=

49 7
= 1,6 0,2 part/min (11.10)
30

Note-se que a regra da raiz quadrada d


a incerteza no nmero contado real ( =
= 7, neste caso). Um erro comum
calcular a taxa de decaimento R = /T e
ento tomar a incerteza em R como sendo de

R . Uma vista em (11.10) d para perceber


que este procedimento simplesmente
incorreto. A regra da raiz quadrada se aplica
somente ao nmero contado real , e a
incerteza em R = /T deve ser encontrada
das incertezas em e em T usando a
propagao da incerteza, como em (11.10).

Probleminha rpido 11.2


O granjeiro do Probleminha rpido 11.1
observa que em um certo perodo de 10
horas, foram colhidos 9 ovos. Baseado nesta
observao,
(a) Qual seria a cota para o nmero de
ovos esperado em 10 horas?
(b) Como seria dado a taxa R de
produo de ovos, em ovos por hora?
(D as incertezas nas duas respostas).
Resposta:
(a) (ovos colhidos em 10 horas) = 9 3 ovos
(b) R = 0,9 0,3 ovos/hora

Aproximao gaussiana para a


distribuio de Poisson
No Captulo 10, a distribuio gaussiana
foi comparada com a distribuio binomial.

Foi visto que em muitos casos, as duas


distribuies so muito diferentes, embora,
sob condies corretas, a distribuio
gaussiana d uma excelente e extremamente
til aproximao para a distribuio binomial.
Como ser visto agora, quase exatamente o
mesmo pode ser dito acerca das distribuies
de Gauss e de Poisson.
A distribuio gaussiana GX,(x) d a
probabilidade de vrios valores de uma
varivel contnua x, enquanto a distribuio
de Poisson P(), como a binomial Bn,p(), d
a probabilidade para uma varivel discreta
= 0, 1, 2, 3, ... . Outra diferena importante
que a distribuio de Gauss GX,(x)
especificada para dois parmetros, a mdia X
e o desvio padro , enquanto a distribuio
de Poisson P() especificada para um
nico parmetro, a mdia , porque a largura
da distribuio de Poisson
automaticamente determinada e vale =
). Finalmente, a distribuio de Gauss
sempre em forma de sino e simtrica em
relao ao seu valor mdio, enquanto a
distribuio de Poisson no tem nenhuma
destas duas propriedades, em geral. Este
ltimo ponto especialmente claro na Fig.
11.2 que mostra a distribuio de Poisson
para = 0,75; esta curva certamente no tem
formato de sino nem mesmo
aproximadamente simtrica em relao a sua
mdia de 0,75.

Fig. 11.3. A distribuio de Poisson para = 9. A curva


pontilhada a distribuio de Gauss com a
mesma mdia e desvio padro (X = 9 e x = 3).
Quando , as duas distribuies tornam-se
iguais, mesmo com = 9 elas j se parecem

A Fig. 11.1 mostrou a distribuio de


Poisson para = 3. Embora esta curva no
tenha obviamente a forma de sino, ela
inegavelmente mais prxima desta curva
para = 0,75 na
Fig. 11.2. A Fig. 11.3 mostra a distribuio de
Poisson para = 9; esta curva tem um
formato parecido com sino e quase
simtrica em torno de sua mdia ( = 9). De

116

Distribuio de Poisson
fato, pode-se provar que, quando
, a
distribuio de Poisson se torna
progressivamente mais parecida com o sino
e se aproxima da distribuio de Gauss com
a mesma mdia e desvio padro. Ou seja,
P ( ) G X, ( )

(quando grande)
(11.11)

Prob(72 contagens) = 3,0%


Quando se quer calcular diretamente a
probabilidade de 72 ou mais contagens no
mesmo experimento, um clculo muito
tedioso daria:
Prob( 72) = P64(72) + P64(73) + ...
= 17,3%

onde
X=
e
=

Na Fig. 11.3, a curva pontilhada a


funo de Gauss com X = 9 e = 3. Pode se
ver claramente como, mesmo quando
somente 9, a distribuio de Poisson
marcadamente prxima da funo de Gauss
apropriada. A pequena discrepncia reflete a
assimetria remanescente na funo de
Poisson.
A aproximao (11.11) chamada de
aproximao gaussiana para a
distribuio de Poisson. anloga
aproximao correspondente para a
distribuio binomial (discutida na seo
10.4) e til sob as mesmas condies, ou
seja, quando os parmetros envolvidos so
muito grandes.
Exemplo: Aproximao gaussiana para a
distribuio de Poisson
Para ilustrar a aproximao gaussiana
para a distribuio de Poisson, seja a
distribuio de Poisson com = 64. A
probabilidade de 72 contagens, por exemplo,
de

Prob(72 contagens) = P64(72) =


e 64

(64)72
72!

(11.12)

cujo clculo complexo d


Prob(72 contagens) = 2,9%
De acordo com (11.11), porm, a
probabilidade (11.12) bem aproximada pela
funo de Gauss:
Prob(72 contagens) = G64,8(72)
que facilmente calculada para dar

Se usada a aproximao (11.11), ento


deve se apenas calcular a probabilidade de
Gauss para obter 71,5 (pois a distribuio
de Gauss trata como uma varivel
contnua). Como 71,5 7,5 ou 0,94 acima
da mdia, a probabilidade requerida pode ser
encontrada rapidamente da tabela no
Apndice B como
Prob( 72) = PG(71,5) = PG( X + 0,94)

=17,4%
que uma boa aproximao, para quase
qualquer padro.

11.4. Aplicaes
Como j foi enfatizado, a distribuio de
Poisson descreve a distribuio de resultados
em uma experincia com contagem, em que
eventos aleatrios so contados, porm h
uma taxa mdia definida. Os dois exemplos
clssicos incluem a desintegrao de ncleos
radioativos e a contagem de chegada de
raios csmicos.
Outro exemplo muito importante um
experimento para estudar uma distribuio
limite esperada, como as distribuies de
Gauss, Poisson e binomial. Uma distribuio
limite diz como muito eventos de um tipo
particular so esperados quando um
experimento repetido muitas vezes. (Por
exemplo, a distribuio de Gauss GX,(x) diz
como muitas medies de x so esperadas
cair em qualquer intervalo de
x = a at x = b.) Na prtica, o nmero
observado raramente igual ao nmero
esperado. Em vez disso, ele flutua de acordo
com a distribuio de Poisson. Em particular,
se o nmero esperado de eventos de algum
tipo n, o nmero observado pode ser
esperado diferir de n por um nmero da
ordem de n .
Em muitas situaes, razovel esperar
que os nmeros sejam distribudos de acordo
com a distribuio de Poisson. O nmero de
ovos postos em uma hora na granja e o
nmero de nascimentos em um dia em um

117

Distribuio de Poisson
hospital ambos devem seguir a distribuio
de Poisson, no mnimo, aproximadamente.
Para testar esta hiptese, deve-se registrar o
nmero considerado vrias vezes. Aps
colocar no grfico a distribuio resultante,
pode-se compar-la com a distribuio de
Poisson para ver como elas se aproximam.
Para um teste quantitativo, pode-se usar o
teste do 2 (qui quadrado), mostrado no
Captulo 12.
Exemplo: Contagem de raios csmicos
Como outro exemplo da distribuio de
Poisson, seja um experimento com raios
csmicos. Estes raios so criados como
partculas carregadas, como prtons ou
partculas alfa, que entram na atmosfera da
Terra do espao. Muitas destas partculas
primrias colidem com tomos na atmosfera
e criam partculas secundrias, com mesons
e positrons. Algumas destas partculas (tanto
primrias como secundrias) viajam de
algum modo para o nvel do cho e podem
ser detectadas (com um contador Geiger, por
exemplo) em laboratrio. No problema
seguinte, explora-se o fato que o nmero de
raios csmicos incidindo em uma dada rea
em um dado tempo deve seguir a distribuio
de Poisson.
Mede-se o nmero de raios csmicos
incidindo no contador Geiger em um minuto,
vrias vezes, e cuidadosamente obtm-se,
em mdia, 9 partculas por minuto, com
incerteza desprezvel. Para verificar esta
afirmao, conta-se novamente quantas
partculas chegam em um minuto e obtm-se
o resultado 12. Os dois resultados, 9 e 12,
so consistentes? Faz-se uma terceira
contagem do nmero de partculas que
chegam em dez minutos. Da primeira
medio, seria esperado obter 90, mas na
realidade se obteve 120. Este valores so
tambm consistentes?
Seja a segunda contagem. Se a primeira
medio estiver correta, a contagem mdia
esperada 9. Como a distribuio das
contagens deve seguir a distribuio de

Poisson, o desvio padro 9 = 3. O


segundo resultado 12, somente um desvio
padro afastado da mdia 9. Este valor
certamente no suficientemente distante para
contradizer a primeira contagem. Mais
especificamente, sabendo-se que a
probabilidade de qualquer resultado
suposta ser P9(), pode-se calcular a
probabilidade total para se obter um
resultado que difira de 9 por 3 ou mais. Esta
probabilidade vale 40%. Obviamente, a
segunda contagem no to surpreendente

e a primeira no tem razo de ser


questionada.
A terceira contagem muito diferente. Se
a primeira estiver correta, a terceira deveria
dar 90 contagens em 10 minutos. Como a
distribuio deve ser a de Poisson, o desvio
padro deve ser 90 = 9,5. Assim, o terceiro
resultado de 120 maior trs desvios padro
que a primeira medio de 90. Com estes
nmeros grandes, a distribuio de Poisson
pode ser aproximada da distribuio
gaussiana e pode achar imediatamente da
tabela no Apndice A que a probabilidade de
uma contagem maior do que trs desvios
padro da mdia 0,3%. Ou seja, se a
primeira contagem correta, muito
improvvel que a terceira seja de 120
contagens. Pode-se ver quase certamente
que algo est errado por alguma das
seguintes causas:
1. A primeira contagem no foi
cuidadosa, como devia.
2. O contador funcionou mal para a
primeira e terceira, introduzindo
incertezas sistemticas em um dos
resultados.
3. A primeira contagem tenha sido feita
em um tempo em que o fluxo de raios
csmicos tenha sido verdadeiramente
menor que o normal.

11.5. Subtraindo um background


Para concluir este captulo, ser discutido
o problema que complica muitos
experimentos com contagem. s vezes, os
eventos a estudar so acompanhados com
outros eventos rudos ou panos de fundo que
no podem ser distinguidos dos eventos de
interesse. Por exemplo, no estudo de
desintegraes de uma fonte radioativa, no
se pode evitar que o detector registre
partculas de outros materiais radioativos na
vizinhana ou dos raios csmicos. Isto
significa que o nmero contado inclui os
eventos de interesse mais os eventos
esprios e deve-se, de algum modo, subtrair
os eventos no desejados. Em princpio, no
mnimo, a soluo direta: tendo achado o
nmero total (soma da fonte e do pano de
fundo), deve-se remover a fonte e achar a
taxa de eventos devidos ao pano de fundo
apenas; a taxa de eventos da fonte ento a
diferena entre duas taxas medidas.
Na prtica, surpreendentemente fcil
cometer um erro neste procedimento,
especialmente na anlise da incerteza.
usualmente conveniente medir as contagens
total e de pano de fundo usando diferentes
intervalos de tempo. Suponha que se conte

118

Distribuio de Poisson
um total de tot eventos (fonte mais rudo) no
tempo Ttot e ento rudo eventos de pano de
fundo em um tempo Truido. Obviamente, no
basta simplesmente subtrair rudo do tot,
porque eles se referem a intervalos de tempo
diferentes. Ao invs, deve se primeiro
calcular as taxas,
R tot =

tot
Ttot

e
R rudo =

rudo
Trudo

e ento calcular a taxa da fonte como a


diferena

e
Rrudo =

rudo 95 10
=
= 32 3 cont/min
Trudo
3

Finalmente, a taxa devida apenas fonte

Rfonte = Ttotal Rrudo = (254 5) (32 3)


= 222 6 cont/min
Note-se que na ltima subtrao as
incertezas foram combinadas em quadratura
( 6 = 5 2 + 3 2 ), pois elas so certamente
independentes e aleatrias.

Rfonte = Rtot Rrudo


Na estimativa das incertezas nas
quantidades envolvidas, deve-se lembrar que
a regra da raiz quadrada d as incertezas
nos nmeros contados tot e rudo. As
incertezas nas correspondentes taxas devem
ser encontradas pela propagao da
incerteza, como no exemplo seguinte.
Exemplo: Decaimento radioativo com
rudo
Decide-se monitorar a atividade de uma
fonte radioativa, colocando-a em um detector
de cintilao. Depois de 10 minutos, o
detector conta 2540 contagens. Para verificar
a possibilidade da contagem indesejada de
rudos, a fonte e removida e depois de 3
minutos, o detector registra 95 contagens.
Para achar a atividade da fonte, deve-se
calcular as duas taxas de contagem, Rtot e
Rrudo (em contagens por minuto) e sua
diferena Rfonte = Rtot - Rrudo.
Qual o resultado e sua incerteza?
(Assumir que os dois tempos tem incertezas
desprezveis.)
De acordo com a regra da raiz quadrada,
os dois nmeros contados com suas
incertezas so:
total = 2540 2540 = 2540 50
total = 95 95 = 95 10

Dividindo estes nmeros totais pelo


correspondente perodo de tempo, acham-se
R total =

total 2540 50
=
= 254 5 cont/min
Ttotal
10

119

Distribuio de Poisson
Definies e Equaes do Captulo
11

da raiz quadrada e destes valores, as


incertezas nas trs taxas.

Distribuio de Poisson
A distribuio de Poisson descreve
experimentos em que se contam eventos que
ocorrem de modo aleatrio mas em uma taxa
mdia definida. Quando se tem uma
contagem para um tempo escolhido T, a
probabilidade de observar eventos dada
por :
P ( ) = e

[Ver (11.2)]

onde o parmetro o nmero mdio


esperado de eventos no tempo T, ou seja:
= (aps muitos testes)
[Ver (11.6)]
O desvio padro do nmero observado

[Ver 11.8)]

Aproximao gaussiana para a


distribuio de Poisson
Quando grande, a distribuio de
Poisson P() bem aproximada pela funo
de Gauss com a mesma mdia e mesmo
desvio padro:
P ( ) G X, ( )

[Ver (11.11)]

onde
X=

Subtraindo o rudo
Os eventos produzidos por uma fonte
sujeita a interferncias indesejveis de rudos
podem ser contados em trs etapas de um
procedimento:
Conta-se o nmero total total (fonte
1.
mais rudo), em um tempo Ttotal e
calcula se a taxa total Rtotal = total/Ttotal
Remove-se a fonte e conta-se o
2.
nmero de eventos devidos ao rudo
em um tempo Truido e calcula se a taxa
do rudo Rruido = ruido/Trudo.
3. Calcula-se a taxa de eventos da fonte
com o a diferena Rfonte = Rtotal Rruido.
4. Calculam-se as incertezas nos
nmeros total e rudo atravs da regra
Apostilas\Incerteza

JRTaylor8.doc

25 SET 98 (Substitui 31 JAN 98)

120

Teste do Qui-Quadrado

12. Teste do Qui-Quadrado


12.1. Introduo
Os captulos anteriores apresentaram a
noo de distribuies limites, funes que
descrevem a distribuio esperada de
resultados se um experimento repetido
muitas vezes. H muitas distribuies limites,
correspondendo a muitos diferentes tipos de
experimentos possveis. Talvez as trs mais
importantes distribuies limites sejam as j
discutidas: de Gauss (ou normal), binomial e
Poisson.
Este captulo final trata de como decidir se
os resultados de uma experincia real so
governados pela distribuio limite esperada.
Especificamente, supe-se que alguns
experimentos so feitos e se acredita conhecer
a distribuio esperado dos resultados. Supese ainda que o experimento repetido vrias
vezes e seus resultados so registrados. A
questo colocada agora esta: como pode se
decidir se a distribuio observada
consistente com a distribuio terica
esperada? Esta questo pode ser respondida
usando um procedimento simples chamado de
teste 2 ou qui quadrado ( a terceira letra
grega, correspondente ao c e pronunciada
como qui).

12.2. Introduo ao Qui Quadrado


Suponha-se que foram feitas 40 medies
x1, x2, ..., x40 de uma faixa x de um projtil
atirado de uma arma e os resultados so os
mostrados na Tab. 12.1. Seja ainda que h
razo para acreditar que estas medies so
governadas pela distribuio de Gauss GX,(x),
o que certamente muito natural. Neste tipo de
experimento, usualmente se conhece a priori
ou o ponto central X ou a largura x da
distribuio esperada. O primeiro passo,
portanto, usar as 40 medies para calcular a
melhor estimativa destas quantidades, que a
mdia.
No caso,
xi = 730,1 cm
x=
(12.1)
40
e a melhor estimativa do desvio padro

(x x)
i

39

= 46,8 cm
(12.2)

Tab. 12.1 Valores medidos de x (em cm)


731

772

771

681

722

688

653

757

733

742

739

780

709

676

760

748

672

687

766

645

678

748

689

810

805

778

764

753

709

675

698

770

754

830

725

710

738

638

787

712

Agora se pode questionar se a distribuio


real dos resultados x1, x2, ..., x40. consistente
com a hiptese que as medies so
governadas pela distribuio de Gauss GX,(x)
com X e como estimados. Para responder a
esta pergunta deve-se computar como seria
esperado que os 40 resultados se
distribussem se a hiptese verdadeira e
comparar esta distribuio esperada com a
distribuio real observada. A primeira
dificuldade que x uma varivel contnua, de
modo que no se pode falar de nmero
esperado de medies igual a um valor
qualquer de x. Depois, deve-se discutir o
nmero esperado em algum intervalo a < x <b.
Isto , deve-se dividir a faixa de valores
possveis em intervalos. Com 40 medies,
pode-se escolher a largura do intervalo em X
e X + , dando 4 intervalos como na Tab.
12.2.
Tab. 12.2. Uma possvel escolha de intervalos para os
dados da Tab. 12.1. A coluna final mostra o nmero
de observaes que caem em cada intervalo
Intervalo
k

Valores de x nos intervalos

Observaes
Ok

x<X

(ou x 683,3

X x <x < X

(ou 683,3 < x < 730,1

10

X<x<x+

(ou 730,1 < x < 776,9

16

X+<x

(ou 776,9 < x)

121

Teste do Qui-Quadrado
Sero discutidos, mais tarde, os critrios
para escolher os intervalos. Em particular, eles
devem ser escolhidos de modo que todos os
intervalos contenham vrios valores medidos
de x. Em geral, o nmero de intervalos
denotado por n; neste exemplo n = 4.
Tendo dividido a faixa de possveis valores
medidos em intervalos, pode-se agora formular
a questo mais precisamente. Primeiro, podese contar o nmero de medies que caem em
cada intervalo k. (Se uma medio cai
exatamente no limite entre dois intervalos,
pode-se atribuir a metade de uma medio
para cada intervalo.) Este nmero denotado
por Ok (onde O significa nmero observado).
Para os dados do exemplo dado, O1 , O2, O3 e
O4 so mostrados na ltima coluna da Tab.
12.2. Depois, assumindo as medies
distribudas normalmente, com X e como
estimado, calcula-se o nmero esperado Ek de
medies em cada intervalo k. Deve-se decidir
quo bem os nmeros observados Ok se
comparam com os nmeros esperados Ek.

O problema agora decidir quo bem os


nmeros esperados Ek representam os
correspondentes nmeros observados Ok (na
ltima coluna da Tab. 12.3). Obviamente no
se espera uma perfeita concordncia entre Ek e
Ok, aps qualquer nmero finito de medies.
Por outro lado, se a hiptese que as medies
so normalmente distribudas correta, espera
se que, em algum sentido, os desvios
Ok Ek

sejam pequenos. De modo inverso, se os


desvios Ok Ek forem grandes, suspeita-se que
a hiptese incorreta.
Tab. 12.3. Os nmeros esperados Ek e os nmeros
observados Ok para as 40 medies da Tab. 12.1,
com os intervalos escolhidos como na Tab. 12.2.
Intervalo
k

Probabilidade
Probk

1
2
3
4

Fig. 12.1. As probabilidades Probk de uma medio cair


em cada intervalo, k = 1, 2, 3 e 4 da Tab. 12.2 so
as quatro reas mostradas sob a funo de Gauss.

O clculo dos nmeros esperados Ek


muito direto. A probabilidade que qualquer uma
medio caia em um intervalo a < x < b justo
a rea sob a funo de Gauss entre x = a e x =
b. Neste exemplo, as probabilidades Prob1,
Prob2, Prob3 e Prob4 para uma medio cair em
cada um dos quatro intervalos so as quatro
reas indicadas na Fig. 12.1. As duas reas
iguais, Prob2 e Prob3 juntas representam a bem
conhecida 68%, de modo que a probabilidade
de cair em uma das duas reas centrais de
34%, ou seja Prob2 = Prob3 = 0,34. As duas
reas externas compreendem os restantes
32% e assim, Prob1 = Prob4 = 0,16. Para achar
os nmeros esperados Ek, simplesmente se
multiplicam estas probabilidades pelo nmero
total de medies, N = 40. Assim, os nmeros
esperados so os mostrados na terceira coluna
da Tab. 12.3. Que os nmeros Ek no so
inteiros serve para lembrar que o nmero
esperado no o que realmente se espera em
uma experincia mas sim, o nmero mdio
esperado depois que se repete a srie inteira
de medies muitas vezes.

(12.3)

16%
34%
34%
16%

Nmero
esperado, Ek

Nmero
observado, Ok

6,4
13,6
13,6
6,4

8
10
16
6

Para tornar preciso a afirmao que o


desvio Ok Ek seja pequeno ou grande, devese decidir quo grande se espera Ok Ek ser
se as medies so realmente distribudas
normalmente. Felizmente, esta deciso fcil.
Imaginando que as sries de 40 medies so
repetidas muitas vezes, ento o nmero Ok de
medies em qualquer um dos intervalos k
pode ser considerada como o resultado de uma
experincia de contagem, do tipo descrito no
captulo 11. Os muitos diferentes resultados
para Ok devem ter um valor mdio de Ek e seria
esperado flutuar em torno de Ek com um desvio
padro da ordem de

Ek . Os dois nmeros a

serem comparados so o desvio Ok Ek e o


tamanho esperado de sua flutuao

Ek .

Estas consideraes levam a se considerar


a relao
Ok Ek
Ek

(12.4)

Para alguns intervalos k, esta relao ser


positiva e para alguns, negativa. Para uns
poucos k, ela pode ser muito maior que um,
mas para a maioria dos casos, ela deve ser da
ordem de um ou menor que um. Para testar a
hiptese de que as medies sejam

122

Teste do Qui-Quadrado
normalmente distribudas, natural elevar ao
quadrado o nmero (12.4) para cada k e ento
somar todos os intervalos k = 1, 2, .., n (aqui, n
= 4). Este procedimento define um nmero
chamado 2 (qui quadrado)
2 =

(O k E k ) 2
Ek
k =1
n

(12.5)

Este nmero 2 claramente um indicador


razovel da concordncia entre as distribuies
observada e esperada. Se 2 = 0, a
concordncia perfeita, ou seja, Ok = Ek para
todos os intervalos k, uma situao muito
pouco provvel de acontecer. Em geral, os
termos individuais na soma (12.5) so
esperados ser da ordem de 1, e h n termos na
soma. Assim, se
n
2

(2 da ordem de n ou menos), as
distribuies observadas e esperadas
concordam entre si, to bem quanto seria
esperado. Em outras palavras, se 2 da
ordem de n, no se tem razo para duvidar que
as medies so distribudas como esperado.
Por outro lado, se
2 >> n
(2 muito maior do o nmero de intervalos),
os nmeros observados e esperados so muito
diferentes entre si e h boa razo para
suspeitar que as medies no so
governadas pela distribuio esperada.
No exemplo, os nmeros observados e
esperados nos quatro intervalos e suas
diferenas so mostrados na Tab. 12.4 e um
simples clculo com eles d
2 =

(O k E k ) 2
Ek
k =1
4

(1,6)2 ( 3,6)2 (2,4)2 ( 0,4)2


+
+
+
6,4
13,6
13,6
6,4

= 1,80

(12.6)

Tab. 12.4. Dados da Tab. 12.1, mostrados aqui com as


diferenas Ok - Ek
Intervalo
k

1
2

Nmero
Nmero
observado, Ok esperado, Ek

8
10

6,4
13,6

Diferena
Ok - Ek

1,6
-3,6

3
4

16
6

13,6
6,4

2,4
-0,4

Como o valor de 1,80 para 2 menor que


o nmero de termos na soma (ou seja, 4), no
h razo para duvidar da hiptese que as
medies sejam normalmente distribudas.

Probleminha rpido 12.1


So feitas 100 medies do tempo de

queda de uma bola e calculado tempo mdio, t


e o desvio padro, t. As medies so
agrupadas em 4 intervalos, escolhidos como o
exemplo estudado. Seus resultados so:
menos que ( t - t): 19
entre ( t - t) e t :

30

entre t e ( t + t):

37

mais que ( t + t):

14

Assumindo que estas medies sejam


normalmente distribudas, quais so os
nmeros esperados de medies em cada um
dos quatro intervalos. Qual o 2 e h razo
para duvidar que as medies sejam
normalmente distribudas?
Resp.: Nmeros esperados: 16, 34, 34, 16. 2 = 10,0. Como 2 >> n, as
medies so provavelmente no normalmente distribudas.

12.3. Definio geral do Qui Quadrado


A discusso focalizou um exemplo
particular, 100 medies de uma varivel
contnua x, que denotou a faixa de um projetil
disparado de uma certa arma. Foi definido o
nmero 2 e visto que ele , no mnimo, uma
medio superficial da concordncia entre a
distribuio observada de medies e a
distribuio de Gauss que esperado que as
medies sigam. Pode-se agora definir e usar
2 do mesmo modo para muitas experincias
diferentes.
Seja uma experincia em que se mede um
nmero x e para o qual h razo para esperar
uma certa distribuio de resultados. A
medio repetida vrias vezes (N) e sendo a
faixa dos resultados possveis dividida em n
intervalos,
k = 1, 2, ..., n, contam-se o nmero Ok de
observaes que realmente caram em cada
intervalo k. Assumindo que as medies sejam
realmente governadas pela distribuio
esperada, calcula-se o nmero esperado Ek de

123

Teste do Qui-Quadrado
medies no ko intervalo. Finalmente, calculase o 2 exatamente como em 12.5:
(O k E k ) 2
=
Ek
k =1
n

(12.7)

O significado aproximado de 2 sempre a


mesmo, como no exemplo anterior:
1. se 2 < n, a concordncia entre as
distribuies observada e esperada
aceitvel.
2. Se 2 >> n, h um desacordo
significativo.
O procedimento para escolher os intervalos
em termos do qual 2 comparado depende da
natureza da experincia. Especificamente,
depende de a quantidade medida ser contnua
ou discreta.
Medies de uma varivel contnua
O exemplo discutido na Seo 12.1
envolvia uma varivel contnua x e pouco mais
precisa ser dito. A nica distribuio limite j
vista para uma varivel contnua a
distribuio de Gauss mas h, obviamente,
muitas outras distribuies que podem ocorrer.
Por exemplo, em muitas experincias
nucleares e atmicas, a distribuio esperada
da varivel medida x (energia) a distribuio
de Lorentz:
f ( x )

1
( x X) 2 + 2

onde X e so certas constantes. Outro


exemplo de uma distribuio contnua
relacionada com a desintegrao radioativa de
tomos a distribuio exponencial
1
f ( x ) e t /

onde a vida mdia esperada .


Qualquer que seja a distribuio esperada
f(x), a rea total sob a curva f(x) 1 e a
probabilidade de uma medio entre x = a e x =
b justo a rea entre a e b
Prob (a < x < b) =

f ( x)dx
a

Assim, se o ko intervalo vai de x = ak at


x = ak+1, o nmero esperado de medies no ko
intervalo, aps N medies em todos,

Ek = N x Prob (ak < x < ak+1)


= N

a k +1

ak

(12.8)

f ( x )dx

Quando se discute o uso quantitativo do teste


2 na Seo 12.4, se v que os nmeros
esperados Ek no devem ser muito pequenos.
Embora no haja um limite inferior definitivo, Ek
deve ser aproximadamente igual a 5 ou mais,
Ek 5

(12.9)

Deve-se portanto escolher os intervalos de


modo que Ek, como dado por (12.8) satisfaa
esta condio. V-se, tambm, que o nmero
de intervalos no deve ser muito pequeno. Por
exemplo, na aplicao da Seo 2.1, onde a
distribuio esperada era a de Gauss com
centro em X e largura x no era conhecida a
priori, o teste do 2 no funciona com menos
que quatro intervalos. Ou seja, neste exemplo
preciso se ter
n4

(12.10)

Combinando (12.9) e (12.10), v-se que


no se pode aplicar o teste do 2 a este tipo de
experimento se o nmero total de observaes
for menor que 20.
Medio de uma varivel discreta
Seja a medio de uma varivel discreta,
como o agora familiar nmero de azes quando
se jogam vrios dados. Na prtica, a varivel
discreta mais comum um inteiro (como o
nmero de azes) e se denota a varivel
discreta por , em vez de x (que usada para
varivel contnua). Se so jogados cinco
dados, os valores possveis de so = 0, 1,
2, ..., 5, e no necessrio realmente agrupar
os resultados possveis em intervalos. Pode-se
simplesmente contar quantas vezes se obtm
cada um dos seis possveis resultados. Em
outras palavras, pode-se escolher seis
intervalos, cada um contendo exatamente um
resultado.
Apesar disso, geralmente desejvel
agrupar vrios resultados diferentes em um
intervalo. Por exemplo, se so lanados os
cinco dados 200 vezes, assim a distribuio
esperada de resultados como mostrado nas
duas primeiras colunas da Tab. 12.5. V-se
que aqui os nmeros esperados de
lanamentos dando 4 ou 5 azes so 0,6 e 0,03,
respectivamente, ambos muito menos do que

124

Teste do Qui-Quadrado
cinco ocorrncias requeridas em cada
intervalo, se se quer usar o teste do qui
quadrado. Esta dificuldade facilmente
remediada agrupando os resultados
= 3, 4 e 5 em um nico intervalo. Este
agrupamento resulta em quatro intervalos,
k = 1, 2, 3, 4, que so mostrado com seus
correspondentes nmeros esperados Ek, nas
ultimas duas colunas da Tab. 12.5.
Tab. 12.5. Ocorrncia esperada de azes ( = 0, 1, 2, ...,
5) aps se lanar cinco dados 200 vezes
Resultado

Ocorrncias
esperadas

Intervalo
nmero k

Nmero
esperado Ek

Zero

80,4

80,4

Um

80,4

80,4

Dois

32,2

32,2

Trs

6,4

Quatro

0,6

Cinco

0,03

Outras formas do 2
A notao 2 tem sido usada antes, em
(7.6) e (8.5) e ela poderia tambm ter sido
usada para a soma dos quadrados em (5.41).
Em todos estes casos, 2 uma soma de
quadrados com a forma geral:
valor observado - valor esperado

=
desvio padro

1
(12.11)
Em todos os casos, 2 um indicador da
concordncia entre os valores observados e
esperados de alguma varivel. Se a
concordncia boa, 2 da ordem de n; se
pobre, 2 ser muito maior que n.
Infelizmente, pode se usar 2 para testar
esta concordncia se so conhecidos os
valores esperados e o desvio padro e portanto
se pode calcular (12.11). Talvez a situao
mais comum em que estes valores so
conhecimentos com preciso suficiente o tipo
de teste discutido neste captulo, chamado, o
teste de uma distribuio, em que Ek dado
n

pela distribuio e o desvio padro


Tendo escolhido intervalos como descrito,
pode se contar as ocorrncias observadas Ok
em cada intervalo. Pode se ento computar 2
e ver se as distribuies observadas e
esperadas paream concordar. Neste
experimento, sabe se que a distribuio
esperada certamente a distribuio binomial
B5,1/6() desde que os dados sejam honestos
(de modo que p seja realmente igual a 1/6).
Assim, o teste da distribuio , neste caso, um
teste de os dados serem honestos ou viciados.
Em qualquer experimento envolvendo uma
varivel discreta, os intervalos podem ser
escolhidos para conter justo um resultado
cada, desde que o nmero esperado de
ocorrncias para cada intervalo seja, no
mnimo, o necessrio cinco ou aproximado.
Caso contrrio, vrios resultados diferentes
devem ser agrupados juntos em um nico
intervalo maior que inclua suficientes
ocorrncias esperadas.

E k . De

qualquer modo, o teste do qui quadrado de


larga aplicao
Seja, por exemplo, o problema discutido no
captulo 8, a medio de duas variveis x e y,
onde y esperado ser uma funo definida de
x,
y = f(x)
(tal como y = A + Bx). Suponha que se tenham
N pares medidos (xi, yi), onde xi tem incerteza
desprezvel e yi tem incertezas conhecidas i.
Aqui, o valor esperado de yi f(xi) e pode se
testar quo bem y encaixa a funo f(x)
calculando

=
2

y i f(x i )

Todas as observaes anteriores acerca do


valor esperado de 2 se aplicam a este nmero
e os testes quantitativas descritos nas sees
seguintes podem ser usados. Esta aplicao
importante no ser vista aqui, porque somente
raramente na Metrologia se encontram
incertezas i conhecidas com suficiente
confiana (porm Ver Prob. 12.14).

125

Teste do Qui-Quadrado
12.4. Graus de liberdade e 2 reduzido
Tem se argumentado que se pode testar a
concordncia entre uma distribuio observada
e uma esperada pela computao de 2 e
comparando-o com o nmero de intervalos
usados na coleta dos dados. Um procedimento
pouco melhor, porm, comparar 2 , no com
o nmero n de intervalos, mas com o nmero
de graus de liberdade, denotado d. O noo de
graus de liberdade foi mencionada rapidamente
na seo 8.3 e deve se agora discuti-la com
mais detalhes.
Em geral, o nmero de graus de liberdade
d em um clculo estatstico definido como o
nmero de dados observados menos o nmero
de parmetros computados dos dados e
usados no clculo. Para os problemas
considerados neste captulo, os dados
observados so os nmeros de observaes
Ok nos n intervalos,
k = 1, 2, ..., n. Assim, o nmero de dados
observados justo n, o nmero de intervalos.
Portanto, nestes problemas considerados aqui
d=nc
onde n o nmero de intervalos e c, o nmero
de parmetros que so necessrios para se
calcular os nmeros esperados Ek, a partir dos
dados. O nmero c geralmente chamado de
nmeros de restries (constraint), como ser
explicado rapidamente.
O nmero de restries c varia de acordo
com o problema considerado. Seja primeiro o
experimento de lanamento de dados da
Seo 12.2. Se so lanados cinco dados e
testada a hiptese de os dados serem
honestos, a distribuio esperada de nmeros
de azes a distribuio binomial B5,1/6(), onde
= 0, 1, ..., 5. o nmero de azes em qualquer
um lanamento. Ambos os parmetros nesta
funo o nmero de dados (5) e a
probabilidade de sair um s (1/6) so
conhecidas a priori e no precisam ser
calculadas dos dados. Quando se calcula o
nmero esperado de ocorrncias de qualquer
particular, deve-se multiplicar a probabilidade
binomial pelo nmero total de lanamentos N
(no exemplo, N = 200). Este parmetro
depende dos dados. Especificamente, N justo
a soma dos nmeros Ok,

se calcular um parmetro (N) dos dados. O


nmero de restries portanto de
c=1
e o nmero de graus de liberdade
d=n-1
Na Tab. 12.5, os resultados do lanamento
de dados foram agrupados em quatro
intervalos (ou seja, n = 4), de modo que o
experimento tem trs graus de liberdade.
A eq. (12.12) ilustra bem a curiosa
terminologia de restries e graus de liberdade.
Uma vez o nmero N tenha sido determinado,
pode-se considerar (12.12) como uma equao
que restringe os valores de O1, O2, ..., On. Mais
especificamente, pode se dizer que, por causa
da restrio (12.12), somente n 1 dos
nmeros O1, O2, ..., On so independentes Por
exemplo, os primeiros (n 1) nmeros O1, O2,
..., On podem assumir quaisquer valores
(dentro de certas faixas), mas o ltimo nmero
On completamente determinado por (12.12).
Neste caso, somente (n 1) dos dados so
livres de assumir valores independentes, de
modo que se diz que h apenas (n 1) graus
independentes de liberdade. Por analogia,
quando se joga memria, o ltimo par a ser
virado determinstico e no aleatrio.
No primeiro exemplo deste captulo, a faixa
x de projetis era medida 40 vezes (N = 40). Os
resultados foram coletados em quatro
intervalos (n = 4) e comparados com o que era
esperado para uma distribuio de Gauss
GX,(x). Aqui, havia trs restries e assim,
apenas um grau de liberdade
d=nc=43=1
A primeira restrio era a mesma de
(12.12): o nmero total de observaes N a
soma das observaes Ok em todos os
intervalos. Mas aqui, h mais duas restries,
porque (como usual neste tipo de
experimento), no se conhecem a priori os
parmetros X e da esperada distribuio de
Gauss GX,(x). Assim, antes de se calcular os
nmeros esperados Ek, devem se estimar X e
usando os dados. Deste modo, h trs
restries ao todo, de modo que neste exemplo
d=n3

N=

(12.13)

(12.12)

k =1

Assim, calculando os resultados esperados


do experimento do lanamento de dados, deve

A propsito, este resultado explica por que


deve se usar, no mnimo, quatro intervalos
neste experimento. Ser visto que o nmero de
graus de liberdade deve sempre ser um ou
mais, de modo, que de (12.13) deve ser

126

Teste do Qui-Quadrado
escolhido
n 4.
Os exemplos considerados aqui sempre
tero, no mnimo, uma restrio (a saber, a
restrio
N = Ok, envolvendo o nmero total de
medies) e pode haver uma ou duas a mais.
Assim, o nmero de graus de liberdade, d,
varia de n 1 a n 3 (nos exemplos
mostrados). Quando n grande, a diferena
entre n e d pouco importante, mas quando n
pequeno (como geralmente , infelizmente),
h uma grande diferena.
Armado com esta noo de grau de
liberdade, pode se agora fazer um teste de qui
quadrado mais preciso. Pode ser mostrado
(embora no seja feito aqui), que o valor
esperado de 2 precisamente d, o nmero de
graus de liberdade,
(valor mdio esperado de 2) = d
(12.14)
Esta equao importante no signfica que
realmente se espera encontrar 2 = d aps
qualquer srie de medies. Ao invs, ele
significa que se possvel repetir o
experimento um nmero infinito de vezes e
computar 2 cada vez, a mdia destes valores
de 2 ser d. Mesmo assim, mesmo aps
apenas um conjunto de medies, uma
comparao de 2 com d um indicador da
concordncia. Em particular, se a distribuio
esperada era a distribuio correta, 2 seria
pouco provavelmente muito maior que d. Em
outras palavras, se encontrado 2 >> d, pode
se garantir que a distribuio esperada muito
pouco provvel de ser correta.
No se provou o resultado (12.14), mas
pode se ver que alguns aspectos do resultado
so razoveis. Por exemplo, como d = n c,
pode se reescrever (12.14) como
(valor mdio esperado de 2) = n c
(12.15)
Ou seja, para qualquer dado n, o valor
esperado de 2 ser tanto menor quanto maior
for c (isto , se so calculados mais parmetros
dos dados). Este resultado esperado. No
exemplo da seo (12.1), os dados foram
usados para calcular o centro X e a largura
da distribuio esperada. GX,(x).
Naturalmente, como X e so escolhidos para
encaixar os dados, seria esperado achar uma
concordncia algo melhor entre as distribuies
observada e esperada, pois, estas duas
restries extras devem reduzir o valor de 2.

Esta reduo justamente o que implica


(12.15).
O resultado (12.14) sugere um modo pouco
mais conveniente para pensar acerca do teste
do 2. introduzido o conceito do qui quadrado
reduzido ou qui quadrado por grau de
liberdade, que denotado por
2

= 2/d

(12.16)

Como o valor esperado de 2 d, v-se que


2

(valor mdio esperado de ) = 1


(12.17)
Assim, qualquer que seja o nmero de
graus de liberdade, o teste pode ser enunciado
2

assim: se obtido um valor de da ordem de


1 ou menos, ento no se tem razo para
duvidar da distribuio esperada; se for obtido
2

um valor de muito maior que 1, a


distribuio esperada pouco provvel de ser
correta.

Probleminha rpido 12.2.


Para o experimento do Probleminha rpido
12.1, qual o nmero de graus de liberdade, e
2

qual o valor do qui quadrado reduzido, ?


Resp.: d = 1 e

= 1,6.

12.5. Probabilidades para qui quadrado


O teste para verificar a concordncia entre
dados observados e sua distribuio esperada
ainda muito grosseiro. Agora se quer uma
medida quantitativa da concordncia. Em
particular, se quer alguma recomendao em
onde estabelecer um limite entre concordncia
e discordncia. Por exemplo, no experimento
da Seo 12.1, foram feitas 40 medies de
uma certa faixa x cuja distribuio seria,
acreditava-se, gaussiana. Os dados coletados
so separados em quatro intervalos e achou se
2 igual a 1,80. Com trs restries, havia
somente um grau de liberdade (d = 1), de modo
que o qui quadrado reduzido tambm igual a
1,80.
2

A questo agora : o valor de = 1,80


suficientemente maior que 1 para aceitar ou
rejeitar a distribuio de Gauss?

127

Teste do Qui-Quadrado
Para responder esta questo, comea-se
supondo que as medies eram governadas
pela distribuio esperada (de Gauss, neste
exemplo). Com esta hiptese, calcula-se a

e deve se rejeitar a distribuio esperada a


um nvel de 5% de significncia. Se o limite
estabelecido em 1%, ento se pode dizer que a
discordncia altamente significativa se

probabilidade de se obter uma valor de to


grande quanto ou maior que o valor de 1,80.
Aqui, esta probabilidade vale
2

Prob ( 1,80) = 18%


como ser visto logo. Ou seja, se os resultados
forem governados pela distribuio esperada,
haveria uma probabilidade de 18% de se obter
2

um valor de igual ou maior que 1,80. Em


outras palavras, neste experimento, um valor
2

de da ordem de 1,80 no de todo


improvvel e no se teria razo para rejeitar a
distribuio admitida.
O procedimento geral agora seria
razoavelmente claro. Aps completar qualquer
srie de medies, calcula-se o qui quadrado
reduzido, que ser denotado por

o2

(onde o

ndice o significa observado, por que o2 o


valor realmente observado). Depois,
assumindo que as medies sigam a
distribuio esperada, calcula-se a
probabilidade
2

Prob ( o2 )

(12.18)
2

de achar o valor de maior ou igual ao valor


observado o2 . Se esta probabilidade
grande, o valor o2 perfeitamente aceitvel e
no h razo para rejeitar a distribuio
esperada. Se esta probabilidade pequena,
2

um valor de da ordem de grandeza do


observado o2 muito pouco provvel (se as
medies forem distribudas como esperado) e
a distribuio esperada correspondentemente
improvvel de ser correta.
Como sempre, com testes estatsticos,
deve se decidir o limite entre o que
razoavelmente provvel e o que no . Duas
escolhas comuns so as j mencionadas
ligadas correlao. Com o limite em 5%,
pode se dizer que o valor observado o2 indica
discordncia significativa se
2

Prob (

o)

< 5%

Prob ( o2 ) < 1%
e rejeitar a distribuio esperada em um nvel
de significncia de 1%.
Qualquer que seja a escolha do limite para
rejeio, o nvel escolhido deve ser
estabelecido. Talvez mesmo mais importante,
deve-se estabelecer a probabilidade Prob
2

( o2 ), de modo que os leitores possam


julgar se o resultado razovel, por eles
mesmos.
O clculo das probabilidades Prob
2

( o2 ) muito complicado para ser descrito


aqui. Porm, os resultados podem ser
tabulados facilmente, como na Tab. 12.6 ou no
Apndice D. A probabilidade de obter qualquer
2

valor particular de depende do nmero de


graus de liberdade. Assim, pode se escrever a
probabilidade de interesse como
2

Probd( o2 ) para enfatizar sua dependncia


com d.
O clculo usual das probabilidades
2

Probd( o2 ) trata os nmeros observados


Ok como variveis continuas distribudas em
torno de seus valores esperados Ek, de acordo
com a distribuio de Gauss. Nos problemas
considerados aqui, Ok uma varivel discreta
distribuda de acordo com a distribuio de
Poisson. Desde que todos os nmeros
envolvidos sejam razoavelmente grandes, o
caracter discreto de Ok pouco importante e a
distribuio de Poisson bem aproximada da
distribuio de Gauss. Nestas condies, as
2

probabilidades tabuladas Probd( o2 )


podem ser usadas com segurana. Por este
motivo, diz se que os intervalos devem ser
escolhidos de modo que a contagem esperada
Ek em cada intervalo seja razoavelmente
grande (no mnimo, da ordem de 5). Pelo
mesmo motivo, o nmero de intervalos no
deve ser muito pequeno.
Com estas advertncias, pode se dar agora
2

as probabilidades calculadas Probd( o2 )


para alguns valores representativos de d e o2
na Tab. 12.6. Os nmeros nas colunas
esquerdas do seis escolhas de d, o nmero
de graus de liberdade (d = 1, 2, 3, 5, 10, 15).
Os de outra coluna d os valores possveis do

128

Teste do Qui-Quadrado
o2 observado. Cada clula na tabela mostra a
2

probabilidade percentual Probd( o2 ) como


uma funo de d e o2 . Por exemplo, com 10
graus de liberdade (d = 10), v-se que a
2

probabilidade de obter 2 de 3%,


2

Prob10( 2) = 3%
Assim, se obtido um qui quadrado
reduzido de 2 em um experimento com 10
graus de liberdade, pode-se concluir que as
observaes diferem significativamente da
distribuio esperada e deve se rejeitar a
distribuio esperada em um nvel de
significncia de 5% (embora no em 1%).
As probabilidades na segunda coluna da
2

Tab. 12.6 so todas 100%, por que so


sempre maiores ou iguais a 0. Quando o2
2

aumenta, a probabilidade de obter o2


diminui, mas em uma taxa que depende de d.
Assim, para dois graus de liberdade (d = 2),
2

Prob2( 1) 37%, enquanto que para d =


2

15, Prob15( 1) 45%. Note se que


2

Probd( 1) sempre aprecivel (no mnimo,


2

32%), de modo que um valor para o de 1 ou


menos perfeitamente razovel e nunca
requer rejeio da distribuio esperada.

129

Teste do Qui-Quadrado
2

Tab. 12.6. A probabilidade percentagem Probd( o2 ) de obter um valor de maior ou igual a qualquer valor particular
o2 , assumindo que as medies correspondentes so governadas pela distribuio esperada. Espaos em branco
indicam probabilidades menores que 0,05%. Para uma tabela mais completa, ver Apndice D.

o2

0,25

0,5

0,75

1,0

1,25

1,5

1,75

100

62

48

39

32

26

22

19

16

100

78

61

47

37

29

22

17

14

0,7

0,2

100

86

68

52

39

29

21

15

11

0,7

0,2

100
5

100

94

78

59

42

28

19

12

0,1

10

100

99

89

68

44

25

13

0,1

15

100

100

94

73

45

23

10

O mnimo valor de o2 que no requer


questionamento da distribuio esperada
depende de d. Para 1 grau de liberdade, v se
o2

que
pode ser to grande quanto 4 antes
que a discordncia se torne significativa (nvel
5%). Com 2 graus de liberdade, o limite
correspondente
o2 = 3; para d = 5, mais perto de 2

( o2 = 2,2, de fato).
Armado com as probabilidades da Tab. 12.6 (e
Apndice D), pode se agora atribuir uma
significncia quantitativa para o valor de o2
obtido em qualquer experimento particular.

12.6. Exemplos
Outro exemplo com distribuio de Gauss
O exemplo da seo 12.1 envolveu uma
medio para a qual os resultados foram
esperados ser normalmente distribudos. A
distribuio de Gauss ou normal to comum
que ser considerado outro exemplo com ela.
Seja um antroplogo interessado na altura dos
nativos de uma ilha. Ele suspeita que as alturas
dos homens sejam normalmente distribudas e
mede as alturas de uma amostra de 200
homens. Usando estas medies, ele calcula a
mdia e o desvio padro e usa estes nmeros
como melhores estimativas para o centro X e a
largura x da distribuio normal esperada
GX,(x). Ele agora escolhe oito intervalos, como
mostrado na Tab. 12.7 e agrupa suas
observaes, com os resultados mostrados na
terceira coluna.

130

Teste do Qui-Quadrado
Tab. 12.7. Medies das alturas de 200 homens adultos
Intervalo
k

Alturas nos intervalos

Nmero
observado

Nmero
esperado

menor que X 1,5

14

13,4

entre X-1,5 e X

29

18,3

entre X - e X 0,5

30

30,0

entre X - 0,5 e X

27

38,3

entre X e X + 0,5

28

38,3

entre X + 0,5 e X +

31

30,0

entre X + e X + 1,5

28

18,3

maior que X + 1,5

13

13,4

O antroplogo agora quer verificar se estes


resultados so consistentes com a distribuio
normal esperada GX,(x). Para esta finalidade,
ele primeiro calcula a probabilidade Probk que
qualquer um homem tenha altura em qualquer
intervalo particular k (assumindo uma
distribuio normal). Esta probabilidade a
integral de GX,(x) entre os limites dos
intervalos e facilmente encontrada da tabela
das integrais do Apndice B. O nmero
esperado Ek em cada intervalo ento a Probk
vezes o nmero total de homens amostrados
(200). Estes nmeros so mostrados na Tab.
12.7.
Para calcular os nmeros esperados Ek, o
antroplogo deve usar trs parmetros
calculados destes dados (nmero total da
amostra N, mdia X e largura ). Assim,
embora haja 8 intervalos, h 3 restries de
modo que o nmero de liberdade 5 (8 3).
Um clculo simples usando os dados da Tab.
12.7 d o qui quadrado reduzido:

hiptese de ter uma distribuio normal das


alturas.
Exemplo: Mais dados
Na seo 12.2 foi discutido um experimento
em que cinco dados eram lanados muitas
vezes e o nmero de azes em cada
lanamento era registrado. Foram feitos 200
lanamentos e divididos os resultados em 4
intervalos. Assumindo os dados honestos,
pode-se calcular os nmeros esperados como
antes. Estes nmeros esto mostrados na Tab.
12.8 (3a coluna).

Tab. 12.8. Distribuio de nmeros de vezes em 200


lanamentos de 5 dados
Intervalo
k

Resultados nos
intervalos

1
2
3
4

Zero s
1 s
2 azes
3, 4 ou 5
azes

Nmero
esperado, Ek

80,4
80,4
32,2
7,0

Nmero
observado, Ok

60
88
39
13

No teste real, cinco dados foram jogados


200 vezes e os nmeros da ltima coluna
foram registrados. Para testar a concordncia
entre as distribuies observadas e esperadas,
simplesmente se nota que h trs graus de
liberdade (4 intervalos menos 1 restrio) e se
calcula
2

1 4 (O k E k ) 2
= 4,16
3 k =1
Ek

Voltando Tab. 12.6, v se que com estes


trs graus de liberdade, a probabilidade de se
2

1
d

i =1

(O k E k ) 2
= 3,5
Ek

Como este nmero muito maior que 1,


imediatamente se suspeita que as alturas dos
nativos no sigam a distribuio normal. Mais
especificamente, v-se da Tab. 12.6 que, se as
alturas dos nativos fossem distribudas como
2

esperado, ento a probabilidade Prob5(


2

3,5) de obter 3,5 aproximadamente


0,5%. Por qualquer padro, este valor muito
pouco provvel e se conclui que as alturas dos
nativos so muito pouco provveis de ser
normalmente distribudas. Em particular, a 1%
(altamente significante), pode se rejeitar a

obter ( 4,16) aproximadamente 0,7%, se


os dados forem honestos. Conclui-se que os
dados so quase certamente viciados. A
comparao dos nmeros Ek com Ok na Tab.
12.8 sugere que, no mnimo, um dado est
viciado para dar s.
Exemplo: Distribuio de Poisson
Como ltimo exemplo do uso do teste do
qui quadrado, seja um experimento em que a
distribuio esperada a distribuio de
Poisson. Seja um contador Geiger para contar
a chegada de raios csmicos em um certo
local. Suponha se que contado o nmero de
partculas que chegam em 100 intervalos
separados de 1 minuto e os resultados so
registrados como na Tab. 12.9.

131

Teste do Qui-Quadrado
Tab. 12.9. Nmeros de raios csmicos observados em
100 intervalos separados de 1 minuto.
Contagens,
por min.

Ocorrncias

Zero
Um
Duas
Trs
Quatro
Cinco
Seis
Sete
Oito ou +

7
17
29
20
16
8
1
2
0

Total

100

Intervalo
k

Observaes,
Ok

Esperado,
Ek

1
2
3
4
5

7
17
29
20
16

7,5
19,4
25,2
21,7
14,1

11

12,1

1
d

i =1

O valor de = 0,35 encontrado neste


experimento realmente muito menor que 1,
indicando que as observaes se encaixam na
distribuio de Poisson muito bem. Este
pequeno valor no d, porm, uma maior
evidencia que as medies sejam governadas
pela distribuio esperada do que um valor
2

Verificando-se os nmeros na coluna 2,


imediatamente se percebe que todas as
contagens 5 foram agrupadas em um nico
intervalo. Esta escolha de seis intervalos (k = 1,
2, ..., 6) mostrada na terceira coluna e os
correspondentes nmeros Ok na quarta coluna.
A hiptese que se quer testar que o
nmero governado pela distribuio de
Poisson P(). Como a contagem mdia
esperada desconhecida, deve-se primeiro
calcular a mdia das 100 contagens. Este valor
facilmente achado e igual a = 2,59, que
d a melhor estimativa para . Usando este
valor = 2,59, pode se calcular a probabilidade
P() de qualquer contagem e assim calcular
os nmeros esperados Ek, como mostrado na
ltima coluna de Tab. 12.9.
Para calcular os nmeros Ek, so usados
dois parmetros baseados nos dados, o
nmero total de observaes (N = 100) e a
estimativa
( = 2,59). Note se que, como a distribuio de
Poisson completamente determinada por ,
no se precisa estimar o desvio padro .) H,
portanto, duas restries, que reduzem os seis
intervalos para quatro graus de liberdade, d =
4.
Um clculo simples, usando os nmeros
das duas ltimas colunas da Tab. 12.9, d o
qui quadrado reduzido.
=

De modo que o experimento no d


nenhuma razo para duvidar da distribuio de
Poisson esperada.

prximo de = 1, Se os resultados so
realmente governados pela distribuio
esperada e se as sries de medies so
repetidas muitas vezes, deve se esperar muitos
2

valores diferentes de , flutuando em torno


de um valor mdio. Assim, se as medies so
governadas pela distribuio esperada, um
2

valor de = 0,35 justo um resultado de uma


provvel grande flutuao longe do valor mdio
esperado. De nenhum modo isto d um peso
extra concluso que as medies parecem
seguir a distribuio esperada.

(O k E k ) 2
= 0,35
Ek

Como este valor menor que 1, pode se


concluir imediatamente que a concordncia
entre as observaes e a distribuio de
Poisson esperada satisfatria. Mais
especificamente, v se da tabela do Apndice
2

D que um valor de da ordem de 0,35


muito provvel; de fato
2

Prob4( 0,35) = 85%

132

Teste do Qui-Quadrado
o2 muito maior que 1, tem-se razo para
duvidar da distribuio em que se esperava
basear os valores esperados Ek. Da tabela do
Apndice D, pode-se achar a probabilidade

Principais Definies e Equaes do


Captulo 12.
Definio de qui quadrado
Se so feitas n medies das quais se
conhece ou se pode calcular o valor mdio
esperado e o desvio padro, ento se define
=
2

valor observado - valor esperado

desvio padro

[Ver (12.11)]

Nos experimentos considerados neste


captulo, as n medies eram os nmeros O1,
O2, ... On de vezes que o valor de alguma
quantidade x era observada em cada um dos n
intervalos. Neste caso, o nmero esperado Ek
determinado pela distribuio assumida de x e

Probd( o2 )

de se obter um valor to grande quanto o2


assumindo que a distribuio esperada seja
correta. Se esta probabilidade pequena, tem
se razo para rejeitar a distribuio esperada.
Se ela menor que 5%, deve se rejeitar a
distribuio assumida a um nvel de 5% de
significncia. Se a probabilidade menor que
1%, deve se rejeitar a distribuio a um nvel
de 1%, altamente significante.

o desvio padro justo Ek e portanto


2 =

(O k E k ) 2
Ek
k =1
n

[Ver (12.7)]

Se a distribuio assumida de x correta,


ento 2 deve ser da ordem de n. Se 2 >> n, a
distribuio assumida provavelmente
incorreta.

Graus de liberdade e qui quadrado


reduzido
Se o experimento completo repetido
vrias vezes, o valor mdio de 2 deve ser igual
a d, o nmero de graus de liberdade definido
como
d=nc
onde c o nmero de restries, o nmero de
parmetros que devem ser clculos dos dados
para computar 2.
O qui quadrado reduzido definido como
2

= 2/d

[Ver (12.16)]

Se a distribuio assumida correta,


2

deve ser da ordem de 1. Se for muito


maior que 1, os dados no encaixam na
distribuio assumida de modo satisfatrio.

Probabilidades para qui quadrado.


Suponha-se que obtido o valor o2 para o
qui quadrado reduzido em um experimento. Se

Apostilas\Incerteza

JRTaylor8.doc

31 JAN 98 (Substitui 01 JAN 98)

133

Apndice A: Integral do Erro Normal

Apndice A
Integral do Erro Normal I

Se a medio de uma varivel contnua x sujeita a muitas pequenas incertezas,


todas elas aleatrias, a distribuio esperada de resultados dada pela distribuio
normal ou de Gauss,
G X, ( x ) =

1
2

e( x X )

/ 2 2

onde
X o valor verdadeiro de X
o desvio padro
b
A integral da funo distribuio normal, a G X, ( x )dx chamada de integral do
erro normal e a probabilidade que uma medio caia entre x = a e x = b,
Pr ob(a x b) =

a G X, ( x )dx

A Tab. A mostra esta integral para a = X t e b = X + t. Ela d a probabilidade


de uma medio dentro t desvios padro de cada lado de X,
Prob(dentro t) = Prob(X t x X + t)
X + t

X t G X, ( x )dx =

t z2 / 2

e
2 t

dz

A probabilidade de uma medio fora do mesmo intervalo pode ser achada pela
subtrao
Prob(fora t) = 100% - Prob(dentro t)

134

Apndice A: Integral do Erro Normal


Tab. A. Probabilidade em percentagem,
Prob(dentro t) =

X + t

X t G X, ( x )dx , como uma funo de t.

135

Apndice B: Integral do Erro Normal, II

Apndice B
Integral do Erro Normal, II

Em certos clculos, uma forma conveniente da integral do erro normal


Q( t ) =
1

X + t

G X, ( x )dx

t z2 / 2

e
2 0

dz

Esta integral , obviamente, igual metade da integral tabulada no Apndice A. A


probabilidade Pr ob(a x b) de uma medio em qualquer intervalo (a x b) pode
ser encontrada de Q(t) por uma simples subtrao ou soma. Por exemplo,
Pr ob( X + x X + 2)

= Q(2) Q(1).

Do mesmo modo,
Pr ob( X 2 x X + )

= (Q2) + Q(1).

A probabilidade de uma medio maior que qualquer X + t justo 0,5 Q(t).


Por exemplo.
Prob(x X + ) = 50% - Q(1).

136

Apndice B: Integral do Erro Normal, II

Tab. A. Probabilidade em percentagem,


Prob(dentro t) =

X + t

G X, ( x )dx , como uma

funo de t.

137

Apndice D: Probabilidades para Coeficientes de Correlao

Apndice C
Probabilidades para Coeficientes de Correlao

A extenso em que N pontos (x1, y1), ..., (xN, yN) encaixam em uma linha reta
indicado pelo coeficiente de correlao linear

r=

xy
xy

( x x)( y y)
(x x) (y y)
i

que sempre cai no intervalo 1 r 1. Valores de r prximos de 1 indicam uma


boa correlao linear; valores prximos de 0 indicam pouca ou nenhuma correlao.
Uma medio mais quantitativa do encaixe pode ser encontrada usando a Tab.
C. Para qualquer valor observado ro, ProbN(|r| |ro|) a probabilidade que N
medies de duas variveis no correlacionadas dem um coeficiente r to grande
quanto ro. Assim, quando se tem um coeficiente ro para que ProbN(|r| |ro|)
pequena, pouco provvel que as variveis no sejam correlacionadas, ou seja,
uma correlao indicada. Em particular, se ProbN(|r| |ro|) < 5%, a correlao
considerada significativa. Se ProbN(|r| |ro|) , 1% a correlao considerada
altamente significativa.
Por exemplo, a probabilidade que 20 medies (N = 20) de duas variveis no
correlacionadas seja |r| 0,5 dada na tabela como 2,5%. Assim, se 20 medies
do r = 0,5, tem-se uma evidncia significativa de uma correlao linear entre as
duas variveis. Para mais detalhes, ver Sees 9.3 a 9.5.
Os valores na Tab. C foram calculados da integral

Pr ob N ( r ro ) =

2[(N 1) / 2]

(1 r

ro
[(N 2) / 2]

2 (N 4 ) / 2

dr

138

Apndice D: Probabilidades para Coeficientes de Correlao


Tab. C. A probabilidade em percentual ProbN(|r| |ro|) que N medies de duas variveis no
correlatas dem um coeficiente de correlao com |r| ro como uma funo de N e ro. (Espaos
em branco significam probabilidades menores que 0,05%.)

139

Apndice D: Probabilidades para Coeficientes de Correlao

Apndice D
Probabilidades para Qui Quadrado (2)

Se uma srie de medies agrupada em intervalos k =1, 2, ..., n, chama-se de Ok, o nmero
de medies observadas no intervalo k. O nmero esperado (na base de alguma distribuio
assumida ou esperada) no intervalo k chamado de Ek. A extenso em que as observaes se
encaixam na distribuio assumida indicada pelo qui quadrado reduzido,

1
=
d
2

i =1

(O k E k ) 2
Ek

onde d o nmero de graus de liberdade, d = n c, e c o nmero de restries (ver Seo 12.3).


O valor mdio esperado de
na distribuio assumida; se

1. Se

>> 1, os resultados observados no se encaixam

< 1, a concordncia satisfatria.

o2

O teste feito quantitativa com as probabilidades mostradas na Tab. D. Seja


valor de

o2

denotando o

realmente obtido no experimento com d graus de liberdade. O nmero Probd(

) a probabilidade de se obter um valor de

to grande quanto o

o2

observado, se as

medies realmente seguem a distribuio assumida. Assim, se Probd( o ) grande, as


distribuies observada e esperada so consistentes; se pequena, elas provavelmente esto em
2

desacordo. Em particular, se Probd(

o2

) < 5%, diz se que o desacordo significativo e

se rejeita a distribuio ao nvel de 5%. Se Probd( o ) < 1%, o desacordo chamado de


altamente significativo e se rejeita a distribuio assumida ao nvel de 1%.
2

Por exemplo, obteve-se um qui quadrado reduzido, de 2,6 ( o = 2,6) no experimento com
2

seis graus de liberdade (d = 6). De acordo com a Tab. D, a probabilidade de se obter o 2,6
1,6%, se as medies forem governadas pela distribuio assumida. Assim, ao nvel de 5% (mas
no ao nvel de 1%), pode rejeitar a distribuio assumidade.
2

140

Apndice D: Probabilidades para Coeficientes de Correlao


Tab. D. A probabilidade em percentual Probd(

2
o2 ) de se obter um valor de o2

em um experimento com d graus de liberdade, como funo de d e o2 . (Espaos em branco


significam probabilidades menores que 0,05%.)

Os valores na Tab. D foram calculados da integral


Pr ob d ( 2 o2 ) =

d/2

d 1 x 2 / 2
2
x e
dx

(d / 2) o

141

Referncias Bibliogrficas
01. Almeida, G. Sistema Internacional de Unidades (SI), Lisboa, Platano, 1988.
02. Arnold, K.L., Guia Gerencial para a ISO 9000, Rio de Janeiro, Editora Campus, 1995.
03. Anthony, D.M., Engineering Metrology, Oxford, Pergamon, 1986.
04. AT & T Technologies, Statistical Quality Control Handbook, Charlotte, Delmar, 1984.
05. Banks, J., Principles of Quality Control, New York, John Wiley, 1989.
06. Barney, G.C., Intelligent Instrumentation, 2a. ed., Longon, Prentice Hall, 1988.
07. Benedict, R.P., Fundamentals of Temperature, Pressure and Flow Measurements, 2a. ed.,
New York, John Wiley, 1977.
08. Bentley, J.P., Principles of Measurement Systems, 2a. ed., Singapore, Longman, 1983.
09. Berkov, V., Metrologie Industrielle, Moscow, MIR, 1983.
10. Besterfield, D.H., Quality Controle, 4a. ed., Englewood Cliffs, Prentice-Hall, 1994.
11. Cheremisinoff, N.P. & Cheremisinoff, P.N., Unit Conversions and Formulas, Ann Arbor,
Butterworth, 1980.
12. Connell, B., Process Instrumentation Applications Manual, New York, McGraw-Hill, 1996.
13.Coyne, G.S., Laboratory Handbook of Materials, Equipment, & Technique, Englewood Cliffs,
Prentice-Hall, 1992.
14. Cox, D.R., Planning of Experiments, Singapore, John Wiley, 1958.
15. Dally, J.W., Riley, W.F. & McConnell, K.G., Instrumentation for Engineering Measurements,
2a. ed., Singapore, John Wiley, 1993.
16. Dieck, R.H., Measurement Uncertainty - Methods and Applications, Research Triangle Park,
ISA, 1992.
17. Dieter, G.E., Engineering Design, 2a. ed., Singapore, McGraw-Hill, 1991.
18. Doebelin, E.0., Engineering Experimentation, Singapore, McGraw-Hill, 1995.
19. Doebelin, E.0., Measurement systems, 4a. ed., Singapore, McGraw-Hill, 1990.
20. Figliola, R.S. & Beasley, D.E., Theory and Design for Mechanical Measurements, 2a. ed.,
Singapore, John Wiley, 1995.
21. Fleming, M.C. & Nellis, J.G., Essence of Statistics for Business, Hertfordshire, Prentice Hall,
1991.
22. Fluke, Calibration: Philosophy in Pratice, Everett, Fluke, 1994
23. Friesth, E.R., Metrication for Manufacturing, New York, Industrial Press, 1978.
24. Gibbings, J.C., Systematic Experiment, Cambridge, Cambridge University Press, 1986.
25. Grant, E.L. & Leavenworth, R.S., Statistical Quality Control, 6a. ed., Singapore, McGraw-Hill,
1977.
26. Halpern S., Assurance Sciences - Introduction to Quality Control & Reliability, Englewood
Cliffs, Prentice-Hall, 1978.
27. Hamburg, M. & Young, P., Statistical Analysis for Decision Making, 6a. ed., Orlando, Dryden,
1994.
28. Hicks, C.R., Fundamental Concepts in Design of Experiments, 3a. ed., New York, Holt,
Rinehart and Winston, 1982.
29. Hoel, P.G., Elementary Statistics, 4a. ed., Singapore, John Wiley, 1976.
30. Holman, J.P., Experimental Methods for Engineers, 6a. ed., Singapore, McGraw-Hill, 1994.
31 Hutchins, G.B., Introduction to Quality - Control, Assurance and Management, New York,
Macmilan, 1991.
32. Hutchins, G.B., ISO 9000 - Um Guia Completo, So Paulo, Makron, 1994.
33. Jones, B.E., Instrumentation, Measurement, and Feedback, London, McGraw-Hill, 1977.
34. Jones, L.D. & Chin, A.F., Electronic Instruments and Measurements, 2a. ed., Englewood Cliffs,
Prentice-Hall, 1991.
35. Juran, J.M. & Gryna, F.M., Quality Planning and Analysis, 3a. ed., Singapore, McGraw-Hill,
1993.
36. Kalvelagen, E. & Tijms, H.C., Exploring Operations Research & Statistcs , Englewood Cliffs,
Prentice-Hall, 1990.
37. Karim, G.A. & Hamilton, A.B., Metrication, Boston, IHRDC, 1981.
38. Kateman, G.A. & Pijpers, F. W., Quality Control in Analytical Chemistry, New York, John
Wiley, 1981.
39. Kume, H., Metodos Estatisticos para Melhoria da Qualidade, So Paulo, Editora Gente, 1993.

142

40. MacLean, G.E., Documenting Quality for ISO 9000 and Other Industry Standards, Milwaukee,
ASQC Press, 1993.
41. Mayne, R. & Margolis, S., Introduction to Engineering, New York, McGraw-Hill, 1982.
42. Meloun, M., et alt., Chemometrics for Analytical Chemistry, Chichester, Ellis Horwood, 1992.
43. Mitra, A., Fundamentals of Quality Control and Improvement, New York, Macmilan, 1993.
44. Montgomery, D.C. & Runger, G.C., Applied Statistics and Probability for Engineers, New York,
John Wiley, 1994.
45. Morris, A. S., Principles of Measurement and Instrumentation, Wiltshire, Prentice Hall, 1993.
46. Nachtigal, C.L., Instrumentation & Control, New York, John Wiley, 1990
47. Nakra, B.C. & Chaudhry, K.K., Instrumentation Measurement and Analysis, New Delhi, Tata
McGraw-Hill, 1985.
48. Noltingk, B.E. (editor), Instrumentation - Reference Book, 2a. ed., Surrey, ButterworthsHeinemann, 1995.
49. Ott, E.R. & Schilling, E.G., Process Quality Control, 2a. ed., New York, Mc-Graw-Hill, 1990.
50. Phadke, M.S., Quality Engineering Using Robust Design, Englewood Cliffs, Prentice-Hall,
1989.
51. Pedde, L.D., Foote, W.E. et alt., Metric Manual, Denver, US Government Printing Office, 1978.
52. Pennella, C.R., Managing the Metrology System, Milwaukee, ASQC Quality Press, 1992.
53. Pyzdek, T. & Berger, R.W., Quality Engineering Handbook, New York, Marcel Dekker, 1992.
54. Ray, M.S., Engineering Experimentation, Cambridge, McGraw-Hill, 1992.
55. Rothery, B., ISO 9000, So Paulo, Makron, 1993.
56. Rowbotham, G.E., Engineering and Industrial Graphics Handbook, New York, McGraw-Hill
Book, 1982.
57. Santos Jr., M.J. & Irigoyen, E.R.C., Metrologia Dimensional, Porto Alegre, EUFRGS, 1985.
58. Souto, F.C.R., Viso da Normalizao, Rio de Janeiro, Qualitymark, 1991.
59. Sydenham, P.H., Measuring Instruments: Tools of Knowledge and Control, London, Peter
Peregrinus, 1979.
60. Taylor, J.R., Quality Control Systems, Singapore, McGraw-Hill, 1989.
61. Taylor, J.R., Error Analysis, 2a ed., Sausalito, University Science Books, 1997.
62. Waeny, J.C., Controle Total da Qualidade Metrolgica, So Paulo, Makron, 1992.

143