Você está na página 1de 95

FUNDAMENTOS DA ESTATÍSTICA

PARA METROLOGIA
Prof. Pedro Paulo Novellino do Rosário, M.Sc.
(021) 99948.6288
pedropaulonovellino@gmail.com
SUMÁRIO 1. ESTATÍSTICA APLICADA A METROLOGIA

1.1. Apresentação dos dados 1.3. Distribuições de 1.4. Teorema central do limite
 Experimentos aleatórios probabilidades  Combinação de distribuições
 Dados não agrupados  Distribuição discreta e  Teorema central do limite
 Dados agrupados em rol contínua
 Média, variância e desvio 1.5. Exemplos de aplicações de
 Dados agrupados por valor
padrão de uma distribuição distribuições de probabilidade
 Histograma  Critério de Chauvenet: rejeição
de probabilidade
1.2. Medidas de tendência  Distribuição uniforme ou de uma leitura
central e medidas de dispersão retangular  Incerteza da resolução de leitura:
 Média da população, média  Distribuição triangular estudo de duas situações
da amostra, mediana, moda  Distribuição em forma de U distintas
 Amplitude  Distribuição normal  Incerteza da histerese
 Variância da população e  Distribuição normal
variância da amostra padronizada
 Desvio padrão da população  Distribuição t-Student
e desvio padrão da amostra  Fator de abrangência
 Coeficiente de variação
1. Estatística Aplicada a Metrologia

Neste curso você aprenderá os conceitos e as principais, e necessárias, ferramentas


estatísticas. Entretanto, nossa abordagem será na efetiva utilização destes conteúdos
para as aplicações da Metrologia.
Não discutiremos, por exemplo, arranjos, permutações, combinações, espaço amostral,
técnicas de amostragem ..., e sim formas de apresentação e tratamento de dados
mensurados, medidas de tendência central e de dispersão (tais como média,
amplitude, variância, desvio padrão, coeficiente de variação) e as principais
distribuições de probabilidade adotadas no estudo da Metrologia (uniforme, triangular,
normal, t-Student e forma de U).
E o mais importante, como aplicar corretamente essas ferramentas!

3
Aqui caberia uma pergunta: mas por quê precisamos conhecer essas ferramentas
estatísticas para trabalhar na Metrologia?
Bem, é sabido que toda medida realizada apresenta uma incerteza de medição
associada e que, dependendo do tipo e da qualidade do instrumento ou do sistema
utilizado, pode ser pequena, ou não, comparativamente falando com o resultado da
medição propriamente dita.
Desta forma, podemos afirmar que:
RM = X + U onde
RM = expressão do resultado final da medição,
X = valor da medição (ou da média das medições) realizada e
U = incerteza da medição.

4
No Vocabulário Internacional de Metrologia (também conhecido por
VIM-2012) encontramos a seguinte definição para a Incerteza de
Medição:
“parâmetro não negativo que caracteriza a dispersão dos valores
atribuídos a um mensurando ...”
O VIM-2012 cita, ainda, que “o parâmetro pode ser um desvio padrão
(incerteza padrão) ou a metade da amplitude de um intervalo tendo uma
probabilidade de abrangência determinada.”
Percebemos, então, que a incerteza de medição é um parâmetro
avaliado por meio de algumas ferramentas estatísticas.

5
1.1. Apresentação dos Dados

Em uma medição existem diversos fatores metrológicos que podem


influenciar no seu resultado, uns mais, outros menos. Assim, flutuações
naturais podem implicar que medições repetidas nem sempre apresentem
valores iguais, ou seja, cada fator pode influenciar diferentemente no
sistema de medição, podendo inclusive ocasionar erros.

6
Medições são experimentos aleatórios e podem ser repetidos
indefinidamente, e uma vez repetidos, provavelmente obteremos
resultados diferentes.
Experimentos aleatórios estão associados a um espaço amostral, ou
população.
A população N é definida como todos os elementos que estão disponíveis
para uma avaliação. Essa população pode ser um número finito (por
exemplo, o total de moradores de um prédio) ou infinito (por exemplo, o
conjunto de números naturais).
Uma amostra n representa uma parcela da população, mas que deve ser
retirada de modo a apresentar as características e representar
adequadamente essa população de origem.
7
Exemplo: medição de um produto com uma balança

Podemos considerar que a população N é infinita, pois


não há um número finito de medições possíveis de
serem realizadas.

Entretanto, quando estabelecemos um determinado


número de medições (em uma calibração ou
verificação, por exemplo) estamos criando uma
amostra n. Assim, se definíssemos 5 medições,
teríamos n = 5; 10 medições, n = 10.

8
Finalizado esse processo de medição obtém-se um determinado valor que
representará uma estimativa do resultado da medição. A partir do
resultado dessa amostra e atribuindo-se um determinado grau de
confiança, pode-se analisar o comportamento da balança como um todo.

Conclusões obtidas com base em uma amostra, ou quantidade de dados,


agilizam o processo de medição e reduzem custos.

Por isso que a análise estatística é fundamental para a Metrologia, pois


possibilita a descrição dos dados a partir de medidas de tendência central,
medidas de dispersão, distribuição de probabilidades, seguido da análise e
interpretação dos resultados obtidos.
9
Dados não agrupados

A norma ABNT NBR 14105, por


exemplo, estabelece que a
temperatura do local de calibração de
manômetros tipo Bourdon deve estar
compreendida entre (20 ± 2) °C.
Foram realizadas 80 medições ao
longo de um dia e os resultados
obtidos encontram-se a seguir.
Pergunta: Todas as medições estão
dentro do intervalo de tolerância
estabelecido pela norma?

10
Vamos realizar outras perguntas.
Qual foi o valor que preponderou no conjunto de medições?
As medições variaram muito ou pouco?

Já pensaram se ao invés de 80 medições tivéssemos 8 000?

Concordam que deve haver uma forma mais adequada de dispor esses
dados para facilitar as respostas?

11
Dados agrupados: Rol

O rol consiste em agrupar os dados de forma crescente, ou decrescente. Para o


exemplo da temperatura vamos colocar em ordem crescente de valores.
18 18 18 18 18 18 18 18
18 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19
19 19 19 19 19 19 19 19
19 20 20 20 20 20 20 20
20 20 20 20 20 21 21 21
21 21 21 21 21 21 21 21
21 21 21 21 21 21 21 21
21 21 21 22 22 22 22 22
22 22 22 22 22 22 22 22

Com o rol fica fácil responder se os resultados estão dentro da tolerância. Basta olhar
o primeiro (18 °C) e o último (22 °C).
Mas ainda não está tão imediato responder as outras perguntas!

12
Dados agrupados por valor

Significa ordenar semelhante com semelhante, ou seja, agrupar valores


iguais em classes dispondo-os em uma tabela, que tem o nome de
distribuição de frequências.

Existem quatro tipos de frequências:


• frequência absoluta simples (fa)
• frequência absoluta acumulada (Fa)
• frequência relativa simples (fr)
• frequência relativa acumulada (Fr)

13
• Frequência absoluta simples (fa):

Corresponde ao número de ocorrências de um valor dentro de uma classe.

18 18 18 18 18 18 18 18
18 18 18 18 18 18 18 19 Valor °C fa
19 19 19 19 19 19 19 19 18 15
19 19 19 19 19 19 19 19
19 20 20 20 20 20 20 20 19 18
20 20 20 20 20 21 21 21 20 12
21 21 21 21 21 21 21 21 21 22
21 21 21 21 21 21 21 21 22 13
21 21 21 22 22 22 22 22
22 22 22 22 22 22 22 22 S (soma) 80

Por essa tabela podemos observar que o valor preponderante foi 21 °C, que
apareceu 22 vezes!

14
• Frequência absoluta acumulada (Fa):

Corresponde à soma das frequências absolutas da classe atual com o somatório das
frequências imediatamente anteriores a ela.

Valor °C fa Fa
18 15 15
19 18 33
20 12 45
21 22 67
22 13 80

Por essa tabela observa-se que mais da metade dos dados (45 de 80) está entre
18 e 20 °C!

15
• Frequência relativa simples (fr):

É a razão entre a frequência absoluta simples da classe e o tamanho da amostra(n).

Valor °C fa fr
18 15 18,75 % fr =
19 18 22,5 %
20 12 15 %
21 22 27,5 %
22 13 16,25 %
S 80 100%

Por essa tabela percebe-se que os valores de 19 e 21 °C juntos representam 50%


dos valores. Os 50% restantes estão distribuídos por 18, 20 e 22 °C.

16
• Frequência relativa acumulada (Fr

Corresponde à soma das frequências relativas da classe atual com o somatório das
frequências relativas imediatamente anterior.

Valor °C fa fr Fr

18 15 18,75 % 18,75 %
19 18 22,5 % 41,25 %
20 12 15 % 56,25 %
21 22 27,5 % 83,75 %
22 13 16,25 % 100 %

Por essa tabela observa-se que mais da metade dos dados (56,25 %) está entre 18 e
20 °C!
17
Histograma
O histograma é um gráfico de barras retangulares que permite visualizar a distribuição
das frequências relativas, ou absolutas, do conjunto de dados. A base de um retângulo
representa uma classe da tabela de frequências. A altura da barra é proporcional ao
valor da frequência contida na classe. A escala horizontal do gráfico é quantitativa. A
escala vertical indica a frequência absoluta ou relativa.
Histograma
No exemplo verifica-se que o valor 2,1
40 tem a maior frequência (35).
30 Além de ser o valor mais recorrente é o
frequência

20
valor central do conjunto de dados. Os
10
0 demais valores estão dispersos no
1,1 1,4 1,6 1,8 2,1 2,3 2,5 2,7 Mais entorno desse valor central.
intervalo

18
Como desenvolver um Histograma?
Temperatura (°C)
49,59 49,60 49,63 49,64 49,66 49,68

Ex.: Considere o conjunto de 49,59 49,61 49,63 49,65 49,67 49,68

dados como 60 valores de 49,59 49,62 49,63 49,65 49,67 49,68

temperatura de um forno de 49,59 49,62 49,64 49,65 49,67 49,69

calibração, estabilizado em 49,60 49,62 49,64 49,66 49,67 49,69

torno de 50,00 °C. 49,60 49,62 49,64 49,66 49,67 49,69

49,60 49,62 49,64 49,66 49,67 49,69

49,60 49,62 49,64 49,66 49,67 49,70

49,60 49,62 49,64 49,66 49,67 49,70

49,60 49,63 49,64 49,66 49,68 49,70

19
É possível obter um histograma utilizando o software Excel.

Como fazer isso?

20
1.2. Medidas de Tendência Central e Medidas de Dispersão
MEDICÃO

COLETA DE DADOS

VALORES DISTINTOS

VALORES AGRUPADOS ALEATORIAMENTE


EM TORNO DE UM VALOR MAIS PROVÁVEL

ESTATÍSTICA – medidas de tendência central e


medidas de dispersão
21
Medidas de Tendência Central

Média da População (μ)


Corresponde à soma de todos os valores pertencentes 
ao conjunto dividido pelo número de dados do
conjunto.

A população n pode ser finita (ex.: total de alunos de uma escola) ou infinita (ex.:
número de medições feitas por um instrumento).

Quando n → , usamos uma amostra com n finito, e a média será representada pela
média amostral ().

22
Média Amostral ()
𝑛
A expressão é idêntica à da média µ, entretanto, n 1
𝑥= ∑ 𝑥 𝑖
é o tamanho da amostra e não da população: 𝑛 𝑖=1

Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 52,0

23
Mediana

É o número central de um grupo de números. Se houver uma quantidade par


de números, a mediana é a média dos dois números do meio.

Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 52,0

Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 38,0 52,0

24
Moda
É o número que ocorre com mais frequência em um grupo de números.
Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 52,0

18 17 18 18 21 18 18 18
18 20 18 18 18 18 19 19
19 19 19 19 19 19 19 19
19 19 20 19 19 19 19 19
19 20 20 20 20 20 20 20
20 20 18 20 20 21 21 21
21 21 21 21 20 20 21 21
21 23 21 21 19 20 23 21
21 21 21 22 20 22 21 22
22 22 22 22 20 22 22 22 25
Medidas de Dispersão
As medidas de tendência central fornecem apenas o valor do centro dos dados. Elas
não indicam como está a dispersão dos valores entorno do valor central.
Exemplo: as figuras possuem o mesmo valor central, entretanto, a curva azul possui a
menor dispersão de valores e a vermelha a maior.

26
Amplitude
É a medida de dispersão mais simples, e corresponde a diferença entre o maior e o
menor valor do conjunto de dados.

18 18 18 18 18 18 18 18 A = Xmáximo - Xmínimo
18 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19
19 19 19 19 19 19 19 19
Valores em °C 19 20 20 20 20 20 20 20
20 20 20 20 20 21 21 21
21 21 21 21 21 21 21 21
21 21 21 21 21 21 21 21
21 21 21 22 22 22 22 22
22 22 22 22 22 22 22 22

A amplitude é usada na montagem de um histograma.

27
Apesar de ser uma medida de dispersão, a Amplitude não considera, e
também não é influenciada, pelos valores intermediários.

Mesmo aumentando o número de dados a Amplitude nunca diminuirá. Ela


poderá até aumentar.

Por exemplo, se em três novas medições encontrarmos 18, 20 e 19 °C, a


amplitude permanece 4 °C. Porém, se em uma nova medição
encontrarmos 17 ou 23 °C, a amplitude aumenta para 5 °C (22-17 ou 23-
18).

28
Variância da população (2)

A variância da população é o somatório dos desvios ao quadrado, que


corresponde à diferença de cada valor do conjunto de dados em
relação à média .

2
𝜎 =𝑉 ( 𝑥 ) = 𝐸 ¿
𝜇=𝐸( 𝑥)
2
𝜎 =𝑉 ( 𝑥 ) = 𝐸 ¿

29
Variância Amostral (s²)

Como na metrologia trabalhamos com amostras, temos a média . Assim,


iremos utilizar a variância amostral s².

A unidade de medida da variância corresponde à unidade da grandeza ao


quadrado, exceto quando se tratar de grandezas adimensionais, como
por exemplo o pH ou o índice de refração.
Veremos que a variância será útil na estimativa da incerteza de medição,
entretanto, ela é pouco prática na apresentação da dispersão pois sua
unidade é ao quadrado. Dessa forma, precisamos recorrer ao desvio
padrão.

30
Desvio Padrão Amostral (s)

O desvio padrão amostral (s) descreve a variação do conjunto na unidade


original da medida, a partir da raiz quadrada da variância.

Dessa forma, o desvio padrão torna-se muito útil para descrever a


variabilidade do conjunto de dados quando comparado à amplitude e à
variância.
O desvio padrão amostral e a média aritmética são, sem dúvida, as
medidas estatísticas mais utilizadas no contexto metrológico.

31
Coeficiente de Variação (CV)

O coeficiente de variação, ou desvio padrão relativo, trata-se de uma medida sem


unidade e representa a relação entre o desvio padrão e a média aritmética.

𝑠
𝐶𝑉 = .100
𝑥

O CV é utilizado para comparar dispersões de resultados de medições provenientes


de grandezas distintas, uma vez que o desvio padrão depende da grandeza que está
sendo medida.

O CV tem aplicação na propagação da incerteza de medição por meio de incertezas


relativas.

32
Exemplo: Considere o circuito ao lado.

Foram realizadas 5 medições da tensão e da corrente


elétrica, e o resultado encontra-se na tabela abaixo.

Medições
Grandeza Média s
1 2 3 4 5
Tensão (V) 200,21 200,22 200,10 199,99 199,90 200,08 0,139
Corrente (A) 1,992 2,020 1,986 1,990 1,989 1,995 0,0139

Pergunta: qual grandeza apresentou a maior variação, a tensão ou a corrente elétrica?

33
1.3. Distribuição de Probabilidades
A distribuição de probabilidades descreve a probabilidade do valor de uma variável
ocorrer dentro de um intervalo de valores especificados. São funções que possuem um
domínio x, correspondente aos valores da variável sob estudo, e uma imagem f(x),
correspondente à probabilidade da variável assumir diferentes valores do domínio.

Probabilidade P(a<x<b)

34
As distribuições de probabilidades podem ser discretas ou contínuas.
As distribuições quando discretas descrevem o comportamento das variáveis
que fornecem valores inteiros e finitos.

Exemplo: é comum a utilização de


PASSA
dispositivos de medição chamados
calibres, cujo propósito é informar se uma NÃO
peça está conforme ou não. PASSA
A variável x, então, só possui dois valores:
passa e não passa.

35
Outro exemplo de distribuição discreta:

Considere um dado não viciado cujos valores de x são (1;2;3;4;5;6). Ao lançá-lo, a


probabilidade de se obter qualquer um dos valores de x é p(x) = 1/6.
 Assim, a distribuição de probabilidade p(x) desta variável é:
Valor da Probabilidade de
variável (X) ocorrência p(X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

A distribuição é discreta porque a variável é discreta, ou seja, não pode assumir


valores intermediários. Ao lançarmos um dado não encontraremos valores entre 1 e
2 ou entre 4 e 5, por exemplo.

36
A temperatura ambiente de um laboratório que vem sendo medida ao
longo de uma semana, por exemplo, é considerada uma variável
contínua porque ela pode assumir qualquer valor ao longo do dia e da
semana. Desta forma, a distribuição de probabilidade também será
contínua.
p(T)

Temperatura Média T
do Ambiente

37
As distribuições contínuas de probabilidades mais utilizadas na
Metrologia são a Uniforme ou Retangular, Triangular, Normal ou
Gaussiana e t-Student.
Importante propriedade de qualquer função distribuição de
probabilidade p(x):
P(-<x<+) = 1
isto é, o somatório dos valores de p(x), no caso de distribuição discreta,
ou a integral (área) de p(x), no caso de distribuição contínua, entre os
limites - e +, que corresponde à probabilidade de x estar dentro dos
limites, sempre resulta em 1.
 

38
No exemplo do dado, o somatório de p(x) será:
 
P (   x   )  P (1  x  6 )  1  1  1  1  1  1 1
  6 6 6 6 6 6

No caso da temperatura da sala, a área abaixo da curva, que representa


a integral (área) da função, também valerá 1, ou seja:


 p( T)dT  1


39
RESUMINDO: a distribuição de probabilidades associa uma probabilidade a
cada resultado numérico de um experimento, ou seja, fornece a
probabilidade de ocorrência em maior ou menor extensão para cada valor
da variável aleatória, seja ela discreta ou contínua.

40
Média, variância e desvio padrão de uma distribuição
de probabilidade

µ  E  X    x. f  x  dx


 

  V  X   E  x  E  x  
2
  x    f  x  dx
2 2



Desvio padrão =  = Medida de dispersão mais


usada, pois possui a mesma
unidade da grandeza medida.

41
Distribuição uniforme ou retangular

1
𝑓 ( 𝑥 )= 𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑏
𝑏−𝑎
f (x) = 0 quando x < a ou x > b

Para toda e qualquer distribuição uniforme, a área sob a curva de distribuição de


probabilidade será sempre 1 e corresponderá ao produto da base (amplitude do
intervalo) do retângulo pela sua altura f(x).

42
x b
x x2 b 𝑎+𝑏
µ  E  X    x. f  x  dx a b  a dx  2 b  a  a 𝜇=
x 2
2
  a  b  2
 a x  
 2 

2 ( 𝑏 − 𝑎 )
 2 V X     x    f  x  dx
2 V X     dx =

b
b  a
12
=

43
Exemplo 1:

Considere o incremento digital de uma balança que oscila continuamente de 0 até 0,1 g.
Que distribuição de probabilidades devemos considerar e qual a estimativa da média e
do desvio padrão dessa distribuição?
Exemplo 2: (extraído do ISO GUM 2008) Um manual fornece o valor do coeficiente de expansão térmica
linear do cobre puro a 20 °C [α20(Cu)] como 16,52 × 10-6 °C-1 e simplesmente estabelece que o erro neste
valor não deve exceder +0,40 × 10-6 °C-1.

45
Distribuição triangular

A distribuição de probabilidade triangular possui o formato de um


triângulo.

Graficamente, essa distribuição inicia com um valor mínimo, cresce


linearmente até um ponto de altura máxima que corresponde à média
da distribuição, e depois decresce da mesma forma até atingir o valor
máximo.

46
Distribuição Triangular
Forma gráfica

{
𝑎+𝑏
𝜇=
0 𝑝𝑎𝑟𝑎 𝑥 <𝑎 2
4 ( 𝑥 − 𝑎) 𝑎+𝑏
¿ 𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑏−𝑎 𝑏− 𝑎
( 𝑏− 𝑎 )2 2 = =
Distribuição Triangular 𝑓 ( 𝑥 )=
Expressão matemática 4 (𝑏 − 𝑥 ) 𝑎+𝑏 √ 24 2 √ 6
¿ 𝑝𝑎𝑟𝑎 ≤ 𝑥 ≤𝑏
(𝑏 − 𝑎) 2
2
¿ 0 𝑝𝑎𝑟𝑎 𝑥 >𝑏

47
Exemplo 1: Durante a calibração de um manômetro a temperatura ambiente variou de um
valor mínimo de 18 até um máximo de 22 °C. Com base nessa informação apresente a
estimativa da média e do desvio padrão da temperatura.

48
Exemplo 2: distribuição triangular (baseado no Guia EURACHEM):

O volume total (V) de uma solução é medido enchendo um balão de


100 mL. O fabricante do balão informa que ele possui um volume de
(100 ± 0,1) ml, medido a uma temperatura de 20 °C.

49
Distribuição em forma de “U”

A distribuição de probabilidade em forma de U


f(x)
apresenta uma maior probabilidade de
encontrarmos valores próximo aos extremos do
intervalo do que próximo ao valor central.

Esta distribuição é muito utilizada nas medições em


x
sistemas de radiofrequências (RF), nos casos onde
-a 0 a ocorrem desacoplamentos de impedâncias.
, -a < x < a
Também pode ser utilizada para modelar a distribuição
𝑎
de uma temperatura ambiente, quando o sistema de
= controle utilizado é do tipo “on-off”.
√2

50
Exemplo:

Um ambiente é refrigerado por um ar condicionado simples e sua temperatura


oscila entre 20,0 °C e 24,0 °C, sendo controlada por um termostato tipo on/off
(liga/desliga).

51
Distribuição normal

A curva normal é uma curva simétrica com formato de sino. Possui um pico
característico, que representa o ponto de frequência máxima e, nesse ponto,
situa-se a média da distribuição. A partir da média, a frequência decai
igualmente para ambos os lados infinitamente, aproximando-se do eixo das
abscissas.

52
O modelo matemático que representa a função densidade de probabilidade da
distribuição normal está representado na figura abaixo.
-∞ < m < +∞ e s > 0

e = 2,718 (constante)
p = 3,1416 (constante)
m = média da população
s = desvio padrão da
população
X = variável aleatória


𝑛
    x  𝑠= 1
n n 2

µ
 i1xi  i 1 i
∑ ( 𝑥𝑖 −𝑥 )
2

n n 𝑛−1 𝑖=1

53
Cada combinação média/desvio padrão corresponde a formatos de curvas
diferentes.

Médias diferentes e desvios


padrões iguais

Médias iguais e desvios padrões


diferentes

54
Distribuição normal padronizada

Numa distribuição normal a média e desvio padrão podem assumir


diferentes valores.
Um modelo matemático simplificado resolve a complexidade da
distribuição normal.
Utilizando-se uma tabela, qualquer variável é transformada na variável Z,
cujo valor é a variável menos a média dividido pelo desvio padrão.

55
Na distribuição normal padronizada temos que a média (m) assume valor zero, e o
desvio-padrão (s), valor um. Sendo assim, a função de distribuição de probabilidade
assume a seguinte conformação.
( xi − μ )
Z=
σ

A área total sob a curva


corresponde a 100 %. Cada
metade possui 50 % da área
total. Após transformar a curva
normal na curva normal
padronizada, ela assume a
mesma forma da distribuição
normal, com média m = 0 e
desvio padrão s = 1.

56
Tabela da
distribuição normal
padronizada

57
Exemplo: considere um limite superior de tolerância para a medição

O teor máximo de contaminantes em uma amostra de produto,


definido por uma determinada legislação, é de 0,200 mg/g.

O resultado encontrado da medição foi próximo a esse limite: 0,197 mg/g.

O instrumento de medição apresenta uma incerteza padrão de 0,002 mg.

Pergunta: o nível de contaminantes na amostra atende à legislação ou ele está acima do


permitido, uma vez que o resultado é apenas uma estimativa e esse apresenta uma
incerteza?

58
1.4. Teorema Central do Limite

Vamos considerar o lançamento de um dado não viciado.

A distribuição de probabilidades para esse evento é uma distribuição retangular.

Histograma de amostra de
tamanho n = 6, representado
pelo lançamento de um dado
apenas.

59
Vamos considerar, agora, o lançamento de dois dados.

A distribuição de probabilidades desse evento se aproxima de uma distribuição


triangular.

Histograma de amostra de tamanho


n = 36, representado pela média do
lançamento de dois dados.

60
Vamos considerar, agora, o lançamento de três
dados.
A distribuição de probabilidades desse evento
se aproxima de uma distribuição normal. 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Histograma de amostra de tamanho n = 216,


representado pela média do lançamento de
três dados.
Percebe-se que o aumento da amostra de 6 para 36, e depois para 216, modificou
radicalmente a função de distribuição probabilidades associada a cada um dos
histogramas.
Aumentando o tamanho da amostra a forma da distribuição de probabilidades tendeu
ao formato de sino (distribuição normal).

61
Mesmo que a distribuição de uma população não seja normal, a média das amostras
aproxima-se da distribuição normal. Essa aproximação torna-se melhor à medida que
aumentamos o tamanho da amostra (n → ).
O Teorema Central do Limite diz o seguinte:

“Quanto mais variáveis aleatórias forem combinadas, mesmo sendo de diferentes


distribuições estatísticas, mais próximo de uma distribuição Normal será o resultado
dessa combinação de variáveis.”

É por este motivo que no estudo da metrologia abordamos como uma distribuição normal
o resultado final da combinação das diversas fontes de incertezas, mesmo sendo, essas
fontes, de diferentes distribuições estatísticas. O resultado final do somatório dessas
influências tem um comportamento de uma distribuição normal.

62
Como decorrência do Teorema Central do Limite, ao retirarmos diversas amostras de
tamanho n e calcularmos suas médias (, onde p é o número de amostras, teremos para
o desvio padrão da média () a expressão dada pela equação:
𝑠𝑥
𝑠𝑥 =
√𝑛
Isso significa que, a partir de uma amostra de tamanho n e desvio padrão , pode-se
estimar o desvio padrão da média () amostral.
Exemplo: Estime para um conjunto de 9 medições que forneceu média 4,56 g e
desvio padrão 0,33 g.

63
O desvio-padrão da média é considerado pelo ISO GUM como a incerteza tipo A, caso a
amostra pertença à mesma população. Do contrário, a incerteza tipo A será igual ao
desvio-padrão da amostra (s).
O teorema central do limite funciona bem a partir de amostras n30.
Ao aumentarmos o tamanho das amostras os intervalos de classe do histograma ficam
cada vez menores, de modo que o contorno das barras ganha um formato mais
suavizado, gerando a distribuição normal.
Na prática trabalhamos com amostras inferiores a 10, já que o custo da medição
aumentaria consideravelmente, e Medir não é de graça!
Veremos, logo a seguir, a distribuição t-Student que auxilia nos casos de amostras de
tamanho pequeno, ou seja, n < 30.

64
Distribuição t-Student

William Sealy Gosset (1876-1937): Químico e matemático. Em 1904 ele escreveu um


relatório intitulado “A aplicação da Lei do Erro”, no qual introduziu varias metodologias
estatísticas para a indústria cervejeira. O primeiro artigo de Gosset foi uma aplicação da
distribuição de Poisson na contagem de leveduras. Para muitos usuários da Estatística
o nome William Gosset pode soar desconhecido. No entanto, o pseudônimo Student
revela-o como um dos estatísticos mais importantes e brilhantes da história.

65
William Gosset desenvolveu uma distribuição, chamada distribuição t-
Student, que fornece valores tabelados em função do grau de liberdade (n
= n-1) da amostra associado às respectivas probabilidades (50%; 68,27%;
70% etc).

Os fatores desenvolvidos por Gosset aproximam a distribuição de pequenas


amostras à distribuição normal. A Tabela apresenta alguns desses fatores,
mais especificamente aqueles associados ao nível de significância,
confiança ou probabilidade de abrangência.

66
Nível de Confiança ou Probabilidade de Abrangência
50% 68,27% 70% 80% 90% 95% 95,45% 99% 99,73%

n = (n-1)
Nível de Significância (a)
n

0,50 0,3173 0,30 0,20 0,10 0,05 0,0455 0,01 0,0027


Os fatores apresentados na Tabela são conhecidos
2 1 1,00 1,84 1,96 3,08 6,31 12,71 13,97 63,66 235,8

Tabela t-Student 3
4
2
3
0,82
0,76
1,32
1,20
1,39
1,25
1,89
1,64
2,92
2,35
4,30
3,18
4,53
3,31
9,92
5,84
19,21
9,22
como t-crítico (tc) e no âmbito da metrologia como
fator de abrangência, recebendo a denominação “k”
4,60
5
6
4
5
0,74
0,73
1,14
1,11
1,19
1,16
1,53
1,48
2,13
2,02
2,78
2,57
2,87
2,65 4,03
6,62
5,51
em vez de “t”.
7 6 0,72 1,09 1,13 1,44 1,94 2,45 2,52 3,71 4,90
8 7 0,71 1,08 1,12 1,41 1,89 2,36 2,43 3,50 4,53 Os valores de k são fornecidos em função do nível de
9 8 0,71 1,07 1,11 1,40 1,86 2,31 2,37 3,36 4,28 confiança (probabilidade de abrangência) ou nível de
10 9 0,70 1,06 1,10 1,38 1,83 2,26 2,32 3,25 4,09
11 10 0,70 1,05 1,09 1,37 1,81 2,23 2,28 3,17 3,96 significância (a) e são inversamente proporcionais ao
12 11 0,70 1,05 1,09 1,36 1,80 2,20 2,25 3,11 3,85 tamanho da amostra (n) e seu respectivo grau de
13 12 0,69 1,04 1,08 1,35 1,77 2,16 2,23 2,98 3,69
liberdade ( = n-1).
Tamanho da amostra

14 13 0,69 1,04 1,08 1,35 1,77 2,16 2,21 3,01 3,69


15 14 0,69 1,04 1,08 1,35 1,76 2,14 2,20 2,98 3,64
16 15 0,69 1,03 1,07 1,34 1,75 2,13 2,18 2,95 3,59 À medida que se aumenta o tamanho da amostra os
17 16 0,69 1,03 1,07 1,34 1,75 2,12 2,17 2,92
2,90
3,54 valores de k tendem a se tornar constantes, basta
18 17 0,69 1,03 1,07 1,33 1,74 2,11 2,16 3,51
19 18 0,69 1,03 1,07 1,33 1,73 2,10 2,15 2,88 3,48 observar os valores de “k” ou “tc” para níveis de
20
21
19
20
0,69
0,69
1,03
1,03
1,07
1,06
1,33
1,33
1,73
1,72
2,09
2,09
2,14
2,13
2,86
2,85
3,45
3,42
confiança na ordem de 95%, 95,45% e 99% para
22 21 0,69 1,02 1,06 1,32 1,72 2,08 2,13 2,83 3,40 tamanho de amostras tendendo ao infinito (). Nessas
2,82
23
24
22
23
0,69
0,69
1,02
1,02
1,06
1,06
1,32
1,32
1,72
1,71
2,07
2,07
2,12
2,11 2,81
3,38
3,36
condições temos respectivamente k ou tc = 1,96; 2,00 e
25 24 0,68 1,02 1,06 1,32 1,71 2,06 2,11 2,80 3,34 2,58.
26 25 0,68 1,02 1,06 1,32 1,71 2,06 2,11 2,79 3,33
27 26 0,68 1,02 1,06 1,31 1,71 2,06 2,10 2,78 3,32
28 27 0,68 1,02 1,06 1,31 1,70 2,05 2,10 2,77 3,30
29 28 0,68 1,02 1,06 1,31 1,70 2,05 2,09 2,76 3,29
30 29 0,68 1,02 1,06 1,31 1,70 2,05 2,09 2,76 3,28 67
A tabela anterior apresenta somente alguns valores do t-Student. Demais
valores podem ser obtidos no software Excel por meio da função:
INV.T.BC(probabilidade;grau de liberdade)
A probabilidade considerada pelo Excel é o nível de significância, ou seja,
1-p. Assim, se quisermos calcular o t-Student para 95,45 % devemos entrar
na fórmula com 0,0455 (=1-0,9545).
Ex.: n= 100  INV.T.BC(0,0455;99)  t = 2,026

68
A distribuição t-Student é contínua, simétrica, possui média zero e desvio padrão variável
de acordo com o grau de liberdade (n = n-1). O parâmetro t é calculado pela seguinte
expressão:
𝑥−𝜇
𝑡=
𝑠
√𝑛
Essa distribuição é muito útil quanto precisamos estimar a média da população m, que
supostamente tem distribuição normal, a partir de pequenas amostras, utilizando a média
e desvio padrão da amostra s. A média m estará compreendida no seguinte intervalo:
_ t _ s
-t<m< +t   X s e s( x ) 
n n

69
Exemplo: Considere uma
distribuição normal com 5 AMOSTRAS Intervalo Frequência
Frequência

Média = 2,091
μ = 2 e  = 0,4. Vamos s = 0,428
1,5 1 2,5
2
agora simular essa 1,8 0 1,5
1

distribuição com 2,1 1 0,5


0
2,4 1
diferentes amostras
1,5 1,8 2,1 2,4 Mais

Mais 2
(n = 5; 20; 100 e 1 000).
20 AMOSTRAS Intervalo Frequência
Frequência
Média = 1,965 1,1 1
s = 0,438 1,4 0
8
1,7 5 6
2,0 3 4

2,3 7 2

2,7 2 0
1,1 1,4 1,7 2,0 2,3 2,7 Mai s
Mais 2

70
Intervalo Frequência 100 AMOSTRAS
1,1 1 Média = 2,049
1,4 2 s = 0,363
1,6 8
Frequência
1,8 13
2,1 32 40

2,3 17 30

2,5 16 20

2,7 8 10

Mais 3 0
1,1 1,4 1,6 1,8 2,1 2,3 2,5 2,7 Mais

71
Intervalo Frequência
0,6 1
0,9 5
Frequência 1000 AMOSTRAS
Média = 2,002
1,2 23 275
s = 0,413
1,5 90 250
225
1,8 200
200
2,1 277 175
2,4 258 150
125
2,7 105
100
3,0 36 75

3,3 3 50
25
3,6 2 0
Mais 0 0,6 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3,0 3,3 3,6 Mais

Percebe-se que com n = 100 e n = 1000 o histograma aproxima-se de uma curva


normal.
72
Vamos considerar, na tabela t-Student, uma probabilidade de
abrangência de 95,45%. A partir das amostras, a média μ pode ser
estimada por: _ t _ s
  X s e s( x ) 
n n

73
Graficamente podemos verificar que, para qualquer tamanho da amostra, a média
μ = 2 está compreendida no intervalo:
-t<m< +t

Entretanto, quanto menor o tamanho da amostra maior será o intervalo que


contém a média.

74
1.5. Critério de Chauvenet: rejeição de uma leitura

Antes de se avaliar e interpretar uma série de resultados obtidos por um ou mais


laboratórios, ou se efetuar o cálculo da incerteza, é necessário que se verifique a
existência de valores que possam ser considerados como dispersos, ou seja, valores
que não pertençam a uma mesma população.

Quando uma grandeza é medida várias vezes pode ocorrer que o desvio de um
resultado em relação ao seu valor médio seja muito grande, se comparado com o
desvio padrão das medições.

75
Isto pode acontecer em função de erros grosseiros, falhas momentâneas do
instrumento de medição ou qualquer outro motivo.

O critério de Chauvenet é bastante utilizado para avaliar se uma medição deve ser
rejeitada.

Este critério estabelece que, se o módulo do desvio di de uma determinada medição xi


em relação à média for maior que um valor dch, chamado de limite de rejeição de
Chauvenet, a medição deve ser rejeitada.

76
Assim, se s: desvio padrão do
conjunto de N medições
N dch N dch
2 1,15 s 19 2,22 s
3 1,38 s 20 2,24 s
4 1,54 s 21 2,26 s
5 1,65 s 22 2,28 s
6 1,73 s 23 2,30 s
7 1,80 s 24 2,31 s
8 1,86 s 25 2,33 s
9 1,91 s 26 2,35 s
10 1,96 s 30 2,39 s
11 2,00 s 40 2,50 s
12 2,04 s 50 2,57 s
13 2,07 s 100 2,81 s
14 2,10 s 200 3,02 s
15 2,13 s 300 3,14 s
16 2,15 s 500 3,29 s
17 2,18 s 1 000 3,49 s
18 2,20 s 2 000 3,62 s

77
Para valores de N não encontrados na tabela apresentada, o valor dch é calculado
de forma a se obter a probabilidade de um desvio em relação à média igual a
1/(2N).
Desta forma, entrando na tabela da curva normal com o valor de ½ P = 1/(4N),
encontramos o valor de z. Daí obtemos dch = z s.

Exemplo: n = 35  ½ P = 1/140 = 0,0071

Tabela curva normal: p = 0,0071, ou 1-p = 0,9929

78
z = 2,45  dch = 2,45 s

79
Exemplo: Leitura xi
1 5,30
2 5,73
3 6,77
4 5,26
5 4,33
6 5,45
7 6,05
8 5,64
9 5,81
10 5,75

Devemos considerar o critério no máximo 2 vezes. Se na 3ª vez encontramos


alguma medida fora devemos rejeitar todo o conjunto de medições.

80
Exemplos de aplicações
I - Incerteza da Resolução de Leitura

É comum encontrarmos uma baixa dispersão dos valores em um processo de


medição, o que caracteriza que o desvio padrão da amostra pode ser “zero”.

Dependendo do valor da resolução e do tipo de distribuição de probabilidade


adotados, essa incerteza poderá ser uma das maiores, ou a maior, contribuição na
incerteza final.
Situação 1: Medição onde “buscamos” o valor da grandeza desejada, ou seja, não sabemos a priori qual
é o valor a ser encontrado.

Exemplo 1:
Suponha que o valor medido da pressão seja 10,00 bar e
que o manômetro digital utilizado tenha uma resolução de
0,01 bar. Isto significa dizer que o instrumento lê
incrementos de 0,01 em 0,01 bar. Considerando o
algoritmo existente no manômetro, responsável pela
digitalização dos valores indicados, o “valor verdadeiro” da
pressão estará compreendido entre o intervalo [9,995 a
10,005] bar. Valores como 10,006 bar, ou maiores, deverão
ser arredondados pelo instrumento para 10,01 bar; da
mesma forma que valores como 9,994 bar, ou menores,
para 9,99 bar.
Logo, toda vez que o manômetro indicar 10,00 bar teremos uma dúvida do
“verdadeiro valor” da pressão, ocasionada pela sua limitação de resolução.
Considerando que a probabilidade do “valor verdadeiro” estar compreendido entre
[9,995 a 10,005] bar é a mesma dentro deste intervalo, é razoável adotar uma
distribuição estatística que reflita este comportamento, ou seja, a distribuição
retangular ou uniforme. Na Figura a seguir temos:

9,995 10,00 10,005 (bar)


Exemplo 2: Termômetro Bimetálico (0 – 120)°C

Percebe-se que, pela proximidade


das marcações de escala e pela
largura do ponteiro, fica difícil
dividir a menor divisão (1°C) por
dois. Adotaremos, então, a
resolução (r) de leitura de 1°C.

O valor lido será de 32°C, que pode estar compreendido no intervalo (31,5<T< 32,5)°C com a mesma
probabilidade (distribuição uniforme).
Situação 2: Medição onde “fixamos” o valor desejado

Fixando o valor desejado saberemos, a priori, o valor mais provável do mensurando. Faz sentido atribuir
uma probabilidade maior a este valor.

Podemos considerar que, nesse caso, a distribuição triangular é a que melhor representa a distribuição
de probabilidade da resolução de leitura.

Exemplo: Calibração de um manômetro usando um manômetro padrão para comparação.

Manômetro com faixa de (0 a 50) bar e resolução (r)


de leitura de 1 bar.

Pontos de calibração no instrumento objeto: 10 bar,


20 bar, 30 bar, 40 bar e 50 bar
Tomando como exemplo o ponto de 30 bar, o “valor verdadeiro” estará compreendido no intervalo
[29,5 bar a 30,5 bar]. Assumindo uma distribuição triangular teremos:
II - Incerteza da Histerese

Histerese é a maior diferença entre os valores de carga e descarga de um


instrumento de medição.

A estimativa da incerteza da histerese é obtida pelo cálculo da histerese (H) do


instrumento adotando-se uma distribuição de probabilidade retangular.

H
uhisterese 
12
Exemplo: Manômetro Bourdon, (0 a 20) kgf/cm2, calibrado por comparação com um
manômetro padrão.
Objeto Padrão (kgf/cm2)
(kgf/cm2) Carga 1 Descarga 1 Carga 2 Descarga 2
5 5,0 5,2 5,0 5,2
12 12,2 11,9 11,6 11,8
20 20,1 20,2 20,4 20,0
EXERCÍCIOS

1. O manual do fabricante de um bloco-padrão, destinado a calibração de paquímetros e micrômetros,


fornece o valor do coeficiente de expansão térmica linear () dos blocos como 11,5 × 10-6 °C-1. Informa
também que a variação máxima do coeficiente de expansão linear é de ± 0,2 × 10-6 °C-1.
Baseado nessas informações, determine o desvio-padrão da distribuição de probabilidade do
coeficiente de expansão térmica linear ().
2. Considerando os 60 valores de tensão elétrica da tabela a seguir, pertencentes a uma distribuição
uniforme, faça seu histograma, determinando sua média e seu desvio-padrão.

Tensão (V)

2,01 2,15 2,40 2,56 2,75 2,91


2,01 2,17 2,42 2,59 2,76 2,91
2,01 2,19 2,44 2,63 2,77 2,93
2,05 2,20 2,44 2,63 2,80 2,93
2,09 2,25 2,44 2,64 2,80 2,93
2,10 2,26 2,45 2,65 2,80 2,94
2,10 2,26 2,52 2,70 2,81 2,95
2,11 2,27 2,53 2,71 2,84 2,96
2,13 2,33 2,55 2,74 2,84 2,98
2,14 2,34 2,55 2,74 2,86 2,99
3. A tabela representa as medições de temperatura, em grau Celsius, de um laboratório ao longo de
uma manhã. Faça o histograma desses valores considerando uma distribuição normal. Determine
também sua média e seu desvio-padrão.

Temperatura (°C)
23,6 23,8 24,0 24,0 24,1 24,2
23,6 23,8 24,0 24,0 24,1 24,2
23,7 23,8 24,0 24,0 24,1 24,2
23,7 23,8 24,0 24,0 24,2 24,2
23,7 23,8 24,0 24,1 24,2 24,3
23,7 23,9 24,0 24,1 24,2 24,3
23,7 23,9 24,0 24,1 24,2 24,3
23,7 23,9 24,0 24,1 24,2 24,3
23,8 23,9 24,0 24,1 24,2 24,5
23,8 24,0 24,0 24,1 24,2 24,6
4. A Tabela apresenta 60 valores de tensão obtidos de uma
Valores de tensão (V)
tomada elétrica. Com base nesses valores:
128,42 128,62 128,69 128,75 128,80 128,84
a) Faça um histograma, adotando sete classes para melhor
128,49 128,63 128,69 128,76 128,80 128,87
construí-lo.
b) Determine seu desvio padrão amostral. 128,49 128,63 128,71 128,76 128,80 128,88

c) Determine o intervalo onde temos 95,45 % de probabilidade 128,56 128,65 128,72 128,77 128,81 128,89
de encontrarmos uma medição entre as 60 medições.
128,57 128,65 128,72 128,77 128,82 128,90
d) Verifique quantos valores estão dentro do intervalo
128,58 128,66 128,73 128,77 128,83 128,91
determinado no item (c) e verifique se esses valores
correspondem a 95,45 % dos valores medidos. 128,59 128,66 128,74 128,78 128,83 128,93

e) Determine o intervalo com 95,45 % de probabilidade onde 128,59 128,66 128,74 128,79 128,83 128,94
podemos encontrar a média das 60 medições.
128,60 128,67 128,75 128,80 128,83 129,01

128,61 128,69 128,75 128,80 128,83 129,11


5. Considere as amostras a seguir retiradas de lotes de pesagem de duas balanças distintas:

Balança 1 (kg) 15,00 14,80 15,20 14,90 15,10 14,70


Balança 2 (kg) 14,60 14,70 15,40 15,30 14,90 14,90

a) Calcule a média das duas amostras.


b) Calcule o desvio-padrão amostral das duas amostras.
c) Com base nos itens anteriores, qual balança apresenta a maior dispersão
de medidas?
d) Determine, para cada balança, o intervalo onde temos 95,45 % de
probabilidade de encontrarmos a média das medições.
6. Considere que a monitoração do pH de uma substância, ao longo de um dia, apresente uma distribuição
triangular. Com base nos 12 valores medidos ao longo desse dia, responda ao que se pede.

pH
a) Qual é a média dessa distribuição de valores?
7,24 7,20 7,23 7,25
b) Qual é o desvio-padrão da distribuição?
7,24 7,21 7,26 7,24
7,24 7,24 7,24 7,24
7. Um técnico em metrologia mediu a temperatura interna de uma estufa encontrando para a média das oito
medições realizadas 48,9 °C e desvio-padrão amostral igual a 0,6 °C. Considerando os valores medidos pertencentes
a uma distribuição t-Student, determine a probabilidade da próxima medição estar entre:
a) (48,3 e 49,5) °C
b) (47,4 e 50,4) °C
c) (46,2 e 51,6) °C

Você também pode gostar