Você está na página 1de 124

FUNDAMENTOS DE ESTATÍSTICA

PARA METROLOGIA
Prof. Pedro Paulo Novellino do Rosário, M.Sc.
(021) 99948.6288
pedropaulonovellino@gmail.com
SUMÁRIO 1. ESTATÍSTICA APLICADA A METROLOGIA

1.1. Apresentação dos dados 1.3. Distribuições de 1.4. Teorema central do limite
 Experimentos aleatórios probabilidades  Combinação de distribuições
 Dados não agrupados  Distribuição discreta e  Teorema central do limite
 Dados agrupados em rol contínua
 Média, variância e desvio 1.5. Exemplos de aplicações de
 Dados agrupados por valor
padrão de uma distribuição distribuições de probabilidade
 Histograma  Critério de Chauvenet: rejeição
de probabilidade
1.2. Medidas de tendência  Distribuição uniforme ou de uma leitura
central e medidas de dispersão retangular  Incerteza da resolução de leitura:
 Média da população, média  Distribuição triangular estudo de duas situações
da amostra, mediana, moda  Distribuição em forma de U distintas
 Amplitude  Distribuição normal  Incerteza da histerese
 Variância da população e  Distribuição normal
variância da amostra padronizada
 Desvio padrão da população  Distribuição t-Student
e desvio padrão da amostra  Fator de abrangência
 Coeficiente de variação
1. Estatística Aplicada a Metrologia

Neste curso você aprenderá os conceitos e as principais, e necessárias, ferramentas


estatísticas. Entretanto, nossa abordagem será na efetiva utilização destes conteúdos
para as aplicações da Metrologia.
Não discutiremos, por exemplo, arranjos, permutações, combinações, espaço amostral,
técnicas de amostragem ..., e sim formas de apresentação e tratamento de dados
mensurados, medidas de tendência central e de dispersão (tais como média,
amplitude, variância, desvio padrão, coeficiente de variação) e as principais
distribuições de probabilidade adotadas no estudo da Metrologia (uniforme, triangular,
normal, t-Student e forma de U).
E o mais importante, como aplicar corretamente essas ferramentas!

3
Aqui caberia uma pergunta: mas por quê precisamos conhecer essas ferramentas
estatísticas para trabalhar na Metrologia?
Bem, é sabido que toda medida realizada apresenta uma incerteza de medição
associada e que, dependendo do tipo e da qualidade do instrumento ou do sistema
utilizado, pode ser pequena, ou não, comparativamente falando com o resultado da
medição propriamente dita.
Desta forma, podemos afirmar que:
RM = X + U onde
RM = expressão do resultado final da medição,
X = valor da medição (ou da média das medições) realizada e
U = incerteza da medição.

4
No Vocabulário Internacional de Metrologia (também conhecido por
VIM-2012) encontramos a seguinte definição para a Incerteza de
Medição:
“parâmetro não negativo que caracteriza a dispersão dos valores
atribuídos a um mensurando ...”
O VIM-2012 cita, ainda, que “o parâmetro pode ser um desvio padrão
(incerteza padrão) ou a metade da amplitude de um intervalo tendo uma
probabilidade de abrangência determinada.”
Percebemos, então, que a incerteza de medição é um parâmetro
avaliado por meio de algumas ferramentas estatísticas.

5
1.1. Apresentação dos Dados

Em uma medição existem diversos fatores metrológicos que podem


influenciar no seu resultado, uns mais, outros menos. Assim, flutuações
naturais podem implicar que medições repetidas nem sempre apresentem
valores iguais, ou seja, cada fator pode influenciar diferentemente no
sistema de medição, podendo inclusive ocasionar erros.

6
Medições são experimentos aleatórios e podem ser repetidos
indefinidamente, e uma vez repetidos, provavelmente obteremos
resultados diferentes.
Experimentos aleatórios estão associados a um espaço amostral, ou
população.
A população N é definida como todos os elementos que estão disponíveis
para uma avaliação. Essa população pode ser um número finito (por
exemplo, o total de moradores de um prédio) ou infinito (por exemplo, o
conjunto de números naturais).
Uma amostra n representa uma parcela da população, mas que deve ser
retirada de modo a apresentar as características e representar
adequadamente essa população de origem.
7
Exemplo: medição de um produto com uma balança

Podemos considerar que a população N é infinita, pois


não há um número finito de medições possíveis de
serem realizadas.

Entretanto, quando estabelecemos um determinado


número de medições (em uma calibração ou
verificação, por exemplo) estamos criando uma
amostra n. Assim, se definíssemos 5 medições,
teríamos n = 5; 10 medições, n = 10.

8
Finalizado esse processo de medição obtém-se um determinado valor que
representará uma estimativa do resultado da medição. A partir do
resultado dessa amostra e atribuindo-se um determinado grau de
confiança, pode-se analisar o comportamento da balança como um todo.

Conclusões obtidas com base em uma amostra, ou quantidade de dados,


agilizam o processo de medição e reduzem custos.

Por isso que a análise estatística é fundamental para a Metrologia, pois


possibilita a descrição dos dados a partir de medidas de tendência central,
medidas de dispersão, distribuição de probabilidades, seguido da análise e
interpretação dos resultados obtidos.
9
Dados não agrupados

A norma ABNT NBR 14105, por


exemplo, estabelece que a
temperatura do local de calibração de
manômetros tipo Bourdon deve estar
compreendida entre (20 ± 2) °C.
Foram realizadas 80 medições ao
longo de um dia e os resultados
obtidos encontram-se a seguir.
Pergunta: Todas as medições estão
dentro do intervalo de tolerância Sim. Analisando todos os 80 dados
estabelecido pela norma? percebe-se que o menor valor foi 18 °C e o
maior 22 °C.

10
Vamos realizar outras perguntas.
Qual foi o valor que preponderou no conjunto de medições?
As medições variaram muito ou pouco?

Já pensaram se ao invés de 80 medições tivéssemos 8 000?

Concordam que deve haver uma forma mais adequada de dispor esses
dados para facilitar as respostas?

11
Dados agrupados: Rol

O rol consiste em agrupar os dados de forma crescente, ou decrescente. Para o


exemplo da temperatura vamos colocar em ordem crescente de valores.
18 18 18 18 18 18 18 18
18 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19
19 19 19 19 19 19 19 19
19 20 20 20 20 20 20 20
20 20 20 20 20 21 21 21
21 21 21 21 21 21 21 21
21 21 21 21 21 21 21 21
21 21 21 22 22 22 22 22
22 22 22 22 22 22 22 22

Com o rol fica fácil responder se os resultados estão dentro da tolerância. Basta olhar
o primeiro (18 °C) e o último (22 °C).
Mas ainda não está tão imediato responder as outras perguntas!

12
Dados agrupados por valor

Significa ordenar semelhante com semelhante, ou seja, agrupar valores


iguais em classes dispondo-os em uma tabela, que tem o nome de
distribuição de frequências.

Existem quatro tipos de frequências:


• frequência absoluta simples (fa)
• frequência absoluta acumulada (Fa)
• frequência relativa simples (fr)
• frequência relativa acumulada (Fr)

13
• Frequência absoluta simples (fa):

Corresponde ao número de ocorrências de um valor dentro de uma classe.

18 18 18 18 18 18 18 18
18 18 18 18 18 18 18 19 Valor °C fa
19 19 19 19 19 19 19 19 18 15
19 19 19 19 19 19 19 19
19 20 20 20 20 20 20 20 19 18
20 20 20 20 20 21 21 21 20 12
21 21 21 21 21 21 21 21 21 22
21 21 21 21 21 21 21 21 22 13
21 21 21 22 22 22 22 22
22 22 22 22 22 22 22 22 S (soma) 80

Por essa tabela podemos observar que o valor preponderante foi 21 °C, que
apareceu 22 vezes!

14
• Frequência absoluta acumulada (Fa):

Corresponde à soma das frequências absolutas da classe atual com o somatório das
frequências imediatamente anteriores a ela.

Valor °C fa Fa
18 15 15
19 18 33
20 12 45
21 22 67
22 13 80

Por essa tabela observa-se que mais da metade dos dados (45 de 80) está entre
18 e 20 °C!

15
• Frequência relativa simples (fr):

É a razão entre a frequência absoluta simples da classe e o tamanho da amostra(n).

Valor °C fa fr
18 15 18,75 % fr =
19 18 22,5 %
20 12 15 %
21 22 27,5 %
22 13 16,25 %
S 80 100%

Por essa tabela percebe-se que os valores de 19 e 21 °C juntos representam 50%


dos valores. Os 50% restantes estão distribuídos por 18, 20 e 22 °C.

16
• Frequência relativa acumulada (Fr

Corresponde à soma das frequências relativas da classe atual com o somatório das
frequências relativas imediatamente anterior.

Valor °C fa fr Fr

18 15 18,75 % 18,75 %
19 18 22,5 % 41,25 %
20 12 15 % 56,25 %
21 22 27,5 % 83,75 %
22 13 16,25 % 100 %

Por essa tabela observa-se que mais da metade dos dados (56,25 %) está entre 18 e
20 °C!
17
Histograma
O histograma é um gráfico de barras retangulares que permite visualizar a distribuição
das frequências relativas, ou absolutas, do conjunto de dados. A base de um retângulo
representa uma classe da tabela de frequências. A altura da barra é proporcional ao
valor da frequência contida na classe. A escala horizontal do gráfico é quantitativa. A
escala vertical indica a frequência absoluta ou relativa.
Histograma
No exemplo verifica-se que o valor 2,1
40 tem a maior frequência (35).
30 Além de ser o valor mais recorrente é o
frequência

20
valor central do conjunto de dados. Os
10
0 demais valores estão dispersos no
1,1 1,4 1,6 1,8 2,1 2,3 2,5 2,7 Mais entorno desse valor central.
intervalo

18
Como desenvolver um Histograma?
Temperatura (°C)
49,59 49,60 49,63 49,64 49,66 49,68

Ex.: Considere o conjunto de 49,59 49,61 49,63 49,65 49,67 49,68

dados como 60 valores de 49,59 49,62 49,63 49,65 49,67 49,68

temperatura de um forno de 49,59 49,62 49,64 49,65 49,67 49,69

calibração, estabilizado em 49,60 49,62 49,64 49,66 49,67 49,69

torno de 50,00 °C. 49,60 49,62 49,64 49,66 49,67 49,69

49,60 49,62 49,64 49,66 49,67 49,69

49,60 49,62 49,64 49,66 49,67 49,70

49,60 49,62 49,64 49,66 49,67 49,70

49,60 49,63 49,64 49,66 49,68 49,70

19
Passo 1: Determinar a amplitude A do intervalo de medições. A  X max  X min
Como os dados já estão organizados em rol crescente, basta pegar o último valor e subtrair do primeiro.

A = (49,70 – 49,59) °C = 0,11 °C

Passo 2: Determinar o número de classes K.

K = = = 7,75

Para montar o histograma podemos usar K = 7 ou K = 8.

Passo 3: Determinar a largura L da classe.

𝐴 0,11 𝐴 0,11
𝐿= = = 0,016ou 𝐿= = = 0,014
𝐾 7 𝐾 8

Como os dois valores de L > 0,01 °C escolheremos L = 0,02 °C

20
Passo 4: Contagem de ocorrência dos dados por classe – Frequência.

Intervalo de classe (°C) Frequência


49,58 ≤ x < 49,60 4
49,60 ≤ x < 49,62 8
49,62 ≤ x < 49,64 11
49,64 ≤ x < 49,66 11
49,66 ≤ x < 49,68 15
49,68 ≤ x < 49,70 8
49,70 ≤ x < 49,72 3

21
Passo 5: Montar o Histograma (gráfico) contagem de ocorrência por classe – Frequência.

HISTOGRAMA
16

14

12

10
Frequência

0
49,58 ≤ x < 49,60 49,60 ≤ x < 49,62 49,62 ≤ x < 49,64 49,64 ≤ x < 49,66 49,66 ≤ x < 49,68 49,68 ≤ x < 49,70 49,70 ≤ x < 49,72

°C

22
É possível obter um histograma utilizando o software Excel. Como fazer
isso?

23
24
25
1.2. Medidas de Tendência Central e Medidas de Dispersão
MEDICÃO

COLETA DE DADOS

VALORES DISTINTOS

VALORES AGRUPADOS ALEATORIAMENTE


EM TORNO DE UM VALOR MAIS PROVÁVEL

ESTATÍSTICA – medidas de tendência central e


medidas de dispersão
26
Medidas de Tendência Central

Média da População (μ)


Corresponde à soma de todos os valores pertencentes 
ao conjunto dividido pelo número de dados do
conjunto.

A população n pode ser finita (ex.: total de alunos de uma escola) ou infinita (ex.:
número de medições feitas por um instrumento).

Quando n → , usamos uma amostra com n finito, e a média será representada pela
média amostral ().

27
Média Amostral ()
𝑛
A expressão é idêntica à da média µ, entretanto, n 1
𝑥= ∑ 𝑥 𝑖
é o tamanho da amostra e não da população: 𝑛 𝑖=1

Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 52,0

28
Mediana
É o número central de um grupo de números. Se houver uma quantidade par
de números, a mediana é a média dos dois números do meio.

Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 52,0

Usando a função do Excel chamada MED, encontraremos que a mediana = 42,0 kg.
Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 38,0 52,0

Usando a função do Excel chamada MED, encontraremos que a mediana = 41,0 kg.

29
Moda
É o número que ocorre com mais frequência em um grupo de números.
Massa de um produto em kg
43,0 32,0 45,0 37,0 41,0 48,0 44,0 35,0 49,0 39,0 39,0 52,0

Usando a função do Excel chamada MODO, encontraremos que a moda = 39,0 kg.

18 17 18 18 21 18 18 18
18 20 18 18 18 18 19 19
19 19 19 19 19 19 19 19
19 19 20 19 19 19 19 19 Usando a função do Excel
19 20 20 20 20 20 20 20
chamada MODO encontraremos
20 20 18 20 20 21 21 21
21 21 21 21 20 20 21 21 que a moda = 19.
21 23 21 21 19 20 23 21
21 21 21 22 20 22 21 22
22 22 22 22 20 22 22 22 30
Medidas de Dispersão
As medidas de tendência central fornecem apenas o valor do centro dos dados. Elas
não indicam como está a dispersão dos valores entorno do valor central.
Exemplo: as figuras possuem o mesmo valor central, entretanto, a curva azul possui a
menor dispersão de valores e a vermelha a maior.

31
Amplitude
É a medida de dispersão mais simples, e corresponde a diferença entre o maior e o
menor valor do conjunto de dados.

18 18 18 18 18 18 18 18 A = Xmáximo - Xmínimo
18 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19
19 19 19 19 19 19 19 19 A = (22 – 18) °C = 4 °C
Valores em °C 19 20 20 20 20 20 20 20
20 20 20 20 20 21 21 21
21 21 21 21 21 21 21 21
21 21 21 21 21 21 21 21
21 21 21 22 22 22 22 22
22 22 22 22 22 22 22 22

A amplitude é usada na montagem de um histograma.

32
Apesar de ser uma medida de dispersão, a Amplitude não considera, e
também não é influenciada, pelos valores intermediários.

Mesmo aumentando o número de dados a Amplitude nunca diminuirá. Ela


poderá até aumentar.

Por exemplo, se em três novas medições encontrarmos 18, 20 e 19 °C, a


amplitude permanece 4 °C. Porém, se em uma nova medição
encontrarmos 17 ou 23 °C, a amplitude aumenta para 5 °C (22-17 ou 23-
18).

33
Variância da população (2)

A variância da população é o somatório dos desvios ao quadrado, que


corresponde à diferença de cada valor do conjunto de dados em
relação à média .

2
𝜎 =𝑉 ( 𝑥 ) = 𝐸 ¿
𝜇=𝐸( 𝑥)
2
𝜎 =𝑉 ( 𝑥 ) = 𝐸 ¿

34
Variância Amostral (s²)

Como na metrologia trabalhamos com amostras, temos a média . Assim,


iremos utilizar a variância amostral s².

A unidade de medida da variância corresponde à unidade da grandeza ao


quadrado, exceto quando se tratar de grandezas adimensionais, como
por exemplo o pH ou o índice de refração.
Veremos que a variância será útil na estimativa da incerteza de medição,
entretanto, ela é pouco prática na apresentação da dispersão pois sua
unidade é ao quadrado. Dessa forma, precisamos recorrer ao desvio
padrão.

35
Desvio Padrão Amostral (s)

O desvio padrão amostral (s) descreve a variação do conjunto na unidade


original da medida, a partir da raiz quadrada da variância.

Dessa forma, o desvio padrão torna-se muito útil para descrever a


variabilidade do conjunto de dados quando comparado à amplitude e à
variância.
O desvio padrão amostral e a média aritmética são, sem dúvida, as
medidas estatísticas mais utilizadas no contexto metrológico.

36
Coeficiente de Variação (CV)

O coeficiente de variação, ou desvio padrão relativo, trata-se de uma medida sem


unidade e representa a relação entre o desvio padrão e a média aritmética.

𝑠
𝐶𝑉 = .100
𝑥

O CV é utilizado para comparar dispersões de resultados de medições provenientes


de grandezas distintas, uma vez que o desvio padrão depende da grandeza que está
sendo medida.

O CV tem aplicação na propagação da incerteza de medição por meio de incertezas


relativas.

37
Exemplo: Considere o circuito ao lado.

Foram realizadas 5 medições da tensão e da corrente


elétrica, e o resultado encontra-se na tabela abaixo.

Medições
Grandeza Média s
1 2 3 4 5
Tensão (V) 200,21 200,22 200,10 199,99 199,90 200,08 0,139
Corrente (A) 1,992 2,020 1,986 1,990 1,989 1,995 0,0139

Pergunta: qual grandeza apresentou a maior variação, a tensão ou a corrente elétrica?

38
Sabe-se que quanto maior o desvio padrão maior a dispersão. O desvio padrão da
tensão foi de 0,139 V e o da corrente foi de 0,0139 A.
Poderíamos interpretar que a dispersão da tensão é dez vezes maior que a dispersão
da corrente elétrica. Entretanto, tensão e corrente são grandezas distintas! Vamos
observar o coeficiente de variação das grandezas separadamente!
𝑠 0,139
Tensão 𝐶𝑉 = .100= .100=0,07 %
𝑥 200,08
𝑠 0,0139
Corrente 𝐶𝑉 = .100= .100=0,70 %
𝑥 1,995
Resposta: a grandeza que apresentou a maior variação foi a corrente elétrica. 10 vezes
mais que a tensão.

39
1.3. Distribuição de Probabilidades
A distribuição de probabilidades descreve a probabilidade do valor de uma variável
ocorrer dentro de um intervalo de valores especificados. São funções que possuem um
domínio x, correspondente aos valores da variável sob estudo, e uma imagem f(x),
correspondente à probabilidade da variável assumir diferentes valores do domínio.

Probabilidade P(a<x<b)

40
As distribuições de probabilidades podem ser discretas ou contínuas.
As distribuições quando discretas descrevem o comportamento das variáveis
que fornecem valores inteiros e finitos.

Exemplo: é comum a utilização de


PASSA
dispositivos de medição chamados
calibres, cujo propósito é informar se uma NÃO
peça está conforme ou não. PASSA
A variável x, então, só possui dois valores:
passa e não passa.

41
Outro exemplo de distribuição discreta:

Considere um dado não viciado cujos valores de x são (1;2;3;4;5;6). Ao lançá-lo, a


probabilidade de se obter qualquer um dos valores de x é p(x) = 1/6.
 Assim, a distribuição de probabilidade p(x) desta variável é:
Valor da Probabilidade de
variável (X) ocorrência p(X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

A distribuição é discreta porque a variável é discreta, ou seja, não pode assumir


valores intermediários. Ao lançarmos um dado não encontraremos valores entre 1 e
2 ou entre 4 e 5, por exemplo.

42
A temperatura ambiente de um laboratório que vem sendo medida ao
longo de uma semana, por exemplo, é considerada uma variável
contínua porque ela pode assumir qualquer valor ao longo do dia e da
semana. Desta forma, a distribuição de probabilidade também será
contínua.
p(T)

Temperatura Média T
do Ambiente

43
As distribuições contínuas de probabilidades mais utilizadas na
Metrologia são a Uniforme ou Retangular, Triangular, Normal ou
Gaussiana e t-Student.
Importante propriedade de qualquer função distribuição de
probabilidade p(x):
P(-<x<+) = 1
isto é, o somatório dos valores de p(x), no caso de distribuição discreta,
ou a integral (área) de p(x), no caso de distribuição contínua, entre os
limites - e +, que corresponde à probabilidade de x estar dentro dos
limites, sempre resulta em 1.
 

44
No exemplo do dado, o somatório de p(x) será:
 
P (   x   )  P (1  x  6 )  1  1  1  1  1  1 1
  6 6 6 6 6 6

No caso da temperatura da sala, a área abaixo da curva, que representa


a integral (área) da função, também valerá 1, ou seja:


 p( T)dT  1


45
RESUMINDO: a distribuição de probabilidades associa uma probabilidade a
cada resultado numérico de um experimento, ou seja, fornece a
probabilidade de ocorrência em maior ou menor extensão para cada valor
da variável aleatória, seja ela discreta ou contínua.

46
Média, variância e desvio padrão de uma distribuição
de probabilidade

µ  E  X    x. f  x  dx


 

  V  X   E  x  E  x  
2
  x    f  x  dx
2 2



Desvio padrão =  = Medida de dispersão mais


usada, pois possui a mesma
unidade da grandeza medida.

47
Distribuição uniforme ou retangular

1
𝑓 ( 𝑥 )= 𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑏
𝑏−𝑎
f (x) = 0 quando x < a ou x > b

Para toda e qualquer distribuição uniforme, a área sob a curva de distribuição de


probabilidade será sempre 1 e corresponderá ao produto da base (amplitude do
intervalo) do retângulo pela sua altura f(x).

48
x b
x x2 b 𝑎+𝑏
µ  E  X    x. f  x  dx a b  a dx  2 b  a  a 𝜇=
x 2
2
  a  b  2
 a x  
 2 

2 ( 𝑏 − 𝑎 )
 2 V X     x    f  x  dx
2 V X     dx =

b
b  a
12
=

49
Exemplo 1:

Considere o incremento digital de uma balança que oscila continuamente de 0 até 0,1 g.
Que distribuição de probabilidades devemos considerar e qual a estimativa da média e
do desvio padrão dessa distribuição?

Solução: considerando que os valores compreendidos entre 0 e 0,1 g possuem a


mesma chance de ocorrência, assumimos uma distribuição uniforme.
= (0+0,1)g/2 = 0,05 g
Média
𝑏−𝑎
Desvio padrão =
2 √3
=0,03 g
0 0,05 0,1

50
Exemplo 2: (extraído do ISO GUM 2008) Um manual fornece o valor do coeficiente de expansão térmica
linear do cobre puro a 20 °C [α20(Cu)] como 16,52 × 10-6 °C-1 e simplesmente estabelece que o erro neste
valor não deve exceder +0,40 × 10-6 °C-1.

Baseado nessas informações limitadas, não é absurdo supor que o valor de α20(Cu) estará distribuído
com igual probabilidade no intervalo de 16,12 × 10-6 °C-1 a 16,92 × 10-6 °C-1 e que é muito pouco
provável que α20(Cu) esteja fora dele.
α20(Cu)

16,12 16,52 16,92 (x 10-6 °C-1)

51
O desvio padrão dessa distribuição retangular simétrica de valores possíveis de α20(Cu)
é:
s

O desvio padrão da distribuição uniforme, adotado como medida de dispersão para a


variação do valor do coeficiente de expansão térmica do cobre, é uma boa estimativa
da incerteza padronizada do mesmo.

52
Distribuição triangular

A distribuição de probabilidade triangular possui o formato de um


triângulo.

Graficamente, essa distribuição inicia com um valor mínimo, cresce


linearmente até um ponto de altura máxima que corresponde à média
da distribuição, e depois decresce da mesma forma até atingir o valor
máximo.

53
Distribuição Triangular
Forma gráfica

{
𝑎+𝑏
𝜇=
0 𝑝𝑎𝑟𝑎 𝑥 <𝑎 2
4 ( 𝑥 − 𝑎) 𝑎+𝑏
¿ 𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑏−𝑎 𝑏− 𝑎
( 𝑏− 𝑎 )2 2 = =
Distribuição Triangular 𝑓 ( 𝑥 )=
Expressão matemática 4 (𝑏 − 𝑥 ) 𝑎+𝑏 √ 24 2 √ 6
¿ 𝑝𝑎𝑟𝑎 ≤ 𝑥 ≤𝑏
(𝑏 − 𝑎) 2
2
¿ 0 𝑝𝑎𝑟𝑎 𝑥 >𝑏

54
Exemplo 1: Durante a calibração de um manômetro a temperatura ambiente variou de um
valor mínimo de 18 até um máximo de 22 °C. Com base nessa informação apresente a
estimativa da média e do desvio padrão da temperatura.

Solução: há um valor central mais provável (ainda desconhecido) e dois valores


extremos no intervalo, com menor probabilidade de ocorrência [18 °C; 22 °C]. Esses
dados sugerem uma distribuição de probabilidade triangular.

Média = (18+22) °C/2 = 20 °C

Desvio padrão °C = 0,8 °C

55
Exemplo 2: distribuição triangular (baseado no Guia EURACHEM):

O volume total (V) de uma solução é medido enchendo um balão de


100 mL. O fabricante do balão informa que ele possui um volume de
(100 ± 0,1) ml, medido a uma temperatura de 20 °C.

Solução: Considerando a pouca informação disponível, o Guia EURACHEM considera


ser mais realista esperar que os valores próximos aos limites sejam menos prováveis
do que próximo ao ponto médio e, portanto, recomenda assumir uma distribuição
triangular para essa fonte de entrada, variando de 99,9 mL a 100,1 mL, com um valor
esperado de 100,0 mL.
mL = 0,04 mL

56
Distribuição em forma de “U”

A distribuição de probabilidade em forma de U


f(x)
apresenta uma maior probabilidade de
encontrarmos valores próximo aos extremos do
intervalo do que próximo ao valor central.

Esta distribuição é muito utilizada nas medições em


x
sistemas de radiofrequências (RF), nos casos onde
-a 0 a ocorrem desacoplamentos de impedâncias.
, -a < x < a
Também pode ser utilizada para modelar a distribuição
𝑎
de uma temperatura ambiente, quando o sistema de
= controle utilizado é do tipo “on-off”.
√2

57
Exemplo:

Um ambiente é refrigerado por um ar condicionado simples e sua temperatura


oscila entre 20,0 °C e 24,0 °C, sendo controlada por um termostato tipo on/off
(liga/desliga).
Considerando, nesse caso, uma distribuição em forma de U para a variação da
temperatura teremos:

a = 2,0 °C

58
Distribuição normal

A curva normal é uma curva simétrica com formato de sino. Possui um pico
característico, que representa o ponto de frequência máxima e, nesse ponto,
situa-se a média da distribuição. A partir da média, a frequência decai
igualmente para ambos os lados infinitamente, aproximando-se do eixo das
abscissas.

59
O modelo matemático que representa a função densidade de probabilidade da
distribuição normal está representado na figura abaixo.
-∞ < m < +∞ e s > 0

e = 2,718 (constante)
p = 3,1416 (constante)
m = média da população
s = desvio padrão da
população
X = variável aleatória


𝑛
    x  𝑠= 1
n n 2

µ
 i1xi  i 1 i
∑ ( 𝑥𝑖 −𝑥 )
2

n n 𝑛−1 𝑖=1

60
Cada combinação média/desvio padrão corresponde a formatos de curvas
diferentes.

Médias diferentes e desvios


padrões iguais

Médias iguais e desvios padrões


diferentes

61
Distribuição normal padronizada

Numa distribuição normal a média e desvio padrão podem assumir


diferentes valores.
Um modelo matemático simplificado resolve a complexidade da
distribuição normal.
Utilizando-se uma tabela, qualquer variável é transformada na variável Z,
cujo valor é a variável menos a média dividido pelo desvio padrão.

62
Na distribuição normal padronizada temos que a média (m) assume valor zero, e o
desvio-padrão (s), valor um. Sendo assim, a função de distribuição de probabilidade
assume a seguinte conformação.
( xi − μ )
Z=
σ

A área total sob a curva


corresponde a 100 %. Cada
metade possui 50 % da área
total. Após transformar a curva
normal na curva normal
padronizada, ela assume a
mesma forma da distribuição
normal, com média m = 0 e
desvio padrão s = 1.

63
Tabela da
distribuição normal
padronizada

64
Exemplo 1: considere um limite superior de tolerância para a medição

O teor máximo de contaminantes em uma amostra de produto,


definido por uma determinada legislação, é de 0,200 mg/g.

O resultado encontrado da medição foi próximo a esse limite: 0,197 mg/g.

O instrumento de medição apresenta uma incerteza padrão de 0,002 mg.

Pergunta: o nível de contaminantes na amostra atende à legislação ou ele está acima do


permitido, uma vez que o resultado é apenas uma estimativa e esse apresenta uma
incerteza?

65
Solução: Limite = 0,200 mg/g

Probabilidade de
não atender à
legislação.

x = 0,197 mg/g

Levando em consideração a incerteza, o usuário dessa medição pode avaliar qual a probabilidade do
valor de contaminantes no produto estar acima do limite máximo permitido pela legislação.
Primeiro ação é transformar a variável de medição para o escore-Z:

𝑋 −𝑥
𝑍= Onde X = limite máximo permitido
𝑢
x = medição
u = incerteza padrão

66
𝑋 − 𝑥 0,200 −0,197
𝑍= = =1,5
𝑢 0,002

Em seguida calcula-se a probabilidade da variável assumir um valor padronizado


maior do que o de escore-Z calculado:

P(X > z) = 1 – P(X ≤ z) = 1 – P(X ≤ 1,5)

67
Na tabela da curva normal padronizada temos que:
P(X ≤ 1,5) = 0,9332
P(X > z) = 1 – 0,9332 = 0,0668

Ou seja, há uma probabilidade de aproximadamente 7% do


produto não atender ao limite máximo permitido de
contaminantes.

Este tipo de informação possibilita ao usuário dessa medição


avaliar e definir um risco aceitável na sua tomada de decisão.

Assim, se ele decidir considerar a amostra como aprovada, saberá


que estará incorrendo em um risco de 7% de ter tomado uma
decisão errada, ou seja, aprovar uma amostra quando na verdade
deveria reprová-la.

68
Exemplo 2: considere um limite inferior de tolerância para a medição

De forma semelhante, dado um único limite inferior de tolerância, LIT, e uma estimativa de
medição y com incerteza padrão de medição de u(y), uma regra de decisão deve definir uma
probabilidade de conformidade (Pc) assumindo uma probabilidade de erro tipo I (α), ou seja,
produtos em conformidade são rejeitados incorretamente.

𝑃 ( 𝑦 ≥ 𝐿𝐼𝑇 )= 𝑃 ( 𝑦 − 𝐿𝐼𝑇
𝑢 )
69
Considere uma estimativa de medição y = 0,012 g com uma incerteza u(y) = 0,001 g. Foi definido um
único limite inferior de tolerância LIT = 0,010 g e uma probabilidade para a conformidade (1 - α) de
0,99 (99%), assumindo, assim, um erro tipo I (α) = 0,01 (1%).

Com o resultado experimental (0,012 g), o limite de tolerância (0,010 g) e assumindo uma distribuição
de probabilidades gaussiana, a regra de decisão será aceitar que a hipótese que P(Y ≥ 0,010 g) ≥ 0,99 é
verdadeira.

𝑃 𝑐 =𝑃 ( 𝑦 − 𝐿𝐼𝑇
𝑢
=𝑃) (
0,012 − 0,010
0,001 )
= 𝑃 ( 2,0 )= 0,977 2(97,7 2 % )< 0,99

70
Conclusão:

Se a medição for 0,012 g com incerteza padronizada u = 0,001 g, a probabilidade do


valor ser aceito é de 97,7%. Como queremos uma probabilidade maior ou igual a
99% o resultado 0,012 g será rejeitado.

Se a probabilidade de conformidade fosse redefinida para 95%, erro tipo I (α) = 0,05
(5%), a regra de decisão seria aceitar a hipótese P(Y ≥ 0,010 g) ≥ 0,95 como
verdadeira.

Se a medição for 0,012 g com incerteza padronizada u = 0,001 g, a probabilidade do


valor ser aceito é de 97,7%. Como queremos uma probabilidade maior ou igual a
95% o resultado 0,012 g será aceito.

71
Exemplo 3: considere um intervalo bilateral de tolerância

A Figura apresenta um intervalo de tolerância bilateral com limites de tolerância superior (LST) e
inferior (LIT) e tolerância T = LST – LIT. Como visto anteriormente, o mensurando Y obedece a
uma distribuição normal. A estimativa y se encontra no intervalo de tolerância e há uma fração
visível da probabilidade na região η > LST.

Conhecendo os limites superior e inferior da tolerância


de um processo de medição, como saber se um
determinado resultado de medição, da grandeza
analisada, tem uma determinada probabilidade de estar
dentro dos limites de tolerância?

𝑃 𝑐 =P(𝐿𝑆𝑇 − 𝑦
𝑢
−P) (
𝐿𝐼𝑇 − 𝑦
𝑢 )

72
Uma amostra de óleo de motor SAE Grau 40 é necessária para ter uma viscosidade cinemática Y a 100°C
não inferior a 12,5 mm2/s e não superior a 16,3 mm2/s. A viscosidade cinemática da amostra é medida a
100 °C, com valor medido de y = 13,6 mm2/s e incerteza padrão de u = 1,8 mm2/s. Qual a probabilidade
da amostra de óleo do motor estar conforme a especificação?

𝑃 𝑐 =P ( 𝐿𝑆𝑇 − 𝑦
𝑢 ) (
−P
𝐿𝐼𝑇 − 𝑦
𝑢 )

 65,89%

73
A área hachurada compreende 65,89% de probabilidade da medição (13,6 ± 1,8) mm²/s estar
conforme com as especificações do produto.

74
1.4. Teorema Central do Limite

Vamos considerar o lançamento de um dado não viciado.

A distribuição de probabilidades para esse evento é uma distribuição retangular.

Histograma de amostra de
tamanho n = 6, representado
pelo lançamento de um dado
apenas.

75
Vamos considerar, agora, o lançamento de dois dados.

A distribuição de probabilidades desse evento se aproxima de uma distribuição


triangular.

Histograma de amostra de tamanho


n = 36, representado pela média do
lançamento de dois dados.

76
Vamos considerar, agora, o lançamento de três
dados.
A distribuição de probabilidades desse evento
se aproxima de uma distribuição normal. 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Histograma de amostra de tamanho n = 216,


representado pela média do lançamento de
três dados.
Percebe-se que o aumento da amostra de 6 para 36, e depois para 216, modificou
radicalmente a função de distribuição probabilidades associada a cada um dos
histogramas.
Aumentando o tamanho da amostra a forma da distribuição de probabilidades tendeu
ao formato de sino (distribuição normal).

77
Mesmo que a distribuição de uma população não seja normal, a média das amostras
aproxima-se da distribuição normal. Essa aproximação torna-se melhor à medida que
aumentamos o tamanho da amostra (n → ).
O Teorema Central do Limite diz o seguinte:

“Quanto mais variáveis aleatórias forem combinadas, mesmo sendo de diferentes


distribuições estatísticas, mais próximo de uma distribuição Normal será o resultado
dessa combinação de variáveis.”

É por este motivo que no estudo da metrologia abordamos como uma distribuição normal
o resultado final da combinação das diversas fontes de incertezas, mesmo sendo, essas
fontes, de diferentes distribuições estatísticas. O resultado final do somatório dessas
influências tem um comportamento de uma distribuição normal.

78
Como decorrência do Teorema Central do Limite, ao retirarmos diversas amostras de
tamanho n e calcularmos suas médias (, onde p é o número de amostras, teremos para
o desvio padrão da média () a expressão dada pela equação:
𝑠𝑥
𝑠𝑥 =
√𝑛
Isso significa que, a partir de uma amostra de tamanho n e desvio padrão , pode-se
estimar o desvio padrão da média () amostral.
Exemplo: Estime para um conjunto de 9 medições que forneceu média 4,56 g e
desvio padrão 0,33 g.

79
Demonstração do cálculo do desvio padrão da média

𝑉 ( 𝑥 )=𝑉 ( )
∑𝑥
𝑛
1 1 1
= 2 𝑉 ( ∑ 𝑥 ) = 2 ∑ 𝑉 (𝑥)= 2 𝑛𝑉 (𝑥 )
𝑛 𝑛 𝑛
1
𝑉 ( 𝑥 )= 𝑉 ( 𝑥)
𝑛

𝑠𝑥
𝑠𝑥 =
√𝑛

80
O desvio-padrão da média é considerado pelo ISO GUM como a incerteza tipo A, caso a
amostra pertença à mesma população. Do contrário, a incerteza tipo A será igual ao
desvio-padrão da amostra (s).
O teorema central do limite funciona bem a partir de amostras n30.
Ao aumentarmos o tamanho das amostras os intervalos de classe do histograma ficam
cada vez menores, de modo que o contorno das barras ganha um formato mais
suavizado, gerando a distribuição normal.
Na prática trabalhamos com amostras inferiores a 10, já que o custo da medição
aumentaria consideravelmente, e Medir não é de graça!
Veremos, logo a seguir, a distribuição t-Student que auxilia nos casos de amostras de
tamanho pequeno, ou seja, n < 30.

81
Distribuição t-Student

William Sealy Gosset (1876-1937): Químico e matemático. Em 1904 ele escreveu um


relatório intitulado “A aplicação da Lei do Erro”, no qual introduziu varias metodologias
estatísticas para a indústria cervejeira. O primeiro artigo de Gosset foi uma aplicação da
distribuição de Poisson na contagem de leveduras. Para muitos usuários da Estatística
o nome William Gosset pode soar desconhecido. No entanto, o pseudônimo Student
revela-o como um dos estatísticos mais importantes e brilhantes da história.

82
William Gosset desenvolveu uma distribuição, chamada distribuição t-
Student, que fornece valores tabelados em função do grau de liberdade (n
= n-1) da amostra associado às respectivas probabilidades (50%; 68,27%;
70% etc).

Os fatores desenvolvidos por Gosset aproximam a distribuição de pequenas


amostras à distribuição normal. A Tabela apresenta alguns desses fatores,
mais especificamente aqueles associados ao nível de significância,
confiança ou probabilidade de abrangência.

83
Nível de Confiança ou Probabilidade de Abrangência
50% 68,27% 70% 80% 90% 95% 95,45% 99% 99,73%

n = (n-1)
Nível de Significância (a)
n

0,50 0,3173 0,30 0,20 0,10 0,05 0,0455 0,01 0,0027


Os fatores apresentados na Tabela são conhecidos
2 1 1,00 1,84 1,96 3,08 6,31 12,71 13,97 63,66 235,8

Tabela t-Student 3
4
2
3
0,82
0,76
1,32
1,20
1,39
1,25
1,89
1,64
2,92
2,35
4,30
3,18
4,53
3,31
9,92
5,84
19,21
9,22
como t-crítico (tc) e no âmbito da metrologia como
fator de abrangência, recebendo a denominação “k”
4,60
5
6
4
5
0,74
0,73
1,14
1,11
1,19
1,16
1,53
1,48
2,13
2,02
2,78
2,57
2,87
2,65 4,03
6,62
5,51
em vez de “t”.
7 6 0,72 1,09 1,13 1,44 1,94 2,45 2,52 3,71 4,90
8 7 0,71 1,08 1,12 1,41 1,89 2,36 2,43 3,50 4,53 Os valores de k são fornecidos em função do nível de
9 8 0,71 1,07 1,11 1,40 1,86 2,31 2,37 3,36 4,28 confiança (probabilidade de abrangência) ou nível de
10 9 0,70 1,06 1,10 1,38 1,83 2,26 2,32 3,25 4,09
11 10 0,70 1,05 1,09 1,37 1,81 2,23 2,28 3,17 3,96 significância (a) e são inversamente proporcionais ao
12 11 0,70 1,05 1,09 1,36 1,80 2,20 2,25 3,11 3,85 tamanho da amostra (n) e seu respectivo grau de
13 12 0,69 1,04 1,08 1,35 1,77 2,16 2,23 2,98 3,69
liberdade ( = n-1).
Tamanho da amostra

14 13 0,69 1,04 1,08 1,35 1,77 2,16 2,21 3,01 3,69


15 14 0,69 1,04 1,08 1,35 1,76 2,14 2,20 2,98 3,64
16 15 0,69 1,03 1,07 1,34 1,75 2,13 2,18 2,95 3,59 À medida que se aumenta o tamanho da amostra os
17 16 0,69 1,03 1,07 1,34 1,75 2,12 2,17 2,92
2,90
3,54 valores de k tendem a se tornar constantes, basta
18 17 0,69 1,03 1,07 1,33 1,74 2,11 2,16 3,51
19 18 0,69 1,03 1,07 1,33 1,73 2,10 2,15 2,88 3,48 observar os valores de “k” ou “tc” para níveis de
20
21
19
20
0,69
0,69
1,03
1,03
1,07
1,06
1,33
1,33
1,73
1,72
2,09
2,09
2,14
2,13
2,86
2,85
3,45
3,42
confiança na ordem de 95%, 95,45% e 99% para
22 21 0,69 1,02 1,06 1,32 1,72 2,08 2,13 2,83 3,40 tamanho de amostras tendendo ao infinito (). Nessas
2,82
23
24
22
23
0,69
0,69
1,02
1,02
1,06
1,06
1,32
1,32
1,72
1,71
2,07
2,07
2,12
2,11 2,81
3,38
3,36
condições temos respectivamente k ou tc = 1,96; 2,00 e
25 24 0,68 1,02 1,06 1,32 1,71 2,06 2,11 2,80 3,34 2,58.
26 25 0,68 1,02 1,06 1,32 1,71 2,06 2,11 2,79 3,33
27 26 0,68 1,02 1,06 1,31 1,71 2,06 2,10 2,78 3,32
28 27 0,68 1,02 1,06 1,31 1,70 2,05 2,10 2,77 3,30
29 28 0,68 1,02 1,06 1,31 1,70 2,05 2,09 2,76 3,29
30 29 0,68 1,02 1,06 1,31 1,70 2,05 2,09 2,76 3,28 84
A tabela anterior apresenta somente alguns valores do t-Student. Demais
valores podem ser obtidos no software Excel por meio da função:
INV.T.BC(probabilidade;grau de liberdade)
A probabilidade considerada pelo Excel é o nível de significância, ou seja,
1-p. Assim, se quisermos calcular o t-Student para 95,45 % devemos entrar
na fórmula com 0,0455 (=1-0,9545).
Ex.: n= 100  INV.T.BC(0,0455;99)  t = 2,026

85
A distribuição t-Student é contínua, simétrica, possui média zero e desvio padrão variável
de acordo com o grau de liberdade (n = n-1). O parâmetro t é calculado pela seguinte
expressão:
𝑥−𝜇
𝑡=
𝑠
√𝑛
Essa distribuição é muito útil quanto precisamos estimar a média da população m, que
supostamente tem distribuição normal, a partir de pequenas amostras, utilizando a média
e desvio padrão da amostra s. A média m estará compreendida no seguinte intervalo:
_ t _ s
-t<m< +t   X s e s( x ) 
n n

86
Exemplo: Considere uma
distribuição normal com 5 AMOSTRAS Intervalo Frequência
Frequência

Média = 2,091
μ = 2 e  = 0,4. Vamos s = 0,428
1,5 1 2,5
2
agora simular essa 1,8 0 1,5
1

distribuição com 2,1 1 0,5


0
2,4 1
diferentes amostras
1,5 1,8 2,1 2,4 Mais

Mais 2
(n = 5; 20; 100 e 1 000).
20 AMOSTRAS Intervalo Frequência
Frequência
Média = 1,965 1,1 1
s = 0,438 1,4 0
8
1,7 5 6
2,0 3 4

2,3 7 2

2,7 2 0
1,1 1,4 1,7 2,0 2,3 2,7 Mai s
Mais 2

87
Intervalo Frequência 100 AMOSTRAS
1,1 1 Média = 2,049
1,4 2 s = 0,363
1,6 8
Frequência
1,8 13
2,1 32 40

2,3 17 30

2,5 16 20

2,7 8 10

Mais 3 0
1,1 1,4 1,6 1,8 2,1 2,3 2,5 2,7 Mais

88
Intervalo Frequência
0,6 1
0,9 5
Frequência 1000 AMOSTRAS
Média = 2,002
1,2 23 275
s = 0,413
1,5 90 250
225
1,8 200
200
2,1 277 175
2,4 258 150
125
2,7 105
100
3,0 36 75

3,3 3 50
25
3,6 2 0
Mais 0 0,6 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3,0 3,3 3,6 Mais

Percebe-se que com n = 100 e n = 1000 o histograma aproxima-se de uma curva


normal.
89
Vamos considerar, na tabela t-Student, uma probabilidade de
abrangência de 95,45%. A partir das amostras, a média μ pode ser
estimada por: _ t _ s
  X s e s( x ) 
n n

90
Graficamente podemos verificar que, para qualquer tamanho da amostra, a média
μ = 2 está compreendida no intervalo:
-t<m< +t

Entretanto, quanto menor o tamanho da amostra maior será o intervalo que


contém a média.

91
Exercício:

Foram feitas 8 medições de resistência Medições R (Ω)


elétrica em um resistor R, e a tabela ao lado 1 199,8
apresenta os valores obtidos. Com base 2 200,0
nesses valores: 3 200,1
a) Qual o valor do resistor? 4 200,4
b)Determine o desvio padrão amostral e o 5 199,5
desvio padrão da média. 6 200,0
c)Determine o intervalo com 95,45 % de 7 200,5
probabilidade onde podemos encontrar a 8 199,9
média das 8 medições.

92
Solução:

a. O valor de R será calculado pela média das 8 medições.

𝑥𝑖
𝑅=∑ =200,0 Ω
𝑛
b.
n 2

Desvio s
 i 1  x  xi  = 0,3196
padrão n 1 Ω

𝑠 0,3196
Desvio padrão da 𝑠 ( 𝑥 )= = =0,113 Ω
média √𝑛 √8

93
c. -t<m< +t

Para determinarmos o intervalo de probabilidade de 95,45 %, devemos calcular o grau de liberdade e seu
fator t-Student.
Com 8 medições, temos um grau de liberdade no valor de 7 (n − 1). Consultando a tabela t-Student, temos
t = 2,43.
Logo, para 95,45 %, temos t2,43 × 0,113 = 0,28 Ω.

Intervalo = (200,0 ± 0,3) Ω


[199,7 a 200,3] Ω

94
1.5. Critério de Chauvenet: rejeição de uma leitura

Antes de se avaliar e interpretar uma série de resultados obtidos por um ou mais


laboratórios, ou se efetuar o cálculo da incerteza, é necessário que se verifique a
existência de valores que possam ser considerados como dispersos, ou seja, valores
que não pertençam a uma mesma população.

Quando uma grandeza é medida várias vezes pode ocorrer que o desvio de um
resultado em relação ao seu valor médio seja muito grande, se comparado com o
desvio padrão das medições.

95
Isto pode acontecer em função de erros grosseiros, falhas momentâneas do
instrumento de medição ou qualquer outro motivo.

O critério de Chauvenet é bastante utilizado para avaliar se uma medição deve ser
rejeitada.

Este critério estabelece que, se o módulo do desvio di de uma determinada medição xi


em relação à média for maior que um valor dch, chamado de limite de rejeição de
Chauvenet, a medição deve ser rejeitada.

96
Assim, se s: desvio padrão do
conjunto de N medições
N dch N dch
2 1,15 s 19 2,22 s
3 1,38 s 20 2,24 s
4 1,54 s 21 2,26 s
5 1,65 s 22 2,28 s
6 1,73 s 23 2,30 s
7 1,80 s 24 2,31 s
8 1,86 s 25 2,33 s
9 1,91 s 26 2,35 s
10 1,96 s 30 2,39 s
11 2,00 s 40 2,50 s
12 2,04 s 50 2,57 s
13 2,07 s 100 2,81 s
14 2,10 s 200 3,02 s
15 2,13 s 300 3,14 s
16 2,15 s 500 3,29 s
17 2,18 s 1 000 3,49 s
18 2,20 s 2 000 3,62 s

97
Para valores de N não encontrados na tabela apresentada, o valor dch é calculado
de forma a se obter a probabilidade de um desvio em relação à média igual a
1/(2N).
Desta forma, entrando na tabela da curva normal com o valor de ½ P = 1/(4N),
encontramos o valor de z. Daí obtemos dch = z s.

Exemplo: n = 35  ½ P = 1/140 = 0,0071

Tabela curva normal: p = 0,0071, ou 1-p = 0,9929

98
z = 2,45  dch = 2,45 s

99
Exemplo: Leitura xi
1 5,30
2 5,73
3 6,77
4 5,26
5 4,33
6 5,45
7 6,05
8 5,64
9 5,81
10 5,75

Devemos considerar o critério no máximo 2 vezes. Se na 3ª vez encontramos


alguma medida fora devemos rejeitar todo o conjunto de medições.

100
Leitura xi Média 𝑑 𝑖 =|𝑥 𝑖 − 𝑥|
 
1 5,3 5,609 0,309
2 5,73   0,121 N=10 1,96 s = 1,222
3 6,77 s 1,161 Leitura xi Média 𝑑  𝑖 =|𝑥 𝑖 − 𝑥|
4 5,26 0,623 0,349 1 5,3 5,624 0,324
5 4,33   1,279 2 5,73   0,106 N=8 1,86 s = 0,503
6 5,45   0,159 3 5,26 s 0,364
7 6,05   4 5,45 0,270 0,174
0,441 5 6,05   0,426
8 5,64   0,031 6 5,64   0,016
9 5,81   0,201 7 5,81   0,186
10 5,75   0,141 8 5,75   0,126

Leitura xi Média 𝑑 𝑖 =|𝑥 𝑖 − 𝑥|


 
1 5,3 5,751 0,451
2 5,73   0,021 N=9 1,91 s = 0,875
3 6,77 s 1,019
4 5,26 0,458 0,491
5 5,45   0,301
6 6,05   0,299
7 5,64   0,111
8 5,81   0,059
9 5,75   0,001

101
Exemplos de aplicações
I - Incerteza da Resolução de Leitura

É comum encontrarmos uma baixa dispersão dos valores em um processo de


medição, o que caracteriza que o desvio padrão da amostra pode ser “zero”.

Dependendo do valor da resolução e do tipo de distribuição de probabilidade


adotados, essa incerteza poderá ser uma das maiores, ou a maior, contribuição na
incerteza final.

102
Situação 1: Medição onde “buscamos” o valor da grandeza desejada, ou seja, não sabemos a priori qual
é o valor a ser encontrado.

Exemplo 1:
Suponha que o valor medido da pressão seja 10,00 bar e
que o manômetro digital utilizado tenha uma resolução de
0,01 bar. Isto significa dizer que o instrumento lê
incrementos de 0,01 em 0,01 bar. Considerando o
algoritmo existente no manômetro, responsável pela
digitalização dos valores indicados, o “valor verdadeiro” da
pressão estará compreendido entre o intervalo [9,995 a
10,005] bar. Valores como 10,006 bar, ou maiores, deverão
ser arredondados pelo instrumento para 10,01 bar; da
mesma forma que valores como 9,994 bar, ou menores,
para 9,99 bar.

103
Logo, toda vez que o manômetro indicar 10,00 bar teremos uma dúvida do
“verdadeiro valor” da pressão, ocasionada pela sua limitação de resolução.
Considerando que a probabilidade do “valor verdadeiro” estar compreendido entre
[9,995 a 10,005] bar é a mesma dentro deste intervalo, é razoável adotar uma
distribuição estatística que reflita este comportamento, ou seja, a distribuição
retangular ou uniforme. Na Figura a seguir temos:

9,995 10,00 10,005 (bar)

104
Observe que a incerteza de medição da resolução do manômetro será o desvio
padrão da distribuição retangular com a = 9,995 bar e b = 10,005 bar, ou seja:

bar

𝑟𝑒𝑠𝑜𝑙𝑢 çã 𝑜
A incerteza da resolução será: 𝑢𝑟𝑒𝑠𝑜𝑙𝑢 çã 𝑜 =
√12

105
Exemplo 2: Termômetro Bimetálico (0 – 120)°C

Percebe-se que, pela proximidade


das marcações de escala e pela
largura do ponteiro, fica difícil
dividir a menor divisão (1°C) por
dois. Adotaremos, então, a
resolução (r) de leitura de 1°C.

O valor lido será de 32°C, que pode estar compreendido no intervalo (31,5<T< 32,5)°C com a mesma
probabilidade (distribuição uniforme).

A incerteza da resolução será obtida calculando o desvio padrão da distribuição retangular com r = 1°C.
1
ures  C  0,3C
12

106
Situação 2: Medição onde “fixamos” o valor desejado

Fixando o valor desejado saberemos, a priori, o valor mais provável do mensurando. Faz sentido atribuir
uma probabilidade maior a este valor.

Podemos considerar que, nesse caso, a distribuição triangular é a que melhor representa a distribuição
de probabilidade da resolução de leitura.

Exemplo: Calibração de um manômetro usando um manômetro padrão para comparação.

Manômetro com faixa de (0 a 50) bar e resolução (r)


de leitura de 1 bar.

Pontos de calibração no instrumento objeto: 10 bar,


20 bar, 30 bar, 40 bar e 50 bar

107
Tomando como exemplo o ponto de 30 bar, o “valor verdadeiro” estará compreendido no intervalo
[29,5 bar a 30,5 bar]. Assumindo uma distribuição triangular teremos:

r r 1
ures  bar  ures  bar  ures  bar  0,2bar
2 6 24 24

108
II - Incerteza da Histerese

Histerese é a maior diferença entre os valores de carga e descarga de um


instrumento de medição.

A estimativa da incerteza da histerese é obtida pelo cálculo da histerese (H) do


instrumento adotando-se uma distribuição de probabilidade retangular.

H
uhisterese 
12

109
Exemplo: Manômetro Bourdon, (0 a 20) kgf/cm2, calibrado por comparação com um
manômetro padrão.
Objeto Padrão (kgf/cm2)
(kgf/cm2) Carga 1 Descarga 1 Carga 2 Descarga 2
5 5,0 5,2 5,0 5,2
12 12,2 11,9 11,6 11,8
20 20,1 20,2 20,4 20,0

Histerese por ponto de calibração:


Objeto Padrão (kgf/cm2)
(kgf/cm2) H1 H2 H

5 |5,0 – 5,2|= 0,2 |5,0-5,2|= 0,2 0,2


12 |12,2 – 11,9|= 0,3 |11,6-11,8|= 0,2 0,3
20 |20,1 – 20,2|= 0,1 |20,4-20,0|= 0,4 0,4

110
Incerteza da histerese por ponto de calibração:

Objeto Padrão (kgf/cm2)


(kgf/cm2) H uhisterese
0,2
 0,0577
5 0,2 12
0,3
 0,0866
12 0,3 12

0,4
 0,11547
20 0,4 12

A incerteza da histerese do manômetro será a maior de


todas as faixas.
0,4
u Histerese   0,12 kgf / cm 2
12

111
EXERCÍCIOS

1. O manual do fabricante de um bloco-padrão, destinado a calibração de paquímetros e micrômetros,


fornece o valor do coeficiente de expansão térmica linear () dos blocos como 11,5 × 10-6 °C-1. Informa
também que a variação máxima do coeficiente de expansão linear é de ± 0,2 × 10-6 °C-1.
Baseado nessas informações, determine o desvio-padrão da distribuição de probabilidade do
coeficiente de expansão térmica linear ().

α = (11,5 × 10-6 ± 0,2 × 10-6) °C-1

Distribuição uniforme
a = 11,3 × 10-6 °C-1 b  a 11,7  11,3 6
Desvio -padrão  s ( x)    10  0,1  10 6   C1
b = 11,7 × 10-6 °C-1 12 12
2. Considerando os 60 valores de tensão elétrica da tabela a seguir, pertencentes a uma distribuição
uniforme, faça seu histograma, determinando sua média e seu desvio-padrão.

Tensão (V)

2,01 2,15 2,40 2,56 2,75 2,91


2,01 2,17 2,42 2,59 2,76 2,91
2,01 2,19 2,44 2,63 2,77 2,93
2,05 2,20 2,44 2,63 2,80 2,93
2,09 2,25 2,44 2,64 2,80 2,93
2,10 2,26 2,45 2,65 2,80 2,94
2,10 2,26 2,52 2,70 2,81 2,95
2,11 2,27 2,53 2,71 2,84 2,96
2,13 2,33 2,55 2,74 2,84 2,98
2,14 2,34 2,55 2,74 2,86 2,99
Amplitude = 2,99 – 2,01 = 0,98 V
K =60 = 7,75
L = A/K = 0,98/7,75 = 0,13, escolho L = 0,2

Intervalo de
HISTOGRAMA Frequência
18
classe
16 2,00 – 2,20 13
14
2,20 – 2,40 7
FREQUENCIA

12
10
8 2,40 – 2,60 11
6
4 2,60 – 2,80 11
2
0
2,80 – 3,00 17
2,00 - 2,20 2,20 - 2,40 2,40 - 2,60 2,60 - 2,80 2,80 - 3,00

CLASSE
_
b  a 2,99  2, 01
x   2,50 V
2 2

𝑏 − 𝑎 2,99 −2,01
𝑠= = =0,28 𝑉
2 √3 2√3
3. A tabela representa as medições de temperatura, em grau Celsius, de um laboratório ao longo de
uma manhã. Faça o histograma desses valores considerando uma distribuição normal. Determine
também sua média e seu desvio-padrão.

Temperatura (°C)
23,6 23,8 24,0 24,0 24,1 24,2
23,6 23,8 24,0 24,0 24,1 24,2
23,7 23,8 24,0 24,0 24,1 24,2
23,7 23,8 24,0 24,0 24,2 24,2
23,7 23,8 24,0 24,1 24,2 24,3
23,7 23,9 24,0 24,1 24,2 24,3
23,7 23,9 24,0 24,1 24,2 24,3
23,7 23,9 24,0 24,1 24,2 24,3
23,8 23,9 24,0 24,1 24,2 24,5
23,8 24,0 24,0 24,1 24,2 24,6
Amplitude = 24,6 – 23,6 = 1,0 °C
K =60 = 7,75 Intervalo de
Frequência
L = A/7 = 0,14 ou L = A/8 = 0,12; escolho L = 0,2 classe
23,5 – 23,7 2
23,7 – 23,9 13
HISTOGRAMA
23,9 – 24,1 19
25

20
24,1 – 24,3 20
24,3 – 24,5 4
FREQUANCIA

15

10 24,5 – 24,7 2
5

0
,70 ,90 ,10 ,30 ,50 ,70
- 23 - 23 - 24 - 24 - 24 - 24
23,5 23 ,7 0
23 ,9 0
24 ,1 0
24 ,3 0
24 ,5 0 Média
n
CLASSE
 x
µ
n
i 1 i
= 24,0 °C

Desvio-padrão
n 2

s
 x  x 
i 1 i
= 0,2 °C
n 1
4. A Tabela apresenta 60 valores de tensão obtidos de uma
Valores de tensão (V)
tomada elétrica. Com base nesses valores:
128,42 128,62 128,69 128,75 128,80 128,84
a) Faça um histograma, adotando sete classes para melhor
128,49 128,63 128,69 128,76 128,80 128,87
construí-lo.
b) Determine seu desvio padrão amostral. 128,49 128,63 128,71 128,76 128,80 128,88

c) Determine o intervalo onde temos 95,45 % de probabilidade 128,56 128,65 128,72 128,77 128,81 128,89
de encontrarmos uma medição entre as 60 medições.
128,57 128,65 128,72 128,77 128,82 128,90
d) Verifique quantos valores estão dentro do intervalo
128,58 128,66 128,73 128,77 128,83 128,91
determinado no item (c) e verifique se esses valores
correspondem a 95,45 % dos valores medidos. 128,59 128,66 128,74 128,78 128,83 128,93

e) Determine o intervalo com 95,45 % de probabilidade onde 128,59 128,66 128,74 128,79 128,83 128,94
podemos encontrar a média das 60 medições.
128,60 128,67 128,75 128,80 128,83 129,01

128,61 128,69 128,75 128,80 128,83 129,11


4. a. Histograma Intervalo de classe Frequência
18
16 128,40 – 128,50 3
14
12
128,50 – 128,60 5
10 128,60 – 128,70 14
8
6 128,70 – 128,80 16
4
2 128,80 – 128,90 16
0
,5 128,90 – 129,00 4
128 28,6 28,7 28,8 28,9 29,0 MAI
S
4- 5-1 6-1 7-1 8-1 9-1 ,0 -
128, 128, 128, 128, 128, 128, 129 129,00 – MAIS 2

b. Pelo histograma, observa-se uma distribuição tendendo a uma normal.

n 2

Desvio padrão s
 x  x 
i 1 i
= 0,13 V
n 1
c.
Para determinarmos o intervalo de probabilidade de 95,45 %, devemos calcular o grau de liberdade e seu fator t-
Student.

Com 60 medições, temos um grau de liberdade no valor de 59 (n − 1). Consultando a tabela t-Student, temos t = 2,043.
Logo, para 95,45 %, temos 2,042 × 0,13 = 0,26 V.

Observe que aqui não calculamos o desvio-padrão da média, uma vez que desejamos determinar o intervalo no qual
temos a probabilidade de 95,45 % de encontrarmos uma medição dentro das 60 realizadas.

Média µ
 x
i 1 i = 128,74 V
n

Intervalo = (128,74 ± 0,26) V


[128,48 V; 129,00 V]
d. Dentro do intervalo, temos 57 medições, totalizando 95,00 % dos valores medidos.
e. Como agora desejamos o intervalo onde encontraremos a média das medições, iremos trabalhar com
o conceito de desvio-padrão da média.
s 0,1282885
sx    0,016562  V
n 60

Para n = 60, temos grau de liberdade igual a 59 e, consequentemente, t = 2,043. O intervalo será dado
pela expressão:
𝑡 𝑠 𝑥 =2,043 𝑥 0,016562=0,034 𝑉
Assim, teremos, para 95,45 % de probabilidade de encontrarmos a média das 60 medições, o seguinte
intervalo:
(128,74 ± 0,03) V
5. Considere as amostras a seguir retiradas de lotes de pesagem de duas balanças distintas:

Balança 1 (kg) 15,00 14,80 15,20 14,90 15,10 14,70


Balança 2 (kg) 14,60 14,70 15,40 15,30 14,90 14,90

a) Calcule a média das duas amostras.


b) Calcule o desvio-padrão amostral das duas amostras.
c) Com base nos itens anteriores, qual balança apresenta a maior dispersão
de medidas?
d) Determine, para cada balança, o intervalo onde temos 95,45 % de
probabilidade de encontrarmos a média das medições.
5. a.


n
x d. ) Intervalo com 95,45 %: 𝑥 ± 𝑡 𝑠𝑥
Balança 1 µ i 1 i
= 14,95 kg
Média n
n
Tabela t-Student para n = 6 e grau de liberdade 5, temos t = 2,649
Balança 2 µ
 i 1 i
x
n = 14,97 kg
Média s 0,187083
Balança 1    0,076376  kg
6 6
Desvio padrão da
b. Balança 1 n
 i1  x  xi 
2
média
Desvio padrão s = 0,187083 kg
n 1 Balança 2 s 0,320416
amostral    0,130809  kg
Desvio padrão da 6 6
média
Balança 2 n 2

Desvio padrão s
 i1  x  xi 
n 1 = 0,320416 kg
amostral Balança 1: (14,95 ± 0,20) kg
Balança 2: (14,97 ± 0,35) kg
c. Balança 2
6. Considere que a monitoração do pH de uma substância, ao longo de um dia, apresente uma distribuição
triangular. Com base nos 12 valores medidos ao longo desse dia, responda ao que se pede.

pH
a) Qual é a média dessa distribuição de valores?
7,24 7,20 7,23 7,25
b) Qual é o desvio-padrão da distribuição?
7,24 7,21 7,26 7,24
7,24 7,24 7,24 7,24

𝑎+𝑏 (7,20+ 7,26 ) 𝑝𝐻


𝜇= = =7,23 𝑝𝐻
2 2

𝑏 − 𝑎 (7,26 −7,20) 𝑝𝐻
= = =0,01 𝑝𝐻
√ 24 √ 24
7. Um técnico em metrologia mediu a temperatura interna de uma estufa encontrando para a média das oito
medições realizadas 48,9 °C e desvio-padrão amostral igual a 0,6 °C. Considerando os valores medidos pertencentes
a uma distribuição t-Student, determine a probabilidade da próxima medição estar entre:
a) (48,3 e 49,5) °C
b) (47,4 e 50,4) °C
c) (46,2 e 51,6) °C

a. Considerando que oito medições implicam um grau de liberdade igual a 7 e consultando a tabela t-Student, verificamos que,
para grau de liberdade 7, temos t = 1,077.

Então ts = 0,642 °C. Logo o intervalo será de (48,3 a 49,5) °C – 68,27 %.

b. Para 95,45 %, temos t = 2,429, implicando para ts = 1,4574 °C. Logo o intervalo será de (47,4 a 50,4) °C.

c. Para 99,7 %, temos t = 4,442, implicando para ts = 2,6652 °C. Logo o intervalo será de (46,2 a 51,6) °C.

Você também pode gostar