Você está na página 1de 14

INSTRUMENTAÇÃO

E AUTOMAÇÃO
INDUSTRIAL
Fundamentos
de estatística
Eduardo Scheffer Saraiva

OBJETIVOS DE APRENDIZAGEM

>> Explicar os conceitos básicos da estatística.


>> Aplicar as definições de média geométrica, desvio-padrão e variância à
instrumentação.
>> Distinguir eventos de probabilidade e correlação.

Introdução
Medições são parte fundamental de todo processo industrial, pois é por meio
delas que podemos estimar, comparar e estabelecer critérios de performance
para todo o sistema. Porém, sensores e instrumentos de medição estão sujeitos
a incertezas de diferentes fontes, o que pode comprometer a obtenção dos dados.
Para contornar esse problema, são utilizados cálculos estatísticos para a análise
dos dados, de modo que se possa obter uma medição mais próxima do valor real
mesmo que o sistema apresente ruído em suas medições.
Neste capítulo, vamos definir os conceitos fundamentais de estatística. Além
disso, veremos como a estatística pode ser utilizada para determinar a perfor-
mance de instrumentos de medição. Por fim, falaremos da probabilidade de uma
medição estar dentro de um intervalo e explicaremos a correlação das variáveis
de um processo.
2 Fundamentos de estatística

Conceitos fundamentais
Em um processo industrial, visando ao controle do sistema, é necessário
que medições sejam constantemente realizadas. Além disso, as medições
nos ajudam a estabelecer metas e comparações quanto à performance do
processo e dos equipamentos envolvidos no sistema. Dessa forma, é impres-
cindível que as medições sejam realizadas, a fim de que erros de leitura não
sejam cometidos.
Segundo Cabral (2004) e Aguirre (2013), em um ambiente industrial, erros
de leitura podem ser causados por erro humano, instabilidade do processo
que está sendo medido, deficiência do instrumento de medição, ruídos na
instalação, etc. Para contornar esses erros de medição, é necessário que o
máximo possível técnica e economicamente de leituras seja realizado. Após o
levantamento das medições, princípios estatísticos podem ser estabelecidos.
Como em medições industriais, estamos lidando com valores cuja faixa
é demasiadamente grande ou infinita, então é necessário trabalhar apenas
com amostras dos elementos da população em geral. Para analisarmos esses
conjuntos de dados, podemos utilizar alguns cálculos fundamentais, como a
média, a mediana e a moda, definidas a seguir.

„„ Média aritmética: ao realizarmos diferentes medições de um processo,


é provável que o valor medido mais próximo do valor real da grandeza
seja dado pela média dos valores obtidos na leitura. Nesse caso, é
importante que o maior número de medições possível seja realizado,
uma vez que a média é tendenciosa e um pequeno número de amostras
pode nos levar a uma conclusão errada acerca da variável. A média é
descrita pela seguinte expressão:

(1)

onde N é o número total de leituras e i é o número da amostra.

„„ Mediana: a mediana é o número central quando ordenamos os valores


da medição por ordem de grandeza. Casa tenhamos um número de
medições par, a mediana será dada pela média aritmética dos dois
valores centrais.
Fundamentos de estatística 3

„„ Desvio da média: é a diferença entre o valor medido e a média das


medições realizadas. Nesse cálculo, cada amostra da população terá
seu próprio desvio da média dado por:

(2)

onde di é o desvio da média para a i-ésima amostra.

„„ Moda: é o valor que mais se repete em um conjunto de dados. Existem


casos em que a moda pode não existir em um conjunto de dados ou
em que a moda não seja única, com múltiplos valores com a mesma
frequência na população.

Vejamos um exemplo para aclarar os conceitos.


Ao realizar a medição da temperatura em um tanque, um engenheiro
obteve as seguintes leituras, obtidas ao longo do dia:

Temperatura no tanque (°C)

102 108 104 102 106 107 107 108 102 108

Com base nesses dados, determine a média, a mediana, a moda e o desvio


das medidas obtidas.
Solução. A média das amostras pode ser obtida por meio do seguinte
equacionamento:

Já a mediana pode ser obtida ao ordenarmos o vetor de medições e tirarmos


a média das leituras centrais, como demonstrado a seguir:

102 102 102 104 106 107 107 108 108 108
4 Fundamentos de estatística

Dessa forma, temos que a mediana é 106,5°C. Já a moda é obtida ao ve-


rificarmos o valor de maior frequência no conjunto. Nesses caso, a moda é
dada por 102 e 108. Por fim, calculamos o desvio da média para os valores do
conjunto, de modo que a seguinte tabela pode ser estabelecida:

Medidas 102 102 102 104 106 107 107 108 108 108

Desvios –3,4 –3,4 –3,4 –1,4 0,6 1,6 1,6 2,6 2,6 2,6

Nesta seção, definimos os conceitos fundamentais de estatística, ex-


plicando como é possível representar a média, a mediana e a moda de um
conjunto de medições realizadas em um processo. Na próxima seção, veremos
como as medidas estatísticas podem ser aplicadas a instrumentos de medição.

Estatística em instrumentação industrial


Ao utilizarmos estatística em nossas medições, também podemos medir a
qualidade e a performance de nossos instrumentos de medição. Para os ins-
trumentos de medição, o que desejamos são duas características principais: a
exatidão e a precisão. Um instrumento exato é aquele cujo valor da medição
está alinhado com o valor “real” da grandeza que está sendo medida. Já um
instrumento preciso é aquele cujas medidas estão próximas entre si, ou seja,
há pouca dispersão entre as amostras.
A exatidão de um instrumento está relacionada com a média das obser-
vações realizadas, conforme a Equação 1. Já a precisão está relacionada com
o desvio-padrão e a variância das amostras. Perceba que o desvio-padrão
não é equivalente ao desvio da média. Para distinguirmos o desvio-padrão
da variância, vamos definir a terminologia conforme Baratto (2008).
Segundo os autores, a medição tem o objetivo de estimar uma grandeza,
de forma que sempre devemos incluir uma incerteza associada à medição. À
medida que desejamos obtê-la, pode estar em função de diferentes grandezas,
como representado pela equação a seguir:

(3)
Fundamentos de estatística 5

onde F é a função entre as variáveis de entrada X e a saída Y. As grandezas X,


ao serem medidas, estão sujeitas a incertezas. Desse modo, se conhecemos
F, podemos estimar Y com base nas estimativas de X. Esses valores estimados
são definidos conforme a seguinte expressão:

(4)

Perceba que a variável Xi denota o valor real da grandeza, enquanto


a variável xi denota o valor da estimativa da grandeza, dado por
Dessa forma, o valor para a saída Y é o valor real para a saída, enquanto y é a
estimativa da saída, obtida em função dos valores estimados para as grandezas.
Além disso, perceba que n denota o número de grandezas medidas em um
processo, enquanto N é o número de medições realizadas.

Com isso, podemos definir o desvio-padrão como a dispersão das esti-


mativas das grandezas em um processo, ou seja, a incerteza relacionada à
medição dada por:

(5)

onde u(xi) é a incerteza relacionada à estimativa xi, que é equivalente ao


desvio-padrão das medições e i está se referindo ao valor da i-ésima
medida de X.
Já a variância é dada pelo quadrado do desvio-padrão:

(6)

onde N é o número total de leituras da grandeza Xi e j corresponde ao j-ésimo


valor medido da grandeza Xi.
Perceba que a estimativa da grandeza é dada pela média das observações
realizadas, conforme a seguinte expressão:

(7)

Considerando a Equação 7, vemos que incertezas relacionadas às estima-


tivas xi serão levadas à estimativa de y por meio da Equação 4. Considerando
6 Fundamentos de estatística

que existam diferentes variáveis de entrada para o processo, é necessário


levar em conta a covariância, ou seja, como as variáveis de entrada estão
relacionadas entre si. Dessa forma, uma incerteza combinada é dada pela
expressão:

(8)

Essa expressão é conhecida como lei de propagação da incerteza, onde


uc (y) é o desvio-padrão estimado e denota a dispersão dos valores para a
saída estimada y. Segundo Aguirre (2013), é desejado que a estimativa da
saída esteja associada a uma faixa de valores relacionados à incerteza da
medição. Isso é possível ao calcularmos a incerteza expandida, dada por:

(9)

onde k é o fator de abrangência, determinado ao atribuir um valor de confiança


ao intervalo de valores para a estimativa da saída. Esses valores de confiança
com o fator de abrangência estão apresentados no Quadro 1, onde p é o nível
de confiança dado à medição.

Quadro 1. Nível de confiança p e fator de abrangência k para distribuição


normal

p k

68,27% 1,000

90% 1,645

95% 1,960

95,45% 2,000

99% 2,576

99,73% 3,000

Fonte: Adaptado de Aguirre (2013).


Fundamentos de estatística 7

Por fim, podemos descrever a faixa de valores associados à estimativa


da saída como:

(10)

Vejamos um exemplo para aclarar os conceitos.


Em um processo industrial, é desejada a estimativa de uma grandeza Y,
que está em função das medições a e b. Sabendo que Y é dada por Y = a · b,
determine a faixa de valores para Y com uma probabilidade de 90%.

a 78 86 55 60 27

b 10 20 3 7 1

Para solucionar o problema, começamos calculando a média e as variâncias


das amostras conforme a seguinte expressão:

Agora precisamos determinar a incerteza combinada, dada por:

Agora calculamos a incerteza expandida, de modo que obtemos:


8 Fundamentos de estatística

Assim, chegamos à faixa de valores com probabilidade de 90%, dada por:

Nesta seção, explicamos melhor as incertezas relacionadas às medições


e como podemos determinar a confiança da medição segundo a variância e
o desvio-padrão das amostras obtidas. Também descrevemos como a pre-
cisão e a exatidão do instrumento de medição estão associadas ao valor da
média estimada e do desvio-padrão. Na próxima seção, veremos como esses
conceitos estão relacionados com a função de densidade de probabilidade.

Probabilidade e correlação
Ao trabalharmos com processos que dependam de medições, muitas vezes é
desejado conhecer a probabilidade de uma medição estar dentro de determi-
nada faixa de valores. Para isso, podemos utilizar uma função de densidade
de probabilidade (HOGG; MCKEAN; CRAIG, 2005).
Podemos expressar a probabilidade de uma medição estar entre um
intervalo de valores [a,b] como (AGUIRRE, 2013):

(11)

onde fp (y) é a função de densidade de probabilidade, ou seja, a probabilidade


de a medida estar no intervalo [a,b] é a área abaixo da curva dada por fp (y).
Embora a fp (y) possa ser qualquer função, existem algumas funções mais
comumente adotadas quando trabalhamos com estatística. A mais utilizada
é a função gaussiana, dada por:

(12)

onde µ é a média e σ é o desvio-padrão.


Essa distribuição, também chamada de distribuição normal, prediz que
um ponto observado em medições realizadas estará distribuído de maneira
simétrica no entorno de uma tendência central (FIGLIOLA; BEASLEY, 2020).
Agora, perceba que, com os valores estimados da média e do desvio-padrão
obtidos na seção anterior, podemos esboçar a curva gaussiana que indica as
características de precisão e exatidão desejadas para os instrumentos. Veja
a Figura 1, considerando que o valor real da grandeza seja dado por y = 0.
Fundamentos de estatística 9

Figura 1. Função densidade de probabilidade para diferentes valores de média e desvio-padrão.

Dessa forma, podemos definir um instrumento como exato quando ele


apresenta uma média de valores próximos ao valor real do processo, enquanto
a precisão é dada por um valor menor de desvio-padrão.
Perceba, na Figura 1, que desejamos que o instrumento apresente resul-
tados como o gráfico em amarelo. O gráfico em roxo denota um instrumento
tendencioso, em que existe precisão nas medidas, mas não exatidão. A curva
em vermelho mostra o oposto: o instrumento apresenta exatidão, pois sua
média coincide com o valor real da grandeza, mas existe uma grande dispersão
nas observações.
Outro fator que deve ser levado em consideração ao realizarmos medições
em um processo é a relação das variáveis de entrada com a variável de saída.
Um parâmetro que nos permite avaliar essa relação entre entrada e saída é
a correlação dada pelo coeficiente de correlação r. Segundo Cabral (2004), a
expressão para o coeficiente de correlação é dada por:

(13)

Esse importante coeficiente tem uma faixa de valores que varia de –1 a


1. Ao calcularmos o coeficiente de correlação e obtermos o valor 1 positivo,
temos que a relação entre a variável independente e a variável dependente é
positivamente perfeita. Isso significa que um aumento da variável indepen-
dente vai gerar um aumento na variável dependente. O inverso é válido para
o valor –1, indicando que o aumento do valor da variável independente causa
uma diminuição no valor da variável dependente. Por fim, um valor próximo de
10 Fundamentos de estatística

zero no coeficiente indica que não existe uma relação direta entre a variável
dependente e a independente. Esses conceitos estão ilustrados na Figura 2.

(a)

(b)

(c)

Figura 2. Exemplos de diferentes coeficientes de correlação: (a) correlação positiva, (b)


correlação negativa e (c) correlação nula.

Veja que o gráfico da Figura 2a apresenta um coeficiente de correlação


próximo de 1, pois, ao aumentarmos o valor da variável dependente, temos
Fundamentos de estatística 11

o crescimento da variável independente. Já no gráfico da Figura 2b, temos


o coeficiente de correlação próximo de –1, pois, ao aumentarmos a variável
independente, temos o decrescimento da variável independente. Por fim, no
gráfico da Figura 2c, o coeficiente é próximo de 0, uma vez que não existe
uma relação direta entre a entrada e a saída do processo.

Segundo Cabral (2004), devemos ser cautelosos ao medir a correlação


entre as variáveis de entrada e saída, pois o valor do coeficiente não é
condição suficiente para determinar uma relação de causa e efeito. Isso significa
que cada caso deve ser analisado individualmente, pois existem situações em
que teremos um valor de coeficiente de correlação que não indica a real situação
da ligação entre a variável dependente e a independente.

Vejamos, agora, um exemplo para fixar o conteúdo.


Em um processo industrial, um engenheiro realizou as medidas para a
entrada e a saída do processo. Desejando saber como a entrada se relaciona
com a saída, calcule o coeficiente de correlação do processo considerando
estes dados:

x 1 5 7 9 12

y 12 20 24 29 40

Para determinarmos o coeficiente de correlação, é necessário obtermos


os valores para a fórmula a seguir:

Obtemos separadamente os valores da seguinte maneira:


12 Fundamentos de estatística

Atribuindo os valores da equação anterior, obtemos:

Isso indica um alto grau de correlação positiva entre a variável de entrada


e a variável de saída do sistema.
Neste capítulo, apresentamos os fundamentos de estatística aplicados
à medição de processos industriais. Vimos quais são as características de-
sejadas para os instrumentos de medição e como podemos verificar essas
características por meio da estimativa da média e do desvio-padrão. Também
descrevemos de que forma fatores como a correlação das variáveis podem
nos ajustar a entender o processo em que estamos trabalhando. Por fim,
vimos exemplos de aplicação dos conceitos abordados no capítulo.

Referências
AGUIRRE, L. A. Fundamentos de instrumentação. São Paulo: Pearson, 2013.
BARATTO, A. C. (org.). Avaliação de dados de medição: guia para a expressão de incerteza
de medição. Duque de Caxias: Inmetro, 2008.
CABRAL, P. Erros e incertezas nas medições. Porto: ISEP/IEP, 2004. (E-book).
FIGLIOLA, R. S.; BEASLEY, D. E. Theory and design for mechanical measurements. Ho-
boken: John Wiley & Sons, 2020.
HOGG, R. V.; MCKEAN, J. W.; CRAIG, A. T. Introduction to mathematical statistics. New
York: Pearson, 2005.

Os links para sites da web fornecidos neste capítulo foram todos


testados, e seu funcionamento foi comprovado no momento da
publicação do material. No entanto, a rede é extremamente dinâmica; suas
páginas estão constantemente mudando de local e conteúdo. Assim, os editores
declaram não ter qualquer responsabilidade sobre qualidade, precisão ou
integralidade das informações referidas em tais links.

Você também pode gostar