Você está na página 1de 17

ANÁLISE DE DADOS EXPERIMENTAIS

E AJUSTE DE MODELOS

1. A Natureza dos Problemas Científicos e da Experimentação


Desde o início da História do Homem, temos sentido a necessidade de entender
o funcionamento do mundo que nos cerca. Essa necessidade de compreensão sempre foi
motivada por questões muito práticas, como por exemplo, entender o comportamento do
tempo, para prever a ocorrência de chuvas ou de secas, que têm implicações diretas
sobre a sobrevivência das comunidades que dependem da agricultura para subsistir.
(Aliás, essa é uma questão que ainda consome o trabalho diário de milhares de pessoas
em todo o mundo, o que mostra como o conhecimento sobre certas questões
fundamentais da vida pode se acumular muito lentamente ao longo dos anos.) Como
bem demonstra o exemplo, a necessidade de compreender o mundo, embora algumas
vezes busque apenas satisfazer a curiosidade de alguns “curiosos” sobre certas questões
que os cercam, quase sempre nasce da vontade de se controlar ou prever um conjunto de
fenômenos naturais, de forma a tornar possível melhorar, otimizar ou fazer com que a
natureza funcione de forma a nos beneficiar de alguma maneira particular. No exemplo,
todos esses elementos estão presentes, como vemos abaixo:
Problema prático: É necessário plantar para que se produzam alimentos. Secas
e enxurradas destroem as plantações, consomem o trabalho e provocam falta de
alimento. Seria bom saber onde e quando secas e enxurradas vão ocorrer, pois assim
poderíamos escolher o momento certo para plantar e para armazenar os alimentos.
Questão fundamental: Como funciona o clima?
Finalidade básica da resposta: Prever o momento adequado para o plantio e
armazenamento de alimentos.
Embora o exemplo proposto seja extremamente simples, ele permite identificar
os elementos fundamentais do problema científico:
1- O problema prático motivador;
2- A necessidade de compreensão do fenômeno;
3- A necessidade de previsão.
O problema prático motivador pode ser compreendido como a chama que aguça
a curiosidade do investigador. Qualquer um que já teve a oportunidade de desenvolver e
submeter um projeto a uma agência de financiamento já teve também que preencher um
formulário onde se pergunta para quê serve o projeto e quais são os objetivos do projeto.
É difícil acreditar que alguém esteja interessado em um problema sem que haja qualquer
objetivo a ser alcançado ou resposta a ser obtida. (Freqüentemente as pessoas discordam
sobre a relevância dos objetivos a serem alcançados numa investigação, embora eles
nunca estejam ausentes.) O problema prático constitui a mola fundamental da era
tecnológica e movimenta milhões de pessoas em todo mundo, com uma infinidade de
pequenos e grandes problemas que precisam ser resolvidos.
Para que o problema possa ser resolvido de forma adequada, é necessário
compreender os fenômenos naturais que geram o problema prático. Quais são as causas
do fenômeno? Quais são as conseqüências? Como as causas e conseqüências estão
relacionadas? A busca de respostas para essas questões é freqüentemente denominada

1
de modelagem do fenômeno. As causas e conseqüências são usualmente denominadas
de variáveis do problema analisado. A estrutura que relaciona as variáveis do problema
é denominada de modelo.
Nesse ponto, uma questão fundamental deve ser colocada: a identificação das
variáveis de um problema implica necessariamente na observação do fenômeno e na
obtenção de dados (atividade empírica), enquanto a construção de uma estrutura que
relaciona as variáveis implica necessariamente em um processo abstrato para explicação
e justificativa dos resultados observados (atividade teórica). Esse íntimo relacionamento
existente entre as atividades empírica e teórica foi compreendido desde o Iluminismo.
(Ainda hoje alguns “investigadores” continuam insistindo na discussão sem sentido
sobre o que é mais importante - investigação experimental ou teórica. Não entre nessa,
pois experimento sem teoria ou teoria sem experimento não faz sentido!!!!) Só podemos
dizer que compreendemos um fenômeno se somos capazes de identificar as variáveis
relevantes do problema e se somos capazes de dizer como certos grupos de variáveis
influenciam os demais; ou seja, se temos um modelo para o fenômeno. Nessa fase, a
atividade experimental tem como principais objetivos permitir a identificação adequada
das variáveis relevantes do problema e a construção do modelo.
Finalmente, atinge-se a fase em que o conhecimento acumulado deve ser
utilizado para resolver o problema proposto. Assim, o modelo deve ser utilizado para
prover as respostas do problema. É a etapa de predição. A resposta é então
implementada, visando resolver o problema prático que originou a investigação. Caso a
resposta predita de fato resolva o problema prático, dizemos que o modelo desenvolvido
é válido; caso contrário, a compreensão do fenômeno não foi adequada para resolver o
problema e precisa ser reavaliada. Novamente a teoria e a prática estão inter-
relacionadas, haja visto que a compreensão teórica só ganha importância se pode ser
aplicada para resolver o problema prático original. Se isto não é possível, a teoria
construída não tem validade no mundo que nos interessa de fato e tem que ser revista.
Tomando como base a discussão acima, vê-se que é através da experimentação
que os problemas práticos são construídos, que a as variáveis relevantes do problema
são identificadas e que o modelo pode ser montado e validado. A prática teórica permite
correlacionar as variáveis e fazer previsões, que fornecem as respostas para os
problemas práticos originalmente propostos (e outros que porventura venham a serem
propostos).

2. Metodologia Científica e Experimentação


As discussões apresentadas anteriormente podem ser colocadas num contexto
mais geral, definindo-se a Metodologia Científica de tratar um problema. Este contexto
mais genérico está apresentado resumidamente na Figura 1.
O que a Figura 1 não acentua, no entanto, são os seguintes pontos:
a) A natureza cíclica do trabalho científico: Como o conhecimento acumulado é
sempre utilizado para resolver os mais variados problemas, mesmo aqueles que não
foram originalmente propostos e utilizados para gerar os modelos, os modelos são
continuamente testados. Isso faz com que a abrangência do modelo aumente
continuamente (desde que as respostas providas sejam de fato úteis e confirmadas
experimentalmente) e que ele seja continuamente revisto e melhorado (o que ocorre
sempre que uma resposta obtida seja inadequada e seja negada pela observação
empírica).

2
Figura 1 - Esquema Geral do Método Científico.

b) A natureza imparcial do trabalho científico: Se um conhecimento científico é de


fato obtido, ele deve poder ser utilizado por todos para resolver problemas semelhantes.
Desta forma, observações experimentais devem ser reprodutíveis e os mesmos
resultados devem ser obtidos sempre que as mesmas condições forem impostas ao
problema. Se condições similares levam a observações distintas, não há como
sistematizar o conhecimento, não há como construir modelos e não há como fazer
predições. Não há Ciência, portanto. O conhecimento e a metodologia científicos não
são manifestações individualizadas nem profissões de fé (o que de forma nenhuma
invalida estas manifestações do espírito humano, como forma de compreender a vida e o
universo). Por isso, o bom investigador sempre reproduz suas observações, para garantir
que estas são válidas e representam de fato um fenômeno real que pode ser controlado.

3
c) A natureza limitada do trabalho científico: Para que as observações sejam feitas,
diversas condições devem ser impostas ao sistema experimental investigado, de maneira
que as conclusões obtidas só são válidas no contexto limitado em que as observações
são feitas. Algumas destas condições são impostas sem mesmo que saibamos disto. Por
exemplo, são clássicos os estudos sobre a natureza ondulatória ou particulada das
radiações eletromagnéticas, particularmente da luz. A depender de como as condições
experimentais são fixadas, conclui-se ou uma coisa ou outra. Hoje, sabe-se que toda
partícula em movimento tem a ela associado um movimento ondulatório e vice-versa. O
investigador e o ambiente interagem de forma nem sempre bem definida com o
experimento que está sendo realizado e podem interferir nos resultados finais obtidos.
Como não podemos controlar os efeitos que não conhecemos, é natural que os
resultados experimentais obtidos em condições semelhantes não sejam exatamente os
mesmos. Por isso, toda a observação experimental está sujeita a flutuações ou a um
certo grau de incerteza. Não é possível obter um resultado experimental 100% correto,
pois não é possível controlar todo o universo para que realizemos o experimento. O
ideal é que as flutuações (ou incertezas ou erro experimental) sejam tão pequenas
quanto possível, indicando um controle bastante efetivo sobre as variáveis mais
relevantes para a consecução dos dados experimentais obtidos.
d) A natureza limitada do modelo: Como toda observação experimental está sujeita a
flutuações e deve ter seu escopo limitado ao contexto experimental em que foi
executado, não é possível construir modelos perfeitos. Desta forma, nenhum modelo
reflete exatamente a realidade e incertezas teóricas devem também ser esperadas. Um
modelo bem sucedido é aquele que consegue explicar os resultados experimentais com
incertezas compatíveis com aquelas observadas experimentalmente. Não é possível
descrever a realidade com precisão maior do que aquela permitida pela observação
experimental. Como o modelo é utilizado para fazer previsões e prover respostas a
perguntas feitas, toda previsão e resposta obtida através do modelo também apresentam
um certo grau de incerteza, que deve ser considerada.
Por tudo o que foi discutido, observa-se que tão ou mais importante que a
própria observação experimental é a caracterização apropriada das incertezas a que tais
observações estão sujeitas.

3. As Fontes de Erro e o Ideal Determinístico


O homem tem procurado através dos tempos as leis que regem o funcionamento
do universo. Segundo o ideal positivista, uma vez conhecidas as leis que regem o
universo seríamos capazes de entender todo o passado e todo o futuro, já que o
desenrolar da vida e da história nada mais seria do que a solução do complexo sistema
de equações que representaria estas leis supremas. O destino teria sido ditado quando as
condições iniciais foram fixadas e todo o universo foi colocado em movimento.
Diz-se que um sistema ou processo é determinista ou determinístico se,
fazendo-se sempre a mesma pergunta, obtém-se sempre a mesma resposta. Esse é o
resultado típico que se obtém ao se resolver um conjunto de equações matemáticas,
como aquelas que descreveriam o funcionamento do universo. Por exemplo, seja o caso
de um tanque de reação continuamente alimentado por uma corrente de processo
(Figura 2), que flui com vazão (volume/tempo) conhecida e que contém um composto A
numa concentração também conhecida (massa/volume). Suponha ainda que é conhecida
a vazão da corrente de retirada (volume/tempo), que contém A numa concentração CA
(massa/volume) desconhecida. Sabe-se que A se transforma em um segundo composto

4
B dentro do tanque, fenômeno esse chamado de reação química. A velocidade com que
essa transformação ocorre é conhecida pelos químicos e descrita pela relação
RA = KC AV (1.1)
onde RA (massa/tempo) é a velocidade da transformação, K (1/tempo) é uma constante
característica do sistema e V (volume) é o volume ocupado do tanque. Usando a “lei”
desse pequeno universo que diz que “a massa se conserva”, é possível dizer que todo o
composto A que entra na alimentação ou sai na corrente de retirada ou vira B. Nesse
caso, é possível escrever as seguintes relações matemáticas, que representam essa “lei”
do universo:

Figura 2 - O Tanque de Reação Continuamente Agitado.

qoC Ao = qC A + KC AV
qoC Ao
CA =
q + KV
Dessa forma, repare que sob as mesmas condições de operação (qo, q, CAo, V),
obtém-se sempre o mesmo valor de CA. A solução desse problema, na forma proposta,
está completamente determinada pelas condições da experimentação.
Sabe-se que isso nem sempre é verdade. Todos já experimentaram a sensação de
tentar tirar o número seis no dado, sem sucesso. Vários fatores contribuem para que o
resultado de um experimento seja desconhecido, mesmo que a princípio todas as
variáveis pareçam estar bem definidas. É o chamado pesadelo determinista. Vejamos
alguns exemplos:
a) O livre arbítrio: Sob condições idênticas o indivíduo pode optar por soluções
diferentes. Embora esta seja uma questão extremamente complexa, com aspectos
religiosos, filosóficos e morais que não pretendemos aprofundar aqui, o fato é que a
alma humana é bastante complexa e resolve problemas de formas inusitadas e
imprevistas. Por isso a dificuldade de se fazer previsões nas áreas de Ciências Humanas
e Sociais.
b) A heterogeneidade dos indivíduos: Os indivíduos de um grupo não são idênticos e
respondem de forma diferente a diferentes impulsos. Dessa forma, a não ser que todos
os elementos do grupo sejam conhecidos com detalhes, previsões sobre
comportamentos coletivos são complexos. Isso é verdade tanto nas áreas de Ciências
Humanas e Sociais quanto nas áreas de Ciências Exatas. Isso ocorre, por exemplo,
sempre que se tentam prever as propriedades da gasolina ou outras frações de petróleo,
que são misturas complexas de um número enorme de compostos químicos distintos.

5
Problemas similares ocorrem durante a análise de sistemas biológicos, dado que as
células dos organismos que constituem esses sistemas não são necessariamente iguais.
c) A precisão finita dos instrumentos de medidas: Mesmo que fossem conhecidas
todas as “leis” do universo, ainda assim teríamos dificuldades de fazer previsões
absolutamente corretas, porque os instrumentos de medida têm capacidade finita de
aferição. Não conseguimos nunca observar uma grandeza com todas as infinitas casas
decimais. As medidas reais se aproximam mais do esquema apresentado na Figura 1.3,
onde se observam flutuações (ruídos) por causa da precisão finita do instrumento. Qual
o valor real da medida apresentada no registro da Figura 1.3?

Figura 3 - Registro de uma variável x com ruído como uma função do tempo.

d) A medição indireta e a necessidade de calibração: Muitas vezes é necessário


inferir uma variável a partir da medida de uma outra variável. Por exemplo, quando se
mede a temperatura com um termômetro de mercúrio, mede-se de fato o volume do
mercúrio em um cilindro graduado. Como o volume do mercúrio muda com o aumento
da temperatura (como ocorre com todas as demais substâncias), relaciona-se o volume
medido com a temperatura do sistema. Isso gera a necessidade de construir uma função
que relaciona o volume com a temperatura, chamada de modelo de calibração.
Contudo, como é possível escolher o melhor modelo de calibração? Como é possível
garantir que o modelo de calibração permanece válido em todas as condições de
experimentação? Esses fatos introduzem incertezas adicionais ao processo de medição e
aos valores experimentais medidos.
e) A possível existência de falha no processo de medição: Instrumentos são
constituídos por equipamentos e processos; portanto, estão sujeitos a falhas. Por
exemplo, uma régua plástica pode se deformar quando é mal acondicionada em
mochilas e pastas escolares, introduzindo erros e imprecisões adicionais no processo de
medida. De forma similar, a existência de mau contato em um circuito elétrico pode
causar ruído e desvios nas medidas fornecidas por um equipamento. O problema é que
esses desvios e deformações nem sempre são percebidos pelo experimentador.
f) O controle limitado sobre um número pequeno de variáveis: E um fato adicional é
que não conhecemos todas as variáveis relevantes para um dado problema com toda a
precisão. Em geral, apenas as variáveis mais importantes são levadas em consideração
durante a análise de um problema real, de forma que flutuações podem ser esperadas
por conta das variáveis não controladas do problema. Por exemplo, será que todos os
possíveis contaminantes da corrente de alimentação são conhecidos? Será que o
isolamento é perfeito e não há nenhuma perda de calor no sistema?
E qual é a conseqüência desses fatos? A principal delas é que, mesmo quando
conhecemos bastante um sistema, há sempre algum grau de incerteza, algum grau de
variabilidade, algum grau de imprecisão. Nunca é possível garantir com certeza absoluta

6
qual é o resultado de um determinado experimento. Diferentes equipamentos de
medidas e diferentes experimentadores obtêm valores medidos diferentes para uma
mesma variável medida. Obviamente, alguns sistemas apresentam maior ou menor grau
de imprecisão que outros. Parece óbvio que uma coisa é a precisão obtida quando se
prevê o comportamento meteorológico e outra é a precisão obtida quando se prevê o
tempo que um objeto que cai do 3º andar de um bloco de apartamentos leva para atingir
o chão. E, portanto, já sentimos aqui a necessidade de caracterizar o grau de
variabilidade existente num sistema experimental qualquer.
De uma forma geral os erros experimentais podem ser classificados como:
• Erros Aleatórios: são as flutuações que ocorrem devido a pequenas oscilações,
positivas e negativas, nos valores das variáveis controladas ou não controladas,
imprecisão dos equipamentos de medida; são flutuações de caráter estatístico e podem
ser descritas por uma distribuição de probabilidade.
• Erros Sistemáticos: são desvios que deslocam o valor de uma medida ou no sentido
positivo ou no sentido negativo e ocorrem devido a uma má calibração dos
equipamentos de medida; estes erros não têm uma característica estatística.
• Erros Grosseiros: são erros causados por falhas na medição, como o mal
funcionamento de um equipamento ou falha na aquisição da medição; estes erros
também não têm uma característica estatística.
Os Erros Sistemáticos e Grosseiros devem ser evitados, já que deslocam os
resultados experimentais dos valores corretos e invalidam toda a base estatística de
análise. Como os Erros Aleatórios podem ser descritos por uma distribuição de
probabilidade e são oscilações que flutuam do sentido positivo para o negativo e vice-
versa, pode ser esperado que estes erros não desloquem o valor observado do valor real.
É importante aqui definir dois importantes conceitos estatísticos: exatidão e precisão. A
exatidão indica como um conjunto de medidas se aproxima do valor real. Já a precisão
indica o quanto um conjunto de medidas oscila em torno de um valor médio. Na Figura
4 é apresentada uma ilustração sobre estes conceitos.

Preciso e Inexato Impreciso e Exato

Preciso e Exato Impreciso e Inexato

Figura 4 –Ilustração sobre a precisão e exatidão de medidas.

7
A precisão de uma medida está intimamente ligada a reprodutibilidade de um
experimento e, assim, para a sua caracterização basta a realização de diversas réplicas
do mesmo experimento. Observe ainda que a precisão de uma medida está associada aos
erros aleatórios. Entretanto, para a caracterização da exatidão de uma medida não é
suficiente a realização de réplicas, sendo necessário a utilização de um padrão externo,
ou seja, uma outra forma de medida (outro equipamento, por exemplo) para determinar
se a medida é exata ou não. Assim, a exatidão de uma medida está associada a presença
ou não de erros sistemáticos e/ou grosseiros.

4. Caracterização de uma Medida Experimental


Um conjunto de medidas da variável x é feito, resultando nos resultados
apresentados na Tabela 1.1.
Tabela 1.1 - Conjunto de Medidas Experimentais Obtidas para a Variável x.
medida 1 2 3 4 5 6 7 8 9 10
x 0.50 0.60 0.50 0.40 0.50 0.50 0.50 0.40 0.50 0.50
Dados os diferentes valores obtidos durante as várias medidas efetuadas, parece
lícito perguntar: qual o valor "real" de x? A resposta correta para esta pergunta é: NÃO
SEI! Supõe-se aqui que todas as medidas foram feitas corretamente e que, portanto,
espelham de forma semelhante o valor de x. Não há como adivinhar a princípio qual é a
melhor medida ou qual medida representa melhor o conjunto de medidas. Apesar de
tudo isto, ainda assim é necessário definir um valor para x, pois vários processos de
tomada de decisão podem depender disto. Por exemplo, se x for a medida da quantidade
de um contaminante industrial presente num efluente lançado em um rio, a definição do
valor de x pode resultar numa multa emitida pela Secretaria de Meio Ambiente.
Quando as medidas estão sujeitas a flutuações, podemos apenas fornecer um
valor que represente o conjunto de medidas de x de forma conveniente. Por exemplo:
• FORMA 1: x = 0.50
O valor 0.5 é o que aparece mais freqüentemente no conjunto de medidas. Este
valor é usualmente chamado de MODA do conjunto de medidas.
• FORMA 2: x = 0.50
O valor 0.5 divide o conjunto de dados ao meio, isto é metade dos dados é maior
ou igual a 0.50 e a outra metade é menor ou igual a 0.50. Este valor é usualmente
chamado de MEDIANA do conjunto de medidas.
• FORMA 3: x = ( 0.6 + 7 ⋅ 0.5 + 2 ⋅ 0.4 ) 10 = 0.49

Este é um valor usado comumente para representar um conjunto de números,


chamado de MÉDIA ARITMÉTICA. Este valor é uma soma ponderada dos vários
números que apareceram no conjunto original de dados. A ponderação utilizada é a
freqüência com que o número aparece no conjunto.

( )
1
• FORMA 4: x = 0.6 ⋅ 0.57 ⋅ 0.42 10
= 0.48697

Este é um valor usado também com freqüência para representar um conjunto de


números, chamado de MÉDIA GEOMÉTRICA. Este valor é um produto ponderado dos
vários números que apareceram no conjunto original de dados. A ponderação utilizada é
a freqüência com que o número aparece no conjunto.

8
Qual destas (ou possivelmente outras) é a melhor forma de representar x? Para
responder esta pergunta é necessária a introdução do conceito de probabilidade e de
independência de medições para a análise das propriedades matemáticas de cada forma
de representar o conjunto de valores. (Apesar desta análise fugir do escopo deste curso,
os alunos interessados devem procurar estas análises na bibliografia citada
recomendada.). Os resultados destas análises mostram que somente a média aritmética
pode ser considerada uma Operação Linear. Por exemplo, dado dois conjuntos de
medidas x e y, com médias μX e μY, a variável z = x + y tem média μZ = μX + μY. Isto
torna a média aritmética extremamente conveniente do ponto de vista matemático e, por
isso, é usualmente escolhida como melhor maneira de representar um conjunto de
dados. A definição da média aritmética de um conjunto de amostras é (Deve ser
observado que formalmente a média real μX e a média amostral x não são a mesma
variável, apesar de estarem intimamente relacionadas):
N
1
x=
N
∑x
i =1
i

Alem de um valor central é necessária uma medida do espalhamento dos dados


em torno deste valor. Como no caso da definição de um valor central podem existir
diversas formas, para definir uma medida do espalhamento também podem ser definidas
diversas formas. A forma mais adequada é a variância, que é a média do quadrado das
diferenças entre os valores esperados e a média aritmética. A variância é uma Operação
Linear e, como a média aritmética, também tem propriedades matemáticas que torna o
seu uso muito conveniente. A definição da variância de um conjunto de amostras é
(Aqui também deve ser observado que formalmente a variância real σ X2 e a variância
amostral sX2 não são a mesma variável, apesar de estarem intimamente relacionadas):

1 N
∑ ( xi − x )
2
sX2 =
N − 1 i =1
A partir do valor da variância pode ser calculado o desvio padrão de um
conjunto de dados, definido como:

1 N
∑ ( xi − x )
2
s X = sX2 =
N − 1 i =1
Este valor é conveniente já que possui a mesma unidade dos valores xi e, como
será visto adiantem, é usado para a determinação do intervalo de confiança de uma
média. Entretanto, o desvio padrão não é um operador linear como a variância, ou seja,
não se pode somar desvios padrões de duas medidas para se obter o desvio padrão da
soma destas duas medidas.
Em alguns casos, deve ser necessária a comparação dos resultados obtidos por
diferentes técnicas, por diferentes operadores ou por diferentes processos. Como as
medidas estão sujeitas a desvios, é preciso construir intervalos de confiança para
possibilitar o experimentado concluir se uma certa medida é significativamente maior
que outra. O intervalo de confiança de um valor médio pode ser construído como:
sX s
x − t N(1+−1α ) 2 ⋅ < μ X < x + t N(1+−1α ) 2 ⋅ X
N N

9
Este equação define um intervalo de confiança onde o valor real da média se
encontra com um nível de confiança igual a α. Para uma variável qualquer xi, o
intervalo de confiança pode ser definido como:
x − t N(1+−1α ) 2 ⋅ s X < xi < x + t N(1+−1α ) 2 ⋅ s X

Nas duas equações acima, t N(1+−1α ) 2 é o valor da distribuição t de Student com N-1
graus de liberdade e uma probabilidade de (1+α)/2. O valor de α indica o nível
confiança (geralmente igual a 0.95).
Em alguns casos não se dispõem de diversas medidas de uma variável que
possibilite o cálculo de um valor médio e de uma variância. Por exemplo, quando as
dimensões de um tanque são medidas com o auxílio de uma trena (ou algum outro
equipamento de medida apropriado), na maioria dos casos é feita somente uma medida.
Mesmo que mais de uma medição seja feita, geralmente os erros aleatórios a que este
processo de medição está sujeito são muito baixos. Nestes casos o intervalo de
confiança de uma medição é definido como:
a) quando se usa um equipamento de medição analógico: xi ± DE 2 , onde DE é a
Divisão de Escala, ou seja, a menor medição que pode ser feita neste equipamento;
b) quando se usa um equipamento de medição digital: xi ± ID , onde ID é o incremento
digital do equipamento de medição

5. Propagação de Erros
Em alguns casos não é possível a medição direta de certas variáveis e seus
valores devem ser determinados por medidas indiretas. Por exemplo, a determinação da
viscosidade de um líquido em um viscosímetro de Stokes é determinada pela seguinte
equação:

1 g ⋅ Δt ⋅ D ⋅ ( ρ S − ρ f )
2

μ= ⋅
18 L ⋅ (1 + 2.1044 ⋅ D Dt )

onde μ é a viscosidade, D é o diâmetro da esfera em queda no tubo, Dt é o diâmetro do


tubo, ρS é a densidade da esfera e ρf é a densidade do fluído, Δt é o tempo que a esfera
leva para cair uma altura L e g é a constante da gravidade.
Considerando um caso geral onde uma certa propriedade z é inferida a partir de
medições x e y, usando a seguinte equação:
z = f ( x, y )

onde f é uma função matemática qualquer. A aproximação linear desta função (Série de
Taylor) pode ser escrita como:
∂f ∂f
z = z0 + ( x − x0 ) + ( y − y0 )
∂x ∂y
ou ainda:
∂f ∂f
Δz = Δx + Δy
∂x ∂y

10
Sendo a definição da variância o valor esperado do quadrado dos desvios em relação ao
valor médio, podemos escrever:
2
⎛ ∂f ⎞ ⎛ ∂f ⎞ ⎛ ∂f ∂f ⎞ 2
2

σ = E {Δz ⋅ Δz} = ⎜ ⎟ σ X2 + ⎜ ⎟ σ Y2 + 2 ⎜
2
⎟ σ XY
⎝ ∂x ⎠ ⎝ ∂y ⎠ ⎝ ∂x ∂y ⎠
Z

onde σ X2 = E {Δx ⋅ Δx} , σ Y2 = E {Δy ⋅ Δy} e σ XY


2
= E {Δx ⋅ Δy} , sendo este último a
covariância entre as medições x e y. Se as medidas x e y são independentes σ XY
2
= 0, e
podemos escrever:
2
⎛ ∂f ⎞ ⎛ ∂f ⎞
2

σ = ⎜ ⎟ σ X2 + ⎜ ⎟ σ Y2
2

⎝ ∂x ⎠ ⎝ ∂y ⎠
Z

Observe que aqui fica evidente a característica linear da variância e por isso, o
seu uso é preferível frente as demais medidas de incerteza. Este resultado pode ser
estendido para uma função de NV variáveis da seguinte forma:
2
NV
⎛ ∂f ⎞
σ = ∑ ⎜ ⎟ σ X2 i
2

i =1 ⎝ ∂xi ⎠
Z

Por exemplo, no cálculo da viscosidade consideramos que somente as medidas


de tempo Δt e de comprimento L estão sujeita a desvios (na realidade, todas as variáveis
na equação estão sujeitas a desvios, inclusive g, a constante da gravidade). Assim, o
cálculo da variância da viscosidade μ é definido como:

g ⋅ D 2 ⋅ ( ρ S − ρ f ) ⎞ 2 ⎛ 1 g ⋅ Δt ⋅ D 2 ⋅ ( ρ S − ρ f ) ⎞ 2
2 2
⎛1
σμ = ⎜ ⋅
2
⎟ σ +⎜ ⋅ ⎟ σ
⎜ 18 L ⋅ (1 + 2.1044 ⋅ D Dt ) ⎟ Δt ⎜ 18 L2 ⋅ (1 + 2.1044 ⋅ D Dt ) ⎟ L
⎝ ⎠ ⎝ ⎠
É interessante observar o comportamento da equação acima com o valor das
variáveis Δt e L. Com relação a Δt o valor da variância da viscosidade aumenta com o
aumento do tempo. Entretanto, com relação ao valor de L, quanto maior o valor de L,
menor é a variância da viscosidade. Ou seja, são dois comportamentos opostos e deve
ser lembrado que quanto maior o comprimento L, maior o tempo para que a esfera
percorra este caminho. Mas deve ser lembrado que a velocidade V de queda é constante,
e a equação pode ser reescrita como:

g ⋅ D2 ⋅ ( ρS − ρ f ) ⎞ 2 ⎛ 1 g ⋅ D2 ⋅ ( ρS − ρ f )
2 2
⎛1 ⎞
σμ =
2
⎜ ⋅ ⎟ σ Δt + ⎜ ⋅ ⎟ σ L2
⎜ 18 L ⋅ (1 + 2.1044 ⋅ D Dt ) ⎟ ⎜ 18 L ⋅V ⋅ (1 + 2.1044 ⋅ D Dt ) ⎟
⎝ ⎠ ⎝ ⎠
Agora a variância é uma função inversa do comprimento, já que os demais
valores são constantes. Assim, é possível determinar antes da realização do
experimento, que o mesmo deve ser feito com o maior comprimento L possível para
minimizar a variância e, conseqüentemente, o erro do valor da viscosidade!
Uma dificuldade que é geralmente encontrada na propagação dos erros é a
determinação dos valores das variâncias σ Δ2t e σ L2 . O comprimento L é geralmente
determinado se usando uma régua, por exemplo, o a sua incerteza é definida como a
metade da menor divisão da escala DE. A dificuldade está em se converter este valor em
uma medida de variância. Uma alternativa é considerar que o desvio padrão do
comprimento é igual a DE/2. De forma análoga, podemos considerar o desvio padrão do

11
tempo Δt igual a ID. Mas observe que no caso da medida de tempo, o erro deve ser
maior, já que é difícil acionar e parar o cronômetro no exato instante em que a esfera
passa pelas posições inicial e final. É por isso que, sempre que possível, os
experimentos devem ser repetidos.

6. Ajuste de Modelos
O ajuste dos parâmetros consiste em minimizar uma função objetivo que leva
em conta todos os valores medidos e os respectivos valores calculados pelo modelo. A
função objetivo mais utilizada a Função de Mínimos Quadrados, definida como:

(
Fobj = ∑ yie − yim (α , xie ) )
N 2

i =1

Observe que esta função soma o quadrado de cada diferença entre o valor
experimental yie e o valor do modelo yim . Já o valor do modelo depende do valor do
parâmetro α (ou dos parâmetros, se tiver mais de 1) e do valor de x, que é a variável
independente, isto é, a variável controlada (por exemplo, o tempo de amostragem, a
temperatura da reação). Por outro lado, y é a variável observada, isto é, ela não é
controlada, seu valor é apenas registrado como função da variável independente. Por
exemplo, em um experimento de troca de calor, observamos como a temperatura
(variável observada) varia ao longo do tempo (variável controlada). Para a estimação do
parâmetro (ou dos parâmetros) α são necessários N conjuntos x – y de dados
experimentais, sendo N maior que número de parâmetros.
Apesar da maioria absoluta dos modelos na área da engenharia química
consistirem de sistemas de equações algébricas e/ou diferenciais não lineares, em alguns
casos simples os processos podem ser descritos por equações lineares, o que facilita
muito a sua análise. A seguir, serão analisados dois casos de modelos lineares, onde
serão desenvolvidas as equações para o cálculo dos valores das estimativas dos
parâmetros. Também é apresentada uma forma de se calcular a incerteza do parâmetro.
Em seguida é apresentado um caso de estimação de parâmetros em um modelo não
linear.

CASO 1: Modelo do tipo y = α ⋅ x


Neste caso temos um único parâmetro α. Observe que esta reta é uma reta que
obrigatoriamente passa pela origem (y = 0 e x = 0). Substituindo a equação do modelo
na função objetivo temos:

Fobj = ∑ ( yie − α ⋅ xie )


N 2

i =1

O que queremos é e encontrar qual é o valor de α que faça com que a função
objetivo seja mínima. Assim, derivamos a função com relação ao parâmetro α e
igualamos o resultado a zero, ou seja:
∂Fobj N
= ∑ −2 ⋅ xie ⋅ ( yie − α ⋅ xie ) = 0
∂α i =1

A equação acima pode ser resolvida de forma nos fornecer o valor de α que
minimiza a função objetivo:

12
(
∑ xie ⋅ ( yie − α ⋅ xie ) = ∑ xie ⋅ yie − α ⋅ ( xie ) ) (
= ∑ ( xie ⋅ yie ) − ∑ α ⋅ ( xie ) ) =0
N N N N
2 2

i =1 i =1 i =1 i =1

∑( )
α ⋅ ( xie ) =∑ ( xie ⋅ yie )
N 2 N

i =1 i =1

(
α ⋅ ∑ ( xie ) =∑ ( xie ⋅ yie ) )
N N
2

i =1 i =1

∑(x ⋅ yie )
N
e
i
α= i =1

∑ (( x ) )
N
e 2
i
i =1

A última equação acima mostra como calcular o valor do parâmetro a partir do


conjunto de dados experimentais. Observe que tal expressão só é válida para o modelo
y = α ⋅ x . O valor da variância do parâmetro pode ser calculado como (o
desenvolvimento desta equação não é apresentado por simplicidade):
1
σ α2 = ⋅ s2
∑( x )
N
e 2
i
i =1

2
onde s é uma medida do erro experimental, que neste caso pode ser definida como:
Fobj
s2 =
N −1

Já o desvio padrão do parâmetro é igual a σ α = σ α2 . Assim é possível definir


um intervalo de confiança do parâmetro como:
α ± t N(1+−αNP) 2 ⋅ σ α
onde NP é o número de parâmetros, neste caso igual a 1.

CASO 2: Modelo do tipo y = α ⋅ x + β


Neste caso são dois parâmetro α e β que devem ser estimados. Substituindo a
equação do modelo na função objetivo temos:

Fobj = ∑ ( yie − α ⋅ xie − β )


N
2

i =1

O que queremos é e encontrar qual é os valores de α e β de tal forma que a


função objetivo seja mínima. Assim, derivamos a função com relação aos parâmetros α
e β e igualamos o resultado a zero, ou seja:
∂Fobj N
= ∑ −2 ⋅ xie ⋅ ( yie − α ⋅ xie − β ) = 0
∂α i =1

∂Fobj N
= ∑ −2 ⋅ ( yie − α ⋅ xie − β ) = 0
∂β i =1

13
O sistema de duas equações acima pode ser resolvido de forma nos fornecer o
valor de α e de β que minimiza a função objetivo (o desenvolvimento desta solução não
):
⎧N e
⎪∑ xi ⋅ ( yi − α ⋅ xi − β ) = 0
e e

⎪ i =1
⎨N
⎪ ( y e − α ⋅ xe − β ) = 0
⎪⎩∑
i =1
i i

⎧N e e
(
⎪∑ xi ⋅ yi − α ⋅ ( xi ) − xi ⋅ β = 0
⎪ i =1
e 2 e
)
⎨N
⎪ ( y e − α ⋅ xe − β ) = 0
⎪⎩∑
i =1
i i

⎧ N e 2
⎪ ∑( i ) ( i ) ( xie ⋅ yie )
N N
α ⋅
⎪ i =1
x +β ⋅ ∑i =1
x e
= ∑i =1
⎨ N
⎪α ⋅ ( x e ) + β 1 = ( y e )
N N

⎪⎩ ∑ i =1
i ∑i =1

i =1
i

Da segunda equação temos:

∑ ( yie ) − α ⋅ ∑ ( xie )
N N

β= i =1 i =1

N
Substituindo na primeira equação:

∑( y ) −α ⋅∑( x )
N N
e e
i i
α ⋅∑(x ) ⋅ ∑ ( xie ) = ∑ ( xie ⋅ yie )
N N N
e 2
i + i =1 i =1

i =1 N i =1 i =1

2
⎛ ⎞
α ⋅ N ⋅ ∑ ( xie ) + ∑ ( yie ) ⋅ ∑ ( xie ) − α ⋅ ⎜ ∑ ( xie ) ⎟ = N ⋅ ∑ ( xie ⋅ yie )
N N N N N
2

i =1 i =1 i =1 ⎝ i =1 ⎠ i =1

Isolando α, obtemos:
⎡ ⎛ N e ⎞ ⎤
2

α ⋅ ⎢ N ⋅ ∑ ( xi ) − ⎜ ∑ ( xi ) ⎟ ⎥ = N ⋅ ∑ ( xie ⋅ yie ) − ∑ ( yie ) ⋅ ∑ ( xie )


N N N N
e 2

⎢⎣ i =1 ⎝ i =1 ⎠ ⎥⎦ i =1 i =1 i =1

N ⋅ ∑ ( xie ⋅ yie ) − ∑ ( yie ) ⋅ ∑ ( xie )


N N N

α= i =1 i =1 i =1

⎡ ⎛ N e ⎞ ⎤
2

⎢ N ⋅ ∑ ( xi ) − ⎜ ∑ ( xi ) ⎟ ⎥
N
e 2

⎢⎣ i =1 ⎝ i =1 ⎠ ⎥⎦

O valor de β é então calculado usando o valor obtido de α:

∑( y ) −α ⋅∑( x )
N N
e e
i i
β= i =1 i =1

14
As duas últimas equações acima mostram como calcular os valores dos
parâmetros α e β partir do conjunto de dados experimentais. Observe que tal expressão
só é válida para o modelo y = α ⋅ x + β .
O valor da variância de cada parâmetro pode ser calculado como (o
desenvolvimento desta equação não é apresentado por simplicidade):
N
σ α2 = ⋅ s2
⎡ ⎛ N e ⎞ ⎤
2

⎢ N ⋅ ∑ ( xi ) − ⎜ ∑ ( xi ) ⎟ ⎥
N
e 2

⎢⎣ i =1 ⎝ i =1 ⎠ ⎥⎦

∑(x )
N
e 2
i
σ β2 = i =1
⋅ s2
⎡ ⎛ N e ⎞ ⎤
2

⎢ N ⋅ ∑ ( xi ) − ⎜ ∑ ( xi ) ⎟ ⎥
N
e 2

⎢⎣ i =1 ⎝ i =1 ⎠ ⎥⎦

onde s2 é uma medida do erro experimental, que neste caso pode ser definida como:
Fobj
s2 =
N −2

O desvio padrão de cada parâmetro é igual a σ α = σ α2 e σ β = σ β2 . Assim é


possível definir um intervalo de confiança do parâmetro como:
α ± t N(1+−αNP) 2 ⋅ σ α

β ± t N(1+−αNP) 2 ⋅ σ β
onde NP é o número de parâmetros, neste caso igual a 2.

CASO 3: Modelo do tipo y = exp ( −α ⋅ x )

Neste caso são somente um parâmetro α deve ser estimado. Substituindo a


equação do modelo na função objetivo temos:

(
Fobj = ∑ yie − exp ( −α ⋅ xie ) )
N 2

i =1

Como nos casos anteriores, derivamos a função com relação ao parâmetro α e


igualamos o resultado a zero, ou seja:
∂Fobj N
∂α
(
= ∑ 2 ⋅ xie ⋅ exp ( −α ⋅ xie ) ⋅ yie − exp ( −α ⋅ xie ) = 0
i =1
)
A solução do problema consiste em encontrar o valor de α que seja a solução da
equação acima. Entretanto, diferentemente dos dois casos acima, aqui não existe uma
solução analítica para o problema. É necessário um método numérico para a solução
deste problema de estimação de parâmetros. Até mesmo o cálculo do erro do parâmetro
α fica aproximado, podendo ser calculado como:

15
s2 s2
σ α2 = =
∑( x ⋅ exp ( −α ⋅ xie ) )
2 N
N
⎛ ∂yim ⎞ 2


e
⎜ ⎟ i
i =1 ⎝ ∂α ⎠
i =1

Observe que nos modelos lineares, o erro do parâmetro independe do valor do


parâmetro e que aqui, em um modelo não-linear, o erro do parâmetro depende de seu
valor.
Uma alternativa consiste em linearizar a equação do modelo da seguinte forma:
y = exp ( −α ⋅ x ) Æ ln ( y ) = −α ⋅ x

e minimizar a seguinte função objetivo:

(
Fobj = ∑ ln ( yie ) − ln ( yim ) ) (
=∑ ln ( yie ) + α ⋅ xie )
N 2 N 2

i =1 i =1

A solução deste problema pode ser encontrada de forma similar ao procedimento


usado no primeiro caso, chegando a:

∑ (−x ⋅ ln ( yie ) )
N
e
i
α= i =1

∑ (( x ) )
N
e 2
i
i =1

Entretanto, minimizar a função objetivo com o modelo não-linear e a função


objetivo com o modelo linearizado não leva ao mesmo resultado. Isto é, minimizar as
diferenças entre os valores medidos e calculados de y não é a mesma coisa que
minimizar as diferenças entre os valores medidos e calculados de ln(y). Isto ficará claro
com a solução do Exercício 2.

7. Exercícios
1) Considere o modelo usado para o cálculo da viscosidade em um viscosímetro
de Stokes:

1 g ⋅ Δt ⋅ D ⋅ ( ρ S − ρ f )
2

μ= ⋅
18 L ⋅ (1 + 2.1044 ⋅ D Dt )
Considere que as seguintes variáveis foram medidas com os seguintes
equipamentos:
Δt → cronômetro digital (incremento digital 0.01 s)
D → paquímetro (menor divisão de escala 0.1 mm)
L → régua (menor divisão de escala 1 mm)
Dt → régua (menor divisão de escala 1 mm)
Deduza a equação de propagação de erros considerando as incertezas nas
medições das 4 variáveis descritas acima. Discuta sobre como você faria para
determinar as variâncias de medição destas 4 variáveis.

16
2) Considere o seguinte conjunto de dados:

x 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
y 1.000 0.403 0.186 0.103 0.062 0.039 0.024 0.015 0.010 0.006 0.004

O modelo matemático que deve ser ajustado a estes dados é:


y = exp ( −α ⋅ x )

a) Linearize a equação do modelo e faça a estimação linear através da minimização das


diferenças entre os valores observados e calculados de ln(y).
b) Faça o ajuste não-linear através da minimização das diferenças entre os valores
observados e calculados de y.
c) Compare os resultados.

OBS: para os ajustes pode ser usado algum software (Excel, Origin ou outro).

7. Bibliografia Recomendada

Himmelblau, D.M. (1970), Process Analysis by Statistical Methods. New York, John
Wiley & Sons.

Schwaab, M., Pinto, J.C. (2007) Análise de dados Experimentais. 1. Fundamentos de


Estatística e Estimação de Parâmetros. Editora E-Papers, Rio de Janeiro.

17