Você está na página 1de 8

Capítulo

Como a Estatística
1
Pode Ajudar

... Porque ter a mente boa não é o bastante; o principal é aplicá-la bem. As maiores
almas são capazes tanto das maiores virtudes quanto dos maiores vícios, e aqueles que
marcham lentamente podem avançar muito mais, se seguirem o caminho certo, do
que os que correm porém dele se afastam.
Descartes, Discurso sobre o método, parte I.

Este é um livro sobre o bom senso. Mais especificamente, sobre o bom senso na
realização de experimentos e na análise de seus resultados. No início do Discurso
sobre o método, um pouco antes da citação acima, Descartes diz que, de todas as
coisas no mundo, a mais bem distribuída é o bom senso, porque “todos se acham
tão abundantemente providos [de bom senso] que mesmo aqueles mais difíceis de
se contentar em outros assuntos comumente não desejam mais bom senso do que já
têm” (Descartes, 1637). Se você acredita nisso (Descartes obviamente não acredita-
va), este livro não é para você.
Digamos, porém, que você esteja de acordo com Descartes − afinal, você con-
tinuou lendo − e ache que nem tudo que parece óbvio é tão óbvio assim. Nesse
caso, se você estiver envolvido com experimentação, seja na vida acadêmica, seja na
indústria, seja num laboratório de pesquisa ou desenvolvimento, este livro poderá
lhe ser bastante útil. Com ele você poderá aprender a realizar seus experimentos e
tirar suas conclusões de forma mais econômica e eficaz.
Nos capítulos seguintes apresentaremos algumas técnicas relativamente
simples e fáceis de empregar. Como o ovo de Colombo, essas técnicas poderão
até parecer óbvias depois que você refletir um pouco sobre elas, mas isso não
lhes tira o mérito nem a eficácia. Para deixar mais claro o que queremos dizer,
16
Como Fazer Experimentos

vamos considerar um exemplo prático, muito fácil de encontrar na vida real, prin-
cipalmente na indústria, onde a relação custo/benefício é sempre uma questão
importante.
Digamos que um químico deseje obter o rendimento máximo em uma certa
reação, e que essa reação seja controlada por apenas duas variáveis: a temperatura
e a concentração de um determinado reagente. Na nomenclatura que adotaremos
neste livro, a propriedade de interesse, que neste caso é o rendimento, é chamada
de resposta. As variáveis que em princípio influenciam a resposta (isto é, a tempe-
ratura e a concentração) são os fatores, e a função que descreve essa influência é
chamada de superfície de resposta. O objetivo do pesquisador é descobrir quais
os valores − os níveis − dos dois fatores que produzem a maior resposta possível.
Como você faria para resolver esse problema?
Eis uma sugestão. Para manter as coisas sob controle, fixamos um dos fatores
num certo nível e variamos o outro até descobrir qual o nível desse outro fator que
produz o maior rendimento. Variando só um dos fatores estaremos nos assegurando
de que qualquer mudança na resposta terá sido causada pela modificação do nível
desse fator. Depois, mantendo esse fator no nível ótimo encontrado, variamos o nível
do primeiro fator (o que tinha sido fixado), até descobrir o valor dele que também
produz um rendimento máximo. Pronto. O experimento acabou, e descobrimos os
valores ótimos que estávamos procurando, certo?
Errado! Esse pode ser o senso comum, mas certamente não é bom senso.
Quase todas as pessoas a quem perguntamos concordaram que o procedimento
que acabamos de descrever era “o mais lógico”, e no entanto existe uma maneira
muito mais eficaz de fazer o experimento. Aliás, com esse “senso comum” o rendi-
mento máximo só seria descoberto em circunstâncias muito especiais. Ao contrá-
rio do que se poderia esperar, é muito melhor fazer variar todos os fatores ao mesmo
tempo. A razão para isso é que as variáveis podem se influenciar mutuamente, e o
valor ideal para uma delas pode depender do valor da outra. Esse comportamento,
que chamamos de interação entre os fatores, é um fenômeno que ocorre com
muita frequência. Raras são as situações em que dois fatores atuam de forma real-
mente independente.
Este é apenas um exemplo de como o senso comum pode ser enganoso. Vol-
taremos a ele nos capítulos seguintes, para um tratamento detalhado. Neste capí-
tulo vamos apenas introduzir algumas noções básicas de modelagem e apresentar
sumariamente as técnicas que discutiremos ao longo do livro, tentando mostrar a
utilidade de cada uma delas na vida real.
17
Capítulo 1 Como a Estatística Pode Ajudar

1.1 Em que a estatística pode ajudar


É comum, especialmente em indústrias químicas, aparecerem problemas em que
precisamos estudar várias propriedades ao mesmo tempo e estas, por sua vez, são
afetadas por um grande número de fatores experimentais. Como investigar os efeitos
de todos esses fatores sobre todas as propriedades, minimizando o trabalho neces-
sário e o custo dos experimentos? Como melhorar a qualidade do produto resultan-
te? Que fatores experimentais devemos controlar para que a qualidade do produto
seja assegurada?
As pesquisas realizadas com o objetivo de fornecer respostas a essas pergun-
tas muitas vezes tomam vários meses de trabalho de pesquisadores e técnicos, a
um custo bastante alto em termos de salários, reagentes, análises químicas e testes
físicos. O principal objetivo deste livro é mostrar que o emprego de conhecimentos
estatísticos pode ajudar a responder a essas perguntas de forma racional e econômi-
ca. Usando planejamentos experimentais baseados em princípios estatísticos,
os pesquisadores podem extrair do sistema em estudo o máximo de informação útil,
fazendo um número mínimo de experimentos.
Os métodos mais eficazes que podem ser usados por cientistas e engenheiros
para melhorar ou otimizar sistemas, produtos e processos são apresentados nos ca-
pítulos seguintes. Esses métodos são ferramentas poderosas, com as quais vários ob-
jetivos específicos podem ser alcançados. Podemos fabricar produtos com melhores
características, diminuir seu tempo de desenvolvimento, aumentar a produtividade
de processos, minimizar a sensibilidade dos produtos às variações nas condições
ambientais, e assim por diante.
Voltando ao nosso exemplo inicial, vejamos algumas questões específicas em
que o planejamento experimental pode ajudar o pesquisador a atingir seus objetivos
mais rapidamente e a um custo menor. Digamos que ele já saiba que a temperatu-
ra e a concentração, bem como o tipo de catalisador, afetam o rendimento. Como
seria possível ajustar os valores da temperatura e da concentração para obter uma
quantidade maior do produto? Variando esses fatores, seria possível maximizar o
rendimento? As mudanças nesses valores provocariam mudanças semelhantes nos
rendimentos se o catalisador fosse outro? Que experimentos devemos realizar para
obter mais informações sobre o sistema? Como podemos quantificar a eficiência dos
catalisadores para as diferentes combinações de temperatura e concentração? Como
os valores dos fatores experimentais podem ser mudados para obtermos o maior
rendimento possível sem que as propriedades mecânicas do produto final deixem
18
Como Fazer Experimentos

de satisfazer às suas especificações? Nos capítulos restantes discutiremos técnicas


estatísticas de planejamento e análise capazes de nos auxiliar a encontrar respostas
confiáveis para todas essas questões.
Os métodos que veremos independem da natureza do problema a que são apli-
cados. Servem para estudar reações químicas, sistemas biológicos, processos mecâ-
nicos (entre muitos outros), e também podem varrer todas as possíveis escalas de
interesse, desde uma única reação em bancada até um processo industrial operando
em larga escala. O denominador comum são os princípios estatísticos envolvidos,
que são sempre os mesmos. É claro que isso não significa menosprezar o conheci-
mento técnico que o especialista já detém sobre o sistema em estudo. Como já dis-
semos no prefácio, ele é insubstituível. As ferramentas estatísticas, embora valiosas,
são apenas um complemento a esse conhecimento. O ideal é que as duas coisas
− conhecimento básico do problema e estatística − andem juntas.

1.2 Modelos empíricos


Quando se trata de modelar dados resultantes de experimentos ou observações, é
importante fazer a distinção entre modelos empíricos e modelos mecanísticos. Ten-
taremos esclarecer essa diferença considerando dois exemplos práticos.

◆ Imaginemos que um astrônomo queira calcular a hora em que vai ocorrer o


próximo eclipse da Lua. Como sabemos, os fatos acumulados ao longo de sé-
culos de observação e especulação levaram, no final do século XVII, a uma
teoria que explica perfeitamente os fenômenos astronômicos não relativísticos:
a mecânica newtoniana. A partir das leis de Newton é possível deduzir o com-
portamento dos corpos celestes como uma consequência inevitável das suas
interações gravitacionais. Este é um modelo mecanístico: com ele podemos
prever as trajetórias dos astros porque sabemos as causas que as provocam, isto
é, conhecemos o mecanismo por trás de seu comportamento. O astrônomo só
precisa aplicar a mecânica newtoniana às suas observações e fazer as deduções
necessárias. Ele não tem, aliás, de ficar restrito ao sistema solar: as leis de
Newton aplicam-se universalmente. Em outras palavras, a mecânica newto-
niana é também um modelo global.
◆ Agora consideremos uma situação bem diferente e mais próxima de nós. Um
químico é encarregado de projetar uma fábrica-piloto baseada numa determi-
nada reação recém-desenvolvida em bancada. Ele sabe que o comportamento
dessa reação pode ser influenciado por muitos fatores: as quantidades iniciais
dos reagentes, o pH do meio, o tempo de reação, a carga de catalisador, a velo-
19
Capítulo 1 Como a Estatística Pode Ajudar

cidade com que os reagentes são introduzidos no reator, a presença ou ausência


de luz, e assim por diante. Mesmo que exista um modelo cinético para a reação
em questão, dificilmente ele poderá levar em conta a influência de todos esses
fatores, além de outros mais que costumam aparecer quando se muda da escala
de laboratório para a escala piloto. Numa fábrica em larga escala, então, que é
normalmente o objetivo de longo prazo, a situação é ainda mais complexa. Sur-
gem elementos imponderáveis, como o nível de impurezas da matéria-prima, a
flutuação de fatores ambientais (umidade, por exemplo), a estabilidade do pro-
cesso como um todo, e até mesmo o próprio envelhecimento do equipamento.
Trata-se de uma situação muito complicada, para a qual é difícil ser otimista
quanto à possibilidade de se descobrir um modelo mecanístico tão abrangente
e eficaz como a mecânica newtoniana. Num caso assim, o pesquisador deve
recorrer forçosamente a modelos empíricos, isto é, modelos que procuram
apenas descrever, com base na evidência experimental, o comportamento do
processo estudado. Isto é totalmente diferente de tentar explicar a partir de
umas poucas leis o que está se passando, que é o que procura fazer um modelo
mecanístico. Mesmo conseguir descrever, dito assim, sem nenhuma adjetiva-
ção, pode ser em muitos casos uma tarefa ambiciosa demais. Na modelagem
empírica já nos damos por satisfeitos se somos capazes de descrever o proces-
so estudado na região experimental investigada. Isso significa que modelos em-
píricos são também modelos locais. Sua utilização para fazer previsões para
situações desconhecidas corre por conta e risco do usuário.

Para resumir o conteúdo deste livro numa única frase, podemos dizer que o seu
objetivo é ensinar as técnicas mais empregadas para desenvolver modelos empíricos.

1.3 Planejamento e otimização de experimentos


As pessoas normalmente se lembram da Estatística quando se veem diante de gran-
des quantidades de informação. Na percepção do chamado senso comum, o em-
prego de métodos estatísticos seria algo semelhante à prática da mineração.1 Um
estatístico seria um tipo de minerador bem-sucedido, capaz de explorar e processar
montanhas de números e delas extrair valiosas conclusões. Como tanta coisa asso-
ciada ao senso comum, esta também é uma impressão falsa, ou no mínimo parcial. A
atividade estatística mais importante não é a análise de dados, e sim o planejamento

1
Aliás, o termo data mining está se tornando cada vez mais comum para descrever investigações exploratórias em
grandes bancos de dados, normalmente de interesse comercial.
20
Como Fazer Experimentos

dos experimentos em que esses dados devem ser obtidos. Quando isso não é feito da
forma apropriada, o resultado muitas vezes é uma montanha de números estéreis, da
qual estatístico algum conseguiria arrancar quaisquer conclusões.
A essência de um bom planejamento consiste em projetar um experimento de
forma que ele seja capaz de fornecer exatamente o tipo de informação que procu-
ramos. Para isso precisamos saber, em primeiro lugar, o que é mesmo que estamos
procurando. Mais uma vez, parece óbvio, mas não é bem assim. Podemos mesmo di-
zer que um bom experimentador é, antes de tudo, uma pessoa que sabe o que quer.
Dependendo do que ele queira, algumas técnicas serão mais vantajosas, enquanto
outras serão simplesmente inócuas. Se você quer tornar-se um bom planejador, por-
tanto, comece perguntando a si mesmo:

◆ O que eu gostaria de ficar sabendo quando o experimento tiver


terminado?

Yogi Berra, o astro do beisebol americano, também era conhecido por suas
tiradas espirituosas, e às vezes paradoxais. Uma delas se aplica perfeitamente neste
contexto: Se você não sabe para onde está indo, vai terminar batendo em outro lugar.
Imaginemos um eixo que descreva o progresso de uma investigação experi-
mental, desde uma situação de praticamente nenhuma informação até a constru-
ção de um (hipotético) modelo mecanístico global. Caminhar ao longo desse eixo
corresponderia a ir descendo as linhas da Tabela 1.1, que mostra um sumário do
conteúdo do livro. Na primeira linha, numa situação de pouca informação, sequer
sabemos quais são as variáveis mais importantes para o sistema que estamos es-
tudando. Nosso conhecimento talvez se limite a uma pequena experiência prática
ou a alguma informação bibliográfica. Nessas condições, a primeira coisa a fazer é
realizar uma triagem e descartar as variáveis não significativas, para não perder mais

Tabela 1.1 A evolução de um estudo empírico. O conhecimento do sistema


estudado aumenta à medida que percorremos a tabela de cima
para baixo
Objetivo Técnica Capítulo
Triagem de variáveis Planejamentos fracionários 4
Avaliação da influência de variáveis Planejamentos fatoriais completos 3
Construção de modelos empíricos Modelagem por mínimos 5,7
quadrados
Otimização RSM, simplex 6,8
Construção de modelos Dedução a partir de princípios _
mecanísticos gerais
21
Capítulo 1 Como a Estatística Pode Ajudar

tempo e dinheiro com elas no laboratório. O uso de planejamentos fatoriais fra-


cionários, discutidos no Capítulo 4, é uma maneira de alcançar esse objetivo. Os
planejamentos fracionários são extremamente econômicos e podem ser usados para
estudar dezenas de fatores de uma só vez.
Tendo selecionado os fatores importantes, nosso próximo passo seria avaliar
quantitativamente sua influência sobre a resposta de interesse, bem como as pos-
síveis interações de uns fatores com os outros. Para fazer isso com o mínimo de
experimentos, podemos empregar planejamentos fatoriais completos, que são
tratados no Capítulo 3. Ultrapassando essa etapa e desejando obter uma descrição
mais detalhada, isto é, obter modelos mais sofisticados, podemos passar a empregar
a modelagem por mínimos quadrados, que é o assunto tratado no Capítulo 5.
Esse é provavelmente o capítulo mais importante de todos, porque algumas das
técnicas discutidas em outros capítulos nada mais são do que casos particulares da
modelagem por mínimos quadrados. Um exemplo é o Capítulo 7, dedicado à mode-
lagem de misturas. Os modelos de misturas têm algumas peculiaridades, mas no
fundo são modelos ajustados pelo método dos mínimos quadrados.
Às vezes nosso objetivo principal é otimizar nosso sistema, isto é, maximi-
zar ou minimizar algum tipo de resposta. Pode ocorrer que, ao mesmo tempo,
também tenhamos de satisfazer determinados critérios. Por exemplo: produzir a
máxima quantidade de um determinado produto, ao menor custo possível, e sem
fugir das especificações. Nessa situação, uma técnica conveniente é a metodolo-
gia de superfícies de resposta (RSM), apresentada no Capítulo 6 e também
baseada na modelagem por mínimos quadrados. Mais adiante, no Capítulo 8,
apresentamos uma técnica de otimização diferente, o simplex sequencial, em
que o objetivo é simplesmente chegar ao ponto ótimo, dispensando-se a constru-
ção de um modelo.
Construir modelos empíricos não basta. Precisamos também avaliar se eles
são realmente adequados ao sistema que estamos querendo descrever. Só então tem
cabimento procurar extrair conclusões desses modelos. Um modelo mal ajustado faz
parte da ficção científica, não da ciência.
É impossível fazer uma avaliação da qualidade do ajuste de um modelo sem
recorrer a alguns conceitos básicos de estatística. Isso não significa, porém, que
você tenha de se tornar um especialista em estatística para poder se valer das técni-
cas que apresentamos neste livro. Algumas noções baseadas na famosa distribuição
normal são suficientes. Essas noções são apresentadas no Capítulo 2, e são muito
importantes para a compreensão e a aplicação dos métodos de planejamento e aná-
lise apresentados nos demais capítulos. Para tentar amenizar a costumeira aridez
com que são discutidos tais conceitos, baseamos nosso tratamento na solução de um
problema prático, de alguma relevância para a culinária nacional.
22
Como Fazer Experimentos

A utilização de todos os métodos descritos neste livro é praticamente inviável


sem a ajuda de um microcomputador para fazer cálculos e gráficos. Quando publi-
camos a primeira edição, distribuíamos junto com o livro um disquete com vários
programas escritos com essa finalidade. Hoje a abundância de programas muito
mais sofisticados, vários dos quais de domínio público, não só para Windows como
para Linux, tornou o nosso disquete obsoleto. Se mesmo assim você estiver inte-
ressado nesses programas (que são para o sistema DOS), pode obtê-los gratuita-
mente na página do Instituto de Química da Unicamp (www.iqm.unicamp.br), a
partir do link chemkeys.