Escolar Documentos
Profissional Documentos
Cultura Documentos
Como Fazer Experimentos 2aed Barros Scarminio Bruns OCR PDF
Como Fazer Experimentos 2aed Barros Scarminio Bruns OCR PDF
Secretria executiva
Elisabeth Regina Marchetti
Preparao e reviso
Benicio de Barros Neto
Editorao eletrnica
Rossana Cristina Barbosa
Designer de capa
Benicio de Barros Neto
Acompanhamento grfico
Ednilson Tristo
Assessor de informtica
Carlos Leonardo Lamari
2001
Editora da Unicamp
Caixa Postal 6074
Cidade Universitria - Baro Geraldo
CEP 13083-970 - Campinas - SP - Brasil
Associao Brasileira de Tel.: (19) 3788-1015 - Tel./Fax: (19) 3788-1100
Editoras Universitrias www.editora.unicamp.br
Sumrio
Prefcio
2.1 Erros 10
2.1(a) Tipos de erros 11
2. 2 Populaes, amostras e distribuies 15
2.2(a) Como descrever as caractersticas da amostra 18
2.3 A distribuio normal 25
2.3(a) Como calcular probabilidades de ocorrncia 27
2.3(b) Como usar as caudas da distribuio normal padro 31
2.3(c) Porque a distribuio normal to importante? 34
2.3(d) Como calcular um intervalo de confiana para a mdia 36
2.3(e) Como interpretar um intervalo de confiana 38
2.4 Covarincia e correlao 38
2.5 Combinaes lineares de variveis aleatrias 43
2.6 Amostragem aleatria em populaes normais 48
2.7 Aplicando a distribuio normal 56
2.7(a) Como fazer comparaes com um valor de referncia 56
2.7(b) Como determinar o tamanho da amostra 58
2.7(c) Como fazer o controle estatstico de processos 60
2.7(d) Como comparar dois tratamentos 64
Como comparar duas mdias 64
Como fazer comparaes emparelhadas 67
Como comparar duas varincias 69
Sumrio
2A Aplicaes 71
2A.1 De casa para o trabalho 71
2A.2 Bioequivalncia de medicamentos genricos e de marca 77
2A.3 Mais feijes? 80
2A.4 Produtividade de algas marinhas 82
Tabelas 391
A utilidade deve ser a principal inteno de qualquer publicao. Onde quer que essa
inteno no aparea claramente, nem os livros nem seus autores tm o menor direito
aprovao da humanidade. Assim escreveu William Smellie no prefcio primeira edio da
Encyclopaedia Britannica, publicada em 1768.
Nosso livro tem a modesta inteno de ser til s pessoas que desejarem - ou
precisarem - fazer experimentos. A edio que voc est lendo uma verso considera-
velmente revista, corrigida e ampliada do nosso texto anterior, Planejamento e Otimizao
de Experimentos, que esgotou trs tiragens. Como foram muitas as mudanas que fizemos,
conclumos que seria apropriado mudar tambm o ttulo, para torn-lo uma descrio mais
fiel do contedo e do propsito do livro.
Na preparao desta edio cada sentena foi reconsiderada, com o objetivo de tornar
o texto mais claro. Todos os erros que conseguimos descobrir, ou que os leitores tiveram a
bondade de nos apontar, foram corrigidos. A principal mudana, porm, que vrios novos
assuntos foram includos, enquanto outros tantos passaram a ter um tratamento mais
aprofundado.
Entre as novidades, gostaramos de chamar a ateno para o captulo dedicado
metodologia de superfcies de resposta, e para as sees contendo aplicaes reais das vrias
tcnicas de planejamento e anlise que discutimos no texto principal. Muitos leitores da
primeira edio comentaram conosco que gostariam de ver menos teoria e mais prtica. Os
35 exemplos reais que agora inclumos (quase 80 novas pginas dedicadas a eles, no total)
representam um esforo no sentido de, seno diminuir a teoria, pelo menos temper-la com
bastante prtica. As pessoas que usaram a edio anterior notaro ainda que o projeto
grfico tambm foi modificado, na esperana de tornar a leitura mais agradvel.
Nos 15 anos em que nos dedicamos a tentar ensinar quimiometria - isto , o
emprego de tcnicas estatsticas, matemticas e grficas para resolver problemas qumicos -
tivemos centenas de alunos e alunas, tanto nas nossas prprias universidades quanto em
outras instituies de ensino e pesquisa, bem como em diversas empresas. Esses estudantes
vinham principalmente das cincias exatas e das engenharias, mas vrias outras profisses
estiveram representadas, da administrao medicina, passando pela biologia, pela far-
mcia e pela tecnologia de alimentos, para mencionar as primeiras que nos ocorrem agora.
Essa diversidade nos faz acreditar que as tcnicas que apresentamos podem ser aprendidas
e usadas, com maior ou menor esforo, por qualquer profissional que tenha de realizar
experimentos.
Gostaramos de reiterar que a estatstica no faz milagres, e que no pode substituir
de forma alguma o conhecimento tcnico especializado. O que continuamos esperando
xi
Prefcio
demonstrar, com esta nova edio, que um profissional que junte conhecimentos de
planejamento de experimentos e de anlise de dados a uma slida formao tcnica em sua
rea torna-se um profissional mais competente, e por isso mesmo mais competitivo.
Ns mesmos somos qumicos, no estatsticos, e talvez seja isso que diferencie o
nosso livro de outros com um contedo semelhante. Embora no acreditemos que algum
possa dominar as tcnicas de planejamento e anlise de experimentos sem um certo
conhecimento dos fundamentos da Estatstica, neste livro procuramos reduzir a discusso
dessa base ao mnimo que consideramos necessrio, e passar logo para o que interessa -
problemas de pesquisa e desenvolvimento. Por outro lado, como sabemos que a Estatstica
no costuma figurar entre as disciplinas mais populares na formao de diversas categorias
profissionais, partimos do princpio de que nossos leitores no tm nenhum conhecimento
prvio dessa cincia. Mesmo assim, chegamos mais cedo aos problemas experimentais com
muitas variveis do que os textos mais tradicionais.
Um nmero muito grande de pessoas contribuiu para que este livro se tornasse
realidade. Se na primeira edio a lista j era extensa demais para que citssemos a todos
nominalmente, temos a satisfao de reconhecer que de l para c ela s fez ampliar-se, e
nossa gratido aumentou na mesma proporo. Queremos, porm, agradecer especialmente
queles cujo trabalho permitiu que inclussemos tantas aplicaes na presente edio. Esses
so chamados pelo nome quando discutimos seus respectivos dados.
As universidades em que trabalhamos so muito distantes uma da outra, e a nossa
colaborao tem se beneficiado do apoio da Fapesp, da Faep-Unicamp e do CNPq, pelo que
tambm somos muito gratos.
Por uma coisa somos os nicos responsveis: os defeitos que no conseguimos reme-
diar. Contamos com a ajuda dos leitores para resolver esse problema de otimizao. Nossos
endereos eletrnicos esto a embaixo. Se voc sabe como poderamos melhorar o livro,
ficaremos muitos satisfeitos em ouvir sua opinio.
l. S. Scarminio (ieda@gui.uel.br)
Departamento de Qumica
Universidade Estadual de Londrina
R. E. Bruns (brunsigm.unicamp.br)
Departamento de Fsico-Qumica
Instituto de Qumica - Unicamp
XII
1
Como a Estatstica pode ajudar
Este um livro sobre o bom senso. Mais especificamente, sobre o bom senso na realizao de
experimentos e na anlise de seus resultados. No incio do Discurso sobre o mtodo, um
pouco antes da citao acima, Descartes diz que, de todas as coisas no mundo, a mais bem
distribuda o bom senso, porque "todos se acham to abundantemente providos [de bom
senso] que mesmo aqueles mais difceis de se contentar em outros assuntos comumente no
desejam mais bom senso do que j tm" (Descartes, 1637). Se voc acredita nisso (Descartes
obviamente no acreditava), este livro no para voc.
Digamos, porm, que voc esteja de acordo com Descartes - afinal, voc continuou
lendo - e ache que nem tudo que parece bvio to bvio assim. Nesse caso, se voc estiver
envolvido com experimentao, seja na vida acadmica, seja na indstria, seja num
laboratrio de pesquisa ou desenvolvimento, este livro poder lhe ser bastante til. Com ele
voc poder aprender a realizar seus experimentos e tirar suas concluses de forma mais
econmica e eficaz.
Digamos que um qumico deseje obter o rendimento mximo em uma certa reao, e
que essa reao seja controlada por apenas duas variveis: a temperatura e a concentrao
de um determinado reagente. Na nomenclatura que adotaremos neste livro, a propriedade
de interesse, que neste caso o rendimento, chamada de resposta. As variveis que em
princpio influenciam a resposta (isto , a temperatura e a concentrao) so os fatores, e a
1
Como a Estatstica
Eis uma sugesto. Para manter as coisas sob controle, fixamos um dos fatores num
certo nvel e variamos o outro at descobrir qual o nvel desse outro fator que produz o maior
rendimento. Variando s um dos fatores estaremos nos assegurando de que qualquer
mudana na resposta ter sido causada pela modificao do nvel desse fator. Depois,
mantendo esse fator no nvel timo encontrado, variamos o nvel do primeiro fator (o que
tinha sido fixado), at descobrir o valor dele que tambm produz um rendimento mximo.
Pronto. O experimento acabou, e descobrimos os valores timos que estvamos procurando,
certo?
Errado! Esse pode ser o senso comum, mas certamente no bom senso. Quase todas
as pessoas a quem perguntamos concordaram que o procedimento que acabamos de
descrever era "o mais lgico", e no entanto existe uma maneira muito mais eficaz de fazer o
experimento. Alis, com esse "senso comum" o rendimento mximo s seria descoberto em
circunstncias muito especiais. Ao contrrio do que se poderia esperar, muito melhor fazer
variar todos os fatores ao mesmo tempo. A razo para isso que as variveis podem se
influenciar mutuamente, e o valor ideal para uma delas pode depender do valor da outra.
Esse comportamento, que chamamos de intera~o entre os fatores, um fenmeno que
ocorre com muita freqncia. Raras so as situaes em que dois fatores atuam de forma
realmente independente.
Este apenas um exemplo de como o senso comum pode ser enganoso. Voltaremos a
ele nos captulos seguintes, para um tratamento detalhado. Neste captulo vamos apenas in-
troduzir algumas noes bsicas de modelagem e apresentar sumariamente as tcnicas que
discutiremos ao longo do livro, tentando mostrar a utilidade de cada uma delas na vida real.
2
As pesquisas realizadas com o objetivo de fornecer respostas a essas perguntas
muitas vezes tomam vrios meses de trabalho de pesquisadores e tcnicos, a um custo
bastante alto em termos de salrios, reagentes, anlises qumicas e testes fsicos. O principal
objetivo deste livro mostrar que o emprego de conhecimentos estatsticos pode ajudar a
responder a essas perguntas de forma racional e econmica. Usando planejamentos
experimentais baseados em princpios estatsticos, os pesquisadores podem extrair do
sistema em estudo o mximo de informao til, fazendo um nmero mnimo de
experimentos.
Os mtodos mais eficazes que podem ser usados por cientistas e engenheiros para
melhorar ou otimizar sistemas, produtos e processos so apresentados nos captulos
seguintes. Esses mtodos so ferramentas poderosas, com as quais vrios objetivos
especficos podem ser alcanados. Podemos fabricar produtos com melhores caractersticas,
diminuir seu tempo de desenvolvimento, aumentar a produtividade de processos, minimizar
a sensibilidade dos produtos s variaes nas condies ambientais, e assim por diante.
3
Come a Estatistica
Imaginemos que um astrnomo queira calcular a hora em que vai ocorrer o prximo
eclipse da Lua. Como sabemos, os fatos acumulados ao longo de sculos de observao e
especulao levaram, no final do sculo XVII, a uma teoria que explica perfeitamente os
fenmenos astronmicos no-relativsticos: a mecnica newtoniana. A partir das leis de
Newton possvel deduzir o comportamento dos corpos celestes como uma conseqncia
inevitvel das suas interaes gravitacionais. Este um modelo mecanstioo: com ele
podemos prever as trajetrias dos astros porque sabemos as causas que as provocam, isto
, conhecemos o mecanismo por trs de seu comportamento. O astrnomo s precisa
aplicar a mecnica newtoniana s suas observaes e fazer as dedues necessrias. Ele
no tem, alis, de ficar restrito ao sistema solar: as leis de Newton aplicam-se univer-
salmente. Em outras palavras, a mecnica newtoniana tambm um modelo global.
Agora consideremos uma situao bem diferente e mais prxima de ns. Um qumico
encarregado de projetar uma fbrica piloto baseada numa determinada reao recm-
desenvolvida em bancada. Ele sabe que o comportamento dessa reao pode ser
influenciado por muitos fatores: as quantidades iniciais dos reagentes, o pH do meio, o
tempo de reao, a carga de catalisador, a velocidade com que os reagentes so
introduzidos no reator, a presena ou ausncia de luz, e assim por diante. Mesmo que
exista um modelo cintico para a reao em questo, dificilmente ele poder levar em
conta a influncia de todos esses fatores, alm de outros mais que costumam aparecer
quando se muda da escala de laboratrio para a escala piloto. Numa fbrica em larga
escala, ento, que normalmente o objetivo de longo prazo, a situao ainda mais
complexa. Surgem elementos imponderveis, como o nvel de impurezas da matria-
prima, a flutuao de fatores ambientais (umidade, por exemplo), a estabilidade do
processo como um todo, e at mesmo o prprio envelhecimento do equipamento. Trata-se
de uma situao muito complicada, para a qual difcil ser otimista quanto possibi-
lidade de se descobrir um modelo mecanstico to abrangente e eficaz como a mecnica
newtoniana. Num caso destes, o pesquisador deve recorrer forosamente a modelos
4
empricos, isto , modelos que procuram apenas descrever, com base na evidncia
experimental, o comportamento do processo estudado. Isto totalmente diferente de
tentar explicar a partir de umas poucas leis o que est se passando, que o que procura
fazer um modelo mecanstico. Mesmo conseguir descrever, dito assim sem nenhuma
adjetivao, pode ser em muitos casos uma tarefa ambiciosa demais. Na modelagem
emprica j nos damos por satisfeitos se somos capazes de descrever o processo estudado
na regio experimental investigada. Isto quer dizer que modelos empricos so tambm
modelos lomis. Sua utilizao para fazer previses para situaes desconhecidas corre por
conta e risco do usurio.
Para resumir o contedo deste livro numa nica frase, podemos dizer que o seu
objetivo ensinar as tcnicas mais empregadas para desenvolver modelos empricos.
1 Alis, o termo data mining est se tornando cada vez mais comum para descrever investigaes
exploratrias em grandes bancos de dados, normalmente de interesse comercial.
5
Como a Estatstica
Yogi Berra, o astro do beisebol americano, tambm era conhecido por suas tiradas
espirituosas, e s vezes paradoxais. Uma delas se aplica perfeitamente neste contexto: Se
voc no sabe para onde est indo, vai terminar batendo em outro lugar.
6
assunto tratado no Captulo 5. Esse provavelmente o captulo mais importante de todos,
porque algumas das tcnicas discutidas em outros captulos nada mais so que casos
particulares da modelagem por mnimos quadrados. Um exemplo o Captulo 7, dedicado
modelagem de misturas. Modelos de misturas tm algumas peculiaridades, mas no fundo
so modelos ajustados pelo mtodo dos mnimos quadrados.
7
2
Quando as coisas funcionam normalmente
Felizmente essa situao desagradvel pode ser evitada. Basta que voc planeje
cuidadosamente a realizao do seu experimento, em todos os detalhes e usando as ferra-
mentas estatsticas apropriadas. Com essa precauo, alm de minimizar os custos ope-
racionais, voc ter a garantia de que os resultados do experimento iro conter informaes
relevantes para a soluo do problema de partida. Com experimentos bem planejados, fica
muito fcil extrair concluses vlidas. A anlise dos resultados passa a ser trivial.
9
uu:an:on as coisas funcionam normahnente
realizando experimentos que no levem a concluso alguma, duvidosa ou no, e cujo nico
resultado prtico seja o desperdcio de tempo e dinheiro.
Por aborrecida que s vezes parea, a estatstica fundamental para que ns possa-
mos planejar e realizar experimentos de forma eficiente. Para aproveitar todo o potencial
das tcnicas apresentadas no restante do livro, muito importante que voc tenha uma com-
preenso correta do contedo deste captulo.
2.1 Erros
Para obter dados experimentais confiveis, precisamos executar um procedimento bem defi-
nido, com detalhes operacionais que dependem da finalidade do experimento.
Cada uma dessas etapas, por sua vez, envolver um certo nmero de operaes bsicas,
como pesagens, diluies e leituras de volume.
10
Determinaes como esta fazem parte da rotina dos laboratrios bromatolgicos, que
as usam para verificar se o vinagre est de acordo com o estabelecido pela legislao (4% de
cido actico, no mnimo).
No sabemos, pelo menos por enquanto. No podemos dar uma resposta justa sem
ter uma estimativa da incerteza associada a esses valores, porque cada uma das operaes
de laboratrio envolvidas na titulao est sujeita a erros, e esses erros todos iro se juntar
para influenciar o resultado final - e portanto nossas concluses - numa extenso que ainda
no temos como avaliar. O resultado insatisfatrio pode no ser culpa da amostra, e sim das
variaes inerentes ao procedimento analtico. O mesmo se pode dizer do resultado aparente-
mente bom.
Digamos que neste exemplo os erros sejam de tal monta que no tenhamos condies
de obter um resultado final com preciso superior a 0,30%.1 Sendo assim, o verdadeiro va-
lor da concentrao da primeira amostra pode estar entre 3,50% e 4,10%. O valor observado,
3,80%, seria apenas o ponto mdio desse intervalo. O resultado dessa nica titulao no
excluiria a possibilidade de o verdadeiro teor de cido estar acima de 4%, e portanto enqua-
drar-se na lei. Da mesma forma, a verdadeira concentrao da segunda amostra pode estar
abaixo de 4%. Sem uma indicao da incerteza experimental, os valores 3,80% e 4,20% po-
dem levar a concluses - e talvez a atitudes, como a rejeio do lote de vinagre - no auto-
rizadas pelos fatos.
Todos sabemos que qualquer medida est sempre afetada por erros - so coisas da vida. Se
os erros forem insignificantes, timo. Se no forem, corremos o risco de fazer inferncias
incorretas a partir de nossos resultados experimentais, e possivelmente chegar a uma
resposta falsa para o nosso problema. Para evitar esse final infeliz, precisamos saber como
levar na devida conta os erros experimentais. Isso importante no s na anlise do resulta-
1 Calma, companheiros qumicos. Sabemos muito bem que esta uma preciso absurda para uma
anlise volumtrica que se preze. O exagero nos erros est sendo cometido no interesse da didtica.
11
do final, mas tambm - e principalmente - no prprio planejamento do experimento, como j
dissemos. No existe anlise que possa salvar um experimento mal planejado.
fcil imaginar outras fontes de erros sistemticos: o padro primrio pode estar
adulterado, a balana pode estar descalibrada, a pipeta pode ter sido aferida erroneamente,
quem est titulando pode olhar o menisco de um ngulo incorreto, e assim por diante. Cada
um desses fatores exercer individualmente sua influncia sobre o resultado final, fazendo-o
tender para uma certa direo.
Com um pequeno esforo, os erros sistemticos tambm podem ser evitados. Uma
vez que todos os instrumentos estejam funcionando perfeitamente, s seguir risca o pro-
cedimento estipulado. Por exemplo, se para voc usar fenolftalena, use fenolftalena mes-
mo, e ponto final.
12
controle, natural esperar que as duas titulaes produzam o mesmo resultado, j que se
trata do mesmo vinagre. Ao comparar os dois valores encontrados, porm, o qumico verifica
que, apesar de bem parecidos, eles no so idnticos. Isso s pode significar que nem tudo
estava realmente controlado. Alguma fonte de erro, ainda que aparentemente pequena,
continua afetando os resultados.
Para investigar esses erros, o qumico resolve ento fazer vrias titulaes em
outras amostras retiradas do mesmo lote. Os resultados obtidos em 20 titulaes so mos-
trados na Tabela 2.1 e tambm na Figura 2.1.
Os valores obtidos flutuam, mas tendem a concentrar-se em torno de um certo valor in-
termedirio.
A flutuao em torno do valor central ocorre aparentemente ao acaso. Sabendo que de-
terminada titulao resultou num valor abaixo da mdia, por exemplo, no conseguimos
prever em que direo se deslocar o valor da prxima titulao, nem de quanto ser o
seu desvio em relao mdia.
Parece que a amostra est mesmo fora da especificao, j que a maioria dos valores
determinados est abaixo de 4%.
1 3,91 11 3,96
2 4,01 12 3,85
3 3,61 13 3,67
4 3,83 14 3,83
5 3,75 15 3,77
6 3,91 16 3,51
7 3,82 17 3,85
8 3,70 18 4,04
9 3,50 19 3,74
10 3,77 20 3,97
13
OUiZU1~dO as coisas funcionam normairnente
4,1
O
4,0 r.
O
3,9
() o
O O
~ 3,8
O O O
o
lct'S
<>
~ O O
'E
Q)
3,7 0
u O
c
o
()
3,6
()
3,5
3,4
o 5 10 15 20
Titulao n-
Basta refletir um pouco para ver que impossvel controlar rigidamente todos os
fatores envolvidos num experimento, por mais simples que seja. Conseqentemente, qual-
quer determinao experimental estar afetada, em maior ou menor grau, por erros aleat-
rios. Se queremos chegar a concluses sensatas, esses erros precisam ser levados em conta.
por isso, entre outros motivos, que precisamos de estatstica. 2
2Erro, neste terceiro sentido, no deve ser entendido como um termo pejorativo, e sim como uma
caracterstica com a qual teremos de conviver.
14
Exerccio 2.1
Pense num experimento simples e procure identificar alguns dos fatores que impedem o seu
resultado de ser obtido rigorosamente sem erro.
o primeiro passo para tratar estatisticamente os erros aleatrios admitir alguma hiptese
sobre sua distribuio. O mais comum, quando se trata de medies, supor que a distri-
buio dos erros gaussiana ou, como tambm chamada, normal. Nesta seo vamos
discutir em termos prticos essa hiptese e suas importantes conseqncias, partindo do
seguinte problema:
Uma possvel soluo seria contar todos os caroos, um por um. Ela ser descartada
desde j, porque estamos interessados numa abordagem estatstica da questo. Adotaremos
uma soluo alternativa, que descobrir primeiro quanto pesa um caroo, e em seguida
dividir 1.000 g por esse valor. O resultado da diviso dar o nmero de caroos contidos em
um quilo.
Exerccio 2.2
Tente adivinhar quantos caroos existem em um quilo de feijo preto. bvio que este no o
mtodo recomendado para resolver nosso problema (a no ser que voc tenha poderes
parapsicolgicos), mas seu palpite servir para um teste estatstico, mais adiante.
Em princpio, nenhum dos dois. Como o peso varia de um caroo para outro, no de-
vemos usar pesos individuais nas nossas contas, e sim o peso mdio do conjunto de todos os
caroos. Para obter o peso mdio, s dividir o peso total do pacote de feijo (1 kg) pelo n-
mero de caroos que ele contm. Infelizmente isso nos traz de volta estaca zero: para des-
15
UUian:QO as coisas fl.HlCionam normahrH:~nte
cobrir, com esse mtodo, quantos caroos existem em um quilo de feijo, precisamos saber
primeiro... quantos caroos existem em um quilo de feijo.
Se todos os caroos fossem idnticos, o peso mdio seria igual ao peso de um caroo
qualquer. Era s pesar um deles que a questo estaria resolvida. O problema que, como
vimos, o peso varia de caroo para caroo. Mais que isso, varia - vejam s - de modo impre-
visvel. Quem poderia adivinhar que, tendo retirado do pacote um caroo com 0,1188 g, a
gente iria encontrar logo depois um outro pesando exatamente 0,2673 g?
16
Catutuh12
partir de apenas alguns deles, isto , a partir de uma amostra da populao. Se a amostra
for suficientemente representativa, a mdia amostraI dever ser uma boa aproximao da
mdia populacional, e poderemos us-la para concluir alguma coisa sobre a populao.
Exerccio 2.3
No exemplo dos feijes a populao finita: o nmero total de caroos pode ser grande, mas
limitado. O conjunto de todas as concentraes que podem em princpio ser obtidas na
titulao de uma dada amostra constitui uma populao finita ou infinita? (Note a expresso
"em princpio". Imagine que possvel fazer quantas titulaes voc quiser, sem correr o risco
de esgotar os estoques da amostra e dos reagentes.)
17
as coisas flH1cionam norma~mente
18
Fica mais fcil interpretar os dados se dividirmos a faixa total dos pesos em inter-
valos menores e contarmos os caroos situados dentro de cada intervalo. Com os valores
extremos que observamos, a faixa 0,10-0,32 g suficiente para acomodar todos os valores da
Tabela 2.2. Dividindo-a em intervalos de largura igual a 0,02 g e atribuindo cada peso
medido ao intervalo apropriado, obtemos os resultados que aparecem na Tabela 2.3. Percor-
rendo a coluna do meio, verificamos imediatamente que os intervalos ao redor de 0,20 g so
mesmo os que contm mais caroos.
Tabela 2.3 Distribuio dos pesos de 140 caroos extrados aleatoriamente de um pacote de
1 kg de feijo preto.
(*) Nmero de caroos no intervalo dividido pelo nmero total de caroos, 140.
19
vuanoo as coisas func~onam norma~mente
Exerccio 2.4
Use os dados da Tabela 2.3 para confirmar que 54,3% dos caroos observados tm peso entre
0,18 g e 0,24 g.
Qualquer conjunto de dados fica mais fcil de analisar se for representado grafica-
mente. No grfico tradicional para uma distribuio de freqncias, cada intervalo repre-
sentado por um retngulo, cuja base coincide com a largura do prprio intervalo e cuja rea
idntica, ou pelo menos proporcional, sua freqncia. A figura geomtrica obtida dessa
forma chamada de histograma Como a soma de todas as freqncias tem de ser igual a um
(isto , a soma de todas as percentagens tem de dar 100%), a rea total do histograma tam-
bm igual a um, quando a rea de cada retngulo for igual freqncia do intervalo cor-
respondente. A Figura 2.2 mostra um histograma das freqncias da Tabela 2.3. Para
0.28
0.24
0.20
tU 0.16
'u
c
cO)
:::J
o-
O)
0.12
Li:
0.08
0.04 .
0.00
0,11 0,15 0,19 0,23 0,27 0,31
Peso (g)
20
facilitar a comparao com os dados da tabela, fizemos a altura de cada retngulo, e no a
sua rea, igual freqncia do intervalo. Isso no altera o aspecto geral do histograma, j
que as bases dos retngulos so todas iguais.
Fica portanto o conselho: quando temos um conjunto de dados para analisar, dese-
nhar um grfico uma das primeiras coisas que devemos fazer. Esta uma regra geral da
estatstica, equivalente ao velho ditado que diz que uma imagem vale mil palavras.
Exerccio 2.5
Construa um histograma para os dados da Tabela 2.1. A literatura em geral recomenda
que o nmero de barras seja aproximadamente igual raiz quadrada do nmero total
de observaes. Como a tabela tem 20 valores, seu histograma deve ter 4 ou 5 barras.
Prefira cinco, que um nmero mpar, e lhe permitir enxergar melhor possveis
simetrias.
21
QuandO as coisas funcionam norma~mente
o valor mdio numa amostra costuma ser indicado por uma barra colocada
sobre o smbolo que representa os elementos da amostra. Se usarmos o smbolo x para
representar o peso de um caroo, a mdia no nosso exemplo ser representada por x, e
dada por
= 0,2024 g.
Com esse valor3 podemos estimar que o quilo de feijo contm cerca de 1.000 g +
0,2024 g/caroo = 4.940 caroos. Essa estimativa, no entanto, foi obtida a partir da obser-
vao de apenas 140 caroos, isto , menos de 3% do total, supondo-se que haja mesmo cerca
de 5.000 caroos no pacote. Por isso, no deve corresponder ao valor exato. Trata-se apenas
de uma mdia amostrai, e no da mdia populacional. Veremos adiante como proceder para
estimar sua incerteza.
MdiaAmostraJ:
1 N
X = - LXi (2.1)
N i=l
Para obter nossa medida do espalhamento das observaes em torno da mdia, que
o desvio padro, primeiro calculamos a diferena, ou desvio, de cada valor individual em re-
lao mdia amostraI:
3 O costume calcular a mdia com uma casa decimal a mais que os dados originais. No nosso
exemplo, com quatro algarismos significativos, isso no tem importncia prtica.
22
Varincia anwstral:
1- ~
V(X) =8 2 = - 2 1 ~( -)2
~di = - - k..J Xi- X (2.2)
N -1 i=l N -1 i=l
Xi = i - simo valor
N = Nmero total de valores na amostra
x = Mdia amostraI
Note que a varincia uma espcie de mdia dos quadrados dos desvios, s que o
denominador no o nmero total de observaes, N, e sim N -1. Para entender a razo
dessa mudana, devemos lembrar que as observaes originais, obtidas por amostragem
aleatria, eram todas independentes. Mesmo conhecendo os pesos de todos os 139 primeiros
caroos, no teramos como prever exatamente qual seria o peso do prximo caroo, o 140.
Usando a linguagem da Estatstica, dizemos que esse conjunto tem 140 graus de liberdade.
um grupo de 140 valores totalmente independentes, em que um valor individual qualquer
no depende dos valores restantes.
somatrio L Xi , e portanto
i
(2.3)
23
elementos do conjunto, para v = N - p. Esse ltimo valor que ser usado como denomina-
dor, numa mdia quadrtim semelhante Equao 2.2.
s = ~(O,00132 g2 ) = 0,0363 g .
: ~ :
~ ~.::: ~~.:.:
(2.4)
I : ..: 1
Exerccio 2.6
Calcule a mdia e o desvio padro dos dez primeiros valores da Tabela 2.2 (de 0,1188 g at
0,1409 g).
4 O desvio padro costuma ser calculado com duas casas decimais a mais que os dados de partida.
Aqui tambm no estamos nos importando com esse detalhe.
24
esses intervalos amostrais podem ser utilizados para testar hipteses a respeito da
populao.
Estas contas por extenso foram feitas a bem da didtica. Voc no deve preocupar-se
com a perspectiva de calcular somatrios interminveis para poder determinar mdias e
desvios padro. Qualquer calculadora cientfica j vem da fbrica programada para realizar
todas as operaes necessrias. Alm disso, existem vrios programas para microcomputado-
res, de fcil acesso, capazes de realizar no s estes como muitos outros clculos estatsticos.
Quanto mais cedo voc aprender a usar um desses programas, melhor. A estatstica lhe
parecer bem mais leve.
Exerccio 2.7
Calcule a mdia e o desvio padro do conjunto de valores da Tabela 2.1 e determine os limites
do intervalo.definido por dois desvios padro em torno da mdia. Compare com o intervalo de
confiana dado no texto para os valores da titulao.
Os valores x = 0,2024 ge 8 = 0,0363 g foram obtidos a partir dos 140 pesos indi-
viduais e portanto representam a amostra: so estimativas amostrais. Os valores que nos
interessam, porm, so os parmetros populacionais. Queremos saber quantos caroos
existem em todo o quilo de feijo, no numa pequena amostra.
Suponhamos que os caroos cujos pesos aparecem na Tabela 2.2 sejam separados do resto
do pacote, e passem a ser tratados como uma minipopulao de 140 elementos. J vimos,
na Tabela 2.3, que 5% desses elementos pesam entre 0,26 g e 0,28 g. Isso nos permite
dizer que a probabilidade de retirarmos aleatoriamente um caroo com o peso na faixa
0,26 - 0,28 g exatamente 5%. Temos condies de fazer essa afirmao porque conhe-
cemos a distribuio exata das freqncias dos pesos nessa pequena populao. Podera-
mos fazer o mesmo com um caroo retirado ao acaso do pacote de um quilo, ou seja, da pr-
pria populao original, se conhecssemos exatamente a distribuio populacional, e no
25
UUiH1:00 as co~sas funcionam normzdrnente
somente a amostraI. Infelizmente, para isso seria necessrio pesar todos os caroos, um
por um.
Imagine agora que tivssemos nossa disposio um modelo que fosse adequado
para a distribuio dos pesos de todos os caroos do pacote. Nesse caso, no precisaramos
mais pesar cada caroo para fazer inferncias sobre a populao. Poderamos tirar nossas
concluses do prprio modelo, sem ter de fazer nenhum esforo experimental a mais.
Esta idia - usar um modelo para representar uma dada populao - o tema
central deste livro. Ela estar presente, implcita ou explicitamente, em todas as tcnicas
estatsticas que vamos discutir. Mesmo que em certos casos a gente no diga expressamente
qual o modelo adotado, pelo contexto voc saber do que estamos falando. claro que nossas
inferncias a respeito da populao s podero estar corretas se o modelo escolhido for
vlido. Em qualquer situao, porm, o procedimento que devemos seguir ser sempre o
mesmo:
Nesse caso, tirar as concluses apropriadas; caso contrrio, trocar de modelo e tentar
novamente.
26
2.3 (a) Como calcular probabilidades de ocorrncia
Uma distribuio estatstica uma funo que descreve o comportamento de uma varivel
aleatria. Uma varivel aleatria uma grandeza que pode assumir qualquer valor dentro
do conjunto de valores possveis para o sistema a que ela se refere, s que cada valor desses
tem uma certa probabilidade de ocorrncia, governada por uma determinada distribuio de
probabilidades. Se tivermos como descobrir ou estimar qual essa distribuio, poderemos
calcular a probabilidade de ocorrncia de qualquer valor de interesse. Ou seja: teremos uma
modesta bola de cristal estatstica, que poderemos usar para fazer previses. Logo mais
veremos como fazer isso com a distribuio normal.
Para indicar que uma varivel aleatria x se distribui normalmente, com mdia J1 e
varincia (J"2, empregaremos a notao x ::: N (JI, (J"2 ), onde o sinal ::: pode ser lido como
"distribui-se de acordo com". Se x tiver mdia zero e varincia igual a um, por exemplo,
escreveremos x ~ N (0,1). Nesse caso, diremos tambm que x segue a distribuio normal
padro (ou padronizada).
Distribuio lrormal:
-(x-J1f
1 --
f(x ) dx - r:::- e 20" 2 dx (2.5)
a...;2n
27
Quando as coisas funcJonam norma~mente
A Figura 2.3 mostra a famosa curva em forma de sino que o grfico da densidade
de probabilidade de uma distribuio normal padro,
_x 2
1 -
f(x)= - e 2 (2.5a)
5
Note que a curva perfeitamente simtrica em torno do ponto central, que a
mdia J..l (aqui, igual a zero). O valor da densidade mximo sobre a mdia, e cai
rapidamente quando nos afastamos dela, em ambas as direes. A trs desvios padro
de distncia da mdia, a densidade de probabilidade praticamente reduz-se a zero.
So caractersticas parecidas com as que vimos no histograma dos 140 caroos, na
Figura 2.2.
b
P(a < x < b) = P(a : : ; x : : ; b) = f f( xJdx
a
28
0,6
0,5
0,4
~ 0,3
~
0,2
0,1
0,0
-3 -2 -1 2 3 4
-4
X
Como vemos na Figura 2.3, a maior parte da rea sob uma gaussiana est contida no
intervalo definido por um desvio padro em torno da mdia, e praticamente toda ela est
situada entre J1 - 30' e J1 + 3a . Para obter os valores numricos correspondentes a esses
fatos, integramos, entre os limites apropriados, a expresso de f(x) dada pela Equao 2.5:
ji+a
P(u - a < x < J1 + a) = f f( x )dx = 0,6826 (isto , 68,26%);
ji-a
ji +3a
P(u - 3a < x < J1 + 3a) = f f( x)dx = 0,9973 (99,73%).
ji-3a
Para explicar como se utiliza a Tabela A.l, precisamos introduzir o conceito de padro-
~o. Por definio, padronizar uma varivel aleatria x de mdia J1 e varincia a 2 cons-
truir a partir dela uma nova varivel aleatria z, cujos valores so obtidos subtraindo-se de
cada valor de x a mdia populacional e dividindo-se o resultado pelo desvio padro:
29
Varivel1Wrmal padronizada:
x-J.1
z (2.6)
a
Para dar um exemplo, vamos admitir que o peso de um caroo de feijo se distribua
normalmente, com J.1 = 0,2024 g e a = 0,0363 g. Com isto estamos fazendo duas suposies
questionveis:
Que os parmetros populacionais so iguais aos valores que calculamos para a amostra.
Na verdade, estamos tentando descrever os dados experimentais com nosso primeiro modelo.
Chegar a hora de nos perguntarmos se ele adequado. Por enquanto, vamos admitir que
sim.
Exerccio 2.8
Use os resultados do Exerccio 2.7 para padronizar (no sentido estatstico que acabamos de
ver) o resultado de uma titulao. Que concentrao seria obtida numa titulao cujo
resultado estivesse 2,5 desvios padro acima da mdia?
30
2.6 temos x = J.1 + z(J , como j vimos, e conseqentemente dx = (J dz . Substituindo estas
-(/l+za-/lf
f(x )dx = ~ e 2(}"2 a dz .
(Jv2n
_Z2
1 -
f(z )dz = r;;- e 2 dz ,
'\j2n
onde escrevemos f(z )dz do lado esquerdo, porque a expresso agora uma funo de z, e no
sempre poderemos usar a distribuio normal padro para discutir o comportamento de uma
distribuio normal qualquer.
A Tabela A.l contm, para valores de z que vo de 0,00 a 3,99, o que se chama de rea da
cauda ( direita) da distribuio normal padro. A primeira coluna d o valor de z at a
primeira casa decimal, enquanto a linha superior da tabela d a segunda casa. Para saber a
rea da cauda correspondente a um certo z temos de procurar na tabela o valor localizado na
interseo da linha e da coluna apropriadas. O valor correspondente a z = 1,96, por exemplo,
est na interseo da linha referente a z = 1,9 com a coluna encabeada por 0,06. Esse
valor, 0,0250, a frao da rea total sob a curva que est localizada direita de z =
1,96. Como a curva simtrica em torno da mdia, uma rea idntica est situada
esquerda de z =- 1,96 na outra metade da gaussiana (Figura 2.4). A soma dessas duas
caudas, a da direita e a da esquerda, d 5% da rea total. Da conclumos que os 95%
restantes esto entre z =- 1,96 e z = 1,96. Se extrairmos aleatoriamente um valor de z, h
uma chance em cada vinte (5%) de que esse valor fique abaixo de - 1,96, ou acima de 1,96.
Nas outras dezenove vezes a probabilidade de que ele esteja no intervalo [-1,96, 1,96].
31
uu~an~ao as coisas funcionam normalmente
z = O,18g - 0,2024g = _ 62
1 00363
, g '
z = O,25g - 0,2024g = 1 31
2 00363
, g '
Com isto a pergunta no se refere mais aos pesos, e sim a z. O que queremos saber agora
"qual a probabilidade de z cair no intervalo [-0,62, 1,31 ]?"
0.6
/
r",\
0.5 .... /"
:
\
/
/ \
\
\
0.4 l I
. . \ . :.. \ .
: \
~
~
0.3 .......
/
/. ..... \ \
.....
I \
0.2 . .... 1".
/ \
.. A ..
I \
! \
I \
0.1 ..:. ./ . .. ... .... \.. i .....
0.0
-4 -3 -2 -1 o 2 3 4
Figura 2.4 Intervalo simtrico em torno da mdia, contendo 95% da rea total
sob a curva da distribuio normal padro.
Essa probabilidade corresponde rea situada entre os limites indicados pela seta
na Figura 2.5. Ela a rea total, que um, menos as reas das duas caudas, a que fica
acima de 1,31 e a que fica abaixo de - 0,62. A da direita podemos ler diretamente na Tabela
A.l, procurando o valor correspondente a z = 1,31, que 0,0951. A rea da cauda da
esquerda no pode ser tirada diretamente da tabela, porque ela no contm valores
negativos. No entanto, por causa da simetria da curva, a rea que fica abaixo de - 0,62 tem
de ser igual que est localizada acima de 0,62. Encontramos assim o valor 0,2676.
32
0.6
0.5
0.4
0.3
~
0.2
0.1
0.0
-4 -3 -2 -1 O 3 4
z
Subtraindo da rea total as reas das duas caudas, temos finalmente a probabili-
dade desejada: (1,0 - 0,0951 - 0,2676) = 0,6373. A resposta nossa questo inicial, portanto,
que 63,73% dos caroos (cerca de dois teros) devem pesar de 0,18 g a 0,25 g. No devemos
nos esquecer, porm, de que essa resposta se baseia na validade de nossas duas suposies: a
de que a distribuio dos pesos dos caroos normal e a de que os parmetros populacionais
so iguais aos valores amostrais.
Exerccio 2.9
(a) Qual a probabilidade de um caroo pesar mais de 0,18 g?
(b) Defina os pesos limites de um intervalo que contenha 95% dos caroos.
(c) Sua resposta para o Exerccio 2.2 pode ser transformada numa estimativa do peso mdio
de um caroo. Com base no que vimos at agora, quais as chances de voc encontrar um
caroo com um peso maior ou igual a esse?
Exerccio 2.10
A rea da cauda esquerda de um ponto chamada de probabilidade cumulativa desse ponto,
e representa a probabilidade de que o valor observado para a varivel aleatria seja no
mximo igual ao valor definido pelo ponto. As probabilidades cumulativas vo ser utilizadas
no prximo captulo, quando fizermos anlises baseadas nos chamados grficos normais. Use
a Tabela A.l para calcular as probabilidades cumulativas dos seguintes valores numa
distribuio normal:
(a) - 00; (b) J.1; (c) J.1- a; (d) J.1 + a; (e) + 00.
Que aspecto deve ter a curva de probabilidades cumulativas de uma distribuio normal?
33
OUiZU1(10 as coisas ftH1Cionam normalmente
A discusso de critrios mais objetivos foge ao mbito deste livro. No captulo 5 apre-
sentaremos um teste alternativo, em que precisaremos decidir se determinado grfico sufi-
cientemente retilneo. Como teremos de tomar a deciso olhando a disposio dos pontos no
grfico, esse teste tambm encerra sua carga de subjetividade, e desse ponto de vista no
representa um avano em relao ao primeiro.
Felizmente existe uma boa razo para no nos preocuparmos demais com a ausncia (neste
livro) de um teste rigoroso para verificar se a distribuio normal: as tcnicas estatsticas
que apresentaremos so robustas em relao a desvios da normalidade. Mesmo que a popu-
lao de interesse no se distribua normalmente, as tcnicas podem ser usadas, porque con-
tinuam aproximadamente vlidas.
34
Essa robustez vem, em ltima anlise, do teorema do limite central, um dos teo-
remas fundamentais da estatstica, que diz essencialmente o seguinte:
Se a flutuao total numa certa varivel aleatria for o resultado da soma das
flutuaes de muitas variveis independentes e de importncia mais ou menos igual,
a sua distribuio tender para a normalidade, no importa qual seja a natureza das
distribuies das variveis individuais.
Suponhamos agora que sejam jogados cinco dados, ao invs de um, ou que o mesmo
dado seja jogado cinco vezes consecutivas, e a mdia dos cinco valores observados seja cal-
culada. Essa mdia uma funo de cinco variveis aleatrias, cada uma se distribuindo
independentemente das demais, j que o valor observado para um certo dado ou jogada no
afeta os valores observados para os outros. Alm disso, o nmero de pontos de cada dado
contribui com o mesmo peso para o resultado final - nenhuma das cinco observaes mais
importante que as outras quatro. As duas premissas do teorema do limite central, (1) flu-
tuaes independentes e (2) de igual importncia, so portanto satisfeitas, e o resultado apa-
rece na Figura 2.6(b): a distribuio das mdias j se parece com a distribuio normal.
Quando o nmero de observaes que compem o resultado final cresce, a tendncia para a
normalidade torna-se mais pronunciada, como mostra a distribuio da mdia dos pontos de
dez dados [Figura 2.6(c)].
35
Quando as coisas funcionam norma~mente
erros individuais. Como situaes desse tipo so muito comuns na prtica, podemos nos dar
por satisfeitos com a hiptese normal na maioria dos casos, e deixar para fazer testes mais
sofisticados quando existir muita evidncia em contrrio. Talvez o teorema do limite central
explique o entusiasmo de 8ir Francis Galton, o inventor da regresso linear: "Dificilmente
existir algo to impressionante para a imaginao como a admirvel forma da ordem
csmica expressa pela Lei da Freqncia do Erro (isto , a distribuio normal). Se os gregos
a tivessem conhecido, certamente a teriam personificado e endeusado."
I I
2
I
3 4
I I
5 6
I.
(a) Um dado
_ _ _ _......
",.........
2
11&_11.. .
11.......
3 4
11 . .....-...-_
5 6
o principal motivo para querermos um modelo a perspectiva de us-lo para fazer infe-
rncias sobre os parmetros populacionais. Esqueamos por um momento que foram pesados
140 caroos. Suponhamos que tenha sido pesado apenas um, escolhido aleatoriamente, e que
o peso encontrado tenha sido 0,1188 g, o primeiro valor da Tabela 2.2. O que esse valor nos
permite dizer a respeito do peso mdio populacional, )1?
Caso a distribuio populacional dos pesos dos caroos seja normal, sabemos que o
intervalo [J.1 - 1,960", )1 + 1,960"] deve conter 95% de todas as possveis observaes. Isto quer
36
dizer que a observao avulsa 0,1188 g tem 95% de probabilidade de ter sido feita dentro desse
intervalo. claro que tambm tem 5% de chances de ter cado fora dele. Aceitando o modelo
normal, podemos dizer ento que temos 95% de confiana na dupla desigualdade
Tomando a desigualdade da esquerda e somando 1,96cr aos dois lados, ficamos com
Para determinar numericamente os limites desse intervalo, s nos falta o valor do desvio
padro populacional. Supondo, por exemplo, que O" = 0,0363 g (que realmente, como
sabemos, apenas um valor amostraI), temos
A partir desses valores, e com todas as suposies feitas, podemos dizer que o nmero total
de caroos de feijo no pacote de um quilo deve estar entre 5.266 e 20.964. Mesmo assim,
ainda h 5% de probabilidade de estarmos enganados. No uma preciso muito animadora,
mas afinal o que que a gente esperava? Baseando nossa estimativa no peso de um solitrio
caroo, no poderamos mesmo querer chegar a concluses muito significativas. Logo mais
faremos estimativas a partir de mdias, e veremos que elas so bem mais precisas, o que por
sua vez natural, j que valores mdios so representaes 'mais adequadas da populao
como um todo.
37
Quando as coisas ftHlcjonam normahnente
Exerccio 2.11
Calcule, a partir do peso do segundo caroo na Tabela 2.2, um intervalo de 95% de confiana
para o nmero total de caroos em um quilo de feijo.
S que agora temos uma novidade. No podemos dizer que o peso e o volume de um
determinado caroo sejam independentes um do outro, porque existe uma relao entre eles,
38
que a densidade do caroo. Encontrando um caroo mais pesado que a mdia, em geral espe-
ramos que o seu volume tambm esteja acima do volume mdio, e vice-versa. Para um dado
caroo, portanto, os desvios dessas duas variveis em relao a suas respectivas mdias
tendem a ser do mesmo sinal algbrico. Dizemos "tendem" porque provvel que a densidade
no seja exatamente a mesma para todos os caroos. Se fosse, no falaramos de tendncia e
sim de certeza, e s teramos de medir uma das variveis para determinar univocamente o
valor da outra, por meio da relao linear volume = massa -:- densidade 5. Um grfico do volume
contra o peso seria ento uma reta de coeficiente angular igual ao inverso da densidade, como
na Figura 2.7(a). Na prtica, como h vrios motivos para a densidade variar de um caroo
para outro - o grau de desidratao, a ao das pragas, a carga gentica, e por a vai - devemos
esperar que o grfico seja mais parecido com o da Figura 2.7(b), onde a linearidade do conjunto de
pontos est perturbada por uma certa disperso.
(a)
cs>
0.13
o
o tP:
0.11 ...... :.~~.(9 ..
oeP
0.09 o'
,o'
o
C
0.07 ....
Cl
0.05
0.10 0.12 0.14 0.16 0.18 0.20 0.22 0.24 0.26 0.28
Peso
(b)
0.16
~
0.14
o o
o
0.12
: 00
0.10 o
.. 0: ..
o
0.08 .
o
... :0,,
0.06
0.10 0.12 0.14 0.16 0.18 0.20 0.22 0.24 0.26 0.28
Peso
Figura 2.7 (a) Relao perfeitamente linear entre o volume e o peso. (b) Relao
linear entre as duas variveis, acrescida de um erro aleatrio.
39
Podemos observar, na Figura 2.7(b), que altos valores dey tendem a ocorrer ao mesmo
tempo que altos valores de x, e vice-versa. Quando isso acontece, dizemos que as duas variveis
aleatrias apresentam uma certa covarincia, isto , uma tendncia de se desviarem de forma
parecida em relao s respectivas mdias (co-variar =variar junto). Podemos obter uma medida
numrica da covarincia a partir dos desvios (Xi -x) e (Yi -)7). Ou melhor, a partir de seus
produtos para cada elemento da amostra. Como, neste exemplo, os dois desvios tendem a ter o
mesmo sinal, seja ele positivo ou negativo, os produtos (Xi -x) (Yi - y) tendero a ser positivos, e
haver tantos mais produtos positivos quanto maior for a covarincia de X e y. O valor numrico
da covarincia por definio a mdia dos produtos dos desvios:
(2.8)
Como o valor da covarincia depende da escala usada para medir x e y, difcil us-
la como padro para comparar o grau de associao estatstica de diferentes pares de vari-
veis. Por exemplo, se ao invs de caroos de feijo estivssemos investigando laranjas, o
valor numrico da covarincia entre o peso e o volume, medido nas mesmas unidades, seria
muito maior. No entanto, continuaria significando a mesma coisa: uma densidade mais ou
menos constante.
Para eliminar esse problema, aplicamos um fator de escala, dividindo cada desvio
individual pelo desvio padro da varivel correspondente. Obtemos assim uma espcie de
covarincia normalizada, que chamada de ooeficiente de oorrela~o das duas variveis
(Equao 2.9). Por causa dessa definio, o coeficiente de correlao de qualquer par de va-
riveis aleatrias fica obrigatoriamente restrito ao intervalo [-1, + 1]. As correlaes de dife-
rentes pares de variveis passam a ser medidas na mesma escala (que adimensional, como
se pode deduzir da Equao 2.9) e podem ento ser comparadas diretamente.
40
Coeficiente de correlao cmwstral das variveis aleatrias x e y:
Exerccio 2.12
Sejam duas variveis y e x, obedecendo equao y = x 2 no intervalo [-a, +a]. (a) Qual o valor
do coeficiente de correlao entre y e x? (No faa contas; faa um grfico da funo e utilize
argumentos geomtricos). (b) Voc pode pensar em outras funes que dem o mesmo
resultado?
Variveis ligadas por uma relao linear perfeita tm coeficiente de correlao igual
a +1, se quando uma cresce a outra tambm cresce, ou igual a -1, se quando uma cresce a
outra diminui. Valores intermedirios representam relaes parcialmente lineares, e o valor
numrico do coeficiente de correlao muito usado em trabalhos cientficos como argu-
mento a favor da existncia de uma relao entre duas variveis. Todo cuidado pouco com
esses argumentos, porque os valores podem ser muito enganosos. s vezes uma simples
olhada em um grfico das variveis o bastante para descartar concluses apressadas,
apoiadas somente no valor numrico do coeficiente de correlao. Voltaremos a esse ponto no
Captulo 5, quando tratarmos da construo de modelos empricos. Por enquanto, como
exemplo - e tambm como advertncia - mostramos na Figura 2.8 os grficos de quatro
conjuntos de pares de valores das variveis X e Y, todos com exatamente o mesmo coeficiente
de correlao, 0,82 (Anscombe, 1973). Se fssemos julgar os dados apenas pelo valor de r,
concluiramos que a relao entre as variveis a mesma nos quatro casos, o que
evidentemente est muito longe de ser verdade.
41
Que concluses voc tiraria dos grficos da Figura 2.8?
(a) (b)
20 20
15 15
10 10
>- >- o o c
o <.1 C
o o
O O
O 10 15 20 O 10 15 20
X X
(c) (d)
20 20
15 15
>- 10 >- 10
o o o
o o o
o o c-
O O
O 10 15 20 O 10 15 20
X X
42
As mdias e desvios padro usados nas Equaes 2.8 e 2.9 so valores amostrais. s
vezes precisamos medir os desvios em relao a valores populacionais, e substituir x por /1 x e
y por /1y. Quando isso acontecer, devemos tambm usar N ao invs de N -1, porque as
Exerccio 2.13
Os valores abaixo so os volumes, em mililitros, dos caroos cujos pesos aparecem na primeira
linha da Tabela 2.2. Calcule a covarincia e o coeficiente de correlao entre os pesos e os
volumes desses sete caroos.
0,108 0,214 0,143 0,195 0,148 0,144 0,174
onde al e a2 so constantes, uma <nmbina~o linear de Xl e X2. Ela define uma nova
A partir de N pares de valores (Xl' X2) extrados das respectivas populaes podemos
calcular um conjunto de N valores de y. O valor mdio de y nesse conjunto ser
O somatrio feito sobre todos os N pares de valores; deixamos de incluir o ndice para
simplificar as expresses. Fazendo os somatrios individuais de Xl e X2 , temos
43
ou
Ou seja:
S _ -1- L (y -y-)2
2-
y N-1
Usando as Equaes 2.2 e 2.9 podemos reescrever esta ltima expresso como
Esses resultados podem ser facilmente estendidos ao caso geral de uma combinao
linear de p variveis,
Teremos ento
~ax
Y-= ~ ll'
(2.11)
i
44
S; = Laf
i
si
2
+ 2L LaiajSiSjr(Xi' Xj).
i j>i
(2.12)
O emprego de letras do alfabeto latino nas Equaes 2.11 e 2.12 revela que essas
expresses se referem a valores amostrais. Desenvolvendo o mesmo argumento a partir de
valores populacionais, obteremos expresses anlogas, dadas pelas Equaes 2.13 e 2.14.
Nelas, seguindo a conveno, utilizamos letras gregas.
(2.13)
I
a; =L ar ar + 2 L L ai aj ai aj P (Xi' X) I. (2.14)
.~~_.~_l~. ~j>~i~_~ __ J
y= LaiXi
i
2
(Pi, a i )= Mdia e varincia populacionais da varivel aleatria Xi
(2.15)
45
uuanao as coisas furu.:ionam normaimente
Vejamos agora um caso mais particular ainda: o valor mdio de uma amostra de N
elementos extrados aleatoriamente de uma certa populao. Por exemplo, o peso mdio de
um caroo, numa amostra de dez caroos escolhidos ao acaso em um quilo de feijo. Repe-
tindo um grande nmero de vezes essa amostragem, teremos um conjunto de pesos mdios.
Como ser a distribuio desses valores?
_ 1 1 1 1
X=-LXi =-Xl +-x2 + ... +-xN
N i N N N
Se a escolha dos elementos for rigorosamente aleatria no haver correlao entre as obser-
vaes, de modo que poderemos usar a Equao 2.15 para calcular a varincia. Alm disso,
como estamos supondo que as observaes so feitas sempre na mesma populao, todas elas
se distribuem individualmente com a mesma varincia populacional (J2. Portanto, subs-
2
tituindo na Equao 2.15 ai por l/N e (Ji por (J2 , podemos escrever, para a distribuio das
mdias amostrais:
(2.15a)
Para obter a mdia da distribuio das mdias amostrais x usamos a Equao 2.13,
substituindo ai por 1/N e Jii por Ji :
1 1
Ji x = L-
iN
J1 =-
N
Li J1 = -N1 N /1. = J1 . (2.13a)
Isto quer dizer que tanto as observaes individuais quanto as mdias amostrais se distri-
buem em torno mesma mdia Ji. A distribuio das mdias, como vimos, mais estreita. Seu
desvio padro apenas (J/ Ji.i. Se as amostras contm 100 observaes cada uma, por
exemplo, esperamos que o histograma de suas mdias tenha um dcimo da largura do his-
tograma dos valores individuais.
46
A Figura 2.9(b) mostra a distribuio dos pesos mdios em 140 amostras aleatrias
de 10 caroos de feijo, extradas da mesma populao que gerou o histograma da Figura
2.2, que aparece de novo na Figura 2.9(a). (A escala ampliada em relao Figura 2.2,
para que possa acomodar os dois histogramas). O estreitamento da distribuio dos pesos
mdios em relao distribuio dos pesos individuais evidente.
(a)
0.40
0.35
0.30
co 0.25
u
c
<O' 0.20
::::]
o-
O'
u: 0.15
0.10
0.05
0.00
0,115 0,155 0,195 0,235 0,275
peso individual (g)
(b)
0.40
0.35
0.30
co 0.25
u
c
<O' 0.20
::::]
o-
~
u.. 0.15
0.10
0.05
0.00
0,115 0,155 0,195 0,235 0,275
peso mdio (g)
Figura 2.9 (a) Distribuio dos pesos individuais de 140 caroos de feijo preto. (b)
Distribuio dos pesos mdios de 140 amostras de dez caroos de feijo preto.
um desvio padro de apenas 0,0363/ /lO = 0,0115 g. Os valores que correspondem distri-
buio das mdias na Figura 2.9(b) so 0,1929 g e 0,0128 g, respectivamente. A concordncia
47
muito boa, especialmente se lembrarmos que estes tambm so valores amostrais, e no
populacionais.
Exerccio 2.14
Qual a varincia da distribuio da diferena Xl - X2, onde Xl e X2 so duas variveis normais
padronizadas e totalmente correlacionadas positivamente, isto , de coeficiente de correlao
igual a I? E se o coeficiente de correlao fosse zero?
Na seo anterior chegamos a vrias concluses importantes sem ter de fazer nenhuma
restrio quanto forma da distribuio das observaes. S foi preciso admitir que as
amostras eram aleatrias. Nesta seo vamos impor mais uma condio. Vamos supor que
as amostras sero extradas de populaes normais. Como j vimos, esta uma hiptese
perfeitamente aceitvel em muitas situaes de interesse prtico, por causa do teorema do
limite central. Sob essas duas restries - amostras aleatrias tiradas de populaes
normais - os valores amostrais seguem certas distribuies especficas, que podem ser
usadas para se obter intervalos de confiana. Antes de mostrar como isso pode ser feito,
vamos enunciar, sem demonstrao, as concluses pertinentes. Se voc estiver interessado,
poder encontrar as demonstraes em algum texto de estatstica avanada, como Dudewicz
e Mishra (1985).
mas com varincia igual a a 2 / N. [Na seo anterior chegamos a uma concluso
parecida, mas no dissemos nada sobre a forma da distribuio.]
liberdade.
2
A varivel aleatria X 2 , definida por X 2 = (N -1)-;-, segue a distribuio qui-quadrado,
a
tambm com N-l graus de liberdade.
48
Distribuio de estimativas amostrais em populaes TWrmais:
(2.16)
(2.17)
2
XN-l (2.18)
Suponhamos que os pesos desses caroos sejam os dez primeiros valores da Tabela
2.2. Para essa amostra, j sabemos (se voc resolveu o Exerccio 2.6) que x = 0,1887 g e s =
0,0423 g. Como a mdia x se distribui normalmente (Equao 2.16), ao subtrair a mdia
X-J1 () (2.19)
ajJii =Z '" N 0, 1
Para um intervalo de 95% de confiana o valor de z 1,96, como vimos na Seo 2.3(b). Isso
significa que h 95 chances em 100 de que - 1,96 < z < 1,96, ou de que
49
UUianiOO as coisas flHlcionam normaimente
X-J.1
- 1,96 < cr/.JN < 1,96.
J1 < X + 1,96 lN e
(2.20)
Para definir numericamente os limites desse intervalo, precisamos do valor do desvio padro
populacional. Vamos admitir mais uma vez que o valor do desvio padro calculado para os
140 caroos uma aproximao aceitvel. Teremos ento a/.JN = 0,0363 / J1 = 0,0115 g.
Finalmente, lembrando que na nossa amostra eX = 0,1887 g,
ou
A partir desta expresso podemos dizer, com 95% de confiana,7 que o quilo de feijo deve
ter de 4.735 a 6.017 caroos. Lembrando que, a partir do peso de um s caroo (o primeiro
valor da Tabela 2.2), nossa estimativa ia de 5.266 a 20.964, vemos que o novo intervalo bem
melhor. Podemos torn-lo mais preciso ainda, se usarmos uma amostra mais numerosa.
_ (J _ (J
x-z-- < J.1 < x+z-- (2.21)
JN JN
Exerccio 2.15
Considere os 140 valores da Tabela 2.2 como uma nica amostra aleatria numa populao
normal. Admita que o desvio padro calculado a partir deles idntico ao valor popula-
cional. Responda agora: Com quantos gros se faz uma feijoada?
50
Nas determinaes de intervalos de confiana que fizemos at agora tivemos de su-
por que o valor do desvio padro populacional era conhecido. Apesar disso, s conhecamos
mesmo um valor amostraI, ainda que obtido a partir de uma amostra bastante grande. Vere-
mos agora nos livrar dessa restrio e obter intervalos de confiana sem precisar recorrer a
valores populacionais.
varivel aleatria (x - )1)/ s. Hoje em dia prefere-se incluir o fator /N, e falar da distri-
buio da varivel ~ ,expresso idntica que aparece na Equao 2.19, exceto pela
substituio do desvio padro populacional, 0", pelo desvio padro amostraI, s. Por causa
dessa mudana, a varivel no segue mais a distribuio normal padronizada, e sim a que
Student deduziu, e que rigorosamente vlida -sempre bom lembrar - para amostras
aleatrias retiradas de uma populao normal. Com ela podemos comparar os desvios
(x -)1) com um desvio padro obtido da prpria amostra, siJii , dispensando o valor popu-
lacional O"IJii . Veremos mais tarde que essa caracterstica da distribuio de Student
muito importante para a avaliao de modelos empricos.
o mesmo valor de N usado para calcular a mdia, e cuja raiz quadrada aparece no denomi-
nador da Equao 2.17.
51
A Tabela A.2, na pgina 393, contm os valores de t para algumas reas da cauda
direita na distribuio de Student. As reas aparecem na parte superior da tabela, em
negrito. A distribuio t tambm simtrica em torno da mdia zero, como a distribuio
normal padro, de modo que s precisamos de um lado da curva.
A recproca verdadeira. Quanto maior for a amostra, mais estreito ser o intervalo.
No limite, com um nmero infinito de graus de liberdade, a distribuio t termina
reduzindo-se distribuio normal padro. Voc pode confirmar esse fato conferindo os
valores que esto na ltima linha da Tabela A.2.
S
tN -1 .Jii < J1 < X + (2.22)
52
No nosso exemplo toda a informao vem de uma nica amostra, e portanto o valor
de N dentro da raiz quadrada o mesmo que aparece em t N - 1 . Como j dissemos, esses
Exerccio 2.16
Use os sete valores na ltima linha da Tabela 2.2 e determine a partir deles, com 99% de con-
fiana, com quantos gros se faz uma feijoada.
Exerccio 2.17
Refaa o Exerccio 2.15, usando a distribuio de Student. Admita que o nmero de graus de
liberdade seja 120, para obter valores de t na Tabela A.2. Compare seus resultados com os do
Exerccio 2.15.
Exerccio 2.18
Como voc pode relacionar os nmeros que esto na ltima linha da Tabela A.2 com os
valores da Tabela A.l?
princpio rapidamente e depois mais devagar, para os valores da distribuio normal padro.
medida que a amostra cresce, portanto, a diferena entre as duas distribuies vai
perdendo a importncia. Na prtica, s se costuma usar a distribuio t quando o nmero de
graus de liberdade na estimativa do desvio padro inferior a 30. Para amostras maiores, a
Equao 2.21 considerada satisfatria.
53
Quando as coisas funcionam normaimente
140, N, 95%
H
140, t, 95%
..-.;
10, N, 95%
1------1
10, t, 95%
7, t, 99%
1, N, 95%
1, N, 95%
Exerccio 2.19
Os dois intervalos de 95% de confiana para o peso mdio calculados a partir de um nico
caroo tm a mesma largura, como mostra a Figura 2.10. J os intervalos para o nmero de
caroos por quilo, obtidos a partir dos mesmos dados, tm larguras muito diferentes. Para o
caroo pesando 0,1188 g o intervalo de 95% de confiana vai de 5.266 a 20.964 caroos. Para o
de 0,2673 g os limites so 2.955 e 5.098, dando a impresso de que essa determinao mais
precisa do que a outra. Isso verdade? Por qu?
54
Partindo da Equao 2.18 e procedendo exatamente da mesma forma, podemos
determinar um intervalo de confiana para o valor da varincia populacional. Daremos um
exemplo com a nossa amostra de dez caroos. Os valores de X2 necessrios esto na Tabela
A.3 (p. 394), cuja leitura idntica da Tabela A.2, com a diferena de que a distribuio
qui-quadrado tem uma forma assimtrica, mais alongada para a direita. Por isso, teremos de
olhar em duas colunas para determinar os limites do intervalo.
bilidade de X2 estar entre esses dois limites, isto , de que 2,70 < X 2 < 19,0, ou, pela Equa-
o 2.18,
S2
2,70 N-1)-2 <19,0.
(1
S2 s2
(N _1)_<(12 N - 1 ) -
19,0 2,70
Substituindo finalmente N = 10 e s = 0,0423 g, temos a expresso 0,0008 g2 < (12 < 0,0060
g2, cuja interpretao semelhante dos outros intervalos que vimos. Devemos lembrar,
porm, que testes de hipteses envolvendo diretamente a varincia no so robustos em
relao a desvios da normalidade, e por isso precisam ser usados com muita cautela. Se for
possvel, melhor substitu-los por testes envolvendo mdias.
Exerccio 2.20
Calcule, a partir dos sete ltimos valores da Tabela 2.2, um intervalo de 99% de confiana
para o desvio padro do peso de um caroo de feijo.
55
{Juan'ClO as coisas funcionam norrnalrnente
Pode-se demonstrar que a razo (X;1 I v I)/(X;2 I V2) segue uma distribuio F com VI e v2
e da tirar
(2.23)
Podemos usar esta ltima expresso para testar hipteses sobre a relao entre varincias
populacionais. Em particular, para testar a possibilidade de que elas sejam idnticas, isto ,
que (ar I ai)= 1 . Para isso precisaremos da Tabela A.4 (p. 395-398), que apresenta os pon-
tos correspondentes a algumas reas de cauda direita na distribuio F. Esse assunto,
porm, fica para a seo seguinte.
Pelos vrios motivos que j discutimos, a distribuio normal descreve bastante bem um
grande nmero de processos reais, e isso nos permite us-la como modelo para resolver v-
rios problemas de interesse prtico. Nesta ltima seo apresentaremos algumas das
aplicaes mais comuns.
Suponha que estamos encarregados de decidir se o lote de vinagre que discutimos na Seo
2.1 est de acordo com o que a legislao exige, que 4% de cido actico. 8 Para isso, rea-
lizamos as trs primeiras titulaes da Tabela 2.1, cujos resultados so 3,91, 4,01 e 3,61%.
Dois desses valores esto abaixo do que deveriam, mas pode ser que isso tenha ocorrido
8Vamos admitir inicialmente, para fins de exemplo, que este o valor mdio exigido, e no o valor
mnimo. No Exerccio 2.21 essa restrio ser removida.
56
somente por causa das flutuaes naturais do processo de titulao, e que no haja nada de
errado com o lote.
Se a titulao no est afetada por erros grosseiros nem sistemticos, restam apenas
os erros aleatrios. Ento, de acordo com o teorema do limite central, os valores mdios de
um conjunto de titulaes feitas em um mesmo lote devem seguir a distribuio de Student.
A mdia das trs titulaes,
Substituindo s = 0,2082 %, que o desvio padro das trs titulaes, e t 2 = 4,303 (da Tabela
A.2, com 95% de confiana), temos
Fazemos ento mais cinco titulaes, e obtemos os cinco valores seguintes na Tabela
2.1. Agora temos oito resultados, com x = 3,818% e s = 0,1286%. Substituindo estes valores
na Equao 2.21, desta vez com N = 8 e t7 = 2,365, chegamos desigualdade
O intervalo ficou muito mais estreito, e deixou de incluir o valor de referncia. Podemos di-
zer ento que existe evidncia, no nvel de 95% de confiana, de que o teor mdio de cido
actico no lote examinado mesmo inferior a 4% (isto , podemos rejeitar a hiptese nula).
57
Na verdade, 4% o teor mnimo de cido actico exigido, e no o teor mdio, mas
adaptar os nossos clculos a esse fato simples. Fazemos o ponto situado trs desvios padro
abaixo da mdia, isto , o ponto acima do qual devem estar 99,87% das observaes, igual a
4%. Depois, s repetir o teste, tomando esse valor como a nova mdia. Admitindo-se que
(J == 0,15 %, que o desvio padro de todos os valores da Tabela 2.1, a nova mdia de
referncia seria 4 % + 3 x 0,15 % = 4,45 % . Se a mdia populacional for esta, em 99,85% das
Exerccio 2.21
Use a nova mdia de referncia para o teor de cido actico, 4,45%, e repita o teste com os trs
ltimos valores da Tabela 2.1.
Exerccio 2.22
Um qumico est testando um novo mtodo para determinar ferro. Fazendo quatro anlises
num padro cuja concentrao verdadeira 14,3%, ele obtm 13,7%, 14,0%, 13,9% e 14,1% de
ferro. Como voc avalia a exatido da nova metodologia, no nvel de 95% de confiana? Ser
que as quatro determinaes vm de uma distribuio com mdia 14,3%?
Continuando com a titulao, digamos que nosso objetivo seja obter uma estimativa
da concentrao com preciso de 0,1%. Quantas titulaes repetidas devemos fazer?
58
ou
N~ (~]2
lO,l%
.
Aqui temos um problema. O valor de s deve ser calculado a partir da amostra, e no entanto
no sabemos nem quantas titulaes devem ser feitas. Na prtica, felizmente, esse problema
no to grave quanto parece, porque as medies j realizadas ao longo do tempo podem
fornecer um valor ''histrico'' para s. o que normalmente acontece em procedimentos de
rotina, como controle de qualidade. No nosso exemplo, podemos usar o desvio padro de
todas as titulaes na Tabela 2.1, que s = 0,1509%, e escrever
N ~9,98 .
Para obter a preciso desejada, portanto, precisamos fazer pelo menos dez titulaes.
Quando temos uma estimativa do desvio padro obtida a partir de uma srie hist-
rica de extenso razovel, a diferena entre a distribuio t e a distribuio normal deixa de
ter importncia. Essa a situao mais comum em laboratrios de anlises, onde todo dia os
mesmos procedimentos so realizados, repetidas vezes. Para estimar o tamanho da amostra,
nesses casos, podemos usar a expresso
(2.24)
Exerccio 2.23
Um laboratrio de anlises faz determinaes com um desvio padro histrico de 0,5%. Um
cliente envia uma amostra, cuja concentrao ele quer saber com uma preciso de 0,2%. Use
59
a equao 2.24 para estimar quantas determinaes repetidas o analista precisar fazer para
dar a resposta desejada, com 95% de confiana.
Exerccio 2.24
Suponha que queremos determinar um intervalo de 95% de confiana para o peso de um
caroo de feijo, de tal maneira que a diferena entre os valores extremos do intervalo seja
um desvio padro amostraI. Quantos caroos devemos pesar?
Imagine uma indstria qumica de alguma complexidade como, por exemplo, uma fbrica de
polmeros. Os engenheiros encarregados de projet-la e constru-la tm de garantir que ela
ser capaz de produzir polmeros com as caractersticas desejadas pelos clientes. Para isto,
precisam considerar longamente todas as variveis - que evidentemente no so poucas - e
projetar a planta de modo a mant-las todas sob controle.
Voc adivinhou: uma distribuio normal, para observaes individuais, ou uma dis-
tribuio de Student, para mdias. 9 Quando o processo se acha controlado, sua variabilidade
devida apenas aos erros aleatrios, e portanto suas respostas devem seguir a distribuio
normal, ou outra distribuio relacionada com ela. Este o princpio bsico do controle de
qualidade. Mais uma vez, conseqncia do teorema do limite central.
9 A bem da verdade, se a varivel for contnua. Para outros tipos de varivel as distribuies
apropriadas so outras, que voc pode encontrar nos livros de controle de qualidade.
60
A Figura 2.11 mostra oitenta valores de viscosidade, na ordem em que foram obtidos, a
intervalos regulares durante o processo. As unidades so arbitrrias. Observe que os valores
comportam-se muito bem, distribuindo-se aleatoriamente em torno do valor mdio, 45, com
desvio padro de 1,67. Na Figura 2.12, que mostra o histograma desses valores, vemos que a
sua distribuio bem representada por uma distribuio normal. Essa situao ideal o
sonho de todo engenheiro de produo.
48
Q)
46
"'O
~
"'O
"00
o
u
(J) 44
:>
42
o 20 40 60 80
Amostra
25
/ ~\
20
(J)
Q)
tO
(,)tI
~
2:
15
I
/ \
V
Q)
\
(J)
.o
O
Q)
"'O 10
O
/
~
E
'::3
Z
/
'/ ~
lo-"
trole - so traados ponto a ponto, em tempo real, pelos prprios operadores da linha, e
61
servem como uma ferramenta para detectar problemas que possam estar perturbando o
processo. medida que cada ponto acrescentado, o grfico analisado. Qualquer padro
anmalo, que indique desvios da normalidade, um aviso de que os responsveis devem
tomar as providncias necessrias para fazer o processo voltar ao controle.
o grfico de controle mais comum idntico ao da Figura 2.13, com trs linhas
horizontais paralelas que definem as caractersticas do processo quando ele se realiza sem
problemas. A linha central corresponde mdia, que no nosso exemplo J.1 = 45. As outras
duas linhas esto situadas trs desvios padro acima e abaixo da mdia. A linha
correspondente a J.1 + 3a = 48 o limite superior de oontrole. A linha correspondente a
J.1 - 3a = 42 naturalmente ser o limite inferior de oontrole. Entre esses dois limites, como j
sabemos, devero cair 99,73% de todos os valores individuais observados, se tudo estiver
perfeitamente bem.
A Figura 2.13 mostra um grfico de controle com os limites superior e inferior, mas
com alguns conjuntos de pontos que representam duas das situaes anmalas mais comuns.
Assim que uma situao dessas se apresentar, os tcnicos devem intervir e tomar as me-
didas necessrias para controlar novamente o processo. Para isso tero de basear-se no
conhecimento tcnico do funcionamento da planta, bem como nas evidncias obtidas a partir
do grfico. Uma mudana de nvel, por exemplo, pode estar associada a uma mudana de
turno, e ser provocada por maneiras diferentes de operar o processo. Uma tendncia pode
significar deteriorao do equipamento, ou contaminao progressiva de um reagente ou
catalisador.
Tais regras variam de um autor para outro. Voc poder encontrar muitas outras na
bibliografia recomendada no final desta seo.
62
50
LSC
Tendncia
Mudana de nvel
48
Q) 46
"'O
ctS
"'O
'00
O
u
cn 44
:;
42
40
O 20 40 60 80
Amostra
Qualidade sempre definida pela satisfao do cliente. ele que decide quais as
caractersticas que o produto deve apresentar. Um fabricante de pneus, por exemplo, pode
dizer a um fabricante de borracha que s compra seu produto se ele tiver uma viscosidade de
45. Esse o valor nominal da especificao. No entanto, como no realista esperar que
todos os lotes apresentam exatamente esse valor, o fabricante de pneus se dispe a aceitar
uma variao na viscosidade de, digamos, 3 unidades para mais ou para menos. Com esses
valores so definidos os limites de tolerncia da especificao: viscosidade de 42, no mnimo,
e de 48, no mximo.
Uma vez que os limites de tolerncia tenham sido acertados, o fabricante de pneus
estabelece uma inspeo por amostragem dos lotes de borracha que vo sendo recebidos. Os
lotes que carem fora da faixa de tolerncia da viscosidade, 42 - 48, so rejeitados e
devolvidos ao fornecedor. Este, claro, tem o maior interesse em desenvolver um processo
eficiente e estvel, capaz de satisfazer s exigncias do cliente. Acontece que ter o processo
sob controle significa apenas que ele est operando de forma consistente, no que o produto
ir satisfazer obrigatoriamente s especificaes. preciso comparar tambm o comporta-
mento do processo, isto , os parmetros de controle, com os parmetros de especificao. S
assim teremos uma medida da capacidade do processo.
Um dos ndices de capacidade mais usados o Cpk, definido como a menor das duas
fraes
63
Quando as coisas funcionam normaiment~~
onde LSE e LIE so os limites superior e inferior de especificao, e J.1 e a so estimativas con-
fiveis da mdia e do desvio padro do processo. Por exemplo, se o cliente deseja uma borracha
com viscosidade entre 42 e 48, e o processo est operando com J.1' = 46 e a = 1,6, ento
J1-LIE = 46 - 42 =0,83 .
3a 3xl,6
Nesse caso teremos Cpk = 0,42, que um valor muito ruim. Um valor, alis, que nenhum
cliente aceitaria. Algumas das empresas mais avanadas do mundo, como a Motorola e a
General Electric, j esto estabelecendo Cpk igual a 2 como o padro mnimo de qualidade
para seus prprios processos e tambm para os seus fornecedores (Bhote, 1996). Para
atender a essa exigncia, preciso manter o processo perfeitamente centrado no valor
nominal de especificao, e operando com um desvio padro no superior a 1/12 da faixa de
tolerncia. Nessa situao, somente dois valores por bilho cairo fora dos limites de tole-
rncia. essa meta que est na base do movimento de gerenciamento da qualidade conhe-
cido como Seis Sigma 10 (Breyfogle, 1999).
o que apresentamos aqui s uma pequena poro, e mesmo assim muito simpli-
ficada, do extenso conjunto de conceitos e tcnicas que constituem o controle estatstico de
processos. No nossa inteno esgotar o assunto, apenas discuti-lo um pouco, como
aplicao da distribuio normal. Um tratamento aprofundado pode ser encontrado em um
dos muitos livros inteiramente dedicados qualidade ou ao controle estatstico de processos.
Para saber mais sobre essas importantes ferramentas voc pode consultar, por exemplo,
Oakland e Followell (1990), Montgomery (1997) ou Vieira (1999).
Como comparar duas mdias. Dois qumicos, S. Arrhenius e J. Berzelius, foram en-
carregados de analisar lotes de vinagre enviados por cinco fabricantes diferentes. Cada um
analisou uma amostra de cada lote, e obteve os resultados que aparecem na Tabela 2.4, onde
vemos que a mdia e o desvio padro das determinaes feitas por Berzelius so menores do
que os valores obtidos por Arrhenius. Para avaliar o desempenho de seus dois funcionrios, o
chefe do laboratrio, A. Lavoisier, resolve fazer uma comparao estatstica desses resulta-
64
dos. Ser que as variaes significam que existe uma diferena sistemtica entre a tcnica
de um analista e a do outro, ou ser que apareceram somente porque eles analisaram
amostras distintas?
V~(-xA -XB
-) = 8 2[1--+--1) .
NA NB
Tabela 2.4 Comparao dos resultados obtidos por dois qumicos titulando amostras de
vinagre de cinco diferentes procedncias. Teores de cido actico em %.
Graus de liberdade 4 4 4
65
UU1an:oo as coisas funcionam norma~mente
(2.25)
(2.26)
( N A-I) s~ + (N B1) s~
-
(2.27)
(NA-I) + (N B -1)
Equao 2.27 s = 0,5822 %. A estimativa do desvio padro da diferena entre as mdias fica
sendo ento
s ~ N1 + 1 = 0,5822%
NB
x~~+~
5 5
= 0,3682%.
A
= 0,114% 0,849%
= [ - 0,735%, 0,963 %]
Concluso: nesse nvel de confiana, no podemos dizer que as mdias dos resultados obtidos
por Arrhenius e Berzelius sejam realmente diferentes.
66
Este teste provavelmente o mais usado de todos os testes estatsticos. muito
valioso quando a diferena sistemtica entre as amostras causada por um nico fator, e o
teste apropriado para comparar duas mdias independentes. Arrhenius e Berzelius, porm,
fizeram as determinaes em amostras de cinco diferentes fabricantes. natural esperar
que essas amostras apresentem diferentes teores de cido actico, e que amostras vindas de
um mesmo fabricante paream mais umas com as outras do que com uma amostra de um
fabricante diferente. S por isso o resultado das anlises j dever variar, mascarando uma
possvel diferena de tcnica analtica. Como estamos interessados na diferena entre os
analistas, precisamos de um mtodo que permita isolar a influncia da variao entre
fabricantes.
Exerccio 2.25
O teor de a-Pb02 numa placa de bateria de automvel foi determinado por espectroscopia de
raios-X. Foram registrados vrios espectros repetidos, fazendo-se (ou no) correo da linha
de base. Os resultados so mostrados abaixo. Existe diferena sistemtica entre os dois modos
de analisar a placa?
% a-Pb02
Espectro
Com correo Sem correo
1 16,2 19,0
2 16,7 19,8
3 17,3 18,5
67
VU:dHUV as coisas fnc~onam norma~mente
Para se obter os dados da Tabela 2.4, duas amostras foram retiradas de cada lote,
sendo uma dada a Arrhenius e a outra a Berzelius. Cada linha da tabela refere-se portanto a
duas amostras de um mesmo fabricante. Se os resultados das anlises diferirem de forma
sistemtica dentro das linhas, s pode ser por causa de uma diferena na maneira de
realizar a anlise qumica.
-5:L
JN -- 0,0814%
J5 -,
- 0364 01
-10
Esse valor cerca de dez vezes menor que o desvio padro da diferena entre as mdias
globais de Arrhenius e Berzelius, justamente porque a variao devida aos fabricantes foi
excluda do teste.
(2.28)
Um modo alternativo de fazer este teste usar os valores observados nas amostras
para estimar o ponto da distribuio t, e compar-lo com o valor da tabela (na hiptese de
que ~ = 0%). Fazendo desse jeito, teremos
68
t ::= IJ -~ 1= 0,114%-0% ::= 313 (2.29)
Sd/JN O,0814/JS ' .
Como este valor superior a t 4 = 2,776 , conclumos que as chances de ele ter ocorrido por
acaso, sem que houvesse diferena de tcnica analtica, so inferiores a 2,5%, e rejeitamos a
hiptese nula, isto , a hiptese de que ~ = O%. Esse procedimento - o teste de hipteses -
o preferido pela maioria dos estatsticos, e pode ser estendido s outras distribuies. Na
seo seguinte mostramos como testar a hiptese de igualdade de varincias. um teste que
iremos usar, mais tarde, para analisar a qualidade do ajuste de um modelo emprico.
Para a diferena entre duas mdias, por exemplo, o erro padro s~ NA1 + 1
NB
(Equao
2.26).
Exerccio 2.26
Como seria o teste de hipteses para a comparao de uma mdia com um valor de referncia?
Exerccio 2.27
Refaa o Exerccio 2.25, testando a hiptese nula, em vez de calcular o intervalo de confiana.
Para quanto preciso mudar o nvel de confiana, para que sua concluso se modifique?
Como comparar duas varincias. Para comparar as mdias de duas amostras inde-
pendentes, combinamos as duas varincias amostrais numa nica estimativa conjunta.
Como a estimativa conjunta tem um nmero de graus de liberdade maior, o intervalo de con-
fiana fica mais estreito e o teste passa a ser mais sensvel, isto , torna-se capaz de detectar
diferenas sistemticas menores. Evidentemente s faz sentido combinar varincias amos-
trais se elas forem estimativas da mesma varincia populacional. Para que a estimativa
conjunta se justifique, precisamos testar a hiptese nula de que s~ e s~ so estimativas de
69
OUianiOO as coisas funcionam normahnente
varincias populacionais idnticas, 0-1 = (j~ Isto pode ser feito atravs de um teste F, que
se baseia na Equao 2.23. Com varincias populacionais iguais, a Equao 2.23 torna-se
Agora s precisamos comparar a razo das duas varincias amostrais com o valor tabelado
para a distribuio F, com os graus de liberdade apropriados. Usamos a Tabela A.4 e vemos
que, com 95% de confiana, F 4 ,4 = 6,39 . A razo entre as varincias ter de superar esse
valor, para que a hiptese nula seja rejeitada e a estimativa conjunta no possa ser feita.
Como temos no nosso exemplo
Note que o menor valor da Tabela A.4 1,000. Isto quer dizer que no teste F o
numerador sempre a maior das duas varincias. Um critrio prtico muito usado, que
dispensa a Tabela A.4, diz que podemos combinar varincias para obter uma estimativa
conjunta sempre que a razo entre a maior varincia e a menor no for superior a quatro.
70
2A Aplicaes
Um dos autores deste livro nunca quis aprender a dirigir. 1 Como mora a uns 12 km do tra-
balho, costuma usar nibus para deslocar-se at l. O percurso total leva pouco mais de uma
hora. Quando o nibus chega nas imediaes da universidade, passa debaixo de uma pas-
sarela de travessia de pedestres sobre a movimentada BR-101. Da at o terminal, do outro
lado do campus, existem 16 pontos de parada. Nosso investigador costuma utilizar, para
chegar at o departamento onde trabalha, um dos trs percursos descritos a seguir.
A. Saltar do nibus no primeiro ponto aps a passarela, us-la para cruzar a estrada, e
percorrer um dos lados externos do campus at a entrada que lhe dar acesso ao
departamento. Este o caminho mais deserto e mais sujeito ao sol e, se for o caso,
chuva.
B. Saltar no terceiro ponto aps a passarela, cruzar a BR-101 pelas pistas de rodagem,
e caminhar numa diagonal atravs do campus. Apesar do risco de atropelamento,
este caminho usado por muita gente e tem vrios trechos de sombra.
Um dos tempos da tabela (ensaio 9) foi excludo da anlise, logo de sada. Nesse dia
caiu uma chuva fortssima, que praticamente paralisou a cidade. O pesquisador levou mais
de quatro horas para ir de casa para o trabalho. O valor registrado na tabela, 56,3 minutos
(contados a partir da passarela junto da universidade), evidentemente no tpico dos tem-
1 BBN, claro. REB americano, e mais fcil um camelo passar pelo fundo de uma agulha do que
um americano viver sem carro. ISS uma jovem profissional me de famlia, e precisa do carro para
conciliar seus afazeres na universidade com a administrao domstica.
71
pos do caminho C. Ele o que se chama, sem qualquer conotao pejorativa, de um ponto
anmalo. A anomalia aqui significa apenas que o valor no pode ser considerado como vindo
da mesma distribuio que produziu os demais pontos, e portanto no faz sentido calcular
nenhuma estimativa com a sua participao. Existem muitos testes para detectar ano-
malias. Adiante falaremos de dois deles.
72
rena de tempo entre os trs percursos. S depois que tentaramos descobrir quais so as
origens e os valores das diferenas. Os autores deste livro, porm, so partidrios do que
poderamos chamar de Escola Yogi Berra de Anlise de Dados. Gostamos muito de outra
frase atribuda a Yogi, que diz assim: "s olhando, voc j observa muita coisa". Quanto
anlise da varincia, trataremos dela no Captulo 5, em outro contexto.
25 r - - - - - - y o - - - - - r - - - - y - - - - - r - - - - , . . . . . - - - - . , . - - - - ,
lo o
20
oi
o
!~ o
.S 15
!
~ r-" . . .
~ o Y Q 9 6u 009 !
1 o ---l----r--r--l --..--l---r---
5L..-------'----'----'----...I.-.--A...-----""---"
o 5 10 15 20 25 30 35
Ensaio
A Figura 2A.2 apresenta os mesmo dados da Figura 2A.l, com uma diferena. Eles
agora esto estratificados, isto , agrupados de acordo com o percurso, o que, alis, uma
das sete ferramentas bsicas da qualidade, como j tivemos oportunidade de mencionar.
No precisamos de estatstica nenhuma para perceber imediatamente que o caminho C o
mais demorado e o que leva menos tempo o caminho B, seguido de perto pelo A. Tambm
fica evidente que a disperso dos valores bem maior no caminho C do que nos outros dois. 2
Uma pessoa que no tenha por representaes grficas o mesmo entusiasmo que ns
poderia argumentar que as mesmas concluses poderiam ser obtidas examinando-se os
valores numricos na prpria tabela, principalmente depois que eles fossem ordenados de
acordo com o percurso. At pode ser verdade, mas daria mais trabalho, e dificilmente a dife-
rena nas disperses ficaria to clara. Alm do mais, a crescente automao dos instru-
mentos est tornando to fcil produzir tantos dados em to pouco tempo que procedimentos
grficos para filtrar ou concentrar informao esto deixando de ser apenas uma conve-
nincia para tornar-se uma necessidade.
73
Quando as co~sas funcionarn norrna~mente
Percurso
o desvio padro 0,5464 uma estimativa agregada, com 17 graus de liberdade, calculada
atravs da Equao 2.27. Como o intervalo (de 95% de confiana) no inclui o valor zero,
podemos concluir que o percurso B leva mesmo menos tempo - entre 1,83 e 2,97 minutos -
que o percurso A.
74
escolha, o caminho A, quase no tem proteo contra as intempries. Alm disto, a diferena
mdia de tempo entre ele e o caminho C de uns sete minutos apenas. Resultado: a menos
que esteja muito apressado, BBN continua preferindo usar o caminho C, que de longe o
mais confortvel.
Tabela 2A.2 - Estatstica descritiva dos tempos da Tabela 2A.1, excluindo-se o ensaio 9.
Vrios outros fatos podem ser percebidos examinado-se mais atentamente os dados
do experimento. Um que salta vista a extraordinria flexibilidade dos horrios do pes-
quisador. Consideremos, porm, a Figura 2A.3, onde os horrios de sada de casa so mos-
trados em funo dos dias da semana. s teras e quintas o horrio nunca passa das oito da
manh. Voc pode desconfiar de alguma explicao para esse fato?
17:00 o
15: oo----------r------------l-------c;----t-------------r-----------
------8----1--------------1-----~----1-------1---~----
9:00
7:00
75
Quando as coisas funcionam norma~mente
17:00 o
I
15:00 o
o
1~ 11 :30
:~
~
.----8--+----.-----I--.-----1-.----1--.--i-----~--
9:00
7:00
A B c
Percurso
Voltemos agora ao valor aparentemente anmalo. Muitos testes para detectar ano-
malias j foram propostos. Um dos mais usados na qumica o teste Q de Dixon, que tam-
bm admite a hiptese de normalidade da distribuio dos valores. Na verdade, existem v-
rios testes de Dixon, todos baseados em comparaes de diferenas entre o valor suspeito e
os demais valores da amostra. Voc poder obter mais informaes sobre esses testes em
Skoog e West (1996), e em Rorabacher (1991). Aqui vamos nos limitar a responder seguin-
te pergunta: devemos considerar o tempo de 56,3 minutos obtido no ensaio nmero 9 como
um elemento vindo da mesma distribuio que produziu os outros tempos registrados para o
caminho C?
Para fazer o teste de Dixon apropriado a esta questo, devemos comear calculando
a menor e a maior das diferenas entre o elemento suspeito e os demais valores do conjunto.
Depois fazemos a razo entre a menor diferena e a maior, e comparamos o resultado com
um valor de Q crtico tabelado, que depende do nvel de confiana desejado e do nmero total
de elementos na amostra. Se a razo calculada for superior ao valor da tabela, ento pde-
mos considerar o valor suspeito como uma anomalia. No nosso exemplo, como s existe um
valor suspeito (o tempo de 56,3 minutos verificado no ensaio 9), usaremos os valores tabela-
dos para o teste de uma cauda. Como os valores extremos dos outros doze tempos do cami-
nho C so 16,1 e 22,9 minutos (Tabela 2A.2), podemos escrever:
76
Razo = 33,4 = 0,831 .
40,2
A razo calculada supera, e muito, os valores tabelados para o teste de Dixon. Esse
resultado mostra, como j desconfivamos, que o ensaio nmero 9 realmente diferente dos
outros. Na verdade, j sabamos que a concluso teria de ser essa, porque as condies
atmosfricas nesse dia eram completamente atpicas.
Outro teste de anomalias muito popular o teste de Gmbbs, que alis o teste reco-
mendado pela International Organization for Standardization (a famosa ISO, sigla que as em-
presas adoram colocar em seus anncios publicitrios). O teste de Grubbs tambm admite a
distribuio normal e compara a distncia, medida em desvios padro, do valor suspeito em
relao mdia do conjunto de valores. (O valor suspeito includo no clculo da mdia e do
desvio padro). Se essa distncia for maior que um certo limite crtico tabelado, o valor sus-
peito considerado anmalo. Usando todos os treze tempos obtidos no caminho C, temos
O estudo das anomalias um assunto vasto e complexo. Barnett e Lewis (1984), por
exemplo, discutem 47 equaes diferentes sugeridas com essa finalidade. O ideal seria p-
dermos repetir a observao suspeita, para verificar se ela mesmo vlida. Como nem sem-
pre isso vivel, cada vez maior o interesse dos pesquisadores pelo uso de testes no para-
mtricos, que so menos sensveis a eventuais anomalias.
Para finalizar, uma questo para voc meditar: ser que d para perceber alguma
peculiaridade nos valores numricos dos horrios de sada registrados na Tabela 2A.1?
77
medicamentos. Um medicamento genrico uma formulao que, aps o trmino da validade
da patente ou da sua renncia, contm o mesmo princpio ativo, na mesma dose e forma far-
macutica de um remdio de referncia, administrado pela mesma via e tem a msma in-
dicao teraputica. importante, para a sade da populao, investigar se existe bioequi-
valncia entre um medicamento genrico e seu anlogo fabricado sob o privilgio da marca.
Uma das medidas comumente usadas para se testar a bioequivalncia a rea sob a curva
que descreve a variao, em funo do tempo, da concentrao do princpio ativo no sangue.
78
Numa investigao de bioequivalncia envolvendo 21 voluntrios, foi administrado a
cada um deles um medicamento genrico (A) em uma etapa, e o medicamento de referncia
(B), seu presumido equivalente, em outra etapa (Cavalcante, 1999). A ordem de administra-
o dos medicamentos foi aleatria, e nem os indivduos testados nem os pesquisadores que
forneciam os remdios sabiam qual das duas formulaes estava sendo administrada num
dado momento. Isto conhecido como um teste em duplo rego (do ingls double-blind). Os
valores da rea sob a curva determinados no experimento so reproduzidos na Tabela 2A.3.
evidente que o intervalo incluir o valor zero, e que podemos considerar os dois remdios como
bioequivalentes, pelo menos do ponto de vista da rea sob a curva. Existe um ponto, porm, que
merece um comentrio. Quando tratamos os dados de Arrhenius e Berzelius, vimos que o
intervalo da comparao emparelhada era bem mais reduzido, porque eliminvamos a variao
causada pela procedncia da amostra. No presente exemplo, o comportamento dos dados outro.
O desvio padro das diferenas muito semelhante aos desvios padro das mdias dos dois
tratamentos. A Figura 2A.5 nos permite visualizar ao mesmo tempo a mudana dos valores
mdios e a semelhana das disperses. Tambm podemos ver que os pontos parecem desviar-se
um pouco de uma distribuio normal, mas isto no deve ser motivo de muita preocupao
porque, como j dissemos, o teste t bastante robusto em relao a tais desvios.
18000r---------r------r------~-----r--,
a-t_ : .....
, i
ri !
[]
-o- A
--13-- B
-6000
o 10 20
........ DIF
Voluntrio
79
2A.3 Mais feijes?
A resposta, mais uma vez, est num teste t, idntico ao da comparao dos tempos
no experimento rodovirio, mas vamos aproveitar para fazer um pouco diferente, e testar a
hiptese de que os dois pesos mdios so idnticos, para ver se podemos rejeit-la. Come-
amos adaptando a Equao 2.25, que vimos na Seo 2.7(d), hiptese nula de igualdade
das mdias. Escrevemos portanto
Substituindo os valores apropriados e usando como desvio padro o valor obtido a partir da
combinao das varincias das duas amostras, temos
A (0,27357 - 0,21943)-
t = ---------
0,05414 9429.
0,0099456 ~ ii
+
0,0057421 '
80
Capitu~o 2,
o peso mdio dos seis caroos de feijo roxinho, 0,21943 g, parecido com o peso m-
dio da amostra de 140 caroos de feijo preto que ns discutimos extensivamente neste
captulo (0,2024 g). evidente que no podemos tratar um pacote de feijo preto e um
pacote de feijo roxinho como pertencentes mesma populao, mas ser que no
poderamos considerar que as duas populaes podem ser descritas pelos mesmos
parmetros?
si = (0,0363)2 = 38,18 .
s~ (0,005875)2
(fazendo-se uma pequena aproximao, j que a tabela no tem nenhum dado para 139
graus de liberdade). Como o valor calculado para a razo das varincias muito maior, no
podemos supor que as duas populaes tenham a mesma varincia. Isto implica, por sua
vez, que no temos o direito de combinar os dois valores das varincias amostrais para obter
uma estimativa agregada da mesma forma que vnhamos fazendo e ento partir para a
comparao das duas mdias. No existe um teste t exato para este caso, mas podemos usar
um procedimento aproximado, que uma modificao do teste que j usamos vrias vezes
(veja por exemplo Montgomery e Runger, 1999, Captulo 9). A estimativa necessria para o
teste agora dada por
i* = --;::::X=A=-=X=B=-
v 2 2
_S_A_ + _s_B_
NA NB
Este resultado deve ser comparado com o valor da distribuio t com o nmero de graus de
liberdade total, N A + N B - 2 , no nvel de confiana desejado. Ele superior at mesmo ao
valor da Tabela A.2 com 99,95% de confiana, t 120 = 3,373 (estamos sendo conservadores em
relao ao nmero de graus de liberdade). Concluso: estamos diante de uma forte evidncia
de que os pesos mdios dos dois tipos de feijo tambm so diferentes.
81
Quando as co~sas funcionam normaimente
~--~--~------~---~-----
Agar-agar, um gel preparado a partir das paredes celulares de vrias algas vermelhas,
usado como meio de cultura em laboratrios e tambm como espessante, estabilizante ou
adesivo nas indstrias de alimentos, de cosmticos e de frmacos. Geyer et aI (1990) estu-
daram como o teor de agar-agar extrado da alga Pterocladia capillacea (Rhodophyceae) va-
riava com a localidade onde as amostras eram colhidas, na costa prxima a Arraial do Cabo,
no Estado do Rio de Janeiro. A Tabela 2A.5 contm resultados obtidos em dois locais, um
com pouca atividade urbana mas com atividade industrial (A), e o outro com muita atividade
urbana, mas sem indstrias (B). Ser que essa diferena de ambiente altera o teor de agar-
agar extrado?
Tabela 2A.S - Teor de agar-agar de algas marinhas recolhidas em dois locais diferentes.
Primeiro vamos ver se podemos combinar as varincias da forma tradicional. Usando os des-
vios padro da tabela, temos
s~ = (5,4948
12 = 1,254 .
sA 4,9077 )
Como no nvel de 95% de confiana temos F S ,9 = 3,23, conclumos que podemos fazer a
estimativa agregada da varincia, que nos dar uma estimativa do desvio padro de 5,1923,
com 17 graus de liberdade. Em seguida, usamos a Equao 2.26 para obter um intervalo de
confiana para a diferena entre os dois teores mdios de agar-agar:
=-3,918 5,034.
evidente que o intervalo incluir o valor zero, e portanto no temos evidncia, nesse nvel
de confiana, de que a mudana no tipo de atividade - urbana ou industrial - altere o teor
de agar-agar das algas colhidas nos dois locais.
82
3
Como variar tudo ao mesmo tempo
Um dos problemas mais comuns, para quem faz experimentos, determinar a influncia de
uma ou mais variveis sobre uma outra varivel de interesse. Por exemplo, nosso velho
amigo da titulao, ao estudar uma certa reao qumica, pode querer saber como o
rendimento seria afetado se ele, digamos, variasse a temperatura ou usasse um catalisador
diferente. No linguajar estatstico, dizemos que ele est interessado em descobrir como a
resposta (o rendimento da reao) depende dos fatores temperatura e catalisador. Po-
demos abordar esse problema como um caso particular da situao mostrada esquematica-
mente na Figura 3.1. Um certo nmero de fatores, Fl, F2, ..., Fk, atuando sobre o sistema em
estudo, produz as respostas Rl, R2, ..., Rj. O sistema atua como uma funo - desconhecida,
em princpio, seno no precisaramos de experimentos - que opera sobre as variveis de
entrada (os fatores) e produz como sada as respostas observadas. O objetivo da pessoa que
realiza os experimentos descobrir essa funo, ou pelo menos obter uma aproximao
satisfatria para ela. Com esse conhecimento, ela poder entender melhor a natureza da
reao em estudo, e assim escolher as melhores condies de operao do sistema.
83
Como variar tudo ao mesmo
Figura 3.1 Um sistema pode ser representado por uma funo (em princpio
desconhecida) ligando os fatores (variveis de entrada) s respostas (variveis
de sada).
Tendo identificado todos os fatores e respostas, nosso prximo passo definir, com o
mximo de clareza, o objetivo que pretendemos alcanar com os experimentos, para que
ento possamos escolher o planejamento mais apropriado. Por exemplo, nosso qumico pode
estar s querendo saber se trocar o catalisador por um mais barato no vai diminuir o ren-
dimento da reao. Ou ento, pode querer descobrir que temperatura deve ser usada para se
obter o rendimento mximo. Ou ainda, at quando ele pode variar os fatores sem alterar o
rendimento ou a qualidade do produto final, e assim por diante. O planejamento dos experi-
mentos, isto , a especificao detalhada de todas as operaes experimentais que devem ser
realizadas, vai depender do objetivo particular que ele quiser atingir. Objetivos diferentes
precisaro de planejamentos diferentes.
84
Por outro lado, se estivermos considerando um nmero de fatores relativamente
grande, possvel que alguns deles no tenham influncia significativa sobre a resposta.
Nesse caso, um planejamento completo seria um desperdcio. O melhor seria fazer primeiro
uma triagem, para decidir quais so os fatores que merecem um estudo mais aprofundado.
Para isso poderamos usar um planejamento fatorial incompleto, como o fatorial fraeionrio,
que discutiremos no prximo captulo.
Exerccio 3.1
Pense num experimento, de preferncia numa rea de seu interesse, cuja resposta seja
quantitativa. Que fatores voc gostaria de examinar, para determinar a possvel influncia
deles sobre a resposta? Que fatores poderiam atuar como confundidores? Que fatores
poderiam contribuir para o rudo - isto, , a flutuao aleatria - nas respostas?
Para estudar o efeito de qualquer fator sobre uma dada resposta, precisamos faz-lo
variar de nvel (manipul-lo, no ?), e observar o resultado que essa variao produz sobre
a resposta. Como, para isso, precisamos ter o fator em pelo menos dois nveis diferentes,
podemos concluir que o planejamento mais simples de todos aquele em que todos os fatores
so estudados em apenas dois nveis.
85
Como vadartuo ao mesmo
1 40 A 57 61 59
2 60 A 92 88 90
3 40 B 55 53 54
4 60 B 66 70 68
Exerccio 3.2
Alm da temperatura e do catalisador, nos nveis que acabamos de citar, nosso qumico deseja
estudar ao mesmo tempo, por meio de um planejamento fatorial, o efeito de trs valores da
presso: 1, 5 e 10 atm. Quantos ensaios ele ter de realizar, no total?
86
3.1(a) Clculo dos efeitos
De acordo com a Tabela 3.1, quando usamos o catalisador A e elevamos a temperatura de 40C
para 60C (ensaios 1 e 2), o rendimento mdio passa de 59% para 90%. Ocorre portanto um
aumento de 90 - 59 = 31%. Quando o catalisador do tipo B (ensaios 3 e 4), o rendimento sobe
apenas 68 - 54 = 14%. Isso mostra que o efeito da temperatura, ou seja, o que acontece com o
rendimento da reao quando elevamos a temperatura de 40C para 60C, depende do nvel em
que o catalisador est. O efeito do catalisador, por sua vez, tambm depende do nvel da
temperatura. A 40C (ensaios 1 e 3) a mudana de catalisador diminui o rendimento mdio em
5%. A 60C (ensaios 2 e 4), a reduo passa a ser de 22%. Quando o efeito de uma varivel
depende do nvel de outra, como neste caso, dizemos que as duas variveis interagem, e
podemos calcular o valor do efeito de interao entre elas, como vremos em breve.
(90-59)
= -:.....-_ _ + (68-54)
...:..-----:.-_-~
(31) + (14)
=-~-~-.;...
= 22,5 %.
Este valor indica que o rendimento da reao sobe 22,5% , em mdia, quando a tem-
peratura passa de seu nvel inferior (40C) para o seu nvel superior (60C). Esta concluso,
porm, est incompleta. Como acabamos de ver, a temperatura e o catalisador interagem, e
no devemos falar do efeito da temperatura sem dizer algo sobre o tipo de catalisador. Pre-
cisamos, na verdade, interpretar os efeitos dos dois fatores conjuntamente, para no deixar
dvidas sobre a interao que existe entre eles. Voltaremos a este ponto na Seo 3.1(d).
87
Como variar tudo ao rnesmo
A Equao 3.1 pode ser reescrita como a diferena entre duas mdias:
(3.1a)
ra, vemos que o efeito principal T a diferena entre a resposta mdia no nvel superior e a
resposta mdia no nvel inferior desse fator:
[ !
i !
i
1
T =y+ -y_ i
i'
(3.2)
1
L~~_~_.............J
I
Esta expresso vale para qualquer efeito principal num planejamento fatorial completo de
dois nveis e pode ser considerada como uma definio alternativa de efeito principal.
(3.3)
= -13,5 %.
88
14-31
TxC = Te = =- 8,5 %.
2
Note que fazemos a diferena subtraindo o valor do efeito T correspondente ao nvel inferior
do catalisador (que o tipo A, pela nossa conveno de sinais) do valor correspondente ao n-
vel superior (tipo B), numa ordem anloga da Equao 3.2. Identificando as respostas de a-
cordo com os ensaios em que foram obtidas, podemos escrever
(3.4)
As Equaes 3.1, 3.3 e 3.4 mostram que para calcular qualquer efeito usamos todas as res-
postas observadas. Cada efeito a diferena de duas mdias. Metade das observaes contri-
bui para uma das mdias, e a metade restante aparece na outra mdia. Esta uma impor-
tante caracterstica dos planejamentos fatoriais de dois nveis. As respostas obtidas nunca fi-
cam ciosas.
Exerccio 3.3
Calculamos uma medida da interao entre os fatores T e C a partir da diferena dos
efeitos da temperatura. Algum poderia perguntar porque no fizemos, em vez disso, a
diferena entre os efeitos do catalisador nos dois nveis da temperatura. Mostre,
algebricamente, que as duas medidas so idnticas. Lembre-se de que, pela conveno de
sinais que adotamos, a conta que voc deve fazer [(Efeito do catalisador a 60C) - (Efeito
do catalisador a 40C)], e no o contrrio.
Podemos dar uma interpretao geomtrica aos efeitos que acabamos de calcular. Para isto,
representamos o planejamento experimental num sistema cartesiano, com um eixo para
cada fator. Como temos apenas dois fatores, o espao definido por eles um plano.
Escolhendo apropriadamente as escalas dos eixos, podemos colocar os quatro ensaios nos
vrtices de um quadrado (Figura 3.2). Atribuindo sinais algbricos aos ensaios de acordo com
as Equaes 3.1a, 3.3 e 3.4, vemos que os efeitos principais so oontrastes - isto , diferenas
mdias - entre valores situados em arestas opostas e perpendiculares ao eixo do fator
correspondente, como mostram as Figuras 3.2(a) e 3.2(b). O efeito de interao [Figura
3.2(c)], por sua vez, o contraste entre as duas diagonais, considerando-se positiva a
diagonal que liga o ensaio (- -) ao ensaio (++). Foi por isso que divi~imos por 2, quando
89
Como variar tudo ao mesmo
calculamos o efeito TC. Assim ele tambm pode ser interpretado geometricamente como uma
diferena mdia.
(-) (+)
Temperatura
(a)
o
"'O
as
.~
ro
10
(-)
(-)
Temperatura
(b)
(+)
o
"O
co
.5a
(ij
CU
(-)
(-) (+)
Temperatura
(c)
90
3.1(c) Estimativa do erro experimental
Os ensaios da Tabela 3.1 foram realizados em duplicata, para que pudssemos ter uma
maneira de estimar o erro experimental, e a partir da avaliar a significncia estatstica dos
efeitos. Para isso, preciso que a duplicao seja uma repeti~o autntim, isto , a reali-
zao, pela segunda vez, de todas as etapas do ensaio, desde, digamos, a limpeza da vidraria
at a separao e a anlise do produto final. Este ponto extremamente importante. Se ns
fizermos as repeties de forma imprpria, sem incluir a variabilidade total do processo, os
erros vo parecer menores do que na realidade so, e talvez sejamos levados a enxergar
efeitos significativos onde eles na verdade no existem.
Para evitar a ocorrncia de distoro estatstica nos resultados, isto , para impedir
que desvios atpicos sejam obrigatoriamente associados a determinadas combinaes de nveis,
devemos realizar os ensaios em ordem aleatria. Suponhamos, por exemplo, que a reao da
Tabela 3.1 possa ser influenciada pela luz, e que tenhamos de realizar parte dos experimentos
durante o dia, e parte noite. Se escolhermos usar somente o catalisador A durante o dia e o
catalisador B noite, estaremos confundindo o efeito do catalisador com um possvel efeito
devido mudana de luminosidade. Para evitar esse problema, devemos sortear a ordem de
realizao dos ensaios, isto , fazer a aleatoriza~ de que falamos no incio do captulo.
91
Como variar tudo ao rnesmo
Outro ponto importante que a realizao das repeties deve refletir a variabi-
lidade do processo em toda a faixa de estudo, e no apenas numa determinada combinao
de nveis. Se no tivermos condies de repetir todos os ensaios, devemos escolher, para as
repeties, ensaios que cubram a maior parte da faixa experimental estudada. Essa precau-
o pode parecer tola quando se tem apenas quatro ensaios, mas se torna muito importante
quando o nmero de fatores aumenta.
A partir das repeties feitas numa dada combinao de nveis podemos obter uma
estimativa do erro experimental nessa combinao. Por exemplo, os rendimentos observados
no ensaio n 1 foram 57% e 61%. Como so repeties autnticas e realizadas em ordem alea-
tria, podemos tomar a varincia desse par de valores, que 8, como uma estimativa da
varincia tpica do nosso procedimento experimental. A rigor, uma estimativa referente
combinao de nveis em que os dois resultados foram obtidos - temperatura de 40C e catali-
sador A. Porm, se admitirmos que a varincia das repeties a mesma em toda a regio in-
vestigada, podemos combinar as informaes de todos os ensaios e obter uma estimativa com
mais graus de liberdade. Na prtica, esta suposio costuma funcionar muito bem. De qual-
quer forma, havendo necessidade, sempre podemos usar um teste F para confirmar a sua
validade.
Cada um dos ensaios foi realizado apenas duas vezes, e por isso fornece uma esti-
mativa da varincia com apenas um grau de liberdade. Para obter uma estimativa conjunta,
com 4 graus de liberdade, ampliamos a Equao 2.27 e calculamos a mdia de todas as esti-
mativas, ponderadas pelos respectivos graus de liberdade. Incluindo as varincias obser-
vadas nos outros trs ensaios (8,2 e 8, respectivamente), temos
Tirando a raiz quadrada desse valor, obtemos uma estimativa, com quatro graus de liber-
dade, do desvio padro associado a uma observao, isto , do erro experimental carac-
terstico - o chamado eITO padro - das nossas respostas:
s=~6,5 =2,55%.
92
222
S2 VISI + V2 S 2 + + VmS m (3.5)
VI +V2 + +Vm
ensaio.
Cada um dos efeitos calculados nas Equaes 3.1-3.4 uma combinao linear de
quatro valores Yi' com coeficientes ai iguais a +1/2 ou -1/2. Por causa da autenticidade das
repeties e da ordem aleatria de realizao dos ensaios, esses valores devem ser estatis-
ticamente independentes. Admitindo tambm que eles tm a mesma varincia populacional
G' , podemos aplicar a Equao 2.15, com af = 1/4, para calcular a varincia de um efeito:
V( efelto} = (1
A
-
+ -1 + -1 + -1) (J-2 = G'-2 .
4 4 4 4 Y Y
Lembrando ainda que cada valor Yi neste exemplo na verdade a mdia de duas obser-
onde (J2 a varincia de uma observao individual. Usando nossa estimativa S2 = 6,5 no
lugar de (J2 , obtemos finalmente uma estimativa, com 4 graus de liberdade, do eITO padro
de um efeito no nosso experimento:
s( efeito) ==
~ == 1,80%
V"""2
Uma outra forma de obter o erro padro de um efeito utilizar a Equao 3.2. Como um
efeito um contraste entre duas mdias, isto ,
efeito = Y+ - y- ,
podemos escrever
porque neste caso temos quatro respostas com sinal positivo e as outras quatro com sinal
negativo. Fazendo-se a mudana apropriada nos denominadores, uma expresso semelhante
se aplica a um fatorial de dois nveis qualquer, porque nesses planejamentos um efeito ser
sempre um contraste entre duas mdias, com metade das respostas em cada mdia.
93
Como variar tudo ao rnesmo
Com o erro padro podemos construir intervalos de confiana para os valores dos
efeitos, usando a distribuio de Student:
f !
.~
I
ij - t y x s( efeito) < 11 < ij + t y x s( efeito) i. (3.6)
L 1
Nesta equao, para no confundir com a notao j empregada para mdias, usamos a letra
grega 11 para representar o verdadeiro valor de um efeito, isto , o valor populacional, e o
acento circunflexo para indicar a estimativa desse valor obtida a partir dos ensaios realiza-
dos no experimento. Na prtica, a equao implica que s devemos considerar estatistica-
mente significativos os efeitos cujas estimativas (obtidas no experimento) forem superiores
em valor absoluto ao produto do erro padro pelo ponto da distribuio de Student, porque
s assim o intervalo de confiana no incluir o valor zero.
Exerccio 3.4
Mostre que para um par de valores numricos s2 =d 2 /2, onde d a diferena entre os dois valo-
res. Use este resultado e mostre que em um conjunto de N ensaios duplicados (isto , cada ensaio
repetido uma s vez, como na Tabela 3.1) a estimativa conjunta da varincia experimental
A Tabela 3.2 contm os resultados da nossa anlise dos dados da Tabela 3.1, e inclui o rendi-
mento mdio global, que tambm uma combinao linear de todas as observaes.
Tabela 3.2 Efeitos calculados para o planejamento fatorial 2 2 da Tabela 3.1. Note que o
erro padro da mdia global a metade do erro padro dos efeitos.
Efeitos principais:
T 22,5 1,8
c -13,5 1,8
Efeito de interao:
Te - 8,5 1,8
94
Inicialmente, precisamos decidir quais, dos efeitos calculados, so significativamente dife-
rentes de zero, e portanto merecedores de interpretao. De acordo com a Equao 3.6, s
consideraremos estatisticamente significativo, com 95% de confiana, um efeito cujo valor
absoluto for superior a t 4 x s(efeito) =2,776 x1,8% = 5,0%. Aplicando esse critrio aos
valores da Tabela 3.2, vemos que todos eles so significativos, ou seja, os efeitos existem
msmo. Podemos, portanto, tentar entender o que eles significam na prtica.
+14
8
...o
"C
co
.!
...co
"ii
o
A
40 60
Tem peratura
Exerccio 3.5
De acordo com a Tabela 3.2, o erro padro da mdia a metade do erro padro dos efeitos.
Use a Equao 2.15 para mostrar que isto verdade.
95
Como variar tudo zo mesmo
Exerccio 3.6
As observaes abaixo foram feitas em repeties autnticas dos diferentes ensaios. Faa uma
estimativa conjunta do erro experimental associado a essas observaes. Quantos graus de
liberdade tem a estimativa?
1 20 25 23 22,7 6,33
2 40 37 38,5 4,50
3 10 8 12 7 9,3 4,92
4 31 31
5 53 49 45 49,0 16,00
Neste exemplo muito simples, calculamos os efeitos a partir de suas definies. Esse procedi-
mento, porm, se torna mais trabalhoso e passvel de erro (humano) medida que o numero
de fatores aumenta. Apresentaremos nesta seo um procedimento alternativo, que nos per-
mitir calcular qualquer efeito sem dificuldade, no importa o tamanho do planejamento.
T C T C
40 A
60 A +
40 B +
60 B + +
Agora acrescentamos a essa matriz uma coluna de sinais positivos - a primeira - e uma
outra cujos sinais so os produtos, elemento a elemento, dos sinais das colunas T e C. Isso
nos d uma matriz 4 x 4, que chamaremos de tabela de ooefici.entes de <Dltraste:
M T e Te
+ +
+ +
+ +
+ + + +
96
Para calcular os efeitos, escolhemos a coluna apropriada, aplicamos seus sinais s respostas
correspondentes, fazemos a soma algbrica e finalmente dividimos o resultado por dois. A
primeira coluna, que s contm sinais positivos, serve para calcular a mdia de todos os
ensaios, e nesse caso obviamente o divisor tem de ser quatro.
Yl 59
Y2 90
Y3 54
Y4 68
c = -Yl - Y2 + Y3 + Y4
2
-59 - 90 + 54 + 68
=--------
2
=-13,50%.
Deixamos para voc a confirmao de que as outras colunas tambm produzem os resultados
corretos.
+ + 1 -1 -1 +1
+ + 1 +1 -1 -1
(3.7)
+ + 1 -1 +1 -1
+ + + + 1 +1 +1 +1
podemos calcular todos os efeitos com uma nica equao matricial. Cada efeito ser dado, a
menos de um divisor, pelo produto escalar do seu vetor na matriz de coeficientes de con-
97
Como variar tudo ao mesmo
traste pelo vetor das respostas. Assim, por exemplo, o efeito do catalisador, que acabamos de
calcular, dado por
59
C= ! [-1 -1 + 1 + 1] 90 =-13,50% .
2 54
68
-1 59
-1 90
Xc = e y=
+1 54
+1 68
(3.8)
onde x~ o vetor linha que obtemos transpondo o vetor coluna Xc . Com esta formulao
concisa (que pode ser estendida a qualquer planejamento fatorial de dois nveis) e a ajuda de
um programa computacional de lgebra linear, calcular os efeitos torna-se muito fcil.
No caso geral de um planejamento de dois nveis com k fatores, onde devemos rea-
lizar um total de 2 k ensaios, o divisor ser 2 k - 1 para os efeitos e, claro, 2 k para a mdia.
Se X a matriz completa de coeficientes de contraste, os efeitos sero, a menos dos divisores,
os elementos do produto Xty, que um vetor coluna. No nosso fatorial 2 2 temos
+1 +1 +1 +1 59 271
-1 +1 -1 +1 90 45
Xty=
-1 -1 +1 +1 54 -27
+1 -1 -1 +1 68 -17
M 67,75
T 22,5
e -13,5
Te -8,5
98
quando fazemos o produto Xty e aplicamos os divisores apropriados, obtemos, a partir dos
quatro valores independentes que so os elementos de y, quatro novos valores tambm
independentes - a mdia global, os dois efeitos principais e o efeito de interao.
importante notar, desde j, que estamos usando uma matriz X 4x4 porque estamos
baseando nossos clculos nas quatro respostas mdias, e no nos oito valores individuais. Se
preferssemos, poderamos fazer o clculo usando diretamente as oito respostas. Nesse caso
a matriz X teria dimenses 8x4, e o divisor seria 4, ao invs de 2. O efeito C, por exemplo, se-
ria calculado assim:
57
92
55
1 66
C=-[-1-1 +1 +1-1-1+1+1] = -13,50% .
4 61
88
53
70
Exerccio 3.7
Os dados abaixo foram obtidos num estudo da influncia de dois fatores no tempo de pega
inicial do gesso, isto , o tempo em que o gesso comea a endurecer,depois que o p mistu-
rado com a gua (M. F. Pimentel e B. B. Neto, Anais do XXXI Congresso Brasileiro de
Qumica, Recife, 1991). Os ensaios foram realizados em duplicata e em ordem aleatria.
Determine todos os efeitos e seus erros padro. Interprete seus resultados.
99
Como variar tudo ao mesmo
No algoritmo usado para calcular os efeitos, os verdadeiros valores dos nveis dos fatores
foram substitudos por +1 ou -1. Isto corresponde a uma oodifimo das variveis originais,
semelhante que fizemos no captulo anterior, quando padronizamos uma varivel alea-
tria. Para transformar os valores 40C e 60C, por exemplo, em -1 e +1, basta subtrair de
cada um deles o valor mdio, 50C, e dividir o resultado pela metade da amplitude da varia-
o, que a diferena entre o valor superior e o valor inferior:
40 - 50 = -10 = -1
60 - 40 10
2
60 - 50 = 10 = +1 .
60 - 40 10
2
Isto significa, obviamente, colocar a origem do eixo das temperaturas no valor intermedirio,
50C, e definir uma nova escala, em que cada unidade corresponde a 10oe. Da mesma forma,
a codificao far com que a origem do eixo dos catalisadores fique centrada entre os cata-
lisadores A e B, numa espcie de "nvel zero" sem qualquer significado fsico mas que, do
ponto de vista algbrico, pode ser tratado do mesmo modo que a origem das temperaturas. A
transformao est ilustrada na Figura 3.4, onde as variveis temperatura e catalisador
passam a ser chamadas, depois de codificadas, de Xl e x2' respectivamente. A resposta
O'
a..
E
B
~---~ 0--~~
o --------------4----87
75 !
-1 !
----+------1 67,75
!
....-+----.
"O i ' i
co +1
.~
-l- 0-:;---0
(ij
co
A
40 60
Temperatura (OC)
Figura 3.4 Codificao das variveis no planejamento 2 2 A origem do novo sistema est
localizada na mdia de todas as respostas. A unidade em cada eixo a metade da amplitude
de variao do fator correspondente.
100
Com a codificao, cada efeito passa a corresponder sempre variao de duas
unidades do fator correspondente, j que o nvel do fator varia de -1 para +1. Por unidade de
Xl e X2, consequentemente, os efeitos so a metade dos valores que calculamos com as
Equaes 3.1-3.4. Dizer que o efeito da temperatura de 22,50% quando T passa de 40C
para 60C o mesmo que dizer que esse efeito de 11,25% por unidade de Xl. Dividindo por
dois os trs efeitos calculados nas Equaes 3.1-3.4, obtemos os novos valores 11,25% (tem-
peratura) -6,75% (catalisador) e -4,25% (interao).
Y(X1,X2). Essa varivel se distribui em torno de uma certa mdia populacional 11(x1,x2),
(3.9)
onde e( Xl' X 2) representa o erro aleatrio com que as respostas flutuam em torno da mdia
rendimentos nessa combinao de nveis um certo valor Til = 11(-1,-1), que no podemos co-
nhecer com perfeita exatido, mas para o qual as duas observaes fornecem a estimativa
)/1 = (57 + 61) + 2 = 59 %. A varincia com que os rendimentos se distribuem em torno de
11(-1,+1) tambm desconhecida, mas pode ser estimada a partir dos ensaios repetidos. Com
budos independentemente, com mdia zero e com a mesma varincia em todas as combi-
naes de nveis. Isso, alis, foi o que admitimos quando combinamos todas as nossas
observaes para obter uma estimativa conjunta da varincia. Caso seja necessrio fazer
algum teste do tipo t ou F, seremos obrigados a supor tambm que os erros seguem uma
distribuio normal (Seo 2.6).
Num planejamento 22, nosso modelo postula que a mdia populacional 11( xl' X 2)
representada adequadamente pela expresso
101
Como variar tudo ao mesmo
onde f30 o valor populacional da mdia de todas as respostas do planejamento, e f31' f32 e
f312 so os valores populacionais dos dois efeitos principais e do efeito de interao, por uni-
dade de Xl e X2. Substituindo essa expresso na Equao 3.9, vemos que uma observao
(3.10)
onde e(xI,x2) o erro aleatrio associado resposta Y(XI,x2). Esta uma descrio que
(3.11)
com o acento circunflexo lembrando que no se trata de um valor populacional, e sim de uma
estimativa. Os coeficientes b o , bl , b 2 e bl2 so chamados de estimadores dos parmetros
bo
y( X b X 2) = [1 Xl X2 XIX2] ~
b2
~2
67,75
11,25
y(-l,-l)= [1 -1 -1 1] =59%,
-6,75
-4,25
102
que a estimativa dada pelo nosso modelo para o rendimento populacional do ensaio n 1.
Ela , como vemos, a mdia dos dois valores observados nesse ensaio: (57 + 61)+ 2 = 59 %. Os
y=Xb (3.12)
onde y o vetor coluna contendo as estimativas Y1, ... ,5'4 dadas pelo nosso modelo para os
rendimentos dos quatro ensaios. Como essas estimativas so as prprias mdias observadas,
o vetor y idntico ao vetor y da Equao 3.8.
mente observados nos experimentos individuais foram Y1 = 57% e Y~ = 61%. A previso feita
Y~ - Y = 61-59 = 2%.
Essas diferenas entre os valores observados e os valores previstos aparecem sempre
que empregamos um modelo com um nmero de parmetros inferior ao nmero total de ob-
servaes. No nosso caso, conforme mostra a Equao 3.11, a estimativa de uma observao
(a rigor, a estimativa do valor mdio de um ensaio) uma funo de duas variveis indepen-
dentes, Xl e x2' com quatro coeficientes a serem determinados (b o , b1 , b2 e b12 ), que esti-
mam os quatro parmetros do modelo. Os resduos aparecem porque esse modelo ajustado
a oito observaes. Se houvesse apenas quatro observaes, o ajuste teria sido perfeito e os
resduos seriam todos nulos.
103
Como variar tudo ao mesmo
berdade das observaes originais. Isso deixa apenas quatro graus de liberdade para o com-
junto de oito resduos.
Exerccio 3.8
de modo que
onde e o vetor coluna contendo a mdia global e os efeitos originais, antes de serem di-
vididos por dois. Multiplicando esse vetor esquerda pela inversa de A, obtemos de volta as
observaes originais, isto , o vetor y:
104
3.2 Um planejamento fatorial 23
Vamos acrescentar agora, temperatura e ao catalisador, um terceiro fator. Digamos que
seja a concentrao de um reagente, que desejamos estudar nos nveis 1,0 M (-) e 1,5 M
(+). O planejamento fatorial completo passa a ter, portanto, 2 3 = 8 ensaios. Os rendi-
mentos observados nesses ensaios, realizados em ordem aleatria e em duplicata, esto na
Tabela 3.3.
1: Temperatura (OC) 40 60
2: Catalisador (tipo) A B
105
Como variar tudo ao mesmo
Tabela 3.4 Coeficientes de contraste para um fatorial 23 A ltima coluna contm os valores
mdios dos rendimentos obtidos nos ensaios.
Mdia 1 2 3 12 13 23 123 y
+ + + + 54,0
+ + + + 86,5
+ + + + 48,0
+ + + + 63,0
+ + + + 63,0
+ + + + 93,5
+ + + + 58,5
+ + + + + + + + 72,0
106
divisores, calculamos os sete efeitos e a mdia global. Em cada clculo so utilizadas todas
as respostas, como antes.
Todas as colunas de efeitos na Tabela 3.4 tm quatro sinais positivos e quatro sinais
negativos. Isto significa que podemos interpretar qualquer efeito como a diferena entre
duas mdias, cada uma contendo metade das observaes, exatamente como no caso do
planejamento 2 2
Xty , onde y o vetor coluna contendo os rendimentos mdios dos ensaios. Obtemos assim
538,50
91,50
-55,50
35,50
(3.13)
-34,50
-3,50
3,50
0,50
Dividindo o primeiro elemento por 8 e os demais por 4 obtemos o vetor dos efeitos (arredon-
dados para a segunda casa decimal):
y 67,31
1 22,88
2 -13,88
3 8,88
12 -8,63
13 -0,88
23 0,88
123 -0,13
Observe que os efeitos aparecem, nas linhas do vetor, na mesma ordem das colunas da
matriz X.
Exerccio 3.9
Em cada um dos dois nveis da varivel 3 existe um planejamento fatorial 2 2 completo para as
variveis 1 e 2. Calcule, a partir dos valores da Tabela 3.3, o efeito de interao 12 nos dois
nveis da varivel 3. Faa a diferena entre os dois valores, divida por dois, e chame o
resultado de interao do fator 3 com a interao 12. Repita todo o processo, partindo dos
valores da interao 23 nos dois nveis do fator 1. Voc ter ento o valor da interao do fator
107
Como vadar tudo ao mesmo
1 com a interao 23. Compare os resultados dos dois casos com o valor da interao 123, dado
no texto.
Como as observaes individuais foram todas realizadas em duplicata, podemos usar o re-
sultado do Exerccio 3.4 para calcular a estimativa conjunta da varincia de uma observao
individual:
onde di a diferena entre as duas observaes correspondentes ao i-simo ensaio. Essa ex-
presso tambm pode ser posta na forma de um produto escalar. Chamando de d o vetor co-
luna das diferenas entre os ensaios, podemos escrever
2
Substituindo os valores numricos e fazendo N = 8, obtemos 8 == 5,2.
Num planejamento fatorial 23 , cada efeito uma combinao linear de oito valores,
com coeficientes 114. Admitindo que esses valores sejam independentes,2 podemos aplicar a
Equao 2.15 para obter uma estimativa da varincia de um efeito. Fazemos agora a; =
1116, para i = 1, 2, ..., 8. Cada um dos oito valores da combinao por sua vez a mdia de
dois outros, porque os ensaios foram feitos em duplicata. Se a varincia de uma observao
individual estimada em 5,2, a varincia da mdia de duas observaes ser 5,2/2.
Juntando tudo, chegamos estimativa
2 Para isto - nunca demais insistir - importante aleatorizar os experimentos e fazer repeties
autnticas.
108
Tabela 3.5 Efeitos calculados para o planejamento fatorial 23 da Tabela 3.3 e seus erros
padro (em %).
Efeitos principais:
12 -8,6 1,1
13 - 0,9 1,1
23 0,9 1,1
Exerccio 3.10
Use a Equao 2.15 para calcular a varincia dos efeitos de um fatorial 23 sem repeties,
partindo da Equao 3.2.
Analisando os valores da Tabela 3.5, podemos ver que a nica novidade trazida pela
entrada da concentrao no planejamento fatorial mais um efeito principal significativo.
No h evidncia de interao da concentrao com os outros dois fatores. Os efeitos prin-
cipais da temperatura e do catalisador, bem como da interao 12, so praticamente os
mesmos do planejamento 2 2 , e podem ser interpretados do mesmo modo que antes, a partir
dos valores mdios mostrados na Figura 3.5. O efeito principal da concentrao pode ser
interpretado isoladamente, porque no h interao desse fator com os outros. A interpre-
tao simples:
109
Como variar tudo ao mesmo
+14,25
-1
-1
Temperatura
Exerccio 3.11
Como exerccio num curso de quimiometria, M. R. Vallim e V. F. Juliano analisaram
dados obtidos por um pesquisador numa srie de experimentos de sntese de polipirrol
numa matriz de EPDM. Foram estudados trs fatores: o tempo de reao (t), a concen-
trao de oxidante (C) e o tamanho da partcula (P). A resposta observada foi o rendi-
mento da reao. Calcule os valores dos efeitos e seus erros padro, usando os dados a
seguir, mas antes examine cuidadosamente o conjunto de valores, levando em conta os si-
nais da matriz de planejamento. possvel antecipar qual ser a varivel com maior in-
fluncia no rendimento?
110
-1
Temperatura
)40----.; +
(b)
Os efeitos calculados num fatorial 2 3 tambm podem ser interpretados como contras-
tes geomtricos. Com trs fatores em vez de dois, a figura bsica ser um cubo, e no mais
um quadrado. Os oito ensaios da matriz de planejamento correspondem aos vrtices do cubo
(Figura 3.6). Os efeitos principais e as interaes de dois fatores so contrastes entre dois
111
Como variar tudo ao mesmo
planos, que podemos identificar examinando os coeficientes de contraste na Tabela 3.4. Por
exemplo, no clculo do efeito principal do fator 1 (a temperatura), os ensaios 1, 3, 5 e 7 en-
tram com o sinal negativo, e os demais entram com sinal positivo. Podemos ver, na Figura
3.6, que os ensaios negativos esto todos numa das faces do cubo, a que perpendicular ao
eixo do fator 1 e est situada no nvel inferior desse fator. Os outros ensaios esto na face
oposta, que corresponde ao nvel superior. O efeito principal do fator 1 portanto o contraste
entre essas duas faces do cubo, como mostra a Figura 3.6(a). Os outros dois efeitos principais
tambm so contrastes entre faces opostas e perpendiculares ao eixo da varivel corres-
pondente. As interaes de dois fatores, por sua vez, so contrastes entre dois planos diago-
nais, perpendiculares a um terceiro plano definido pelos eixos das duas variveis envolvidas
na interao, como mostra a Figura 3.6(b).
O ensaio n 8, que corresponde aos nveis (+++), entra no clculo de qualquer efeito
com o sinal positivo, como podemos ver na ltima linha da Tabela 3.4. Isto significa que na
interpretao geomtrica dos efeitos a parte positiva sempre incluir esse ensaio. Voc pode
conferir esse fato na Figura 3.6. Lembrando-se dele, poder fazer corretamente a inter-
pretao geomtrica de qualquer efeito.
Exerccio 3.12
Que concluses voc pode tirar da Figura 3.5?
Exerccio 3.13
Qual a interpretao geomtrica da interao 123 no planejamento fatorial 2 3?
O modelo pode ser construdo por analogia com a Equao 3.10, s que agora as variveis
codificadas so trs: xl' X2 e X3 . Usando a notao costumeira, escrevemos
(3.14)
Os coeficientes desta equao (os f3's) representam valores populacionais dos efeitos, por
unidade das variveis codificadas. Substituindo os dados da Tabela 3.4 na Equao 3.13 e
dividindo tudo por 8, obtemos as seguintes estimativas para esses coeficientes:
112
bo 67,3
~ 11,4
b2 -6,9
_ Xty _ b3 4,4
b--- =:::::
8 b12 -4,3
~3 -0,4
b23 0,4
~23 0,1
Exerccio 3.14
Nossa anlise dos resultados do planejamento 23 indica que as interaes 13, 23 e 123 podem
ser desprezadas. Exclua da Equao 3.14 os termos correspondentes a essas interaes e faa
estimativas dos rendimentos para os oito ensaios. Calcule as diferenas entre os valores
estimados e os observados, e compare essas diferenas, que so os resduos, com os valores
mdios observados.
Vamos acrescentar agora uma quarta varivel ao nosso planejamento: o pH do meio rea-
cional, nos nveis neutro (7) e levemente cido (6). Com isto, o nmero total de ensaios sobe
para 16. Os resultados obtidos nos experimentos, desta vez feitos sem repeties, esto na
Tabela 3.6. Com eles podemos calcular, alm da mdia global, quinze efeitos: quatro efeitos
principais, seis interaes de dois fatores, quatro interaes de trs fatores e uma interao
de quatro fatores.
1: Temperatura (OC) 40 60
2: Catalisador (tipo) A B
3: Concentrao (M) 1,0 1,5
4: pH 7,0 6,0
113
Como variar tudo ao mesmo
Ensaio 1 2 3 4 Resposta
1 54
2 + 85
3 + 49
4 + + 62
5 + 64
6 + + 94
7 + + 56
8 + + + 70
9 + 52
10 + + 87
11 + + 49
12 + + + 64
13 + + 64
14 + + + 94
15 + + + 58
16 + + + + 73
114
:3
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + +
+ + + + + + + + + + + + + + + +
Exerccio 3.15
Escreva a equao do modelo estatstico correspondente a um planejamento fatorial 24
Desta vez os experimentos no foram repetidos, de modo que no podemos estimar o erro
experimental da forma que vnhamos fazendo. Precisamos de outra sada.
Voc deve ter notado que, medida que o nmero de fatores aumenta, o modelo
matemtico tambm aumenta, incluindo cada vez mais termos. Com dois fatores, tnhamos
apenas dois efeitos principais e uma interao. Com trs, o modelo estendeu-se at incluir
uma interao de trs fatores. Agora, com quatro fatores, o modelo precisa de dezesseis
115
Como variar tudo ao mesmo
termos, sendo o ltimo deles a interao de quatro fatores. Com k fatores, o modelo completo
teria de continuar at a interao de todos os k fatores, como a expanso de uma funo nu-
ma srie de potncias.
Vamos imaginar agora que a superfcie de resposta, isto , a relao entre a resposta
e os fatores na regio que estamos investigando, seja suave o bastante para que pequenas
variaes nos fatores no causem variaes abruptas na resposta. Sendo assim, podemos
esperar que os coeficientes do modelo obedeam a uma certa hierarquia, com os termos de
ordem mais baixa mostrando-se mais importantes que os de ordem mais alta. Voltando ao
nosso exemplo, esperamos que os efeitos principais sejam mais importantes na formulao
do modelo do que, digamos, a interao de quatro fatores. Em geral, podemos esperar que a
importncia de uma interao para um modelo decresa com o nmero de fatores envolvidos
na sua definio. Se no, no poderemos obter um modelo satisfatrio da nossa superfcie de
resposta com um nmero finito de termos.
Tabela 3.8 Efeitos calculados para o planejamento fatorial 2 4
Mdia: 67,188
Efeitos principais:
1 (Temperatura) 22,875
2 (Catalisador) -14,125
3 (Concentrao) 8,875
4 (pH) 0,875
12 -8,625 13 -0,625
14 0,875 23 -0,625
24 0,875 34 0,375
1234 0,375
A Tabela 3.8 mostra claramente que alguns efeitos so bem mais significativos que
outros. Admitindo, tendo em vista os valores dessa tabela, que os efeitos principais e as
interaes de dois fatores bastam para descrever adequadamente a superfcie de resposta,
116
podemos usar os demais efeitos para obter uma estimativa do erro experimental nos valores
dos efeitos. De acordo com essa suposio (que eqivale a dizer que a expanso em srie
pode ser truncada depois dos termos de segunda ordem), as interaes de trs ou mais
fatores na verdade no existem. Os valores determinados para 123, 124, 134, 234 e 1234
na Tabela 3.8, ento, s podem ser atribudos s flutuaes aleatrias inerentes ao nosso
processo, isto , ao "rudo" embutido nos valores das respostas. Elevando cada um deles ao
quadrado, teremos uma estimativa da varincia de um efeito, e a mdia dos cinco valores
nos dar uma estimativa conjunta, com 5 graus de liberdade (porque so cinco valores
independentes).
Temos portanto
A raiz quadrada deste valor, s == 0,54, a nossa estimativa para o erro padro de um efeito.
Exerccio 3.16
Interprete os valores da Tabela 3.8, levando em conta a estimativa do erro que acabamos de fazer.
A anlise por meio de grficos normais uma tcnica alternativa para tentarmos distinguir,
nos resultados de um planejamento, os valores que correspondem realmente aos efeitos
daqueles outros valores que so devidos apenas ao rudo. Seu funcionamento se baseia na
noo de probabilidade cumulativa, que foi introduzida no Exerccio 2.10. Precisamos agora
discuti-la mais detalhadamente.
-(x-pf
1-2
x dx =
f () r;:;-:: e 2a dx
a,,2Jr
Como vimos no captulo anterior, a representao grfica desta equao uma curva em
forma de sino, semelhante que aparece na Figura 3.7(a).
cumulativa (ou probabilidade acumulada) do valor xl. Essa rea, que corresponde probabi-
117
Como variar tudo ao mesmo
que x se desloca para a direita, tendendo para 1, que o valor da rea total sob a curva da
Figura 3.7(a), quando x tende para +00. Um grfico da probabilidade cumulativa numa dis-
tribuio normal uma curva monotonicamente crescente, em forma de 8 3 que vai (de forma
assinttica) de zero esquerda para 1 direita, como mostra a Figura 3.7(b).
0,60 r----'----.--~----------,
1,00 r---------------.----==---~
(a) (b)
0,45
~ 0,30
~
0,15
-3,50 -1,75 0,00 1,75 3,50 -3,50 -1,75 0,00 1,75 3,50
x x
1,0 r-------,.------.-----......------,
(c)
0,25
Exerccio 3.17
118
A curva da Figura 3.7(b) pode ser transformada numa reta, por meio de uma modi-
ficao na escala do eixo das ordenadas. Essa modificao consiste em expandir a escala si-
metricamente em torno do ponto representando 0,5 (isto , 50% de probabilidade acumu-
lada), de modo a "esticar" as duas pontas do S [Figura 3.7(c)]. O procedimento semelhante
ao que se usa para fabricar papel logartmico. A funo y = log x, que num papel milime-
trado comum representada por uma curva, num papel logartmico passa a ser represen-
tada por uma reta. Da mesma forma, se x se distribuir normalmente, o grfico de suas pro-
babilidades acumuladas ser uma sigmide numa escala cartesiana comum, mas passar a
ser uma reta se fizermos a escala vertical correspondente da Figura 3.7(c). Observe que as
probabilidades acumuladas O e 1, que correspondem respectivamente a -00 e +00 sobre o eixo
das abscissas, a rigor no podem ser representadas nesse grfico, porque a escala finita.
0,60
0,45
~ 0,30
~
0,15
0,00
-4 -3 -2 -1 o 2 3 4
x
mos imaginar que cada um desses dez elementos seja o representante de uma fatia equiva-
119
Como variar tudo ao rnesmo
lente a 10% da rea total da distribuio. O primeiro elemento, que o menor, representaria
os primeiros 10% de cauda esquerda, o segundo representaria a regio entre 10% e 20%, e
assim por diante. Ao dcimo elemento, o maior de todos, caberia a cauda de 10% direita,
isto , a regio indo de 90% a 100% de probabilidade acumulada. Essa concepo est
ilustrada graficamente na Figura 3.8, com a curva de densidade de probabilidade.
finalmente X10 seria associado probabilidade de 95%. Num grfico dessas probabilidades
contra os valores Xl' , X10 numa escala linear, os pontos devem cair aproximadamente
sobre uma curva sigmide, como na Figura 3.9(a). Mudando o eixo para uma escala de
probabilidade normal, esperaremos que os pontos se ajustem razoavelmente a uma reta
[Figura 3.9(b)]. Se essas expectativas no forem confirmadas, desconfiaremos que algo est
errado com as nossas suposies. Isso nos permitir chegar a concluses de grande
importncia prtica, como logo veremos.
1,0
1,0
lj 0,8
~
'"tj
lj
~ ~
~
~
~ 0,6 ~
'.J ~
lj '->
~
~
0,5
'"tj
~
~
:.c
]
lj :.
~
...c ..o
~
~ 0,2
2
~
0,0 0,0
-3 -2 -1 2 3 -3 -2 -1 2 3
x x
Figura 3.9 (a) Probabilidades acumuladas para uma amostra de dez elementos,
extrados aleatoriamente de uma populao normal padronizada, numa escala
cartesiana comum. (b) Os mesmos pontos, num grfico de probabilidade normal.
120
do limite central, podemos consider-los como uma amostra aleatria retirada de uma
distribuio aproximadamente normal, com mdia populacional zero.
Procedendo como no exemplo dos dez pontos, podemos traar um grfico normal dos
nossos quinze valores e us-lo para testar a hiptese de que os efeitos no existem. Os dados
necessrios para isso esto na Tabela 3.9, onde cada efeito da Tabela 3.8 associado a um
valor de probabilidade acumulada. Para traar o grfico, o mais cmodo usar um dos
muitos programas computacionais de estatstica disponveis. Caso voc no tenha acesso a
um desses programas, pode usar uma escala linear comum, colocando no eixo das abscissas
os valores dos efeitos, mas no eixo das ordenadas os valores correspondentes da distribuio
normal padronizada (Z, na ltima coluna da tabela).
121
Como variar tudo ao mesmo
o grfico normal dos efeitos est na Figura 3.10. Vemos imediatamente que os pon-
tos centrais se ajustam muito bem a uma reta que cruza a probabilidade acumulada de 50%
praticamente sobre o ponto zero do eixo das abscissas. Faz sentido, portanto, considerar
esses pontos como vindos de uma populao normal de mdia zero. Ou seja: eles repre-
sentam "efeitos" sem nenhum significado fsico.
O mesmo j no podemos dizer dos outros valores, que esto identificados com os
nmeros dos efeitos que representam. Dificilmente poderamos pensar que esses pontos, to
afastados da reta, pertenam mesma populao que produziu os pontos centrais. Devemos
interpret-los, ento, como efeitos realmente significativos, e tanto mais significativos
quanto mais afastados estiverem da regio central, seja para a direita, seja para a esquerda.
Isto vem confirmar o que voc j descobriu, se resolveu o Exerccio 3.16 e comparou os efeitos
calculados com a estimativa do erro padro: s os efeitos principais 1,2 e 3 e a interao 12
so mesmo significativos.
3r------.....--.---~------.---......---------,
tsJ o
-1 ....... :1.2.
-2 2
-3 L....--o.._ _-.....l __..._ _""""""____'_ "'___'"__'
~
-20 -10 o 10 20 30
Efeito
122
uma distribuio normal de mdia zero. Ou seja, deve aproximar-se de uma reta passando
pelo ponto (x, Z) = (O, O), como na regio central da Figura 3.10. 4
Exerccio 3.18
Utilize os valores de todos os efeitos que caem sobre a reta da Figura 3.10 para calcular uma
estimativa da varincia de um efeito com 11 graus de liberdade. Use um teste F para mostrar
que esta estimativa e a estimativa obtida a partir dos efeitos de terceira e quarta ordem (com
5 graus de liberdade) podem ser consideradas como produzidas pela mesma populao.
4 Isto depende, porm, do nmero de graus de liberdade dos resduos. Quanto mais, melhor. No
devemos esperar muita coisa de um grfico normal com poucos graus de liberdade (como, por exemplo,
num fatorial 23), justamente porque os valores no tm muitas opes de distribuir-se aleatoriamente.
123
Como variar tudo ao mesmo
processo de variao e seleo anlogo ao que, na teoria darwiniana, governa a evoluo das
espcies. Nesta seo nos limitaremos a descrever as caractersticas bsicas da operao
evolucionria. O leitor interessado poder encontrar muito mais informaes nas publicaes
de G. E. P. Box, a quem se deve a concepo e a primeira aplicao industrial da EVOP, feita
em 1954 nas instalaes da Imperial Chemical Industries, na Inglaterra. O livro Evolutio-
nary operation: a statistical method for process improvement (Box e Draper, 1969) particu-
larmente recomendado.
Como as variaes sero pequenas, o seu efeito pode passar despercebido em meio ao
rudo das respostas, que alis costuma ser muito maior no processo em larga escala do que
no laboratrio. necessrio por isso repetir vrias vezes a operao num dado conjunto de
condies, e considerar o resultado mdio final. As repeties devem ser feitas at que seja
possvel discernir algum padro nos resultados do planejamento. A anlise dos resultados
feita da forma descrita nas sees anteriores, no trazendo portanto qualquer novidade.
124
sentada pelo ponto A, para as do ponto B. Com isso o processo evoluiria na direo A ~ B,
obedecendo a uma espcie de "seleo natural" dos mais aptos, e passaria a ser operado de
forma mais eficiente.
Condies
mais
favorveis
E B
o
Condies
iniciais
A--~-----,
o C
Condies
menos
favorveis
(a) (b)
E - . E B
A A
o .. - C o C ------'
(c) (d)
Figura 3.11 (a) Planejamento fatorial com ponto central, na fase inicial de
uma operao evolucionria. (b), (c), (d): possveis deslocamentos em relao
situao de partida.
125
Como variar tudo ao mesmo
Por uma questo de sigilo industrial, informaes detalhadas sobre exemplos reais
de EVOP so escassas na literatura. Mesmo assim, existem indicaes de que esses resulta-
dos tm sido altamente significativos, originando ganhos que podem chegar a milhes de d-
lares/ano, graas larga escala em que se manifestam as conseqncias das pequenas modi-
ficaes nas condies de operao (veja, por exemplo, Box, Hunter e Hunter, 1978, p. 365).
126
que nos interessam so os outros trs. Como devemos fazer, para minimizar o efeito desse
quarto fator indesejvel?
Suponhamos que cada lote seja suficiente para realizar quatro ensaios, isto , meio
planejamento. Num planejamento 23, o efeito menos importante na hierarquia a interao
123. J que a mudana de lote inevitvel, podemos executar o planejamento de forma a
confundi-la com o efeito 123, distribuindo as amostras dos dois lotes como mostra a Tabela
3.10. As quatro amostras de cada bloco so atribudas aos ensaios de acordo com os sinais
algbricos da interao 123, e a aleatorizao feita dentro dos blocos, e no no planeja-
mento total. Assim, quando calcularmos a interao de trs fatores, saberemos que no resul-
tado estar embutida uma contribuio devida variao de um lote para o outro (que pode
ou no ser significativa). Em compensao, os efeitos principais e as interaes de dois fato-
res, que em princpio devem ser os mais importantes, estaro livres dessa contaminao.
Podemos entender como isso acontece examinando o clculo de um dos efeitos prin-
cipais. Por exemplo, o efeito 1 dado por
1= (B-A)+(A-B)+(A-B)+(B-A) .
4
A blocagem pode ser estendida a situaes mais complicadas. Por exemplo, a diviso de um
planejamento 23 em quatro blocos de dois ensaios. O melhor planejamento, nesse caso, teria
duas variveis de bloco, uma correspondendo interao 123, e a outra correspondendo a
uma das interaes de dois fatores. Esta segunda interao, claro, passaria tambm a ser
127
Como variar tudo ao mesmo
Tabela 3.10 Planejamento fatorial 23 realizado em dois blocos de quatro ensaios. Os blocos
so escolhidos de acordo com os sinais da interao 123. A ordem de realizao dos
ensaios aleatria dentro de cada bloco.
1 I A 2
2 + + 11 B 4'
3 + + 11 B l'
4 + + I A 1
5 + + 11 B 3'
6 + + I A 4
7 + + I A 3
8 + + + + 11 B 2'
X
2
-1 -1
-1
128
Exerccio 3.19
Suponha que o efeito de interao 123 realmente no existe no experimento que estamos
discutindo, e no entanto o valor numrico determinado para ele relativamente alto. Como
podemos interpretar esse valor?
Exerccio 3.20
Um planejamento 23 foi realizado em dois blocos. Os ensaios do segundo bloco foram
executados um ms aps o primeiro, e tiveram uma contribuio, h, causada por erros
sistemticos que estavam ausentes das respostas obtidas no primeiro bloco. Mostre que a
presena dessa diferena sistemtica no segundo bloco no afeta o valor calculado para o
efeito de interao 23.
129
3A Aplicaes
V. X. de Oliveira Jr. realizou um planejamento 23 em duplicata para estudar o efeito de trs fa-
tores (tempo e temperatura de hidrlise, e tipo de catalisador) no grau de substituio numa
resina clorometilada. Seu objetivo era maximizar a resposta. Os dados esto na Tabela 3A.1.
Efeitos:
-----------------------------
1 2 3 12 13 23 123
0,040 0,015 -0,040 -0,025 0,005 0,010 -0,015
1 Por qu?
130
chegamos ao intervalo de 95% de confiana para o valor de um efeito: 1,525 x 10-2 . Isto sig-
nifica que somente os efeitos principais dos fatores 1 (tempo) e 3 (catalisador) e a interao
12 (tempo x temperatura) so significativos, nesse nvel de confiana. Como queremos obter
o maior grau de substituio, devemos fazer a hidrlise em 48h, usando o cido trifluo-
roactico como catalisador.
A Figura 3A.1 nos ajuda a visualizar todos os resultados do experimento. As res-
postas obtidas com o TFA (os crculos) so sempre superiores. O efeito do aumento do tempo
sobre a resposta, que mostrado no eixo das abscissas, atenuado quando a reao
realizada na temperatura mais alta, mas as duas maiores respostas foram obtidas com 48h
de reao. Isto indica que deveramos investigar tempos de hidrlise mais longos, talvez nu-
ma temperatura intermediria. Insistir no cido propinico como catalisador, porm, dificil-
mente valeria o esforo.
0,60 ,....--------.--------.-------,
0,55 0
co
6
.
0
.
i5
o
~ 0,50
Q)
a:
d
0,45
-o- TFA
131
Como variar tudo ao mesmo
Ensaio 1 2 3 ~(mV)
1 106
2 + 98
3 + 139
4 + + 141
5 + 137
6 + + 123
7 + + 119
8 + + + 103
Efeitos:
1 2 3 12 13 23 123
132
103
150 r------......--------r---~
140 ~ : -: ~
ia. JI/ . ~
~
11 30
20
" /..... .......
I ..............:
110 ~dc:
.. ...~ . , ) ' ..
,
~)
-<r Concentrao: -1
Slica -1 +1 Slica -1 +1
pH: -1 pH: +1
Um fatorial completo 23 (Tabela 3A.3) foi usado para investigar como o tempo de reteno de
um pico obtido em um cromatgrafo lquido afetado pela percentagem de etanol, pela
temperatura da coluna e pelo fluxo de gs (Ribeiro et aI., 1999).
133
Como var~ar tudo ao mesmo
Fatores: 1: Temperatura, C 30 50
2: % etanol (v Iv) 60 70
1 49,26
2 + 31,27
3 + 42,20
4 + + 26,61
5 + 23,81
6 + + 15,07
7 + + 19,57
8 + + + 12,86
Efeitos:
1 2 3 12 13 23 123
Os efeitos principais dos trs fatores so todos negativos. Os efeitos principais 1 (tem-
peratura) e 3 (fluxo) so os mais importantes, mas mesmo o efeito do lcool, que bem
menor, tambm parece significativo, porque em todas as quatro comparaes de ensaios que
s diferem pelo nvel do lcool (1~3, 2~4, 5~7 e 6~8) o ensaio correspondendo ao nvel
superior tem a resposta mais baixa, como fica evidente na Figura 3A.4. Se o efeito principal
do lcool (-4,54) significativo, ento a interao 13 (4,53) tambm , e precisamos
interpretar os efeitos da temperatura e do fluxo conjuntamente (Fig. 3A.5).
Um aumento do fluxo, seja qual for a temperatura, reduz o tempo mdio de reteno. A
reduo, porm, mais pronunciada no nvel inferior da temperatura (-24 min) do que no
nvel superior (-15 min). Tambm podemos visualizar este mesmo resultado na Figura 3A.4,
pela mudana na inclinao das retas de um grfico para outro. Se o objetivo do experimento
minimizar o tempo de reteno, devemos preferir a regio em torno do ensaio onde a tem-
peratura e o fluxo - e tambm o teor de etanol- esto em seus nveis superiores (50C, 70%
e 0,2 mL min- 1 ). Na Figura 3A.4, esse ensaio representado pelo ltimo quadrado direita.
134
60 ,----.....---------.------,
-o- Etanol 60%
0- Etanol 70%
o o
l~ 40
c
Q)
~
Q)
"O
o o.
C.
~ 20 ............., ~. .
t-
Figura 3A.4 - Variao das respostas com os nveis dos trs fatores.
21,69 13,97
0,2 l-------------------{
45 73 28 94
0,1
30 50
1 (Temperatura)
135
Como variar tudo ao mesmo
4: Tempo de adsoro, s 8 30
1 2,75
2 + 3,15
3 + 2,85
4 + + 3,55
5 + 4,65
6 + + 5,85
7 + + 5,40
8 + + + 6,30
9 + 5,95
10 + + 6,55
11 + + 5,60
12 + + + 6,75
13 + + 11,50
14 + + + 13,00
15 + + + 12,50
16 + + + + 14,00
Efeitos:
1 2 3 4 12 13 14 23
136
2r----r--""--~---_r__--_,__--~-.-_r_--__,
04
1
O !
1 ----I--:-~-:--r~~_t___t__.. 3 t-__..
~ I I i I i
:!
>l
!1 !i !i !i !i
-2 a....-_~"'____
,! _ _..&.o__.. ! !
"""""__
!
-'----...._~"""___~
! ! --'
-1 o 2 3 4 5 6
Efeito
Agora temos um nmero de efeitos suficientemente grande para fazermos um grfico normal
(Figura 3A.6). Os mais significativos so os efeitos principais do tempo de adsoro e da va-
zo de alimentao (4 e 3, respectivamente), seguidos a uma certa distncia pela sua inte-
rao e pelo efeito principal da presso de adsoro. O fator 2, presso de dessoro, de in-
teresse secundrio, e natural pensarmos em tom-lo como inerte, para ficar com um fato-
rial em duplicata nos outros trs fatores, do qual poderamos obter uma estimativa do erro
puro. Note, porm, que 15 dos 16 efeitos calculados so positivos, o que no est de acordo
com a hiptese de uma distribuio normal de mdia zero, como seria de se esperar para va-
lores representativos do erro puro. Se examinarmos os oito pares de ensaios que s diferem
pelo nvel do fator 2, constataremos que em sete deles o nvel superior produz uma resposta
ligeiramente mais alta. Concluso: sem dvida o fator 2 menos importante que os outros
trs fatores, mas ele tambm parece atuar no sentido de aumentar a produtividade do adsor-
vente. Alis, a resposta mais baixa a do primeiro ensaio, e a mais alta a do ltimo. Exata-
mente o contrrio do que aconteceu na Aplicao 3A.3, onde os efeitos principais eram todos
negativos.
Obter funes de onda de boa qualidade uma questo fundamental na qumica computacio-
nal. Existem vrias maneiras de se tentar melhorar a qualidade de uma funo de onda, e a
137
Como varfar tudo ao mesmo
resposta normalmente depende do problema que est sendo estudado. Funes que se
mostram satisfatrias para calcular determinadas propriedades no so obrigatoriamente
boas para outras propriedades. Nesta aplicao, os pesquisadores estavam interessados em
avaliar como alguns parmetros usados para especificar a funo de onda iriam afetar a
freqncia do estiramento CH determinada a partir dessa funo para a molcula CH3F
(Azevedo et al., 1996). O planejamento escolhido foi um fatorial completo 2 4 , veja Tabela 3A.5
+
Fatores: 1: Conjunto de base 6-31G 6-311G
Ensaio 1 2 3 4 Freqncia
1 3245,6
2 + 3212,4
3 + 3203,5
4 + + 3190,3
5 + 3251,7
6 + + 3209,4
7 + + 3214,9
8 + + + 3193,5
9 + 3096,2
10 + + 3049,3
11 + + 3132,8
12 + + + 3087,6
13 + + 3105,0
14 + + + 3050,4
15 + + + 3143,5
16 + + + + 3093,5
138
:3
Efeitos:
1 2 3 4 12 13 14 23
-38,35 4,95 5,53 -120,38 5,90 -3,73 -10,83 2,28
2.------.----~---------.--~-.,
, o
i~ 24 i
~ o
~
1
-2 L...-...o
I
---'--_ _..o.-.-"""--""
1 I I
--'--_..o.-.-...._--i-----l
3090,6
139
Como variar tudo ao mesmo
o grfico normal (Figura 3A.7) mostra claramente que somente os efeitos principais 4
(correlao), 1 (conjunto de base) e a interao 24 (funes de polarizao x correlao) so
significativos. Estamos novamente diante de um caso em que uma interao se mostra
importante sem que um dos efeitos principais correspondentes (o do fator 2, neste caso) seja
significativo. Voc pode descobrir a razo, examinando atentamente o grfico cbico das
respostas em funo dos fatores 1,2 e 4 (Figura 3A.8).
o planejamento fatorial 25 cujos dados esto na Tabela 3A.6 foi usado para investigar como
cinco fatores influenciavam o desempenho de eletrodos de Titri02 na eletrorreduo do
nitrobenzeno. O desempenho foi quantificado em termos das cargas catdicas medidas (em
mC cm-2 ) durante o processamento dos eletrodos (Ronconi e Pereira, 2001). Os fatores
estudados foram a concentrao do precursor de titnio nas solues precursoras empre-
gadas (1), o nmero de camadas depositadas no eletrodo (2), a temperatura em que o
tratamento trmico foi realizado (3), a concentrao de nitrobenzeno (4) e a velocidade de
varredura do potencial aplicado (5).
2: Nmero de camadas 2 10
4: Concentrao de nitrobenzeno, mM 2 8
Ensaio 1 2 3 4 5 Desempenho
1 2,07
2 + 2,03
3 + 4,71
4 + + 7,01
5 + 1,71
140
6 + + 2,10
7 + + 4,36
8 + + + 3,71
9 + 7,15
10 + + 4,87
11 + + 8,96
12 + + + 12,25
13 + + 4,28
14 + + + 3,13
15 + + + 9,42
16 + + + + 8,68
17 + 1,70
18 + + 1,39
19 + + 4,50
20 + + + 5,92
21 + + 0,73
22 + + + 0,77
23 + + + 3,20
24 + + + + 3,08
25 + + 2,51
26 + + + 1,82
27 + + + 5,60
28 + + + + 7,61
29 + + + 1,55
30 + + + + 1,05
31 + + + + 4,25
32 + + + + + 4,38
141
Como var~ar tudo ao mesmo
Efeitos:
1 2 3 4 5 12 13 14
15 23 24 25 34 35 45 123
2
,
-
, o 2
o 4
n.,0
N o fI
-1 45
o ,
J
ou
o ,,
-2 0 3
5
-3
-3 -2 -1 o 2 3 4 5
Efeitos
Pelo grfico normal, Figura 3A.9, os valores mais significativos so os efeitos principais
dos fatores 2 a 5 e a interao 45. Parece que podemos considerar o fator 1 como inerte, o
que transforma o planejamento num fatorial 24 em duplicata (Tabela 3A.7).
142
Tabela 3A.7 - Fatorial em duplicata obtido pela eliminao do fator 1.
finalmente ao valor limite para a significncia do valor absoluto de um efeito, 0,734 (95% de
confiana).
Por este resultado, os cinco efeitos apontados pela anlise do grfico normal so
confirmados como significativos. Dois outros, as interaes 12 e 123, ficam praticamente
sobre o limite. As concluses no mudam muito, mas importante reconhecer que neste
tratamento do erro estamos combinando varincias que diferem por at quatro ordens de
grandeza. Na verdade, esse procedimento uma violao da hiptese de normalidade dos
erros que est na base da maioria dos testes estatsticos, e deveramos ter usado alguma
transformao das varincias (em geral, logartmica) antes de procurar determinar valores
2 Por qu?
143
Corno vadar tudo ao mesmo
limite. Para os detalhes, que fogem ao mbito deste livro, uma boa referncia o livro de Wu
e Ramada (2.000), que tambm apresenta outros critrios para determinar quais so os
efeitos significativos.
2 A406 + 40,20
3 A604 + 27,70
4 A606 + + 34,00
5 ASOS O 35,00
6 AS OS
O O 34,60
7 ASOS O O 35,40
(*) Os dois nmeros no nome do produto indicam as unidades de po e EO, nessa ordem.
Efeitos:
EO PO EOxPO
144
Dos trs ensaios repetidos no ponto central, obtemos a estimativa de 0,40 para o erro padro
de uma resposta, que neste caso igual ao erro padro de um efeito. O valor limite para a
significncia do valor absoluto de um efeito ser portanto, com 95% de confiana,
t 2 xs(efeito) = 4,303xO,40 =1,72.
efeito do nmero de unidades de EO, 7,20, e o do nmero de unidades de PO, -5,30, so
bastante significativos. efeito de interao no significativo. Esses resultados podem ser
visualizados na Figura 3A.10. A ausncia de interao se reflete no quase paralelismo das
duas retas. O ponto de turvao aumenta com o grau de etoxilao e diminui com o grau de
propoxilao, sendo mnimo para o produto A604 (dentre os cinco lcoois avaliados,
obviamente). Como os tensoativos de menor ponto de turvao so tambm os de menor
poder espumante, podemos concluir que esse lcool o que deve fazer menos espuma.
45 ~----....------------....-----------.
40
o
lctS
()ti
ctS
>
2
Q)
35
"'O
o
"E
o
Q.. 30
-O- PO =4
25
0 PO =6
4 6
EO
-
P ont o cent ra:I Yc 35,00 + 34,60 + 35,40 35 00
= = ,
3
145
Como vadar tudo ao mesrno
diferena 1,31, no nvel de 95% de confiana. Temos portanto evidncia de uma leve
curvatura na superfcie de resposta. Como a resposta mdia no centro superior mdia
das respostas nos vrtices, a superfcie deve ser ligeiramente convexa.
146
tes formulaes. As lavagens foram feitas em simuladores industriais de lavagem de roupas,
usando peas de tecido que tinham sido submetidos mesma soluo padro de sujeira,
formulada para imitar a sujeira domstica tpica. Os resultados obtidos esto na Tabela 3A.9,
onde a resposta uma densidade tica que mede a intensidade da luz refletida pela roupa
lavada. O objetivo do experimento maximizar essa resposta. Os ingredientes e seus nveis
aparecem codificados, para garantir o sigilo industrial. As normas do laboratrio industrial
onde os testes foram realizados exigem que os ensaios sejam repetidos em grupos de doze.
2 75,719 2,993
4 + 76,998 4,285
6 + 75,557 3,803
8 + + 76,928 3,686
3 + 81,032 3,725
5 + + 82,298 2,690
7 + + 80,848 1,716
1 + + + 82,146 2,496
Efeitos:
Mdia A B c AB AC BC ABC
147
Como variar tudo ao mesmo
dois fatores, (veja Tabela 3A.10) com um modelo descrito por y = 78,94 + 0,65x A + 2,64xc (lem-
brando que os valores coeficientes do modelo so sempre a metade dos valores dos efeitos).
A c Resposta Mdia
75,64
+ 76,96
+ 80,94
+ + 82,22
e ~.....:
~ .
:
. .. ,: .,'
l .. '
~ . . ;.J..J;J "--';
.: :.................... . .
i"
148
4
Quando as variveis so muitas
Ordem
k 1 2 3 4 5 6 7
3 3 3 1
4 4 6 4 1
5 5 10 10 5 1
6 6 15 20 15 6 1
7 7 21 35 35 21 7 1
149
uu:anao as variveis so mtdtas
No projeto que vamos discutir nesta seo, os pesquisadores queriam otimizar um proce-
dimento analtico para determinar traos de molibdnio em plantas. Escolheram ento um
mtodo baseado na ao cataltica da espcie Mo(VI) sobre a oxidao do on 1- pelo H202,
feita num sistema de fluxo contnuo monossegmentado. De todos os fatores considerados
importantes para a produo do sinal analtico, quatro foram escolhidas para um estudo
preliminar: as concentraes de H202, H2S04 e KI, e o tempo de reao dessas espcies com o
Mo(VI). A influncia desses fatores sobre a intensidade do sinal analtico foi analisada por
meio de um planejamento fatorial 2 4 completo. A matriz de planejamento dos dezesseis
ensaios est na Tabela 4.2, bem como as intensidades observadas. Os valores dos efeitos
calculados a partir desses resultados so apresentados na Tabela 4.3. Pelo grfico normal
desses valores (Figura 4.1), podemos ver que so significativos os efeitos principais de [KI],
de [H22] e do tempo, e as interaes de [KI] com [H22] e de [KI] com o tempo. A concen-
trao de cido sulfrico no parece estar envolvida em nenhum efeito importante.
150
Tabela 4.2 Resultados de um planejamento fatorial 2 4 completo, realizado para estudar a
ao cataltica do Mo(VI).
Fator +
1 [H2S4], mol L-l 0,16 0,32
4 Tempo, s 90 130
Ensaio 1 2 3 4 Resposta(a)
.I 1 52
2 + 61
3 + 124
.I 4 + + 113
5 + 85
.I 6 + + 66
.I 7 + + 185
8 + + + 192
9 + 98
.I 10 + + 86
.I 11 + + 201
12 + + + 194
.I 13 + + 122
14 + + + 139
15 + + + 289
.I 16 + + + + 286
Exerccio 4.1
Use os dados da Tabela 4.2 e confirme que os valores dos efeitos significativos nesse
planejamento so mesmo os que aparecem na Tabela 4.3.
151
vuanoo as variveis so muitas
mente com os quatro efeitos principais e a mdia global. Todos esses valores (exceto a mdia,
claro) continuam sendo contrastes entre duas metades do conjunto de oito respostas. No
clculo de cada um deles usamos quatro respostas com sinal positivo e quatro com sinal
negativo. No entanto, como os clculos no se referem a um planejamento completo e sim a
uma frao, vamos usar a letra l para representar esses contrastes e assim distingui-los dos
efeitos do captulo anterior.
1 =- 2,38 13 = 2,88
2 = 109,38 14 = 1,13
3 = 54,38 23 = 25,63
4 = 67,13 24 = 21,88
34 = 9,88
123 = 2,63
134 = 5,38
234 = 0,13
4
2
....................
3
1
~.
N O
........ _;
...
-1 .......
~
1
f
-20 20 60 100
Efeito
Figura 4.1 Grfico normal dos valores dos efeitos calculados para o fatorial
completo 24 no estudo da ao cataltica do Mo(VI).
152
4
Fator +
1 [H2S04], mol L-i 0,16 0,32
4 t, s 90 130
Ensaio I 1 2 3 4 12 13 14 23 24 34 Resp.
1 + + + + + + + 52
10 + + + + + 86
11 + + + + + 201
4 + + + + + 113
13 + + + + + 122
6 + + + + + 66
7 + + + + + 185
16 + + + + + + + + + + + 286
l4= 69,75
Comparando os valores dos efeitos obtidos com o planejamento completo (Tabela 4.3)
e os contrastes calculados somente com a meia frao (Tabela 4.4), vemos que as estimativas
da mdia e dos efeitos principais so muito parecidas nos dois casos. Isto significa que pode-
mos estimar muito bem a mdia e os efeitos principais usando apenas oito ensaios, ou seja,
com a metade do esforo necessrio para fazer o planejamento completo.
153
Os valores das interaes significativas do fatorial completo tambm esto em boa
concordncia com os valores dos contrastes l23 e l24 calculados na meia frao. Em compen-
sao, as interaes envolvendo o fator 1 so muito superestimadas pelos valores de l12, l13
e l14. Tambm pudera. Seria timo poder reduzir o nmero de ensaios metade sem ter de
Apesar disso, a situao ainda pode ser remediada. Se admitirmos que as interaes
envolvendo o fator 1 no so importantes (porque o seu efeito principal desprezvel), ento
concluiremos que l12 == l13 == l14 == O. Esses novos valores, juntamente com l23 = 26,75,
l24 = 24,75 e l34 = 8,75 , so estimativas muito boas das interaes de dois fatores calculadas
O planejamento com oito ensaios mostrado na Tabela 4.4 uma frao meia do
fatorial completo da Tabela 4.2. Costuma-se represent-lo com a notao 2 4-1, que a metade
de 2 4 :
Esta notao indica que temos quatro fatores, cada um com dois nveis, mas realiza-
mos apenas oito ensaios. A presena do valor -1 no expoente significa que o fatorial completo
foi dividido por dois. Se ele tivesse sido dividido em quatro partes, o expoente seria 4-2, e
assim por diante.
Exerccio 4.2
Use os sinais da Tabela 4.4 para calcular os contrastes correspondentes s interaes 134 e
1234. J sabemos que no h mais graus de liberdade para isso, e que portanto esses valores
no devem ser independentes dos valores j calculados. Com que outros contrastes eles se
confundem? Voc acha que faz sentido interpretar esses valores como sendo realmente
estimativas dos efeitos 134 e 1234?
154
4.1(a) Como construir uma frao meia
idnticos, j que sero determinados pelos mesmos sinais. Este um resultado semelhante
ao obtido com a blocagem, no Captulo 3. Alm disto, como existem outras relaes de sinais,
envolvendo interaes de dois fatores e tambm interaes de ordem mais alta (Exerccio
4.2), o bom senso nos diz que deve haver outras identidades entre contrastes. Afinal, na
frao meia s temos oito graus de liberdade, enquanto o fatorial completo, com todos os
efeitos, tem dezesseis. Poderamos descobrir as relaes que faltam fazendo todos os
possveis produtos de colunas, mas isso no ser necessrio. Podemos descobri-las facilmente
atravs de uma lgebra muito simples.
4 = 123. (4.1)
11 = 22 = 33 = 44 = I.
155
QuandO as varhive~s so muitas
propriedades que acabamos de enunciar. Quando quisermos saber a que equivale deter-
minado contraste, s precisamos dar um jeito de faz-lo aparecer sozinho num dos lados da
Equao 4.1.
Digamos, por exemplo, que queremos saber qual o contraste que tem os mesmos
sinais que l2' Examinando a Equao 4.1, vemos que possvel isolar o fator 2 no lado di-
reito multiplicando 123 pelo produto 13, porque isso transformar em identidades o 1 e o 3
que j se encontram na equao. claro que temos de multiplicar tambm o outro lado, para
que a relao de igualdade permanea:
N a terminologia estatstica, dizemos que o emprego da frao meia confunde o efeito prin-
cipal 2 com a interao 134. O valor do contraste calculado, l2 (ou l134), na verdade uma
estimativa da soma dos dois efeitos. Voc pode confirmar que isso verdade, adicionando os
valores dos efeitos 2 e 134 na Tabela 4.3 e comparando o resultado com o valor de l2 na
Tabela 4.4.
Para mostrar que o contraste calculado confunde os dois efeitos e estima a sua soma,
costuma-se empregar a notao
l2 ~ 2 + 134.
Todas as relaes entre os contrastes calculados na frao meia 2 4-1 e os efeitos obtidos com o
planejamento completo 2 4 (os chamados padres de confundimento) so mostrados na se-
gunda coluna da Tabela 4.5.
Exerccio 4.3
Quantos ensaios tem um planejamento 28-4?
Exerccio 4.4
Escreva por extenso as expresses algbricas para o clculo dos efeitos 2 e 134 no fatorial 24
completo e mostre que o contraste l2 calculado na meia frao realmente corresponde soma
Exerccio 4.5
Todos os contrastes da Tabela 4.5 representam a soma de dois efeitos, exceto II , que estima a
156
Tabela 4.5 Relaes entre os contrastes da meia frao 24 -1 e os efeitos do fatorial completo
2 4 M a mdia de todas as respostas.
1 = 234
2= 134
3= 124
4= 123
12 = 34
13 = 24
14 = 23
1=1234 II -4 M + lh (1234)
Nossa frao meia foi obtida a partir da igualdade 4 = 123 (Equao 4.1). A literatura
costuma apresentar essa relao na forma equivalente
1= 1234, (4.2)
que obtida multiplicando-se os dois lados da equao 4.1 por 4. Nessa forma, onde o
elemento identidade aparece isolado, a expresso conhecida como geratriz (ou rela~o
geradora) do fatorial fracionrio. Ela suficiente para definir toda a frao meia, porque nos
permite obter todos os sinais da matriz de planejamento. Cada possvel frao de um pla-
nejamento completo sempre definida por um certo nmero de relaes geradoras.
Consideremos agora os ensaios restantes da Tabela 4.2, aqueles que no esto mar-
cados e que portanto no foram empregados nos clculos do fatorial fracionrio. Esses oito
ensaios tambm constituem uma metade, isto , uma frao meia, do planejamento com-
pleto. Voc pode confirmar facilmente que os sinais do fator 4 nesses ensaios so o contrrio
dos sinais do produto 123. Podemos dizer ento que essa outra frao gerada pela relao
4 = -123, (4.3)
1=-1234. (4.4)
157
t)uanao as variveis so mtdtas
z; ~ 2 -134.
As relaes entre os novos contrastes (identificados pelo asterisco) e os efeitos do pla-
nejamento completo so as mesmas da segunda coluna da Tabela 4.5, s que com sinais
negativos.
Tambm poderamos usar a segunda frao meia, que chamada de frao oomple-
mentar da primeira, para estimar os efeitos do fatorial. Os resultados finais levariam s
mesmas concluses. Com os valores e sinais apropriados, teramos, por exemplo,
Z; = 104,00 ,
tambm em boa concordncia com o valor do efeito principal 2 obtido para o fatorial com-
pleto, que 109,38.
Exerccio 4.6
Use os ensaios da frao meia complementar na Tabela 4.2 para calcular os valores dos con-
trastes Z~: , Z; , e Z: . Compare os resultados com os valores dados na Tabela 4.4 e tambm com
Somando-os, teremos
Z2 + Z; = (2 + 134) + (2 - 134) = 2 + 2 .
o valor do efeito principal ser portanto a metade da soma dos dois contrastes:
Da mesma forma, a interao 134 ser dada pela metade da diferena entre Z2 e Z; :
158
Exerccio 4.7
Como voc combinaria os valores dos contrastes para obter o efeito de interao 1234? Faa as
contas e compare o resultado com o valor dado na Tabela 4.3.
A frao 24-1 tem uma caracterstica importante. Seus contrastes no misturam os efeitos
principais com interaes de dois fatores, e sim com interaes de trs fatores, que em
princpio devem ser menos significativas. Se essas interaes forem mesmo desprezveis, os
contrastes devem fornecer timas aproximaes dos efeitos principais calculados no fatorial
Como j devamos esperar, precisamos pagar algo por isto. Os contrastes li} (ou 1;;)
so combinaes de pares de interaes de dois fatores, e sua interpretao fica mais difcil.
Consideremos, por exemplo, o valor de 114 na Tabela 4.4, 26,75. Pelos padres de confun-
dimento (Tabela 4.5), esse valor corresponde soma das interaes 14 e 23. Ele deve ser
atribudo principalmente a 14, a 23, ou igualmente s duas?
S com os resultados da Tabela 4.4 no temos como saber, a rigor. No entanto, esses
mesmos resultados indicam que o fator 1 (a concentrao de H2S04) no tem efeito principal
significativo, ao contrrio dos fatores 2 ([KI]) e 3 ([H202]), o que nos inclina a supor que a
interao 23 deve ser, em princpio, mais importante que a interao 14. Conseqentemente,
o valor do contraste 123 (ou 114 ) deve ser uma boa aproximao da interao entre os fatores
Esta hiptese um tanto arriscada, mas nesta investigao especfica ela mostrou-se
vlida. Pelo clculo completo, 23 = 25,63, enquanto o valor de 14 apenas 1,13. Infelizmente,
nem sempre isso funciona. Se num dado experimento s tiverem sido feitos os ensaios
correspondentes a uma meia frao e se for mesmo necessrio distinguir entre duas
interaes de dois fatores, teremos de fazer os oito ensaios restantes para completar o
fatorial. S assim poderemos estimar separadamente os efeitos. 1
159
o planejamento 24-1 um exemplo de fatorial fracionrio de resoluo quatro. Num
fatorial de resoluo quatro os efeitos principais no se misturam com as interaes de dois
fatores mas estas, por sua vez, misturam-se entre si. A notao empregada para representar
a resoluo de um planejamento um ndice em algarismos romanos. Aqui, por exemplo,
4-1
escrevemos 2 IV.
Exerccio 4.8
Os resultados abaixo foram obtidos numa investigao cujo objetivo era a otimizao do ren-
dimento de uma reao orgnica (R. S. Correa Neto, S. M. G. de Barros, M. Penso e D. Lan-
dini, Optimization of an Alkylation under PTC Conditions, 5th Brazilian Meeting on Organic
Synthesis, Campinas, 1992).
Fatores +
2 (Base) fuC03fNaOH
3 (Solvente)
Ensaio 1 2 3 4 Rendimento( %)
1 o
2 + + 70
3 + + 65
4 + + o
5 + + 100
6 + + 85
7 + + 50
8 + + + + 95
160
4.2(b) Fatoriais fracionrios de resoluo cinco
No estudo do sinal analtico do Mo(VI), na verdade foi investigado mais um fator alm dos
quatro j mencionados: o fluxo atravs do sistema monossegmentado. Os dezesseis ensaios
cujos resultados aparecem na Tabela 4.2 no correspondem realmente a um planejamento
24 , e sim a uma frao meia de um planejamento 25 , que apresentada na Tabela 4.6. Essa
frao foi construda a partir da relao 5 = 1234, ou, o que a mesma coisa, a partir de
1=12345. (4.5)
Tabela 4.6 Um planejamento fracionrio 2~-1 para o estudo da resposta cataltica do Mo(VI).
Fator Nvel
+
1 [H2S04], mol L-I 0,16 0,32
2 [KI], mol L-I 0,015 0,030
3 [H202], mol L-I 0,0020 0,0040
4 t, s 90 130
5 Fluxo, ml min- I 1,2 3,0
1 2 3 4 5
Ordem [H2S04] [KI] [H202] t Fluxo Resposta
5 + 52
13 + 61
12 + 124
4 + + + 113
11 + 85
3 + + + 66
6 + + + 185
14 + + + 192
10 + 98
2 + + + 86
7 + + + 201
15 + + + 194
8 + + + 122
16 + + + 139
9 + + + 289
1 + + + + + 286
161
Trata-se portanto de uma frao meia de resoluo cinco, para a qual podemos usar a no-
tao 2~-1 . Os efeitos principais na verdade esto misturados somente com as interaes de
quatro fatores, enquanto as interaes de dois fatores se misturam com as de trs. Todas as
relaes entre os contrastes desse fatorial fracionrio e os efeitos do planejamento completo
esto na Tabela 4.7, juntamente com os valores dos contrastes calculados a partir dos dados
da Tabela 4.6.
Tabela 4.7 Estimativas dos contrastes do fatorial fracionrio 2~-1 e suas relaes com os
efeitos do fatorial completo. Os valores em negrito so os mais significativos.
162
UUianao as variveh; so muitas
No cubo da Figura 4.2, a resposta varia muito mais entre um vrtice e outro do que
dentro de um mesmo vrtice. Os valores mais altos ocorrem quando todos os trs fatores
esto nos seus nveis superiores, isto , na combinao de sinais (2 3 4) = (+ + +). Como o
objetivo do experimento aumentar a sensibilidade do mtodo analtico, podemos concluir
que seria aconselhvel realizar mais ensaios em torno dessa regio.
,I ' 1I
J/jt
Figura 4.3 Representao geomtrica dos trs fatoriais completos 2 2 embu-
tidos numa frao 23-1 .
nas outras variveis. Se eliminarmos duas variveis, passaremos a ter dois fatoriais 22 com-
pletos nas outras duas. No exemplo do Mo(VI), j vimos o que acontece quando duas vari-
veis so retiradas de uma frao 2~-1 . O que aconteceria se eliminssemos trs variveis?
164
165
(JUian:oo as variveis so muitas
Para construir as fraes meias apresentadas at agora, usamos o efeito de interao de or-
dem mais alta para determinar os sinais da coluna de um dos fatores. No primeiro exemplo,
partimos de um fatorial 2 3 e usamos a interao 123 para definir os nveis da quarta
varivel, por meio da relao I = 1234. Isso nos levou a uma frao de resoluo quatro.
Exerccio 4.11
Construa um planejamento fracionrio 2 5- 1 usando a relao 5 = 124. Determine, nessa frao,
as relaes existentes entre os contrastes correspondentes a um e a dois fatores e os efeitos
calculados num fatorial completo. Voc pode imaginar uma situao em que esse
planejamento fosse prefervel, ao invs do fatorial de resoluo mxima?
No exemplo analisado at agora, conclumos que somente trs, das cinco variveis de
partida, afetam significativamente a intensidade do sinal analtico. Como o sistema de an-
lise em fluxo relativamente complexo, teria sido difcil prever quais seriam as variveis
166
mais importantes. Nesta investigao, na verdade, os pesquisadores no tinham certeza nem
dos valores que deveriam escolher para os dois nveis de cada varivel.
At agora, tratamos apenas de fraes meias, nas quais fazemos metade dos ensaios do
planejamento completo. Dependendo do nmero de fatores, essa frao ainda pode ser grande
demais. Se esse for o caso, nosso prximo passo considerar planejamentos fracionrios con-
tendo apenas um quarto do total de ensaios. Com cinco variveis, como no exemplo do Mo(VI),
o planejamento teria apenas oito ensaios e corresponderia a uma frao 25-2 Para construir sua
matriz, comearamos com um fatorial 23 baseado em trs das cinco variveis. Em seguida,
precisaramos de duas relaes geradoras para definir os nveis das duas variveis restantes.
Para chegar ao planejamento mostrado na Tabela 4.9, partimos das relaes 4 = 123
e5 = 12, o que equivale a fazer I = 1234 e I = 125. Como o menor termo nessas relaes con-
tm trs fatores, o planejamento tem resoluo trs, e sua notao completa 2~ii2 . Eviden-
167
Tabela 4.9 Anlise de uma frao 2~ii? para o estudo da resposta cataltica do Mo(VI), com
resultados parcialmente simulados.
Fator Nvel
+
1 [H2S04], mol L-l 0,16 0,32
2 [KI], mol L-l 0,015 0,030
3 [H202], mol L-l 0,0020 0,0040
4 t, s 90 130
5 Fluxo, ml min- 1 1,2 3,0
1 2 3 4 5 Sinal
[H2S04] [KI] [H202] t Fluxo (x1000)
+ 52
+ + 92*
+ + 198*
+ + + 113
+ + + 122
+ + 76*
+ + 189*
+ + + + + 286
* Resultados simulados, baseados nas respostas apresentadas na Tabela 4.6. Por exemplo, o resultado
92 para o ensaio (+ - - + -) foi obtido fazendo-se uma mdia das respostas 98 e 86, observadas nos
ensaios (--- + -) e (+ - - + +) da Tabela 4.6.
Quatro dos ensaios da Tabela 4.9 so idnticos a ensaios da Tabela 4.6. As respostas
para esses ensaios so portanto as mesmas nas duas tabelas e representam valores reais,
obtidos no laboratrio. Os outros quatro ensaios tm combinaes de nveis para as quais os
experimentos no tinham sido realizados. Suas respostas so valores simulados, obtidos a
partir dos prprios dados experimentais da Tabela 4.6. Os contrastes calculados para as
cinco variveis tambm so mostrados na Tabela 4.9, onde podemos observar que os valores
esto em tima concordncia com as estimativas da mdia e dos efeitos principais deter-
168
minados no planejamento 2~-1 (Tabela 4.7). Analisando os resultados da frao quarta 25-2 ,
Exerccio 4.12
Os efeitos confundidos num determinado contraste so determinados pelas relaes geradoras
do fatorial e por todos os seus possveis produtos. Nos planejamentos 24 - 1 e 2 5- 1 s havia uma
relao geradora, e por isso os efeitos eram confundidos dois a dois. No planejamento 25-2 ,
como existem duas relaes geradoras, precisamos considerar trs equaes: as prprias
relaes, I = 1234 e I = 125, e o seu produto, (1)(1) = I = (1234)(125) = 345. Cada efeito estar
portanto confundido com outros trs. (a) Use estas relaes para mostrar que o efeito prin-
cipal 1 se confunde com as interaes 25, 234 e 1345; (b) Que interaes esto confundidas
com o efeito principal5?
Problemas de otimizao envolvendo mais de, digamos, uma meia dzia de fatores no so
muito comuns na vida acadmica. Alm de o pesquisador ter plena liberdade para definir
seus projetos de pesquisa, e conseqentemente poder escolher problemas mais simples,
muito mais fcil controlar as variveis num experimento de bancada. Na indstria, a
situao exatamente oposta. O problema a ser atacado geralmente imposto por
circunstncias alheias vontade do pesquisador, e sua resoluo costuma apresentar
maiores dificuldades, entre as quais a de que no h tempo a perder. por isso que os
planejamentos fracionrios, que permitem uma triagem eficaz de um conjunto de muitas
variveis, so particularmente importantes para laboratrios industriais.
2 Devemos lembrar que este um exemplo didtico, onde aproveitamos resultados obtidos em outro
planejamento. Numa aplicao real, os pesquisadores tm de realizar de verdade os quatro ensaios
cujas resposta foram simuladas aqui.
169
saturado. Nesta seo vamos usar um planejamento saturado para analisar um estudo
emprico realizado bem longe do laboratrio.
Tabela 4.10 Um planejamento fracionrio saturado de oito ensaios, para avaliar como sete
variveis afetam o saque de um tenista amador.
Fator Nvel
+
1 Tcnica chapada cortada
2 Freqncia baixa alta
3 Hora dia noite
4 Revestimento saibro concreto
5 Lado direito esquerdo
6 Camisa com sem
7 Raquete mdia grande
1 + + + 56
2 + + + 66
3 + + + 51
4 + + + 52
5 + + + 54
6 + + + 70
7 + + + 42
8 + + + + + + + 64
3 Quem ser?
170
Outros fatores, como o vento e a chuva, podem afetar a preciso do saque. Fatores
desse tipo obviamente fogem ao controle do pesquisador, mas foram tomadas precaues
para evitar sua influncia. Quando, na execuo dos experimentos, as condies atmosfricas
se mostraram adversas, os ensaios foram adiados at o tempo melhorar. Cada um dos
ensaios consistiu num total de cem saques. O nmero de saques vlidos em cada ensaio
mostrado na ltima coluna da Tabela 4.10.
Tabela 4.11 Contrastes calculados na frao 2}li4 , e suas expresses em termos dos efeitos
principais e das interaes binrias de um fatorial completo 2 7
Tcnica: II = 12,25 ~ 1 + 24 + 35 + 67
Freqncia: 12 = -9,25 ~ 2 + 14 + 36 + 57
Hora: 13 = 1,25 ~ 3 + 15 + 26 +- 47
Revestimento: 14 = -0,75 ~ 4 + 12 + 56 + 37
Lado: 15 = 6,75 ~ 5 + 13 + 46 + 27
Camisa: 16 = 0,25 ~ 6 + 23 + 45 + 17
Raquete: 17 = 3,75 ~ 7 + 34 + 25 + 16
171
Quando as varLve~s so muitas .~---------------------~-------
Exerccio 4.13
Calcule o valor do contraste correspondente ao efeito principal do lado da quadra, usando os
dados da Tabela 4.10.
Exerccio 4.14
No fatorial 2 7-4 cada efeito principal confundido com quinze interaes. Para descobrir o que
se confunde com o qu, necessrio usar, alm das quatro relaes geradoras, seus seis
produtos binrios, seus quatro produtos ternrios e finalmente o produto de todas elas.
Determine que interaes esto confundidas com o efeito principal que representa o lado da
quadra.
4 Depois que se aprende, na verdade, a batida cortada mais fcil de controlar que a chapada. No caso
do outro fator, realizar os saques a intervalos maiores permite que o jogador se concentre mais, o que
ajuda a melhorar o aproveitamento.
172
Esta anlise, feita por alto, considerou desprezveis todos os efeitos de interao.
Ser que no estamos enganados? Quem sabe se esses efeitos que desprezamos no so os
verdadeiros responsveis pelos altos valores dos contrastes?
uso de uma raquete maior permite sacar com maior freqncia sem piorar o ndice de
acertos.
Tabela 4.12 Um planejamento fracionrio saturado de oito ensaios que, junto com a frao
da Tabela 4.10, permite separar o efeito principal do fator 5 das interaes de dois
fatores. Os sinais do fator 5 so opostos aos da Tabela 4.10. Os outros fatores per-
manecem com os mesmos sinais.
Ensaio 1 2 3 4 5 6 7 % acertos
1 + + 52
2 + + + + 74
3 + + 50
4 + + + + 60
5 + + + + 54
6 + + 62
7 + + + + 50
8 + + + + + + 63
173
Para resolver essa questo, o pesquisador-atleta fez um novo planejamento, cons-
trudo de forma a separar (ou, como s vezes se diz, des<XJDfundir) o valor do efeito principal
5 da soma 13 + 46 + 27. Esse planejamento, que apresentado na Tabela 4.12, baseia-se nas
mesmas relaes usadas na Tabela 4.10, com uma exceo. Para o fator 5, que queremos des-
confundir, empregamos a relao 5 = - 13, ao invs de 5 = 13. Os dois fatoriais so portanto
idnticos, exceto pelos nveis atribudos ao fator 5, que tm sinais exatamente opostos nas
duas tabelas. essa caracterstica que vai nos permitir isolar o efeito principal 5, combi-
nando os resultados dos dois planejamentos.
Exerccio 4.15
Cada ensaio das Tabelas 4.10 e 4.12 corresponde realizao de saques sob certas condies,
especificadas pelos sinais das respectivas matrizes de planejamento. Descreva a realizao do
ensaio n Q 4 na Tabela 4.10. Qual a diferena, em termos prticos, entre esse ensaio e o ensaio
n Q 4 da Tabela 4.12?
Tabela 4.13 Contrastes calculados na segunda frao 2 7-4 e suas expresses em termos dos
efeitos principais e das interaes binrias do planejamento completo 2 7
Tcnica lO::
1 = 13,25 = 1 + 24- 35 + 67
Freqncia: l; = - 4,75 = 2 + 14 + 36- 57
174
Para isolar o efeito principal 5, combinamos os dois contrastes em que ele aparece:
Da mesma forma,
1 -l*
13 + 46 + 27 = _5_ _
5 = 2,00 .
2
A Tabela 4.14 mostra as combinaes dos outros contrastes. Voc pode perceber que,
alm de isolar o efeito principal 5, tambm conseguimos isolar todas as interaes binrias
envolvendo esse fator. Os valores absolutos dessas interaes so todos inferiores a 2,25. Se
admitirmos que o valor verdadeiro de todas elas zero, podemos empregar os sete valores da
Tabela 4.14 que s correspondem a interaes de dois fatores para estimar o erro de um
contraste:
Com essa estimativa do erro, podemos finalmente concluir que s os contrastes en-
volvendo os efeitos principais da tcnica (1), da freqncia (2), do lado da quadra (5) e do
tamanho da raquete (7) tm valores significativos, no nvel de 95% de confiana.
Outras fraes podem ser executadas, caso seja necessrio isolar outros efeitos. No
total, existem dezesseis planejamentos 2 ;ii
4
diferentes, definidos pelas possveis combina-
175
Quando as variveis so muitas
Teramos ento uma melhor estimativa do efeito principal deste que parece ser o fator mais
importante, e tambm estimativas de todas as interaes binrias de que ele participa.
Contraste
1 II +1; 12,25 + 13,25 12,75 = 1 + 24 + 67
2 2
176
4.3(c) Como construir uma frao de resoluo trs
4.3(d) Como construir uma frao 2~V4 a partir de uma frao 2}ii4
tando ao planejamento de partida uma coluna para o fator 8, toda de sinais positivos. Como
um planejamento 28 - 4 deve ter dezesseis ensaios, precisamos de mais oito linhas. Para obter
os sinais que faltam, devemos inverter os sinais dos oito primeiros ensaios, linha por linha.
O nono ensaio ser o primeiro com os sinais trocados, o dcimo ser a inverso do segundo, e
assim at o dcimo sexto, que s tem sinais negativos e portanto obtido a partir do oitavo.
Com isto teremos de realizar o dobro de ensaios, mas o trabalho adicional com-
pensado com uma melhora na resoluo. Como o novo planejamento definido pelas relaes
1= 1248, I = 1358, 1= 2368 e 1= 1237, sua resoluo passou a ser quatro.
177
Tabela 4.15 Uma frao de resoluo quatro, 2~4, definida por I = 1248 = 1358 = 2368 =
1237.
Ensaio 1 2 3 4 5 6 7 8
1 + + + +
2 + + + +
3 + + + +
4 + + + +
5 + + + +
6 + + + +
7 + + + +
8 + + + + + + + +
9 + + + +
10 + + + +
11 + + + +
12 + + + +
13 + + + +
14 + + + +
15 + + + +
16
Exerccio 4.16
Como se chega s relaes geradoras da Tabela 4.15? Por que elas no se alteram quando os
sinais dos ensaios so trocados, como foi feito para os ensaios 9-16?
Exerccio 4.17
Use as relaes geradoras dadas na Tabela 4.15 e verifique com que interaes de trs fatores
o efeito principall est confundido.
178
Tabela 4.16 Contrastes da frao 2~4, em funo dos efeitos principais e das interaes
binrias do fatorial completo 2 8 , desprezando-se as interaes de mais de dois fa-
tores.
l1 =1 l12 = 12 + 37 + 48 + 56
l2 =2 l13 = 13 + 27 + 46 + 58
l3 =3 l14 = 14 + 28 + 36 + 57
l4 =4 l15 = 15 + 26 + 38 + 47
l5 =5 l16 = 16 + 25 + 34 + 78
l6 =6 l17 = 17 + 23 + 68 + 45
l7 =7 l18 = 18 + 24 + 35 + 67
l8 =8
J vimos que, dispondo de condies materiais para realizar 8, 16, 32, ... , 2m ensaios, pode-
mos empregar planejamentos saturados e com eles estudar a influncia de at 7, 15, 31, ... ,
2m - 1 fatores. Uma outra classe de planejamentos fracionrios emprega um total de 12, 20,
24,28, ... ensaios para investigar simultaneamente at 11, 19,23,27, ... fatores. Esses planeja-
mentos, propostos por R. L. Plackett e J. P. Burman, permitem estimar todos os k = n - 1
efeitos principais (onde n representa o nmero de ensaios) com varincia mnima (Plackett
e Burman, 1946). A Tabela 4.17 mostra o planejamento Plackett-Burman correspondente
a n = 12.
sempre correspondem, nas demais colunas, a n/4 sinais positivos e n/4 sinais negativos. A
mesma coisa ocorre com os sinais negativos. Em outras palavras, as colunas so todas
ortogonais, e essa simetria permite que os efeitos principais de cada fator sejam determi-
nados individualmente, admitindo-se que os efeitos de interao sejam desprezveis.
179
Quando as variveis s~o mu~tas
devemos estudar no mximo oito fatores. Os trs graus de liberdade restantes 5 podem ser
usados para estimar os erros nos valores calculados para os efeitos principais.
Ensaio I 1 2 3 4 5 6 7 8 9 10 11
1 + + + + + + +
2 + + + + + + +
3 + + + + + + +
4 + + + + + + +
5 + + + + + + +
6 + + + + + + +
7 + + + + + + +
8 + + + + + + +
9 + + + + + + +
10 + + + + + + +
11 + + + + + + +
12 +
No Japo do ps-guerra, Genichi Taguchi, que trabalhava na Nippon Telephone & Tele-
graph Co., dedicou-se tarefa de ajudar os engenheiros japoneses a desenvolver produtos de
qualidade, apesar das condies bastante desfavorveis que prevaleciam naquela poca:
matria-prima inferior, equipamentos ultrapassados, e ainda por cima falta de pessoal quali-
ficado. Taguchi desenvolveu ento uma abordagem baseada em planejamentos experimen-
tais, feitos com o objetivo de projetar produtos ou processos que
180
Fossem pouco sensveis a variaes nos componentes;
Qualquer desvio em relao ao valor alvo passou a ser considerado indesejvel, mesmo
que o produto estivesse dentro dos limites de especificao.
Consideremos uma mistura para bolo, fabricada, digamos, com quatro ingredientes:
farinha de trigo, acar, ovos e gordura vegetal. Quando o cozinheiro vai preparar o bolo,
tem de adicionar leite, ajustar a temperatura do forno e controlar o tempo que a massa vai
ficar assando. Esses fatores tambm afetam o resultado final, mas esto fora do alcance do
fabricante, por mais explcitas que sejam as instrues na embalagem.
Aos primeiros fatores, que podem ser controlados durante a fabricao da mistura,
Taguchi chama de parmetros. Os outros so fontes de rudo. Na abordagem de Taguchi,
estes ltimos tambm devem ser includos durante o planejamento e o desenvolvimento do
produto. Para isso ele recomenda o uso de planejamentos fatoriais ortogonais, semelhantes
aos que vimos neste captulo.
Para Taguchi, a resposta deve estar to prxima do alvo quanto possvel, mas
tambm deve ser robusta (pouco sensvel) influncia do rudo. Isto significa que devemos
levar em conta no s as respostas dos ensaios no arranjo interno como tambm sua variao
com o rudo. Dois ensaios da tabela, o segundo e o oitavo, produzem respostas mdias
exatamente sobre o alvo (80). No entanto, o segundo ensaio deve ser preferido, porque tem
um desvio padro de apenas 1,83, contra 4,97 do oitavo.
181
Tabela 4.18 Planejamento de Taguchi para o desenvolvimento de uma mistura para bolo.
Um arranjo interno L8 para quatro parmetros (Farinha, Gordura, Acar e Ovos)
cruzado com um arranjo externo L4 para trs fatores ambientais. O significado de
SNT explicado no texto. O valor alvo para y (uma medida de textura) 80.
Tempo/LeitelTemperatura
+ 82 81 78 79 80 1,83 32,8
+ + 84 91 95 90 90 4,55 25,9
+ + 86 85 90 91 88 2,94 29,5
+ + + 86 82 77 75 80 4,97 24,1
-2
Y
SNT =1010g2"" '
s
cujos valores aparecem na ltima coluna da Tabela 4.18. Por este critrio, o segundo ensaio
tambm seria o escolhido. J o oitavo ensaio, que dos outros sete o nico centrado no valor
alvo, ficaria em antepenltimo lugar, ganhando apenas do quarto e do sexto ensaios. Isto
uma conseqncia da nfase taguchiana na robustez da resposta em relao ao rudo.
tambm uma das razes para as crticas que os mtodos de Taguchi tm sofrido ultimamente.
182
Taguchi sugere que os experimentos utilizem ensaios de dois nveis, definidos por
planejamentos em redes ortogonais designadas por L4, L8, L12, L16 e L32, onde o nmero
indica o total de ensaios de cada planejamento. A rede L4 um fatorial fracionrio 23-1 , no
qual os nveis da terceira varivel so definidos pela relao geradora I = 123. O
planejamento L8 equivalente ao fatorial 2 7-4 mostrado na Tabela 4.10, s que construdo a
partir das relaes geradoras I = - 124, I = - 135, I = - 236 e I = 1237. Nas matrizes de
planejamento de Taguchi as colunas so dispostas numa ordem diferente da ordem padro
que apresentamos neste livro, mas como qualquer fator pode ser atribudo a qualquer coluna
de sinais, os dois tipos de planejamento so idnticos.
Taguchi prope ainda planejamentos com trs ou mais nveis, que podem ser usados
para identificar tendncias no-lineares nas relaes entre as respostas e os fatores, mas
esses planejamentos no so capazes de estimar interaes de dois fatores.
183
ou:an:ao as variveh; so muitas
o uso das relaes sinal-rudo tambm tem sido duramente criticado. Ao combinar y
2
e 8 num nico valor numrico, estamos misturando proximidade em relao ao alvo com
flutuao causada pelo rudo, e por isto muitos pesquisadores preferem analisar separa-
damente os valores das respostas e suas varincias. Vimos a diferena que faz usar ma
abordagem ou a outra, na anlise dos resultados da Tabela 4.18.
184
4A Aplicaes
Num experimento preliminar de um estudo que tinha como objetivo estudar a adsoro de
Cu(II) em superfcies de slica organofuncionalizadas (obtidas quando grupos Si-OH na su-
perfcie da slica se ligam a alcoxisilanos), empregou-se o planejamento fracionrio cujos
dados esto a seguir (Cestari, Bruns e Airoldi, 1996).
1 0,39
2 + + 1,74
3 + + 1,37
4 + + 1,68
5 + + 4,66
6 + + 6,12
7 + + 6,09
8 + + + + 2,61
Contrastes:
185
3
O
1 1tt1t
I 4 i I I
I o I I I I
~ o __-[-Ot-..-I_.._J....t .
F I I I I
4 {:> ! i ! !
1 :~ _ l- r r r _ ..r .
2,61
__1
,
o grfico normal mostra como o contraste 3 (+3,58) se destaca dos demais. J de-
vamos esperar por esse resultado, porque as quatro ltimas respostas, que correspondem ao
186
nvel superior do fator 3, tm valores maiores do que as quatro primeiras. Mas no s isto.
Os outros contrastes, embora bem menores em valor absoluto, so todos negativos, o que
sugere que eles representam um comportamento sistemtico, e no apenas uma manifes-
tao do erro puro. Esta suspeita confirmada pelo grfico cbico (Fig. 4A.2). Tanto o fator 2
(sal) quanto o fator 4 (quantidade de slica) tendem a diminuir a resposta quando passam do
nvel inferior para o superior. Isto ocorre em trs dos quatro efeitos individuais de ambos os
fatores. As duas excees envolvem o valor da resposta no ensaio (1 2 3 4) = (- - - -), que
muito baixo (0,39). De qualquer forma, a Figura 4A.2 deixa claro que, se quisermos au-
mentar a quantidade de Cu(ll) adsorvida, devemos no apenas fixar o fator 3 no seu nvel
superior (isto , usar etanol como solvente), mas tambm fixar o fator 4 no seu nvel inferior
- isto , usar menos slica. Nessas condies, o tipo de sal no parece fazer muita diferena.
O segundo contraste mais significativo a interao 34 (=12 = -1,50). Voc consegue
entender por qu, examinado a Figura 4A.2?
Um planejamento fatorial fracionrio 2~ij2 foi usado para avaliar os efeitos do fluxo de nitro-
+
Fatores: 1: Fluxo de nitrognio, ml min- 1 30 15
2: Massa da amostra, g 4 10
187
Quando as V'arive~s so muitas
2 + + 695,4
3 + + 734,7
4 + + + 738,4
5 + + + 780,8
6 + + 768,9
7 + + 822,8
8 + + + + + 856,1
Contrastes:
1 2 3 4 5 13 23
Aqui, como se trata de uma frao quarta, os efeitos esto confundidos quatro a quatro, e a
interpretao dos contrastes fica um pouco mais complexa. Devemos nos lembrar de que os r-
tulos da tabela acima na verdade significam somas de quatro efeitos. O valor mais signi-
ficativo, 83,43, na verdade a soma de efeitos 3 + 45 + 124 + 1235. Tambm no podemos
deixar de perceber que sete dos oito contrastes tm valores positivos, e o nico contraste
negativo justamente o menos significativo de todos. Mesmo assim, possvel extrair algu-
mas concluses. Como os contrastes mais significativos so 3, 2, 5 e 23, veja Figura 4A.3, um
grfico cbico das respostas nos fatores 2, 3 e 5 (Figura 4A.4) nos ajudar na interpretao,
que mais simples do que no exemplo anterior. Todos os contrastes individuais agora so
positivos, ao longo dos trs os eixos da figura. Fazendo a ressalva de que estamos falando de
contrastes que na verdade abrigam quatro efeitos, tambm podemos notar evidncia de inte-
rao entre os fatores. Por exemplo, quando o fator 2 (massa) est no nvel inferior, o efeito
mdio do fator 3 (taxa de aquecimento) 64,0. Quando o fator 2 passa para o seu nvel supe-
rior, isto , quando usamos uma amostra mais pesada, o efeito mdio da taxa de aqueci-
mento sobe para 103,0. Como o fluxo de nitrognio e o tipo de cadinho no afetam a posio do
pico, podemos usar um fluxo menor (15 ml min- I ) e o cadinho de Al203, que muito mais
barato que o cadinho de platina. Efeitos positivos para a massa da amostra e a taxa de
aquecimento j eram esperados pelos pesquisadores, por causa da demora para se alcanar
o equilbrio trmico.
188
Capitu~o 4
o 3
02
5
,..
~ o \"
23
O
iO
-1
-2
-20 o 20 40 60 80 100
Efeitos
856,1
189
Quando as variveis so muitas
+
Fatores: 1: Volume ocupado pela amostra, mL 10 19
2. Temperatura da amostra, e 50 80
1 + + 49
2 + + 21
3 + 15
4 + + + 1
5 + + 42
6 + + 2
7 + + + 25
8 + + + + + 32
* ua = unidades arbitrrias
Contrastes:
1 2 3 4 5 13 15
190
Capitu~o 4
32
+1
21
(fl
~
......
~
g;l
E"
..1
~,
~~.
~ ~~
~~'- ~
~ ,~~~
~
1 Qual?
191
Quando as variveis so muitas
fatores. Os resultados obtidos esto na Tabela 4A.4. A resposta a relao entre a quan-
tidade de ciclohexanol produzida na reao catalisada pela porfirina e uma quantidade fixa
de um padro interno previamente adicionado ao meio de reao.
2: Temperatura, De o Ambiente
3: Tempo, mino 30 90
5: Razo <t>IO/MnP 90 15
Ensaio 1 2 3 4 5 6 7 % ciclohexanol
1 + + + 34,3
2 + + + 5,6
3 + + + 3,6
4 + + + 2,9
5 + + + 19,8
6 + + + 19,6
7 + + + 4,4
8 + + + + + + + 3,85
Contrastes:
1 2 3 4 5 6 7
Dois fatores, o tempo (3) e a presena de imidazol (6), no parecem ter importncia, o que
transforma o planejamento numa frao 2 5- 2 Quanto aos cinco restantes, dois agem no
sentido de aumentar o teor de ciclohexanol - a concentrao de catalisador e a razo
<t>IO/MnP -, enquanto os outros trs (o modo de agitao, a natureza do solvente e princi-
192
Capitu~o 4
palmente a temperatura) atuam para diminu-lo. A Figura 4A.5 mostra como os dois prin-
cipais fatores afetam as respostas. Devemos suspeitar de alguma interao entre eles? Qual
dos outros trs fatores importantes (4, 5 e 7) voc associaria com a diferena entre as
respostas obtidas nos pares de experimentos onde (12) = (--) e (12) = (+ -)?
( ~~
" 0
t!""l.:........, .
: ~
2: Aditivo, % 1 2
193
Ensaio 1 2 3 4 Tempo, s
1 32,5
2 + + 26,0
3 + + 76,0
4 + + 38,5
5 + + 74,0
6 + + 35,5
7 + + 23,0
8 + + + + 42,0
Contrastes:
Os valores calculados para os contrastes parecem no deixar dvida de que s h dois fato-
res importantes (1 e 4 - solvente e tempo), e que a interao entre eles tambm impor-
tante. Tomando os fatores 2 e 3 como inertes, ficaremos com um planejamento fatorial 22
duplicado (Tabela 4A.6), do qual poderemos extrair uma estimativa do erro puro e conse-
qentemente uma medida da significncia dos efeitos.
A varincia agregada dos ensaios em duplicata 44,91. O desvio padro a raiz qua-
drada deste valor, 6,70. A varincia de um efeito metade disto, 22,45, e portanto o seu erro
padro 4,74. Como a estimativa da varincia agregada tem quatro graus de liberdade, o
intervalo de 95% de confiana dado por
194
Capitu~o 4:
confirmando que apenas trs contrastes so significativos, como a simples inspeo dos va-
lores calculados j havia apontado. A Figura 4A.6 nos permite visualizar o que significam na
prtica os valores calculados. Quando o solvente o hexano, o aumento da permanncia na
estufa eleva bastante a resposta. Quando o lcool, praticamente no faz diferena. O obje-
tivo do experimento era minimizar o valor da resposta - o tempo de escoamento do xido.
Nossa anlise mostra que isto pode ser conseguido de mais de uma maneira, e curioso no-
tar que as duas menores respostas obtidas nos oito experimentos correspondem aos ensaios
7 e 2 , que so diametralmente opostos nos sinais dos fatores 1 e 4. Concluso: o que real-
mente no devemos fazer, se queremos obter um baixo tempo de escoamento, usar hexano
e deixar o xido na estufa por muito tempo.
80 r-----.------,-------~----_....,.------_,
60 r,,: .. /
(lj
+J
C/)
O
C-
C/)
Q)
a:: 40 1- ; -/- ;....
.................
0
-o- Hexano
195
Quando as variin..Hs so muitas
+
Fatores: 1: Fonte de carbono (D-glicose) 0,25% 1%
Ensaio 1 2 3 4 5 6 7 8 9 10 11 Resposta
1 + + + + + + 0,39
2 + + + + + 0,19
3 + + + + + 0,26
4 + + + + 0,14
5 + + + + + 0,26
6 + + + + 0,15
7 + + + + 0,31
8 + + + + + + + 0,00
9 + + + + 0,09
10 + + + + + 0,00
11 + + + + + 0,24
12 + + + + + + 0,26
13 + + + + + 0,17
14 + + + + + + 0,14
15 + + + + + + 0,26
16 + + + + + + + + + + + 0,31
196
Contrastes:
1 2 3 4 5 6 7 8
-0,99 0,049 0,04 -0,029 0,009 -0,001 0,086 -0,009
9 10 11
Como os sinais das colunas 12 - 15 no correspondem a nenhum fator real, podemos usar os
valores dos contrastes calculados a partir delas como estimativas do erro padro de um
efeito (supondo, claro, que todas as interaes sejam desprezveis). Podemos obter uma
estimativa agregada, com quatro graus de liberdade, a partir de
0,251
Figura 4A.7 - Respostas mdias da Tabela 4A.6, em funo dos fatores 9,7 e 1.
197
Quando as varive~s so muitas
A produo industrial de uma resina polister insaturada controlada por vrios fatores,
cujos nveis conferem ao produto determinadas caractersticas importantes para o seu pro-
cessamento posterior, por empresas que o utilizam como insumo. No processo de cura, adi-
ciona-se um catalisador para acelerar a formao de gel pela resina. O tempo a partir do
qual o gel comea a ser formado, depois da adio do catalisador, uma caracterstica
importante conhecida como tempo de gele
+
Fatores: 1: Hidroquinona (HQ) 190 210
2: Benzoquinona (BQ) 20 30
3: Octanoato de cobre (Cu) 180 360
4: Octanoato de cobalto (Co) 900 1800
5: Dimetilanilina (DMA) 270 540
1 11 + 14,02
2 4 + 29,42
3 1 + 26,07
4 12 + + + 17,58
5 2 + 25,18
6 13 + + + 17,03
7 14 + + + 15,24
8 16 + + + 33,54
9 3 + 18,30
10 9 + + + 12,17
11 10 + + + 10,57
12 5 + + + 22,20
13 15 + + + 10,19
14 8 + + + 23,52
15 6 + + + 21,14
16 7 + + + + + 13,10
198
Capittdo 4
Contrastes:
1 2 3 4 5 12 13 14
3,48 1,20 1,08 -5,86 -11,18 --0,13 0,38 -0,78
15 23 24 25 34 35 45
-1,01 0,57 -0,49 -0,43 0,10 -0,77 1,40
O grfico normal dos efeitos (Figura 4A.8) muito fcil de interpretar, e mostra que
o tempo de gel totalmente controlado por trs fatores (5 = Dimetilanilina, 4 = Octanoato de
cobalto e 1 = Hidroquinona, nessa ordem de importncia). Os fatores 4 e 5 contribuem para
diminuir o tempo de gel, enquanto o fator 1 tende a aument-lo. No existe nenhuma inte-
rao significativa. Isto bom, porque significa que os fatores podem ser variados de forma
independente, conforme a convenincia do usurio. Os valores na escala da direita do grfico
so probabilidades acumuladas correspondentes aos valores de z na escala da esquerda.
3,...-------r-----------r----...------r---------r-----,
I
I
I
2 --------l-------------t-------"t--~;:-t-_1-- .95
.75
.55
~ O
.35
-1 .15
I
I
I
-2 ------~--+-----------~---/------i--. . .- . --.-_.-.-..~-.-.
! I ,! I .01
-3 '---_ _ ~ I ~ __ I
__L__ ~ ! _ _- - . . . . I
~----I
-10 -5 O 5
Efeitos
m - Interaes + - Efeitos principais
Figura 4A.S - Grfico normal dos efeitos.
199
Quando as variveis so muitas
Existe um outro ponto interessante que vale a pena mencionar nesta aplicao, e
que serve para nos lembrar de uma questo crucial em qualquer planejamento. Apesar de a
separao entre os nveis dos fatores afetar diretamente a intensidade da resposta, nem
sempre ns temos total liberdade para vari-la. Isto particularmente verdadeiro quando se
trata de um experimento realizado na indstria, onde as caractersticas do processo
costumam impor diversas condies de contorno. Todos os nveis dos fatores neste experi-
mento so concentraes, medidas nas mesma unidades, o que nos permite fazer uma
comparao direta das quantidades usadas nos dezesseis ensaios. Para os trs ltimos
fatores, a concentrao do nvel superior o dobro da concentrao do nvel inferior. O tem-
po de gel no afetado pelo fator 3, mas os fatores 4 e 5 so justamente os que apresentam
os dois maiores efeitos. O interessante que o efeito significativo restante, o da hidroqui-
nona (1), o que corresponde menor variao de concentrao entre os dois nveis (cerca de
11 %, apenas). Caso fosse possvel variar os nveis de hidroquinona na mesma extenso dos
outros dois fatores importantes (levando-se em considerao, claro, todas possveis restri-
es que acabamos de mencionar), talvez o seu efeito viesse a tornar-se o mais significativo
de todos. A Figura 4A.9 ilustra esta possibilidade, bem como facilita a visualizao dos
resultados do experimento.
12,64
Figura 4A.9 - Respostas mdias da Tabela 4A.8, em funo dos fatores 1,4 e 5.
200
5
Como construir modelos empricos
Nos planejamentos experimentais que vimos nos captulos anteriores, cada fator era estu-
dado em apenas dois nveis. Por causa dessa economia, tivemos de nos contentar com uma
viso limitada da funo que descreve a influncia dos fatores sobre a resposta. Conside-
remos, por exemplo, a variao do rendimento da reao com a temperatura, que discutimos
no Captulo 3. De acordo com a Tabela 3.1, os rendimentos mdios observados com o cata-
lisador A so 59%, a 40C, e 90%, a 60C. Colocando esses dois pares de valores num grfico
[Figura 5.1(a)], vemos que eles so compatveis com um nmero infinito de funes. No
Captulo 3 fizemos o ajuste das respostas a um modelo com uma parte linear e tambm com
termos de interao, mas no temos nenhuma garantia de que este seja o modelo correto. Se
quisermos esclarecer essa questo, precisaremos obter mais informaes.
A Tabela 5.1 mostra os rendimentos observados num novo planejamento, no qual fizemos a
reao em cinco temperaturas igualmente espaadas na faixa 40 - 60C, e mantivemos o
catalisador no tipo A. Pelo grfico desses valores (Figura 5.2), um modelo linear parece
mesmo o mais indicado para descrever a variao do rendimento com a temperatura. Lem-
brando que cada observao afetada por um erro aleatrio, podemos representar esse
modelo por meio da equao
(5.1)
201
onde Yi o rendimento correspondente temperatura Ti e i o erro aleatrio associado
y(%) 70
50
40 50 60
T(OC)
(b)
?
90
y(%) 70
50
40 50 60
T(OC)
(c)
90
....................-----..---,-, ?
.','
"
y(%) 70 /
50
1
40 50 60
T(OC)
Figura 5.1 (a) Dados dois pontos, podemos passar por eles muitas funes
diferentes. (b) Padro de pontos sugerindo uma funo linear. (c) Padro de
pontos onde um modelo linear no seria adequado.
1 Por conveno, costumamos usar letras minsculas para representar as variveis aleatrias e letras
maisculas para as variveis controladas.
202
Tabela 5.1 Variao do rendimento da reao em funo da temperatura, na faixa 40 -
60C, com o catalisador A.
Temperatura (OC) 40 45 50 55 60
Rendimento (%) 60 70 77 86 91
100 -------------.----------.-----....--------...----------,
90
80
70 .. 0....
60 ...... .. 0 ........
35 40 45 50 55 60 65
T ('e)
Para determinar os valores de fio e fil devemos ajustar a Equao 5.1 aos cinco
pares de valores (yi,Ti ) da Tabela 5.1. Isto , temos de resolver um sistema de cinco equa-
es,
onde cada equao contm um par de valores (yi' Ti) = (rendimento, temperatura), e cujas
incgnitas so fio e fil' Esse sistema pode ser representado de forma compacta por uma
nica equao matricial,
203
y= XB +c, (5.1a)
onde
y= x= c=
Ys
Voc pode verificar, usando uma rgua, que no possvel traar uma reta que passe
ao mesmo tempo por todos os cinco pontos da Figura 5.2. Qualquer reta que decidirmos
escolher deixar resduos em relao a algumas observaes, como est ilustrado, com um
certo exagero, na Figura 5.3. Os resduos podem ser positivos ou negativos, conforme os
rendimentos observados estejam acima ou abaixo da reta escolhida. A melhor reta ser sem
dvida a que passar "mais perto" dos pontos experimentais, j que impossvel passar
exatamente sobre todos eles.
Tl
T
204
Em termos prticos, "passar mais perto" significa minimizar a distncia global dos
pontos em relao reta, isto , minimizar o comprimento total dos segmentos verticais na
Figura 5.3. A maneira tradicional de conseguirmos esse resultado localizar a reta de tal
maneira que a soma dos quadrados dos resduos seja mnima, razo pela qual esse mtodo
chamado de ajuste por mnimos quadrados. conhecido tambm como anlise de regresso,
termo usado pela primeira vez neste contexto por Sir Francis Galton, um dos pioneiros da
Estatstica, num trabalho de 1885 intitulado Regression toward mediocrity of hereditary
stature .
(5.2)
estimadores de /30 e /31' para os quais queremos obter estimativas numricas. Usando
matrizes, podemos escrever
y=Xb (5.3)
Y1
b=[~l
Y2
y= e
Ys
dos valores que escolhermos para bo e b1 . No ajuste por mnimos quadrados, esses valores
Para que o valor de I,e; seja mnimo, preciso que suas derivadas em relao a bo
e b1 se anulem (Box, Hunter e Hunter, 1978, Captulo 14; Pimentel e Neto, 1996):
205
a(Le;) =0 (5.4a)
abo
a(Le;) = O . (5.4b)
a~
Para tornar a derivao mais geral, vamos representar a varivel independente, que
neste exemplo a temperatura, por X. Teremos assim, para a equao de regresso, a
expresso Yi = bo + ~Xi. Substituindo na Equao 5.2, elevando ao quadrado e fazendo o
somatrio,obtennos
(5.5a)
(5.5b)
ou (5.7)
e da
206
(5.8)
Esta equao pode ser colocada numa forma mais fcil de lembrar, contendo os resduos em
torno das mdias de X e de y (Exerccio 5.1):
(5.9)
(5.10)
Exerccio 5.1
Desenvolva a Equao 5.9 e mostre que ela equivalente Equao 5.8.
Exerccio 5.2
Mostre que
Exerccio 5.3
Com a notao introduzida na Equao 5.10, como seria representado o desvio padro amos-
ral da varivel y?
(5.11)
como voc pode facilmente comprovar, escrevendo as matrizes por extenso. Para resolver
esta equao, devemos multiplic-la esquerda pela inversa de XtX. Assim isolamos o
vetor b, cujos elementos so os estimadores que procuramos:
207
(5.12)
Esta uma equao muito importante, que vale a pena voc saber de cor. Se ampliarmos as
matrizes X e y adequadamente, teremos a soluo geral para o ajuste de um modelo por
mnimos quadrados, no importa quantas sejam as observaes ou quantos parmetros
sejam necessrios para caracterizar o modelo. Para que a soluo exista, porm, preciso
que
(a) A matriz (XtX t possa ser calculada, isto , preciso que a matriz XtX no seja
singular.
(b) Os modelos sejam lineares nos parmetros, ou seja, eles no podem conter termos como
b5 ou bob1 Esta restrio, no entanto, no to severa quanto parece. Podemos escrever
equaes muito complexas e ainda assim lineares nos parmetros (Exerccio 5.4).
60 1 40
70 1 45
y= 77 e X = 1 50 ,
86 1 55
91 1 60
e da
250bo+12.750~ =19.590 ,
208
10,2 - 0,2] [ 384] [-1,200]
b == [ _ 0,2 0,004 x 19590 == 1,560
podemos escrever
1 40 61,2
1 45 69,0
-1,200]
y=Xb= 1 50 x
[ 1560 = 76,8
1 55 ' 84,6
1 60 9~4
60 61,2 -1,2
70 69,0 1,0
e= y-y = 77 76,8 0,2
86 84,6 1,4
91 92,4 -1,4
A Figura 5.4 mostra como a reta ajustada se situa em relao s observaes, confirmando
visualmente que o modelo linear mesmo uma excelente representao para os dados da
Tabela 5.1.
209
Y = -1,20+1,56T
90 .."",." ........'....".,',."."''',:".,..'"."''".., . , . ,,''...... ", . :."'". "..........".. ,."."""." . . ".".".., . , . ,. ,',." . "..".".. "".,:""";~" . ,/,,,,,,,-:::::,,.,.,., . ,."""""""'"
ao 1 - " " " " " " " " " " " " " ' " ' ' ' ' ' ' ' ' ; ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' " " " " " ' ' ' ' ' ; ' ' ' ' ' ' ' ' , , " , , ' , , ' , , " , , ' , . ' . , " '. " : " " ' " ' ' ' ' ' ' ' / ' ' '. " " , . " , ... " ' ; , . " . " . " . " ' ,'.,.,, .';...' , , . , , . " . " , .., ." ",., ..
70 1 - " " " " " " " " " " " " " " " " " " " " ' : " " " " " " " " " " " " , " " " " " , " " ( l / " " " , , , , , , , , , , , , , , , , , , : , , , , , , , , , , , "..' .." .." . " . " . " , " : . " ' .. ,' .. " . . , . " , . , . ' . ' . ' " .., . . , .... " . , ... , . ' . ' . ' , . , " ' . .
60 ~.""" , "."."',.{ ).. ,.."." "..",,",,"..".""."..:. """.""""".""." . ';.".,.".".".".".", . ,., . ,., : ".".".." ,.."".,..: ,.."",..""" . , ,..,.."..,." ..
35 40 45 50 55 60 65
T(oC)
Figura 5.4 Reta ajustada por mnimos quadrados aos dados da Tabela 5.1.
ou (5.14)
A reta ajustada por mnimos quadrados sempre passa pelo ponto mdio das observaes,
lei = I (Yi - Yi )
210
j que, como vimos no Captulo 2, a soma dos resduos dos valores de qualquer varivel em
relao sua prpria mdia sempre zero (Equao 2.3). por isso, alis, que precisamos
elevar os resduos ao quadrado, antes de minimizar o seu somatrio.
Exerccio 5.4
Identifique, na lista abaixo, quais so os modelos lineares e quais so os modelos no-lineares
nos parmetros.
(a) A funo y = bo sen X + b1 cos(b2X)
Exerccio 5.5
Um procedimento importantssimo na qumica analtica instrumental a calibrao, isto , a
determinao de uma relao quantitativa entre a resposta do aparelho e a concentrao da
espcie que se quer determinar. Normalmente essa relao determinada empregando-se o
ajuste por mnimos quadrados. Considere as matrizes
1 0,50 0,0937
1 0,50 0,0916
1 1,00 0,1828
1 1,00 0,1865
1 1,50 0,2782
1 1,50 0,2732
c= e A=
1 2,00 0,3776
1 2,00 0,3702
1 2,50 0,4562
1 2,50 0,4505
1 3,00 0,5593
1 3,00 0,5499
obtidas num experimento feito para se construir uma curva de calibrao. Os elementos da
segunda coluna da matriz c so concentraes de padres analticos de Ferro (em mg L-I). Os
elementos do vetor A so as absorvncias desses padres, determinadas por espectrometria
de absoro molecular no UV-visvel (M. F. Pimentel, tese de mestrado, UFPE, 1992). Ajuste
um modelo linear a estes dados,
sabendo que
211
(ctct =[ 0,4333 -0,2000] e CtA = [3,8696] .
- 0,2000 0,1143 8,3790
Exerccio 5.6
como vimos na Equao 3.5. Calcule XtX e inverta-a para obter (Xtxt. A inverso no ofe-
rece problemas, porque XtX uma matriz diagonal. Use a matriz Xty dada na p. 98 e deter-
mine finalmente o vetor b. Compare seus resultados com os valores apresentados na p. 98.
(5.15)
212
A primeira parcela, CYi - y), representa o desvio da previso feita pelo modelo para o ponto
em questo, Yi , em relao mdia global, y . A segunda parcela a diferena entre o valor
observado e o valor previsto. Num modelo bem ajustado, essa segunda diferena deve ser
pequena. Isto equivale a dizer, em termos da Equao 5.15, que o desvio (Yi - y) deve ser
aproximadamente igual ao desvio CYi - y). Dizer que os desvios dos valores previstos pelo
modelo so semelhantes aos desvios dos valores observados (ambos em relao mdia y)
outra maneira de dizer que as previses esto em boa concordncia com as observaes.
Yi - - - - _ ... - - - - - - - -- - - - - - - - - --o
Yi-Y
o
Y
o ._._....:I
o
x
x
Pode-se demonstrar (Exerccio 5.7) que o somatrio dos produtos (Yi - Y)(yi - Yi) igual a
zero, e portanto
213
(5.16)
Estas somas de quadrados de desvios costumam ser chamadas de somas quadrtims, ou,
abreviadamente, S. Q. Assim, podemos ler a Equao 5.16 como
Quer dizer: uma parte da variao total das observaes Yi em torno da mdia y descrita
pela equao de regresso, e o restante fica por conta dos resduos. Evidentemente, quanto
maior for a frao descrita pela regresso, melhor ser o ajuste do modelo, o que podemos
quantificar por meio da razo
(5.17)
Exerccio 5.7
Substitua Yi =y+l>tI(xi -X) em I(Yi -Y)(yi -Yi) e mostre que esse somatrio igual a
zero.
A cada soma quadrtica est associado um certo nmero de graus de liberdade, que
indica quantos valores independentes envolvendo as n observaes Yl' Y2' ..., Y n so
necessrios para determin-la. Para a soma quadrtica dos n desvios em relao mdia, o
nmero de graus de liberdade (n -1) e no n, porque a soma dos desvios L (Yi - y) nula
214
(5.18)
Como as variveis Xi no so aleatrias, o somatrio L (xi - X)2 est fixado a priori, pela
determinado por um nico nmero, o valor de bl . Este, por sua vez, uma varivel
aleatria, j que depende das respostas obtidas experimentalmente. O valor ht = 1,56 vale
somente para os dados da Tabela 5.1. Se fizermos uma outra srie de experimentos
idnticos, realizados nas mesmas temperaturas, a presena dos erros experimentais far
com que obtenhamos rendimentos diferentes, com os quais calcularemos um outro valor para
bl . Com esse nico valor, no entanto, um novo valor para o somatrio L (Yi - y)2 estar
Estas consideraes mostram que a soma quadrtica devida regresso tem apenas
um grau de liberdade. Como o nmero de graus de liberdade de SQT (n -1), a soma
quadrtica residual deve ter (n - 2) graus de liberdade, para satisfazer Equao 5.16:
(n -1) = 1 + (n - 2) .
o lado direito desta equao reflete o fato de que o nosso modelo contm apenas dois
parmetros, f30 e f3l. No caso geral de um modelo com p parmetros, o nmero de graus de
liberdade da soma quadrtica residual dado pela diferena entre o nmero de observaes
e o nmero de parmetros estimados, isto , vr = (n - p). Para que continuemos tendo
215
Tabela 5.2 Tabela de anlise da varincia para o ajuste de um modelo linear com dois
parmetros.
No nosso exemplo, com as respostas da Tabela 5.1 e as previses dadas pela Equao
5.13, obtemos na ANOVA os valores apresentados na Tabela 5.3. Substituindo na Equao
5.17 os valores calculados para SQR e SQr, temos
R 2 = 608,4 = O9896
614,8 ' ,
o que significa que 98,96% da variao total em torno da mdia explicada pela regresso.
Para os resduos fica apenas 1,04%.
Tabela 5.3 Anlise da varincia para o ajuste de um modelo linear aos dados da Tabela 5.1.
Total 614,8 4
torno da mdia que o modelo no consegue reproduzir. Dividindo-a por Vr , obtemos a mdia
quadrtica residual, que uma estimativa, com n - 2 graus de liberdade, da varincia dos
pontos em torno da equao de regresso, isto , em torno do modelo ajustado. Essa
estimativa pode ser interpretada como uma medida aproximada do erro mdio (quadrtico)
que cometeremos se usarmos a equao de regresso para prever a resposta Yi
2
correspondente a um dado valor Xi. No nosso exemplo, temos 8 = 2,13, com 3 graus de
liberdade, como mostra a penltima linha da Tabela 5.3.
216
Exerccio 5.8
Sxx
modelo seja correto, isto , que a sua parte sistemtica seja mesmo uma descrio fiel da
relao existente entre as variveis Y e X. Nesse caso, ao fazer um grande nmero de
experimentos repetidos no mesmo valor Xi deveremos observar uma distribuio das
respostas Yi em torno de f30 + f3 1X i . Esse valor, portanto, nada mais que a mdia das
respostas observadas no ponto Xi. Como no existe medida sem erro, as respostas de
desvios positivos sendo to freqentes quanto desvios negativos, de tal maneira que a mdia
dos erros i seja zero. Num dado Xi os erros em Yi se distribuiro com uma certa varincia
CJ?, que em princpio tambm varia com Xi. Para fazer nossas dedues precisaremos
parte de Yi que aleatria o erro i' podemos concluir tambm que V (Yi ) = CJ2 e
217
3. Os erros seguem uma distribuio normal. Na maioria dos experimentos esta uma
boa aproximao, graas ao teorema do limite central (Seo 2.3) e ao esforo que
todo pesquisador faz para eliminar de suas experincias os erros sistemticos.
Estas trs hipteses sobre o comportamento dos erros aleatrios podem ser
resumidas nas expresses
COV(EoE')=O
I., J '
(5.19)
ou, equivalentemente,
(5.19a)
J vimos (Exerccio 5.8) que o coeficiente angular da reta de regresso pode ser dado
por
(5.20)
218
2
Admitindo agora que o valor de 8 , a varincia residual em torno da regresso, seja
uma boa estimativa de (j2, podemos obter uma estimativa do erro padro de ~ tirando a
sendo
com 95% de confiana. J que os dois limites so positivos, o valor de b1 que calculamos
(5.23)
219
m?
X~
erro padro de b o = s _ _1_ (5.24)
nS xx
o erro padro calculado com os dados do nosso exemplo 4,665, o que nos leva ao
intervalo
Isto significa que h 95% de probabilidade de que o verdadeiro valor do parmetro 130 esteja
entre -16,044 e 13,644. Como estes dois limites tm sinais contrrios, e como nenhum valor
num intervalo de confiana mais provvel do que outro, pode ser que o verdadeiro valor de
130 seja zero. Em outras palavras, o valor bo = -1,200 no estatisticamente significativo, e
portanto no existe evidncia suficiente para mantermos o termo 130 no nosso modelo.
Mesmo assim, o costume mant-lo, para preservar a hierarquia matemtica.
Note que os valores dos erros padro so muito diferentes. O erro padro de bo ,
4,665, cerca de cinqenta vezes maior que o erro padro de b1 , que 0,0923. O motivo
que o erro padro de bo afetado pelo somatrio dos valores de Xi elevados ao quadrado,
como mostra a Equao 5.24. Se tivssemos usado na regresso temperaturas mais prximas
de zero, os dois erros teriam valores mais parecidos.
Exerccio 5.9
Sejam a e c duas combinaes lineares das variveis aleatrias Y i ,
Exerccio 5.8 e esta ltima expresso para mostrar que a covarincia de y e b1 zero.
Quando construmos um modelo de regresso, nosso objetivo obter uma relao que
nos permita prever a resposta correspondente a um valor qualquer da varivel
independente, que chamaremos de X a . No modelo que estamos adotando, essa relao
220
onde a estimativa Ya uma combinao linear das duas variveis aleatrias y e b1 . Sua
Substituindo as expresses para a varincia de uma mdia (Eq. 2.15a) e para a varincia de
~ (Equao 5.20), chegamos expresso
(5.26)
2
Substituindo mais uma vez (12 por 8 e tirando a raiz quadrada, obtemos
finalmente o erro padro da estimativa Ya :
erro padro de Ya = 8
1
-
(xa-X)2
+ ----------- (5.27)
n Sxx
Quando X a = X , o segundo termo dentro da raiz se anula e o erro padro de Ya assume seu
valor mnimo. medida que nos afastamos desse ponto, em qualquer direo, o erro vai au-
mentando. Quanto mais longe estivermos de X a =X , mais incertas sero as previses feitas
a partir da regresso.
Como sempre, usamos o erro padro para definir intervalos de confiana em torno do
valor previsto:
A Equao 5.27 mostra que os limites do intervalo variam com a posio ao longo do eixo X.
Geometricamente, eles determinam hiprboles acima e abaixo da reta de regresso.
f30 + f3 1X a ) com varincia (12, como mostra a Equao 5.19a. Se quisermos nos referir
221
previso de uma nica observao realizada no ponto X a , precisamos acrescentar essa
que uma ampliao da Equao 5.27. Para obt-la, somamos 0'2 varincia da previso do
valor mdio.
Tambm podemos usar matrizes para expressar o clculo das incertezas nas
estimativas dos parmetros. Para isso, temos de definir primeiro a matriz de oovarinci.a de
bo e~:
(5.30)
Esta outra equao muito importante, que se aplica ao ajuste por mnimos quadrados de
qualquer modelo linear nos parmetros, dentro das suposies que fizemos no incio desta
seo. Tambm vale a pena sab-la de cor.
222
Para o nosso exemplo, usamos a matriz (XtXr que calculamos na Seo 5.1 e subs-
2 2
titumos a varincia populacional 0- pela estimativa 8 = 2,13 :
Tirando a raiz quadrada dos elementos da diagonal principal, chegamos aos erros padro de
bo e~.
distribuio F:
MQR ~F (5.31)
MQr ~ l,n-2'
bastando para isso compar-lo com o valor tabelado de FI ,n-2, no nvel de confiana
desejado. Se verificarmos que MQR/MQr > F I ,n-2, devemos descartar a possibilidade de que
f3I = .Teremos ento evidncia estatstica suficiente para nos fazer acreditar na existncia
de uma relao linear entre as variveis y e X, e quanto maior o valor de MQR / MQr ,
melhor.
No nosso exemplo precisamos do valor de FI,s, que pode ser lido na Tabela A.4, na
que a nossa equao altamente significativa. Nem sempre, porm, uma regresso dada
como significativa pelo teste F til para realizar previses. Pode acontecer que a faixa de
223
variao coberta pelos fatores estudados seja pequena demais, fazendo com que o efeito
sobre a resposta fique mascarado pela extenso do erro experimental. Uma regra prtica que
podemos empregar considerar regresso como til para fins de previso se o valor de
MQR/MQr for, pelo menos, de cerca de dez vezes o valor do ponto da distribuio F com o
Animado com os resultados obtidos at agora, nosso qumico resolve ampliar a faixa de
variao da temperatura e realizar mais quatro ensaios, a 30, 35, 65 e 70C. Os novos
rendimentos observados aparecem na Tabela 5.4, juntamente com os valores obtidos
anteriormente. Usando a Equao 5.12 para ajustar um modelo linear aos nove pares desse
novo conjunto de valores, obtemos
Temperatura (OC) 30 35 40 45 50 55 60 65 70
Rendimento (%) 24 40 60 70 77 86 91 86 84
A Tabela 5.5 mostra a anlise da varincia para este novo ajuste. A percentagem de
variao explicada pelo modelo agora 80,63%. Um valor razoavelmente alto, mas muito
menos impressionante que os 98,96% do exemplo anterior, que se limitava faixa 40 - 60C.
Tabela 5.5 Anlise da varincia para o ajuste de um modelo linear aos dados da Tabela 5.4.
Total 4.298,0 8
224
o motivo da piora do ajuste torna-se evidente quando colocamos no mesmo grfico os
nove rendimentos observados e a reta ajustada [Figura 5.6(a)]. Os pontos esto dispostos ao
longo de uma curva, indicando que um modelo linear no serve mais para represent-los.
Essa impresso confirmada pelo grfico dos resduos [Figura 5.6(b)]. Ao invs de se
distriburem de forma aleatria, os resduos sugerem nitidamente um padro geomtrico, no
qual a regio central do grfico concentra os resduos positivos e os resduos negativos
localizam-se nas extremidades.
O valor de MQR/MQr 29,14, enquanto F 1,7 = 5,59, no nvel de 95%. Isto indicaria
que temos uma regresso significativa,3 mas o emprego do teste F pressupe uma distri-
buio normal dos resduos, e acabamos de ver que este no o nosso caso. S poderamos
usar um teste F se no houvesse evidncia de anormalidade na distribuio dos resduos.
100
20
o
o o o
80
o
-.... o 10
o o o
--
'*'
.9
c:
Q)
60 o
-....
~
o
::J
o o
o --------------------------------
~c: 40 o ~
CJ)
Q) o o
Q) CI:
CI:
20
o -10
o o
o -20
20 40 60 80 20 40 60 80
Ttc) T (De)
(a) (b)
Figura 5.6 Ajuste de um modelo linear aos dados da Tabela 5.4. (a) Os valores
observados no esto bem representados por uma reta. (b)
Conseqentemente, a distribuio dos resduos no aleatria
(5.33)
onde Xi representa a temperatura do i-simo nvel. O ajuste deste novo modelo aos valores
observados tambm feito por meio da Equao 5.12, s que as matrizes precisam ser ex-
pandidas, para se referirem Equao 5.33 e ao conjunto de dados ampliado. Assim,
passamos a ter
3 Note que o nmero de graus de liberdade da mdia quadrtica residual mudou, por causa do maior
nmero de pontos.
225
1 Xl X[
x=
1 X 2 X~
e
B= [~:J '
1 Xg X~
alm, claro, de
Yl
Y2
y=
Yg
_ [-158,24]
b- 7,99,
-0,065
o que significa que o nosso modelo quadrtico estima os rendimentos por meio da equao
parmetro /32 no modelo transfere um grau de liberdade da mdia quadrtica residual para
a mdia quadrtica devida regresso, o novo valor de MQR / MQr deve ser comparado com
F 2 ,B (que 5,14 no nvel de 95%), e no mais com F l ,7. De toda forma, esses resultados nos
Esta comparao do modelo linear com o modelo quadrtico uma boa ocasio para
lembrar que modelos empricos so modelos locais, isto , modelos aplicveis apenas a uma
determinada regio. Essa caracterstica torna a extrapolao uma atividade bastante
arriscada. Basta observar que o modelo linear mostrou-se perfeitamente satisfatrio para o
nosso primeiro conjunto de valores, mas uma pequena ampliao da faixa de temperaturas
226
tornou necessrio o emprego de um modelo quadrtico, apesar de os dados da Tabela 5.1
estarem todos contidos na Tabela 5.4. Mesmo esse segundo modelo no deve ser extrapolado,
e no precisamos ir muito longe para chegar a essa constatao. Se fizermos, por exemplo, T
= 20C na Equao 5.34, o que representa apenas dez graus a menos que a temperatura
mais baixa investigada experimentalmente, obteremos y = -24,44%, um valor absurdo, j
que no existem rendimentos negativos. Em suma: precisamos desconfiar das extrapolaes.
Elas sempre devem ser testadas com mais experimentos, chamados por isto mesmo de
experimentos oonfirmatrios.
20 40 60 80 20 40 60 80
(a) (b)
Figura 5.7 (a) Ajuste de um modelo quadrtico aos dados da Tabela 5.4. A
concordncia bem melhor do que na Figura 5.6(a). (b) No parece haver um
padro na distribuio dos resduos.
Tabela 5.6 ANOVA para o ajuste de um modelo quadrtico aos dados da Tabela 5.4.
Total 4.298,0 8
At aqui baseamos a avaliao dos nossos modelos na aparncia do grfico dos resduos. Se
no houver nada na distribuio dos resduos que nos faa suspeitar de anormalidade,
consideramos o modelo satisfatrio. um procedimento subjetivo, sem dvida, mas no
227
devemos menosprez-lo por isso, at porque no existe alternativa para ele, se no
dispusermos de alguma medida do erro aleatrio. Alm disto, examinar a distribuio dos
resduos sempre nos ajuda a verificar se no h nada de errado com o modelo, e pode indicar
como melhor-lo, se houver necessidade. Um exame cuidadoso dos grficos dos resduos deve
ser considerado obrigatrio em qualquer situao.
Suponhamos que os ensaios da Tabela 5.4 tenham sido duplicados, e que nossos
dados sejam os dezoito rendimentos mostrados na Tabela 5.7. Para cada valor de X existem
agora dois valores de y diferentes. evidente que, qualquer que seja o modelo escolhido, ele
no poder passar ao mesmo tempo por esses dois valores. Fatalmente haver resduos, que
poderemos atribuir, pelo menos em parte, aos erros aleatrios.
Veremos, nesta seo, que a soma quadrtica residual deixada pelo modelo pode ser
decomposta em duas partes: uma causada pelos erros aleatrios, e a outra devida falta de
ajuste do modelo. Esta segunda parcela pode ser reduzida aperfeioando-se o modelo. A
outra parte, no.
Temperatura (OC) 30 35 40 45 50 55 60 65 70
Rendimento (%) 24 40 60 70 77 86 91 86 84
20 43 57 72 80 89 88 89 80
Vamos deixar por um momento nosso exemplo numrico e considerar um caso geral
onde, para cada valor Xi' tenham sido determinadas ni respostas, obtidas em repeties
autnticas. Para identificar as repeties usaremos um segundo ndice, j, de modo que uma
resposta passar a ser representada genericamente por Yij' significando a j-sima resposta
obtida para o i-simo ensaio. O nmero total de respostas em todo o experimento ser igual
soma de todas as repeties: n = Lni .
228
Em cada nvel i o modelo deixar ni resduos, um para cada resposta repetida.
m, m ni ( )2
Soma quadrtica residual: SQr = L (SQr)i =L L Yij - Yi .
i j
(5.35)
onde Yi a mdia das respostas observadas no nvel i. Elevando ao quadrado esta equao e
somando sobre todas as observaes, teremos do lado esquerdo a soma quadrtica residual,
SQr' como acabamos de ver. Do lado direito ficaremos com as somas quadrticas das duas
parcelas, pois o somatrio dos termos cruzados se anula, a exemplo do que aconteceu na
decomposio da soma quadrtica total (Equao 5.16 e Exerccio 5.7). Podemos escrever ento
(5.36)
o primeiro somatrio do lado direito no tem nada a ver com o modelo, e portanto no
depende das estimativas Yi' refletindo apenas a disperso, em cada nvel i, das respostas
repetidas Yij em torno de suas prprias mdias Yi . Esse termo, que nos dar uma medida do
erro aleatrio, chamado de soma quadrtim devida ao eITO puro (SQep). O segundo soma-
trio, ao contrrio, depende do modelo, e ser tanto maior quanto mais as estimativas para
um dado nvel, Yi' se desviarem da resposta mdia correspondente, Yi. Esse termo fornece
uma medida da falta de ajuste do modelo s respostas observadas, sendo chamado por isso
de soma quadrtim devida falta de ajuste, SQfaj. Com esta terminologia, a Equao 5.36
229
ou
(5.36a)
Quando dividirmos essas somas quadrticas pelos seus respectivos nmeros de graus de
liberdade teremos mdias quadrticas, cujos valores iremos comparar para avaliar a falta de
ajuste do modelo.
V{a} = (n - p )- (n - m) = (m - p ).
Note que ele dado pela diferena entre o nmero de nveis utilizados para a varivel
independente e o nmero de parmetros do modelo, o que tem uma implicao de grande
importncia prtica. Para termos condies de testar se h falta de ajuste, o nmero de
nveis do nosso planejamento experimental precisa ser maior que o nmero de parmetros
do modelo que estamos querendo ajustar. Para uma reta, por exemplo, que caracterizada
por dois parmetros, precisaramos ter no mnimo trs nveis da varivel representada por
X., para que v{a} no se anulasse. Se tentssemos ajustar uma reta a respostas deter-
minados em apenas dois nveis, ela passaria obrigatoriamente pelas mdias das respostas
em cada nvel. Isso anularia SQ{a} na Equao 5.36a e reduziria a soma quadrtica residual
a uma soma quadrtica de erro puro, tornando impossvel descobrir qualquer falta de ajuste.
230
MQ
fi
= _i----::,J_
(Y - Yi)2
_
ep n-m
que no depende do modelo, uma estimativa da varincia 0'2 que postulamos para as
respostas, esteja o modelo bem ajustado ou no. A mdia quadrtica devida falta de ajuste,
tambm estima 0'2 se o modelo for adequado, isto , se no houver falta de ajuste. Caso
contrrio, o valor de MQfaj estimar 0'2 mais a contribuio da falta de ajuste. Podemos
ento usar um teste F da razo MQfaj /MQep para avaliar se o nosso modelo est (ou no
est) bem ajustado s observaes. Valores altos de MQfaj/MQep significaro muita falta de
ajuste, e vice-versa.
Tabela 5.8 Tabela de anlise da varlancia para o ajuste, pelo mtodo dos mlnlmos
quadrados, de um modelo linear nos parmetros. ni = nmero de repeties no nvel
i; m = nmero de nveis distintos da varivel independente; n =L ni = nmero total
de observaes; p = nmero de parmetros do modelo.
Regresso p-1
SQR = ficYi _y)2
i j
Resduos n-p
SQr = fi
i j
(Y - Yi)2
Falta de ajuste m-p
SQfaj = fi(Yi _yJ2
i j
Total m nj n -1
SQT = L L (Yij - y)2
i j
231
Voltamos agora aos dados em duplicata da Tabela 5.7. J sabemos que um modelo
linear inadequado para essa faixa de temperaturas mas vamos ajust-lo assim mesmo,
para mostrar como funciona o teste F para a falta de ajuste. Mais uma vez, comeamos
usando a equao matricial 5.12 para determinar a equao de regresso, tendo o cuidado de
fazer corresponder os valores das matrizes X e y, que agora tero dezoito linhas, ao invs de
nove. Escrevemos ento, a partir da Tabela 5.7,
1 30 24
1 30 20
1 35 40
x= 1 35 e y= 43
1 70 84
1 70 80
y = -7,42+1,52X .
A Tabela 5.9 mostra a anlise da varincia para o novo ajuste. A percentagem de
variao explicada pela regresso, isto , a razo entre a soma quadrtica devida regresso
e a soma quadrtica total, SQR/SQT = 77,79%. Esse valor, porm, no deve ser comparado
Como nenhum modelo pode reproduzir a soma quadrtica do erro puro, o valor
mximo explicvel a diferena entre a soma quadrtica total e SQep. No nosso caso,
soma quadrtica total. A diferena no muito grande, porque a contribuio do erro puro
relativamente pequena, mas com este novo valor que devemos comparar a variao
explicada pela regresso, 77,79%. A inadequao do modelo aparece claramente nos grficos
da Figura 5.8(a). Mais uma vez os resduos se distribuem num padro curvo.
o valor da razo MQR/MQr 56,03. Comparado com F 1,16 = 4,49 (no nvel de 95%),
este valor indicaria uma regresso significativa, se no fosse pela evidncia de falta de
ajuste, que agora tambm confirmada pelo alto valor de MQfaj /MQep :
232
Tabela 5.9 Anlise da varincia para o ajuste de um modelo linear aos dados da Tabela 5.7.
Total 8.930,00 17
20 r - - - - - - , - - - - - . . - - - - - - - - ,
8 8
ao 8 8 10
o o o
9 o o o o o
8 o o
g o --------------------------------
~ o o
~ o o
cr:
-10
20 8
o o
o ~_~_..L...-_~_'---_~-..I _201-.._0_ _.L....- O
. . L . . - - - - . l" ' - - - - - - . . l
20 40 60 ao 20 40 60 80
rtc) rtc)
(a)
100,..-----.-----.,.------- 20 r - - - - - - . . - - - - - - . . . , . . - - - - - - - - ,
ao
10
o o o o o o o
g o ---- -o- - o- - -o- - -Qo - Uo
~
- t::r -0- - - - - - - - --
o o
~
cr:
-10
20
o L..---....L--_ _- ' - - . l . . -_ _- - - - l
-20 '----~_ _. . L . . - - ' - -_ _- - - - l
20 40 60 ao 20 40 60 80
(b)
Figura 5.8 (a) Ajuste de um modelo linear aos dados da Tabela 5.7. Os valores
observados no so bem representados pela reta. A distribuio dos resduos
no aleatria. (b) Com um modelo quadrtico a concordncia bem melhor.
Os resduos agora parecem distribuir-se aleatoriamente.
233
J que o modelo linear apresenta falta de ajuste, passamos a ajustar o modelo qua-
drtico, que dado pela Equao 5.33. Construindo as matrizes apropriadas e substituindo-
as na Equao 5.12 chegamos a
_ [-172,42]
b- 8,59,
-0,071
ou
y = -172,42 + 8,59X - 0,071X 2
era 55,39, reduz-se a apenas 0,45, um valor no significativo. No h mais sinal de falta de
ajuste, e podemos determinar os intervalos de confiana para os parmetros do modelo.
Tabela 5.10 Anlise da varincia para o ajuste de um modelo quadrtico aos dados da
Tabela 5.7.
Total 8.930,00 17
J que no h falta de ajuste, tanto MQfaj quanto MQep estimam (j2. Podemos
aproveitar este fato para obter uma estimativa da varincia com um maior nmero de graus
de liberdade, somando SQfaj e SQep e dividindo o total por (vfaj +vep ). Com essa operao,
simplesmente teremos de volta a mdia quadrtica residual, que agora passa a ser uma
estimativa legtima da varincia devida ao erro puro.
234
2
Substituindo ()2 na Equao 5.30 pelo valor da mdia quadrtica residual, 8 = 3,89 ,
chegamos s estimativas das varincias dos parmetros. Da, tirando a raiz quadrada, obtemos
seus erros padro. Com eles podemos escrever o resultado final do nosso ajuste:
y = -172,42+8,59X-O,071X 2
(7,65) (O,32) (O,003)
Os valores entre parnteses so os erros padro dos parmetros. Como eles so muito me-
nores do que os valores das estimativas, conclumos que todos os trs parmetros so
estatisticamente significativos. Havendo necessidade de uma anlise mais rigorosa, podemos
fazer um teste t para cada um deles. 4
Exerccio 5.10
Esta uma verso incompleta da tabela de anlise da varincia para o modelo ajustado no
Exerccio 5.5. Complete-a e verifique se o modelo linear satisfatrio, ou se h evidncia de
falta de ajuste.
Resduos ? ? ?
Falta de ajuste ? ? ?
% variao explicada: ?
Exerccio 5.11
o resultado do Exerccio 5.10 deve mostrar que no h evidncia de falta de ajuste no modelo
do Exerccio 5.5. Use a mdia quadrtica residual como uma estimativa da varincia das
observaes e determine os erros padro das estimativas dos coeficientes da equao de
regresso. Eles so estatisticamente significativos no nvel de 95%?
235
faz sentido, porque a correlao definida para um par de variveis aleatrias, e na
regresso somente a varivel dependente que considerada aleatria. No entanto, se
esquecermos desse detalhe conceitual, existem algumas relaes algbricas entre correlao
e regresso que vale a pena discutir, nem que seja para esclarecer seu verdadeiro significado
e suas limitaes.
Imaginemos que tanto X quanto y sejam variveis aleatrias e que, portanto, seja
apropriado definir um coeficiente de oorrelao entre elas, dado por
E
r(X, y)= ~--~-~ (2.9)
como vimos na Seo 2.4. Com a notao simplificada que introduzimos na Equao 5.10
(veja tambm o Exerccio 5.3), podemos reescrever esta expresso da seguinte forma:
(5.10)
Combinando as duas expresses, obtemos uma relao entre o coeficiente angular da reta de
regresso, ~, e o coeficiente de correlao entre as duas variveis, r(X, y):
~ =r(X,y)i~yy , (5.38)
xx
ou
(5.39)
236
e o coeficiente de correlao r(X,y). Para isso, usamos a Equao 5.18 e reescrevemos R 2
como
ou, simplificando,
(5.40)
Esta igualdade mostra que, quando adotamos o modelo Yi = 130 + f31 X i + i' a
percentagem de variao explicada pela regresso tambm uma medida da associao
linear entre X e y. Um erro comum, talvez induzido pela prpria Equao 5.40, interpretar
o valor de R, a raiz quadrada de R 2 com o sinal algbrico apropriado, como o coeficiente de
correlao entre X e y, numa regresso qualquer. Acabamos de ver que isso s vlido para
o ajuste de uma reta. Alm do mais, na modelagem por mnimos quadrados, X nem sequer
uma varivel aleatria. Na verdade, o valor de R pode ser interpretado como um coeficiente
de correlao, mas no entre as variveis X e y. Pode-se demonstrar que em qualquer
circunstncia, para qualquer regresso linear com qualquer nmero de variveis, R o
coeficiente de correlao entre as respostas observadas e os valores previstos pelo modelo
ajustado:
R =r(y,y) (5.41)
Esta relao legtima, pois tanto os valores observados quanto os valores previstos so
variveis aleatrias. O valor de R, que chamado de ooeficiente de oorrel~o mltipla,
nunca negativo. Ele o maior valor da correlao que uma combinao linear das variveis
independentes, na forma especificada pelo modelo, pode ter com os valores de y observados.
237
5A Aplicaes
5A.l A flexibilidade do ar
Em 1661, Robert Boyle fez um relato Royal Society em que descrevia sua descoberta da
relao, que depois viria a ser conhecida como a Lei de Boyle,l entre a presso e o volume de
uma dada massa de ar. Os dados originais de Boyle, que foram publicados em 1662, na se-
gunda edio do seu New Experiments Physio-Mechanicall, Touching the 8pring of Air and
its Effects, esto na Tabela 5A.l. Vamos us-los para ajustar alguns modelos polinomiais e
avaliar a qualidade dos ajustes atravs da anlise da varincia e dos grficos dos resduos.
1 Ou de Mariotte, como se diz na Frana. O francs E. Mariotte descobriu a mesma relao, indepen-
dentemente de Boyle, e ainda notou que ela s era vlida se a temperatura permanecesse constante.
238
Todos os termos de todos os modelos so significativos, como podemos ver pela pequena
extenso dos seus respectivos erros padro. Embora cada termo adicional retire um grau de
liberdade dos resduos, isto no prejudica os modelos, j que, do ponto de vista da ANOVA,
eles vo progressivamente melhorando. O modelo cbico, por exemplo, tem MQR /MQr =
3.214,15, e explica 99,78% da variao total. Por esses nmeros, dificilmente iramos nos
preocupar em achar um modelo melhor. Quando olhamos os grficos dos resduos, porm,
vemos uma outra histria (Figura 5A.1). Embora eles fiquem cada vez menores, evidente
que seu conjunto mantm uma estrutura, que varia conforme a complexidade do modelo.
Para o modelo linear, os resduos tm um padro que se assemelha a uma parbola. Quando
inclumos o termo quadrtico, os novos resduos passam a lembrar uma cbica.
Acrescentando em seguida o termo cbico, eles parecem ser descritos por uma equao do
quarto grau.
o que na verdade estamos fazendo tentar ajustar com uma srie de potncias um
conjunto de dados que pode muito bem ser representado por uma funo mais simples. Como
sabemos da qumica elementar, a Lei de Boyle dada pela expresso pV = k, ou
p = k (l/V), onde k uma constante que depende da temperatura e da quantidade de gs. Se
usarmos como varivel independente no o volume e sim o seu inverso, teremos portanto a
expresso de uma reta. A Figura 5A.2 mostra essa reta e os resduos deixados por ela para
os dados de Boyle. A troca da varivel V por ilV , por motivos bvios, um exemplo do que se
conhece como transforma~olinearizante. Esta uma lio importante. Antes de pensar em
acrescentar novos termos e complicar um dado modelo, devemos sempre refletir se no
existe alguma transformao das variveis que possa produzir um ajuste mais satisfatrio.
Em qualquer caso, o grfico dos resduos sempre uma tima indicao de como anda a
modelagem.
1
Pi = 0,065 + 48,18 - , com MQR / MQr = 299.273 e R2 = 99,992%.
(0,04270) (0,088) Vi
Ou seja: ficou tudo muito melhor do que com os trs modelos polinomiais ajustados
diretamente no volume. Alm disto, o termo constante deixou de ser estatisticamente
significativo, o que reproduz perfeitamente a lei de Boyle. 2
2 Voc notou que quando usamos 1/Vos pontos vo ficando mais espaados medida que caminhamos
da esquerda para a direita do grfico? Por que ser?
239
Como construir mode~os empricos
1,0 . .
!
0,8
-----o--t----i---i------l--------- Modelo linear
0,6 ------------t--------4---------+----------i---_.-...-.-..-.-.
=*=~f=~-~~:t:=;~t~=
0,4
0,2
:s
~ 0,0
-0,2 -----~3tr--_t---~~-+_-
i lo i I
Ch.
-'-'CX)I
O O I
j
I
-0,4 ----t----'"'1'-''-'-'-'-'""'"'"1''''"_-_t..-___
i i i !
-0,6
5 15 25 35 45 55
Volume
1,0
0,8
-----------r-------1----------r------------r----------- Modelo quadrtico
0,6
0,4
=:==~~I-=:~==J=:~=~:==r:==~=-=~r:~==~=
O
j 0,2
~ 0,0
-0,2
-0,4
-0,6
I I i I
5 15 25 35 45 55
Volume
1,0
Modelo cbico
0,8
0,6
0,4
j 0,2
O
~ 0,0 fL
-v(~
--r(""() 00 O ()I'"'\
-vOOOo - -
"O
-0,2
-0,4
-0,6
5 15 25 35 45 55
Volume
Figura 5A.l - Grficos dos resduos deixados pelos trs modelos para os dados de Boyle.
240
Capitulo :5
4,5 r-------.....------~----~---_,
:
...................................................."
:
+
.
................ 1.. .. ..--_ .
l/V
0,6
O, 4 _ _ _ ..-1-
-+-.. _.-i---_..+--.+-_..+_-+.. . _-{_ _._. \ _ \_ _ \ __ _j__j__t .
-0, 4 --11..1-_11_11
I I I
-0,6 L - - _ - - ' - - -_ _I - - _ - . . . I - -_ _. & - - _ - . . . I - -_ _' - - _ - . . . I - - _ - - - - . J I I I I
0,01 0,03 0,05 0,07 0,09
l/V
Para construir uma curva de calibrao, G. M .F. Silva e J. F. Pinto mediram a altura de um
pico cromatogrfico (A) para seis diferentes concentraes de benzatona (C). Para cada
concentrao foram feitas vrias determinaes repetidas, num total de 21 ensaios (Tabela
5A.2). A julgar pelo grfico das alturas contra as concentraes, mostrado na Figura 5A.3,
uma reta seria um bom modelo para esses dados. Fazendo o ajuste por mnimos quadrados,
chegamos equao
Parece uma equao excelente, mas na verdade apresenta falta de ajuste. Usando as
equaes dadas na Tabela 5.8, obtemos MQfaj /MQep = 6,11 , que maior que F 4,15 = 3,06
241
(95% de confiana). Para tentar eliminar a falta de ajuste, acrescentamos ento um termo
quadrtico, e chegamos a um modelo com trs parmetros, dado por
inferior a um, nos dispensa de fazer o teste F. Pelo mesmo motivo, os erros padro que
aparecem na segunda equao foram calculados a partir da mdia quadrtica residual total,
e no da mdia quadrtica devida ao erro puro. Tambm vale a pena observar que o termo
constante, que levemente significativo no modelo linear, deixa de s-lo no modelo
quadrtico. Ou seja, no segundo modelo uma soluo de concentrao zero no deve apre-
sentar pico cromatogrfico nenhum para a benzatona, como obviamente teria de ser.
25 r----.........- ........--------r---..----....--..----.......--__--.,.---.---------,
: :~=:=:I=::1~:~=:~::;:I~:~::I:::=:~:
i ---------------f---~_Jc:-~-~~-------------~---------t------------
5
o ---------:--~-----~------.---+-..- ...--.j.---------+-----.-..-----
-5 1 ! 1 !
L...--_ _......L...-_ _.......Io-_ _- - - - - ' I - - ~
1 __'
Concentrao
242
Capitulo 5
Modelo linear
o
J O,
5
r.._-..__r--.. . . . . -r...--:.. . .
....::....
-0,5
O
<----------------'--"""---''"'"---''--------'--------'"'"---''-.
g 01
. .16. . .---------..-......-....22
-2 10
Alturas previstas
j
~~
!
i
d! i
!
~ J - - - - - \ : ; 1R- -!+ - - - - - - -o- - 1
i
o, o I----+v,..." !O
+l,~~----+------~V!.
o O
O
O
-0,5 <--------'--"""---'--------'------------1----------..1
-2 10 16 22
Alturas previstas
Os grficos dos resduos tambm deixam muito claro que a varincia das respostas
cresce com a concentrao, fato que comum em vrios mtodos de anlise instrumental.
Isto viola uma das suposies do ajuste por mnimos quadrados, e normalmente resolvido
fazendo-se uma regresso com dados ponderados por uma transformao estabilizadora da
varincia (veja, por exemplo, Pimentel e Neto, 1996).
importante notar que, dependendo dos erros que estejamos dispostos a tolerar nas
previses feitas a partir da equao de regresso, pode ser que nem a falta de ajuste do
modelo linear nem a heteroscedasticidade das respostas tenham ,qualquer importncia
prtica. De qualquer forma, bom estarmos preparados para tratar desses problemas, se
eles vierem a se revelar prejudiciais para os objetivos de algum experimento.
243
Como c:onstru~r mode~os empiricos
solues padro destas trs espcies qumicas foram preparadas e analisadas por
espectrofotometria uv-visvel, em trs comprimentos de onda diferentes: 530, 440 e 410 nm
(Scarminio et aI., 1993). Os dados relativos ao on permanganato esto na Tabela 5A.3.
testar rigorosamente se existe falta de ajuste, porque no temos medidas repetidas, mas o
grfico dos resduos (Figura 5A.5) est com um bom aspecto (isto , no parece ter estrutura)
e por isto usamos o valor do erro mdio quadrtico residual, MQr, para determinar os erros
padro dos coeficientes do modelo. O modelo linear explica 99,74% da variao total e o valor
de MQR!MQr = 628 bastante alto. Note que, como seria de se esperar, o termo constante
no estatisticamente significativo. Alis, o termo em A530 tambm no, indicando que este
comprimento de onda no ajuda na determinao do on permanganato.
244
Capitulo 5~
Respostas previstas
245
Como construir mode~os empricos
~ : : : :::-~~l~::=I:~~=;=~~_:=]~~-~~~:J~~~~:_~
I o I I I !
-0,10 L..-- i'----- . . .f. i
....I...-_ _............... i'--_---.J
2,0 2,6 3,2 3,8 4,4 5,0 5,6
Resposta estimada
Figura 5A.6 - Resduos do ajuste do modelo lner =bo + ~ ~ aos dados da Tabela 5A.4.
T
Sob certas condies, pode-se demonstrar que a presso de vapor de uma substncia, Pvap,
InPvap -
-b Ml vap
o-~ T )'
(1 l
Nesta equao, R a constante dos gases perfeitos, bo uma constante que varia de uma
246
Capituio 5
1 273 0,044
2 283 0,075
3 293 0,122
4 303 0,190
5 313 0,288
6 323 0,422
7 333 0,601
8 343 0,829
9 353 1,124
Este resultado corresponde a um calor de vaporizao de 32,44 0,22 kJ moi-i. Apesar dos
excelentes valores numricos da Anova, porm, o grfico dos resduos (Figura 5A.7)
apresenta mais uma vez um padro clarssimo, indicando a necessidade de acrescentarmos
um termo quadrtico. Teremos ento o novo ajuste
247
Como constrt.dr mode~os empricos
d(lnpvap) = -1.954-600.622(~)
d(l/T) T
uma estimativa mais realista de - MI vap / R , podemos concluir que o calor de vaporizao
do CCl4 na verdade varia entre 30,39 e 34,54 kJ mol- 1 , no intervalo de temperaturas que
estamos considerando.
0,025
0,015
0,005
~ -0,005
~ -0,015
-0,025
-0,035
-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5
Respostas previstas
Quadrtico
-0,035
-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5
Respostas previstas
Figura 5A.7 - Resduos dos dois ajustes dos dados da tabela 5A.5.
Esta aplicao vamos deixar para voc mesmo fazer. A tabela 5A.6 mostra concentraes de
solues aquosas contendo ons zinco e as respectivas absorvncias obtidas, em triplicata,
num experimento para construir uma curva de calibrao num espectrmetro de absoro
atmica (Lopes, 1999).
248
Capitu~o 5
(a) Faa um grfico da absorvncia contra a concentrao. Que tipo de modelo esse
grfico sugere?
(b) Ajuste aos dados o modelo sugerido pelo item (a), usando a absorvncia como
varivel dependente. Avalie a qualidade do ajuste por anlise da varincia. Faa
tambm o grfico das absorvncias estimadas pelo modelo contra as absorvncias
observadas. Use esse modelo para prever a concentrao de uma soluo cuja
absorvncia 25,00.
(c) Agora olhe os grficos dos resduos. O modelo pode ser melhorado? Se achar que
pode, ajuste um modelo melhor e compare seus resultados com os do primeiro
modelo. Compare as duas anlises da varincia. Que modelo voc prefere?
(d) Com o tipo de modelo que voc escolheu, faa a calibrao inversa, usando a
concentrao como varivel dependente. Com esse novo modelo, qual deve ser a
concentrao de uma soluo de absorvncia 25,00? Existe muita diferena entre as
previses da calibrao direta e da calibrao inversa?
[Zn2+] Absorvncia
249
6
Andando na superfcie de resposta
Suponhamos que o nosso amigo qumico esteja investigando o efeito de dois fatores,
concentrao de um reagente e velocidade de agitao, no rendimento de uma determinada
reao. Ele j sabe que o processo vem funcionando h algum tempo com os valores desses
fatores fixados em 50% e 100 rpm, respectivamente, e que os rendimentos mdios obtidos
251
tm ficado em torno de 68%. Agora ele gostaria de saber se no seria possvel melhorar o
rendimento, escolhendo outros nveis para os fatores.
12 o ....---..---------------...---------..------------.
80 '--- ~
I ~
I I
___..J, --.J
40 45 50 55 60
C (%)
(6.1)
fatores codificados. Como vimos no Exerccio 5.4, os valores de bo , bl e b2 podem ser obtidos
pelo mtodo dos mnimos quadrados. Neste caso a matriz X ser dada por
252
Tabela 6.1 Resultados de um planejamento 22 com ponto central. Xl e X2 representam os
C-50 u -100
valores dos dois fatores, codificados pelas equaes Xl =- - e X 2 - ---
5 10
1 45 90 -1 -1 69
2 55 90 1 -1 59
3 45 110 -1 1 78
4 55 110 1 1 67
5 50 100 O O 68
6 50 100 O O 66
7 50 100 O O 69
1 -1 -1
1 1 -1
1 -1 1
x= 1 1 1
1 O O
1 O O
1 O O
69
59
78
y= 67 .
68
66
69
XtX
7 OO]
= O 4 O
[O O 4
Usando a Equao 5.12 temos ento
253
1~ ~ ]X[~~~] = [~::~~]
4
O 1/4 17 4,25
(6.2)
2
Dos trs ensaios repetidos no ponto central, calculamos 8 = 2,33 como uma estimativa da
varincia das observaes. Substituindo este valor na Equao 5.30, obtemos uma esti-
mativa da varincia dos elementos do vetor b:
V(b) = (XtX)-18 2 =
1/7 O
O 1/4
O]
O x 2,33 =
[0,33
O 0,58 O
O O]
[
O O 1/4 O O 0,58
Tirando as razes quadradas chegaremos aos erros padro de bo , b1 e b2 . Com eles e com as
o tamanho relativamente pequeno dos erros indica que este modelo significativo (para um
tratamento quantitativo, veja os Exerccios 6.2 e 6.4). A anlise da varincia encontra-se na
Tabela 6.2. Como o valor de MQfaj /MQep no estatisticamente significativo (0,42/2,34 =
Tabela 6.2 Anlise da varincia para o ajuste do modelo y = bo + ~Xl + b2x2 aos dados da
Tabela 6.1.
Total 188,00 6
254
.....11 .
.....rl j ~ r
90 r
......... ~ ...
..... ..~..... . ..... ~. '"
r.;.:
..... ~: :....
r "'t'" .. .. :f.
80 .L... + ....
"i
'< 70
60 ....
<0 ? :.:..~: .
::.:~.:::
: :; :: :.:.:# . . : : :J. .
<0?
+~
,<0?
,",~ ./\~
Figura 6.2 Plano descrito pela Eq. 6.3, Y = 68,0 - 5,25xl + 4,25x2 .
Exerccio 6.1
Esquecendo o ponto central na Tabela 6.1 e na Figura 6.1, ficamos com um planejamento
fatorial 2 2 , que pode ser analisado pelos mtodos do Captulo 3. Calcule os valores dos efeitos
para esse fatorial e compare com os valores dos coeficientes da Equao 6.3.
Exerccio 6.2
2
Usando a estimativa 8 = 2,33, que foi calculada a partir das repeties realizadas no ponto
central da Figura 6.1, calcule os erros padro da mdia de todos os sete ensaios e dos efeitos
calculados no exerccio anterior. Compare seus resultados com os erros determinados para os
coeficientes do modelo ajustado (Equao 6.3).
Exerccio 6.3
Faa uma avaliao da significncia estatstica da Equao 6.3, usando o teste F e os dados da
Tabela 6.2. Em outras palavras, compare o valor de F apropriado com a razo entre a mdia
quadrtica da regresso e a mdia quadrtica residual.
Exerccio 6.4
Use os erros dados para os coeficientes na Equao 6.3 para calcular intervalos de 95% de
confiana para f3 o , f31 e f32' Eles so todos significativos neste nvel de confiana?
255
um plano so segmentos de retas. Por exemplo, se fizermos y = 70 na Equao 6.3 chega-
remos expresso
X2 = 1,24x I + 0,47 ,
que descreve uma reta sobre a qual o valor de y deve ser igual a 70, de acordo com o modelo
ajustado. Fazendo o mesmo para outros valores de y obteremos outras curvas de nvel, que
em conjunto daro uma imagem da superfcie de resposta na regio investigada (Figura 6.3).
Podemos ver claramente, tanto numa figura quanto na outra, que se trata de um plano
inclinado obliquamente em relao aos eixos, e com sentido ascendente indo da direita para
a esquerda. Assim, se desejamos obter maiores rendimentos, devemos deslocar a regio
experimental para menores valores de Xl e maiores valores de X2 (o que, alis, j est
indicado pelos sinais dos coeficientes de Xl e X2 na Equao 6.3) . O progresso ser mais
1,5
(78) I 75 I (67)
1,0 ..9~, f_r.... -____1::::.
-:i:::: ..
! ' ~ ! 70
0,5 . . . . . ._ ~. . _ _.~. ~. ~ !_t.._.. _ .
~~
0,0
._.- ___I___-!-
! ! i
~:-~~~t_~-~-; +~:_ -r- __ __--
! ! 60
-0,5 __-1-- ----l-----"1""_ __r--___j-
-1,0 --<r-.._._. _.~. _._. - -+ _.._.+-.- _.+._ _-
(69) ! I : (59)
-1 ,5 I...-.-. -'--_--...Lo.-.L.- ......o..----.L---...___..........--L ...o...-.o-......o..--.L.--o-_.........---I
Figura 6.3 Curvas de nvel do plano descrito pela Equao 6.3. A linha
tracejada a trajetria de mxima inclinao partindo do ponto central do
planejamento. Os valores entre parnteses so as respostas determinadas
experimentalmente.
O caminho de mxima inclinao saindo do ponto central do planejamento est indicado pela
linha tracejada na Figura 6.3. Ele pode ser determinado algebricamente a partir dos
256
coeficientes do modelo. Para termos a mxima inclinao, devemos fazer deslocamentos ao
longo dos eixos x2 e xl na proporo b2 /bl .
Da Equao 6.3 temos b2/~ = 4,25/(-5,25)= -0,81, o que significa que para cada
unidade recuada no eixo xl devemos avanar 0,81 unidades ao longo do eixo X2. As
coordenadas de vrios pontos ao longo dessa trajetria esto na Tabela 6.3, tanto nas
variveis codificadas quanto nas unidades reais de concentrao e velocidade de agitao.
Tabela 6.3 Caminho de mxima inclinao para o modelo das Figuras 6.2 e 6.3.
Centro + ..1
-1 0,81 45 108,1 77
No caso geral, em que temos uma superfcie de resposta determinada por p fatores, o
caminho de mxima inclinao proporcional aos mdulos e aos sinais dos coeficientes do
modelo. Podemos tra-lo facilmente, usando o seguinte procedimento:
1. Escolhemos um dos fatores, digamos i, para servir de base, e mudamos o seu nvel
numa certa extenso, para mais ou para menos, dependendo do sinal de seu
coeficiente e do objetivo do experimento - maximizao ou minimizao da resposta.
Alguns autores recomendam escolher o fator de maior coeficiente, em mdulo, no
modelo ajustado. Tipicamente, o seu deslocamento inicial de uma unidade (na
escala codificada).
(6.4)
257
Vejamos um exemplo com trs fatores. Num estudo para avaliar a influncia de
alguns nutrientes na produo de quitina pelo fungo Cunninghamella elegans (Andrade et
al., 2000) utilizou-se um planejamento fatorial 23 com os nveis da Tabela 6.4, cujos
resultados se ajustaram ao modelo
(6.5)
2
Lll:I =- (+ 1) = +0,4 ~3 = 2,5 (+ 1)= +0,5 .
5 5
Nas unidades verdadeiras, onde o ponto central dado por (G, A, T) = (40, 2, 0,05), isto
corresponde s seguintes condies experimentais:
Tabela 6.4 Nveis de um planejamento 23 com ponto central, para estudar como o teor de
quitina produzido pelo fungo Cunninghamella elegans varia com as concentraes de
glicose, asparagina e tiamina no meio de cultura.
Nvel
Fator
-1 +1
G (Xl) D-glicose (g L -1) 20 40 60
Exerccio 6.5
Imagine que, no exemplo da C. e legans , os pesquisadores tenham preferido tomar a
concentrao de glicose como fator de partida para determinar o caminho de mxima
inclinao, com um deslocamento inicial de + 25 g L-l (note que estas so as unidades reais).
Calcule as coordenadas do terceiro ponto ao longo do novo caminho, e use a Equao 6.5 para
fazer uma estimativa do rendimento de quitina nessas condies.
258
Com isso obtemos os resultados da ltima coluna da tabela, que tambm esto indicados na
Figura 6.4.
~.
'. 70
4 140 .~.~ ...
'.
80
,
. . . . .~.<..... 86 1
:
2
110 ......,. ~~. . 7 7 -i
.~
100
20 25 30 35 40 45 50
C (%)
I I I I I ~
-5 -4 -3 -2 -1
Xl
259
Andando na superficie de resposta
1 30 115 -1 -1 86
2 40 115 1 -1 85
3 30 135 -1 1 78
4 40 135 1 1 84
5 35 125 O O 90
6 35 125 O O 88
7 35 125 O O 89
onde os erros padro foram calculados a partir de uma estimativa conjunta da varincia,
combinando os ensaios repetidos dos dois planejamentos. Em comparao com os valores dos
coeficientes, os erros so bem mais importantes do que no caso da Equao 6.3, e a
dependncia linear da resposta em relao a xl e X2 j no parece segura.
Exerccio 6.6
Use os erros dos coeficientes na Equao 6.6 para calcular intervalos de 95% de confiana
para f3o, f31 e f32. Esses parmetros so estatisticamente significativos?
A anlise da varincia (Tabela 6.6) mostra que a situao agora bem diferente. A
percentagem de variao explicada apenas 27,20%, e o valor de MQfaj/MQep subiu para
34,46, que maior que F 2 ,2 (19,0, no nvel de 95% de confiana). Isto quer dizer que, na
regio onde o caminho de mxima inclinao nos levou, o modelo linear j no descreve
satisfatoriamente a superfcie de resposta.
260
Tabela 6.6 Anlise da varincia para o ajuste do modelo y = b o + b1Xl + b2X2 aos dados da
Tabela 6.5.
Total 97,42 6
Como o modelo linear no serve mais, devemos partir para um modelo quadrtico, cuja
expresso geral, para duas variveis,
(6.7)
Este modelo tem seis parmetros, e o nosso planejamento tem apenas cinco "nveis",
isto , cinco diferentes combinaes de valores da concentrao e da velocidade de agitao.
Como no possvel determinar as estimativas quando h mais parmetros do que nveis,
precisamos ampliar o planejamento. A ampliao pode ser feita de vrias maneiras, sendo a
mais comum a construo do chamado planejamento em estrela.
primeiros, esto a uma distncia de J2 unidades codificadas do ponto central. Todos eles
esto portanto sobre uma circunferncia de raio J2. As coordenadas dos pontos em estrela
so dadas nas quatro ltimas linhas da Tabela 6.7.
Realizando ensaios nos quatro novos pontos, nosso qumico obtm os resultados
mostrados no fim da ltima coluna da Tabela 6.7, que tambm contm os valores j
mostrados na Tabela 6.5, completando os dados do planejamento em estrela.
261
-1
-2 -1 o 2
1 30 115 -1 -1 86
2 40 115 1 -1 85
3 30 135 -1 1 78
4 40 135 1 1 84
5 35 125 O O 90
6 35 125 O O 88
7 35 125 O O 89
8 28 125 -/2 O 81
9 35 139 O /2 80
10 42 125 /2 O 86
11 35 119 O -/2 87
262
o vetor yagora ter onze valores, e a matriz X ter dimenses 11x6, com suas seis
colunas correspondendo aos seis termos do modelo quadrtico. Para obter as colunas
referentes a x;, x~ e XlX2, elevamos ao quadrado ou multiplicamos as colunas apropriadas
1 -1 -1 1 1 1 86
1 1 -1 1 1 -1 85
1 -1 1 1 1 -1 78
1 1 1 1 1 1 84
1 O O O O O 90
X= 1 O O O O O e y= 88
1 O O O O O 89
1 -/2 O 2 O O 81
1 O /2 O 2 O 80
1 /2 O 2 O O 86
1 O -/2 O 2 O 87
evidncia de falta de ajuste do modelo quadrtico. Isto quer dizer que o valor de 0,55 para a
mdia quadrtica residual total, MQr, tambm poderia ser usado como uma estimativa da
de 121 rpm. Com estes valores, de acordo com a Equao 6.8, o rendimento da reao deve
ser cerca de 89,6%, o que representa uma melhora de 32% em relao ao valor de partida,
que era 68%.
Como localizamos a regio do mximo, a investigao termina por aqui. Poderia ter
acontecido, no entanto, que a superfcie de resposta ajustada aos dados do segundo
planejamento fosse uma nova ladeira, em vez de um pico (para continuar usando a analogia
topogrfica). Nesse caso, deveramos nos deslocar novamente, seguindo o novo caminho de
mxima inclinao, e repetir todo o processo de modelagem ~ deslocamento ~ modelagem
263
~ ... , at atingir a regio procurada. Na prtica no deve haver muitas dessas etapas,
porque o modelo linear vai-se tornando menos eficaz medida que nos aproximamos de um
ponto extremo, onde a curvatura da superfcie evidentemente passar a ter importncia.
Total 146,91 10
Exerccio 6.7
Use os dados da Tabela 6.8 para calcular um valor que mostre que a Equao 6.8
estatisticamente significativa.
Exerccio 6.8
Uma representao grfica, embora seja sempre conveniente, no necessria para
localizarmos o ponto mximo de uma superfcie de resposta. Isso pode ser feito derivando-se a
equao do modelo em relao a todas as variveis e igualando-se as derivadas a zero. (a) Use
esse procedimento para a Equao 6.8, para confirmar os valores citados no texto. (b) O que
aconteceria se voc tentasse fazer o mesmo com a Equao 6.6? Por qu?
Uma questo muito importante na RSM a escolha da faixa inicial de variao dos fatores,
que determinar o tamanho do primeiro planejamento e conseqentemente a escala de
codificao e a velocidade relativa com que os experimentos seguintes se deslocaro ao longo
da superfcie de resposta.
264
(a)
X2 -2 -2
(b)
65
75
l 80. i
1 ................0- 1.0- .
! 85
-2 -1
Figura 6.6 (a) Superfcie quadrtica descrita pela Equao 6.7. (b) Suas
curvas de nvel. O rendimento mximo (89,6%) ocorre em Xl = 0,15 e
x2 = -0,37.
Suponhamos, por exemplo, que na Tabela 6.1 tivssemos escolhido para o segundo fator
- a velocidade de agitao - os limites de 95 e 105 rpm (ao invs de 90 e 110). Essa deciso
teria as seguintes conseqncias:
265
1. O coeficiente de X2 na Equao 6.3 se reduziria de 4,25 para 2,125, porque a
mais a 10 rpm.
Ax = 2,125 ~ = -O 405Ax .
2 _ 5,25 1 , 1
Somos os primeiros a reconhecer que isto mais fcil de falar do que de fazer, mas
serve mais uma vez para lembrar como importante fazer os experimentos de forma
seqencial e iterativa. Caso a anlise dos primeiros resultados nos leve a fazer modificaes
nos planejamentos originais, o prejuzo ser menor se no nos apressarmos em fazer muitos
experimentos logo de sada.
266
pode modelar vrias respostas ao mesmo tempo.1 Esta uma caracterstica importante,
porque muitas vezes um produto ou processo tem de satisfazer mais de um critrio, como,
digamos, apresentar o mximo de rendimento com o mnimo de impurezas, ou ter custo
mnimo porm mantendo os parmetros de qualidade dentro das especificaes. Para
ilustrar essa flexibilidade da RSM, apresentamos nesta seo uma aplicao real, cujo
objetivo era a maximizao simultnea de duas respostas distintas.
Os coeficientes do modelo e seus erros padro foram calculados como de costume, por
meio das equaes matriciais 5.12 e 5.30. Para o Mdulo de Young, o emprego do modelo
linear resultou na equao
267
Tabela 6.9 Planejamento 33 para investigar o efeito do tempo de reao (t), da concentrao
de oxidante (C) e da granulometria (P) no rendimento (R) e no Mdulo de Young (M)
do produto de uma sntese de polipirrol numa matriz de borracha de EPDM.
Nvel -1 +1
t(h) 8
16 24
C (Ppc) 10 30 50
P(mesh) >150 150-100 100-60
t C P R(%) M(MPa)
268
:M: = 1,13 + O,Olt+ 0,74C- 0,15P , (6.9)
(O,03) (O,04) (O,04) (O,04)
A anlise da varincia para os dois ajustes est na Tabela 6.10. Os valores de MQR/MQr
Tabela 6.10 Anlise da varincia para o ajuste de modelos linear e quadrtico aos valores
do Mdulo de Young dados na Tabela 6.9. Os valores para o modelo quadrtico esto
entre parnteses.
Embora no parea haver muita diferena entre os dois modelos, um exame mais
detalhado da Tabela 6.10 mostra que devemos preferir o modelo quadrtico. Enquanto para
o modelo linear a razo MQfaj/MQep igual a 12,61, valor bem superior a F23 ,79 = 1,67 , o
modelo quadrtico tem MQfaj /MQep = 2,22, que est apenas um pouco acima de
F 17,79 = 1,75 .
A diferena entre os modelos fica ainda mais evidente nos grficos dos resduos
(Figura 6.7). Para o modelo linear, o grfico apresenta uma curvatura. Os valores passam de
positivos para negativos e depois se tornam positivos novamente. O mesmo no acontece com
269
o modelo quadrtico, cujos resduos parecem flutuar aleatoriamente em torno do valor zero.
Em ambos os casos, no entanto, a varincia residual parece aumentar com o valor da
resposta, o que pode indicar que os dados so heteroscedsticos.
(a)
1,2
0,8
0,4
~ o
o
~ 0,0
-0,4
-0,8
0,0 0,5 1,0 1,5 2,0 2,5
Resposta prevista
(b)
0,8
0,4
O
O
O'
~ 0,0
~
-0,4
_0,81..-..---...0...----.....0.-----'-----.......--...........
0,0 0,5 1,0 1,5 2,0 2,5
----..13,0
Resposta prevista
Figura 6.7 (a) Resduos deixados pelo ajuste de um modelo linear aos valores
do mdulo de Young dados na Tabela 6.9. (b) Resduos deixados pelo ajuste de
um modelo quadrtico aos mesmos dados.
A preferncia pelo modelo quadrtico confirmada ainda pelos valores dos coefi-
270
Exerccio 6.9
Use os dados da Tabela 6.10 para calcular uma estimativa do erro experimental com mais de
79 graus de liberdade.
Exerccio 6.10
Sabendo que a estimativa do erro padro foi obtida a partir do valor de MQep na Tabela 6.10,
A 2
M = 0,86 + 0,74C - 0,16P + 0,44C - 0,18CP . (6.11)
A forma da superfcie de resposta gerada por esta expresso revelada pela Figura 6.8.
Trata-se de uma espcie de vale, situado quase perpendicularmente ao eixo das con-
centraes.
Na prtica, a utilidade da Equao 6.11 (e da Figura 6.8) nos ajudar a prever que
condies experimentais resultaro num valor de interesse para o Mdulo de Young. A
Tabela 6.11 mostra uma comparao dos valores mdios observados com os valores previstos
pela Equao 6.11. A concordncia muito boa. O erro mdio das previses, em valor
absoluto, apenas 0,06, o que no chega a 40/0 da faixa de variao dos valores da Tabela 6.9.
Isto comprova que quase toda a variao observada nos valores do Mdulo de Young pode
ser explicada pelas mudanas feitas na concentrao e na granulometria do oxidante.
Se nosso objetivo obter um produto com um alto valor de M, a Figura 6.8(b) indica
que devemos usar um nvel de concentrao de cinqenta partes por cem e partculas com
granulometria >150 mesh. Caso o modelo possa ser extrapolado, podemos obter valores
ainda maiores continuando a aumentar a concentrao e a diminuir a granulometria das
partculas. 3 Da mesma forma, para obter pequenos valores do Mdulo de Young devemos
usar uma baixa concentrao de oxidante, cerca de 10 partes por cem. Nesse caso, porm, o
3 Valores em mesh numericamente maiores significam partculas menores, isto , uma granulometria
mais fina.
271
Andando na superfcie de resposta
(a)
....(T1..
.....( ...'1' .1'.....
...... ~.T
2,5
: .....
1,5
)1 :
0,5
(b)
10 30 50
C (ppc)
Figura 6.8 (a) Superfcie de resposta descrita pela Equao 6.11, que
relaciona o Mdulo de Young com a concentrao e a granulometria do
oxidante. (b) Curvas de nvel para a superfcie do item (a). Os valores entre
parnteses so as respostas mdias observadas.
272
precisamos nos importar com o tempo. Neste estudo, porm, os pesquisadores tambm
queriam aumentar o rendimento da reao, e fizeram para ele um ajuste semelhante ao que
acabamos de discutir. Da resultou a equao
A 2
R=11,17+8,07C-1,47P+1,28C . (6.12)
A superfcie de resposta descrita por esta expresso est representada na Figura 6.9.
Comparando-a com a Figura 6.8 podemos constatar que a regio que produz altos Mdulos
de Young (o canto inferior direito do grfico das curvas de nvel) tambm produz altos
rendimentos. O mesmo paralelismo se observa no fundo do vale: valores de M da ordem de
0,50 MPa correspondem a rendimentos baixos, de cerca de 5%.
Tabela 6.11 Valores previstos pela Equao 6.11 e valores mdios observados para o
Mdulo de Young. O erro mdio absoluto dado por e = (Llel)/ N = 0,06MPa .
c P Mobs M e=Mobs-M
273
Andando na superfcie de resposta
(a) ampliar o planejamento inicial com mais ensaios para transform-lo num plane-
jamento em estrela, ou
(b) deslocar os experimentos para uma regio mais promissora, a ser investigada com
um novo fatorial.
100-60
~ 150-100
>150
10 30 50
c
Figura 6.9 Superfcie de resposta e curvas de nvel para a Equao 6.12, mos-
trando o rendimento aps 24 horas de reao, em funo da concentrao (C) e
da granulometria do oxidante (P).
274
Estas consideraes no desmerecem o estudo que apresentamos nesta seo. Todos
os experimentos foram feitos de acordo com um planejamento sistemtico, que permitiu
caracterizar, com bastante preciso, a influncia dos fatores investigados sobre as respostas
de interesse. Esse modo de proceder indiscutivelmente superior maneira, digamos,
intuitiva que ainda prevalece em muitos laboratrios de pesquisa.
No nosso ltimo exemplo, apesar de termos trs fatores a considerar, conseguimos reduzir
nossa anlise a grficos envolvendo apenas dois deles (mais a resposta). Isto nos permitiu
localizar a regio desejada por simples inspeo visual das duas superfcies ajustadas. Se
todos os trs fatores tivessem se mostrado significativos, a visualizao no seria mais
possvel (exigiria quatro dimenses) e precisaramos nos arranjar de outra forma. Tambm
tivemos a sorte de verificar que a regio tima dos nveis dos dois fatores era a mesma para
as duas respostas. Caso no fosse, no poderamos otimiz-las simultaneamente e teramos
de partir para alguma soluo de meio termo. Evidentemente, medida que o nmero de
fatores for aumentando, a anlise tender a se tornar mais complicada. Na prxima seo
falaremos sobre planejamentos apropriados para essas situaes.
Se, por outro lado, o nosso objetivo for maximizar ou minimizar uma dada resposta
mantendo as outras respostas sujeitas a determinadas restries, podemos recorrer aos
mtodos de programao linear - ou mesmo no linear - comumente usados nas
engenharias.
275
Arujando na superfcie de resposta
Uma vez que as funes de desejabilidade tenham sido especificadas para todas as
respostas, devemos combin-las numa desejabilidade global, normalmente dada pela mdia
geomtrica das m desejabilidades individuais:
(6.13)
Com este artifcio, a otimizao simultnea das vrias respostas se reduz maximizao de
um nico valor, a desejabilidade global. Nosso problema transforma-se em descobrir os
nveis dos fatores que maximizem o valor de D. Outra vantagem desta definio que o uso
da mdia geomtrica faz com que a desejabilidade global se anule sempre que uma das
respostas tiver um valor inaceitvel, no importa quo satisfatrios sejam os valores das
outras respostas.
Observe que o valor de d est restrito ao intervalo [0,1]. Uma desejabilidade igual a 1 s ser
obtida se a resposta coincidir exatamente com o valor alvo, e tornar os numeradores das
fraes iguais aos respectivos denominadores. medida que o valor de Y se afaste do alvo
A, o valor da desejabilidade ir caindo, tornando-se zero quando um dos limites da faixa de
aceitao for alcanado.
276
dois expoentes (por exemplo, 10) faro com que a desejabilidade caia rapidamente, tornando-
se muito baixa a menos que y esteja muito perto do alvo. Valores baixos, por outro lado,
permitiro que a resposta tenha uma variao mais ampla sem que a desejabilidade seja
muito diminuda. A escolha vai depender da prioridade ou da importncia relativa que
resolvermos atribuir a cada resposta. Alm disto, a taxa de queda da desejabilidade no
precisa ser simtrica em torno do alvo. Os valores de 8 e de t podem ser diferentes. Se, por
exemplo, for mais aceitvel que o valor da resposta fique acima do alvo do que abaixo dele,
devemos escolher t 8. 4
Muitas vezes no temos um valor alvo, e sim um limite unilateral, acima ou abaixo
do qual queremos que a resposta fique. Para tratar desses casos, devemos modificar uma
parte da definio de desejabilidade, fazendo o valor alvo coincidir com um dos extremos e
considerando d = 1 a partir da. Existem duas possibilidades:
1. Eliminar a Equao 6.14a e fazer d =1 para y ~ LI . Isto significa que estaremos
plenamente satisfeitos com qualquer valor da resposta abaixo do limite inferior LI.
2. Se, ao contrrio, nosso objetivo for manter a resposta acima do limite superior LS,
descartamos a Equao 6.14b e fazemos d =1 para qualquer y ~ LS .
4 Por exemplo, se a resposta for a quantidade de cerveja contida numa garrafa, o fabricante
certamente preferir pecar pelo excesso do que arriscar sua reputao pondo venda garrafas com um
nvel inferior ao normal.
277
otimizadas, dentre os quais poderemos selecionar o que melhor nos convier. A prpria
variedade desses conjuntos j nos dar uma idia da robustez das condies experimentais
sugeridas. Se elas forem relativamente insensveis variao dos expoentes s e t, isso um
bom sinal.
Resposta LI A L8 s t
278
logo. As desejabilidades iguais a 1 especificadas tanto para 15% quanto para 20% significam
que qualquer rendimento nessa faixa ser considerado perfeitamente satisfatrio.
Os dois grficos da ltima coluna mostram os perfis das desejabilidades das duas
respostas, definidos de acordo com os valores escolhidos para os limites e os expoentes na
Tabela 6.12. Note que para o mdulo de Young a desejabilidade tem um pico bem
pronunciado sobre o valor alvo, como j espervamos. Para o rendimento, temos um patamar
de desejabilidade 1 acima de 15%. As linhas tracejadas verticais sinalizam as condies de
mxima desejabilidade global, que neste exemplo chegou a 0,99, como mostra a ltima linha
de grficos, e obtida com t = -0,158, C = 0,895 e P =- 0,474. Nessas condies devemos ter
um mdulo de Young igual a 2,00 Mpa e um rendimento de 16,5%, como mostram os valores
assinalados nos respectivos eixos.
t c p Desejabilidade
20
.... oS
~A:~I ~"""''''''"-~115 ~
ri
10 ]
~"'''T.
~.++
....+-
. . .. -. ' .
2, oo ~+~. I ++ ~ I ~ I I I ~ ~1.ll~
..... ,.
, .: .. ', .._ : . . '
.....;...,;...;...:.. ;...:.... !...':....;...
279
As curvas mostram como as respostas variam com cada fator, mantidos fixos os
nveis dos outros fatores nos valores especificados. No segundo grfico da primeira coluna,
por exemplo, vemos que o mdulo de Young praticamente no afetado pela variao de t,
como alis j havamos descoberto na Seo 6.3. O fator crucial para a determinao do
ponto timo C, a concentrao de oxidante, que quem apresenta as inclinaes mais
pronunciadas. Essas inclinaes todas so muito instrutivas, porque fornecem uma idia da
margem de manobra que existe em torno das condies timas. O grfico da desejabilidade
global em funo de t mostra que este fator pode variar numa faixa razovel sem prejudicar
muito o valor de D. Por outro lado, qualquer alterao no valor de C provocar uma queda
brusca na desejabilidade. Este fator, portanto, deve ser mantido sob controle mais rigoroso.
1. Uma parte chamada de fatorial (ou cbica), contendo um total de nfat pontos de
2. Uma parte axial (ou em estrela), formada por n ax = 2k pontos com todas as
coordenadas nulas exceto uma, que igual a um certo valor a (ou -a);
280
Para realizar um planejamento composto central, precisamos definir como ser cada uma
dessas trs partes. Precisamos decidir quantos e quais sero os pontos cbicos, qual o valor
de U, e quantas repeties faremos no ponto central. No planejamento da Tabela 6.7, por
exemplo, temos k = 2. A parte cbica formada pelos quatro primeiros ensaios, a parte em
estrela pelos quatro ltimos (com a =.J2), e existem trs ensaios repetidos no ponto central.
O caso de trs fatores mostrado na Figura 6.11, onde podemos perceber a origem da
terminologia empregada para as trs partes do planejamento.
Figura 6.11 Planejamento composto central para trs fatores. As bolas cinzas
so a parte cbica - os ensaios de um fatorial 23 As bolas pretas representam
a parte em estrela.
modelo quadrtico completo para k fatores dado pela Equao 6.15, que contm
(k + 1) (k + 2) / 2 parmetros. Com dois fatores, temos 6 parmetros. O planejamento da
Tabela 6.7 tem 9 diferentes combinaes de nveis, e a rigor poderamos estimar todos os
parmetros do modelo usando apenas dois pontos cbicos, correspondentes a uma das duas
fraes 22 - 1 . Num planejamento to simples, a economia muito pouca e dificilmente
281
Andando na superffcie de resposta
---~---~-~-~-----~~-----------_.
parea. Explicar por que isso acontece est alm do escopo deste livro, mas fica o aviso. Uma
lista das fraes mais adequadas pode ser encontrada em Wu e Hamada (2.000), Captulo 9.
: l
~ Ii
:
1 2 I
j Y= 130 + 'Lf3i x i + 'Lf3ii x i + 'L'Lf3ij X iX j + l (6.15)
. i i i<j j I
i
5 O prefixo hiper usado aqui para indicar uma figura geomtrica em mais de trs dimenses.
6 Rotability, em ingls.
282
da resposta prevista for a mesma em todos os pontos situados numa dada (hiper)esfera com
centro no prprio centro do planejamento. A Tabela 6.13 mostra como podemos construir
planejamentos rodveis para trs e quatro fatores.
Tabela 6.13 Parte axial de planejamentos rodveis com trs e quatro fatores. As partes
cbicas so fatoriais completos 23 e 24.
k=3 k=4
xl X2 X3 Xl X2 X3 x4
-1,68 O O -2 O O O
1,68 O O 2 O O O
O -1,68 O O -2 O O
O 1,68 O O 2 O O
O O -1,68 O O -2 O
O O 1,68 O O 2 O
O O O -2
O O O 2
a = ~nfat . Mesmo que a resoluo no seja exatamente essa, esta expresso serve como guia
para a escolha do valor de a, que de qualquer forma deve ser analisado quanto sua conve-
nincia e praticidade. Se, por exemplo, estivermos interessados em investigar a regio mais
prxima das faces do hipercubo, ento melhor escolher um valor de a menor do que o valor
rodvel. Tambm pode acontecer que o valor de a leve a alguns ensaios inviveis. Nesse ca-
so, precisaremos definir novas condies experimentais para esses ensaios. Finalmente, a ro-
tabilidade depende de como os fatores foram codificados. Em geral, a rotabilidade do plane-
jamento ser destruda se precisarmos fazer transformaes das variveis usando diferentes
escalas. Uma quase rotabilidade parece ser o critrio mais razovel (Wu e Hamada, 2.000).
283
Uma outra vantagem dos planejamentos compostos centrais que, por serem eles
formados de trs partes distintas, podemos constru-los seqencialmente, conforme a neces-
sidade. Se estivermos numa regio da superfcie de resposta em que a curvatura no seja
importante, ento no precisamos de um modelo quadrtico, e podemos nos dar por satisfei-
tos somente com a parte cbica do planejamento, com a qual podemos ajustar um modelo li-
near e em seguida, se for o caso, nos deslocar para uma regio mais interessante da super-
fcie. Se estivermos em dvida sobre a curvatura, podemos usar os ensaios no ponto central
para testar sua significncia. Finalmente, se a curvatura se revelar significativa, a sim,
podemos completar o planejamento com os pontos axiais. Estaremos, na verdade, fazendo os
ensaios em dois blocos - primeiro o cbico e depois o axial.
Tabela 6.14 Trs planejamentos compostos centrais que podem ser realizados em blocos,
seqencialmente, e que preservam a rotabilidade.
Parte cbica
nfat 4 16 16
Nmero de blocos 1 2 1
ncentr,fat (em cada bloco) 3 2 6
n ax 4 8 10
ncentr,ax 3 2 1
nfat(n ax + ncentr,ax)
a=
2(nfat + ncentr,fat) ,
284
onde ncentr,fat e ncentr,ax so os ensaios do ponto central no bloco cbico e no bloco axial, res-
285
6A Aplicaes
catalisada por vrios metais em estados de oxidao elevados. Andrade et alo (1991)
resolveram usar esta reao como base de um mtodo para determinar traos de molibdnio
em um sistema de fluxo contnuo monossegmentado, tendo como resposta a intensidade do
sinal espectroscpico do iodo a 350 nm. Na tentativa de maximizar a sensibilidade do mtodo
(isto , maximizar a intensidade do sinal), os pesquisadores usaram o planejamento
composto central cujos dados esto na Tabela 6A.1, onde Xl e X2 representam valores
Xl x2 Resposta
-1 -1 0,373
+1 -1 0,497
-1 +1 0,483
+1 +1 0,615
-1,4 0,308
+1,4
0,555
0,465
-1,4
+1,4 0,628
0,538
0,549
O
0,536
O
O 0,549
O 0,538
Os modelos linear e quadrtico ajustados aos dados da tabela so os seguintes:
286
y = 0,542+ 0,076 xl +0,058x2 -0,055x~ +0,003x~ +0,002XIX2'
(0,003) (0,002) (0,002) (0,002) (0,002) (0,003)
Embora este ltimo valor ainda seja maior que F3 4 no nvel de 95% de confiana
(6,59), evidente que o modelo quadrtico muito superior ao linear, como podemos
comprovar pelos grficos das respostas previstas contra as respostas observadas (Figura
6A.l). A melhoria devida inteiramente ao termo quadrtico em xl'
0,7
Linear 1 O
0,6
i . . O 1
r_rrI0.......
~
.g
.~
~
~
0,5 -.- - --L ---- -- --.L---.--.--.---.. -~ ---j - ------ -.-..- . -.-.QQ-.-..-
-
~ 0,4
Quadrtico
0,6 .f._ j. .
----r-__-~ -_---r----_---r----___-
!o !!
_.--.. - i-__---_---l-_----t---------t---------
0,3 0,4 0,5 0,6 0,7
Respostas observadas
Figura 6A.l - Comparao das previses dos dois modelos com os valores observados.
287
significativo. A interao no significativa. Os dois termos lineares tm coeficientes
positivos, indicando que a intensidade do sinal deve aumentar se aumentarmos Xl e x2. No
entanto, como o modelo tambm tem uma contribuio negativa em xi, e de coeficiente
0,1 5
0,55
....
cn
=
=
~
0,3 5
288
estabelece um gradiente osmtico que progressivamente vai retirando a gua. Como
trabalho para um curso de quimiometria, P. R. Buchweitz e E. R. Bruno resolveram usar um
planejamento composto central para estudar como a desidratao de pedaos de abacaxi
dependia de trs fatores: o tempo de contato (1), a temperatura do processo (2) e a
concentrao da soluo osmtica (3). A perda de peso relativa ao final de cada ensaio foi
tomada como medida do nvel de desidratao. Os resultados obtidos esto na Tabela 6A.2,
onde Xl' X2 e x3 so valores codificados dos trs fatores.
1 -1 -1 -1 47,34
2 +1 -1 -1 53,00
3 -1 +1 -1 53,64
4 +1 +1 -1 54,28
5 -1 -1 +1 48,85
6 +1 -1 +1 53,73
7 -1 +1 +1 55,19
8 +1 +1 +1 58,31
9 -1,682 O O 51,90
10 +1,682 O O 57,34
11 O -1,682 O 47,62
12 O +1,682 O 57,35
13 O O -1,682 50,73
14 O O +1,682 57,68
15 O O O 56,24
16 O O O 55,74
17 O O O 57,23
18 O O O 56,85
19 O O O 55,42
289
y = 56,32+ 1,72 Xl +2,55x2 + 1,43x3 -0,71x; -1,47 x~ -0,86x~
(0,34) (0,20) (0,20) (0,20) (0,20) (0,20) <0,20)
claro), o que quer dizer que a regresso significativa e tambm til para fazer previses,
pelo critrio de Box e Wetz.
Os grficos dos resduos deixados pelos dois modelos (Figura 6A.3) comprovam
visualmente a superioridade do modelo quadrtico. Os coeficientes dos termos lineares so
todos positivos, o que significa que aumentando os nveis de todos os fatores deveremos obter
desidrataes mais intensas. Por outro lado, como os coeficientes dos termos quadrticos so
todos negativos, a prpria elevao do nvel dos fatores tambm tender a diminuir a
desidratao, e na proporo do quadrado da variao. Tudo isto sugere que a regio onde a
desidratao mxima no deve estar muito longe.
Linear O
O
()
2
C 8 O
O
() O
O O O O O
O
-2
O
O
O
-4
48 52 56 60
Valores previstos
290
4
Quadrtico
2
O
( CD
-Vc u
O O
O
O
v
o
O
O O 8
O
-2
-4
48 52 56 60
Valores previstos
Os coeficientes mais importantes so os dos dois termos lineares, que tm sinais contrrios - o da
concentrao de quilaia negativo e do pH positivo. Como queremos reduzir o teor de colesterol, esses
291
Andando na de
termos nos dizem que deveramos elevar a concentrao e usar um pH mais cido, em princpio. No
entanto, como a interao e os termos quadrticos tambm so significativos, devemos tomar um pouco de
cuidado com a interpretao desses resultados.
1 -1 -1 -1 -1 1,701
2 +1 -1 -1 -1 1,120
3 -1 +1 -1 -1 1,607
4 +1 +1 -1 -1 0,881
5 -1 -1 +1 -1 1,860
6 +1 -1 +1 -1 0,965
7 -1 +1 +1 -1 1,786
8 +1 +1 +1 -1 0,933
9 -1 -1 -1 +1 2,131
10 +1 -1 -1 +1 2,072
11 -1 +1 -1 +1 2,095
12 +1 +1 -1 +1 2,002
13 -1 -1 +1 +1 2,101
14 +1 -1 +1 +1 2,055
15 -1 +1 +1 +1 2,017
16 +1 +1 +1 +1 1,972
17 O O O O 1,763
18 O O O O 1,840
19 O O O O 1,935
20 -2 O O O 1,713
21 +2 O O O 1,089
22 O -2 O O 1,643
23 O +2 O O 1,601
24 O O -2 O 1,691
25 O O +2 O 1,648
26 O O O -2 0,675
27 O O O +2 2,049
28 O O O O 1,783
29 O O O O 1,983
292
A Figura 6A.4 compara as respostas observadas com os valores previstos pelo modelo
quadrtico. As respostas se dividem em dois grupos, com seis ensaios apresentando teores de
colesterol inferiores a 1,2 mg g, enquanto os demais esto todos acima de 1,6 mg g. Os seis
ensaios com menos colesterol so mostrados novamente na Tabela 6A.4. De fato, todos eles
tm Xl ~ e X4::; 0, mas para o menor valor de todos (o do ensaio 26) trs dos fatores -
entre os quais a concentrao de quilaia - esto nos seus nveis centrais. Diante desses fatos,
voc no acha que seria uma boa idia tentar fazer um ensaio com, digamos, X4 = -2, como
no prprio ensaio 26, mas tambm Xl = +2, ou at mesmo Xl = +1? A Figura 6A.5 mostra que
essa regio no foi investigada neste primeiro planejamento. O plano corresponde a 1,2 mg g
de colesterol, e foi desenhado apenas para destacar a separao entre os dois conjuntos de
respostas.
o
2,0
o
~O CO
S
~
.~
O O
~ 1,6
~
~
S
~ 1,2
~ o
~
0 0
0,8 0
Respostas observadas
2 +1 -1 -1 -1 1,120
4 +1 +1 -1 -1 0,881
6 +1 -1 +1 -1 0,965
8 +1 +1 +1 -1 0,933
21 +2 O 1,089
26 O
-2 0,675
293
Andando na superficie de resposta
2,4
~Ir[T[I ...
2,0
()
~ 1,6
~
~
~ 1,2
~ -----,-.'------; 1 '1
0,8
A lacase, uma polifenol-oxidase com vrias aplicaes industriais, produzida pelo fungo
Botryosphaeria sp induzido por lcool veratrlico. Vasconcelos et alo (2.000) decidiram inves-
tigar como a produo dessa enzima dependia do tempo de cultivo e da concentrao do
lcool. Para isso, realizaram o planejamento composto central da Tabela 6A.5, onde a
resposta a atividade enzimtica em U ml- 1 , definida como o nmero de Jlmols de ABTS (um
derivado do cido sulfnico) oxidados por minuto por mL da soluo de enzima, nas con-
dies padro do ensaio enzimtico. Todos os cultivos foram feitos a 28C, sob agitao
constante de 180 rpm.
Nveis
294
Ensaio PPO-I, U ml- 1
1 -1 -1 3,50
2 -1 -1 3,20
3 +1 -1 1,17
4 +1 -1 1,70
5 -1 +1 4,10
6 -1 +1 5,40
7 +1 +1 1,90
8 +1 +1 2,10
9 o O 4,80
10 O O 5,00
11 O O 4,70
12 O O 5,20
13 -1,41 O 5,25
14 -1,41 O 5,41
15 O +1,41 6,00
16 O +1,41 3,20
17 +1,41 O 2,30
18 +1,41 O 1,60
19 O -1,41 0,50
20 O -1,41 0,50
295
rendimento mximo localiza-se na parte superior esquerda, onde parece haver uma espcie
de plat.
0
5
-2 -1
Concentrao
296
Tabela 6A.6 - Planejamento para o estudo do aumento do teor de 02 no ar.
Ensaio xl X2 X4 % oxignio
'., ~3{ .
. .... .
-1 . ..
. .. "::: ::.:'.. ::::L:::-:::-: .::.:.:::i
-1
-1 -1
8 1 -1 -1 4.~,7 .
:':':'9:, , ..... ::~lL::,:': . -:: ... ":' .:. ':.:;:::::;~:i:::::::.;:: :':::..::.:.: .:.:.:::, :::.:: :::,:~4::;:::' '.'
10 -1 1 -1 33,8
::":::11.: : ::~1:.-: . : : .: : : : :;: :":,)": . :/:.!llQ:~:a:::: .:' . . :.' :.
1
: .12a .'
'"
14 1 1 -1
:::':<':::':::::];5.;':::-:":' .:
16 1 1 1
:.::':::::..1('11'.:':':':
18
:;:::::!::'~:;:::19'::"::"::"
20
:' . : . :.:.::2:1::.": . ,::'
22 -1 1 -1 1
. :,:2'3::. : /3.":.. ::: <:" ::lF'::
24 1 1 -1 1
:.J2:5:.
o
"':::'''::-3'7':'';::'' .::: .
38
. :>3:~f::":": . .
40
.'::'. ::':/'41"
42
><4.3.::, .....
44
-)4:f)::" '.
46
::'::4:;7.:'::,::'::':':
48
.::(:,':',.';:::-4:9
50 O
>.;:j5.jl." .'
52 O O O 33,4
297
Andando na superficie de resposta
26,2
Figura 6A.7 - Valores previstos pelo modelo ajustado para o teor de oxignio.
Um modelo eficiente deve ser capaz de fazer previses confiveis para o valor da res-
posta na regio estudada. Os erros de previso, como sabemos, no devem apresentar
comportamento sistemtico e sua extenso deve ser da mesma ordem de grandeza do erro
puro. A Figura 6A.8 compara os resduos deixados pelo ajuste do modelo com os erros de
298
previso das respostas do conjunto de teste. evidente que alguma coisa est faltando.
Embora esteja muito bem ajustado aos ensaios do planejamento 2 4 , nosso modelo comete
erros sistemticos nas previses para os pontos intermedirios. Todos os resduos para o
conjunto de teste so negativos, o que significa que as previses do modelo superestimam as
respostas observadas. 2 A pior previso a do ensaio 35.
~ -2
-4
-6
o 8 16 24 32 40 48
Ensaio
que ainda apresenta uma certa falta de ajuste, no nvel de 95% de confiana, mas cujas
previses so melhores do que as do modelo anterior, como mostra o novo grfico dos
resduos (Figura 6A.8). O maior resduo acontece novamente no ensaio 35. A presena desse
ponto anmalo no conjunto de treinamento, alis, introduz um certo desvio sistemtico no
modelo, fazendo com que os resduos negativos sejam mais numerosos que os positivos. O
ideal, diante disto, seria realizar novamente o ensaio 35, para verificar se o valor registrado
na tabela no decorrncia de algum erro. Podemos notar tambm que as previses para os
ensaios iniciais (que correspondem a baixos tempos de adsoro) ficaram piores. Conclumos
portanto que o modelo ainda pode ser aperfeioado, e que o sistema em estudo realmente
2 J que o erro de previso , por definio, o valor observado menos o valor previsto.
299
Andando na superficie de resposta
bastante complexo, envolvendo vrias interaes e efeitos no lineares. Ao que tudo indica,
se quisermos uma representao mais adequada teremos de incluir no modelo termos de
ordem mais alta.
2 O
o I. ~
0t-------;..........------i-----;--.......----;---~~~-+__~;____
+ee.
..............1lIIl!IIr+_-__;_-__;.._j
..........:
~ 2
-6
o 8 16 24 32 40 48
Ensaio
300
7
Como modelar misturas
A soma das propores dos diversos componentes de uma mistura sempre 100%.
Para uma mistura qualquer de q componentes, podemos escrever
q
L = 100% = 1 ,
Xi (7.1)
i=l
301
Como m,odelar misturas
Exerccio 7.1
Em vrias indstrias o processo de fabricao consiste apenas em misturar diversos ingre-
dientes, nas propores adequadas para dar um produto final com as caractersticas
desejadas. Voc pode dar exemplos de indstrias desse tipo, de preferncia na sua cidade?
Para uma mistura binria (isto , uma mistura formada por apenas dois compo-
nentes) a Equao 7.1 reduz-se a Xl +X2 = 1. No sistema de eixos mostrado na Figura 7.l(a)
esta equao representada pela reta x2 = 1- xl . Todas as possveis misturas dos dois com-
ponentes correspondem a pontos localizados sobre essa reta. Se Xl e x2 no fossem propor-
es e sim fatores independentes como, digamos, temperatura e pH, todo o espao dentro do
quadrado mostrado na Figura 7.l(a) poderia ser investigado experimentalmente. No estudo
de misturas, porm, o espao experimental fica restrito aos pontos da reta, ou seja, torna-se
unidimensional. Fazendo dessa reta o eixo das abscissas, podemos usar um grfico como o da
Figura 7.l(b) para mostrar como diversas propriedades da mistura variam com a sua com-
posio.
(a) (b)
1,0
0,6
~':\l
0,4
0,2
0,0
0,0 0,2 0,4 0,6 0,8 1,0 0,0 0,2 0,4 0,6 0,8 1,0
Xl
Figura 7.1 (a) O espao experimental para sistemas com duas variveis
independentes inclui todos os pontos dentro do quadrado. O espao
experimental para misturas de dois componentes est limitado aos pontos
sobre a reta X2 = l-Xl. (b) Curvas representando a variao de duas
propriedades de uma mistura binria com a sua composio. Note que as
escalas de Xl e de x2 esto em sentidos contrrios.
Para sistemas com trs fatores independentes, podemos realizar experimentos cor-
respondentes a qualquer ponto dentro do cubo da Figura 7.2(a). Um estudo da variao do
rendimento de uma reao com xl = tempo, X2 = temperatura e X3 = presso, por exemplo,
302
seria um caso tpico. Caso o sistema seja uma mistura de trs componentes, porm, ter de
obedecer restrio xl + X2 + X3 = 1, que define um tringulo eqiltero inscrito no cubo,
tambm mostrado na Figura 7.2(a).
(a)
1,0
0,0
0,0
0,5
0,5
1,0 1,0
(b)
(c)
\ \\
I ,",' ,',
Figura 7.2 (a) O espao experimental para processos com trs fatores inde-
pendentes inclui todos os pontos dentro do cubo. O espao experimental para
misturas de trs componentes limita-se aos pontos pertencentes ao tringulo.
(b) Uma superfcie de resposta para todas as possveis misturas dos compo-
nentes 1,2 e 3. (c) Suas curvas de nvel.
303
Como mode~ar misturas
Em termos gerais, a investigao das propriedades de uma mistura segue o mesmo caminho
que percorremos para sistemas com variveis independentes. Comeamos postulando um
modelo para descrever como as propriedades de interesse variam em funo da composio
da mistura. Depois, fazemos um planejamento experimental, especificando as composies
das misturas a serem estudadas. Finalmente, o modelo ajustado aos resultados experimen-
tais, avaliado e, se for o caso, comparado com modelos alternativos. As duas primeiras
etapas esto estreitamente relacionadas. A forma inicialmente escolhida para o modelo
determinar quais so as composies mais adequadas, do ponto de vista estatstico, para a
obteno de estimativas dos seus parmetros.
o modelo mais simples para uma mistura de dois componentes o modelo aditivo, ou
linear:
(7.2)
(7.3)
que nos permite estimar a resposta mdia num ponto qualquer de composio (X1,X2). Esta
equao, alis, formalmente idntica Equao 6.1. A nica diferena que, como ela se
refere a uma mistura, os fatores Xl e x2 no so mais variveis independentes. Como
conseqncia, a matriz XtX singular, e no podemos mais usar a Equao 5.12 para esti-
mar os coeficientes do modelo.
1 Se voc j estudou fsico-qumica, deve ter visto grficos parecidos: diagramas de fase para sistemas
ternrios.
304
Poderamos usar diretamente a restrio xl + X2 = 1 para eliminar Xl ou X2 da
expresso do modelo, mas adotaremos uma estratgia diferente, com a qual obteremos
modelos mais fceis de interpretar. Como a soma Xl +x2 sempre igual a 1, podemos
(7.4)
onde bt = bo + bi . Com este artifcio, o modelo passa a ter apenas dois coeficientes a serem
determinados - b; e b; - ao invs dos trs que aparecem na equao original. Para
Quando (Xl' X2) = (1, O), isto , quando a 'mistura' contm apenas o componente 1, a
Equao 7.4 reduz-se a y = ~ = Y1 , onde Y1 a resposta observada para o componente 1
puro. Da mesma forma, quando (xl' X2)= (0,1), temos y = b; = Y2. Quer dizer: os dois coefi-
cientes do modelo aditivo so as prprias respostas dos respectivos componentes puros. Caso
o modelo seja vlido, poderemos prever as propriedades de uma mistura qualquer sem ter
precisado fazer mistura nenhuma! Essa situao representada geometricamente na Figura
7.3. A superfcie de resposta, que nesse caso unidimensional, simplesmente a reta
ligando Y1 a Y2. A resposta para uma mistura qualquer ser uma mdia ponderada das
postas repetidas. Os erros padro dos valores de b; e b; podem ser obtidos diretamente da
expresso que deduzimos para o erro padro da mdia (Seo 2.6):
(7.5)
onde s uma estimativa conjunta do erro padro de uma resposta, obtida a partir das obser-
vaes repetidas, ni o nmero de observaes usadas para calcular o valor mdio Yi e
i =1, ..... ,q.
305
Como mode~ar m~sturas
b*1
Figura 7.3 A reta tracejada representa um modelo linear para uma mistura de
dois componentes, y = ZJ;Xl + b;X2 Os coeficientes ZJ; e b; so os valores das
respostas para os componentes 1 e 2 puros. O modelo quadrtico
representado pela curva slida. Alm de incluir os termos do modelo linear, ele
contm um termo que descreve a interao dos dois componentes, ZJ;2XIX2.
Exerccio 7.2
Duas gasolinas, A e B, so misturadas. Quando puras, elas rendem 14 e 6 quilmetros por
litro, respectivamente. (a) Determine a equao do modelo aditivo para o rendimento de uma
mistura qualquer das duas gasolinas. (b) Calcule o rendimento previsto para uma mistura em
partes iguais. (c) Faa o mesmo para uma mistura contendo apenas 30% da gasolina B.
(7.6)
Esta expresso - igual Equao 6.7 - contm seis parmetros, mas para misturas
binrias esse nmero se reduz, por causa da soma constante das propores dos dois com-
306
Reunindo os termos em Xl e X2 ficamos com
e finalmente com
(7.7)
onde bt = bo +bi +bii (para i = 1,2) e b;'2 = b12 -bll -b22 . Temos portanto apenas um
coeficiente a mais que no modelo linear. Para obter um planejamento experimental com um
nmero mnimo de ensaios, s precisamos acrescentar, aos dois valores utilizados para
determinar o modelo linear, uma outra medida feita numa mistura binria de composio
qualquer. O bom senso - e tambm a estatstica - sugerem que a mistura mais adequada
aquela que contm os dois componentes em partes iguais (1:1). A resposta observada para
essa mistura, que designaremos Y12 , corresponde a
Y12 t 1t
=b1*( "211 ~*("2 1 bi2*(11
"4) . (7.8)
Voc pode confirmar que continuamos tendo b; = Yl e b; = Y2' isto , esses coefi-
cientes so os mesmos do modelo linear. Substituindo estas duas igualdades na Equao 7.8,
obtemos finalmente a expresso do coeficiente que falta, b;2' em termos das trs respostas
observadas:
Como sempre, todos esses clculos podem ser postos em termos de matrizes. A
Equao 7.7, que define o modelo, dada por
307
Como mode~ar misturas
ou
"" -- Xb* .
Y
1: 1, podemos escrever
YI] [1 O
Y2 = O 1 O] b; .
O x [ZJ;]
[Yl2 1/2 1/2 1/4 ZJ;2
ZJ;:]
~; =[1O OO]
1 O
[YI]
Y2 X
[b2 -2 -2 4 Yl2
Note que a resposta medida para a mistura binria s afeta o termo de interao b;2.
Os outros dois coeficientes so totalmente determinados pelas observaes feitas nos compo-
nentes puros.
Para obter valores mais precisos dos coeficientes do modelo podemos fazer ensaios
repetidos e usar as respostas mdias observadas, exatamente como fizemos no caso do mo-
delo linear. Teremos ento
b*i -Yi
-- e
Um modelo quadrtico hipottico representado na Figura 7.3 por uma curva slida
situada acima da reta correspondente ao modelo linear. A diferena entre os valores pre-
vistos pelos dois modelos depende da composio da mistura. Neste exemplo, o valor dado
pelo modelo quadrtico para a resposta Yl2 maior que a previso do modelo linear (que a
mdia das respostas dos componentes puros), o que significa que o termo de interao b;2 na
Equao 7.8 positivo. Quando isto acontece dizemos que os dois componentes da mistura
apresentam um efeito sinrgioo, ou interagem sinergicamente. A resposta obtida com os dois
componentes misturados sempre maior do que a simples soma de suas resposta individuais
(devidamente ponderadas pelas respectivas propores). No caso contrrio, quando b;2 < O,
308
aviso que existe, nas bulas de quase todos os remdios, sobre os riscos de us-los em
combinao com certas outras substncias.
Exerccio 7.3
Uma mistura 1:1 das duas gasolinas do Exerccio 7.2 rendeu 12 quilmetros por litro. (a) -
Determine os coeficientes do modelo quadrtico para uma mistura qualquer dessas duas
gasolinas. A interao entre elas sinrgica ou antagnica? (b) Uma mistura formada de
dois teros de gasolina A e um tero de gasolina B apresentou um rendimento de 13 qui-
lmetros por litro. Este resultado est em boa concordncia com o valor previsto pelo
modelo quadrtico?
Exerccio 7.4
A tabela abaixo contm medidas repetidas da viscosidade de dois vidros fundidos puros e
tambm de uma mistura contendo os dois em partes iguais.
Admita que a varincia constante para estas repeties e que portanto voc pode combinar
todas as observaes para obter uma estimativa conjunta.
Podemos obter modelos de misturas de trs componentes (ou misturas ternrias) ampliando
os modelos que usamos para misturas binrias. O modelo linear dado por
(7.9)
com a restrio xl + x2 + x3 = 1 .
309
Como modeiar misturas
(7.10)
(a)
(b)
Figura 7.4 (a) Superfcie de resposta de um modelo linear para uma mistura
de trs componentes, com b; > b; > b; . O modelo pode ser determinado usando-
se somente as respostas medidas para os componentes puros, que
correspondem aos vrtices do tringulo de base. (b) Superfcie de resposta de
um modelo quadrtico de uma mistura de trs componentes, com b; > b; > b; ,
b;2 > O e b;3 = b;3 = o. O modelo quadrtico pode ser determinado usando-se
somente as respostas medidas para os componentes puros e para as misturas
binrias representadas pelos pontos mdios dos trs lados do tringulo.
Quando Xi = 1 (e portanto Xj;t;i = O), a resposta Yi ser igual ao coeficiente bt. Por exemplo,
310
quando (Xl' X2' X3) = (1, 0, O), teremos Yl = ~. Continuamos podendo determinar os coefi-
cientes do modelo linear sem precisar fazer nenhuma mistura. Da mesma forma, podemos
obter estimativas mais precisas utilizando respostas mdias de ensaios repetidos.
(7.12)
lJ
-:f. J .
Os dez coeficientes da Equao 7.11 ficaram reduzidos a seis. Para determinar seus
valores precisamos de um planejamento experimental contendo pelo menos seis ensaios
distintos. Realizando ensaios com os componentes puros, obtemos os valores dos trs
coeficientes lineares:
311
Como modelar rnisturas
Para os trs ensaios que faltam, podemos usar as trs possveis misturas binrias
contendo os componentes em partes iguais, onde
y ..
1) *[1) :;:[1) *[1)[1)
= bl 2- + bJ - + b -
2 1 ) 2- 2 '
(7.14)
para i, j = 1,2,3 e i:j:. j , que nada mais que uma extenso da Equao 7.8 para o caso de
trs componentes.
As seis equaes representadas por (7.13) e (7.14) podem ser reunidas numa nica
equao matricial y = Xb * . Escrevendo-a por extenso, temos
Y1 1 O O O O O ~
Y2 O 1 O O O O b;
Y3 O O 1 O O O b;
X
Y12 1/2 1/2 O 1/4 O O b;2
Y13 1/2 O 1/2 O 1/4 O ~3
Y23 O 1/2 1/2 O O 1/4 b;3
Resolvendo esta equao, obtemos de uma s vez os valores dos seis coeficientes:
b * =X -1 y,
ou
b*1 1 O O O O O Y1
b; O 1 O O O O Y2
b; O O 1 O O O Y3
X
b*12 -2 -2 O 4 O O Y12
b*13 -2 O -2 O 4 O Y13
b;3 O -2 -2 O O 4 Y23
(7.15a)
(7.15b)
(7.15c)
Estas relaes, mais uma vez, so semelhantes s equaes deduzidas para misturas
de dois componentes. Os coeficientes bt so as respostas medidas para os componentes puros,
312
e com uma mistura binria de i e j na proporo 50% - 50%. O modelo fica completamente
determinado sem que haja necessidade de fazer nenhum experimento com misturas ternrias.
Se desejarmos obter valores mais precisos dos coeficientes, procedemos como antes,
realizando ensaios repetidos em cada composio. Com isso, ao resolvermos as Equaes 7.15
empregaremos respostas mdias, ao invs de valores individuais.
Uma superfcie de resposta para um modelo quadrtico com ~ > b; > b;, ~2 > O e
b;3 = b;3 = O ilustrada na Figura 7.4(b). Os limites da superfcie situados acima dos lados
do tringulo (e que portanto se referem a misturas binrias) so anlogos s curvas de res-
posta da Figura 7.3. Como neste exemplo ~3 = b;3 = O, as curvas para as misturas binrias
dos componentes 1 e 3 (e 2 e 3) so retas, mostrando como a resposta para essas misturas
varia linearmente com as propores dos dois componentes envolvidos. J a curva localizada
sobre o lado que representa as misturas binrias dos componentes 1 e 2 semelhante
curva slida da Figura 7.3, porque ~2 > O (isto , os componentes interagem sinergica-
mente). Para misturas ternrias, que correspondem a pontos no interior do tringulo, a in-
terpretao da superfcie mais complicada. A resposta passa a ser a soma das contribuies
lineares devidas aos componentes puros com as contribuies das misturas binrias.
Antes de passar para modelos mais complicados e sistemas com mais componentes, vamos
apresentar uma modelagem de misturas com dados reais, feita em 1991 no laboratrio do
Professor G. Oliveira Neto (Unicamp, Instituto de Qumica).
Alguns substratos biolgicos podem ser analisados com eletrodos seletivos. Uma das
partes crticas desses eletrodos uma membrana, cujas propriedades tm grande influncia
na sensibilidade analtica do eletrodo. O objetivo do estudo era determinar a composio da
membrana que produzisse o maior sinal analtico possvel. Os pesquisadores utilizaram um
planejamento em rede simplex, para o qual mediram as respostas da Tabela 7.1. As
composies das misturas estudadas esto representadas no tringulo da Figura 7.5(a),
juntamente com as respostas mdias obtidas.
313
Como modelar m~sturas
Tabela 7.1 Estudo de membranas para a fabricao de um eletrodo seletivo. Composio das
misturas e valores dos sinais analticos observados. O sinal a altura do pico, em
centmetros.
Xl X2 x3 Sinal Yi s~1
Substituindo nas Equaes 7.15 as mdias das respostas observadas para cada
mistura, chegamos aos seguintes valores para os coeficientes do modelo quadrtico:
b; = 0,35
O alto valor do coeficiente ZJ;3 sugere imediatamente uma forte interao sinrgica
314
Xl
(3,10)
. .
'\:/f\~~~~;j~~.~:7
(0,45) (0,27) (0,35)
x2 xa
(a)
Xl
(3,10)
(b)
S os coeficientes ZJ; e tJ;3 tm valores muito superiores aos seus respectivos erros
(7.16)
o modelo nos diz que a presena do componente 1 na mistura leva a sinais analticos
mais intensos. O componente 2 no aparece na equao, e portanto no contribui para
aumentar o sinal, embora possa ser importante para determinar outras propriedades da
membrana. Como j havamos notado, o componente 3 tem uma interao sinrgica com o
315
Como mc.uieiar m~sturas
componente 1. Isto quer dizer que a presena simultnea dos dois componentes na mistura
produzir sinais mais fortes do que poderamos esperar com um modelo aditivo.
Pela Equao 7.16, o valor mximo do sinal analtico para o tipo de membrana
estudado deve ser 4,2 cm, e deve ser obtido com uma membrana contendo somente os
componentes 1 e 3, na proporo 66% - 34%.
Exerccio 7.6
Faa um teste t para verificar se os coeficientes da equao completa do modelo quadrtico da
membrana so significativos.
Exerccio 7.7
Use a equao simplificada do modelo quadrtico, (7.16), para determinar, no exemplo da
membrana, a composio da mistura que resultaria no valor mximo do sinal analtico e o
valor desse sinal.
Exerccio 7.8
Num projeto realizado no Centro de Pesquisa da Pirelli, tendo como objetivo a melhoria do
revestimento de cabos eltricos, foram obtidos os resultados mdios mostrados a seguir
(Costa, Hattori, Redondo, Bruns e Scarminio, 1991).
1 1 O O 2,84 94,26
2 O 1 O 5,24 8,95
3 O O 1 3,80 11,52
(a) Um alto valor do trilhamento desejvel, pois significa que o cabo resiste por mais tempo
a uma determinada tenso eltrica, sem deixar vazar corrente. Qual dos trs compo-
nentes voc colocaria em altos teores, para ter um revestimento com trilhamento alto?
316
(b) Determine as equaes dos modelos quadrticos para ambas as respostas. Seus resul-
tados confirmam sua resposta para o item (a)?
o modelo quadrtico da Equao 7.12 contm, alm dos termos do modelo aditivo, termos
cruzados que descrevem as interaes entre dois componentes, e por isso ele geralmente
consegue reproduzir satisfatoriamente os valores da resposta nos vrtices e nas arestas do
tringulo de concentraes, que representam respectivamente os componente puros e suas
misturas binrias. No devemos estranhar, porm, que efeitos no aditivos envolvendo a
presena simultnea de trs componentes sejam importantes para descrever a resposta de
determinadas misturas ternrias (os pontos no interior do tringulo). Se esse for o caso, o
modelo quadrtico se mostrar insuficiente, e precisaremos acrescentar-lhe termos cbicos.
o modelo cbico completo para uma mistura de trs componentes dado pela equao
3 3 3 3 3 3
~ bx + ~
= bo + ~ ~ bxxJ + ~
~ ~~
~ ~ bkxx
A
Y ~~ LJ
1 1 1 LJ J'Xk 1 . (7.17)
i=l i5j j i5:j j5:k k
Como esta equao tem dez termos, teramos de fazer no mnimo dez ensaios dife-
rentes para determinar os valores de todos os seus coeficientes. Para muitas situaes pr-
ticas isto um exagero. Muitas vezes, basta introduzir um nico termo cbico para que o
modelo passe a descrever satisfatoriamente toda a regio experimental. Eliminando os ter-
mos em d~ na Equao 7.18, chegamos expresso do modelo cbiro especial, que possui ape-
nas um termo a mais que o modelo quadrtico, e portanto s precisa de um ensaio adicional:
;-. ~~_ ... ~.-.~~~~~--_.~~~~~-~~~------_.~~ .... .._...
~ ~~~.~.~~--~~l
317
Como modelar misturas
partes iguais, (Xl' X2, X3) = (.!.,.!.,.!. I. O coeficiente do termo cbico dado por
l3 3 3)
onde Y123 a resposta observada para a mistura ternria (1:1:1). Os demais coeficientes tm
Numa experincia em duplicata usando a mistura (1/3, 1/3, 1/3) para a membrana do
eletrodo seletivo observou-se um sinal mdio de 3,50 cm, resultante de duas observaes
individuais de 3,40 e 3,60 cm. Combinando esse resultado com as respostas j apresentadas
para os componentes puros e as misturas binrias, chegamos ao valor 33,00 para o
coeficiente b;23 , que altamente significativo.
Exerccio 7.9
Suponha que, no experimento das membranas, a resposta observada para a mistura ternria
em partes iguais tivesse sido 2,50 cm (mdia de dois ensaios), ao invs de 3,50 cm. (a) Calcule
* . (b) Usando o valor 0,056 como estimativa da varincia do sinal
o valor do coeficiente b123
(7.20)
O modelo cbico prev um sinal analtico mximo de 4,2 cm, valor idntico ao prvisto
pelo modelo quadrtico. Para produzir esse sinal a mistura deve ter 62%, 4% e 34% dos compo-
nentes 1, 2 e 3, respectivamente. A composio dessa mistura praticamente a msma da
mistura indicada pelo modelo quadrtico (66%,0% e 34%). Na verdade, como mostra a Figura
318
7.6, a regio do ponto timo uma espcie de plat, onde podemos variar as concentraes sem
que a resposta seja muito afetada. Por exemplo, se substituirmos (Xl' X2, X3) = (0,70, 0,05, 0,25)
na Equao 7.20 obteremos y = 4,14 , uma resposta indistinguvel, para todos os efeitos prticos,
do valor matematicamente timo. Esta uma situao interessante, porque nos permite alterar a
composio da mistura de acordo com outros critrios, sem que a desejabilidade da resposta caia.
Por exemplo, se o componente 3 for mais caro que o componente 1, mais vantajoso usar a
ltima mistura do que a mistura correspondente resposta mxima.
Xl
(3,10)
3,3
2,8/"'.-..
.,:'-. (3,50) ---.... :'
24 .... ~ ....... ......
~
Exerccio 7.10
Qual a previso do modelo quadrtico para a resposta mdia de uma membrana feita dos trs
componentes em partes iguais? Como ela se compara com a previso do modelo cbico
especial?
Exerccio 7.11
o ajuste de um modelo cbico tambm pode ser expressado em termos de matrizes, como o de
qualquer outro modelo. Escreva por extenso a equao matricial que devemos resolver para
obter os valores dos sete coeficientes do modelo cbico especial para o sinal analtico das
membranas.
319
Como modeiar misturas
Nesta altura temos certeza de que voc no se espantar se dissermos que a construo de
modelos para misturas nada mais que um caso particular do ajuste por mnimos qua-
drados. O que fizemos na seo anterior, na verdade, foi o mesmo que resolver a Equao
5.12 para um conjunto de dezessete observaes: as quinze que aparecem na Tabela 7.1,
mais as duas observaes feitas no ponto central do tringulo. Para isso utilizamos dois
modelos: o quadrtico, com seis parmetros, e o cbico especial, com sete. A significncia
estatstica desses modelos pode ser avaliada com uma anlise da varincia.
O modelo cbico no pode apresentar falta de ajuste, porque para ele o nmero de
parmetros igual ao nmero de ensaios distintos. No temos, portanto, como fazer uma
comparao direta do grau de ajuste dos dois modelos. Conseqentemente, na anlise da
varincia desdobraremos a variao total em torno da mdia em duas parcelas somente: a da
regresso e a dos resduos. Em outras palavras, a ANOVA neste caso ser semelhante da
Tabela 5.2. Os resultados esto na Tabela 7.2.
Tabela 7.2 Anlise da varincia para o ajuste dos modelos quadrtico e cbico especial aos
dados da Tabela 7.1, acrescidos dos resultados observados para a mistura com
Xl = X2 = X3 = 1/3 (respostas em duplicata com mdia de 3,50 cm), o que eleva o
nmero total de observaes para dezessete. Os valores em parnteses se referem ao
modelo cbico especial.
Total 40,62 16
especial, respectivamente. Como j sabemos, eles devem ser comparados com os valores de
F 5 ,11 e F 6 ,lO. No nvel de 990/0 de confiana esses valores so apenas 5,32 e 5,39, o que
mostra que ambos os modelos so altamente significativos. O valor superior para o modelo
cbico indica que ele explica uma percentagem de varincia maior, mas tambm devemos
levar em conta que ele tem um parmetro a mais, e que um modelo com mais parmetros
necessariamente explicar uma soma quadrtica maior.
320
Quando acrescentamos um termo ao modelo, estamos transferindo um grau de
liberdade da soma quadrtica residual para a soma quadrtica da regresso. Para decidir se
isto vale a pena, podemos usar um novo teste F, onde vamos comparar a reduo nos
resduos causada pela ampliao do modelo com a mdia quadrtica residual do modelo mais
extenso. Se o teste no for significativo, porque no valeu a pena introduzir mais
parmetros. Este procedimento no est restrito a misturas - pode ser aplicado a qualquer
modelo ajustado por mnimos quadrados.
Consideremos o caso geral de dois modelos quaisquer, I e ll, onde n tem d par-
metros a mais que I. O modelo I deixa uma soma quadrtica residual SQr,l , que reduzida
F = SQr,quad -SQr,cub
MQr,cub
onde os ndices quad e cub indicam os modelos quadrtico e cbico especial. Utilizando os
valores da Tabela 7.2 temos
F = 2,66 - 0,56 = 35
0,06 '
.
Comparando este resultado com F1,lO = 10,0 (99% de confiana), podemos concluir
que o modelo cbico especial de fato melhor que o modelo quadrtico, para os dados do
nosso exemplo.
Uma maneira mais segura de testar a qualidade dos dois modelos, e certamente
mais interessante para o pesquisador, determinar novas respostas, para misturas que no
foram usadas na modelagem, e comparar os resultados observados com os valores previstos
por cada modelo. No estudo das membranas foram realizados trs desses ensaios, indicados
321
Como modelar m~sturas
com asteriscos na Figura 7.6. Nas novas misturas os componentes esto nas propores
(Xl,X2,X3)= (2/3,1/6,1/6), (1/6,2/3,1/6) e (1/6,1/6,2/3).
misturas ternrias de teste, o resduo mdio deixado por esse modelo 0,28 (usando
valores absolutos). Para o modelo quadrtico o resduo mdio 0,82 - quase trs vezes
maior.
Um terceiro modo de comparar a eficincia dos dois modelos realizar uma anlise
da varincia incluindo falta de ajuste, agora que temos, no total, mais ensaios do que
parmetros para todos os modelos. Os resultados dessa anlise esto na Tabela 7.4. A sua
interpretao confirma o que acabamos de discutir e ser deixada como exerccio.
322
Tabela 7.4. Anlise da varincia para o ajuste dos modelos quadrtico e cbico especial aos
valores individuais dos sinais analticos. O nmero de misturas diferentes agora
dez, o que permite testar a falta de ajuste dos dois modelos. Os valores em parn-
teses so os do modelo cbico especial.
Total 44,86 19
7.6 Pseudocomponentes
A experincia mostra que para a membrana se formar preciso que a mistura tenha
pelo menos 10% de cada um dos trs componentes (pirrol, KCI e K4Fe(CN)6). A existncia
desses limites inferiores tambm impe limites superiores para os teores dos componentes. O
mximo que uma mistura pode ter de um dado componente 80%, porque cada um dos
outros dois tem de entrar com pelo menos 10%. Neste exemplo, chamando de Ci a proporo
Esta situao pode ser generalizada para uma mistura qualquer, em que as pro-
pores dos componentes puros tenham de obedecer a limites inferiores no-nulos, que cha-
maremos de ai . Obviamente a soma de todos esses limites tem de ser menor que um, seno
323
Como modeiar misturas
q
e Lai<1, i=1,2, ... ,q. (7.22)
i=l
x. = cl -a 1-
(7.23)
l q
1-L a i
i=l
C - 0,1
x = l i = 1,2,3 . (7.24)
l 0,7'
Exerccio 7.12
Qual a composio verdadeira, em termos dos componentes puros, das misturas
correspondentes s quatro ltimas linhas da Tabela 7.3?
Alm desta expresso obviamente ter mais termos que a Equao 7.20, a inter-
pretao de seus coeficientes bem mais complicada. As curvas de nvel correspondentes so
mostradas na Figura 7.7. Observe que nessa representao, em termos das concentraes
dos componentes puros e no dos pseudocomponentes, a regio experimental fica limitada ao
324
tringulo interno, de permetro tracejado. Usar a Equao 7.25 para prever os valores das
respostas fora dessa regio seria extrapolar, e j sabemos que isso deve ser feito com a
mxima desconfiana. No nosso exemplo especfico, esses pontos correspondem a misturas
que dificilmente produziriam membranas aceitveis. Note, finalmente, que as superfcies
das Figuras 7.7 e 7.6 so idnticas. A nica diferena a forma de descrever a composio. O
que na Figura 7.6 passa por um componente puro (por exemplo, Xl =1), na verdade uma
/\
j'" . .
:
: .'
;'U.,;
:.i3:.a
:1'" 2,8~
. . 3,8 ...
. .:
~"
(0,1, 0,8, 0,1)
I
.:.<..
... \
0,5::
1,4 <>~
::- . ~:
~
; ..... :'
::::,;:.:.:.::::=.;\.
".
~.
.:.~ -. -. ----'~'- . -. -
'.,
_.~'.'.
(0,1, 0,1, 0,8)
\
KCI
Figura 7.7 Curvas de nvel do modelo cbico especial em funo das propor-
es das solues de pirrol, de KCI e de fuFe(CN)6.
Quando as propores dos componentes devem obedecer a limites inferiores, a regio expe-
rimental fica limitada e o problema fica mais fcil de analisar em termos de pseudocompo-
nentes, como acabamos de ver. Em muitas formulaes, a composio da mistura tem de sa-
tisfazer no apenas limites inferiores como tambm limites superiores, o que diminui ainda
mais a regio que pode ser estudada e dificulta a escolha dos pontos do planejamento. Nesta
seo vamos apresentar um exemplo desse tipo de problema, tambm estudado no Instituto
de Qumica da Unicamp, no laboratrio da Professora. I. Joekes (Rubo, 1992). Tentaremos
apenas transmitir um pouco da metodologia apropriada. Um tratamento detalhado poder
ser encontrado em livros e artigos mais especializados, como os de Cornell (1990b, 1990c).
325
Como mode~ar misturas
x
CpIB -0,50
---.;;....;;:=-----
PIB - 025
,
x
CpE -0,15
----.;;;....;~--
PE - 025
,
X
CCE -0,10
=-..;;...;~--
CE 025
, .
Para definir o planejamento, precisamos considerar que modelos poderiam ser apro-
priados para descrever as duas respostas de interesse - a elongao at a ruptura e o intu-
mescimento dos filmes. Normalmente, claro, isso no pode ser determinado antes de
fazermos as experincias. Alm do mais, natural que diferentes respostas sigam diferentes
modelos. Como possvel que a descrio dos resultados venha a requerer um modelo cbico
especial, bom estarmos precavidos e realizarmos pelo menos sete ensaios distintos, para
termos condies de determinar os sete coeficientes desse modelo.
326
a. Os seis vrtices do hexgono mais o ponto central;
(a)
6'
~ ~:\:~ : :;~:~".:
.....'"....
6'
2
7
5
Figura 7.8 (a) Tringulo das concentraes de poliisobuteno (PIB), polietileno (PE) e
cera parafnica (CE). A regio estudada determinada pelos limites inferiores e supe-
riores das concentraes desses componentes e resulta no hexgono irregular cujos vrti-
ces esto numerados de 1 a 6. (b) A mesma regio, em termos de pseudocomponentes.
327
Como modelar rnisturas
Pode ser que voc esteja se perguntando como faria para escolher os melhores nveis
de um estudo de misturas com muitos componentes, onde sequer teramos condies de
enxergar a superfcie de resposta. Felizmente essa escolha no precisa ser motivo de preocu-
pao para o pesquisador. Hoje em dia existem vrios programas comerciais de planeja-
mento experimental que usam critrios estatsticos e fazem isso por ns.
Tabela 7.5 Composio dos filmes preparados com misturas PlB-PE-CE, em valores reais
dos componentes (Ci) e em pseudocomponentes (xi), e os valores medidos para a
elongao at a ruptura e para o intumescimento em dioxano. As respostas foram
determinadas em duplicata.
Valor excludo dos clculos, porque o filme formou-se com dificuldade e a elongao medida
(a)
no foi considerada digna de confiana.
328
postas de interesse foram determinados em duplicata para cada mistura. Desses valores,
que tambm so mostrados na Tabela 7.5, foi obtida uma estimativa conjunta da varincia
experimental, usada para calcular os erros padro das estimativas dos parmetros.
A Equao 5.12 foi empregada para ajustar modelos lineares, quadrticos e cbicos es-
peciais para os valores de cada resposta. A anlise dos resultados levou s seguintes
concluses:
Yel =479xPIB+176xPE+20xCE
(18) (12) (20)
o objetivo final dos pesquisadores era obter um filme que apresentasse ao mesmo
tempo um alto valor da elongao e um baixo valor do intumescimento. De acordo com a
Figura 7.9(a), podemos obter a primeira caracterstica com misturas de composio seme-
lhante do ponto 6'. Por outro lado, para termos baixos valores do intumescimento deve-
remos preparar misturas prximas do ponto 4, que fica diametralmente oposto. A concluso
clara, ainda que um tanto frustrante. Com esses componentes qumicos, a produo de um
filme com propriedades aceitveis ter de surgir de um meio-termo entre as duas
caractersticas desejadas, a alta elongao e o baixo intumescimento. O mtodo de Derringer
e Suich, que discutimos na Seo 6.4, pode ajudar a encontrar esse meio-termo
Os modelos para misturas contendo mais de trs componentes so simples extenses dos
modelos para trs componentes. Para o caso geral de q componentes, os modelos linear, qua-
drtico e cbico especial so dados respectivamente por
q
Y=
A Lb*-x-l l'
i=1
329
q:J- q q :J-
Y'" =~
~ b:'x + ~ ~ b:~xx
1 ~~ U
1 t)'
i=l i<j j
'" q * q q:;: q q q *
e Y=~~ b,t x1 + ~~
~ ~ bxx
U t ). + " ~ " b1)'k X t'X)'Xk
~ ~~
i=l i<j j i<j j<k k
(a)
1
6
(b)
Figura 7.9 Curvas de nvel das propriedades dos filmes PIB-PE-CE, em ter-
mos de pseudocomponentes. (a) modelo linear para a elongao. (b) modelo
quadrtico para o intumescimento. As caractersticas desejveis so obtidas
com composies semelhantes s da mistura 6' (alta elongao) e da mistura 4
(baixo intumescimento).
330
tros, podemos visualizar curvas de nvel fazendo cortes transversais em direes apropria-
das, mas em geral a representao grfica problemtica, e se complica ainda mais quando
vrias respostas esto em jogo. Do ponto de vista algbrico, porm, os modelos continuam
sendo interpretados da mesma maneira que nos casos envolvendo menos componentes.
Para uma mistura de quatro componentes o modelo quadrtico tem dez termos, cujos
coeficientes podem ser estimados usando-se um planejamento em rede simplex {4,2}, que
mostrado no tetraedro da Figura 7.10(a). Cada face do tetraedro tem um arranjo de pontos
igual ao empregado no ajuste de um modelo quadrtico para misturas de trs componentes.
(a)
(b)
x 1=1
X l=X 2=X4=113
331
Como modelar misturas
o nmero total de pontos na rede {4,2} igual ao nmero de termos no modelo quadrtico.
Em geral, para misturas de q componentes, o nmero de ensaios num planejamento em rede
simplex {q ,2} igual ao nmero de termos contidos na expresso do modelo quadrtico. Para
o ajuste de um modelo quadrtico, portanto, esse planejamento o mais econmico.
o modelo cbico especial para misturas de quatro componentes tem quatorze termos,
e seus coeficientes podem ser determinados com o planejamento mostrado na Figura 7.10(b).
Em cada face do tetraedro os pontos agora reproduzem o arranjo correspondente ao
planejamento centride simplex, que usamos para determinar o modelo cbico especial no
problema de trs componentes.
precisaremos fazer pelo menos mais um ensaio, na composio especificada pelo ponto cen-
tral do tetraedro, Xl =X2 =X3 = X4 =.!.. Esse ponto indicado com um asterisco na Figura
4
7.10(b). Em geral, modelos desse tipo, definidos pela expresso
tm um total de 2q-l termos, cujos coeficientes podem ser determinados usando-se os 2q-l
pontos de um planejamento centride simplex, cuja representao geomtrica exigiria um
espao de dimenso q-l.
332
7A Aplicaes
Para estudar os efeitos do solvente sobre esta reao de complexao, Bruns et aI. (1996)
utilizaram dezesseis misturas ternrias de gua, etanol e acetona, s quais foram
adicionadas quantidades fixas dos ons Fe(lll) e SCN-. As misturas foram preparadas nas
composies especificadas pelo planejamento aproximadamente hexagonal da Tabela 7A.l,
onde as concentraes dos solventes esto representadas em termos de pseudocomponentes,
na ordem gua, etanol e acetona. Como resposta mediu-se a concentrao do complexo,
atravs da absorvncia registrada em 623 nm. Todos os ensaios foram feitos em duplicata.
Ensaio Absorvncia
333
Como mode~ar misturas
Ajustando aos dados da tabela os modelos linear, quadrtico e cbico especial, chegamos s
seguintes equaes:
Tabela 7A.2 ANOVA para os modelos ajustados aos dados da Tabela 7A.1.
334
Figura 7A.l- Curvas de nvel para o modelo quadrtico.
o, 7 I- ~ ; .. , ,.rn..< ,
s
.~
;;)
0,61-..;.. ; -"~ : ,
~
i o, 5 1- ; ~~ : , ,
~
~
o, 4 ~ :J~ ; , ;.......................... ~
Respostas observadas
Preparar blendas - isto , misturas - uma das formas que os pesquisadores mais usam
para tentar otimizar as propriedades de produtos polimricos. Entre as principais
propriedades descritas nas patentes desses materiais esto a resistncia ao impacto, a
facilidade de processamento e a resistncia trao. Siqueira et aI. (1993), em um estudo
visando a maximizao da resistncia trao de blendas de polifluoreto de vinilidenila
335
Como modelar misturas
Procedendo da mesma forma que no exemplo anterior, chegamos aos seguintes modelos
ajustados:
336
y = 49,72x1 + 20,79x2 + 18,66 x s + 61,77 x1x2 - 36,89x1xS + 57,89x2XS
(5,10) (2,96) (S,62) (20,22) (14,S9) (14,S8)
y =51, 09x1 + 21,32x2 + 19,34xS + 36,21x1X2 - 48,18x1XS + 48, 22x 2XS + 234,99x1X2XS
(4,44) (2,56) (S,14) (20,45) (1S,29) (1S,06) (97,87)
Os resultados das anlises da varincia (Tabela 7A.4) mostram que o modelo linear
insatisfatrio, e que os outros dois modelos no apresentam falta de ajuste. Desta vez, porm, o
modelo cbico especial superior. A variao explicada maior, a razo MQfaj /MQep menor,
e o termo cbico significativo. Suas curvas de nvel esto na Figura 7A.3. As maiores
resistncias trao so obtidas perto da base do tringulo, na direo do vrtice esquerdo, o
que corresponde a blendas com predomnio de PVDF e com pouco ou nenhum poliestireno.
Tabela 7A.4 ANOVA para os modelos ajustados aos dados da Tabela 7A.3.
Infelizmente este ajuste ainda est longe de ser satisfatrio, como podemos deduzir a partir
da Figura 7A.4, que apresenta o grfico das respostas previstas contra as respostas obser-
vadas. Em primeiro lugar, as previses para trs dos quatro ensaios que no pertencem ao
337
Como mode~ar misturas
planejamento simplex (os crculos brancos na Figura 7A.3) esto bastante superestimadas,
indicando que o modelo no est representando muito bem essa regio. Mas o mais
preocupante que os pontos 11 e 12 so ensaios repetidos, e a diferena entre suas respostas
quase a metade da diferena entre os valores extremos de toda a tabela. Como o erro puro
calculado a partir dos ensaios repetidos, essa enorme variao inflaciona MQ ep e termina
50
00
20
O
11 12
18
Q)
17 O
O
O O
O
20
20 30 40 50
Respostas observadas
Esta mais uma demonstrao de que sempre devemos fazer uma anlise grfica de
qualquer ajuste. Se s nos basessemos nos valores da ANOVA, dificilmente suspeitaramos
que havia algo errado com a modelagem.
45
r i ! i
---a-------+---------~-t_----I---_i----~-----. - -
i
:
i i
.~ No repeti~os I I I 6 I
~ 35 ----i--------i-------i------i--------t------?-----t-------
~ ------i-------~-------1_-----l-----'------t--.- ._~---
2
15
5
~ _ i i
_ _ . L ._ _----I....-_ i
_--L...- i
...L..__~ i i
_ _- . L - ._ i
___I....__-----'
3 4 6 7
Ensaio
338
carutu~o 7
Ensaio Xl X2 X3 Absorvncia
339
Como mode~ar rnisturas
0,08
Quadrtico
O O
0,04 -
O O
O O
~ O
:s, 0,00
O
u O O
O
~ O O
()
-0,04 o
O
O
-0,08
0,0 0,2 0,4 0,6 0,8
Respostas previstas
0,08
Cbico
()
0,04
O O
O
O
O
~ O
:s, 0,00 u
O
O
00
~
-0,04 00
O
-0,08
0,0 0,2 0,4 0,6 0,8
Respostas previstas
340
Figura 7A.7 - Curvas de nvel para o modelo cbico especial.
mente. Duas respostas foram acompanhadas: a condutividade inica da blenda (em escala
logartmica) e a temperatura de transio vtrea, T*. A Figura 7A.8 mostra a disposio dos
ensaios do planejamento em termos dos verdadeiros teores dos trs componentes e em ter-
mos de pseudocomponentes.
341
Como mode~ar misturas
,,",": : ,:,:.':' :'; :,' ",:..ffiI~~~:.:,::::::',:::: : ",: :,:, ;.. ,::~~'O, ... ,'" '
Ao ajustar os modelos aos dados da tabela, descobrimos que este sistema bem mais
complexo que os outros que vimos at agora. Todos os modelos mais simples apresentam
falta de ajuste, e s um modelo cbico completo mostra-se satisfatrio, para ambas as
respostas. Em termos dos teores originais, esses modelos so dados pelas equaes abaixo,
onde s aparecem os termos significativos no nvel de 95% de confiana.
342
Clcut:lUO 7
Plastificante
.. __ __ .
"
i""
Polmero Sal
Figura 7A.8 - Planejamento da Tabela 7A.6, em termos dos verdadeiros teores e em termos
de pseudocomponentes.
343
Como modeiar misturas
Condutividade
Temperatura de transio
Figura 7A.9 - Curvas de nvel para os modelos cbicos completos ajustados aos dados da
Tabela 7A.6.
344
o acar, o amido e o leite em p so os componentes presentes em maior proporo
numa formulao genrica para a preparao de pudins. A proporo de amido um dos
fatores que mais influenciam as propriedades texturais e estruturais do pudim. Braga Neto
(1998) investigou como cinco dessas propriedades eram afetadas pela variao das
propores dos trs ingredientes principais, e obteve os resultados da Tabela 7A. 7. As
unidades foram omitidas, para economizar espao.
Pseudocomponentes
Ordem
Amido (Xl) Leite em p (X2 ) Acar (X3)
Fraturabilidade Coesividade
345
Como mode~ar misturas
ciente. De todos os modelos ajustados, somente o da firmeza ainda apresenta falta de ajuste,
mas o nmero de nveis do experimento no suficiente para que possamos tentar ajustar
um modelo cbico completo. Os valores dos coeficientes deixam claro que o amido de fato o
componente mais importante, mas seu efeito afetado pelos teores de acar e de leite em
p.
A variao na qualidade dos ajustes revelada pelos grficos das respostas previstas
contra as respostas observadas (Figura 7A.10). A firmeza e a fraturabilidade esto bem
modeladas, a adesividade mais ou menos, mas os modelos da coesividade e, principalmente,
da elasticidade deixam a desejar.
00 00
O
40
S S 2
.:1 .~
~Q.
Q
O O O
~ 30
S CO S
l ~ 1 ~""""""'"'''''''''''''''''''''''''''''''''''/''''''''''''''''''''''''''''''''''''''' .. ..; .. i
~ 20
~
10
0"'----------"--------'---------'
10 20 30 40 50 O
Respostas observadas Respostas observadas
346
100 ,.........-----.-~-.....__,..---___r_~-~___r_---~
Fraturabilidade Coesividade
lo 1,0
80 ------i-----t-----t-------i-----
i O
} 40 -----l-J---J---.-.L.- S
~
l 0,6
O 00
---J---I-------L--
CD
~
! 20 . - - - - - ,
I! II II
~
0,4
00
O
; i i
O~------'-----'------'------"-----'"
O 20 40 60 80 100 0,4 0,6 0,8 1,0
Respostas observadas Respostas observadas
2,6 r----~----r------...---_r__--__r_--____,.
I
2,4 ~~~~t----.-+_-+_O-!-.--n--
! ! ! ! Imo
-_._._ J._ _.l--._._ ~ ~_._ _.. . I _._._._. _.91.._ _.
i
2,2
2, O -_._._ _
I
-1-
I
-.L-._-_ ~._
lo 1
_._.
I
-+-_._._ _..-.1 _._ __..
I I ~ I I
!i 1,8 -o--'-I;-'--'~-----r--i-l-----
1,6 --,-----l--l--r--l----
i i
~
1 l
_ ___I.__ _- - - '
347
8
Otimizao simplex
Nos mtodos de otimizao que vimos nos captulos anteriores, a resposta do sistema era
expressada como uma funo matemtica dos fatores a serem otimizados, e a otimizao pro-
priamente dita comeava pela obteno de valores numricos para os parmetros dessa
funo. Existe uma outra classe de mtodos que nos permite otimizar um sistema sem que
precisemos conhecer, ou sequer postular, qualquer relao matemtica entre a resposta e as
variveis independentes. Neste captulo estudaremos um desses mtodos, o simplex seqen-
cial, que bastante usado nas engenharias e at recentemente gozou de muita popularidade
entre os qumicos analticos. Os mtodos simplex funcionam bem na presena de erros expe-
rimentais e so capazes de otimizar sistemas controlados por um grande nmero de vari-
veis independentes. Alm disso, no exigem o emprego de testes de significncia (como os tes-
tes t e F), o que uma vantagem a mais para pesquisadores alrgicos a clculos estatsticos.
349
Otimizao simpiex.
precisaremos decidir em qual delas a aplicao do simplex ser baseada. Esta ultima
restrio no to grave, porque s vezes podemos contorn-la usando como "resposta" uma
combinao das verdadeiras respostas experimentais, ponderadas de acordo com a sua
importncia relativa para o problema, como na metodologia de Derringer e Suich.
A dcima edio do Webster's Collegiate Dictionary define simplex como 'uma con-
figurao espacial de n dimenses determinada por n+1 pontos num espao de dimenso
igualou maior que n. Nos mtodos de otimizao simplex essa configurao um polgono
(ou o seu equivalente multidimensional) de p + 1 vrtices, onde p o nmero de variveis
independentes que queremos ajustar. Com duas variveis, portanto, o simplex um trin-
gulo. Com trs, um tetraedro. Com quatro ou mais, um hiperpoliedro. O nmero de fatores
define as dimenses em que o simplex se move.
Exatamente: voc adivinhou. o mais simples de todos. O simplex sempre uma figura
geomtrica regular, cujas dimenses no variam ao longo do processo de otimizao, e por
isso o mtodo no muito eficiente (Spendley, Hext e Himsworth, 1962; Deming, 1981). Com
dois fatores, o simplex um tringulo eqiltero. Com trs, um tetraedro regular. A Figura
8.1 apresenta graficamente o deslocamento do simplex bsico num problema bidimensional,
em que os fatores so o tempo de reao e a concentrao de um reagente, e a resposta o
rendimento da reao, todos medidos em unidades arbitrrias. Para facilitar a argumen-
tao, estamos admitindo que a superfcie de resposta aproximadamente plana e ascen-
dente do canto inferior esquerdo para o canto superior direito da figura, como mostram as
curvas de nvel. Mais uma vez, isto apenas um recurso didtico. Num problema real,
provvel que no tenhamos nenhum conhecimento prvio sobre a forma da superfcie. At
350
porque, se tivssemos, faramos um negcio mais proveitoso usando a metodologia de
superfcies de resposta ao invs do simplex.
A idia bsica dos mtodos discutidos neste captulo deslocar o simplex sobre a su-
perfcie de resposta de modo a evitar regies de resposta insatisfatria. No presente
exemplo, como obviamente desejamos atingir o rendimento mximo, devemos nos afastar
dos pontos que apresentem baixos rendimentos. Isso feito de acordo com cinco regras.
(a) (b)
150 150
70 70
100 100
65 65
C C
50 50
60 60
(c)
200
75
150
70
100
65
C
50
60
O 50 100 150
351
Otimizao shnph~x.
A pior resposta do novo simplex (BCD) ocorre no vrtice B, cuja rejeio levar ao sim-
plex CDE [Figura 8.1(b)]. Fazendo isso vrias vezes, obtemos uma espcie de deslocamento em
zigue-zague com uma resultante quase perpendicular s curvas de nvel da superfcie de
resposta, correspondendo aproximadamente ao percurso de mxima inclinao [Figura 8.1(c)].
Para uma superfcie plana, como na Figura 8.1, o simplex, sendo tambm plano,
adapta-se perfeitamente ao relevo e o seu deslocamento se d sem problemas. Havendo cur-
vatura significativa, porm, a aplicao da regra 2 pode levar a uma paralisao do movi-
mento. O simplex TUV na Figura 8.2(a) ilustra esse problema. Ele obtido a partir do sim-
plex STU pela rejeio do vrtice S, que substitudo pelo vrtice V. O vrtice V, porm, a-
contece de ter a pior das trs respostas do novo simplex TUV. Pela regra 2 ele deve ser des-
cartado, para obtermos o simplex seguinte. Isso nos trar de volta ao vrtice S, fazendo com
que o novo simplex seja idntico ao simplex de partida, o tringulo STU. Nessas condies,
se continuarmos usando a regra 2 manteremos o simplex preso no mesmo local da superfcie
de resposta, oscilando entre os vrtices Se V. Para sair dessa situao, aplicamos a regra 3.
Regra 3 - Quando o vrtice refletido tiver a pior das respostas do novo simplex,
devemos rejeitar o segundo pior vrtice. Aplicando essa regra ao simplex TUV, descartamos o
vrtice T (ao invs do vrtice V) e obtemos o simplex UVW [Figura 8.2(b)]. A partir dele,
voltando a aplicar a regra 2, obtemos os simplexes 1 UWX, WXY e WYZ. Para sair do simplex
352
WYZ, no entanto, temos de usar novamente a regra 3, j que o vrtice Z, gerado pela reflexo
do vrtice X, o pior dos trs. Rejeitamos portanto o vrtice W e obtemos o simplex "YZA'.
300 300
250
~
83
ao
250
80
, T
200 \ I \ 200
- -)tR
75 \ I \ 75
C c
P JII- -;0
I \ I
150 - -)fN 150
\ I \
70 L JII- -)tM 70
I \ I
--)tK
100 I \ I 100
65 H 9(- -~ I 65
I \ I
50 50
O 50 100 150 o 50 100 150
(a) (b)
353
Otimizao simpiex.
---------
s vezes o mtodo simplex pode especificar para o prximo ensaio condies experi-
mentais impossveis ou muito difceis de executar. Por exemplo, a reflexo do simplex pode-
ria levar a figura para uma regio de concentraes negativas. Ou ento, na otimizao de
um mtodo analtico, para um tempo de reao longo demais para ter utilidade prtica. A
regra 5 nos diz como proceder nesses casos.
Regra 5 - Se o novo vrtice ultrapassar os limites aceitveis para qualquer uma das
variveis que esto sendo ajustadas, devemos atribuir um valor indesejvel resposta nesse
vrtice. A aplicao das regras 2 e 3 far ento o simplex voltar para a regio de valores
aceitveis para a varivel em questo. Mais adiante veremos um exemplo real desse tipo de
comportamento.
A Figura 8.3 mostra o que termina ocorrendo com o simplex bsico quando ele se
aproxima o suficiente do valor procurado. Tendo chegado nas vizinhanas do mximo, que
o valor desejado neste exemplo, o simplex passa a descrever um movimento circular em
torno da resposta mais alta observada (o ponto A:, na Figura 8.3), e da no sai mais. Nesse
estgio no temos mais o que fazer, porque o simplex bsico no pode diminuir de tamanho.
O processo de otimizao deve ser interrompido, e a preciso com que as condies otimiza-
das so determinadas fica dependendo do tamanho e da localizao do simplex inicial. No
nosso exemplo a resposta mxima um pouco superior a 86. O valor mximo alcanado pelo
simplex fica at bem prximo: cerca de 85,3, nas condies experimentais definidas pelo
vrtice A:, t == 50 e c == 247.
Exerccio 8.1
Na Figura 8.3, quais so os simplexes obtidos pela aplicao da regra 2? Quais decorrem da
regra 3? Precisaramos aplicar a regra 4 a algum vrtice?
354
300 .------..:------.:::------~--------~
DI EI
250
200 x
75
150
70
100
65
O 50 100 150
t
No algoritmo modificado (Nelder e Mead, 1965) o simplex pode alterar seu tamanho e sua
forma, e conseqentemente adaptar-se melhor superfcie de resposta. Essa flexibilidade
permite uma determinao mais precisa do ponto timo, porque o simplex pode "encolher"
nas suas proximidades. Alm dessa caracterstica desejvel, o mtodo modificado tambm
pode resultar num nmero de ensaios menor do que o necessrio para a execuo do simplex
bsico, porque o simplex pode "esticar-se" quando estiver longe do ponto procurado e assim
aproximar-se mais rapidamente da regio de interesse.
355
Os possveis movimentos do simplex modificado so ilustrados na Figura 8.4. O
simplex inicial o tringulo BNW. Esta notao j classifica os vrtices de acordo com as
respostas correspondentes. B (de best) o vrtice com a melhor resposta e W (worst) o que
tem a pior. O vrtice N (next to worst) corresponde segunda pior resposta. O primeiro
movimento, partindo do simplex inicial, idntico ao do simplex bsico: uma reflexo do pior
vrtice no centride dos vrtices restantes. Na Figura 8.4, isso corresponde a rebater o ponto
W atravs do ponto mdio do segmento BN, identificado como P. O resultado o ponto ~ e
o novo simplex passa a ser BNR. Para decidir se esse simplex ser retido, porm, precisamos
comparar a resposta observada em R com as respostas obtidas no simplex anterior, BNW.
Trs casos so possveis. Para discuti-los, vamos identificar as respostas com as mesmas
letras usadas para rotular os vrtices. Admitiremos tambm, para simplificar a discusso,
que estamos em busca de um mximo.
B
~~------------- S
W
I
I
I
I
I
I
,
I N
/L
W) ,/
,
I,"'"
~"
--/----~
O
Primeiro caso - R> B. A nova resposta melhor do que todas as respostas do sim-
plex anterior. Isso nos faz supor que o simplex est no caminho certo, e que devemos conti-
nuar nossas investigaes na mesma direo. Realizamos ento uma nova determinao no
ponto S, localizado sobre a reta WPR de forma que a distncia PS seja o dobro da distn-
la - S > R A resposta ficou ainda melhor. A expanso valeu a pena, e o novo simplex
passa a ser BNS.
356
1b - S < R O resultado piorou com a expanso. Devemos ficar com o simplex no
expandido, BNR.
Terceiro caso - R < N. A nova resposta menor do que a segunda pior resposta do
simplex de partida. Conclumos que a direo do movimento no est sendo satisfatria, e
que precisamos corrigir o rumo. Temos novamente duas possibilidades:
ponto mdio do segmento WP. Nesse caso ocorre no apenas uma contrao como tambm
uma mudana no sentido do deslocamento (isto , um recuo propriamente dito).
3b - W < R < N. Embora a nova resposta seja ruim, ainda superior pior das
respostas anteriores. Devemos recuar, mas com moderao. O simplex contrado para uma
posio intermediria entre P e R O novo simplex passa a ser BNU, onde U o ponto
mdio do segmento PR.
- B+N
P=--. (S.la)
2
No nosso exemplo o simplex um tringulo, e por isso o vetor P contm as mdias das
coordenadas de apenas dois vrtices. Se estivssemos otimizando um sistema de trs va-
riveis o simplex seria um tetraedro, e o ponto P seria dado pela mdia dos trs vrtices
situados na face oposta ao pior vrtice, e assim por diante.
Uma reflexo simples (isto , sem expanso nem contrao) gera o ponto ~ dado por
(S.2a)
Caso a reflexo seja feita a partir do segundo pior vrtice, isto , seja resultante da aplicao
da regra 3, s substituir o vrtice W pelo vrtice N:
357
Otimizao shnplex.
(8.2b)
- B+W
p= . (8.1b)
2
Com as Equaes vetoriais 8.1 e 8.2 podemos determinar as coordenadas de todos os pontos
varridos pelo simplex bsico.
Exerccio 8.2
Use a "regra do paralelogramo", da geometria vetorial, para demonstrar que a Equao 8.2a
verdadeira.
Exerccio 8.3
As coordenadas dos vrtices A, B e C na Figura 8.1(a) so dadas respectivamente por (t, C) =
(68, O), (56, 21) e (80, 21). (a) Quais so as coordenadas do ponto D? (b) Quais so as coorde-
nadas do ponto E?
N a expanso temos
(8.3)
(8.4)
Se alm de contrair o simplex precisarmos mudar sua direo, teremos uma subtrao de
vetores, ao invs de uma adio:
(8.5)
358
Nas Figuras 8.5 e 8.6 usamos a mesma superfcie de resposta das Figuras 8.1 e 8.2
para mostrar a aplicao do algoritmo modificado. Os valores numricos da concentrao e
do tempo correspondentes aos diversos vrtices esto na Tabela 8.1. Note que o simplex
inicial ABC o mesmo do exemplo do simplex bsico, o que nos permitir comparar melhor a
eficincia dos dois algoritmos.
Tabela 8.1 Coordenadas dos vrtices do simplex modificado bidimensional cujo desloca-
mento ilustrado nas Figuras 8.5 e 8.6.
A 68 Inicializao
B 56
21 Inicializao
C ABC 80 21 Inicializao
D BCD 68 63 Expanso
359
Otimizao simplex
o primeiro movimento uma reflexo, que nos leva ao ponto D'. Como a resposta
nesse ponto superior a todas as respostas do simplex inicial, fazemos uma expanso at o
ponto D, cuja resposta ainda melhor. O novo simplex portanto o tringulo BCD, cujo pior
vrtice o ponto B. Este, refletido, nos leva ao ponto E', e da, por expanso, ao ponto E,
formando o simplex CDE.
Exerccio 8.4
Use as coordenadas do simplex BCD dadas na Tabela 8.1 e calcule os valores do tempo e da
concentrao no ponto E mostrado na Figura 8.5.
200 , . . - - - - - - - - - - - - - - - - - - - - - - - - ,
75
150
70
c 100
60
50
60
o 50 100 150
Tanto a Figura 8.1(c) quanto a Figura 8.5 apresentam a situao do simplex depois
de nove experimentos. Na Figura 8.1(c), que mostra a aplicao do simplex bsico, a resposta
no nono ponto (o vrtice I) == 68. J na Figura 8.5, em que foi aplicado o algoritmo modi-
ficado, a resposta final (vrtice F) sobe para cerca de 79, porque o simplex modificado foi
"acelerando" a subida, medida que as novas respostas iam-se mostrando melhores que as
360
precedentes. Nessa regio, no entanto, a superfcie de resposta comea a curvar-se, e o
simplex, se prosseguir na mesma direo, terminar passando ao largo do mximo. A Figura
8.6 mostra o que realmente acontece. A passagem DEF ~ EFG trivial. Desse ltimo
simplex uma reflexo nos levaria ao ponto H', no canto superior direito da figura. A resposta
nesse ponto superior resposta no ponto E, mas menor que a resposta no ponto G, que
o segundo pior vrtice do simplex EFG. O procedimento recomendado nesse caso uma
contrao simples (regra 3b), que produz o simplex FGH. Uma reflexo simples nos leva em
seguida ao ponto I' (embaixo, direita), cuja resposta, no entanto, pior que a pior das
respostas em FGH. Pela regra 3a devemos fazer no apenas uma contrao mas tambm
uma mudana de direo. O resultado o ponto I, e o novo simplex passa a ser FGI.
300r-::----..::---------.:-----------.,----------,
250
""ao
200
~ G
75
C
150
70
100
o
50L..------~-----...L--------...,;::::.-.L-----I
o 50 100 150
Exerccio 8.5
Use os dados do simplex FIJ (Tabela 8.1) para calcular os valores do tempo e da concentrao
correspondentes ao vrtice K na Figura 8.6.
361
Exerccio 8.6
Qual o simplex imediatamente posterior ao simplex R8T, na Figura 8.6? Ele o resultado da
aplicao de qual regra?
o ltimo vrtice atingido na Figura 8.6 (o ponto U) est muito prximo do mximo
da superfcie. Caso seja necessria uma maior preciso, pode-se realizar mais experimentos,
que certamente faro o simplex diminuir de tamanho e produziro uma regio mais restrita
ainda nos arredores do mximo. bvio que o simplex no poder reduzir-se a um ponto,
por mais que encolha, e por isso improvvel que o mximo matemtico seja atingido. Para
evitar que a sua busca se prolongue indefinidamente, costuma-se dar por encerrada a inves-
tigao quando as diferenas entre as respostas dos vrtices do simplex ficam do mesmo
tamanho do erro experimental.
362
o novo vrtice, R, ser obtido refletindo-se o vrtice 1 (que nesse caso o vrtice W) no ponto
P . Aplicando a Equao 8.2a temos
Exerccio 8.7
Calcule as concentraes de H2S04, KI e H202 correspondentes ao vrtice 8, que o resultado
de uma expanso do simplex formado pelos vrtices 2, 3, 5 e 6 na Tabela 8.2.
Exerccio 8.8
Calcule a concentrao de H2S04 no vrtice 15, que obtido por reflexo a partir do simplex
formado pelos vrtices 8, 9, 11 e 14 na Tabela 8.2.
Exerccio 8.9
Calcule as concentraes de H2S04, KI e H202 correspondentes ao vrtice 16, partindo do sim-
plex formado pelos vrtices 8, 11, 14 e 15 na Tabela 8.2.
Um dos simplexes da Tabela 8.2 foi obtido de uma forma que ainda no discutimos.
O vrtice 20 foi o resultado de uma contrao com mudana de direo. Esta, por sua vez, foi
conseqncia de uma reflexo malsucedida, que havia produzido um ponto experimental-
mente invivel (o vrtice 19). Ocorre, no entanto, que o vrtice 20 apresenta uma resposta
pior que as respostas do simplex anterior. Em outras palavras, nem a reflexo nem a con-
trao na direo oposta tiveram xito. Nessa situao o procedimento indicado uma
drstica contrao do simplex na direo do vrtice que apresenta a melhor resposta. Esse
movimento, que chamado de contrao macia, ilustrado na Figura 8.7 para um simplex
triangular. Nessa figura o vrtice T, que obtido a partir do simplex BNW por meio de
uma contrao com mudana de direo, apresenta uma resposta inferior pior resposta
do simplex anterior, que a do ponto W. Isso sugere que para obter uma resposta otimizada
363
Otimizao shnpiex
364
devemos investigar melhor a regio do ponto B, o que se pode fazer por meio de uma contra-
o macia. Nesse tipo de movimento apenas o vrtice com a melhor resposta (B) mantido.
Os demais (N e W, em nosso exemplo) so substitudos por pontos localizados no meio das
arestas que os ligam ao vrtice B. O novo simplex passa a ser ento o tringulo BX'Y'. Na
Tabela 8.2, como o simplex um tetraedro, ser necessrio descartar trs vrtices. O vrtice
18, que o melhor dos quatro, mantido, e os vrtices 11, 14 e 16 so substitudos. O novo
simplex passa a ser formado pelos vrtices 18,21,22 e 23, e a otimizao prossegue.
X'
, I
,,
I
Y'
w ~, T
,
,
,,
,,
,,
,,
,,
,
Exerccio 8.10
Calcule as coordenadas dos vrtices 21, 22 e 23, resultantes de uma contrao macia do
simplex formado pelos vrtices 11, 14, 16 e 18 na Tabela 8.2.
365
Otimizao simpiex
No algoritmo modificado o simplex inicial BNW pode ser submetido a cinco diferentes opera-
es: reflexo, expanso, contrao, contrao com mudana de direo e contrao macia.
No simplex supermodificado (Routh, Swartz e Denton, 1977) esse leque de opes am-
pliado.
As Equaes 8.2 - 8.5, que governam o movimento do simplex modificado, podem ser
consideradas casos especiais de uma s,
(8.7)
onde Y representa o novo vrtice, cuja localizao depende do valor do parmetro a. Quando
a igual a 1, 2, 0,5 e -0,5, o vrtice Y corresponde respectivamente aos vrtices ~ S, U e T
das Equaes 8.2 - 8.5 e da Figura 8.4. Na seo anterior salientamos que outros valores de
a poderiam ser utilizados, embora estes fossem os mais corriqueiros. O valor ideal, isto ,
aquele que nos leva mais depressa para perto do ponto desejado, depende de vrios fatores,
como a forma da superfcie, o tamanho do simplex e a extenso do erro experimental. No
simplex supermodificado isso levado em considerao e o valor de a estimado de acordo
com as caractersticas da superfcie estudada. O deslocamento do simplex torna-se assim
mais eficiente. Em compensao, a determinao de cada novo simplex requer a realizao
de mais experimentos do que no caso do algoritmo modificado.
(8.8)
redor de 1,3, teria produzido a melhor resposta. Estas sbias consideraes, infelizmente, s
podem ser feitas a posteriori, depois que a resposta no ponto S tiver sido determinada, ou
366
ento se conhecermos de antemo a superfcie de resposta, caso em que no precisaramos
mais realizar experimento algum.
R w -R-
A = p +05 (S.9)
Popt RR -2R p +R w '
(S.10)
(a)
4
~o 3
Q.
a::
~ 2
1
-----------------~
O '----+----+--+-----+--~
O 1 2 3
W T fi U R S
r>
(b) (c)
eu 4 ctS~4
... a:
~Q. 3 ~ + 3
o.. -----~
~2 mcl
0:-
2
lI: 1 .... IN 1
: (3opt
V
O
o 1 2 3
o o 1 2 3
w fi R S w fi R S
367
Otimizao shnplex.
Exerccio 8.11
Ajuste a equao R = af32+ bf3 + c aos pontos cujas coordenadas so (0, R w ), (1, R p ) e (2,
Aplicando a Equao 8.9 curva mostrada na Figura 8.8(b), onde R w = 2,0, R p = 3,2 e RR
Z =1,36P - 0,36W .
R p < !(Rw +RR)' a superfcie cncava, como na Figura 8.8(c). Obviamente, num caso
2
destes, no interessante continuarmos investigando a regio situada entre W e R, e o ponto
R mantido como o novo vrtice.
entanto, so inconvenientes. Caso o valor de Bopt caia numa dessas faixas, que so ilustra-
das na Figura 8.9, ele descartado e o novo vrtice passa a ser definido pelas regras a
seguir.
2. Valores de ~oPt prximos de zero devem ser evitados, porque resultariam num novo
ponto Z na Equao 8.10 coincide com o ponto P , e a reflexo no pode ser efetuada.
Valores de ~oPt prximos de 1, portanto, tambm devem ser evitados. Se (l-sf3):::;
368
~oPt ~ (1 + S f3)' o valor de ~oPt substitudo pelo limite mais prximo, (1- S f3) ou
~+sf3).
w s
-1 o 1 2 3
369
Referncias bibliogrficas
ANDRADE, J. c.; EIRAS, s. P. e BRUNS, R. E. Study ofthe Mo(VI) catalytic response in the oxidation
of iodide by hydrogen peroxide using a monosegmented continuous flow system. Anal. Chim. Acta
255, 1991,pp. 149-155.
ANSCOMBE, F. J. Graphs in statistical analysis. Amer. Stat. 27, 1973, pp. 17-21.
BARNETT, V. e LEWIS, T. Outliers in statistical data, 2nd edition. New York, Wiley, 1984.
BOX, G. E. P. The exploration and exploitation of response surfaces: some considerations and
examples. Biometrics 10, 1954, pp. 16-60.
_____. Evolutionary operation: a method for increasing industrial productivity. Appl. Statist. 6,
1957, pp. 3-23.
_____. Empirical model-building and response surfaces. New York, Wiley, 1987.
BOX, G. E. P. e YOULE, P. V. The exploration and exploitation ofresponse surfaces: an example ofthe
link between the fitted surface and the basic mechanism of the system. Biometrics 11, 1955, pp.
287-323.
371
Referncias bibliogrficas
BREYFOGLE 111, F. W. Implementing six sigma: smarter solutions using statistical methods. New
York, Wiley, 1998.
BRUNS, R. E.; ANDRADE, J. C.; REIS, C. e NAKAI, D. Is statisticallack offit a reliable criterion for
chemical complexity? Chemom. Intell. Lab. Systems 19, 1993, pp. 159-166.
CORNELL, J. A. How to apply response surface methodology, em The ASQC basic references in
quality control: statistical techniques. Shapiro, S. S., e Mykytka E. F. (eds.), American Society for
Quality Control, Milwaukee, WI, EUA, 1990a.
_____. Experiments with mixtures: designs, models and the analysis of mixture data, 2nd
edition. New York, Wiley, 1990b.
_____. How to run mixture experiments for product quality, em The ASQC basic references in
quality control: statistical techniques. Shapiro, S. S. e Mykytka, E. F. (eds.), American Society for
Quality Control, Milwaukee, WI, EUA, 1990c.
DESCARTES, R. Discours de la mthode de bien conduire sa raison et chercher la vrit dans les
sciences; plus la dioptrique, les mtores et la geomtrie, qui sont des essais de cette mthode.
Leyden, 1637. Existem diversas tradues em portugus, uma das quais publicada na conhecida
coleo Os Pensadores (So Paulo, Abril Cultura!). Os textos citados foram traduzidos pelos
prprios autores.
372
Referncias bibhogrficas
GEYER, A. L. M.; MOREIRA, J. C.; FAIGLE, J. F.; BRUNS, R. E. e CURTIUS, A. J. Local and
temporal variations in essential elements and agar of the marine algae Pterocladia capillacea.
Hydrobiologia 194, 1990, pp 143-148.
LOPES, L. Separao e pr-concentrao de cdmio, chumbo, cobre, niquel e zinco usando extrao
em fase slida com ditizona e naftaleno coprecipitados, Dissertao de mestrado, Instituto de
Qumica, Universidade Federal de Bahia, 1999.
MONTGOMERY, D. C. Design and analysis of experiments, 4th edition. New York, Wiley, 1997.
MONTGOMERY, D. C. Introduction to statistical quality control, 3rd edition. New York, Wiley, 1997.
MONTGOMERY, D. C. e RUNGER, G. C. Applied statistics and probability for engineers, 2nd edition.
New York, Wiley, 1999.
NELDER, J. A. e MEAD, R. A simplex method for function minimization. Computer J. 7, 1965, pp.
308-312.
PIMENTEL, M. F. e NETO, B. B. Calibrao: uma reviso para qumicos analticos. Qumica Nova 19,
1996, pp. 268-275.
373
Referncias bibliogrficas
RORABACHER, D. B. Statistical treatment for rejection of deviant values: criticaI values of Dixon's
"Q" parameter and related subrange ratios at the 95% confidence leveI. Anal. Chem. 63, 1991, pp.
139-146.
ROUTH, M. W.; SWARTZ, P. A. e DENTON, M. B. Performance ofthe super modified simplex. Anal.
Chem. 49, 1977, pp. 1422-1428.
STATI8TICA for Windows. StatSoft, Inc. 2300 East 14th Street, Tulsa, OK, 74104, USA, 1998.
374
Respostas aos exerccios
Captulo 2
2.4 Voc tem duas opes: (a) Somar as freqncias dos intervalos correspondentes e (b) Somar os
nmeros de caroos nesses intervalos e dividir pelo nmero total, 140. Os resultados so
54,3% e 54,28%. A diferena devida aos erros de arredondamento.
2.9 (a) 73,24%; (b) (0,1313, 0,2735); (c) 52,6%) de probabilidade, admitindo-se 5.000 caroos/kg e
interpolando-se entre os valores mais prximos na Tabela A.1.
2.10 (a) O; (b) 50%; (c) 15,87%; (d) 84,13%; (e) 100%. Para o aspecto da curva, veja a Figura 3.7.
2.12 (a) r(x, y) = 0, porque para cada valor positivo de x h um valor de mesmo mdulo, porm
negativo, com a mesma ordenada. Os produtos desses pares (x, y) tm o mesmo mdulo, mas
sinais contrrios. Quando eles forem combinados no coeficiente de correlao, se anularo dois
a dois. (b) Qualquer funo par, isto , que satisfaa f(x) = fi-x). Por exemplo: y = cos x,
y =x 4 .
375
Respostas aos exerck:ios
2.14 Aplicando a Equao 2.11, temos (a) s; =sr +s~ +2(1)(-1)SlS2(1)=sr +s~ -2s 1s 2 , (b)
s; =sr +s~ +2(1)(-1)SlS2(0) =sr +s~. Como as varincias so iguais a 1, temos (a) s; =
e
(b) s; = 2.
2.17 (4.796, 5.094). Esses valores so praticamente idnticos aos do Exerccio 2.15, porque o
nmero de graus de liberdade muito grande.
2.18 Os valores da ltima linha da Tabela A.2 so os valores da distribuio normal padronizada
(z) correspondentes s reas de cauda direita 0,4, 0,25, 0,1, 0,05, 0,025, 0,01, 0,005, 0,0025,
0,001 e 0,0005.
2.19 No verdade. Apenas a transformao de peso para nmero de caroos no linear. O peso
entra no denominador, numa frao de numerador constante, o que faz a mesma faixa de
variao de pesos, quando centrada num valor menor, produzir uma maior variao no
nmero de caroos.
2.20 Usando a Equao 2.17, obtemos 0,00064 < 0"2 < 0,01757, e da 0,0253 < O" < 0,1326..
2.21 O intervalo de 95% de confiana 3,527% < J1 < 4,307% . Como ele no inclui o valor 4,45%,
podemos rejeitar a hiptese nula e concluir que o teor de cido no lote inferior ao teor
mnimo exigido.
2.22 O intervalo de confiana 13,65% < J1 < 14,20% , e no inclui o valor verdadeiro, 14,3%. Isto
uma evidncia de que as quatro determinaes no vm de uma distribuio com mdia
14,3%. Em outras palavras, rejeitamos a hiptese nula neste nvel de confiana e conclumos
que a nova metodologia no tem a exatido necessria.
2.23 ( z: J 1,9~; J
=[ 0,5 = 24,01 . Logo, precisamos de pelo menos 25 determinaes.
376
2.24 O intervalo definido por x [ .iN-} .Como queremos que ele seja igual a x 0,58 , devemos
procurar na Tabela A.2, na coluna correspondente a 95% de confiana, um nmero de caroos
tal que .iN = 0,5 . O valor inteiro mais prximo de satisfazer essa condio N = 18 (v = 17).
2.25 O intervalo de 95% de confiana para a diferena entre as duas mdias (- 3,74, -1,00), no
incluindo o valor zero. Podemos rejeitar a hiptese nula e concluir que existe uma diferena
sistemtica entre os resultados obtidos com a correo e sem a correo da linha de base.
2.26 Usamos a Equao 2.29, substituindo ~ pelo valor de referncia e d e Sd pela mdia e pelo
desvio padro amostrais. Depois comparamos o valor de i com o valor tabelado, no nvel de
confiana desejado. Se o valor calculado for maior que o tabelado, rejeitaremos a hiptese nula
e concluiremos que a amostra incompatvel com o valor de referncia.
A 1-237-01
2.27 t = l'021 = 4,02 . Este valor corresponde aproximadamente ao nvel de 94%.
,
J3
Captulo 3
3.1 Pense.
d2 d2 d2
=-+-=-
4 4 2'
377
Respostas aos exercicios
= L. d? .
. 2N
1,
3.5 Qualquer efeito sempre dado por uma diferena CY+ - y_), onde cada mdia contm N
2
observaes. Podemos escrever ento
2 2 _ _ 2 _. 2 _ (}2 (}2 4(}2
eJefeito=eJ (Y+-Y_)=eJ (Y+)+eJ (Y-)=(N/2t(N/2)=N'
2
que quatro vezes a varincia da mdia, !!-. Tirando a raiz quadrada, temos finalmente
N
2()
eJefeito = JN = 2eJy '
2
3.6 Aplicando a Equao 3.5, obtemos 8 = 7,99 e portanto s = 2,83, com vT = 8 graus de
liberdade no total.
3.7 G = -1,60, A = -2,11 e GA = 0,52. O erro padro de um efeito 0,22, o que torna a interao
GA no significativa, no nvel de 95%. Os efeitos principais mostram que o tempo de pega
diminui 1,6 minutos quando se usa a granulometria mais fina (150-200 mesh) e tambm
diminui 2,11 minutos quando se aumenta a gua residual para 7,5%.
1 1 1
1 -- -- -
2 2 2 67,75 59 1 -1 -1 1 67,75 59
1 1 1
1 - -- -- 1 -1 -1
3.8 A-I e= 2 2 2 x 22,50 90
Xb=
1
x
11,25 90
1 1 1 -13,50 54 1 -1 1 -1 -6,75 54
1 -- - --
2 2 2 -8,50 68 1 1 1 1 -4,25 68
1 1 1
1 - - -
2 2 2
As duas primeiras colunas de A-I e X so idnticas. As outras s diferem pelo fator .!-, que
2
tambm o responsvel pela diferena entre os vetores e e b.
3.9 Nvel (-) do fator 3: Efeito 12(-) = .!- (54,0 - 86,5 - 48,0 + 63,0) = -8,75
2
Nvel (+) do fator 3: Efeito 12(+) = .!- (63,0 - 93,5 - 58,5 + 72,0) = -8,50
2
1 1
Interao do fator 3 com a Interao 12: -2 [12(+)
. -12(-)]
. =-2 (-8,50 + 8,75) = 0,125
Nvel (-) do fator 1: Efeito 23(-) = .!- (54,0 - 48,0 - 63,0 + 58,5) = 0,75
2
Nvel (+) do fator 1: Efeito 23(+) = .!- (86,5 - 63,0 - 93,5 + 72,0) = 1,0
2
378
Respostas aos exercicios
1
Interao do fator 1 com a interao 23: -2 [23(+)
. . - 23(-)] =-21 (1,0 - 0,75) = 0,125 .
2 2
3.10 Vefeito=V(y+-y-)=V(y+)+V(y-) = ~/2 + ~/2
2 2 2
Para um fatorial 23 sem repeties N = 8 e portanto Vefeito = -8 8
+- = - .
8
4 4 2
3.11 t = 3,87, C = 12,36, P = -2,17, tC = 2,54, tP = -0,02, CP = 0,47 e tCP = 0,07. O erro padro de
um efeito 0,325. Basta comparar a coluna das respostas com a matriz de planejamento para
perceber que o padro de oscilao das respostas entre trs e quatro dgitos est associado ao
padro de nveis da concentrao.
3.16 No nvel de 95% de confiana o valor de t com 5 graus de liberdade 2,571.0 valor limite para
a significncia de um efeito ser portanto 0,54 x 2,571 = 1,39. Apenas os efeitos 1, 2, 3, e 12
so significativos nesse nvel de confiana.
379
Respostas aos exercicios
(Vefeito)V=11 0,425
= - - = 1,459 < F11 5 = 4,71 , com 95% de confiana.
(Vefelto
. )
v=5
0,291 '
3.20 A interao dada por 23 = .!. 6'1 + Y2 + Y7 + Y8)-.!. 6'3 + Y 4+ Y5 + Y6)' Suponhamos que Tli
4 4
represente os valores populacionais das respostas Yi . No primeiro bloco temos Yi = l1i , para i
diferena sistemtica h se anular, porque aparecer duas vezes com o sinal positivo (para i =
2ei = 8), e outras duas com o sinal negativo (i = 3 e i = 5).
Captulo 4
1
4.2 134 = - (-52 - 86 + ... + 286) = 114,75 = 12
4
1234 = O dobro da mdia de todas as respostas.
A Tabela 4.5 mostra as relaes implcitas em cada contraste. No uma boa idia interpretar
esses valores como estimativas dos efeitos 134 e 1234, porque eles esto misturados com
efeitos hierarquicamente superiores.
4.3 16.
4.4
4.5 Porque no clculo de 1] o divisor oito, enquanto para os contrastes o divisor quatro.
380
~~~~~~-~---~-~-~-~---~~~~~--~--~~~~.
Respost?s aos exercfcios
4.9 Os efeitos principais esto confundidos com as interaes de quinta ordem. As interaes
binrias se confundem com as interaes de quatro fatores.
4.10 Quando t, [KI] e [H202] esto nos nveis superiores, (a) a resposta no influenciada pela
mudana dos nveis de [H2S04] e do fluxo ou (b) as variaes produzidas pelas mudanas nos
nveis de [H2S04] e do fluxo se cancelam.
so as seguintes:
O efeito principal 3 contaminado por uma interao de quinta ordem, em vez de uma
interao de quarta ordem. Em compensao, os outros quatro efeitos provavelmente so
estimados com menos preciso, j que esto confundidos com interaes de terceira ordem, e
no de quarta como no fatorial de resoluo cinco. As interaes binrias envolvendo o fator 3
esto contaminadas apenas por interaes de quarta ordem. Este fatorial, portanto, privilegia
o fator 3 em detrimento dos demais. A menos que haja um bom motivo para isso, no
recomendamos o seu uso.
381
Respostas aos exercicios
1
4.13 l5 =-(56-66+51-52-54+70-42+64)=6,75 .
4
4.14 Com algum esforo, voc pode descobrir que l5 == 5 + 13 + 27 + 46 + 126 + 147 + 234 + 367 +
4.15 A nica diferena o lado da quadra. Na Tabela 4.10 o ensaio nQ 4 significa bater saques
cortados, com alta freqncia, de dia, num piso de concreto, a partir do lado direito, com
camisa e com uma raquete mdia. Na Tabela 4.12 o saque batido do lado esquerdo.
4.16 Multiplicando-se as trs primeiras relaes geradoras do planejamento da Tabela 4.10 pelo
fator 8 que, como corresponde identidade, no as afeta. No entanto, todas elas passam agora
a ter um nmero par de termos (quatro, no caso), de modo que a troca de todos os sinais deixa
o sinal do produto do mesmo jeito.
4.17 II ==1+248+358+237+346+256+678+457.
Captulo 5
Numerador:
I (xi -X)(Yi -y)= I (xiYi -YXi -x Yi +Xy)= IXiYi -yIXi -XIYi + IXy
382
Respostas aos exercicios
1 Xl
1 X2
5.2 . Xl]x'
n . =b:~i LXi]
LX?
1 Xn
Y1
Y2
. Xl]x
n
[ LYi ]
= LXiYi
Yn
5.4 (a) No linear; (b) Linear; (c) Linear; (d) Linear; (e) No linear, mas tirando o logaritmo dos
dois lados ficamos com um modelo linear.
1
- O O O
4 O O O 4 67,75
1
O 4 O O O - O O
5.6 XtX= (Xtxt = 4
1
(XtXr1xty = 11,22
O O 4 O O O - O -6,75
O O O 4 4 -4,25
1
O O O -
4
Os resultados so os valores numricos dos coeficientes da Eq. 3.11.
5.8
383
Respostas aos exercicios
o segundo somatrio no numerador se anula, porque contm uma soma de resduos em torno
da mdia. Lembrando que o denominador o prprio S xx , podemos escrever finalmente
5.9
5.10
Total 0,295425 11
MQfi'
_ _a_u = 2,39 . No nvel de 95% de confiana, F46 = 4,53
MQ~ ,
2
5.11 8 = 0,000028
Com esses valores e t10 = 2,228 (95% de confiana) o valor de b1 significativo. O de b o , no.
Captulo 6
384
R.espostas aos exerck:ios
pequeno em relao aos efeitos principais. Isso j era de se esperar, porque a superfcie bem
representada por um modelo linear.
O erro padro da mdia igual ao erro padro de bo , porque bo =Y. O erro padro dos efeitos
6.3 MQR = 66,4 e F24 = 6,69 no nvel de 95% de confiana. A regresso altamente
MQr '
significativa. Mais uma vez, j devamos esperar por isto, porque todos os coeficientes na
Equao 6.3 so significativos.
385
Respostas aos exen.:icios
Resolvendo este sistema de equaes, chegamos aos valores Xl = 0,152 (ou seja, uma
ay =-0,525*0 e dY =4,25*0.
dXI dX2
Ou seja: no existem valores extremos para essa funo. Por que ser?
6.9 Como praticamente no h falta de ajuste no modelo quadrtico, podemos tomar a raiz
quadrada da mdia quadrtica residual como uma estimativa do erro padro:
6.10 Com t73 = 1,99 (95% de confiana) e os erros padro dados na Equao 6.10 calculamos
Captulo 7
(b) O modelo prev o rendimento y = (~ )14 + (~ )6 + (~ )(~ )8 = 13,lkmL-1 , que est em boa
386
Respostas aos exerccios.
7.4 B
Coeficientes: b = 1,44; b = 1,71; bB = -0,82. O erro padro de uma observao s = 0,035.
Com ele calculam?s os erros padro dos coeficientes: ~b = ~bB = 0,025 e ~b.B = 0,107.
7.6 No nvel de 95% de confiana, com tg = 2,262 , o limite de significncia para o valor absoluto
dos termos lineares 2,262 x 0,17 = 0,38 , enquanto o dos termos quadrticos
7.7 Substituindo na Eq. 7.16 X3 por (l-Xl) chegamos equaoy = 12,62x l -9,62xf.
(b) Yperda de massa = 2,84x l + 5, 24x 2 + 3,80X3 -11,44x l X2 - 4,56x l X3 - 4,56x 2X3
7.9 (a) ZJ;23 = 6,0. (b) Erro padro de b;23: 5,41. Como esse erro quase igual ao valor do
7.10 Das equaes 7.16 e 7.20 obtemos Yquadrtico = 2,10 em e Ycbicoespecial = 3,30 em . A
estimativa do modelo cbico est muito mais prxima do valor observado, 3,50 em.
1 O O O O
O O
O 1 O O O
O O
O O 1 O O O O
1 1 1
- - O - O O O
2 2 4
7.11 b = X- 1y / onde X= 1 1 1
- O - O - O O
2 2 4
1 1 1
O - - O O - O
2 2 4
1 1 1 1 1 1 1
- - - - - - -
3 3 3 9 9 9 27
387
Respostas aos exercicios
Captulo 8
8.4 Usando a Equao 8.3, temos E =.!. (C + D)+ 2 [.!. (C + D)- B] = ~ (C + D)- 2 B. Substituindo
2 2 2
8.5 O ponto K produzido a partir do simplex FIJ por uma contrao com mudana de direo
8.8 1~
W = 9 , e -P = "3\8+11 +14 ) . E" s aplicar a Eq. 8.2a para chegar a CH2S04 = -0,045 M .
- 8+11+14
8.9 CH2S04=0,1870M,CKI=0,0617M eCHO =0,0039M. Use aEq. 8.4, com P=
2 2 3
e
W=15.
1
8.10 21 = - (18 + 11) = (0,0868, 0,0835, 0,0037);
2
388
Respostas aos exercicios
389
Tabelas
391
Tabela A.l rea da cauda da distribuio normal
padronizada.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
Fonte: Box, G. E. P.; Hunter, W. G., e Hunter, J. S., Statistics for experimenters. An introduction to design, data
analysis and model building. Nova York, Wiley, 1978. Reproduzida com autorizao da John Wiley & Sons, Inc.
392
Tabela A.2 Pontos de probabilidade da distribui-
o t com v graus de liberdade.
rea de probabilidade
v 0,4 0,25 0,1 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
1 0,325 1,000 3,078 6,314 12,706 31,821 63,657 127,32 318,31 636,62
2 0,289 0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,326 31,598
3 0,277 0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,213 12,924
4 0,271 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610
5 0,267 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,265 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,263 0,711 1,415 1,895 2,365 2,998 3,449 4,029 4,785 5,408
8 0,262 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041
9 0,261 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,260 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,260 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,259 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318
13 0,259 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,258 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140
15 0,258 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,258 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015
17 0,257 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965
18 0,257 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922
19 0,257 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,257 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850
21 0,257 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819
22 0,256 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,256 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,767
24 0,256 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,256 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725
26 0,256 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,256 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690
28 0,256 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,256 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,256 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646
40 0,255 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
60 0,254 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460
120 0,254 0,677 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373
0,253 0,674 1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291
Fonte: Box, G. E. P.; Hunter, W. G., e Hunter, J. S., Statistics for experimenters. An introduction to design, data
analysis and model building. Nova York, Wiley, 1978. Pearson, E. S. e Hartley, H. O. (eds.), Biometrika tables for
statisticians, voI. I, Cambridge University Press (1958). Fisher, R. A. e Yates, F., Statistical tables for Biological,
Agricultural and Medical Research, Longman Group Ltd. (1974) - Tabela lI!. Reproduzida com autorizao da John
Wiley & Sons, Inc; Biometrika Trustees e Longman Group UK Ltd.
393
Tabela A.3 Pontos de probabilidade da X2~
distribuio X2 com v graus de
liberdade.
rea de probabilidade
v 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005 0,001
1 0,016 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88 10,8
2 0,010 0,020 0,051 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6 13,8
3 0,072 0,115 0,216 0,352 0,584 1,21 2,37 4,11 6,25 7,81 9,35 11,3 12,8 16,3
4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9 18,5
5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,1 12,8 15,1 16,7 20,5
6 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,5 22,5
7 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,3 24,3
8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0 26,1
9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6 27,9
10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2 29,6
11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8 31,3
12 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,3 32,9
13 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,8 34,5
14 4,07 4,66 5,63 6,57 7,79 10,2 13,3 17,1 21,1 23,7 26,1 29,1 31,3 36,1
15 4,60 5,23 6,26 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8 37,7
16 5,14 5,81 6,91 7,96 9,31 11,9 15,3 19,4 23,5 26,3 28,8 32,0 34,3 39,3
17 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 33,4 35,7 40,8
18 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6, 26,0 28,9, 31,5 34,8 37,2 42,3
19 6,84 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2, 38,6 43,8
20 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,0 45,3
21 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,4 46,8
22 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,3 42,8 48,3
23 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,2 49,7
24 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,2 36,4 39,4 43,0 45,6 51,2
25 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9 52,6
26 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,3 54,1
27 11,8 12,0 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,6 55,5
28 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,0 56,9
29 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,3 58,3
30 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,7 59,7
Fonte: Box, G. E. P.; Hunter, W. G., e Hunter, J. S., 8tatistics for expe rime nters. An introduction to desi{?n, data
analysis and model buildin{? Nova York, Wiley, 1978. Pearson, E. S. e Hartley, H. O. (eds.), Biometrika tables for
statisticians, voI. I, 3a ed., Cambridge University Press (1966). Reproduzida com autorizao da John Wiley & Sons,
Inc., Biometrika Trustees.
394
Tabela A.4 Pontos de porcentagem da distribuio F, 25%.
~
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
V2
1 5,83 7,50 8,20 8,58 8,82 8,98 9,10 9,19 9,26 9,32 9,41 9,49 9,58 9,63 9,67 9,71 9,76 9,80 9,85
2 2,57 3,00 3,15 3,23 3,28 3,31 3,34 3,35 3,37 3,38 3,39 3,41 3,43 3,43 3,44 3,45 3,46 3,47 3,48
3 2,02 2,28 2,36 2,39 2,41 2,42 2,43 2,44 2,44 2,44 2,45 2,46 2,46 2,46 2,47 2,47 2,47 2,47 2,47
4 1,81 2,00 2,05 2,06 2,07 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08
5 1,69 1,85 1,88 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,88 1,88 1,88 1,88 1,88 1,88 1,88
6 1,62 1,76 1,78 1,79 1,79 1,78 1,78 1,78 1,77 1,77 1,77 1,76 1,76 1,75 1,75 1,75 1,74 1,74 1,74
7 1,57 1,70 1,72 1,72 1,71 1,71 1,70 1,70 1,69 1,69 1,68 1,68 1,67 1,67 1,66 1,66 1,65 1,65 1,65
8 1,54 1,66 1,67 1,66 1,66 1,65 1,64 1,64 1,63 1,63 1,62 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,58
9 1,51 1,62 1,63 1,63 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,54 1,53 1,53
10 1,49 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,53 1,52 1,52 1,51 1,51 1,50 1,49 1,48
11 1,47 1,58 1,58 1,57 1,56 1,55 1,54 1,53 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,47 1,46 1,45
12 1,46 1,56 1,56 1,55 1,54 1,53 1,52 1,51 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,45 1,44 1,43 1,42
13 1,45 1,55 1,55 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,42 1,41 1,40
14 1,44 1,53 1,53 1,52 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,41 1,41 1,40 1,39 1,38
CJ.:l 15 1,43 1,52 1,52 1,51 1,49 1,48 1,47 1,46 1,46 1,45 1,44 1,43 1,41 1,41 1,40 1,39 1,38 1,37 1,36
~
Ot 16 1,42 1,51 1,51 1,50 1,48 1,47 1,46 1,45 1,44 1,44 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1,34
17 1,42 1,51 1,50 1,49 1,47 1,46 1,45 1,44 1,43 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33
18 1,41 1,50 1,49 1,48 1,46 1,45 1,44 1,43 1,42 1,42 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33 1,32
19 1,41 1,49 1,49 1,47 1,46 1,44 1,43 1,42 1,41 1,41 1,40 1,38 1,37 1,36 1,35 1,34 1,33 1,32 1,30
20 1,40 1,49 1,48 1,47 1,45 1,44 1,43 1,42 1,41 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,32 1,31 1,29
21 1,40 1,48 1,48 1,46 1,44 1,43 1,42 1,41 1,40 1,39 1,38 1,37 1,35 1,34 1,33 1,32 1,31 1,30 1,82
22 1,40 1,48 1,47 1,45 1,44 1,42 1,41 1,40 1,39 1,39 1,37 1,36 1,34 1,33 1,32 1,31 1,30 1,29 1,28
23 1,39 1,47 1,47 1,45 1,43 1,42 1,41 1,40 1,39 1,38 1,37 1,35 1,34 1,33 1,32 1,31 1,30 1,28 1,27
24 1,39 1,47 1,46 1,44 1,43 1,41 1,40 1,39 1,38 1,38 1,36 1,35 1,33 1,32 1,31 1,30 1,29 1,28 1,26
25 1,39 1,47 1,46 1,44 1,42 1,41 1,40 1,39 1,38 1,37 1,36 1,34 1,33 1,32 1,31 1,29 1,28 1,27 1,25
26 1,38 1,46 1,45 1,44 1,42 1,41 1,39 1,38 1,37 1,37 1,35 1,34 1,32 1,31 1,30 1,29 1,28 1,26 1,25
27 1,38 1,46 1,45 1,43 1,42 1,40 1,39 1,38 1,37 1,36 1,35 1,33 1,32 1,31 1,30 1,28 1,27 1,26 1,24
28 1,38 1,46 1,45 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,34 1,33 1,31 1,30 1,29 1,28 1,27 1,25 1,24
29 1,38 1,45 1,45 1,43 1,41 1,40 1,38 1,37 1,36 1,35 1,34 1,32 1,31 1,30 1,29 1,27 1,26 1,25 1,23
30 1,38 1,45 1,44 1,42 1,41 1,39 1,38 1,37 1,36 1,35 1,34 1,32 1,30 1,29 1,28 1,27 1,26 1,24 1,23
40 1,36 1,44 1,42 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,31 1,30 1,28 1,26 1,25 1,24 1,22 1,21 1,19
60 1,35 1,42 1,41 1,38 1,37 1,35 1,33 1,32 1,31 1,30 1,29 1,27 1,25 1,24 1,22 1,21 1,19 1,17 1,15
120 1,34 1,40 1,39 1,37 1,35 1,33 1,31 1,30 1,29 1,28 1,26 1,24 1,22 1,21 1,19 1,18 1,16 1,13 1,10
00 1,32 1,39 1,37 1,35 1,33 1,31 1,29 1,28 1,27 1,25 1,24 1,22 1,19 1,18 1,16 1,14 1,12 1,08 1,00
Fonte: Box, G. E. P.; Hunter, W. G., e Hunter, J. S., Statistics for experimenters. An introduction to design, data analysis and modelo Nova York, Wiley, 1978. building.
Merrington, M. and Thompson, C. M., Biometrika 33,73 (1943). Reproduzida com autorizao da John Wiley & Sons, Inc. e Bionletrika Trustees.
Tabela A.4 Pontos de percentagem da distribuio F, 10% (continuao).
~
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
V2
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19 60,71 61,22 61,74 62,00 62,26 62,53 62,79 63,06 63,33
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,24 9,44 9,45 9,46 9,47 9,47 9,48 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,18 5,17 5,16 5,15 5,14 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,79 3,78 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,14 3,12 3,10
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,58 2,56 2,54 2,51 2,49 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,34 2,32 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,28 2,25 2,23 2,21 2,18 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,18 2,16 2,13 2,11 2,08 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,21 2,17 2,12 2,10 2,08 2,05 2,03 2,00 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,04 2,01 1,99 1,96 1,93 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,10 2,05 2,01 1,98 1,96 1,93 1,90 1,88 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10 2,05 2,01 1,96 1,94 1,91 1,89 1,86 1,83 1,80
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,90 1,87 1,85 1,82 1,79 1,76
C\j 16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,99 1,94 1,89 1,87 1,84 1,81 1,78 1,75 1,72
\.O 17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,96 1,91 1,86 1,84 1,81 1,78 1,75 1,72 1,69
m
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98 1,93 1,89 1,84 1,81 1,78 1,75 1,72 1,69 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,91 1,86 1,81 1,79 1,76 1,73 1,70 1,67 1,63
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,77 1,74 1,71 1,68 1,64 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92 1,87 1,83 1,78 1,75 1,72 1,69 1,66 1,62 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,86 1,81 1,76 1,73 1,70 1,67 1,64 1,60 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89 1,84 1,80 1,74 1,72 1,69 1,66 1,62 1,59 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,70 1,67 1,64 1,61 1,57 1,53
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,69 1,66 1,63 1,59 1,56 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86 1,81 1,76 1,71 1,68 1,65 1,61 1,58 1,54 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85 1,80 1,75 1,70 1,67 1,64 1,60 1,57 1,53 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,63 1,59 1,56 1,52 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83 1,78 1,73 1,68 1,65 1,62 1,58 1,55 1,51 1,47
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,64 1,61 1,57 1,54 1,50 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,47 1,42 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,51 1,48 1,44 1,40 1,35 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,45 1,41 1,37 1,32 1,26 1,19
00 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 1,60 1,55 1,49 1,42 1,38 1,34 1,30 1,24 1,17 1,00
Fonte: Box, G. E. P.; Hunter, W. G., e Hunter, J. S., Statistics for experimenters. An introduction to design, data analysis and lnodel. Nova York, Wiley, 1978. building.
Merrington, M. and Thompson, C. M., Biometrika 33, 73 (1943). Reproduzida com autorizao da John Wiley & Sons, Inc. e Biometrika Trustees.
Tabela A.4 Pontos de percentagem da distribuio F, 5% (continuao).
I~
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
V2
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
~
~
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
-J 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
00 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Tabela A.4 Pontos de percentagem da distribuio F, 1 % (continuao).
~
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
V2
1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
CI,j
co 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75
00 17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,23 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,20 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,17 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,14 2,03
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
00 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00
.,
Indice remissivo
Aleatorizao, 91 Gaussiana, 15, 26
Amostra normal, 15, 26, 48
aleatria, 17 normal padro, 27
representativa, 17 normal padronizada, 27
Anlise qui-quadrado, X 2 , 48, 49, 55
de varincia, 72, 212
t, Student, 48,51-54
resduo, 103-104
ANOVA, 215 Efeito
rea de cauda, 31 antagnico, 308
erro padro, 92-94
Berra, Yogi, 6, 73 interao, 87-89
Blocagem, 91 principal, 87
fatorial, 126-129 sinrgico, 308
superfcie de resposta, 284-285 varincia, 93
Box, G. E. P., 124, 251 Ensaio, 85
Equaes normais, 206
Caminho Erro
mxima inclinao, 251, 256 aleatrio, 14
Capacidade do processo, 63 grosseiro, 12
Cartas de controle, 61 mdio (quadrtico), 216
Codificao de variveis, 100 padro, 69
Coeficiente padro do efeito, 93, 94, 108
contraste, 96 puro (quadrtico), 229
determinao, 214 sistemtico, 12
correlao, 41, 44, 236-237 Estimador, 102
correlao amostraI, 41 EVOP, 123-126
correlao mltipla, 237 Experimentos confirmatrios, 227
Combinao linear
variveis aleatrias, 43-46 Falta de ajuste, 229-231
Comparao Fatores, 1, 65, 83-84
valor de referncia, 56-58 Faixa de tolerncia, 63
Confundimentos Fatorial
padres, 156 completo, 85, 150-152
Conjunto 2 2 ,86-104
treinamento, 298-300 2 3 , 105-113
teste, 298-300 24 , 113-117
Contrastes, 89 2 k ,86
Covarincia, 40 fracionrio, 150, 153
Cumeeira, 288 2 4-1 , 153-158, 165
25-1, 161-163,165
Diagramas de disperso, 42 25-2 ,168
Densidade de probabilidade, 27 2 7-4 , 170-177
Desvio ,22 2 8-4 ,177-179
padro, 24 embutido, 163-165
padro amostraI, 24 frao meia, 155
Distribuio frao complementar, 158
contnua, 27 geratriz, 157
F,56 Plackett-Burman, 179-180
399
ndice remissh/o
400
ndice remissivo
Tabela
anlise de varincia, (ANOVA), 215,
216, 229-231
qui-quadrado,394
F,395-398
Gaussiana, 392
Normal, 392
T,393
Taguchi, G., 180
tcnicas, 181-184
Tcnicas estatsticas robustas, 34
Teorema do limite central, 35
Teste
duplo cego, 79
Grubbs, 77
falta de ajuste, 231
hipteses, 69
Q de Dixon, 76
valores anmolos,76-77
401