Você está na página 1de 6

FUNO NO R PARA OBTENO DO DESENHO D-TIMO EM MODELOS DE MISTURAS COM RESTRIO

Edmilson Rodrigues Pinto1


Faculdade de Matemtica Universidade Federal de Uberlndia
edmilson@famat.ufu.br

Leandro Alves Pereira1


Faculdade de Matemtica Universidade Federal de Uberlndia
leandro@famat.ufu.br

Resumo. Experimentos com misturas so usados em diversas reas da cincia e da indstria, especialmente nas indstrias qumica e farmacutica. A obteno de desenhos timos em experimentos com misturas de grande importncia, pois permitem a estimao eficiente dos parmetros dos modelos considerados, alm de economizarem tempo e dinheiro. Nas situaes onde os desenhos timos tradicionais, comumente aplicados em experimentos com misturas, no puderem ser usados, por exemplo, em alguns problemas de misturas com restrio, desenhos timos, obtidos com a ajuda de computadores, devem ser utilizados. Existem poucos pacotes estatsticos que permitem a obteno de experimentos timos nessas situaes, sendo todos eles comerciais. O objetivo deste trabalho apresentar uma funo desenvolvida em R para obteno do desenho D_timo em experimentos de misturas com restrio. O software estatstico R uma linguagem orientada a objetos e faz parte de um projeto de software livre e gratuito. A funo, intitulada D.otimo.mix, foi desenvolvida originalmente em Fortran e posteriormente convertida em uma biblioteca do R. Devido sua praticidade, facilidade de uso e por poder ser adicionada biblioteca de um software livre e gratuito, acredita-se que essa funo possa ser de grande utilidade para pesquisadores e profissionais que necessitem conduzir experimentos que envolvam misturas.

Palavras-chave: Desenhos timos para misturas com restrio, desenhos D_timos, desenhos timos no R.

1. Introduo
O termo mistura usado para definir uma formulao ou uma composio de determinadas substncias. Muitos produtos so confeccionados a partir da mistura de vrios componentes. Tintas, alimentos, produtos qumicos e farmacuticos so alguns exemplos. Um experimento com mistura aquele no qual dois ou mais componentes so misturados, em qualquer proporo e uma resposta obtida para cada conjunto dos componentes da mistura. O propsito geral em um experimento de mistura com vrios componentes, a partir de um nmero limitado de observaes, tornar possvel obter uma estimativa da resposta. Geralmente, as observaes so obtidas de combinaes pr-selecionadas dos componentes na tentativa de se determinar quais delas, de alguma maneira, otimizam a resposta (Cornell, 2002). A principal referncia sobre a teoria de experimentos com mistura o livro de Cornell (2002), onde se pode encontrar uma exposio abrangente e detalhada sobre o tema. Myers & Montgomery (2002) dedicam dois captulos a experimentos com mistura, constituindo uma boa introduo ao assunto. Atkinson et al. (2007) dedicam um captulo sobre a obteno desenhos timos para misturas, utilizando um algoritmo intitulado BLKL e o software SAS (Statistical Analysis System). Pinto & Ponce de Leon (2006) tambm apresentam um captulo sobre a obteno de desenhos timos para misturas, considerando diversas situaes. Em certos experimentos com mistura, pode haver a necessidade de restringir a proporo de um ou mais componentes, que, por motivos tcnicos ou prticos, no podem satisfazer todas as propores possveis. Com isso, a nova regio experimental passa a ser uma sub-regio da regio das propores matematicamente possveis. Essas restries nos componentes, que so muito comuns nos casos industriais, podem ser apenas limites superiores, apenas limites inferiores ou
1

Agradecimento FAPEMIG pelo apoio financeiro

uma combinao das duas. Na prtica, h casos em que muitos dos componentes de uma mistura possuem simultaneamente limites superiores e inferiores em suas composies. De um modo geral, essas restries podem ser representadas da seguinte forma: 0 li xi ui 1, i = 1, 2,...,q. (1)

Onde li o limite inferior e ui o limite superior para o componente de mistura xi. Com essas restries, a regio experimental pode ter forma bem diferente da regio sem restries. Nesses casos, no vivel recorrer mais aos planejamentos experimentais tradicionais apresentados na literatura, e, muitas vezes, recorre-se a algoritmos computacionais para a escolha da localizao dos pontos experimentais. Existem situaes em que possvel usar transformaes lineares das variveis originais, os pseudo-componentes, para transformar um problema de mistura com as restries (1) em um problema de mistura irrestrito e os experimentos tradicionais podem ser usados. Entretanto, quando no for possvel o uso de pseudo componentes, desenhos timos, baseados em algoritmos computacionais, devem ser usados. Kiefer (1961) provou que os planejamentos em rede simplex sem restries nos componentes, usados para modelos polinomiais de primeira e segunda ordem, so D-timos. Para experimentos com restries nos componentes, McLean e Anderson (1966) sugerem que sejam usados os pontos extremos da regio de experimentao. Saxena e Nigam (1973) mostraram que o desenho timo tambm pode conter conjuntos de pontos na regio de experimentao que no so necessariamente pontos extremos. Snee e Marquardt (1974), atravs de um algoritmo chamado XVERT, mostraram que os pontos de vrtice, o centro e os pontos mdios das retas, que delimitam a regio experimental, so candidatos a ponto timo. Nesse caso, o conjunto de pontos timos ser um subconjunto dos pontos candidatos. Este trabalho apresenta uma funo no R para obteno de desenho D_timo em experimentos de mistura com restrio, considerando o modelo quadrtico de Sheff com trs componentes. Acredita-se que essa ferramenta ser de grande importncia para pesquisadores e profissionais que necessitem conduzir experimentos para modelos de mistura com restrio. O R um software flexvel, potente e confivel para realizar tarefas estatsticas de qualquer tipo, desde as mais elementares s mais avanadas. Alm disso, ele conta com a vantagem de ser gratuito e de seus processos de instalao e uso serem simples e de ser um software de aceitao mundial, usado no somente por profissionais da rea de estatstica como tambm por pesquisadores e profissionais nas mais variadas reas do conhecimento. Um dos principais motivos da grande utilizao do R o fato de qualquer usurio poder melhorar o cdigo do software bsico ou escrever cdigos para tarefas especficas, aproveitando todos os recursos j existentes. Alm da gratuidade, a outra grande vantagem de se utilizar o R para implementao da funo apresentada neste trabalho a possibilidade de utiliz-la dentro de outros programas. Na seo 2 apresentada uma breve introduo sobre experimentos com misturas e a regio experimental para o caso de trs componentes com e sem restrio. Na seo 3 apresentada a funo D.otimo.mix e um exemplo de aplicao. As concluses finais deste artigo so apresentadas na Seo 4.

2. Modelos para componentes de misturas


Sejam xi , i = 1,...,q, as variveis que representam as propores dos q componentes de mistura. Em experimentos envolvendo mistura, a soma das propores dos componentes sempre igual a 1, ou seja,

x
i =1

= 1 e xi 0 , i=1,...,q

(2)

Ao modificar a formulao do problema, no sentido de alterar as propriedades de uma determinada mistura em estudo, as novas propores devem continuar obedecendo restrio de mistura (2). Assim sendo, em planejamento de experimentos com mistura devem ser adotados projetos que considerem esta restrio. As restries em (2) so mostradas na Figura 1, para o caso de dois e trs componentes. Devido restrio de mistura, a regio experimental se reduz a uma regio simplex de dimenso q 1. Na Figura 1, cada lado do tringulo corresponde a uma mistura binria e os vrtices dos tringulos correspondem s formulaes de componentes puros. No interior do tringulo, esto situadas as possveis misturas ternrias. Neste caso, so necessrias apenas duas dimenses para representar graficamente o experimento, como pode ser visto na Figura1c. Como cada componente representado por um vrtice, uma figura geomtrica com trs vrtices e duas dimenses, ou seja, um tringulo equiltero, representa o espao fatorial restrito de uma mistura ternria.

(a)

(b)

(c)

Figura 1: Representao do espao experimental simplex para variveis independentes e misturas (a) para duas variveis, (b) e (c) para trs variveis.

2.1 Polinmios cannicos

Para se obter o melhor ajuste para a varivel resposta, modelos matemticos devem ser ajustados aos dados obtidos do planejamento experimental. Em procedimentos com modelos de misturas, experincias tm demonstrado que a mdia da varivel reposta Y pode ser estimada utilizando um polinmio de Taylor (Box et al., 1978). Para duas variveis, um modelo quadrtico poderia ser:
E (Y ) = 0 + i xi + ii xi 2 + ij xx x j .
i =1 i =1 i< j q q q

Entretanto, quando a condio para misturas aplicada ao modelo polinomial, a equao se transforma em:
E (Y ) = i* xi + ij * xx x j ,
i =1 i< j q q

(3)

onde: i * = 0 + i + ii

ij * = ij ii jj , i, j = 1, 2,..., q, i < j
O polinmio apresentado em (3) descrito como o polinmio de segunda ordem ou polinmio quadrtico de Sheff. Este polinmio faz parte de um grupo de polinmios especiais para experimentos com mistura e, em geral, tais polinmios podem tomar as seguintes formas: Modelo linear:
E (Y ) = i xi
i =1 q

Modelo quadrtico E (Y ) = i xi + ij xi x j
i =1 i< j q q

Modelo cbico especial E (Y ) = i xi + ij xi x j +


i =1 i< j q q i< j <k

ijk i

x x j xk
q

Modelo cbico completo E (Y ) = i xi + ij xi x j +


i =1 i< j q q i< j <k

ijk i

x x j xk + i j xi x j ( xi x j )
i< j

3. A Funo D.otimo.mix
A obteno de desenhos D-timos envolve procedimentos numricos como clculos matriciais e maximizao sujeita a restries. Desta forma, softwares de programao matemtica como Matlab ou Fortran so mais adequados. Para construo da funo D.otimo.mix foi utilizado como base um programa escrito em Linguagem Fortran 90. Esse compilador possui ricas bibliotecas de funes matemticas. O programa para obteno do desenho D-timo foi compilado em Fortran e convertido em uma biblioteca do tipo DLL para a linguagem R, atravs de um pacote de converses da linguagem R, chamado Rtools. A instalao da funo d.otimo.mix simples, basta copiar todos os arquivos que fazem parte dessa funo no diretrio de trabalho do R. Geralmente este diretrio definido como sendo a pasta meus documentos, exceto quando o mesmo alterado pelo usurio. Para habilitar a funo no R, o usurio dever digitar na linha de prompt do R o comando source(dotimomix.r) e salvar a rea de trabalho para que o comando no precise ser digitado posteriormente. A funo D.otimo.mix poder ser adquirida atravs de contato por email com os autores.
3.1. Exemplo de Aplicao

O exemplo abaixo foi reproduzido de Atkinson et al. (2007). Seja uma mistura composta por trs componentes, sujeitos s seguintes restries: 0, 2 x1 0, 7 0,1 x2 0, 6 0,1 x3 0, 6 Suponha-se que o modelo quadrtico de Sheff, com seis parmetros, seja adequado para a mistura apresentada, ou seja, E (Y ) = 1 x1 + 2 x2 + 3 x3 + 12 x1 x2 + 13 x1 x3 + 23 x2 x3 . As restries nos componentes da mistura geram um hexgono, de forma bem diferente da regio simplex regular (Veja Figura 2). Para este problema deve-se, primeiramente, obter os pontos candidatos e depois obter o desenho timo atravs de algum mtodo numrico. Para obteno da regio experimental e dos pontos candidatos pode-se utilizar a Figura 1c, onde as linhas internas representam os eixos relativos x1 , x 2 e x3 e onde sero traadas as linhas de restrio. A rea interna delimitada por estas linhas de restrio ser a regio de experimentao. Cada ponto de vrtice desta rea ser um ponto candidato, juntamente com os pontos mdios das linhas de restrio e o ponto central da regio experimental. Este esquema est representado na Figura 2. A

regio experimental est representada pelas linhas em negrito e os pontos em preto representam os pontos candidatos. Tendo em mos estes pontos e o modelo especificado, tem-se as condies necessrias para executar a funo D.otimo.mix no R.

Figura 2: Regio experimental e pontos candidatos

Para executar a funo D.otimo.mix usa-se a seguinte comando:


Objeto <- d.otimo.mix(c(a1,a2,a3),c( b ),c( c ),c(modelo),c( l ),c( u ))

Onde o vetor Objeto representa a matriz que receber os resultados. Os parmetros a1, a2 e a3 representam o nmero de pontos candidatos, o nmero de variveis e o nmero de parmetros do modelo, respectivamente. O nmero de pontos candidatos deve ser, no mnimo, igual ao numero de parmetros do modelo. O vetor b contm os pontos candidatos. Estes pontos devem ser digitados em seqncia e separados apenas por vrgulas. O vetor c contm os pesos associados aos pontos candidatos. Estes pesos devem ter soma igual a um. O objeto modelo contm as informaes sobre o modelo considerado. Cada parmetro a ser estimado no modelo deve ser informado pelo nome da varivel ou da interao que ele deve descrever, entre parnteses. A interao representada pelo smbolo *. Se o modelo tiver a constante, essa deve ser informada como numero 1. Os vetores l e u contm os limites inferiores e superiores para os componentes da mistura, respectivamente. O comando para a funo D.otimo.mix para o exemplo considerado dado por:
Des_mix <- d.otimo.mix(c(13,3,6), c(0.6,0.3,0.1,0.2,0.6,0.2,0.7,0.2,0.1,0.4,0.3,0.3,0.3,0.4,0.3,0.2,0.3,0.5), c(0.076, 0.076, 0.076, 0.076, 0.076, 0.076, 0.076, 0.076, 0.076, 0.076, 0.076, 0.076,0.088), c("x1","x2","x3", "x1*x2","x1*x3","x2*x3"), c(0.2,0.1,0.1), c(0.7,0.6,0.6))

Os resultados (pontos timos e pesos) so colocados em um vetor qualquer, que no exemplo, recebeu o nome de Des_mix: O Quadro 1 apresenta os pontos candidatos e os pontos timos obtidos pela funo D.otimo.mix. O tempo gasto pelo software para retornar os resultados foi de, aproximadamente, 4 segundos, para um computador com processador de 2.0 Gigahertz e 1 Gigabyte de memria RAM. Aps a execuo da funo, 10 pontos timos foram encontrados, coincidindo com o resultado obtido por Atkinson et al. (2007), utilizando o algoritmo BLKL, implementado em Fortran, para obteno de desenhos timos exatos. Note que os pontos excludos do experimento foram os pontos centrais dos seguimentos de retas menores, que delimitam a regio de experimentao (Figura 2). O Quadro 1 tambm apresenta os pesos obtidos pelo algoritmo BLKL e pela funo D.otimo.mix. Novamente, os resultados foram, aproximadamente, coincidentes. Os pesos em cada ponto ficaram distribudos de tal forma que o ponto central teve menor peso e os pontos centrais dos seguimentos de retas maiores tiveram maior peso.

Quadro 1: Pontos candidatos e desenhos timos obtidos pela funo d.otimo.mix em R no caso contnuo, e usando o algoritmo BLKL, no caso discreto, implementado em Fortran.
Pontos 1 2 3 4 5 6 7 8 9 10 11 12 13 Pontos candidatos 0,7 0,1 0,2 0,2 0,6 0,2 0,7 0,2 0,1 0,2 0,2 0,6 0,3 0,6 0,1 0,3 0,1 0,6 0,7 0,15 0,15 0,2 0,4 0,4 0,5 0,1 0,4 0,25 0,6 0,15 0,5 0,4 0,1 0,25 0,15 0,6 0,4 0,3 0,3 Pontos timos obtidos pela funo D.otimo.mix e pelo algoritmo BLKL 0,7 0,1 0,2 0,2 0,6 0,2 0,7 0,2 0,1 0,2 0,2 0,6 0,3 0,6 0,1 0,3 0,1 0,6 0,2 0,5 0,49989 0,3999 0,4 0,1 0,4 0,2999 0,3999 0,3999 0,1084 0,3 Pesos (BLKL) 0,1 0,1 0,1 0,1 0,1 0,1 0,11 0,11 0,11 0,07 Pesos (D.otimo.mix) 0,1008 0,1008 0,1008 0,1009 0,1008 0,1008 0,1084 0,1083 0,1084 0,0701

4. Concluso
A obteno de desenhos timos de grande importncia, pois promovem diminuio do nmero de pontos a serem considerados no experimento, acarretando economia de tempo e dinheiro, alm de fornecer a proporo de recursos que se deve gastar em cada ponto considerado timo. O desenho timo tambm garante que nos pontos e nas propores consideradas para cada ponto, os parmetros do modelo sero estimados da melhor forma possvel. Este artigo apresentou uma funo alternativa para obteno de desenhos D-timos em experimentos de misturas com restrio. A funo foi implementada no R e apresentada atravs de um exemplo obtido da literatura. A implementao da funo no R bastante simples. Devido sua praticidade, facilidade de uso e por poder ser adicionada biblioteca de um software livre e gratuito, acreditase que essa funo possa ser de grande utilidade para pesquisadores e profissionais que necessitem conduzir experimentos que envolvam misturas.

5. Referncias
Atkinson, A. C., Donev, A. N., Tobias, R. D.; Optimum experimental Designs with SAS. London, Oxford Statistical Science Series, Oxford university Press, 2007. Box, G. E., Hunter, W. G., Hunter, J. S.; Statistics for Experimenters. John Wiley & Sons, New York, 1978. Cornell, J.A.; Experiments with mixtures: designs, models and the analysis of mixtures data. Segunda Edio, Jonh Wiley & Sons, New York, 1981. Kiefer, J.; Optimum designs in regression problems II. Annals of Mathematical Statistics, 32, pp. 298325, 1961. McLean, R. A., Anderson, V. L.; Extreme vertices design of mixture experiments. Technometrics, 8, pp. 447454, 1966. Myers, R.H., Montgomery, D.C.; Response Surface Methodology. Segunda Edio, John Wiley & Sons, New York, 2002. Pinto, E. R., Ponce de Leon, A. C. M.; Planejamento timo de Experimentos. XVII Simpsio Nacional de Probabilidade e Estatstica, Caxambu, Associao Brasileira de Estatstica, 2006. Prescott, P.; Modelling in misture experiments including interactions with process variables. Quality Technology & Quantitative Management, 1, pp. 87-103, 2004. Saxena, S. K., Nigam, A. K.; Symmetric-simplex block designs for mixtures. Journal of the Royal Statistical Society, Series B, 35, pp. 466472, 1973. Snee, R. D., Marquardt, D. W.; Extreme vertices designs for linear mixture models. Technometrics, 16, pp. 391408, 1974.