Escolar Documentos
Profissional Documentos
Cultura Documentos
Em Química de Soluções
e Interfaces
Planejamento de Experimentos
sob a ótica da Estatística Química
André Fernando de Oliveira
(andref.oliveira@ufv.br)
Universidade Federal de Viçosa
Objetivo do Seminário
Usando
técnicas de estatísticas univariadas e quimiometria
conhecimento químico /multidisciplinar
Qual software para fazer tratamento estatístico?
- Apresentação gráfica
- Facilidade de uso
- Facilidade de implementar novos cálculos
- Tradição
Statistica
Minitab
SAS
MathLab
Octave Muito prático – trabalham em conjunto com outros
BioStat
PEST Ainda incomparável em relação a modelos não-lineares
Excel Importância crescente – atualização muito rápida
Origin
R
Python
Outros (milhares)
Objetivos do Planejamento de Experimentos
• Screening
• Otimização
• Economia de tempo
• Modelagem quantitativa
- variedade de malte
- variedade de solo
- ...
Experimentos demorados
Relativamente poucos
Muito erro associado
Interesse
Universidade / Pesquisa
Superfície de Resposta
* condições práticas podem variar
* aplicação em várias situações distintas
(condições de contorno diversas)
Todos modelos são errados!
Mas alguns são úteis!
G. Box
Modelos Natureza
ab initio
semi-empíricos
?
empíricos
Qualidade da previsão
precisão
amplitude
Domínio Experimental
Faixa valores
II da variável A
IV
da variável B
III
Variável A
Natureza – desconhecida totalmente
Qual o comportamento das Variáveis A e B? Ou parcialmente (conhecimento científico)
Exemplo
Variável B
C
0.1000
A 0.08750
0.07500
0.06250
B 0.05000
D
0.03750
0.02500
C
0.01250
0.000
Variável A
Qual o comportamento das Variáveis A e B?
I 0.08750
Apenas 0.07500
variável A
0.06250
é significativa
II 0.05000
IV
R
0.03750
0.02500
III
A 0.01250
0.000
Variável A
Qual melhor domínio experimental para o
Planejamento Experimental?
Depende do comportamento
das variáveis!!!!
Experiência Prévia
Tipos de Planejamentos de Experimentos em Química
(Desenhos Experimentais – DoE)
Níveis (n): valores de cada variável
- 1 variável por vez
- Planejamento Fatorial Variáveis ou fatores (f)
contínuas
- Planejamento Doehlert categorizadas
- Composito Central dicotômicas
Superfícies de resposta
- Box-Behnken (Polinomais)
- Outros Historicamente, os DoE se
desenvolveram por permitir
avaliar várias variáveis com
O número de experimentos a serem realizados pequeno número de
depende do experimentos
número de variáveis
número de níveis de cada variável
tipo de desenho experimental
Desenhos Experimentais – DoE
Melhores “custo-benefício”
Fatorial 22 Doehlert
1 variável
por vez Etc.
EVOP
Simplex
Princípio da Suficiência
Conjunto de condições MÍNIMAS de contorno
que permitem a resolução do problema químico
Objetivos do Planejamento de Experimentos
• Screening
• Otimização
• Economia de tempo
• Modelagem quantitativa
• Tecnologia
• Ciência Aplicada
• Ciência Básica
Número maior de níveis
1 variável por vez Número Elevado de Experimentos
Avaliação máximo 2 variáveis simultaneamente
B3 Objetivo:
Resposta R
22 duas variáveis com 2 níveis Mais comum 4 experimentos (* repetição) + ponto central
Mais coerente
8 experimentos (* repetição) + ponto central
23 três variáveis com 2 níveis
24
34
Modelo de Regressão Múltipla Linear
Tipos de Efeitos das Variáveis sobre a Resposta
𝑅 = 𝑏𝑜 + 𝑏1 𝑉1 + 𝑏2 𝑉2 + ⋯ + 𝑏3 𝑉1 𝑉2 + ⋯
Efeito principal
Efeito Secundário
Devido à interação entre duas variáveis
ao produto de duas variáveis Sinérgicos entre si
Antagônicos entre si Parâmetros também
podem ser obtidos
• ANOVA
• Cálculo “manual”
Efeito de confusão: quando não é possível distinguir o efeito das variáveis • outros
Efeito Principal
Efeito Secundário (Interações)
B1
+1
-1 +1
B2
-1
A1 A2
Métodos de Superfície de Resposta
Permitem termos quadráticos
Matriz de Dohlert
Compósito Central
Vários Parâmetros
• índices para análise rápida
- r (coeficiente de correlação)
R2(coeficiente de determinação)
- ANOVA (Teste F)
Teste t
Qualidade da Avaliação
Resíduos do modelo SEMPRE: O Modelo tenta explicar a Natureza
(valor que não foi EXPLICADO pelo modelo)
O modelo que “se ajusta/não se ajusta” aos dados
𝑦ො = 𝑏𝑜 + 𝑏1 𝑥
y1,iexp
𝑒𝑥𝑝
𝑦ො𝑖 𝑒1,𝑖 = 𝑦1,𝑖 − 𝑦ො𝑖
y2,iexp 𝑒𝑥𝑝
𝑒2,𝑖 = 𝑦2,𝑖 − 𝑦ො𝑖
𝑥𝑖
E se um bi não for
Importância dos Termos
significativamente diferente de zero??
𝑅 = 𝑏𝑜 + 𝑏1 𝑉1 + 𝑏2 𝑉2 + 𝑏3 𝑉1 𝑉2 + 𝑏4 𝑉12 + 𝑏5 𝑉22 …
Tipo stepwise:
Todos os termos desse modelo EMPÍRICO são importantes? ▪ Recálculo sem o termo
𝑅 ± 𝑠𝑟𝑒𝑠 = 𝑏𝑜 ± 𝑠𝑏𝑜 + (𝑏1 ±𝑠𝑏1 )𝑉1 +(𝑏2 ±𝑠𝑏2 )𝑉2 +(𝑏3 ±𝑠𝑏3 )𝑉1 𝑉2 + (𝑏4 ±𝑠𝑏4 )𝑉12 +(𝑏5 ±𝑠𝑏5 )𝑉1 𝑉22
𝐻𝑜 : 𝑏𝑖 = 0
𝐻𝑎 : 𝑏𝑖 ≠ 0
Risco :
• Heterocedasticidade
- Repetição apenas no ponto central
Hipótese: Homocedasticidade em todo
espaço amostral
• analisar outlier como dado
válido: interpretação errônea!
Objetivos do Etapas do
Planejamento de Planejamento de
Experimentos Experimentos
• Screening
A. Seleção de Variáveis
• Otimização
B. Definição do Domínio Experimental
• Economia de tempo
C. Codificação das Variáveis
• Modelagem quantitativa
D. Definição das Respostas
• Compreensão do comportamento do sistema químico
E. Seleção do Desenho Experimental
F. Execução
G. Tratamento dos dados
H. Decisão
Conclusão Compreender o problema químico é fundamental para o Planejamento de Experimentos
A discussão para definir o DoE é ótimo para compreender melhor o problema químico
A estatística química é uma forma de abordar o problema químico e a DoE mais coerente
Agradecimento:
Estudo de Caso 1
Respostas devem ser claramente definidas
- diminuir a subjetividade na avaliação
20 mL água 2
4 13
Agitação Centrifuga A
1h (4 000 rpm 10
8 Centrifuga B
60 rpm 10 min)
500 L (12000 rpm
5 6 7
9 -10°C
15 min) 12
Filtração
14
Determinação
Cromatográfica 15
Agradecimento à
Ana Carolina Paiva
doutoranda Agroquímica UFV
- Compreender o processo global
- Identificar relações / conhecimento prévio
Aumento:
• aumenta sensibilidade (linearmente? Uma variável por vez!!)
Área cromatográfica
Otimizar o que? Curva analítica
- Sensibilidade Analítica
(resposta cromatográfica)?
Temperatura
aumento cinética extração
alteração linear do equilíbrio de partição/etc.
degradação do analito ?
11
500 uL MeOH Usado para dissolver suspensão
Diminuição:
aumenta concentração ( apenas
diluição)
13
Centrifuga A
(4 000 rpm 10
8 Centrifuga B
10 min)
500 L (12000 rpm
7
9 -10°C
15 min) 12
Filtração
14
Bias /Viés
FALSO
SIM
POSITIVO POSITIVO
(erro tipo )
Decisão
(Teste)
FALSO
NÃO
NEGATIVO
NEGATIVO
(erro tipo )
desvios
outliers
Modelos de Regressão
gráfico de resíduos
Codificação das Variáveis
- Transformação do valores das variáveis para domínio geometria analítica
, ou seja, as variáveis transformados têm a mesma escala
1,5
1
Codificação
0,5
Variável Y
0
-1,5 -1 -0,5 0 0,5 1 1,5
-0,5
(função conhecida)
-1
-1,5
Variável X
Vantagens:
- mais fácil comparar a importância das variáveis sobre a resposta
- facilita o tratamento dos dados
1,4
1,2
0,8
0,6
Variável = 0.4 code + 0.8
0,4
0,2
0
-1,5 -1 -0,5 0 0,5 1 1,5
Escala codificada
Função
(transformação)
1
𝑇
Não , mas...
- Comportamento realmente linear
Navalha de Occam (Princípio da Parcimônia): “duas teorias com Modelo téorico x Modelo Empírico
iguais resultados, que explicam ou preveem os mesmos fenômenos,
devemos sempre escolher a teoria mais simples”
Guilherme de Occam (1285-1347)
k(T) – Dependência constante cinética em relação à temperatura
Equação de Arrhenius
0,0038 0,0035
y = 2E-08x2 - 1E-05x + 0,0036
0,0036 R² = 0,9995 Linear em uma pequena faixa
1/T /K-1
0,0034
0,0034
0,0033
0,0032
0,0032
0,003
1/T /K-1
0,0028 0,0031
0,0026 0,003
0,0 10,0 20,0 30,0 40,0 50,0 60,0
0,0024 temperatura / °C
0,0022
0,002
0,0 50,0 100,0 150,0 200,0 250,0
Box
Qualimetria
Estatística de Pequenos Números
Student (Gosset)
Fisher
Pearson (Egon – filho)
Newmann
Kolmogorov
Cox
Box
Hunter & Hunter
Montgomery
2.0
Armadilhas B = A + 7.f
f (fator)
1.8 1%
5%
10%
C/H 1.6 25%
50%
C/O
B/A
0%
1.4
1.2
1.0
0 2 4 6 8 10 12 14 16
A
Tabela 12 Resultados de análise elementar (CHNS) para palha de café e para os hidrochars sintetizados (BIO-SL; BIO-LA; BIO-LAA).
Amostra N
(%m/m) C
(%m/m) H
(%m/m) S
(%m/m) O
(%m/m)
H/C
O/C
Biomassa 1,26 41,23 5,22 2,70 49,59 1,52 0,90
BIOSL 0,95 49,82 4,82 2,62 41,79 1,16 0,63
BIOLA 0,98 52,68 5,43 2,49 38,42 1,24 0,55
BIOLAA 0,70 53,50 5,06 2,65 38,09 1,13 0,53
BIOSL = hidrochar sem lavar; BIOLA = Hidrochar lavado só com água ultrapura, BIOLAA = Hidrochar lavado com água ultrapura e solução de acetonitrila água (50%); N =
nitrogênio; C = carbono
Inferência Estatística
Resumo Simplista de Filosofia da Ciência
Intuição
Dedução Lógica
A partir de uma premissa geral e uma premissa particular se chega a uma conclusão particular
Todo ser humano é mortal
João é ser humano
então João é mortal
(silogismo)
Todo ser humano se locomove sobre duas pernas premissa geral é correta?
João é ser humano
então João se locomove sobre duas pernas mas João é cadeirante – premissa
geral não é correta
Até século XVII
MANEIRA DE EXPRESSÃO ADEQUADA (DESDE QUE AS PREMISSAS ESTEJAM CORRETAS
Descartes
Indução (Galilei)
a partir de dados experimentais (casos particulares) formula-se
leis gerais e conclui-se casos particulares.
(Bacon, Locke, Hume, etc.)
Hipotético-Indutivo – Popper (1975) (e escola de Viena) – positivismo lógico
Sequência
Formulação de Problemas
Solução proposta (Conjectura)
Dedução da Consequências (Previsões) – na forma de proposição de testes
Testes de Refutamento (Tentativa de falseamento, pela experimentação, por exemplo)
Teoria é aceita até ser refutada
- Quais Hipóteses
- Quais conhecimentos prévios serenpidity
- aceitos
- questionáveis
Exemplos:
Science Serenpidity – O acaso na ciência
Muitas descobertas na Ciência parecem ter ocorrido por acaso – as Science Serenpidities
- mas há um detalhe importante em todas esses descobertas
- o acaso ocorreu com um cientista preparado para compreender a descoberta!!!!
Conhecer a teoria
Exemplos Saber tratar dados experimentais
1895 Roentgen (Físico) – Raios X Saber relacionar dados experimentais e teoria
1928 Fleming – Penicilina
Forno microondas
http://www.explicatorium.com/sociedade/raios-x.html
https://www.infoescola.com/fisica/ampola-de-crookes/
http://www.rbac.org.br/wp-content/uploads/2017/04/6-
3.png.pagespeed.ce.Ui2ZzDNbmd.png
• No trabalho de pesquisa não necessariamente a importância relativa das respostas devem ser definidas
• Há uma grande subjetividade em muito casos reais (custo mais importante que eficiência, ou vice-versa)