Escolar Documentos
Profissional Documentos
Cultura Documentos
http://www.fisica.ueg.br/ademir/
EMENTA
Vetores aleatrios;
Distribuio normal multivariada;
Pr-processamento de dados.
Classificao e discriminao.
Anlise de varincia multivariada.
Planejamento fatorial e superfcie de resposta.
Anlise de Componentes Principais.
Anlise de agrupamento
Mtodos de reconhecimento de padres nas classificaes.
Calibrao multivariada em qumica analtica.
P
Pacotes
t quimiomtricos
i i t i
para microcomputadores.
i
t d
e anlises de vrias
variveis estatsticas ao mesmo tempo. Quando a estatstica
multivariada usada para descrever fenmenos qumicos e
farmacuticos passa a ser chamada de Quimiometria.
Quimiometria
O termo quimiometria foi introduzido por Swede Svante Wold
(Suo) e Bruce R. Kowalski (Americano) em 1972
Definio
efi io da International
te atio al cchemometrics
e o et ics society ICS,1974
CS, 97
DADOS
ESTATSTICA MULTIVARIADA
INFORMAO
CONHECIMENTO/ENTENDIMENTO
DECISO
SOFTWARES
1)
Matlab (Mathworks);
2)
PLS_toolbox (Eigenvector);
3)
Unscrambler (Camo);
4)
Pirouette (Infometric);
5)
SIMCA (Umetric);
6)
S i i (Statroft);
Statistica
(S
f)
7)
8)
9)
R (Free) http://www.r-project.org/
REVISTAS CIENTFICAS
1) Journal of Chemometrics (Wily);
2) Chemometrics and Intelligent Laboratory Systems (Elsevier).
(Elsevier)
3) Analytical Chemistry (ACS Publications);
4) The
Th A
Analyst
l t (RSC Publishing);
P bli hi )
5) Analytical Chemical Acta (Elsevier);
6) Analytical and Bioanalytical Chemistry (Springer);
7) Talanta (Elsevier);
8) Applied Spectroscopy (Society for Applied Spectroscopy);
f
((NIR Publications);
);
9)) Journal off Near Infrared
10) SAR & QSAR in Environmental Research
LIVROS
1 Como Fazer Experimentos (B.
1.
(B B
B. Neto
Neto, I.
I S.
S Scarmino; R.
R
E. Bruns);
2. Chemometrics ( M. Otto);
3. Chemometrics: a pratical guide (B. P. Seasholtz);
4. Tutorial PLS_toolbox (Barry M. Wise)
5. Design And Analysis Of Experiments (2004) DOUGLAS
C. MONTGOMERY
PLANEJAMENTO E OTIMZAO
DE
EXPERIMENTOS
C
O
N
H
E
C
I
M
E
N
T
O
OBJETIVO
TCNICA
Planejamento
j
fracionrio
Avaliar a influncia
das variveis
Planejamentos
j
fatoriais completos
Construo de
modelos empricos
Modelagem por
mnimos quadrados
Otimizao
Superfcie de
resposta,
t Simplex
Si l
Construo de
modelos
d l mecanstico
ti
Deduo a partir de
princpios
i i gerais
i
ERROS GROSSEIROS
1.
2.
3.
4.
TIPOS DE
ERROS
ERROS SISTEMTICOS
1. Atribudos a causas definidas;
2. Afetam o resultado sempre na mesma direo;
3. Podem ser corrigidos;
4. Podem ser de mtodos, operacionais, pessoais ou
i t
instrumentais;
t i
5. Exemplos: balana no tarada, pipeta no aferida,
indicador errado em uma titulao etc.
ERROS ALEATRIOS
1. No possuem valores definidos;
2. No so mensurveis;;
3. Flutuam aleatoriamente entorno de um valor central
(mdia);
4. Devem ser tratados estatsticamente.
Concentrao (%)
Titulao no
Concentrao (%)
3.91
11
3.96
4.01
12
3.85
3.61
13
3.67
3.83
14
3.83
3.75
15
3.77
3.91
16
3.51
3.82
17
3.85
3.70
18
4.04
3.50
19
3.74
10
3.77
20
3.97
1
b=
3
a = [ 2 4 1]
MATRIZ
2
A = 7
5
3
2
2
0
6
1
3
Comandos do MATLAB
>> A=[2
A [2 5 3 6;7
67321
1;5
5 2 0 3]
7
3
2
1
5
2
0
( AB )
=B A
Comandos do MATLAB
>> B=A'
ADO
DE MATRIZES
As matrizes devem ter dimenses iguais
Exemplo
1
X =
5
1
5
4
4
4
4
3 2
+
0 2
Comandos do MATLAB
>> C=X+Y
2
Y =
2
4
6
1 3 8
=
3 7 10
MULTIPLICAO
DE MATRIZES
POR ESCALAR
c=4;
1
X =
5
1
c* X = 4
5
4
4
Comandos do MATLAB
>> c*X
4
4
3 4 16 12
=
0 20 16 0
PRODUTO DE MATRIZES
O nmero de colunas da primeira matriz deve
ser igual ao nmero de linhas da segunda
segunda .
2
A=
4
5
5
3 2x3
4
B = 9
5
3
5
5
3
58 34 31 41
A* B =
76 46 53 69 2x4
2 4
Comandos do MATLAB
>> A*B
7
4
7 3x4
MATRIZ IDENTIDADE
I * A = A* I = A
I 44
1
0
=
0
0
0
0
Comandos do MATLAB
>> I=eye(4,4)
MATRIZ NULA
A* Nula = Nula
A + Nula = Nula + A = A
0
0
Nula =
0
0
0
0
0
Comandos
C
d d
do MATLAB
>> Nula=zeros(4)
0
0
MATRIZ DE UNS
1
1
U = 1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Comandos
C
d d
do MATLAB
>> U=ones(5)
1
1
1
1
1
MATRIZ INVERSA
-1
-1 -1
AB
=
B
A
( )
2 1 1
A = 4 1 0
-2 2 1
-1
A* A = A * A = I
Comandos do MATLAB
>> C =inv(A)
>> C*A
2 A + B = B + A;
3 0 + A = A + 0 = A;;
4 A + ( -A ) = 0;
5 ( A + B ) = A + B;
6 ( + ) A = A + A;
7 ( ) A = ( A ) ;
8 1 A = A
INDEPENDNCIA LINEAR
Dado um conjunto de vetores
{v1 , v2 , v3 "}
dizemos q
que esses vetores so linearmente
independentes se a equao
1 = 2 = 3 = " = n = 0.
EXEMPLOS
As matrizes
1 0
3 0
A=
e B=
2 3
6 9
no so linearmente independentes, pois
B = 3 A.
A
Os vetores
1
e1 = 0 ,
0
so L.I.
0
0
e2 = 1 e e3 = 0
0
1
EXEMPLOS
O posto da matriz
1
A = 2
3
3
6
9
2
9 dois.
8
Comandos do MATLAB
( )
>> rank(A)
ans = 2
PRODUTO INTERNO
Um produto interno sobre um espao vetorial real V
uma funo que associa a cada par de V a um
nmero real, satisfazendo as seguintes propriedades:
i ) v,v 0 p/ v V e v,v = 0 v = 0
ii ) v1 , v2 = v1 , v2 p/ \
iii ) v1 + v2 , v3 = v1 , v3 + v2 , v3
iv) v1 , v2 = v2 , v1
EXEMPLOS
O produto escalar usual de vetores do \ n . Dados
p como
os vetores a e b,, definimos o p.i.
a,b = a b
T
Se
2
a = 5
1
4
b = 3 , ento
5
4
a T b = [ 2 5 1] 3 = 28.
28
5
Comandos do MATLAB
>> c=a*b
DETERMINANTES
Seja A uma matriz quadrada. O determinante da
matriz A definido como
n!
EXEMPLOS
1
A = 4
7
2
5
8
3
6
0
Comandos do MATLAB
>> det(A)
A = 27.
2
HISTOGRAMA
um grfico de barras em que a rea ou a altura
representa
p
a ffreqncia
q
da classe.
Rol o conjunto de dados brutos dispostos em
alguma ordem, geralmente crescente.
1 Amplitude
1.
A li d do
d rol=
l valor
l mximo
i
valor
l mnimo;
i
2. Amplitude da classe = Amplitude do rol/nmero
de classe;;
3. Nmero de classe = raiz quadrada do nmero de
amostra.
Toda anlise estatstica deve comear com um grfico
Freqncia
F .R. =
Nmero total de amostras
Freqncia
Intervalo (conc. %)
Freqncia
3.500 6 3.608
0.10
3.608 6 3.716
0.15
3.7166 3.824
0.25
3.8246 3.932
0.30
3.9326 4.040
0.20
Relativa
INTERPRETAO
DOS DADOS
DA TABELA DE FREQNCIAS
10% das titulaes tm valores entre 3,500 e 3,608
15% das titulaes tm valores entre 3,608 e 3,716
25% das titulaes tm valores entre 3,616
3 616 e 3,824
3 824
Portanto, a pprobabilidade de encontrarmos
aleatoriamente uma titulao com valor entre 3,500 e
3,608 exatamente 10%. Podemos afirmar isso porque
conhecemos a distribuio exata das freqncias da
populao.
Comandos do MATLAB
3.9100
4.0100
3.6100
3.8300
3.7500
3.9100
3.8200
3 7000
3.7000
3.5000
3.7700
y=
3
3.9600
9600
3.8500
3.6700
3.8300
3.7700
3.5100
3.8500
4.0400
3.7400
3.9700
0.2000
AMOSTRA
qqualquer
q
subconjunto
j
de uma populao
p p
.
AMOSTRA REPRESENTATIVA
1. O
Os elementos
l
so escolhidos
lh d rigorosamente ao acaso;
2. Todos os elementos tm a mesma chance de serem
escolhidos;
3. Nmero suficiente de elementos, o qual depende da
preciso das estimativas.
TIPOS DE AMOSTRAGEM
1. Amostra Aleatria Simples (AAS): consiste em
enumerar cada elemento da populao e em seguida fazer
o sorteio;
2. Amostragem Sistemtica: cria-se uma lei de formao
para a escolha dos elementos;
3. Amostra Por Conglomerado: sorteiam-se regies da
populao e as sorteadas,
sorteadas todos os elementos delas faro
parte da amostra;
4. Amostragem Estratificada: divide a populao em
sub-populaes que tenham o maior grau de
homogeneidade possvel e retira-se uma amostra de cada
sub populao.
sub-populao.
PARMETROS ESTATSTICOS
So nmeros que representam caractersticas de uma populao:
1 Mdia aritmtica: uma medida
1.
did de
d tendncia
t d i central;
t l
2. Varincia: uma medida da disperso dos dados amostrais;
3 Desvio
3.
D i padro
d etc.
MDIA ARITMTICA
uma medida de tendncia central definida por
1
x=
N
x
i =1
x a mdia
di aritmtica;
it ti
xi o i-simo termo;
N o nmero total de valores na amostra.
Comandos do MATLAB
>> media=mean(y)
media mean(y)
VARINCIA
uma medida do grau de disperso dos dados em torno da mdia:
1
2
Var. populacional = =
N
1
2
di =
N
i =1
(x x )
i =1
N
N
1
1
2
2
2
Var. amostral = s =
di =
( xi x )
N 1 i =1
N 1 i =1
di = xi x
x a mdia aritmtica;
xi o i-simo termo;
N o nmero total de valores na amostra.
d = ( x x ) = x x = x Nx = Nx Nx = 0
i
Comando do MATLAB:
>> variancia = var(y)
DESVIO PADRO
Tambm mede a disperso da amostra em torno da mdia.
Usamos o desvio ppadro ppara definir
f
intervalos em torno da
mdia.
Populao
Amostra
s= s
Comandos do MATLAB
>> std(y)
>> ans =0.1509
DISTRIBUIO
ESTATSCA
uma funo que descreve o comportamento de uma
varivel aleatria.
Uma varivel aleatria pode assumir qualquer valor no
universo estatstico e o valor assumido apresenta uma certa
probabilidade de ocorrncia que governada por uma certa
distribuio de probabilidade.
DISTRIBUIO CONTNUA
um tipo de distribuio em que a varivel aleatria pode
assumir qualquer valor em um determinado intervalo.
FUNO
DENSIDADE DE PROBABILIDADE
uma funo que descreve a distribuio de probabilidade
de uma varivel aleatria continua x.
Exemplo:
Distribuio
normal ou ggaussiana proposta
p p
ppor Karl F. Gauss
no sculo XIX.
2
x - )
(
-
1
2 2
f(x) =
e
x ( , )
2
f ( x )=Densidade de probabilidade da varivel x;
= Mdia
dia da varivel
va ivel x;
2 = Varincia da varivel x.
x N ( ,
).
Se
x N ( 0,1) ,
ento
t dizemos
di
que x segue a distribuio
di t ib i normall padro
d ou
padronizada, i.e., com mdia zero e varincia unitria.
1 z2 2
f ( x) =
e
2
x
z=
Interpretao:
68,26% dos dados esto compreendidos no
intervalo (-, ); i.e., com 1 desvio
95,44% est no intervalo (-2, 2); i.e., 2
d
desvios
padres;
d
99,73% est no intervalo (-3, 3); i.e., 3
desvios padres.
3. Simtrica em relao a ;
4. Ponto de inflexo em
x = ;
Q
Qual
a pprobabilidade de encontrarmos x com valores
entre a e b?
P (a < x < b) =
f ( x ) dx
f ( x ) dx
= f ( x ) dx =
a
1
e
2
x2
2
dx
z=
x=
N ( ,
);
z=
x = + z
3.9100 0.7290
4.0100 1.3917
3.6100
3
6100 - 11.2592
2592
3.8300 0.1988
3.7500 - 0.3314
3.9100 0.7290
3.8200 0.1325
3.7000 - 0.6627
3.5000 - 1.9882
3.7700 - 0.1988
3.9600 1.0604
3.8500 0.3314
3.6700 - 0.8615
3 300 00.1988
3.8300
19
3.7700 - 0.1988
3.5100 - 1.9219
3.8500 0.3314
4.0400 1.5905
3.7400 - 0.3976
3.9700 1.1266
x = 3,8
z = 0
x2 = 0, 0228
x =0,1509
,
z2 = 1
z =1
EXERCCIO 1
Qual a probabilidade de que o resultado de uma
titulao esteja entre 3,8 (%) e 3,9 (%)?
z=
Resposta : z1 = 0 e z2 = 0, 6627
EXERCCIO 2
Qual a pprobabilidade de qque uma titulao
Q
esteja
j entre 3,5 e
3,92?
EXERCCIO 3
Q l a probabilidade
Qual
b bilid d de
d que uma titulao
tit l tenha
t h um
valor maior do 3,4?
EXERCCIO 4
Verifique se as 20 titulaes seguem um distribuio normal.
Sugesto: normalize as titulaes e calcule o nmero de valores dentro dos
intervalos
( 1 ,1 ) , ( 2 , 2 ) e ( 3 ,3 )
EXERCCIO 5
Faa o grfico da funo de distribuio normal para os dados
da titulao do vinagre.
Soluo
z
0.7290
1.3917
-1.2592
0.1988
. 9
-0.3314
0.7290
0.1325
-0.6627
-1.9882
-0.1988
1.0604
0.3314
-0.8615
0.1988
-0.1988
-1.9219
0.3314
1.5905
-0.3976
1.1266
0.3911
. 9
0.3776
0.3059
0.3955
0.3203
0.0553
0.3911
0.2274
0.3776
0.2753
0.3911
0.3911
0.0629
0.3776
0.1126
0.3686
0.2115
f(z)
0.3059
0.1515
0.1806
Premissas
emissas impo
importantes
tantes do TLC:
C: flutuaes independentes e igual impo
importncia.
tncia.
EXEMPLOS
1. O peso do feijo depende do grau de desidratao, ao
das pragas, carga gentica etc que tm flutuaes
independentes e apresentam igual importncias.
importncias Portanto
Portanto,
o peso dos caroos de feijes se distribui normalmente.
2. O erro final de uma titulao depende da leitura da bureta,
tonalidade final do indicador etc, que so variveis que
flutuam independentemente e apresentam igual
importncia Portanto
importncia.
Portanto, o erro final na titulao se distribui
normalmente.
( 1 1) e
( , )
A combinao linear
2
2
respectivamente.
y = a1 x1 + a2 x2
1
1
y = y=
N
N
y = a1 x1 + a2 x2
1
( a1 x1 + a2 x2 ) = a1 N
1
x1 + a2 N
x
2
y
( )
N 1
1
2
=
( a1 x1 + a2 x2 a1 x1 a2 x2 )
N 1
2
1
=
a
x
x
+
a
x
(
)
(
)
1 1 1 2 2 2
N 1
1
2
2
2
2
+ 2a1a2 ( x1 x1 )( x2 x2 )
a
x
x
a
x
x
(
)
(
)
1
1
1
2
2
2
N 1
2
2
1
1
2 1
= a12
x
x
+
a
x
x
+
2
a
a
x
x
x
x
(
)
(
)
(
)(
)
1 1 2 N 1 2 2 1 2 N 1 1 1 2 2
N 1
s y2 =
onde
r ( x1 , x2 ) =
( x1 x1 )( x2 x2 )
1
N 1
sx1 sx2
y = a11 + a2 2
y2 = a12 12 + a22 22 + 2a1a2 1 2 ( x1 , x2 )
Se as variveis se distriburem de modo independe, ento a correlao
entre as variveis zero:
( x1 , x2 ) = 0
=a +a
2
y
2
1
2
1
2
2
2
2
y = a1 x1 + a2 x2 + " + a p x p = ai xi
i
y = ai xi
i
s = a s + 2 ai a s s r ( xi , x j )
2
y
2
i i
j >i
2 2
j i j
populacionais
l i i de
d uma combinao
bi linear
li
de
d variveis
i i
aleatrias:
N
y = ai xi
i
y = ai i
y2 = ai i2 + 2 ai a j i2 2j ( xi , x j )
i
j >i
1
x=
N
1
1
1
1
xi = N x1 + N x2 + N x3 + " + N xN
1
a1 = a2 = " = aN =
N
y = ai xi
i
onde
xi
mdia da amostra
1
1
y = ai xi = =
N
N
i
1
= N N =
y=
Concluso: A mdia das mdias amostrais igual a mdia da
populao.
s = ai sxi
2
y
1 2
2
2
s y = ai sxi =
N
s y2 =
1
=
N
2
1
2
2
=
=
N
N
2
N
a varincia da populao.
x N ( , 2 N )
t=
A varivel aleatria t, definida
f
por
p
x
s N
x
t N 1
s N
A varivel 2, definida por 2 = ( N 1) s 2 2 , segue a distribuio quiquadrado tambm com grau de liberdade N-1:
( N 1)
s2
N2 1
z=
x-
= z N ( 0,1)
N
x-
-z <
<z x-z
< < x+z
N
N
N
x-z
< < x+z
N
N
A frmula acima pode ser usada para estabelecer um intervalo
para a mdia populacional a partir da mdia amostral x . z
pode ser obtido usando a tabela normal. O problema desta
frmula que precisamos da varincia populacional que no
temos.
Em 1908, William Sealy Gosset (pseudnimo student) props a
distribuio da varivel aleatria ( x ) s para estimar a mdia
populacional
l i l . Atualmente,
At l
t dividimos
di idi
s por N e falamos
f l
da
d
distribuio da varivel
x-
t N 1
s N
x-
t N 1
s N
x-
-t N 1 <
< t N 1
s N
x - t N 1
s
s
< < x +t N 1
N
N
1.
2.
3.
4.
Curva azul: distribuio normal. Curvas verdes e vermelha distribuio de Student para
p
1,2,3,5 e 10 graus de liberdade Observe que a curva normal mais alta e mais estreita do
que a de Student. Mas, a medida que aumenta o grau de liberdade as duas curvas se
assemalham. (Wikipedia, acessado em 13/09/2009) .
EXEMPLO
Os pesos de 7 gros de feijo so: 0.1399 0.2790 0.1988 0.1904 0.1911 0.2186
0.1606. Determine, com 99% de confiana, quantos gros existem em um
quilograma.
Soluo
Intervalo de confiana =99%
Grau de liberdade v=N-1=7-1=6
Procurar na tabela de student o valor de t6 : linha 6, coluna 0,005
t6 =3,707
x = 0.1969 s = 0.0445 x - t N 1
0.1969 3.707 0.0445
0.1346 < < 0.2593
s
s
< < x +t N 1
N
N
Com 99% de confiana o valor mdio dos gros de feijes situam-se entre
0,1346g e 0,2593. Para encontrarmos quantos gros tm em um quilo, dividimos
um quilo pelo peso de um gro:
1000 0.1346 < < 1000 0.2593 3857 < < 7431
EXERCCIO
N21
2
N 1
( N 1)
N21 < ( N 1)
s2
2
s2
< N2 1
( N 1) s 2 < 2 < ( N 1) s 2
N2 1
N2 1
N21
N21
( N 1) s
<
<
N2 1
( N 1) s 2
s
s
2
< < ( N 1)
.
( N 1)
19, 0
2, 70
s2
< 19, 0
EXERCCIO
1. Os pesos de 7 gros de feijo so: 0.1399 0.2790 0.1988
0.1904 0.1911 0.2186 0.1606. Determine, com 95% de
confiana
fi
um intervalo
i
l para a 2 e o para os gros
de
d
feijo de um quilo.
EXERCCIO
O teor de carboidrato de uma glicoprotena foi determinado
como sendo: 12.6; 11.9; 13.0; 12.7 e 12.5 de carboidrato por
100g de protena em anlise repetidas.
1 Usando
1.
U d a di
distribuio
t ib i de
d Student,
St d t calcule
l l os intervalos
i t
l de
d
50 e 95% de confiana, para a mdia do teor de
carboidrato.
N = 5; x = 12 ,5 g; s = 0 , 4 g; = 4; = x t N 1 s
= 12 ,5 0 , 741 0 , 4 5 g
2. Calcule o intervalo para a mdia, com 95% de confiana,
para uma situao em que o valor populacional do desvio
padro
d seja
j conhecido
h id como sendo
d igual
i l a 0,2g.
02
= 0, 2 g; 95%; z = 1,96
0, 2
= x z
= 12,5 1,96
= 12,5 0, 2 g
N
1 N
Cov ( x, y ) =
( xi - x )( yi - y )
N - 1 i=1
EXEMPLO
Determine a matriz de covarincia da matriz A dada.
-11
A = -2
4
1
3
0
2
1
3
1 N ( x i - x ) ( yi - y )
r ( x, y ) =
N - 1 i=1 s x s y
COEFICIENTE DE CORRELAO POPULACIONAL
1
( x, y ) =
N
( x i - x ) ( yi - y )
sx s y
i=1
N
r [ 1,1;]
2.
3.
4
4.
5.
EXEMPLO
Calcule a matriz de correlao
da matriz A dada.
x1
-1
A = -2
4
x2
x3
1
3 2
0 -4
1
L
L
..........( ............... ...................) ............
t N-1 s
N
L
Logo,
t N-1 s
+
N
t NN-11 s
L=
N
s
t s
L N
N
L
= grau de liberdade
s = desvio p
padro amostral
L = preciso desejada
O desvio padro amostral s deve ser obtido a partir de uma srie histrica.
EXEMPLO
Determinar
ete mina o tamanho da amost
amostra
a de titulao para
pa a que a mdia tenha uma
preciso de 0,1% com 95% de confiana. Usar o desvio padro de 0,1509.
Soluo
Como a desvio padro foi calculado a partir de 20 titulaes, temos 19 graus
de liberdades t19=20-1=19. Na tabela de student olhamos a linha 19 e a
coluna 0,025
,
ppara termos uma confiana
f de 95%.
t19 = 2, 093
s = 0,1509
0 1509
2
2, 093 0,1509%
t s
N N
= 9,98
0 1%
0,1%
L
N 9,98
Neste caso podemos tomar N=10 para termos uma preciso de 0,1%
z
N
EXERCCIO
Um llaboratrio
U
b
i de
d anlise
li faz
f determinaes
d
i com um desvio
d i padro
d
histrico de 0,5%. Um cliente envia uma amostra, cuja concentrao ele
quer saber com uma preciso de 0,2%. Estimar o nmero de determinaes
que o analista dever fazer para dar a resposta desejada com 95% de
confiana. Resposta: N>24,01
C3
C8
C27
C31
L7
L30
L33
PI
H-1
L+1
EA
GAP
LogP
-0.033
-0.073
0.002
0.109
0.941
0.944
9.905
-10.149
-9.906
-0.995
-0.854
5.451
4.456
0.995
8.911
-0.5
-0.096
-0.075
0.138
136
0.951
0.937
10.151
-10.196
-10.152
-0.993
-0.665
5.572
4.58
0.993
9.159
-1.02
-0.096
-0.072
0.138
0.148
0.948
0.935
9.738
-10.239
-9.738
-0.872
-0.726
5.305
4.433
0.872
8.866
-1.05
0.114
-0.015
-0.204
-0.212
0.957
0.97
0.971
9.503
-10.16
-9.504
-0.951
-0.57
5.227
4.276
0.951
8.553
-0.73
0.093
-0.014
-0.181
-0.213
0.953
0.973
0.971
9.046
-9.969
-9.047
-0.97
-0.59
5.008
4.038
0.97
8.077
-0.98
0.114
-0.012
-0.203
-0.213
0.952
0.97
0.969
9.622
-9.698
-9.627
-0.842
-0.648
5.234
4.392
0.842
8.785
-0.77
0.091
0.001
-0.181
-0.213
0.952
0.973
0.97
9.003
-9.922
-9.003
-1.013
-0.526
5.008
3.995
1.013
7.99
-1.02
0.069
0.004
-0.227
-0.24
0.96
0.933
0.975
8.721
-8.928
-8.722
0.153
0.363
4.284
4.437
-0.153
8.875
3.03
-0.115
-0.028
0.134
0.127
0.987
0.943
8.8
-9.461
-8.8
-0.663
0.312
4.731
4.068
0.663
8.137
2.91
0.039
0.008
-0.214
-0.214
0.961
0.984
0.981
8.777
-9.058
-8.778
0.067
0.147
4.356
4.422
-0.067
8.845
2.37
0.097
0.024
-0.206
-0.241
0.989
0.973
0.97
8.592
-9.291
-8.593
-0.658
0.302
4.625
3.967
0.658
7.935
3.2
0.043
0.037
-0.228
-0.237
0.984
0.925
0.978
8.504
-8.77
-8.504
-0.272
0.266
4.388
4.116
0.272
8.232
3.94
0.007
0.032
-0.202
-0.241
0.987
0.959
0.978
8.669
-8.698
-8.67
-0.216
0.367
4.443
4.227
0.216
8.454
3.97
0.056
0.029
-0.203
-0.214
0.986
0.933
0.98
8.581
-8.798
-8.581
-0.196
0.315
4.388
4.192
0.196
8.385
4.45
0.074
0.035
-0.212
-0.211
0.985
0.976
0.981
8.614
-8.817
-8.614
-0.128
0.444
4.371
4.243
0.128
8.486
4.14
0.051
0.035
-0.207
-0.212
0.985
0.973
0.981
8.566
-8.817
-8.566
-0.121
0.366
4.343
4.222
0.121
8.445
4.48
0.052
0.033
-0.188
-0.21
0.986
0.979
0.98
8.397
-8.827
-8.398
0.255
0.459
4.071
4.326
-0.255
8.653
4.27
-0.032
-0.071
0.002
0.148
0.946
0.935
9.816
-10.122
-9.817
-0.992
-0.931
5.404
4.412
0.992
8.825
-0.53
0.108
-0.276
-0.206
-0.207
0.952
0.99
8.326
-9.327
-8.327
-0.417
0.111
4.372
3.955
0.417
7.91
3.49
0.082
-0.284
-0.184
-0.2
0.934
0.985
8.283
-8.95
-8.283
-0.323
0.065
4.303
3.98
0.323
7.96
3.23
HIPTESES
Os valores so
f
estaticamente diferentes
Soluo
1
x = ( 3.9
3.91+ 4.01+
.0 3.6
3.61) = 3.8843
3% s = 0.2082
08 %
3
t2 = 4.303 ( 95% de confiana )
3.843 t2
s
s
< < 3.843 + t2
3.32 < < 4.36
3
3
EXERCCIO
Um qumico est testando um novo mtodo para
pa a determinar
dete mina ferro.
fe o. Fazendo
a endo
quatro anlises num padro certificado, cuja concentrao de referencia
14,3% em massa, ele obtm 13.7; 14.0; 13.9 e 14.1 de ferro. Como voc avalia a
exatido da nova metodologia no nvel de 95% de confiana? Ser que as quatro
determinaes vm de uma distribuio com mdia 14,3%?
S l
Soluo
x = 13.9; s=0.2; t3 = 3.185 ( 95% )
s
s
0.2
0.2
< < x + t3
13.9 3.182
< < 13.9 + 3.182
N
N
4
4
13.6% < < 14.2%
x t3
Amostra
Tcnica A
Tcnica B
d=A-B
3 77
3.77
3 62
3.62
0 15
0.15
3.85
3.69
0.16
4 07
4.07
4 10
4.10
-0.03
0 03
4.83
4.70
0.13
5.05
4.89
0.16
4.314
4.200
0.114
0.5871
0.5772
0.0814
y = x A xB
onde
a1 = 1 e a2 = 1
s2
s2
1
2 1
=
+
=s
+
N A NB
N
N
B
A
1
1
sy = s
+
N A NB
Estamos supondo que as mdias no esto correlacionadas e que
as varincias s A2 e sB2 provm da mesma populao.
( xA xB ) ( A B ) t
1
1
s
+
N A NB
v = ( N A 1) + ( N B 1)
v = N A + NB 2
1
1
+
( A B ) = ( x A xB ) t v s
N A NB
Para ffazermos uma estimativa conjunta
j
do desvio padro
p
s, procedemos
p
assim:
2
2
N
1
s
+
N
1
s
(
)
(
)
4 0,5871 + 4 0,5772
A
A
B
B
2
=
= 0,5822%
s =
4+4
( N A 1) + ( N B 1)
s = 0.5822%
1 1
( A B ) = ( 4.314 4.200 ) t8 0.5822 +
5 5
1 1
( A B ) = ( 4.314 4.200 ) 2.306 0.5822 +
5 5
( A B ) = 0.114% 0.849% = [ 0.735%, 0.963% ]
Como o intervalo contm o valor zero, no podemos rejeitar a
hiptese nula, ou seja, no nvel de confiana de 95% no
podemos afirmar que exista diferena nas duas mdias obtidas
ppelos dois mtodos.
COMPARAES EMPARELHADAS
1.
2.
3.
4.
5.
COMPARAES EMPARELHADAS
sd
sd
d t N 1
< < d + t N 1
N
N
sd
sd
< < d + t4
d t4
5
5
0 , 0818
0 , 0818
0,114 2, 776
< < 0,114 + 2, 776
5
5
0, 014 < < 0, 215
[0,014%,0, 215% ]
Como o valor zero no est no intervalo, podemos afirmar que
existe uma diferena entre as duas tcnicas com nvel de
confiana de 95%.
d t N 1
sd
sd
sd
sd
< < d + t N 1
t N 1
< d < t N 1
N
N
N
N
d < t N 1
sd
N
t N 1 >
d
s
tabelado
= t N 1 t Ntabelad
> t N 1
1
O t tabelado tem que ser maior do que o t estimado para que o intervalo
contenha o zero. As duas tcnicas sero iguais quando =0% ( Hiptese nula),
i.e., o intervalo contm o valor zero.
d 0,114% 0%
t =
=
= 3,13
sd
0,0814 5
N
Para que o valor zero esteja no intervalo t tabelado deve ter o valor mnimo de
3 13 O valor tabelado para t4 (no nvel de confiana de 95%) 2,776
3,13.
2 776 que
menor do que o valor estimado 3,13. Logo, devemos rejeitar a hiptese nula,
=0%, de que no existe diferena entre as duas tcnicas.
EXERCCIO
Determinao do teor de colesterol em seis amostras de plasmas sanguneos,
medidas
did por duas
d
tcnicas
i
diferentes.
dif
Cada
C d amostra possuii um teor diferente
dif
de
d
colesterol. O mtodo B apresenta um resultado menor do que o mtodo A em
cinco das seis amostras. Com 95% de confiana, o mtodo B sistematicamente
diferente do mtodo A?
Tabela . Teor de Colesterol (g/ml)
Amostra
1
2
3
4
5
6
Mdia
Mtodo A
1.46
2.22
2.84
1.97
1.13
2.35
Mtodo B
1.42
2.38
2.67
1.80
1.09
2.25
Diferena (d)
0.04
-0.16
0.17
0.17
0.04
0.10
0.06
Soluo
d 0, 06 gml 1 / ml 0 gml 1
t5 =
=
= 1, 20
sd
0,1225 6
N
Como t5 = 2,571 maior do que o estimado (1,20), no existe
diferena estatisticamente significante entre as duas tcnicas
a nvel
l de
d confiana
f
de
d 95%.
9 %
EXERCCIO
O teor de -PbO2 numa placa de bateria de automvel foi
determinado por espectroscopia de raios-X. Foram registrados
vrios espectros repetidos
repetidos, fazendo
fazendo-se
se (ou no) correo da
linha de base. Os resultados so mostrados abaixo. Existe
diferena sistemtica entre os dois modos de analisar a placa?
Com correo da
l h de
linha
d base
b
16.2
Sem correo da
l h de
linha
d base
b
19.0
-2.8
16.7
19.8
-3.1
17.3
18.5
-1.2
Espectros
Voluntrio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Diferena
1 778
1.778
2.030
-0.536
0.813
-0.633
2.541
0.304
0 242
0.242
1.280
-1.680
1.489
-0.574
0.708
-2.613
-0
0.468
468
0.358
1.071
-5.094
2 603
2.603
-2.963
0.530
EXERCCIO
A tabela ao lado mostra os resultados
para o teste de bioequivalncia de
um medicamento genrico A em
relao ao medicamento de
referncia B. O teste usado foi a rea
sob curva da concentrao do
medicamento
di
t no plasma
l
sanguneo.
2.
3.
4.
s A2 A2
s A2
F A , B FvA ,vB = 2
2
2
sB B
sB
5.
EXEMPLO
Um qumico analtico novato fez 6 determinaes de Ca em calcrio,
calcrio
encontrando uma mdia de 35,25% com um desvio de 0,34%. Um qumico
analtico experiente obteve 35,35% com um desvio de 0,25% realizando 5
determinaes. Existe diferena significativa na preciso dos dois analistas, com
95% de confiana?
Soluo
2
novato = 6 1 = 5
0
,
34
cal
= 1,85
F5 ,4 =
2
exp eriente = 5 1 = 4
0 , 25
EXERCCIO
Verifique se as varincias da tabela do slide 94 so estaticamente diferentes.
Soluo
s A2 = 0 ,5871
sB2 = 0 ,5772
F4 ,4
s A2 0 ,58712
= 2 =
= 1, 035
2
sB 0 ,5772
Como o valor tabelado para F4,4 6,39 que maior que o valor
calculado (1,035 ) ento as varincias no so estatisticamente
diferentes.
PLANEJAMENTO DE EXPERIMENTO OU
PLANEJAMENTO FATORIAL
Tem por objetivo determinar a influncia
dos fatores (variveis independes) sobre a
resposta do experimento
( varivel dependente).
PLANEJAMENTO FATORIAL
1..
Cada fator
fato analisado em vrios
v ios nveis;
2.
Nvel o valor (ou classe) que cada fator pode assumir no experimento;
3.
4.
5.
6.
7
7.
Planejamento fatorial 2K
um planejamento fatorial de k fatores em dois nveis
nveis.
Planejamento
j
fatorial
f
completo
p
22
Planejamento fatorial completo 22 . Este tipo de planejamento simples de
executar e ppode ser estendido para
p
um planejamento
p
j
mais sofisticado.
f
til
quando desejamos saber a influncia dos fatores na resposta.
EXEMPLO
Estudar a influncia da temperatura e do catalisador no rendimento de uma
reao.
Fatores: temperatura e catalisador
Nveis: T
T=40
40 e 60 (dois nveis); catal. A e catal. B (dois nveis).
Resposta: Rendimento
Planejamento fatorial 22
Matriz de planejamento
Temperatura
Catalisador
Rendimento (%)
Mdia (%)
40
57
61
59
60
92
88
90
40
55
53
54
60
66
70
68
Planejamento fatorial 22
Clculo dos efeitos principais dos fatores sobre a resposta
(rendimento)
a.
T = y + y-
y 2 + y 4 ) ( y1 + y3 ) ( 90 + 68 ) ( 59 + 54 )
(
=
= 22.5%
2
Planejamento fatorial 22
b.
C = y + y-
y 4 + y3 ) ( y 2 + y1 ) ( 68 + 54 ) ( 90 + 59 )
(
=
= 13,5%
2
Planejamento fatorial 22
y1 + y4 y2 + y3 59 + 68 90 + 54
TC =
2
2
2
2
TC = 8,5%
8 5%
Planejamento fatorial 22
Planejamento fatorial 22
ERRO PADRO ((s)) DAS OBSERVAES
Pode ser obtido a partir da varincia das replicatas de cada amostra. Uma
estimativa conjunta ou total da varincia pode ser obtida a partir da
varincia de todas as replicatas, com grau de liberdade apropriado.
Ensaio (i)
Varincia (i)
si2 = ( x j - x )
j
( N - 1)
Grau de liberdade
i = N ireplicatas 1
Planejamento fatorial 22
Varincia conjunta ou varincia total
2
Conjunta
Planejamento fatorial 22
y 2 + y 4 ) ( y1 + y 3 ) 1
(
=
= y
1
1
1
T = y+ - y y 4 - y1 - y 3
2 +
2
2
2
2
2
2
y 3 + y 4 ) ( y1 + y 2 ) 1
(
1
1
1
C = y+ - y- =
= y 3 + y 4 - y1 - y 2
2
2
2
2
2
2
y1 + y 4 ) ( y 2 + y 3 ) 1
(
1
1
1
TC =
= y1 + y 4 - y 2 - y 3
2
2
2
2
2
2
Planejamento fatorial 22
Como as mdias dos ensaios se distribuem de maneira independente (repeties
autnticas e ordem aleatria) temos que coeficiente de correlao r(xi,xj) zero.
Alm disso, estamos considerando que as mdias dos ensaisos tem a mesma
varincia populacional das mdias, e a varincia populacional igual a
varincia
global
l b l ou totall (slide
( l d 117).
117)
Varincia da mdia do efeito temperatura T
2
sefeito
= ai2 si2 + 2 ai a j si2 s 2j r ( xi ,x j )
i j >i
=0
2
sefeito
= ai2 s y2i = a12 s y2 1 + a22 s y2 2 + a32 s y2 3 + a42 s y2 4
2
sefeito
= ai2 s y2i = a12 + a22 + a32 + a42 s y2
2
2
2
2
s = ( 1 2 ) + (1 2 ) + ( 1 2 ) + (1 2 ) s y2
1 1 1 1 2
2
sT = + + + s y = s y2
4 4 4 4
2
T
Planejamento fatorial 22
A varincia
i i das
d mdias
di relaciona
l i
com a varincia
i i populacional
l i l atravs
da equao
2
=
2
y
2
sConjunta
N Re plicatas
6 ,5
=
= 3, 25
2
= sT =
sefeito
f
2
sConjunta
6 ,5
=
= 1,80%
2
Planejamento fatorial 22
Erro padro da mdia global
2
sConj
6 .5
s =
=
= 0 ,8125
8
8
2
y
s y = s y2 = 0 ,90%
Planejamento fatorial 22
Intervalos de confiana para os valores dos efeitos
Com o erro padro podemos construir um intervalo de confiana para
os valores dos efeitos, usando a distribuio de student:
= valor
l estimado
d dde um efeito
f
onde
2
efeito
2
sConjunta
N Re plicatas
sefeito =
2
sConjunta
N Re plicatas
sConjunta
N Re plicatas
Planejamento fatorial 22
Se
> t sefeito
Se
< t sefeito
Planejamento fatorial 22
Interpretao
Mdia Global
67 , 75 0 ,9%
Efeito principal da
temperatura: T
Efeito
f
principall do
d
Catalisador: C
22 ,5 1,8%
Efeito da interao TC
13,5 1,8%
8,5 1,88%
%
Planejamento fatorial 22
+14
54
68
-5
-22
59
90
+31
40
60
Planejamento fatorial 22
T
40
60
40
60
T C
A +
=
B
B +
2.
M T C TC
+
+
+
=X
+
+ + +
3.
+1
+1
+1
+1
1
+1
1
+1
C TC
1
1
+1
+1
+1
1
1
+1
59
90
y=
54
68
59
90
1
1 t
1
t
C = k 1 X C y = X C y = [ 1 1 +1 +1] = 13,50
54
2
2
2
68
X tY =
1 1 +1 +1 54 27
+
1
1
+
1
68
17
M 271 4 67 , 75
T 45 2 22 ,5
=
=
C 27 2 13,5
TC 17 2 8,5
+1
C TC
1 1 +1
+1 1 1
1 +1 1
+1 +1 +1
b0
1
b= y=
b2
12
59
90
54
68
67.75
11.25
X b = y X-1 X b = X -1 y b = X-1 y =
-6.75
6 75
-4.25
y ( T,
T C ) = b0 + b1T + b2 C + b12 TC
y ( T, C ) = 67 ,75 + 11, 25T - 6, 75C - 4, 25TC
Grfico:
( N - 1)
2
2- Varincia conjunta ou total: stotal
2
i i
i
2
3- Varincia dos efeitos: sefeito
=
1 NE 2
2( k 1) stotal
NR 2
2
4- Erro padro dos efeitos: sefeito = sefeito
2
stotal
NE NR
de
d experimentos ou ensaios; NR=Nmero
d replicata
de
l
s;
= Grau de liberdade de cada ensaio; x j = Replicata do ensaio; k = Nmero de fatores.
EXERCCIO
Os ddados
O
d abaixo
b i se referem
f
ao tempo de
d pega inicial
i i i l do
d gesso, isto
i ,
o
tempo em que o gesso comea a endurecer depois que o p misturado
com a gua. Os ensaios foram realizados em duplicata e em ordem
aleatria Determine todos os efeitos e seus erros padro,
aleatria.
padro interprete os
resultados e construa um modelo.
Fator 1: Granulometria: 100-150
100 150 mesh (-),
( ) 150
150-200
200 mesh (+)
Fator 2: gua residual: 6,6% (-), 7,5% (+)
i
1
2
3
4
Fator 1
Fator 2
+
+
+
+
xi
12.33 13.00 12.67
10.52
10
52 10.57
10 57 10.55
10 55
10.33 9.75 10.04
9.00 8.92 8.96
Resposta
s2
0.224
0 0013
0.0013
0.168
0.0032
Planejamento fatorial 23
Seja a influncia de trs
t s fatores
fato es sobre
sob e o rendimento
endimento da reao
eao conforme
confo me
indicado na tabela abaixo.
Fatores
(-)
(+)
40
60
1,0
1,5
Ensaio
1
2
3
4
5
6
7
8
1
+
+
+
+
2
+
+
+
+
3
+
+
+
+
Rendimento (%)
56
52
85
88
49
47
64
62
65
61
92
95
57
60
70
74
Mdia
54,0
86,5
48 0
48,0
63,0
63,0
93 5
93,5
58,5
72,0
Planejamento fatorial 23
Num planejamento fatorial completo, quantos experimentos ou ensaios
precisamos fazer?
Nmeros de experimentos
Mdia
+
+
+
+
+
+
+
+
1
+
+
+
+
2
+
+
+
+
3
+
+
+
+
= 23 = 8
12
+
+
+
+
13
+
+
+
+
23
+
+
+
+
123
+
+
+
+
y
54.0
86.5
48.0
63 0
63.0
63.0
93.5
58 5
58.5
72.0
Planejamento fatorial 23
M 1
X=
12 13 23 123
1 -1 -1 -1 1 1 1 -1
1 1 -11 -11 -1
1 -1
1 1 1
1 -1 1 -1 -1 1 -1 1
1 1 -1
1 1 -1
1 1 -11 -1
1
1 -1 1 1 -1 -1 1 -1
1 1 1 1 1 1 1 1
y=
54.0
86 5
86.5
48.0
63 0
63.0
63.0
93 5
93.5
58.5
72 0
72.0
Planejamento fatorial 23
Cl l dos
Clculo
d efeitos
f
principais e da
d mdia
d gerall
1 t
XE y
k 1
2
1 t
Mdia : M = k X M
y,
2
Efeitos : E =
XT * y =
538.5000
91.5000
-55.5000
35.5000
-34
34.5000
5000
-3.5000
3.5000
0.5000
538.5000 8 M 67,31
91.5000 4 1 22,88
-55.5000 4 2 -13,88
35.5000 4 3 8,88
-88,63
-34
34.5000
5000 4
12
63
-3.5000 4 13 -0,88
3.5000 4 23 0,88
Planejamento fatorial 23
Estimativa dos erros dos efeitos e da mdia
1- Varincia Conjunta ou total:
2
total
NE
= s
i=1
2
i i
NE
i=1
s
=
5, 2 = 1, 30%
2( k 1) total
NR 2
2 2
2
stotal
=
2
sefeito
= sefeito
= 1,30 = 1,14%
f
f
2
stotal
5,2
4- Erro padro da mdia geral: smdia =
=
= 0, 57%
8 2
NE NR
5- Significncia dos efeitos: t NE sefeito = t8 sefeito = 2 , 306 1,14 = 2, 63 ( 95% de confiana )
Planejamento fatorial 23
Resumo
Mdia
Ef it principais
Efeitos
i i i
1 (Temperatura)
2 ((Catalisador))
3 (Concentrao)
Interaes
12
13
23
123
63,30,57
22,91,14
-13,91,14
,
,
8,91,14
-8,61,14
8 61 14
-0,91,14
0,91,14
0,11,14
Planejamento fatorial 23
CONSTRUO DO MODELO ESTATISTICO
b0
b
1
b2
b3
1
b= X y =
b12
b13
b
23
b123
67.3
11.4
-6.9
4.4
-4.3
43
-0.4
0.4
0.1
Planejamento fatorial 23
A tabela abaixo most
mostraa o rendimento
endimento da reao
eao de sntese do polipirrol
polipi ol
em uma matriz de EPDM. Foram estudados trs fatores: o tempo de reao
(t), a concentrao de oxidante (C) e o tamanho da partcula (P). A resposta
observada foi o rendimento da reao.
Calcule os valores dos efeitos e seus erros padro, usando os dados a
seguir, mas antes examine cuidadosamente o conjunto de valores, levando em
conta os sinais da matriz de planejamento.
possvel
l antecipar quall ser a varivel
l com maior influncia
fl
no
rendimento?
Ensaio
1
2
3
4
5
6
7
8
t
+
+
+
+
C
+
+
+
+
P
+
+
+
+
Rendimento %
4.39
4.73
6.21
5.75
14.51
.5
13.45
3. 5
19.57 21.11
2.09
1.93
3.15
3.39
11.77 12.69
19.40 17.98
yi
4.56
5.98
13.98
3.98
20.34
2.01
3.27
12.23
18.69
si2
0.058
0.106
0.562
0.56
1.186
0.013
0.029
0.423
1.008
Planejamento fatorial 24
No experimento anterior vamos incluir um quarto fator, i.e., o PH da
mistura reacional. Neste caso, devemos fazer um planejamento fatorial de
dois nveis e quatro fatores.
Fatores
F
t
1. Temperatura ( 0C)
2. Catalisador (tipo)
3 Concentrao (M)
3.
4. pH
((-))
40
A
10
1,0
7,0
(+)
60
B
15
1,5
6,0
Planejamento fatorial 24
Nmero de ensaios: 2.2.2.2
2 2 2 2=16
16
Ensaio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
+
+
+
+
+
+
+
+
2
+
+
+
+
+
+
+
+
3
+
+
+
+
+
+
+
+
4
+
+
+
+
+
+
+
+
Resposta y
54
85
49
62
64
94
56
70
52
87
49
9
64
64
94
58
73
Planejamento fatorial 24
M
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
1
+
+
+
+
+
+
+
+
2
+
+
+
+
+
+
+
+
3
+
+
+
+
+
+
+
+
4
+
+
+
+
+
+
+
+
12 13 14 23 24 34 123 124
+ + + + + + - + + + + +
- + + - + + +
+ - + + - + - + - + - + - + - +
- + + - +
+ + - + - + + + - + - +
- + + - + - + - + - + + - + - + - +
+ - + + +
- + + - + - + + + + + + + + + + +
134
+
+
+
+
+
+
+
+
234 1234
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
y
54
85
49
62
64
94
56
70
52
87
49
6
64
64
94
58
73
Planejamento fatorial 24
M
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-11
1
2
-1
-1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
3
-1
-1
1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
4
-1
-1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
12
1
-11
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-11
1
13
1
-1
1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
14
1
-1
1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
1
23
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
24
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
-1
-1
1
1
34
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
123
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
1
124
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
1
134
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
1
234 1234
-1
1
-1
1
-1
1
1
-1
1
1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
-1
1
-1
-1
1
-1
1
1
1
y
54
85
49
62
64
94
56
70
52
87
49
64
64
94
58
73
Planejamento fatorial 24
M
1
12
13
14
23 =
24
34
123
124
134
234
1234
67.1875
22.8750
-14.1250
8.8750
0.8750
-8.6250
-0.6250
0.8750
-0.6250
0.8750
0.3750
0.8750
-0.1250
-0.6250
0.3750
0.3750
2
efeito
= 0, 291
2
= 0,54
sefeito = sefeito
smdia =
2
stotal
0,54
=
= 0,184
NE NR
16 1
MODELO ESTATSTICO
b 0
b
1
b 2
b
3
b
4
b12
b
13
b14
=
b
23
b
24
b 34
b
123
b124
b
134
b 234
b
1234
67.1875
11.4375
-7.0625
4.4375
0.4375
-4.3125
b 0
-0.3125
b1
0.4375
b 2 =
-0.3125
b 3
0.4375
b12
0.1875
0.4375
-0.0625
-0.3125
0.1875
0.1875
67.1875
11.4375
-7.0625
4.4375
-4.3125
4 312
EXERCCIO
Deseja-se estudar
D
d os ffatores que influenciam
fl
a funo
f de
d onda
d no
clculo da freqncia de estiramento do C-H na molcula de CH3F.
Os ffatores escolhidos foram:
f
Fatores
6-31G
6-311G
2 Funes de polarizao
Ausentes
Presentes
3 Funes difusas
Ausentes
Presentes
H
Hartre-Fock
F k
MP2
1 Conjuto de base
4 Correlao
C
l eletrnica
l i
PLANEJAMENTO FATORIAL 24
Ensaio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
+
+
+
+
+
+
+
+
2
+
+
+
+
+
+
+
+
3
+
+
+
+
+
+
+
+
4
+
+
+
+
+
+
+
+
Resposta
3245,6
3212 4
3212,4
3203,5
3190,3
3251,7
,
3209,4
3214,9
3193,5
3096,2
3049,3
3132,8
3087 6
3087,6
3105,0
3050,4
3143 5
3143,5
3093,5
FRAO MEIA
Num planejamento fracionrio meia s realizamos metade dos
ensaios que faramos se fizssemos um planejamento fatorial
completo.
l
Com
C isto, economizamos tempo e dinheiro
d h
para
fazermos um pr-seleo dos fatores mais importantes.
EXEMPLO
Um pesquisador deseja otimizar um procedimento analtico para determinar
traos de Mo em plantas. O mtodo escolhido foi a ao cataltica do Mo(IV)
sobre a oxidao do on iodeto pelo H2O2. De todos fatores importantes para
o sinal analtico foram escolhidos pelo pesquisador as concentraes da
H2O2, H2SO4, KI em mols/dm3 e o tempo de reao destas espcies:
Fator
(-)
(+)
[H2SO4]
0 016
0,016
0 32
0,32
[KI]
0,015
0,030
[H2O2]
0 0020
0,0020
0 0040
0,0040
Tempo (s)
90
130
1
+
+
+
+
+
+
+
+
2
+
+
+
+
+
+
+
+
3
+
+
+
+
+
+
+
+
4
+
+
+
+
+
+
+
+
Resp*.
52
61
124
113
85
66
185
192
98
86
201
194
122
139
289
286
M
1
3
4
12
13
14
23 =
24
34
123
124
134
234
1234
143.3125
-2.3750
109 3750
109.3750
54.3750
67 1250
67.1250
-1.1250
2.8750
1.1250
25.6250
21.8750
9.8750
2 6250
2.6
-2.6250
5.3750
0.1250
-8.8750
1
+
+
+
+
2
+
+
+
+
3
+
+
+
+
4
+
+
+
+
12
+
+
+
+
13
+
+
+
+
14
+
+
+
+
23
+
+
+
+
24
+
+
+
+
34
+
+
+
+
Resp*.
52
86
201
113
122
66
185
286
M
l
1
l2
l3
l
4
l12 =
l
13
l14
l23
l
24
l34
138.8750
138
8750
-2.2500
114 7500
114.7500
51.7500
69.7500
8.7500
24.7500
26.7500
26.7500
24.7500
8.7500
M
1
12
13
14
23 =
24
34
123
124
134
234
1234
143.3125
-2.3750
109.3750
54.3750
67.1250
-1.1250
2.8750
1.1250
25.6250
21.8750
9.8750
2.6250
-2.6250
5.3750
0.1250
-8.8750
Observe que
l12 = l34
l13 = l24
l14 = l23
No podemos medir
essas interaes com
um planejamento meia,
pois esto confundidas.
l1=l234 1+234
2=134
l2=l134 2+134
3=124
l3=l124 3+124
4=123
l4=l123 4+123
12=34
l12=ll34 12+34
13=24
l13=l24 13+24
14 23
14=23
l14=ll23 14+23
I=1234
lI M+(1/2)1234
A RESOLUO
de um planejamento fatorial fracionrio igual
ao nmero de fatores usados na menor relao geradora. No
exemplo
p acima,, o ffatorial de resoluo
IV,, pois
p I=1234
4-1
IV
1
2
3
4
Ensaio
1
2
3
4
5
6
7
8
Fator
Temperatura
Base
Solvente
Catalisador
M
+
+
+
+
+
+
+
+
1
+
+
+
+
()
(-)
Ambiente
K2CO3/NaOH
CH2Cl2
Nenhum
2
+
+
+
+
3
+
+
+
+
( )
(+)
Refluxo
K2CO3
CH3CN
TEBA
4
+
+
+
+
Rendimento
0
70
65
0
100
85
50
95
5-2
III
(-)
(+)
[H2SO4]
0,016
0,32
[KI]
0,015
0,030
[H2O2]
0,0020
0,0040
Tempo (s)
90
130
Fluxo (ml/min)
1,2
3,0
MATRIZ DE CONTRASTES
Ensaio
1
2
3
4
5
6
7
8
M
+
+
+
+
+
+
+
+
1
+
+
+
+
2
+
+
+
+
3
+
+
+
+
4
+
+
+
+
5
+
+
+
+
Relaes geradoras
4=123 e 5=12 ou I=1234 e I=125
Resoluo 3, pois a menor relao geradora tem 3 fatores.
Resposta
52
92
198
113
122
76
189
286
MODELOS EMPRICOS
So modelos ((equaes)
q ) qque relacionam os ffatores com as
respostas. Os modelos construdos anteriormente foram
feitos considerando apenas dois nveis das variveis.
variveis
Embora, levassem em considerao a interao entre as
variveis,
i i o modelo
d l que considera
id
apenas dois
d i nveis
i pode
d
no descrever bem a situao. Os modelos que criaremos
agora levaro em conta uma quantidade maior de pontos.
40
45
50
55
60
Rendimento (%)
60
70
77
86
91
Os dados do grfico se ajustam a uma equao linear, onde cada ponto dado
por
y1 = b0 + b1T1 + 1
y 2 = b0 + b1T2 + 2
#
y n = b0 + b1Tn + n
Em notao matricial, temos
y1 1
y 1
2
y3 = 1
y
4 1
y5 1
T1
1
T2
2
b0
T3 + 3 y = T b +
b1
T4
4
5
T5
O mtodo mais utilizado para fazer o ajuste o mtodo dos mnimos quadrados
que minimiza os erros. Isso pode ser feito do seguinte modo:
yi = b0 + b1Ti
e = ( y y ) = ( y b b T )
( e )
= 2 ( y b b T ) = 0
b
2
2
i
1 i
2
i
( e
2
i
b1
) = 2
1 i
T ( y b
i
b1Ti ) = 0
nb0 + b1 Ti = yi
2
b
T
+
b
T
0 i 1 i = Ti yi
Isolando b0 na primeira equao e substituindo na segunda,
temos
yi b1 Ti
= y b1T
b0 =
n
Ti yi
Ti yi n
b1 =
2
Ti )
(
Ti
nbb0 + b1 Ti = yi
2
+
b
T
b
T
0 i 1 i = Ti yi
n
Ti
T b = y
T b T y
i
2
Observe que, se
n
TT=
Ti
t
ento,
1 T1
T = # #
1 Tn
T
T
i
2
Tt T b = Tt y
ento
yi
Ty=
y
T
i i
t
y1
y
2
y = y3
y4
y5
A equao
1
1
T = 1
1
1
T1
T2
T3
T4
T5
y = b0 + b1T +
y = Tb +
b0
b=
b1
em notao matricial
Para
a a encont
encontrarmos
a mos a equao de regresso
eg esso devemos encontrar
encont a o vetor
veto de
regresso b:
Tb = y
T Tb = T y
t
(T T)
t
-1
t
T
T
b
=
T
T
T
( ) ( ) y
t
I b = (T T) T y
-1
b = (T T) T y
t
-1
-1
y=
60
70
77
86
91
T=
1 40
1 45
-1.2000
1 50 b =
1.5600
1 55
1 60
A equao de regresso
y i = 1,
1 200 + 11,560
560Ti
y i = 1, 200 + 1,560Ti
y = T b
y = T b =
1 40
61.2000
1 45
69.0000
-1.2000
= 76.8000
1 50
1.5600
1 55
84 6000
84.6000
92.4000
1 60
61.2000
2000
60 61
70 69.0000
e = y y = 77 76.8000 =
84.6000
6000
86 84
91 92.4000
-1.2000
1 2000
1.0000
0.2000
11.4000
4000
-1.4000
EXERCCIO
As matrizes abaixo referem-se a um experimento feito
para se construir um curva de calibrao.
calibrao O vetor c o
vetor das concentraes e o vetor A a absorbncias.
Ajuste um modelo linear a estes dados.
c= [0.5 0.5 1.0 1.0 1.5 1.5 2.0 2.0 2.5 2.5 3.0 3.0]
A= [0.0937 0.0916 0.1828 0.1865 0.2782 0.2732
0.3776 0.3702 0.4562 0.4505 0.5593 0.5499]
( y y )( y y ) = 0
i =1
Prova:
1
1
nb0 + b1 Ti = yi b0 = yi b1 Ti = y b1T
n
n
como y i = b0 + b1Ti , temos
yi = y b1T + b1Ti = y + b1 (Ti T ) yi = y + b1 (Ti T )
n
( y y )( y y ), temos
i =1
( y + b (T T ) y ) ( y y ) = b (T T ) e
n
i =1
i =1
=0
( yi y ) = ( yi y ) + ( yi yi )
2
2
y
=
y
y
+
y
( i ) ( i ) ( i i )
( yi y )
= ( yi y ) + 2 ( yi y )( yi yi ) + ( yi yi )
=0
( yi y )
= ( yi y ) + ( yi yi )
2
A equao
mostra que a variao total em torno da mdia tem duas partes: uma parte
devida a equao de regresso e a outra devida aos resduos. Quanto maior
for a frao descrita pela regresso menor ser os resduos e melhor ser o
ajuste do modelo. Dividindo a equao anterior por SQT podemos obter um
mtodo para quantificar o modelo:
2
1=
+
1= R +
2
2
2
( yi y ) ( yi y )
( yi y )
R2 =
( yi y )
( yi y )
2
2
Justificativa:
1 n
1 n
1 n
1
1
( yi y ) = yi y = nyy nyy = 0
n i
n i
n i
n
n
Justificativa:
yi = b0 + b1 X i . Como b0 = y b1 X , temos
yi = y - b1 X + b1 X i
yi = y +b1 ( X i X )
yi - y = b1 ( X i X )
Elevando ao quadrado e somando sobre todas as observaes,
temos
( y - y )
i
2
1
=b
( X
X)
( X
O somatrio
X)
( y - y )
fica completamente determinado pelo valor de b1, que depende das respostas
obtidas experimentalmente
experimentalmente.
Generalizando, o grau de liberdade da soma quadrtica devido regresso
igual ao nmero de parmetros (no nosso caso dois: b0 e b1) menos um: VR=p-1.
O grau de liberdade da soma quadrtica residual
( n 1) = ( p 1) + r
r = n p
Resumindo
T = n 1
R = p 1
r = n p
MDIAS QUADRTICAS
Soma quadrtica
Regresso
( y - y )
p 1
n p
Resduo
( yi - yi )
Total
( y - y )
i
Nm. de grau
de liberdade
Mdia quadrtica
MQR = SQR
MQr = SQr
n 1
( p 1)
( n p ) = s2
Soma
Quadrtica
608,4
6,4
614 8
614,8
Grau de
liberdade
1
3
4
R2 =
Mdia
Quadrtica
608,4
2,3
SQR 608, 4
=
= 0,9896
SQT 614,8
MQr = s 2 = 2,13
i N ( 0, 2 )
Cov ( b0 , b1 )
Var ( b0 )
Var ( b ) =
Var ( b1 )
Cov ( b0 , b1 )
Var ( b ) = ( X X ) s
t
0, 2 0, 2
3
10,
21,, 73 0, 43
Var ( b ) =
2,13 =
0,
2
0,
004
0,
43
0,
00852
Var ( b0 ) 4, 66
=
erro padro ( b ) =
0,
,
0923
Var ( b )
a) b0 tn p ( erro padro de b0 )
b) b1 tn p ( erro padro de b1 )
No nosso exemplo, temos:
MQR
Fp 1,1 n p
MQr
Se
MSQ
QR
> Fp 1, n p ,
MSQr
MQR 608, 4
=
= 285, 6 > 10,13 = F1,3
MQr
22,13
13
Portanto, nossa equao estatisticamente significativa. Nem todo equao
estatsticamente significativa boa para predio.
Exerccio
Construa um modelo emprico para os dados da tabela abaixo.
T
Temp.
(0 C) 30
35
40 45 50 55
60
65
70
Rend. (%)
40
60 70 77 86
91
86
84
24
Exerccio
Vamos tentar
tenta uma regresso
eg esso linear
linea da fo
forma
ma y = b0 + b1T
-7,333
b = inv(T * T)* T * R =
1,520
,
yi = 7,333 + 1,520Ti
Fonte de
F
d
variao
Soma quadrtica
Regresso
3465,6
(p-1)=1
(p
1) 1
SQR/(p
/(p-1)
1) = 3465,6
Resduo
832,4
(n-p) = 7
SQr/(n-p) = 118,9
Total
4298,0
(n-1) = 8
yi = b0 + b1Ti + b2Ti
SUPERFCIE DE RESPOSTA
yi = b0 + b1Ti + b2Ti
Modelagem Inicial
C (%)
V (rmp)
(
)
x1
x2
y(%)
(%)
45
90
69
55
90
59
45
110
78
55
110
67
50
100
68
50
100
66
50
100
69
C 50
x1 =
5
V 100
x2 =
10
yi = b0 + b1Ti + b2Ti
1 1 1
1 1 1
1 1 1
X = 1 1
1
1 0
0
0
1 0
1 0
69
59
78
y = 67
68
66
69
68 00
68,
1
t
b = ( X X ) X t y = 5, 25
4,
4 25
Usando
U
d os trs
valores
l
repetidos
id do
d ponto central,
l podemos
d
fazer
f
uma
estimativa da varincia das observaes:
s 2 = 2,33
2 33
Com essa varincia, podemos fazer uma estimativa da varincia dos
parmetros da equao:
0
0 33
0
0
1 7 0
0,33
( b ) = ( X t X ) s 2 = 0 1 4 0 2,33 = 0
0,58
0
V
0
0
0 1 4
0
0,58
0
58
y = 68,
68 00 0,58
0 58 5,
5 25 0, 76 x1 + 4, 25 0,
0 76 x2
Quando
Q
d o experimento
i
feito
f i em replicata,
li
podemos
d
obter
b uma estimativa
i
i
do erro aleatrio e, assim, julgar se o modelo bom ou no.
Definies:
nj
( SQr )i = ( yij yi )
nj
(y
ij
y i ) = ( yij yi ) ( y i yi )
yij
y i
o valor
l predito
dit para o nvel
l i;
yi
nj
( y
ij
nj
y i ) = ( yij yi ) + ( y i yi )
i
j
i
2
No depende do modelo
residual
id
l
ao
erro
puro
falta
f
lt
de
d
ajuste
j
t
Graus de liberdades:
( j foi visto )
g .l. da SQep = ( ni 1) = n m
g .l. da SQr = n p
Fonte de variao
Regresso
Resduos
Falta de ajuste
Erro puro
T l
Total
S. Q.
m
ni
ni
SQR = ( yi y )
SQ faj
ni
Mdia Quadrtica
p 1
MQR = SQR p 1
n- p
MQr = SQr n p
m p
MQ faj = SQ faj m p
nm
MQep = SQep n m
SQr = ( yij y i )
m
G.L.
= ( y i yi )
m
ni
SQep = ( yij yi )
m
ni
SQT = ( yij y )
n 1
SQT
Se
Se
MQ faj
MQep
MQ
Q faj
MQep
e to o modelo
odelo bo
bom..
< Fm p ,n m , ento
y = 68 5, 25 x1 + 4, 25 x2
Fonte de variao
Soma Quadrtica
Mdia Quadrtrica
R
Regresso
182 50
182,50
91 25
91,25
Resduos
5,50
1,38
Falta de ajuste
0,83
0,42
Erro Puro
4,67
2,34
Total
188,00
Representao grfica
Curvas de nveis
1..
2.
Escolhe
scolhe o coeficiente do fator
fato de maior
maio mdulo (digamos fator
fato i) da
equao usada para construir o modelo;
Determinamos os deslocamentos dos outros fatores j atravs de
x j =
3.
bj
bi
xi
Converta os deslocamentos
d l
codificados
d f d de
d volta
l s
variveis
originais e
determine os novos nveis dos fatores.
y = 68, 00 5, 25 x1 + 4, 25 x2
4, 25
x2 =
x1 = 0,81 x1
5, 25
x2 = 0,81 x1
x1
x2
C (%)
V (rpm)
y (%)
Centro
0 00
0,00
50
100 0
100,0
68 66 69
68,66,69
Centro +
-1
0,81
45
108,1
77
Centro + 2
-2
1,62
40
116,2
86
Centro + 3
-3
2,43
35
124,3
88
Centro + 4
-4
3,24
30
132,4
80
Centro + 5
-5
,
4,05
25
140,5
,
70
C 50
x1 =
C ( % ) =50+5 x1
5
V 100
x2 =
V ( rpm ) = 100 + x2 10
10
C (%)
V (rmp)
x1
x2
y(%)
30
115
86
40
115
1
1
85
30
135
78
40
135
84
35
125
90
35
125
88
35
125
89
Codificao
f das variveis:
C 50
x1 =
5
V 100
x2 =
10
Modelo linear
y = 85, 71 0, 49 + 1, 25 0, 65 x1 2, 25 0, 65 x2
F
Fonte
d variao
de
i
S
Soma
Q d i
Quadrtica
N Grau
Nm.
G
d Lib
de
Lib.
Mdi Quadrtrica
Mdia
Q d i
Regresso
26,50
13,25
Resduos
70,93
17,73
Falta de ajuste
68,93
34,46
Erro Puro
2,00
1,00
Total
97 42
97,42
MQ faj
MQep
Modelo quadrtico
C (%)
V (rmp)
x1
x2
y(%)
30
115
86
40
115
1
1
85
30
135
78
40
135
84
35
125
90
35
125
88
35
125
89
28
125
21/2
81
35
139
/
21/2
80
10
42
125
21/2
86
11
35
111
2
21/2
87
1 1
1
1
1
0
0
X = 1
1
0
1 2
0
1
2
1
1
0
1
1
1
1
0
1
1
1
1
0
0
0
0
0
1 1
1 1
1 1
1 1
0 0
0 0
0 0
0 0
2 0
0 0
2 0
86
85
78
84
90
y = 88
89
81
80
86
87
Modelo Quadrtico
y = 89 0, 75 + 1,51 0, 46 x1 2,36 0, 46 x2
2,81 0,54 x12 2,81 0,54 x22 + 1, 71 0, 65 x1 x2
F
Fonte
d variao
de
i
S
Soma
Q d i
Quadrtica
N Grau
Nm.
G
d Lib
de
Lib.
Mdi Quadrtrica
Mdia
Q d i
Regresso
144,15
28,83
Resduos
2,76
0,55
Falta de ajuste
0,76
0,25
Erro Puro
2,00
1,00
Total
146 91
146,91
10
MQ faj
MQep
Grfico da equao
Curvas de nveis
1, 71x1 5, 62 x2 = 2,36
5 62 1,
1 71 x1 1,51
1 51
5,
1, 71 5, 62 x = 2,36
0 1553
x1 = 0,1553
x2 = 0,3727
C 35
x1 =
C ( % ) =35+5 x1 =35+5 0,1553=35.78%
5
V 125
x2 =
V ( rpm ) = 125 + x2 10 121 rpm
10
Exerccio