Você está na página 1de 221

QUIMIOMETRIA

Chamar um especialista em estatstica depois que o experimento foi


feito pode ser o mesmo que pedir a ele para fazer um exame postmortem. Talvez ele consiga dizer de que foi que o experimento morreu
R.. A.. Fisher
ishe

Prof. Dr. Ademir J. Camargo

http://www.fisica.ueg.br/ademir/

EMENTA
Vetores aleatrios;
Distribuio normal multivariada;
Pr-processamento de dados.
Classificao e discriminao.
Anlise de varincia multivariada.
Planejamento fatorial e superfcie de resposta.
Anlise de Componentes Principais.
Anlise de agrupamento
Mtodos de reconhecimento de padres nas classificaes.
Calibrao multivariada em qumica analtica.
P
Pacotes
t quimiomtricos
i i t i
para microcomputadores.
i
t d

A estatstica multivariada descreve o conjunto de


pprocedimentos qque envolve observaes

e anlises de vrias
variveis estatsticas ao mesmo tempo. Quando a estatstica
multivariada usada para descrever fenmenos qumicos e
farmacuticos passa a ser chamada de Quimiometria.
Quimiometria
O termo quimiometria foi introduzido por Swede Svante Wold
(Suo) e Bruce R. Kowalski (Americano) em 1972

Definio
efi io da International
te atio al cchemometrics
e o et ics society ICS,1974
CS, 97

QUIMIOMETRIA a disciplina qumica que usa mtodos


matemticos e estatsticos para:
a) Planejar e relacionar condies timas de experimentos;
b) Extrair o mximo de informaes dos dados qumicos
qumicos.
De acordo com essa definio,
f aq
quimiometria objetiva:
j
1. Planejar e otimizar experimentos;
2. Anlise exploratria de dados;
3. Classificao;
4. Calibrao multivariada;
5. Resoluo Multivariada de curvas.

DADOS

ESTATSTICA MULTIVARIADA

INFORMAO

CONHECIMENTO/ENTENDIMENTO

DECISO

SOFTWARES
1)

Matlab (Mathworks);

2)

PLS_toolbox (Eigenvector);

3)

Unscrambler (Camo);

4)

Pirouette (Infometric);

5)

SIMCA (Umetric);

6)

S i i (Statroft);
Statistica
(S
f)

7)

Octave (Free) http://www.gnu.org/software/octave/

8)

Scilab (Free) http://www.scilab.org/


http://www scilab org/

9)

R (Free) http://www.r-project.org/

REVISTAS CIENTFICAS
1) Journal of Chemometrics (Wily);
2) Chemometrics and Intelligent Laboratory Systems (Elsevier).
(Elsevier)
3) Analytical Chemistry (ACS Publications);
4) The
Th A
Analyst
l t (RSC Publishing);
P bli hi )
5) Analytical Chemical Acta (Elsevier);
6) Analytical and Bioanalytical Chemistry (Springer);
7) Talanta (Elsevier);
8) Applied Spectroscopy (Society for Applied Spectroscopy);
f
((NIR Publications);
);
9)) Journal off Near Infrared
10) SAR & QSAR in Environmental Research

LIVROS
1 Como Fazer Experimentos (B.
1.
(B B
B. Neto
Neto, I.
I S.
S Scarmino; R.
R
E. Bruns);
2. Chemometrics ( M. Otto);
3. Chemometrics: a pratical guide (B. P. Seasholtz);
4. Tutorial PLS_toolbox (Barry M. Wise)
5. Design And Analysis Of Experiments (2004) DOUGLAS
C. MONTGOMERY

ESTATSTICA MULTIVARIADA EM OUTRAS REAS


1 Quimiometria (Qumica e Farmcia)
1.
2. Psicometria ( Psicologia);
3. Biometria (Biologia);
4. Econometria (Economia)

MODELAGEM DE DADOS RESULTANTES


DE EXPERIMENTOS
1. Modelos mecansticos: o mecanismo por trs do
comportamento do modelo conhecido (por exemplo,
as leis de Newton).
Newton) um modelo GLOBAL.
GLOBAL
2 M
2.
Modelos
d l empricos:
i
no
se conhece
h
todos
d os fatores
f
que influenciam o fenmeno que est sendo estudado.
No vale fora da regio experimentalmente
investigada. um modelo LOCAL

PLANEJAMENTO E OTIMZAO

DE
EXPERIMENTOS

O bom planejador de experimento comea com a seguinte


pergunta:
O que desejamos saber quando o experimento terminar?

PLANEJAMENTO E OTIMZAO DE EXPERIMENTOS

C
O
N
H
E
C
I
M
E
N
T
O

OBJETIVO

TCNICA

Triagem das variveis

Planejamento
j
fracionrio

Avaliar a influncia
das variveis

Planejamentos
j
fatoriais completos

Construo de
modelos empricos

Modelagem por
mnimos quadrados

Otimizao

Superfcie de
resposta,
t Simplex
Si l

Construo de
modelos
d l mecanstico
ti

Deduo a partir de
princpios
i i gerais
i

ERROS GROSSEIROS
1.
2.
3.
4.

TIPOS DE
ERROS

Geralmente so muito altos;


A medida deve ser eliminada;
A estatstica no se ocupa deles;
Exemplo: esquecer de colocar um
indicador em uma soluo.

ERROS SISTEMTICOS
1. Atribudos a causas definidas;
2. Afetam o resultado sempre na mesma direo;
3. Podem ser corrigidos;
4. Podem ser de mtodos, operacionais, pessoais ou
i t
instrumentais;
t i
5. Exemplos: balana no tarada, pipeta no aferida,
indicador errado em uma titulao etc.
ERROS ALEATRIOS
1. No possuem valores definidos;
2. No so mensurveis;;
3. Flutuam aleatoriamente entorno de um valor central
(mdia);
4. Devem ser tratados estatsticamente.

Exemplo de erro aleatrio


R lt d de
Resultado
d 20 titulaes
tit l feitas
f it em um lote
l t de
d vinagre.
i
V l de
Valor
d referencia
f i 4%.
4%
Titulao no

Concentrao (%)

Titulao no

Concentrao (%)

3.91

11

3.96

4.01

12

3.85

3.61

13

3.67

3.83

14

3.83

3.75

15

3.77

3.91

16

3.51

3.82

17

3.85

3.70

18

4.04

3.50

19

3.74

10

3.77

20

3.97

Observe que os valores parecem flutuar entorno da mdia ao acaso.


Comandos do SCILAB ou MATLAB: digite >> help plot
>> plot(y,ro)

REVISO DE ALGEBRA LINEAR


Escalar uma quantidade matemtica que pode
ser completamente descrita pela sua magnitude.
Exemplo: b=5, temp=400
Vetor uma quantidade matemtica que
apresenta uma magnitude e uma direo.
E
Exemplo:
l
3
b = 4
1

1
b=
3

a = [ 2 4 1]

>> a=[2 3 4] ou >> b=[2; 3; 4]

MATRIZ
2
A = 7
5

3
2

2
0

6
1
3

Comandos do MATLAB
>> A=[2
A [2 5 3 6;7
67321
1;5
5 2 0 3]

MATRIZ TRANSPOSTA (B=AT)


2
5
AT =
3

7
3
2
1

5
2
0

( AB )

=B A

Comandos do MATLAB
>> B=A'

ADO

DE MATRIZES
As matrizes devem ter dimenses iguais
Exemplo

1
X =
5
1
5

4
4
4
4

3 2
+

0 2

Comandos do MATLAB
>> C=X+Y

2
Y =
2
4
6

1 3 8
=

3 7 10

MULTIPLICAO

DE MATRIZES
POR ESCALAR
c=4;

1
X =
5

1
c* X = 4
5

4
4

Comandos do MATLAB
>> c*X

4
4

3 4 16 12
=

0 20 16 0

PRODUTO DE MATRIZES
O nmero de colunas da primeira matriz deve
ser igual ao nmero de linhas da segunda
segunda .

2
A=
4

5
5

3 2x3

4
B = 9
5

3
5

5
3

58 34 31 41
A* B =

76 46 53 69 2x4
2 4
Comandos do MATLAB
>> A*B

7
4
7 3x4

MATRIZ IDENTIDADE

I * A = A* I = A
I 44

1
0
=
0

0
0
0

Comandos do MATLAB
>> I=eye(4,4)

MATRIZ NULA
A* Nula = Nula
A + Nula = Nula + A = A

0
0
Nula =
0

0
0

0
0

Comandos
C
d d
do MATLAB
>> Nula=zeros(4)

0
0

MATRIZ DE UNS
1
1

U = 1

1
1

1
1

1
1

1
1

1
1

1
1

1
1

Comandos
C
d d
do MATLAB
>> U=ones(5)

1
1
1

1
1

MATRIZ INVERSA
-1

-1 -1
AB
=
B
A
( )

2 1 1
A = 4 1 0
-2 2 1

0.1250 0.1250 - 0.1250


C = -0.5000
-0 5000 0.5000
0 5000 0.5000
0 5000
1.2500 - 0.7500 - 0.2500

-1

A* A = A * A = I

2 1 1 0.1250 0.1250 - 0.1250 1 0 0


A* C = 4 1 0 -0.5000 0.5000 0.5000 = 0 1 0
-2 2 1 1.2500 - 0.7500 - 0.2500 0 0 1

Comandos do MATLAB
>> C =inv(A)
>> C*A

PROPRIEDADES DAS MATRIZES


A, B e 0 so matrizes e so escalares.
1 ( A+ B) + C = A + ( B + C ) ;

2 A + B = B + A;
3 0 + A = A + 0 = A;;
4 A + ( -A ) = 0;
5 ( A + B ) = A + B;
6 ( + ) A = A + A;
7 ( ) A = ( A ) ;
8 1 A = A

INDEPENDNCIA LINEAR
Dado um conjunto de vetores

{v1 , v2 , v3 "}
dizemos q
que esses vetores so linearmente
independentes se a equao

1v1 + 2 v2 + 3v3 + " + n vn = 0

admitir apenas a soluo trivial, i.e.,

1 = 2 = 3 = " = n = 0.

EXEMPLOS
As matrizes

1 0
3 0
A=
e B=

2 3
6 9
no so linearmente independentes, pois

B = 3 A.
A
Os vetores
1
e1 = 0 ,
0

so L.I.

0
0
e2 = 1 e e3 = 0
0
1

POSTO OU RANK DE UMA MATRIZ


o nmero de colunas ou linhas linearmente independente
de uma matriz.
rank ( X ) min ( m, n )

EXEMPLOS
O posto da matriz

1
A = 2
3

3
6
9

2
9 dois.
8

Comandos do MATLAB
( )
>> rank(A)
ans = 2

PRODUTO INTERNO
Um produto interno sobre um espao vetorial real V
uma funo que associa a cada par de V a um
nmero real, satisfazendo as seguintes propriedades:

i ) v,v 0 p/ v V e v,v = 0 v = 0
ii ) v1 , v2 = v1 , v2 p/ \
iii ) v1 + v2 , v3 = v1 , v3 + v2 , v3
iv) v1 , v2 = v2 , v1

EXEMPLOS
O produto escalar usual de vetores do \ n . Dados
p como
os vetores a e b,, definimos o p.i.

a,b = a b
T

Se

2
a = 5
1

4
b = 3 , ento
5

4
a T b = [ 2 5 1] 3 = 28.
28
5

Comandos do MATLAB
>> c=a*b

DETERMINANTES
Seja A uma matriz quadrada. O determinante da
matriz A definido como
n!

A = det A = ( -1) ji a1j1 a2j2 a3j3 " anjn ,


I

I o nmero de inverses de cada parcela da soma


Pji o operador que gera as permutaes dos dices.

PROPRIEDADES DOS DETERMINANTES


1. Se todos os elementos de uma linha ou coluna for
igual
g
a zero,, o determinante ser zero;;
2. detA=detAT ;
3. Se multiplicarmos uma linha ou coluna por uma
constante k,
k ento o det fica multiplicado por k;
4. Se permutarmos duas linhas ou duas colunas de
uma matriz, ento o determinante da matriz muda
d sinal;
de
l
5. O determinante de uma matriz que tem duas
linhas ou colunas iguais
g
zero;
6. Det(AB)=detAdetB.

EXEMPLOS
1
A = 4
7

2
5
8

3
6
0

Comandos do MATLAB
>> det(A)

A = 27.
2

HISTOGRAMA
um grfico de barras em que a rea ou a altura
representa
p
a ffreqncia
q
da classe.
Rol o conjunto de dados brutos dispostos em
alguma ordem, geralmente crescente.
1 Amplitude
1.
A li d do
d rol=
l valor
l mximo
i
valor
l mnimo;
i
2. Amplitude da classe = Amplitude do rol/nmero
de classe;;
3. Nmero de classe = raiz quadrada do nmero de
amostra.
Toda anlise estatstica deve comear com um grfico

Freqncia
F .R. =
Nmero total de amostras
Freqncia

Intervalo (conc. %)

Freqncia

3.500 6 3.608

0.10

3.608 6 3.716

0.15

3.7166 3.824

0.25

3.8246 3.932

0.30

3.9326 4.040

0.20

Relativa

Amplitude da classe = 0.108


>> amp_c=(max(t)-min(t))/5;
>> classe(1)=min(t);
>> for i=1:5
classe(i+1)=classe(i)+amp_c;
end

INTERPRETAO

DOS DADOS
DA TABELA DE FREQNCIAS
10% das titulaes tm valores entre 3,500 e 3,608
15% das titulaes tm valores entre 3,608 e 3,716
25% das titulaes tm valores entre 3,616
3 616 e 3,824
3 824
Portanto, a pprobabilidade de encontrarmos
aleatoriamente uma titulao com valor entre 3,500 e
3,608 exatamente 10%. Podemos afirmar isso porque
conhecemos a distribuio exata das freqncias da
populao.

Comandos do MATLAB

3.9100
4.0100

3.6100

3.8300

3.7500

3.9100

3.8200

3 7000
3.7000
3.5000

3.7700
y=

3
3.9600
9600

3.8500

3.6700

3.8300

3.7700
3.5100

3.8500

4.0400

3.7400

3.9700

>> [n, xout]=hist(t, 5)


n = 2 3 5 6 4 (Freqncia das classes)
xout =3.5540
=3 5540 3
3.6620
6620 3
3.7700
7700 3
3.8780
8780 3
3.9860
9860
(Centro de cada classe)
Clculo da freqncia relativa:
>> f=(1/20)*n;
>> f
0.1000 0.1500 0.2500 0.3000
>> bar(xout,f) (Faz o historgrama)
Para fazer tudo automaticamente
>> hist(y,5)
>> histfit(y,5)
hi tfit( 5)

0.2000

POPULAO OU UNIVERSO ESTATSTICO


o conjunto de todos os elementos ou indivduos sobre os
quais se desenvolve alguma pesquisa. A populao pode ser
finita (nmero de caroos de feijes existente na terra) ou
infinita (nmero de pesagens de um indivduo).

AMOSTRA
qqualquer
q
subconjunto
j
de uma populao
p p
.

AMOSTRA REPRESENTATIVA
1. O
Os elementos
l
so escolhidos
lh d rigorosamente ao acaso;
2. Todos os elementos tm a mesma chance de serem
escolhidos;
3. Nmero suficiente de elementos, o qual depende da
preciso das estimativas.

TIPOS DE AMOSTRAGEM
1. Amostra Aleatria Simples (AAS): consiste em
enumerar cada elemento da populao e em seguida fazer
o sorteio;
2. Amostragem Sistemtica: cria-se uma lei de formao
para a escolha dos elementos;
3. Amostra Por Conglomerado: sorteiam-se regies da
populao e as sorteadas,
sorteadas todos os elementos delas faro
parte da amostra;
4. Amostragem Estratificada: divide a populao em
sub-populaes que tenham o maior grau de
homogeneidade possvel e retira-se uma amostra de cada
sub populao.
sub-populao.

PARMETROS ESTATSTICOS
So nmeros que representam caractersticas de uma populao:
1 Mdia aritmtica: uma medida
1.
did de
d tendncia
t d i central;
t l
2. Varincia: uma medida da disperso dos dados amostrais;
3 Desvio
3.
D i padro
d etc.

MDIA ARITMTICA
uma medida de tendncia central definida por

1
x=
N

x
i =1

x a mdia
di aritmtica;
it ti
xi o i-simo termo;
N o nmero total de valores na amostra.

Comandos do MATLAB
>> media=mean(y)
media mean(y)

VARINCIA
uma medida do grau de disperso dos dados em torno da mdia:

1
2
Var. populacional = =
N

1
2
di =

N
i =1

(x x )
i =1

N
N
1
1
2
2
2
Var. amostral = s =
di =
( xi x )

N 1 i =1
N 1 i =1

di = xi x

x a mdia aritmtica;
xi o i-simo termo;
N o nmero total de valores na amostra.

Por que usamos N-1 na frmula anterior?

d = ( x x ) = x x = x Nx = Nx Nx = 0
i

A amostra tem um grau de liberdade a menos, i.e., cada equao


retira
ti um grau de
d liberdade
lib d d do
d sistema,
it
o que torna
t
natural
t la
diviso por N-1.

Comando do MATLAB:
>> variancia = var(y)

DESVIO PADRO
Tambm mede a disperso da amostra em torno da mdia.
Usamos o desvio ppadro ppara definir
f
intervalos em torno da
mdia.

Populao

Amostra

s= s

Comandos do MATLAB
>> std(y)
>> ans =0.1509

DISTRIBUIO

ESTATSCA
uma funo que descreve o comportamento de uma
varivel aleatria.
Uma varivel aleatria pode assumir qualquer valor no
universo estatstico e o valor assumido apresenta uma certa
probabilidade de ocorrncia que governada por uma certa
distribuio de probabilidade.

DISTRIBUIO CONTNUA
um tipo de distribuio em que a varivel aleatria pode
assumir qualquer valor em um determinado intervalo.

FUNO

DENSIDADE DE PROBABILIDADE
uma funo que descreve a distribuio de probabilidade
de uma varivel aleatria continua x.
Exemplo:
Distribuio
normal ou ggaussiana proposta
p p
ppor Karl F. Gauss
no sculo XIX.
2
x - )
(
-

1
2 2
f(x) =
e
x ( , )
2
f ( x )=Densidade de probabilidade da varivel x;
= Mdia
dia da varivel
va ivel x;
2 = Varincia da varivel x.

Uma varivel aleatria x que se distribui normalmente com


mdia e varincia 2 denotada por

x N ( ,

).

Se

x N ( 0,1) ,

ento
t dizemos
di
que x segue a distribuio
di t ib i normall padro
d ou
padronizada, i.e., com mdia zero e varincia unitria.

A REA SOB A CURVA NORMAL PADRONIZADA 1

1 z2 2
f ( x) =
e
2
x
z=

68 26% => 1 desvio


68,26%
95,44% => 2 desvios
99,73% => 3 desvios

Interpretao:
68,26% dos dados esto compreendidos no
intervalo (-, ); i.e., com 1 desvio
95,44% est no intervalo (-2, 2); i.e., 2
d
desvios
padres;
d
99,73% est no intervalo (-3, 3); i.e., 3
desvios padres.

CARACTERSTICAS DA DISTRIBUIO NORMAL


1. Mximo ocorre em x = (valor mais provvel);
2 Pequenos
2.
P
desvios
d
so
mais provveis;

3. Simtrica em relao a ;
4. Ponto de inflexo em

x = ;

5. Mudana em causa translao na curva;


6. Mudana em causa o estreitamento ou alargamento da
curva.

Q
Qual
a pprobabilidade de encontrarmos x com valores
entre a e b?

P (a < x < b) =

f ( x ) dx

f ( x ) dx

= f ( x ) dx =
a

1
e
2

x2
2

dx

COMO PADRONIZAR VARIVEIS?


Para criar uma nova varivel z com mdia zero e varincia
unitria ou seja,
unitria,
seja padronizada usamos a frmula

z=
x=

varivel aleatria com distribuio

N ( ,

);

z = varivel aleatria com distribuio N ( 0,1)


z representa o afastamento (em unidades de ) da varivel x em
relao a mdia . Isto fica claro se observarmos que

z=

x = + z

Exerccio: Padronize os dados da titulao do vinagre.


y

3.9100 0.7290
4.0100 1.3917
3.6100
3
6100 - 11.2592
2592
3.8300 0.1988
3.7500 - 0.3314
3.9100 0.7290
3.8200 0.1325
3.7000 - 0.6627
3.5000 - 1.9882
3.7700 - 0.1988
3.9600 1.0604
3.8500 0.3314
3.6700 - 0.8615
3 300 00.1988
3.8300
19
3.7700 - 0.1988
3.5100 - 1.9219
3.8500 0.3314
4.0400 1.5905
3.7400 - 0.3976
3.9700 1.1266

Comandos do MATLAB para calcula z:


>> m
m=mean(y);
mean(y);
>> s=std(y);
>> for i=1:20
z(i) (y(i) m)/s;
z(i)=(y(i)-m)/s;
end
>> plot(z,'o')

x = 3,8

z = 0

x2 = 0, 0228
x =0,1509
,

z2 = 1
z =1

EXERCCIO 1
Qual a probabilidade de que o resultado de uma
titulao esteja entre 3,8 (%) e 3,9 (%)?

1. Calcular z1 para x1 e z2 para x2 usando a frmula

z=

Resposta : z1 = 0 e z2 = 0, 6627

2. Consultar a tabela de reas da funo de distribuio normal.


3. Somar as reas das caudas e subtrair de um. A probabilidade
procurada a rea sob a curva entre z1 =0 e z2 =0,66
p
24,54%
,
de pprobabilidade.
4. Resposta:

EXERCCIO 2
Qual a pprobabilidade de qque uma titulao
Q
esteja
j entre 3,5 e
3,92?
EXERCCIO 3
Q l a probabilidade
Qual
b bilid d de
d que uma titulao
tit l tenha
t h um
valor maior do 3,4?
EXERCCIO 4
Verifique se as 20 titulaes seguem um distribuio normal.
Sugesto: normalize as titulaes e calcule o nmero de valores dentro dos
intervalos

( 1 ,1 ) , ( 2 , 2 ) e ( 3 ,3 )

e veja se as freq. relativas correspondem a 68,26%, 95,44% e 99,73%,


respectivamente.
espectivamente.

EXERCCIO 5
Faa o grfico da funo de distribuio normal para os dados
da titulao do vinagre.

Soluo
z
0.7290

1.3917

-1.2592
0.1988
. 9

-0.3314
0.7290

0.1325
-0.6627

-1.9882

-0.1988
1.0604

0.3314
-0.8615

0.1988
-0.1988

-1.9219

0.3314
1.5905

-0.3976
1.1266

0.3911
. 9

0.3776
0.3059

0.3955
0.3203

0.0553

0.3911
0.2274

0.3776
0.2753

0.3911
0.3911

0.0629

0.3776
0.1126

0.3686
0.2115
f(z)
0.3059
0.1515
0.1806

>> for i=1:20


f(i)=(1/sqrt(2*pi))*exp(-z(i)^2/2);
end;
d
>> plot(z,f,'o')

TEOREMA DO LIMITE CENTRAL -TLC


S a fl
Se
flutuao
totall numa certa varivel
i l aleatria
l i for
f o
resultado da soma das flutuaes de muitas variveis
independentes e de importncia mais ou menos igual, ento a
sua distribuio tender para a normalidade.

Premissas
emissas impo
importantes
tantes do TLC:
C: flutuaes independentes e igual impo
importncia.
tncia.

EXEMPLOS
1. O peso do feijo depende do grau de desidratao, ao
das pragas, carga gentica etc que tm flutuaes
independentes e apresentam igual importncias.
importncias Portanto
Portanto,
o peso dos caroos de feijes se distribui normalmente.
2. O erro final de uma titulao depende da leitura da bureta,
tonalidade final do indicador etc, que so variveis que
flutuam independentemente e apresentam igual
importncia Portanto
importncia.
Portanto, o erro final na titulao se distribui
normalmente.

de cinco dados uma


3. A mdia dos ppontos do lanamento
funo de cinco variveis aleatrias , onde cada uma se
distribui independentemente das outras. Logo, a mdia se
distribui normalmente.

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Sejam x1 e x2 va
variveis
iveis aleatrias
aleat ias com pa
parmetros
met os populacionais dados po
por
2

( 1 1) e

( , )

A combinao linear

2
2

respectivamente.

y = a1 x1 + a2 x2

define uma nova varivel aleatria y.

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Seja y uma varivel aleatria formada pela combinao das variveis
aleatrias x1 e x2, i.e.,

1
1
y = y=
N
N
y = a1 x1 + a2 x2

1
( a1 x1 + a2 x2 ) = a1 N

1
x1 + a2 N

x
2

Concluso: A mdia da combinao linear de variveis aleatria s igual


a combinao
linear das mdias.

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Varincia de y:
1
2
y

y
( )
N 1
1
2
=
( a1 x1 + a2 x2 a1 x1 a2 x2 )
N 1
2
1
=
a
x

x
+
a
x

(
)
(
)
1 1 1 2 2 2
N 1
1
2
2
2
2

+ 2a1a2 ( x1 x1 )( x2 x2 )
a
x
x
a
x
x
(
)
(
)

1
1
1
2
2
2

N 1
2
2
1
1

2 1
= a12
x

x
+
a
x

x
+
2
a
a
x

x
x

x
(
)
(
)
(
)(
)
1 1 2 N 1 2 2 1 2 N 1 1 1 2 2
N 1
s y2 =

s y2 = a12 sx21 + a22 sx22 + 2a1a2 sx1 sx2 r ( x1 , x2 )

onde

r ( x1 , x2 ) =

( x1 x1 )( x2 x2 )
1

N 1
sx1 sx2

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Para
a a populaes, temos:

y = a11 + a2 2
y2 = a12 12 + a22 22 + 2a1a2 1 2 ( x1 , x2 )
Se as variveis se distriburem de modo independe, ento a correlao
entre as variveis zero:

( x1 , x2 ) = 0

=a +a
2
y

2
1

2
1

2
2

2
2

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


S houver
Se
h
vrias
i variveis,
i i podemos
d
escrever

y = a1 x1 + a2 x2 + " + a p x p = ai xi
i

y = ai xi
i

s = a s + 2 ai a s s r ( xi , x j )
2
y

2
i i

j >i

2 2
j i j

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Parmetros
P

populacionais
l i i de
d uma combinao
bi linear
li
de
d variveis
i i
aleatrias:
N

y = ai xi
i

onde N o nmero de indivduos da populao.

y = ai i

y2 = ai i2 + 2 ai a j i2 2j ( xi , x j )
i

j >i

( i i ) = mdia e varincia populacional da varivel aleatria xi

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Observe que,

1
x=
N

1
1
1
1
xi = N x1 + N x2 + N x3 + " + N xN

A mdia de N ( xi ) observaes um caso particular de combinao linear,


onde

1
a1 = a2 = " = aN =
N

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Suponhamos que sejam retiradas vrias amostras da populao. A mdia das
distribuies das mdias amostrais uma combinao linear:

y = ai xi
i

onde

a mdia das mdias amostrais e

xi

mdia da amostra

Para amostras representativas, razovel supor que as mdias amostrais se


distribuem com a mdia populacional . Substituindo ai por 1/N e
substituindo xi p
por , temos

1
1
y = ai xi = =
N
N
i

1
= N N =

y=
Concluso: A mdia das mdias amostrais igual a mdia da
populao.

COMBINAES LINEARES DE VARIVEIS ALEATRIAS


Se a escolha dos elementos das amostras for aleatria, ento o coeficiente de
correlao
l zero : r(x
( i,xj)=0.
) 0 Logo,
L
a varincia
i i das
d mdias
di

s = ai sxi
2
y

Como as observaes so feitas na mesma populao, ento razovel supor


que as mdias se distribuem com a mesma varincia da populao 2, i.e.,
2

1 2
2
2
s y = ai sxi =
N
s y2 =

1
=
N

2
1

2
2

=
=
N
N

2
N

onde s y a varincia das mdias amostrais e


2

a varincia da populao.

Concluso: A varincia das mdias amostrais mais estreita do


que a varincia populacional.

Teorema: Sejam amostras aleatrias de N elementos extrados de uma


populao que se distribui normalmente com mdia e varincia 2. Ento,
As mdias amostrais distribuem normalmente com a mesma mdia
populacional e varincia 2/N :

x N ( , 2 N )
t=
A varivel aleatria t, definida
f
por
p

x
s N

segue a distribuio t com N-1 graus de liberdade:

x
t N 1
s N

A varivel 2, definida por 2 = ( N 1) s 2 2 , segue a distribuio quiquadrado tambm com grau de liberdade N-1:

( N 1)

s2

N2 1

INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL


Intervalo de confiana um intervalo em torno da mdia amostral que, com
certa probabilidade,
b bilid d contm
a mdia
di populacional
l i l verdadeira.
d d i
Como visto, z distribui normalmente com mdia zero e desvio padro um, i.e.,
z N(0,1). Usando a frmula

z=

e trocando x pela mdia amostral


(ver slide 68), temos:

x e pelo desvio padro amostral

x-
= z N ( 0,1)
N
x-

-z <
<z x-z
< < x+z
N
N
N

INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL


USANDO A DISTRIBUIO Z

x-z
< < x+z
N
N
A frmula acima pode ser usada para estabelecer um intervalo
para a mdia populacional a partir da mdia amostral x . z
pode ser obtido usando a tabela normal. O problema desta
frmula que precisamos da varincia populacional que no
temos.
Em 1908, William Sealy Gosset (pseudnimo student) props a
distribuio da varivel aleatria ( x ) s para estimar a mdia
populacional
l i l . Atualmente,
At l
t dividimos
di idi
s por N e falamos
f l
da
d
distribuio da varivel

x-
t N 1
s N

INTERVALO DE CONFIANA PARA A MDIA POPUPACIONAL A


A PARTIR DE UMA AMOSTRAGEM

x-
t N 1
s N
x-
-t N 1 <
< t N 1
s N
x - t N 1

s
s
< < x +t N 1
N
N

1.

Usada para estabelecer um intervalo de confiana para a mdia


ppopulacional
p
;

2.

A distribuio t simtrica em relao mdia zero;

3.

Usada para pequenas amostras (geralmente N<30)

4.

Para N>30 a distribuio normal (slide 71) produz resultado similar


distribuio de student.

Distribuio de Student para 1,2,5,10 e graus de liberdade (Wikipedia, acessado


em 13/09/2009)

Curva azul: distribuio normal. Curvas verdes e vermelha distribuio de Student para
p
1,2,3,5 e 10 graus de liberdade Observe que a curva normal mais alta e mais estreita do
que a de Student. Mas, a medida que aumenta o grau de liberdade as duas curvas se
assemalham. (Wikipedia, acessado em 13/09/2009) .

EXEMPLO
Os pesos de 7 gros de feijo so: 0.1399 0.2790 0.1988 0.1904 0.1911 0.2186
0.1606. Determine, com 99% de confiana, quantos gros existem em um
quilograma.

Soluo
Intervalo de confiana =99%
Grau de liberdade v=N-1=7-1=6
Procurar na tabela de student o valor de t6 : linha 6, coluna 0,005
t6 =3,707

x = 0.1969 s = 0.0445 x - t N 1
0.1969 3.707 0.0445
0.1346 < < 0.2593

s
s
< < x +t N 1
N
N

7 < < 0.1969 + 3.707 0.0445

Com 99% de confiana o valor mdio dos gros de feijes situam-se entre
0,1346g e 0,2593. Para encontrarmos quantos gros tm em um quilo, dividimos
um quilo pelo peso de um gro:

1000 0.1346 < < 1000 0.2593 3857 < < 7431

EXERCCIO

Retire uma amostra de sete titulaes da Tabela do slide 15 e usando a


distribuio de Student estime, com 95% de confiana, um intervalo para a
mdia das titulaes.

DISTRIBUIO QUI-QUADRADO 2 USADA PARA


ESTIMAR A VARINCIA POPULACIONAL 2
A distribuio qui-quadrado usada para calcular a varincia e o desvio
padro populacional. Essa distribuio assimtrica e devemos olhar duas
colunas
l
na tabela
t b l do
d 2.

N21

2
N 1

( N 1)

N21 < ( N 1)

s2

2
s2

< N2 1

( N 1) s 2 < 2 < ( N 1) s 2
N2 1

N2 1

N21

N21

( N 1) s

<

<

N2 1

( N 1) s 2

COMO OLHAR A TABELA DO 2?


Por exemplo, para um intervalo de confiana de 95%, com 9 graus
de liberdade, devemos olhar a coluna de 0,025 correspondendo a
cauda direita e a coluna de 0,975,
0 975 cauda direita que
corresponde a 0,025 da cauda esquerda, i.e.,

2, 70 < 2 < 19, 0 2, 70 < ( N 1)


2

s
s
2
< < ( N 1)
.
( N 1)
19, 0
2, 70

s2

< 19, 0

EXERCCIO
1. Os pesos de 7 gros de feijo so: 0.1399 0.2790 0.1988
0.1904 0.1911 0.2186 0.1606. Determine, com 95% de
confiana
fi
um intervalo
i
l para a 2 e o para os gros
de
d
feijo de um quilo.

2. Retire uma amostra de seis titulaes da Tabela do slide 15 e


usando
d a di
distribuio
t ib i do
d chi
hi quadrado
d d estime,
ti
com 95% de
d
confiana, um intervalo para a varincia e o desvio padro
das titulaes

EXERCCIO
O teor de carboidrato de uma glicoprotena foi determinado
como sendo: 12.6; 11.9; 13.0; 12.7 e 12.5 de carboidrato por
100g de protena em anlise repetidas.
1 Usando
1.
U d a di
distribuio
t ib i de
d Student,
St d t calcule
l l os intervalos
i t
l de
d
50 e 95% de confiana, para a mdia do teor de
carboidrato.
N = 5; x = 12 ,5 g; s = 0 , 4 g; = 4; = x t N 1 s

= 12 ,5 0 , 741 0 , 4 5 g
2. Calcule o intervalo para a mdia, com 95% de confiana,
para uma situao em que o valor populacional do desvio
padro
d seja
j conhecido
h id como sendo
d igual
i l a 0,2g.
02
= 0, 2 g; 95%; z = 1,96

0, 2
= x z
= 12,5 1,96
= 12,5 0, 2 g
N

COVARIANA AMOSTRAL DAS VARIVEIS x E y


uma medida
did no
padronizada
d i d da
d relao
l entre duas
d
variveis,
i i i.e.,
i da
d
tendncia de se desviarem de forma parecida em relao s respectivas mdias
(co-variar = variar junto). A covarincia definida como

1 N
Cov ( x, y ) =
( xi - x )( yi - y )

N - 1 i=1
EXEMPLO
Determine a matriz de covarincia da matriz A dada.

-11
A = -2
4

1
3
0

2
1
3

10.3333 -4.1667 3.0000


Cov ( A ) = -4.1667 2.3333 -1.5000
3.0000
3 0000 -1.5000
-1 5000 1.0000
1 0000

Comando do matlab/Octave: >> cov(A)

COEFICIENTE DE CORRELAO AMOSTRAL


uma medida
did padronizada
d i d da
d relao
l entre duas
d
variveis.
i i

1 N ( x i - x ) ( yi - y )
r ( x, y ) =

N - 1 i=1 s x s y
COEFICIENTE DE CORRELAO POPULACIONAL

1
( x, y ) =
N

( x i - x ) ( yi - y )

sx s y
i=1
N

Propriedades do coeficiente de correlao


1.

r [ 1,1;]

2.

Variveis estatisticamente independentes tm r igual a zero, a recproca no


verdadeira;

3.

Variveis perfeitamente correlacionadas tm r igual a 1 ou -1;

4
4.

O r uma medida da linearidade existente entre duas variveis;

5.

O r(x,y) deve ser interpretado com cuidado.

EXEMPLO
Calcule a matriz de correlao
da matriz A dada.

x1
-1
A = -2
4

x2

x3

1
3 2
0 -4
1

1.0000 -0.8486 -1.0000


r ( A ) = -0.8486 1.0000 0.8486
-1.0000 0.8486 1.0000

Comando do Matlab/Octave: >> corrcoef(A)


EXEMPLO
Os volumes (em ml) de sete caroos de feijo so: 0.108; 0.214; 0.143; 0.195;
0.148; 0.144 e 0.174. Os seus respectivos pesos so: 0.1188; 0.2673; 0.1795;
0.2369; 0.1826; 0.1860 e 0.2045. Calcule a covarincia, a correlao e
interprete os resultados. Faa um grfico bidimensional das variveis.

COMO DETERMINAR O TAMANHO DA AMOSTRA?


O teste t nos fornece um intervalo que com certa confiana encontra-se
encontra se a
mdia da populao, i.e.,

L
L
..........( ............... ...................) ............
t N-1 s
N
L
Logo,

t N-1 s
+
N

t NN-11 s
L=
N

Se desejamos uma preciso menor ou igual a L


L, ento fazemos

s
t s
L N
N
L

= grau de liberdade
s = desvio p
padro amostral
L = preciso desejada

O desvio padro amostral s deve ser obtido a partir de uma srie histrica.

EXEMPLO
Determinar
ete mina o tamanho da amost
amostra
a de titulao para
pa a que a mdia tenha uma
preciso de 0,1% com 95% de confiana. Usar o desvio padro de 0,1509.
Soluo
Como a desvio padro foi calculado a partir de 20 titulaes, temos 19 graus
de liberdades t19=20-1=19. Na tabela de student olhamos a linha 19 e a
coluna 0,025
,
ppara termos uma confiana
f de 95%.

t19 = 2, 093
s = 0,1509
0 1509
2

2, 093 0,1509%
t s
N N
= 9,98

0 1%
0,1%
L

N 9,98

Neste caso podemos tomar N=10 para termos uma preciso de 0,1%

Quando temos a estimativa do desvio padro obtido a partir de uma srie


histrica
ist ica de ta
tamanho
a o razovel,
azovel, a diferena
dife ena entre
ent e a dist
distribuio
ibuio normal
no mal e a de
student pequena e poderemos usar a distribuio normal:

z
N

EXERCCIO
Um llaboratrio
U
b
i de
d anlise
li faz
f determinaes
d
i com um desvio
d i padro
d
histrico de 0,5%. Um cliente envia uma amostra, cuja concentrao ele
quer saber com uma preciso de 0,2%. Estimar o nmero de determinaes
que o analista dever fazer para dar a resposta desejada com 95% de
confiana. Resposta: N>24,01

TABELA DE DADOS PARA O PRXIMO EXERCCIO

C3

C8

C27

C31

L7

L30

L33

PI

H-1

L+1

EA

GAP

LogP

-0.033

-0.073

0.002

0.109

0.941

0.944

9.905

-10.149

-9.906

-0.995

-0.854

5.451

4.456

0.995

8.911

-0.5

-0.096

-0.075

0.138

136

0.951

0.937

10.151

-10.196

-10.152

-0.993

-0.665

5.572

4.58

0.993

9.159

-1.02

-0.096

-0.072

0.138

0.148

0.948

0.935

9.738

-10.239

-9.738

-0.872

-0.726

5.305

4.433

0.872

8.866

-1.05

0.114

-0.015

-0.204

-0.212

0.957

0.97

0.971

9.503

-10.16

-9.504

-0.951

-0.57

5.227

4.276

0.951

8.553

-0.73

0.093

-0.014

-0.181

-0.213

0.953

0.973

0.971

9.046

-9.969

-9.047

-0.97

-0.59

5.008

4.038

0.97

8.077

-0.98

0.114

-0.012

-0.203

-0.213

0.952

0.97

0.969

9.622

-9.698

-9.627

-0.842

-0.648

5.234

4.392

0.842

8.785

-0.77

0.091

0.001

-0.181

-0.213

0.952

0.973

0.97

9.003

-9.922

-9.003

-1.013

-0.526

5.008

3.995

1.013

7.99

-1.02

0.069

0.004

-0.227

-0.24

0.96

0.933

0.975

8.721

-8.928

-8.722

0.153

0.363

4.284

4.437

-0.153

8.875

3.03

-0.115

-0.028

0.134

0.127

0.987

0.943

8.8

-9.461

-8.8

-0.663

0.312

4.731

4.068

0.663

8.137

2.91

0.039

0.008

-0.214

-0.214

0.961

0.984

0.981

8.777

-9.058

-8.778

0.067

0.147

4.356

4.422

-0.067

8.845

2.37

0.097

0.024

-0.206

-0.241

0.989

0.973

0.97

8.592

-9.291

-8.593

-0.658

0.302

4.625

3.967

0.658

7.935

3.2

0.043

0.037

-0.228

-0.237

0.984

0.925

0.978

8.504

-8.77

-8.504

-0.272

0.266

4.388

4.116

0.272

8.232

3.94

0.007

0.032

-0.202

-0.241

0.987

0.959

0.978

8.669

-8.698

-8.67

-0.216

0.367

4.443

4.227

0.216

8.454

3.97

0.056

0.029

-0.203

-0.214

0.986

0.933

0.98

8.581

-8.798

-8.581

-0.196

0.315

4.388

4.192

0.196

8.385

4.45

0.074

0.035

-0.212

-0.211

0.985

0.976

0.981

8.614

-8.817

-8.614

-0.128

0.444

4.371

4.243

0.128

8.486

4.14

0.051

0.035

-0.207

-0.212

0.985

0.973

0.981

8.566

-8.817

-8.566

-0.121

0.366

4.343

4.222

0.121

8.445

4.48

0.052

0.033

-0.188

-0.21

0.986

0.979

0.98

8.397

-8.827

-8.398

0.255

0.459

4.071

4.326

-0.255

8.653

4.27

-0.032

-0.071

0.002

0.148

0.946

0.935

9.816

-10.122

-9.817

-0.992

-0.931

5.404

4.412

0.992

8.825

-0.53

0.108

-0.276

-0.206

-0.207

0.952

0.99

8.326

-9.327

-8.327

-0.417

0.111

4.372

3.955

0.417

7.91

3.49

0.082

-0.284

-0.184

-0.2

0.934

0.985

8.283

-8.95

-8.283

-0.323

0.065

4.303

3.98

0.323

7.96

3.23

2. Com os dados da Tabela anterior faa:


f
i.

Um grfico de linhas para as variveis e verifique se existe algum


valor anmalo. Se existir voc dever remov-lo. >> plot(Sauto)
ii. Calcule o valor mdio de cada varivel. Qual varivel tem maior
valor e qual tem menor valor? >> Sbar=mean(S)
iii. Faa um grfico de barras das mdias calculadas no item 2.
>>
bar(Sbar)
i
iv.
C l l a varincia
Calcule
i i de
d cada
d varivel
i l e faa
f
o grfico
fi de
d barras.
b
Qual
Q l
varivel apresenta maior varincia? >> VarS=var(S) >> bar(VarS)
v. Calcule o desvio padro de cada varivel e faa o grfico de barras.
vi Qual varivel apresenta maior desvio padro?
vi.
vii. Faa um grfico de barras da varivel 17. Qual amostra apresenta
maior valor? >> bar(S(:,17)

viii. Voc julga necessrio autoescalar as variveis? Por qu?


ix Autoescale as variveis.
ix.
variveis
>> Sbar=mean(S)
>> stdS=std(S)
>> for
f j=1:17
j 1 17
for i=1:20
Sauto(i,j)=(S(i,j)-Sbar(j))/stdS(j)
end
end
>> plot(Sauto)
x. Calcule as matrizes de covarincia e de correlao.
xi. Verifique se as matrizes so simtricas;
xii.Quais
ii Q i variveis
i i esto
t correlacionadas
l i d positivamente;
iti
t
xiii.Quais variveis esto correlacionadas negativamente;
xiv.Na matriz de correlao, interprete a diagonal principal.
>> CovarS=cov(S)
>> CorreS=corrcoef(S)

COMO FAZER COMPARAO COM UM VALOR DE


REFERNCIA?
Vamos supor que o valor mdio do cido actico exigido pela a legislao seja
de 4%. Suponha que foram feitas trs titulaes e os valores encontrados foram:
3.91; 4.01; 3.61. De acordo com essa anlise, o teor de cido actico na
amostra est de acordo com a legislao a nvel de 95% de confiana?

HIPTESES

H0: Hiptese Nula

H1: Hiptese Alternativa

No existe diferena estatisticamente


significativa entre a mdia da
amostra e o valor de referncia

Os valores so
f
estaticamente diferentes

Soluo

1
x = ( 3.9
3.91+ 4.01+
.0 3.6
3.61) = 3.8843
3% s = 0.2082
08 %
3
t2 = 4.303 ( 95% de confiana )
3.843 t2

s
s
< < 3.843 + t2
3.32 < < 4.36
3
3

Como o intervalo contm a mdia, no podemos rejeitar a hiptese nula,


isto , de acordo com nossa anlise, a amostra est dentro da legislao.

EXERCCIO
Um qumico est testando um novo mtodo para
pa a determinar
dete mina ferro.
fe o. Fazendo
a endo
quatro anlises num padro certificado, cuja concentrao de referencia
14,3% em massa, ele obtm 13.7; 14.0; 13.9 e 14.1 de ferro. Como voc avalia a
exatido da nova metodologia no nvel de 95% de confiana? Ser que as quatro
determinaes vm de uma distribuio com mdia 14,3%?

S l
Soluo
x = 13.9; s=0.2; t3 = 3.185 ( 95% )
s
s
0.2
0.2
< < x + t3
13.9 3.182
< < 13.9 + 3.182
N
N
4
4
13.6% < < 14.2%
x t3

Como o intervalo no contm o valor de referncia 14.3%, podemos rejeitar a


hiptese nula e concluir que as quatro determinaes no provm de uma
distribuio com mdia 14.3%. Portanto, a nova metodologia no possui a
exatido necessria.

COMO COMPARAR DUAS MDIAS


A tabela abaixo mostra cinco amostras enviadas por cinco fabricantes diferentes
para a determinao da concentrao de acido actico usando 2 tcnicas
diferentes: tcnica A e tcnica B.

Amostra

Tcnica A

Tcnica B

d=A-B

3 77
3.77

3 62
3.62

0 15
0.15

3.85

3.69

0.16

4 07
4.07

4 10
4.10

-0.03
0 03

4.83

4.70

0.13

5.05

4.89

0.16

4.314

4.200

0.114

0.5871

0.5772

0.0814

Existe diferena estatisticamente significativa nas mdias


determinadas p
pelas duas tcnicas?
Para resolvermos este problema, usaremos o teste t para a diferena de duas
mdias:
Primeiramente, determinamos a varincia e o desvio padro da diferena das
duas amostras:

y = x A xB

onde

a1 = 1 e a2 = 1

s y2 = a12 sx2A + a22 sx2B = sx2A + sx2B

s2
s2
1
2 1
=
+
=s
+

N A NB
N
N
B
A

1
1
sy = s
+
N A NB
Estamos supondo que as mdias no esto correlacionadas e que
as varincias s A2 e sB2 provm da mesma populao.

( xA xB ) ( A B ) t
1
1
s
+
N A NB

v = ( N A 1) + ( N B 1)
v = N A + NB 2

Daqui chegamos ao intervalo de confiana:

1
1
+
( A B ) = ( x A xB ) t v s
N A NB
Para ffazermos uma estimativa conjunta
j
do desvio padro
p
s, procedemos
p
assim:
2
2
N

1
s
+
N

1
s
(
)
(
)
4 0,5871 + 4 0,5772
A
A
B
B
2
=
= 0,5822%
s =
4+4
( N A 1) + ( N B 1)

No nosso exemplo, temos

s = 0.5822%

1 1
( A B ) = ( 4.314 4.200 ) t8 0.5822 +
5 5
1 1
( A B ) = ( 4.314 4.200 ) 2.306 0.5822 +
5 5
( A B ) = 0.114% 0.849% = [ 0.735%, 0.963% ]
Como o intervalo contm o valor zero, no podemos rejeitar a
hiptese nula, ou seja, no nvel de confiana de 95% no
podemos afirmar que exista diferena nas duas mdias obtidas
ppelos dois mtodos.

COMPARAES EMPARELHADAS
1.

Na comparao anterior a origem da amostra pode afetar o resultado


da comparao;

2.

A blocagem permite neutralizar essa influncia;

3.

Na blocagem, cada amostra considerada como um bloco;

4.

Fazemos anlise das diferenas d de cada amostra.

5.

Na tabela anterior, ffazemos um teste t da quarta


q
coluna, ou seja,
j
calculamos um intervalo de confiana para as mdias das diferenas. Se
o valor zero estiver dentro do intervalo de confiana, ento no existe
diferena, i.e., a mdia de d pode ser zero dentro da confiana
especificada. Se o valor zero no estiver dentro do intervalo calculado,
ento existe diferena entre as duas tcnicas.

COMPARAES EMPARELHADAS

sd
sd
d t N 1
< < d + t N 1
N
N
sd
sd
< < d + t4
d t4
5
5
0 , 0818
0 , 0818
0,114 2, 776
< < 0,114 + 2, 776
5
5
0, 014 < < 0, 215

[0,014%,0, 215% ]
Como o valor zero no est no intervalo, podemos afirmar que
existe uma diferena entre as duas tcnicas com nvel de
confiana de 95%.

MODO ALTERNATIVO PARA A COMPARAO EMPARELHADA

d t N 1

sd
sd
sd
sd
< < d + t N 1
t N 1
< d < t N 1
N
N
N
N

d < t N 1

sd
N

t N 1 >

d
s

tabelado
= t N 1 t Ntabelad
> t N 1
1

O t tabelado tem que ser maior do que o t estimado para que o intervalo
contenha o zero. As duas tcnicas sero iguais quando =0% ( Hiptese nula),
i.e., o intervalo contm o valor zero.

d 0,114% 0%
t =
=
= 3,13
sd
0,0814 5
N
Para que o valor zero esteja no intervalo t tabelado deve ter o valor mnimo de
3 13 O valor tabelado para t4 (no nvel de confiana de 95%) 2,776
3,13.
2 776 que
menor do que o valor estimado 3,13. Logo, devemos rejeitar a hiptese nula,
=0%, de que no existe diferena entre as duas tcnicas.

EXERCCIO
Determinao do teor de colesterol em seis amostras de plasmas sanguneos,
medidas
did por duas
d
tcnicas
i
diferentes.
dif
Cada
C d amostra possuii um teor diferente
dif
de
d
colesterol. O mtodo B apresenta um resultado menor do que o mtodo A em
cinco das seis amostras. Com 95% de confiana, o mtodo B sistematicamente
diferente do mtodo A?
Tabela . Teor de Colesterol (g/ml)
Amostra
1
2
3
4
5
6
Mdia

Mtodo A
1.46
2.22
2.84
1.97
1.13
2.35

Mtodo B
1.42
2.38
2.67
1.80
1.09
2.25

Diferena (d)
0.04
-0.16
0.17
0.17
0.04
0.10
0.06

Soluo

d 0, 06 gml 1 / ml 0 gml 1
t5 =
=
= 1, 20
sd
0,1225 6
N
Como t5 = 2,571 maior do que o estimado (1,20), no existe
diferena estatisticamente significante entre as duas tcnicas
a nvel
l de
d confiana
f
de
d 95%.
9 %

EXERCCIO
O teor de -PbO2 numa placa de bateria de automvel foi
determinado por espectroscopia de raios-X. Foram registrados
vrios espectros repetidos
repetidos, fazendo
fazendo-se
se (ou no) correo da
linha de base. Os resultados so mostrados abaixo. Existe
diferena sistemtica entre os dois modos de analisar a placa?

Com correo da
l h de
linha
d base
b
16.2

Sem correo da
l h de
linha
d base
b
19.0

-2.8

16.7

19.8

-3.1

17.3

18.5

-1.2

Espectros

Voluntrio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

rea sob a curva no


perodo de 0-8h
Medic. A Medic. B
12 761
12.761
10 983
10.983
10.241
8.211
8.569
9.105
13.321
12.508
11.481
12.114
14.061
11.520
12.287
11.983
14 696
14.696
14 454
14.454
12.526
11.246
9.060
10.740
12.329
10.840
13.244
13.818
7.864
7.156
9.684
12.297
11 811
11.811
12 279
12.279
10.109
9.751
10.966
9.895
10.485
15.579
11 899
11.899
9 296
9.296
13.200
16.163
12.368
11.838

Diferena
1 778
1.778
2.030
-0.536
0.813
-0.633
2.541
0.304
0 242
0.242
1.280
-1.680
1.489
-0.574
0.708
-2.613
-0
0.468
468
0.358
1.071
-5.094
2 603
2.603
-2.963
0.530

EXERCCIO
A tabela ao lado mostra os resultados
para o teste de bioequivalncia de
um medicamento genrico A em
relao ao medicamento de
referncia B. O teste usado foi a rea
sob curva da concentrao do
medicamento
di
t no plasma
l
sanguneo.

No nvel de confiana de 95%,


verifique se o medicamento A
bioequivalente ao medicamento B.
B

COMO COMPARAR DUAS VARINCIAS


1.

O teste F usado para comparar duas varincias amostrais;

2.

S faz sentido comparar varincias amostrais se forem estimativas de


uma mesma populao;

3.

usada para distinguir se existe diferena significativa na preciso de


dois conjuntos de dados;

4.

Compara-se a razo das varincias entre dois conjuntos de dados de


uma mesma populao:

s A2 A2
s A2
F A , B FvA ,vB = 2
2
2
sB B
sB
5.

Por conveno o maior valor


colocado no numerador

Quando Fcalculado > Ftabelado , os dois conjuntos de dados apresentam


varincias com diferenas estatisticamente significativas.

EXEMPLO
Um qumico analtico novato fez 6 determinaes de Ca em calcrio,
calcrio
encontrando uma mdia de 35,25% com um desvio de 0,34%. Um qumico
analtico experiente obteve 35,35% com um desvio de 0,25% realizando 5
determinaes. Existe diferena significativa na preciso dos dois analistas, com
95% de confiana?

Soluo
2
novato = 6 1 = 5
0
,
34
cal
= 1,85
F5 ,4 =
2
exp eriente = 5 1 = 4
0 , 25

Valor tabelado F5,4 = 6,26 (Olhar linha 4, coluna 5)


Como o valor calculado menor do que o tabelado, ento no existe
diferena na preciso, ou seja nos desvios padres.

EXERCCIO
Verifique se as varincias da tabela do slide 94 so estaticamente diferentes.

Soluo
s A2 = 0 ,5871
sB2 = 0 ,5772

F4 ,4

s A2 0 ,58712
= 2 =
= 1, 035
2
sB 0 ,5772

Como o valor tabelado para F4,4 6,39 que maior que o valor
calculado (1,035 ) ento as varincias no so estatisticamente
diferentes.

PLANEJAMENTO DE EXPERIMENTO OU
PLANEJAMENTO FATORIAL
Tem por objetivo determinar a influncia
dos fatores (variveis independes) sobre a
resposta do experimento
( varivel dependente).

PLANEJAMENTO FATORIAL
1..

Cada fator
fato analisado em vrios
v ios nveis;

2.

Nvel o valor (ou classe) que cada fator pode assumir no experimento;

3.

Mtodo univariado (ou clssico): estuda um fator de cada vez, os outros


devem ser mantidos constantes. A interao entre os fatores no so
levados em conta;

4.

Mtodo multivariado: todos os fatores estudados so variados ao mesmo


tempo;

5.

Efeito sinergtico: efeito de interao positiva, isto , o aumento de um


fator refora o outro;

6.

Efeito antagnico: efeito de interao negativo.

7
7.

Planejamento fatorial completo: os experimentos so realizados em


todas as possveis combinaes de nveis dos fatores.

Planejamento fatorial 2K
um planejamento fatorial de k fatores em dois nveis
nveis.

Planejamento
j
fatorial
f
completo
p
22
Planejamento fatorial completo 22 . Este tipo de planejamento simples de
executar e ppode ser estendido para
p
um planejamento
p
j
mais sofisticado.
f
til
quando desejamos saber a influncia dos fatores na resposta.

EXEMPLO
Estudar a influncia da temperatura e do catalisador no rendimento de uma
reao.
Fatores: temperatura e catalisador
Nveis: T
T=40
40 e 60 (dois nveis); catal. A e catal. B (dois nveis).
Resposta: Rendimento

Planejamento fatorial 22
Matriz de planejamento

Resultado do planejamento fatorial 22 para estudar o efeito da


temperatura e do catalisador sobre o rendimento de uma reao
Exp.

Temperatura

Catalisador

Rendimento (%)

Mdia (%)

40

57

61

59

60

92

88

90

40

55

53

54

60

66

70

68

Planejamento fatorial 22
Clculo dos efeitos principais dos fatores sobre a resposta
(rendimento)
a.

Efeito principal da temperatura (T) por definio a mdia dos


efeitos da temperatura nos dois nveis do catalisador.

T = y + y-

y 2 + y 4 ) ( y1 + y3 ) ( 90 + 68 ) ( 59 + 54 )
(
=

= 22.5%
2

Interpretao: o rendimento da reao aumenta 22,5% quando a temperatura


passa do seu nvel inferior (40 0C) para seu nvel superior (600 C).

Planejamento fatorial 22

b.

Efeito principal do catalizador (C) sobre a resposta por definio a


mdia dos efeitos do catalisador nos dois nveis da temperatura.

C = y + y-

y 4 + y3 ) ( y 2 + y1 ) ( 68 + 54 ) ( 90 + 59 )
(
=

= 13,5%
2

Interpretao: o rendimento da reao diminui em mdia 13,5% quando


trocamos o catalisador A pelo catalisador B.

Planejamento fatorial 22

Efeito da interao (TC) entre a temperatura e a


concentrao:

y1 + y4 y2 + y3 59 + 68 90 + 54
TC =

2
2
2
2
TC = 8,5%
8 5%

Planejamento fatorial 22

ESTIMATIVA DO ERRO EXPERIMENTAL


Para que possamos determinar o erro experimental, os ensaios
devem :
i. ser feitos em replicatas. O corrente experimento foi
realizado em duplicata.
ii A
ii.
As repeties
ti devem
d
ser autenticas
t ti
( d as etapas ddos
(todas
ensaios devem ser repetidas rigorosamente).
iii Os ensaios devem ser feitos em ordem aleatria
iii.
(aleatorizao).

Planejamento fatorial 22
ERRO PADRO ((s)) DAS OBSERVAES
Pode ser obtido a partir da varincia das replicatas de cada amostra. Uma
estimativa conjunta ou total da varincia pode ser obtida a partir da
varincia de todas as replicatas, com grau de liberdade apropriado.

Ensaio (i)

Varincia (i)
si2 = ( x j - x )
j

( N - 1)

Grau de liberdade
i = N ireplicatas 1

Planejamento fatorial 22
Varincia conjunta ou varincia total

a mdia ponderada das varincias dos ensaios pelos


respectivos graus de liberdade. uma estimativa conjunta da
varincia a partir de todas as replicas.
2
sConjunta

2
Conjunta

v1 s12 + v 2 s22 + v 3 s32 + v4 s42


=
v1 + v 2 + v 3 + v 4
1 8 + 1 8 + 1 2 + 1 8
=
= 6,5
1+ 1+ 1+ 1

Erro padro das respostas (rendimento da reao)


2
s = sConjunta
= 6,5 = 2,55%

Planejamento fatorial 22

Clculo do erro padro de um efeito ou fator


Cada efeito a combinao linear de quatro valores yi :

y 2 + y 4 ) ( y1 + y 3 ) 1
(
=
= y

1
1
1
T = y+ - y y 4 - y1 - y 3
2 +
2
2
2
2
2
2
y 3 + y 4 ) ( y1 + y 2 ) 1
(
1
1
1
C = y+ - y- =
= y 3 + y 4 - y1 - y 2
2
2
2
2
2
2
y1 + y 4 ) ( y 2 + y 3 ) 1
(
1
1
1
TC =
= y1 + y 4 - y 2 - y 3
2
2
2
2
2
2

Planejamento fatorial 22
Como as mdias dos ensaios se distribuem de maneira independente (repeties
autnticas e ordem aleatria) temos que coeficiente de correlao r(xi,xj) zero.
Alm disso, estamos considerando que as mdias dos ensaisos tem a mesma
varincia populacional das mdias, e a varincia populacional igual a
varincia

global
l b l ou totall (slide
( l d 117).
117)
Varincia da mdia do efeito temperatura T
2
sefeito
= ai2 si2 + 2 ai a j si2 s 2j r ( xi ,x j )


i j >i

=0

2
sefeito
= ai2 s y2i = a12 s y2 1 + a22 s y2 2 + a32 s y2 3 + a42 s y2 4
2
sefeito
= ai2 s y2i = a12 + a22 + a32 + a42 s y2
2
2
2
2

s = ( 1 2 ) + (1 2 ) + ( 1 2 ) + (1 2 ) s y2

1 1 1 1 2
2
sT = + + + s y = s y2
4 4 4 4
2
T

Planejamento fatorial 22
A varincia
i i das
d mdias
di relaciona
l i
com a varincia
i i populacional
l i l atravs

da equao
2

=
2
y

Usando a estimativa s2 no lugar de 2 temos


2
efeito

2
sConjunta

N Re plicatas

6 ,5
=
= 3, 25
2

N o nmero de repeties (dois no nosso caso). O erro padro do efeito


com 2 graus de liberdade

= sT =
sefeito
f

2
sConjunta

6 ,5
=
= 1,80%
2

Planejamento fatorial 22
Erro padro da mdia global
2
sConj

6 .5
s =
=
= 0 ,8125
8
8
2
y

s y = s y2 = 0 ,90%

O nmero 8 porque o rendimento calculado a partir de 8 medidas. A


mdia global tambm uma combinao linear de todas as observaes

Planejamento fatorial 22
Intervalos de confiana para os valores dos efeitos
Com o erro padro podemos construir um intervalo de confiana para
os valores dos efeitos, usando a distribuio de student:

t sefeito < < + t sefeito ou = t sefeito


= valor
l reall de
d um efeito
f

= valor
l estimado
d dde um efeito
f

onde
2
efeito

2
sConjunta

N Re plicatas

sefeito =

2
sConjunta

N Re plicatas

sConjunta
N Re plicatas

Planejamento fatorial 22

Se

> t sefeito

Ento, no existe possibilidade de ser igual a zero. Neste caso o valor


calculado para o efeito do fator ser estatisticamente significativo no grau
f usado para
p
obter t .
de confiana

Se

< t sefeito

Ento, existe possibilidade de ser igual a zero. Neste caso o valor


calculado para o efeito do fator ser estatisticamente insignificante.
insignificante

Planejamento fatorial 22

Interpretao
Mdia Global

67 , 75 0 ,9%

Efeito principal da
temperatura: T
Efeito
f
principall do
d
Catalisador: C

22 ,5 1,8%

Efeito da interao TC

13,5 1,8%
8,5 1,88%
%

t4 sefeito = 2,776 1,8% = 5,0%


estatisticamente significante, com 95% de confiana, um efeito
cujo valor absoluto for superior a 5,0% . Neste caso, o intervalo no
incluir
l o valor
l zero. Observando
Ob
d a tabela
b l anterior, vemos que todos
d
so significativos.

Planejamento fatorial 22

+14
54

68

-5

-22

59

90
+31

40

60

Planejamento fatorial 22

ALGORITMO PARA O CLCULO DOS EFEITOS


1
1.

Escrever a matriz de planejamento,


planejamento substituindo os valores nmeros
pelos sinais algbricos de nveis equivalentes:

T
40
60

40

60

T C

A +
=
B

B +

ALGORITMO PARA O CLCULO DOS EFEITOS

2.

Incluir uma coluna com sinais positivos, relativo mdia e outra


coluna cujos sinais so os produtos de T e C.

M T C TC
+
+

+
=X
+

+ + +

X uma matriz chamada de tabela de coeficiente de contraste.

ALGORITMO PARA O CLCULO DOS EFEITOS

3.

Incluir a unidade em cada linha de X, para que possamos usar


o MATLAB/OCTAVE

+1
+1

+1

+1

1
+1
1
+1

C TC
1
1
+1
+1

+1

1
1

+1

ALGORITMO PARA O CLCULO DOS EFEITOS


4.

Cada efeito calculado como o produto escalar entre o referente


vetor coluna de X e o vetor das respostas (y) e dividindo o
resultado pelo nmero adequado ( no caso de um planejamento 22
dividir por 2 para calcular os efeitos e por 4 para calcular a
mdia).
1
1
XC =
+1

+1

59
90
y=
54

68

59
90
1
1 t
1
t
C = k 1 X C y = X C y = [ 1 1 +1 +1] = 13,50
54
2
2
2

68

ALGORITMO PARA O CLCULO DOS EFEITOS

Generalizando para outros planejamentos de 2 nveis


1 t
Clculo dos efeitos : E = k 1 X E y
2
1 t
Clculo da mdia : M = k X M
y,
2
onde k o nmero de fatores.

ALGORITMO PARA O CLCULO DOS EFEITOS

Calculando a mdia e todos os efeitos conjuntamente


+1 +1 +1 +1 59 271
1 +1 1 +1 90 45
=

X tY =
1 1 +1 +1 54 27

+
1

1
+
1
68

17

M 271 4 67 , 75
T 45 2 22 ,5
=
=

C 27 2 13,5

TC 17 2 8,5

ALGORITMO PARA O CLCULO DOS EFEITOS


5. Construo do modelo emprico
M
+1
+1
X=
+1

+1

C TC

1 1 +1
+1 1 1
1 +1 1

+1 +1 +1

b0

1
b= y=
b2

12

59
90
54

68
67.75
11.25

X b = y X-1 X b = X -1 y b = X-1 y =
-6.75
6 75

-4.25

y ( T,
T C ) = b0 + b1T + b2 C + b12 TC
y ( T, C ) = 67 ,75 + 11, 25T - 6, 75C - 4, 25TC

Grfico:

[T, C] = meshgrid ( 1 : 0.1 : 1, 1 : 0.1 : 1)


Z = 67.75 + 11.255* T - 6.75*C
6.75 C - 4.25*T
. 5 *C
C
mesh (T ,C,Z )
grid on;; xlabel (' Temperatura'
g
p
) ; yylabel (' Catalisador' ) ;
zlabel (' Re d .%' ) ; title (' Planejamento fatorial' )

Resumo do algoritmo para estimar o erro padro dos efeitos

1- Varincia de cada ensaio ( replicatas ) : s = ( x j - x )


2
i

( N - 1)

2
2- Varincia conjunta ou total: stotal

2
i i
i

2
3- Varincia dos efeitos: sefeito
=

1 NE 2
2( k 1) stotal
NR 2

2
4- Erro padro dos efeitos: sefeito = sefeito

5 Erro padro da mdia geral: smdia =


5-

2
stotal
NE NR

6- Significncia dos efeitos: calcular t NE sefeito


Se efeito calculado > t NE sefeito

, ento o efeito estatisticamente significativo

Se efeito calculado < t NE sefeito , ento o efeito no estatisticamente significativo


NE=Nmero

de
d experimentos ou ensaios; NR=Nmero

d replicata
de
l
s;
= Grau de liberdade de cada ensaio; x j = Replicata do ensaio; k = Nmero de fatores.

EXERCCIO
Os ddados
O
d abaixo
b i se referem
f
ao tempo de
d pega inicial
i i i l do
d gesso, isto
i ,
o
tempo em que o gesso comea a endurecer depois que o p misturado
com a gua. Os ensaios foram realizados em duplicata e em ordem
aleatria Determine todos os efeitos e seus erros padro,
aleatria.
padro interprete os
resultados e construa um modelo.
Fator 1: Granulometria: 100-150
100 150 mesh (-),
( ) 150
150-200
200 mesh (+)
Fator 2: gua residual: 6,6% (-), 7,5% (+)

i
1
2
3
4

Fator 1

Fator 2

+
+

+
+

xi
12.33 13.00 12.67
10.52
10
52 10.57
10 57 10.55
10 55
10.33 9.75 10.04
9.00 8.92 8.96
Resposta

s2

0.224
0 0013
0.0013
0.168
0.0032

Planejamento fatorial 23
Seja a influncia de trs
t s fatores
fato es sobre
sob e o rendimento
endimento da reao
eao conforme
confo me
indicado na tabela abaixo.

Fatores

(-)

(+)

Fator 1 -Temperatura (oC)

40

60

Fator 2 - Catalisador (Tipo)

Fator 3 Conc. de um reagente (M)

1,0

1,5

Ensaio
1
2
3
4
5
6
7
8

1
+
+
+
+

2
+
+
+
+

3
+
+
+
+

Rendimento (%)
56
52
85
88
49
47
64
62
65
61
92
95
57
60
70
74

Mdia
54,0
86,5
48 0
48,0
63,0
63,0
93 5
93,5
58,5
72,0

Planejamento fatorial 23
Num planejamento fatorial completo, quantos experimentos ou ensaios
precisamos fazer?

Nmeros de experimentos

Mdia
+
+
+
+
+
+
+
+

1
+
+
+
+

2
+
+
+
+

3
+
+
+
+

= 23 = 8

12
+
+
+
+

13
+
+
+
+

23
+
+
+
+

123
+
+
+
+

y
54.0
86.5
48.0
63 0
63.0
63.0
93.5
58 5
58.5
72.0

Planejamento fatorial 23

M 1

X=

12 13 23 123

1 -1 -1 -1 1 1 1 -1
1 1 -11 -11 -1
1 -1
1 1 1
1 -1 1 -1 -1 1 -1 1

1 1 1 -11 1 -11 -11 -1


1
1 -1 -1 1 1 -1 -1 1

1 1 -1
1 1 -1
1 1 -11 -1
1
1 -1 1 1 -1 -1 1 -1

1 1 1 1 1 1 1 1

y=

54.0
86 5
86.5
48.0

63 0
63.0
63.0

93 5
93.5
58.5

72 0
72.0

Planejamento fatorial 23
Cl l dos
Clculo
d efeitos
f
principais e da
d mdia
d gerall
1 t
XE y
k 1
2
1 t
Mdia : M = k X M
y,
2
Efeitos : E =

XT * y =

538.5000
91.5000
-55.5000

35.5000

-34
34.5000
5000

-3.5000
3.5000

0.5000

onde k o nmero de fatores.

538.5000 8 M 67,31
91.5000 4 1 22,88
-55.5000 4 2 -13,88

35.5000 4 3 8,88

-88,63
-34
34.5000
5000 4
12
63

-3.5000 4 13 -0,88
3.5000 4 23 0,88

0.5000 4 123 -0,13

Planejamento fatorial 23
Estimativa dos erros dos efeitos e da mdia
1- Varincia Conjunta ou total:

2
total

NE

= s
i=1

2
i i

NE

i=1

18 +1 4,5 +1 2 +1 2 +18 +1 4,5 +1 4,5 +18


= 5, 2
1+1+1+1+1+1+1+1
1 NE 2
1 1
2
2- Varincia dos efeitos: sefeito =

s
=
5, 2 = 1, 30%
2( k 1) total
NR 2
2 2

2
stotal
=

3- Erro padro dos efeitos:

2
sefeito
= sefeito
= 1,30 = 1,14%
f
f

2
stotal
5,2
4- Erro padro da mdia geral: smdia =
=
= 0, 57%
8 2
NE NR
5- Significncia dos efeitos: t NE sefeito = t8 sefeito = 2 , 306 1,14 = 2, 63 ( 95% de confiana )

Se efeito calculado >


S efeito calculado <
Se

2, 63% , ento o efeito estatisticamente significativo


2, 63% , ento o efeito no estatisticamente significativo

Planejamento fatorial 23
Resumo
Mdia
Ef it principais
Efeitos
i i i
1 (Temperatura)
2 ((Catalisador))
3 (Concentrao)
Interaes
12
13
23
123

63,30,57
22,91,14
-13,91,14
,
,
8,91,14
-8,61,14
8 61 14
-0,91,14
0,91,14
0,11,14

Os valores em vermelho no so estatisticamente significativos,


significativos pois so menores do
que 2,63%.

Planejamento fatorial 23
CONSTRUO DO MODELO ESTATISTICO

y ( x1 ,x2 ,x3 ) = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2 + b13 x1 x3 + b23 x1 x2 + b123 x1 x2 x3 + ( x1 ,x2 ,x3 )

b0
b
1
b2

b3

1
b= X y =

b12

b13
b
23
b123

67.3
11.4
-6.9

4.4
-4.3
43

-0.4
0.4

0.1

Os coeficientes b13, b23 e b123


no so significantes e podem
ser omitidos.

y ( x1 ,x2 ,x3 ) = 67 ,3 + 11, 4 x1 6,9 x2 + 4, 4 x3 4,3 x1 x2

Planejamento fatorial 23
A tabela abaixo most
mostraa o rendimento
endimento da reao
eao de sntese do polipirrol
polipi ol
em uma matriz de EPDM. Foram estudados trs fatores: o tempo de reao
(t), a concentrao de oxidante (C) e o tamanho da partcula (P). A resposta
observada foi o rendimento da reao.
Calcule os valores dos efeitos e seus erros padro, usando os dados a
seguir, mas antes examine cuidadosamente o conjunto de valores, levando em
conta os sinais da matriz de planejamento.
possvel
l antecipar quall ser a varivel
l com maior influncia
fl
no
rendimento?
Ensaio
1
2
3
4
5
6
7
8

t
+
+
+
+

C
+
+
+
+

P
+
+
+
+

Rendimento %
4.39
4.73
6.21
5.75
14.51
.5
13.45
3. 5
19.57 21.11
2.09
1.93
3.15
3.39
11.77 12.69
19.40 17.98

yi
4.56
5.98
13.98
3.98
20.34
2.01
3.27
12.23
18.69

si2

0.058
0.106
0.562
0.56
1.186
0.013
0.029
0.423
1.008

Planejamento fatorial 24
No experimento anterior vamos incluir um quarto fator, i.e., o PH da
mistura reacional. Neste caso, devemos fazer um planejamento fatorial de
dois nveis e quatro fatores.

Fatores
F
t
1. Temperatura ( 0C)
2. Catalisador (tipo)
3 Concentrao (M)
3.
4. pH

((-))
40
A
10
1,0
7,0

(+)
60
B
15
1,5
6,0

Planejamento fatorial 24
Nmero de ensaios: 2.2.2.2
2 2 2 2=16
16
Ensaio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

1
+
+
+
+
+
+
+
+

2
+
+
+
+
+
+
+
+

3
+
+
+
+
+
+
+
+

4
+
+
+
+
+
+
+
+

Resposta y
54
85
49
62
64
94
56
70
52
87
49
9
64
64
94
58
73

Planejamento fatorial 24
M
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+

1
+
+
+
+
+
+
+
+

2
+
+
+
+
+
+
+
+

3
+
+
+
+
+
+
+
+

4
+
+
+
+
+
+
+
+

12 13 14 23 24 34 123 124
+ + + + + + - + + + + +
- + + - + + +
+ - + + - + - + - + - + - + - +
- + + - +
+ + - + - + + + - + - +
- + + - + - + - + - + + - + - + - +
+ - + + +
- + + - + - + + + + + + + + + + +

134
+
+
+
+
+
+
+
+

234 1234
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+

y
54
85
49
62
64
94
56
70
52
87
49
6
64
64
94
58
73

Planejamento fatorial 24
M
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-11
1

2
-1
-1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1

3
-1
-1
1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1

4
-1
-1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1

12
1
-11
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-11
1

13
1
-1
1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1

14
1
-1
1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
1

23
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1

24
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
-1
-1
1
1

34
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1

123
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
1

124
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
1

134
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
1

234 1234
-1
1
-1
1
-1
1
1
-1
1
1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
-1
1
-1
-1
1
-1
1
1
1

y
54
85
49
62
64
94
56
70
52
87
49
64
64
94
58
73

Planejamento fatorial 24
M
1


12


13


14


23 =


24


34


123


124


134


234
1234

67.1875
22.8750
-14.1250

8.8750
0.8750

-8.6250
-0.6250

0.8750
-0.6250

0.8750

0.3750
0.8750

-0.1250
-0.6250

0.3750
0.3750

Como os ensaios no foram feitos em duplicatas,


duplicatas temos que usar
uma outra maneira para determinar o erro experimental.
Consideraremos significativos os EFEITOS PRINCIPAIS e as
INTERAES DE DOIS FATORES. As interaes de trs e
quatro fatores sero consideras como erros ou rudos.
Varincia dos efeitos e erro padro dos efeitos e da mdia:

( 0,875) + ( 0,125) + ( 0, 625) + ( 0,375 ) + ( 0,375)


=
2

2
efeito

= 0, 291

2
= 0,54
sefeito = sefeito

smdia =

2
stotal
0,54
=
= 0,184
NE NR
16 1

Estimativa da significncia dos efeitos principais e das


interaes com 5 graus de liberdade * e 95% de confiana:

t 5sefeito = 22, 571 0,


0 54 = 1,
1 39
*Usamos 5 valores para calcular sefeito

MODELO ESTATSTICO
b 0
b
1
b 2


b
3
b
4
b12
b
13
b14

=
b
23
b
24
b 34
b
123
b124


b
134


b 234


b
1234

67.1875
11.4375
-7.0625

4.4375
0.4375

-4.3125
b 0
-0.3125

b1

0.4375
b 2 =

-0.3125
b 3
0.4375
b12
0.1875
0.4375

-0.0625
-0.3125

0.1875
0.1875

67.1875
11.4375
-7.0625

4.4375
-4.3125
4 312

y = 67.1875+11.4375T-7.0625Catal +4.4375Conc.-4.3125T Catal

EXERCCIO
Deseja-se estudar
D
d os ffatores que influenciam
fl
a funo
f de
d onda
d no
clculo da freqncia de estiramento do C-H na molcula de CH3F.
Os ffatores escolhidos foram:
f
Fatores

6-31G

6-311G

2 Funes de polarizao

Ausentes

Presentes

3 Funes difusas

Ausentes

Presentes

H
Hartre-Fock
F k

MP2

1 Conjuto de base

4 Correlao
C
l eletrnica
l i

PLANEJAMENTO FATORIAL 24
Ensaio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

1
+
+
+
+
+
+
+
+

2
+
+
+
+
+
+
+
+

3
+
+
+
+
+
+
+
+

4
+
+
+
+
+
+
+
+

Resposta
3245,6
3212 4
3212,4
3203,5
3190,3
3251,7
,
3209,4
3214,9
3193,5
3096,2
3049,3
3132,8
3087 6
3087,6
3105,0
3050,4
3143 5
3143,5
3093,5

PLANEJAMENTO FATORIAL FRACIONRIO


Tem como objetivo selecionar as variveis mais importantes em
determinado processo com um custo mnimo.

FRAO MEIA
Num planejamento fracionrio meia s realizamos metade dos
ensaios que faramos se fizssemos um planejamento fatorial
completo.
l
Com
C isto, economizamos tempo e dinheiro
d h
para
fazermos um pr-seleo dos fatores mais importantes.

EXEMPLO
Um pesquisador deseja otimizar um procedimento analtico para determinar
traos de Mo em plantas. O mtodo escolhido foi a ao cataltica do Mo(IV)
sobre a oxidao do on iodeto pelo H2O2. De todos fatores importantes para
o sinal analtico foram escolhidos pelo pesquisador as concentraes da
H2O2, H2SO4, KI em mols/dm3 e o tempo de reao destas espcies:

Fator

(-)

(+)

[H2SO4]

0 016
0,016

0 32
0,32

[KI]

0,015

0,030

[H2O2]

0 0020
0,0020

0 0040
0,0040

Tempo (s)

90

130

Resultado do planejamento fatorial 24 completo para estudar a


ao cataltica do Mo(IV)
Mo(IV).
Ensaio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

1
+
+
+
+
+
+
+
+

2
+
+
+
+
+
+
+
+

3
+
+
+
+
+
+
+
+

4
+
+
+
+
+
+
+
+

Resp*.
52
61
124
113
85
66
185
192
98
86
201
194
122
139
289
286

M
1


3
4


12
13


14
23 =


24


34


123


124
134


234
1234

143.3125
-2.3750
109 3750
109.3750

54.3750
67 1250
67.1250

-1.1250
2.8750

1.1250
25.6250

21.8750

9.8750
2 6250
2.6

-2.6250
5.3750

0.1250
-8.8750

Observa-se que apenas os fatores


Ob
f
2 3
2,
e 4 e as interaes 23 e 24 so
realmente importantes
p
.

Como construir um planejamento fatorial meia, denotado por 24-1?


Procedimento
1.Construir um planejamento completo para os fatores 1, 2 e 3;
2.Atribuir ao fator 4 o produto dos sinais das colunas 1, 2 e 3.
Ensaio M
1
+
2
+
3
+
4
+
5
+
6
+
7
+
8
+

1
+
+
+
+

2
+
+
+
+

3
+
+
+
+

4
+
+
+
+

12
+
+
+
+

13
+
+
+
+

14
+
+
+
+

23
+
+
+
+

24
+
+
+
+

34
+
+
+
+

Resp*.
52
86
201
113
122
66
185
286

M
l
1
l2

l3
l
4
l12 =
l
13
l14

l23
l
24
l34

138.8750
138
8750
-2.2500
114 7500
114.7500

51.7500
69.7500

8.7500
24.7500

26.7500
26.7500

24.7500

8.7500

M
1


12


13


14
23 =


24


34


123


124
134


234
1234

143.3125
-2.3750
109.3750

54.3750
67.1250

-1.1250
2.8750

1.1250
25.6250

21.8750

9.8750
2.6250

-2.6250
5.3750

0.1250
-8.8750

Observe que

l12 = l34
l13 = l24
l14 = l23
No podemos medir
essas interaes com
um planejamento meia,
pois esto confundidas.

Vamos representar a coluna de sinais por nmeros, por exemplo,


1 representa a coluna
l
de
d sinais
i i do
d fator
f
1 A notao
1.
123
representa a coluna de sinais obtida pela multiplicao das
colunas correspondentes
p
aos trs primeiros
p
fatores.
f
Assim,
4=123
Propriedades:
Identidade: 11=22=33=44=I;
Associatividade:
A
i i id d 123=(12)3=1(23)=(23)1=2(31)=
123 (12)3 1(23) (23)1 2(31)
A relao 4=123 ou I=1234 chamada de geratriz ou relao
geradora. Com essas relaes podemos prever quais contrastes
estaro confundidos:

Relaes entre os contrastes da meia frao 24-1 e os


efeitos
f i do
d fatorial
f
i l completo
l 24. M a media
di de
d todas
d as
respostas.
1=234

l1=l234 1+234

2=134

l2=l134 2+134

3=124

l3=l124 3+124

4=123

l4=l123 4+123

12=34

l12=ll34 12+34

13=24

l13=l24 13+24

14 23
14=23

l14=ll23 14+23

I=1234

lI M+(1/2)1234

A notao l12=l34 12+34 enfatiza o fato que o contraste l12


estima
i a soma dos
d efeitos
f i dos
d fatores
f
12 e 34. No
N nosso exemplo
l
temos que:
12=-1,13
34=9,88
12+34=-1,13+9,88=8,75= l12=l34 =8,75

A RESOLUO
de um planejamento fatorial fracionrio igual
ao nmero de fatores usados na menor relao geradora. No
exemplo
p acima,, o ffatorial de resoluo
IV,, pois
p I=1234

4-1
IV

Planejamento fatorial meia de resoluo IV.

Exerccio para ser entregue na prxima aula


O quadro abaixo mostra uma tentativa de otimizar uma reao orgnica.
Analise esse planejamento fatorial meia e interprete os resultados.
resultados Quais
contrastes esto confundidos?

1
2
3
4
Ensaio
1
2
3
4
5
6
7
8

Fator
Temperatura
Base
Solvente
Catalisador
M
+
+
+
+
+
+
+
+

1
+
+
+
+

()
(-)
Ambiente
K2CO3/NaOH
CH2Cl2
Nenhum
2
+
+
+
+

3
+
+
+
+

( )
(+)
Refluxo
K2CO3
CH3CN
TEBA
4
+
+
+
+

Rendimento
0
70
65
0
100
85
50
95

RELATIVO AO EXERCCIO ANTERIOR, RESPONDA:

1. Qual a relao geradora?


2. Quais contrastes de dois fatores esto confundidos?
3. Quais contrastes de trs fatores esto confundidos?
4. Os efeitos principais esto confundidos com quem?
5 Que concluses voc tira desses resultados?
5.

5-2
III

PLANEJAMENTO FATORIAL FRACIONRIO DE FRAO QUARTA

Anlise de uma frao 25-2


para o estudo da resposta cataltica do Mo(VI).
III
Fator

(-)

(+)

[H2SO4]

0,016

0,32

[KI]

0,015

0,030

[H2O2]

0,0020

0,0040

Tempo (s)

90

130

Fluxo (ml/min)

1,2

3,0

MATRIZ DE CONTRASTES
Ensaio
1
2
3
4
5
6
7
8

M
+
+
+
+
+
+
+
+

1
+
+
+
+

2
+
+
+
+

3
+
+
+
+

4
+
+
+
+

5
+
+
+
+

Relaes geradoras
4=123 e 5=12 ou I=1234 e I=125
Resoluo 3, pois a menor relao geradora tem 3 fatores.

Resposta
52
92
198
113
122
76
189
286

MODELOS EMPRICOS
So modelos ((equaes)
q ) qque relacionam os ffatores com as
respostas. Os modelos construdos anteriormente foram
feitos considerando apenas dois nveis das variveis.
variveis
Embora, levassem em considerao a interao entre as
variveis,
i i o modelo
d l que considera
id
apenas dois
d i nveis
i pode
d
no descrever bem a situao. Os modelos que criaremos
agora levaro em conta uma quantidade maior de pontos.

Como exemplo vamos modelar a variao do rendimento da


reao em funo da temperatura, na faixa 40 600 C, com o
catalisador A .
Temperatura (0 C)

40

45

50

55

60

Rendimento (%)

60

70

77

86

91

O primeiro passo fazer um grfico dos dados para ver qual


tipo de grfico se ajusta aos dados.

Rendimento da reao em funo da temperatura


Comandos do Matlab/octave
>> plot(x,y,*')

Os dados do grfico se ajustam a uma equao linear, onde cada ponto dado
por

y1 = b0 + b1T1 + 1
y 2 = b0 + b1T2 + 2
#

y n = b0 + b1Tn + n
Em notao matricial, temos

y1 1
y 1
2
y3 = 1

y
4 1
y5 1

T1
1

T2
2

b0
T3 + 3 y = T b +
b1
T4
4
5
T5

O mtodo mais utilizado para fazer o ajuste o mtodo dos mnimos quadrados
que minimiza os erros. Isso pode ser feito do seguinte modo:

yi = b0 + b1Ti

e = ( y y ) = ( y b b T )
( e )
= 2 ( y b b T ) = 0
b
2

2
i

1 i

2
i

( e

2
i

b1

) = 2

1 i

T ( y b
i

b1Ti ) = 0

nb0 + b1 Ti = yi

2
b
T
+
b
T
0 i 1 i = Ti yi
Isolando b0 na primeira equao e substituindo na segunda,
temos

yi b1 Ti

= y b1T
b0 =
n

Ti yi

Ti yi n
b1 =
2

Ti )
(

Ti

O sistema abaixo pode ser escrito sob a forma de matriz:

nbb0 + b1 Ti = yi

2
+
b
T
b
T
0 i 1 i = Ti yi
n

Ti

T b = y

T b T y
i
2

Observe que, se

n
TT=
Ti
t

ento,

1 T1
T = # #
1 Tn

T
T
i
2

Tt T b = Tt y

ento

yi
Ty=

y
T
i i
t

No nosso caso, temos que

y1
y
2
y = y3

y4
y5
A equao

1
1

T = 1

1
1

T1
T2
T3

T4
T5

y = b0 + b1T +

y = Tb +

b0
b=
b1

em notao matricial

Para
a a encont
encontrarmos
a mos a equao de regresso
eg esso devemos encontrar
encont a o vetor
veto de
regresso b:

Tb = y
T Tb = T y
t

(T T)
t

-1

t
T
T

b
=
T
T
T
( ) ( ) y
t

I b = (T T) T y
-1

b = (T T) T y
t

-1

-1

Usando este procedimento no nosso exemplo

y=

60

70
77

86
91

T=

1 40
1 45
-1.2000
1 50 b =

1.5600
1 55
1 60

A equao de regresso

y i = 1,
1 200 + 11,560
560Ti

Clculo dos valores estimados

y i = 1, 200 + 1,560Ti

y = T b

y = T b =

1 40
61.2000

1 45
69.0000

-1.2000
= 76.8000
1 50

1.5600

1 55
84 6000
84.6000
92.4000
1 60

Clculo dos resduos e

61.2000
2000
60 61
70 69.0000


e = y y = 77 76.8000 =


84.6000
6000
86 84
91 92.4000

-1.2000
1 2000

1.0000
0.2000

11.4000
4000
-1.4000

Reta ajustada por mnimos quadrados aos dados do slide 166

O grfico dos erros mostra que os erros se distribuem


aleatoriamente,
l
i
o que justifica
j ifi o ajuste
j
linear.
li

EXERCCIO
As matrizes abaixo referem-se a um experimento feito
para se construir um curva de calibrao.
calibrao O vetor c o
vetor das concentraes e o vetor A a absorbncias.
Ajuste um modelo linear a estes dados.
c= [0.5 0.5 1.0 1.0 1.5 1.5 2.0 2.0 2.5 2.5 3.0 3.0]
A= [0.0937 0.0916 0.1828 0.1865 0.2782 0.2732
0.3776 0.3702 0.4562 0.4505 0.5593 0.5499]

Anlise de varincia do modelo emprico


Inicialmente observe que

( y y )( y y ) = 0
i =1

Prova:

1
1
nb0 + b1 Ti = yi b0 = yi b1 Ti = y b1T
n
n
como y i = b0 + b1Ti , temos
yi = y b1T + b1Ti = y + b1 (Ti T ) yi = y + b1 (Ti T )
n

Usando este resultado em

( y y )( y y ), temos
i =1

( y + b (T T ) y ) ( y y ) = b (T T ) e
n

i =1

i =1

=0

Anlise de varincia do modelo emprico


A anlise de varincia do modelo tem como objetivo avaliar a qualidade do
modelo. O modelo considerado bom quando os resduos so pequenos.

( yi y ) = ( yi y ) + ( yi yi )
2
2

y
=
y

y
+
y

( i ) ( i ) ( i i )

( yi y )

= ( yi y ) + 2 ( yi y )( yi yi ) + ( yi yi )


=0

( yi y )

= ( yi y ) + ( yi yi )
2

[ S .Q. em torno da mdia ] = [ S .Q. devida regresso ] + [ S .Q. residual ]


[ SQT ] = [ SQR ] + [ SQr ]

A equao

[ SQT ] = [ SQR ] + [ SQr ]

mostra que a variao total em torno da mdia tem duas partes: uma parte
devida a equao de regresso e a outra devida aos resduos. Quanto maior
for a frao descrita pela regresso menor ser os resduos e melhor ser o
ajuste do modelo. Dividindo a equao anterior por SQT podemos obter um
mtodo para quantificar o modelo:

SQT ] [ SQR ] [ SQr ]


[
=
+
[ SQT ] = [ SQR ] + [ SQr ]
[ SQT ] [ SQT ] [ SQT ]
2
2
2
( yi y ) ( yi yi )
( yi yi )

2
1=
+
1= R +
2
2
2
( yi y ) ( yi y )
( yi y )

R2 chamado de coeficiente de determinao do modelo. O valor mximo de


R2 1 e significa que o modelo de regresso descreve completamente a
variao total dos dados em torno da mdia.

R2 =

( yi y )

( yi y )

2
2

Quanto mais prximo de 1 for o valor de R2 melhor ser o


modelo de ajuste.

Cada soma quadrtica est associada a um certo grau de


lib d d
liberdade.
Grau de liberdade da SQT: (n-1), onde n representa o nmero
de observaes.

Justificativa:

1 n
1 n
1 n
1
1
( yi y ) = yi y = nyy nyy = 0

n i
n i
n i
n
n

Esta equao consome um grau de liberdade.

Grau de liberdade da SQR: (p-1), onde p representa o nmero


de parmetros da equao de regresso.
regresso

Justificativa:

yi = b0 + b1 X i . Como b0 = y b1 X , temos
yi = y - b1 X + b1 X i
yi = y +b1 ( X i X )
yi - y = b1 ( X i X )
Elevando ao quadrado e somando sobre todas as observaes,
temos

( y - y )
i

2
1

=b

( X

X)

( X

O somatrio

X)

est fixado a priori pela matriz de planejamento. Logo, o valor de

( y - y )

fica completamente determinado pelo valor de b1, que depende das respostas
obtidas experimentalmente
experimentalmente.
Generalizando, o grau de liberdade da soma quadrtica devido regresso
igual ao nmero de parmetros (no nosso caso dois: b0 e b1) menos um: VR=p-1.
O grau de liberdade da soma quadrtica residual

Total = Regresso + residual

( n 1) = ( p 1) + r
r = n p

Resumindo

T = n 1

R = p 1

r = n p

MDIAS QUADRTICAS

As mdias quadrticas so obtidas dividindo as somas quadrticas pelos


respectivos graus de liberdades.
liberdades
Fonte de
variao

Soma quadrtica

Regresso

( y - y )

p 1

n p

Resduo

( yi - yi )

Total

( y - y )
i

Nm. de grau
de liberdade

Mdia quadrtica
MQR = SQR
MQr = SQr

n 1

A MQr fornece uma estimativa para a varincia.

( p 1)
( n p ) = s2

ANOVA para o nosso exemplo


Fonte de
variao
Regresso
Resduo
T t l
Total

Soma
Quadrtica
608,4
6,4
614 8
614,8

Grau de
liberdade
1
3
4

Coef de determinao do modelo:


Coef.

R2 =

Mdia
Quadrtica
608,4
2,3

SQR 608, 4
=
= 0,9896
SQT 614,8

Significa que 98,96% da variao total em torno da mdia explicada pela


regresso,
ficando
fi d apenas 1,04%
1 04% para os resduos.
d
A mdia quadrtica residual, MQr , uma boa estimativa da varincia dos
pontos em torno da equao de regresso. No nosso exemplo, temos

MQr = s 2 = 2,13

CLCULO DAS ESTIMATIVAS DAS INCERTEZAS DOS PARMETROS

Se os erros forem aleatrios, ento

i N ( 0, 2 )

Definio da matriz de covarincia de b0 e b1

Cov ( b0 , b1 )
Var ( b0 )
Var ( b ) =

Var ( b1 )
Cov ( b0 , b1 )

A matriz de covarincia de b0 e b1 pode ser calculada como


segue:

Var ( b ) = ( X X ) s
t

No nosso exemplo, temos

0, 2 0, 2
3
10,
21,, 73 0, 43
Var ( b ) =
2,13 =

0,
2
0,
004
0,
43
0,
00852

Var ( b0 ) 4, 66
=
erro padro ( b ) =

0,
,
0923
Var ( b )

INTERVALO DE CONFIANA PARA OS PARMETROS DA


EQUAO DE REGRESSO

Os intervalos de confiana para os parmetros so definidos como


segue:

a) b0 tn p ( erro padro de b0 )
b) b1 tn p ( erro padro de b1 )
No nosso exemplo, temos:

a) b0 tn p sb0 = 1, 2 3,182 4, 665 ou ( 16, 044;13, 644 )


, 3,182
,
; ,
b) b1 tn p sb1 = 1,56
0,, 0923 ou (1,, 266;1,854
)
Em a)) o intervalo de confiana
f contm o valor zero. Como nenhum valor
dentro do intervalo mais provvel do que outro, ento existe, no nvel de
confiana de 95% , a probabilidade de que b0 seja 0 e podemos descart-lo.

Significncia estatstica da regresso


Quando
Q
d os coeficientes
fi i
d equao
da
de
d regresso
forem
f
i
iguais
i a zero, ento

no existe relao entre X e y. Neste caso, a razo MQR/MQr segue a


distribuio F. Logo, podemos testar a significncia estatstica de uma
equao de regresso usando o teste F , i.e.,
ie

MQR
Fp 1,1 n p
MQr
Se

MSQ
QR
> Fp 1, n p ,
MSQr

ento a equao estatisticamente


significativa.

No nosso exemplo, temos

MQR 608, 4
=
= 285, 6 > 10,13 = F1,3
MQr
22,13
13
Portanto, nossa equao estatisticamente significativa. Nem todo equao
estatsticamente significativa boa para predio.

Exerccio
Construa um modelo emprico para os dados da tabela abaixo.

T
Temp.
(0 C) 30

35

40 45 50 55

60

65

70

Rend. (%)

40

60 70 77 86

91

86

84

24

Grficos dos dados

Exerccio
Vamos tentar
tenta uma regresso
eg esso linear
linea da fo
forma
ma y = b0 + b1T

-7,333
b = inv(T * T)* T * R =

1,520
,

yi = 7,333 + 1,520Ti
Fonte de
F
d
variao

Soma quadrtica

Regresso

3465,6

(p-1)=1
(p
1) 1

SQR/(p
/(p-1)
1) = 3465,6

Resduo

832,4

(n-p) = 7

SQr/(n-p) = 118,9

Total

4298,0

(n-1) = 8

Nm. dde grau


N
Mdia quadrtica (MQ)
de liberdade

R 2 = SQR SQT = 3465.6


3465 6 / 4298.0
4298 0 = 0.8063
0 8063
SQR SQr = 3465.6 /118.9 = 29.14 > F1,7 = 5,59

O grfico dos resduos no mostra uma distribuio normal

Embora o teste F mostra que a equao de regresso estatsticamente


significativa e tem R2=0.80, o grfico dos resduos mostra que os resduos
tm um distribuio no aleatria. Neste caso, devemos tentar um outro
ajuste de curva, como por exemplo uma curva de segundo grau do tipo

yi = b0 + b1Ti + b2Ti

SUPERFCIE DE RESPOSTA

A superfcie de resposta uma tcnica de otimizao de experimento


baseada em planejamento fatoriais introduzida por G. E. P. Box na dcada
de 50.
A metodologia SUPERFCIE DE RESPOSTA consiste de duas etapas:
1. Modelagem
2. Deslocamento
Exemplo:
Suponhamos que um qumico vem realizando uma reao qumica com 50%
de concentrao de um reagente e com velocidade de agitao de 100 rpm.
Esta reao apresenta rendimento entorno de 68%. Ele j tem conhecimento
qque estes dois ffatores so importantes
p
nesta reao.
No entanto, ele gostaria
g
de saber se possvel escolher outros nveis para estes fatores de tal maneira
que o rendimento pudesse melhorar.

yi = b0 + b1Ti + b2Ti

Modelagem Inicial

Como etapa iinicial,


C
i i l vamos fazer
f
um planejamento
l j
fatorial
f
i l com ponto
central, isto , um planejamento de trs nveis para cada fator:
E i
Ensaio

C (%)

V (rmp)
(
)

x1

x2

y(%)
(%)

45

90

69

55

90

59

45

110

78

55

110

67

50

100

68

50

100

66

50

100

69

Codificao das variveis:

C 50
x1 =
5

V 100
x2 =
10

Representao grfica do planejamento

yi = b0 + b1Ti + b2Ti

Construo do modelo emprico

1 1 1
1 1 1

1 1 1

X = 1 1
1
1 0
0

0
1 0
1 0

69
59

78

y = 67
68

66
69

68 00
68,
1
t
b = ( X X ) X t y = 5, 25
4,
4 25

Construo do modelo emprico

Usando
U
d os trs
valores
l
repetidos
id do
d ponto central,
l podemos
d
fazer
f
uma
estimativa da varincia das observaes:

s 2 = 2,33
2 33
Com essa varincia, podemos fazer uma estimativa da varincia dos
parmetros da equao:

0
0 33
0
0
1 7 0
0,33

( b ) = ( X t X ) s 2 = 0 1 4 0 2,33 = 0
0,58
0
V

0
0
0 1 4
0
0,58
0
58
y = 68,
68 00 0,58
0 58 5,
5 25 0, 76 x1 + 4, 25 0,
0 76 x2

Falta de ajuste e erro puro

Quando
Q
d o experimento
i
feito
f i em replicata,
li
podemos
d
obter
b uma estimativa
i
i
do erro aleatrio e, assim, julgar se o modelo bom ou no.
Definies:

nj

( SQr )i = ( yij yi )

Soma quadrtica dos resduos no nvel i:

Soma quadrtica residual:

nj

SQr = ( SQr )i = ( yij yi )

Os resduos podem ser decompostos em duas parcelas:

(y

ij

y i ) = ( yij yi ) ( y i yi )

yij

so os valores feitos em replicatas no nvel i;

y i

o valor
l predito
dit para o nvel
l i;

yi

representa a mdia do nvel i.

Elevando ao quadrado e somando sobre todos os valores de i e j, temos

nj

( y

ij

nj

y i ) = ( yij yi ) + ( y i yi )
i
j


i
2

No depende do modelo

Soma Quadrtica S.Q. devido S.Q. devida


=
+

residual
id
l
ao
erro
puro
falta
f
lt
de
d
ajuste
j
t

SQr = SQep + SQ faj


Os resduos podem ser decompostos em duas parcelas:

Graus de liberdades:

SQr = SQep + SQ faj

( j foi visto )
g .l. da SQep = ( ni 1) = n m
g .l. da SQr = n p

( n o nm. total de observaes e m o nm. de nveis )


g .l. da SQ faj
f j = n p (n m) = m p

Fonte de variao
Regresso

Resduos

Falta de ajuste

Erro puro

T l
Total

S. Q.
m

ni

ni

SQR = ( yi y )

SQ faj

ni

Mdia Quadrtica

p 1

MQR = SQR p 1

n- p

MQr = SQr n p

m p

MQ faj = SQ faj m p

nm

MQep = SQep n m

SQr = ( yij y i )
m

G.L.

= ( y i yi )
m

ni

SQep = ( yij yi )
m

ni

SQT = ( yij y )

n 1

% de variao explicada: SQ R SQT ; % mxima de variao explicvel : SQT - SQep

n o nmero total de observaes; m o nm. de nveis; p o nm. de parmetros da eq.

SQT

Se

Se

MQ faj
MQep
MQ
Q faj
MQep

e to o modelo
odelo bo
bom..
< Fm p ,n m , ento

> Fm p ,n m , ento o modelo ruim.

Anlise da varincia para o modelo

y = 68 5, 25 x1 + 4, 25 x2

Fonte de variao

Soma Quadrtica

Nm. Grau de Lib.

Mdia Quadrtrica

R
Regresso

182 50
182,50

91 25
91,25

Resduos

5,50

1,38

Falta de ajuste

0,83

0,42

Erro Puro

4,67

2,34

Total

188,00

% de varincia explicada: 97,07


% mxima de variao explicvel: 97,52
Portanto, o modelo est bem ajustado.

Representao grfica

[ x1 ,x2 ] = meshgrid ( 1 : 0.1 : 1, 1 : 0.1 : 1)


z = 68* ones ( 21, 21) 5.25* x1 + 4.25* x2
mesh ( x1 ,x2 ,z ) ; grid on; xlabel (' x1 ' ) ; ylabel (' x2 ' ) ; zlabel (' y (% )' ) ;
title (' Superf . de Resp.' ) ; plot 3 ( x1 ,x2 , y )

Curvas de nveis

[ x1 ,x2 ] = meshgrid ( 1 : 0.1 : 1, 1 : 0.1 : 1)


z = 68* ones ( 21, 21) 5.25* x1 + 4.25* x2
[c,h] = contour ( x1 ,x2 ,z )
, ) ; xlabel (' x1 ' ) ; yylabel (' x2 ' )
clabel ( c,h

Como andar na superfcie na direo de mximo crescimento?

1..
2.

Escolhe
scolhe o coeficiente do fator
fato de maior
maio mdulo (digamos fator
fato i) da
equao usada para construir o modelo;
Determinamos os deslocamentos dos outros fatores j atravs de

x j =
3.

bj
bi

xi

Converta os deslocamentos
d l
codificados
d f d de
d volta
l s
variveis

originais e
determine os novos nveis dos fatores.

Na nossa equao, devemos ter:

y = 68, 00 5, 25 x1 + 4, 25 x2
4, 25
x2 =
x1 = 0,81 x1
5, 25
x2 = 0,81 x1

A nossa equao mostra que o rendimento aumenta quando x1 diminui e x2


aumenta. Portanto, x1 deve ser negativo. Tomando x1 = -1, temos
Etapa

x1

x2

C (%)

V (rpm)

y (%)

Centro

0 00
0,00

50

100 0
100,0

68 66 69
68,66,69

Centro +

-1

0,81

45

108,1

77

Centro + 2

-2

1,62

40

116,2

86

Centro + 3

-3

2,43

35

124,3

88

Centro + 4

-4

3,24

30

132,4

80

Centro + 5

-5

,
4,05

25

140,5
,

70

A descodificao das variveis foram realizadas usando as equaes

C 50
x1 =
C ( % ) =50+5 x1
5
V 100
x2 =
V ( rpm ) = 100 + x2 10
10

Resultados dos ensaios realizados na trajetria de mxima inclinao

A descodificao das variveis foram realizadas usando as equaes

Resultado do novo planejamento 22 com ponto central.


Ensaio

C (%)

V (rmp)

x1

x2

y(%)

30

115

86

40

115

1
1

85

30

135

78

40

135

84

35

125

90

35

125

88

35

125

89

Codificao
f das variveis:

C 50
x1 =
5

V 100
x2 =
10

Modelo linear

y = 85, 71 0, 49 + 1, 25 0, 65 x1 2, 25 0, 65 x2
F
Fonte
d variao
de
i

S
Soma
Q d i
Quadrtica

N Grau
Nm.
G
d Lib
de
Lib.

Mdi Quadrtrica
Mdia
Q d i

Regresso

26,50

13,25

Resduos

70,93

17,73

Falta de ajuste

68,93

34,46

Erro Puro

2,00

1,00

Total

97 42
97,42

% de variao explicada: 27,20


% mxima de variao explicvel: 97,95

MQ faj
MQep

= 34, 46 > 19, 0 = F2,2,

( com 95% de confiana )

Concluso: o modelo linear no descreve satisfatoriamente bem a superfcie

Modelo quadrtico

y = b0 + b1 x1 + b2 x2 + b11 x12 + b22 x22 + b12 x1 x2


Como temos 6 parmetros na nova equao e apenas 5 ensaios, no podemos
determinar os parmetros. A soluo estender o planejamento. Para duas
variveis podemos usar o planejamento em estrela:

Resultado do planejamento em estrela


Ensaio

C (%)

V (rmp)

x1

x2

y(%)

30

115

86

40

115

1
1

85

30

135

78

40

135

84

35

125

90

35

125

88

35

125

89

28

125

21/2

81

35

139

/
21/2

80

10

42

125

21/2

86

11

35

111

2
21/2

87

y = b0 + b1 x1 + b2 x2 + b11 x12 + b22 x22 + b12 x1 x2


1 1
1
1

1 1

1
1
1
0

0
X = 1
1
0

1 2

0
1

2
1
1
0

1
1
1
1
0

1
1
1
1
0

0
0

0
0

1 1

1 1
1 1

1 1
0 0

0 0
0 0

0 0

2 0

0 0
2 0

86
85

78

84
90

y = 88
89

81
80

86

87

Modelo Quadrtico

y = 89 0, 75 + 1,51 0, 46 x1 2,36 0, 46 x2
2,81 0,54 x12 2,81 0,54 x22 + 1, 71 0, 65 x1 x2
F
Fonte
d variao
de
i

S
Soma
Q d i
Quadrtica

N Grau
Nm.
G
d Lib
de
Lib.

Mdi Quadrtrica
Mdia
Q d i

Regresso

144,15

28,83

Resduos

2,76

0,55

Falta de ajuste

0,76

0,25

Erro Puro

2,00

1,00

Total

146 91
146,91

10

% de variao explicada: 98,12


% mxima de variao explicvel: 98,64

MQ faj
MQep

= 0, 25 < 19,16 = F3,2

Concluso: o modelo quadrtico descreve satisfatoriamente bem a superfcie

Grfico da equao

y = 89 + 1,51x1 2,36 x2 2,81x12 2,81x22 + 1, 71x1 x2

[ x1 ,x2 ] = meshgrid ( 2 : 0.1 : 2, 2 : 0.1 : 2 )


z = 89* ones ( 41, 41) + 1,51* x1 2 ,36* x2 2,81* x1 .^ 2 2,81* x2 .^ 2 + 1, 71* x1 .* x2
mesh
h ( x1 ,x2 ,z ) ; grid
id on; xlabel
l b l (' C (% )' ) ; ylabel
l b l (' V ( rpm )' ) ; zlabel
l b l (' y (% )' ) ;

Curvas de nveis

[ x1 ,x2 ] = meshgrid ( 2 : 0.1 : 2, 2 : 0.1 : 2 )


z = 89* ones ( 41, 41) + 1,51* x1 2 ,36 * x2 2,81* x1 .^ 2 2 ,81* x2 .^ 2 + 1, 71* x1 .* x2
[c,h]=contour ( z,20 ) ; clabel ( c,h )

Para obter os valores timos de x1 e x2 devemos calcular o gradiente da


equao:

y = 89 + 1,51x1 2,36 x2 2,81x12 2,81x22 + 1, 71x1 x2


,
5,, 62 x1 + 1,, 71x2 = 1,51

1, 71x1 5, 62 x2 = 2,36
5 62 1,
1 71 x1 1,51
1 51
5,
1, 71 5, 62 x = 2,36

0 1553
x1 = 0,1553

x2 = 0,3727
C 35
x1 =
C ( % ) =35+5 x1 =35+5 0,1553=35.78%
5
V 125
x2 =
V ( rpm ) = 125 + x2 10 121 rpm
10

Exerccio

Você também pode gostar