Escolar Documentos
Profissional Documentos
Cultura Documentos
Campina Grande - PB
Agosto de 2017
Arnete Matias Campos
Campina Grande - PB
Agosto de 2017
Arnete Matias Campos
BANCA EXAMINADORA
Digitado.
Trabalho de Concluso de Curso (Graduao em Estatstica) -
Universidade Estadual da Paraba, Centro de Cincias e
Tecnologia, 2017.
"Orientao: Profa. Dra. Ana Patricia bastos Peixoto,
Departamento de Cincias e Tecnologias".
A DEUS por me dar foras para enfrentar as dificuldades, por sempre me manter
firme nos meus objetivos e tambm por me fazer persistir na realizao deste sonho.
Aos meus pais Antnio e Ramira, as minhas irms Arlete, Maria Jos e Rosngela
por todo carinho, amor e compreenso.
A Carlos Alberto Lucena por todo apoio e incentivo.
A orientadora, Dra. Ana Patricia por toda ajuda, ateno e empenho no desenvol-
vimento desse trabalho.
A Dr. Wellingthon dos Santos meu eterno agradecimento pelas explicaes e
ensinamentos que me ajudaram a entender e desenvolver os assuntos, pela amizade e por
ser a pessoa maravilhosa sempre me tratando com carinho.
Aos professores, Dr. Ricardo Olinda e Ednrio Barbosa por participarem da banca.
A todos os professores do departamento de estatstica da UEPB em especial a Dr.
Tiago Almeida de Oliveira e Dr. Joo Gil de Luna por me ajudarem na realizao desse
trabalho.
A Adrcia Mirely por me ajudar com informaes e materiais e por toda a ateno
me dada.
A todos os meus amigos que conviveram comigo no decorrer do curso, em especial
a Luzidark Maciel e Klaini Clemente por terem me acolhido, em alguns momentos, em
suas casas, meu muito obrigada!
Em fim, a todos que, de alguma forma, contriburam para a realizao deste
trabalho.
O fato de uma opinio ser amplamente compartilhada no nenhuma evidncia de que
no seja completamente absurda; de fato, tendo-se em vista a maioria da humanidade,
mais provvel que uma opinio difundida seja tola do que sensata.
(Bertrand Russell)
Resumo
Em certas ocasies, as restries nos impedem de cruzar todos os nveis de um fator com
todos os nveis do outro fator. Assim sendo, ser necessrio utilizar-se de uma ferramenta
conhecida como disposio hierarquizada. A anlise de varincia hierarquizada obtida
uma extenso da anlise de varincia, onde cada fator dividido em subgrupos destes
fatores. Exclusivamente, estes subgrupos so escolhidos aleatoriamente partir de um
conjunto maior de subgrupos possveis. Para esse trabalho os dados utilizados foram
obtidos da Embrapa Algodo, na safra 2014/2015, com o intuito de investigar se existe
efeito de fornecedores, gentipos e lotes sobre o comprimento, percentagem e resistncia
da fibra do algodo. Os dados so balanceados de um experimento aninhado conhecido
tambm como hierrquico. Foi utilizado o mtodo da anlise de varincia para o modelo
aleatrio, e obtidos tambm as estimativas dos componentes de varincia. Alm disto,
foram feitos estudos para as anlises de resduos. Observou-se que ao cruzar fatores como
por exemplo gentipo e lote, a efetivao de tal cruzamento trs mudanas considerveis
para a proposta do experimento apresentado, j em relao a varivel resistncia da fibra
o fornecedor junto com gentipo e lote no tiveram efeito significativo para a varivel.
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 FUNDAMENTAO TERICA . . . . . . . . . . . . . . . . . . . . 12
2.1 Experimento aninhado . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.1 Experimento aninhado com trs estgios . . . . . . . . . . . . . . . . . . . 13
2.1.1.1 Modelo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.1.2 Estimao dos efeitos do modelo . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1.3 Decomposio da variabilidade total . . . . . . . . . . . . . . . . . . . . . . 18
2.1.1.4 Componentes da varincia no modelo aleatrio . . . . . . . . . . . . . . . . . 19
2.1.1.4.1 Estimao dos componentes de varincia . . . . . . . . . . . . . . . . . . . . . . 20
2.1.1.4.2 Estimativa negativa de um componente da varincia . . . . . . . . . . . . . . . . 21
2.1.1.5 Razo - F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.1.6 Diagnstico do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 MATERIAL E MTODOS . . . . . . . . . . . . . . . . . . . . . . . 25
3.1 Resultados e discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4 CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
11
1 Introduo
2 Fundamentao Terica
outra liga e assim por diante. Sendo possvel observar no esquema da Figura 1 que as
barras esto aninhados sob calor que esto aninhados sob liga. Caso exista dvida se o
experimento realmente aninhado (hierrquico), tenta-se renumerar arbitrariamente, caso
consiga dizemos que o fator aninhado.
em que, yijkl a l-sima observao do k-simo nvel do fator C dentro do j-simo nvel
do fator B (e do i-simo nvel do fator A); a mdia geral; i o efeito aleatrio do
i-simo nvel do fator A; j(i) o efeito aleatrio do j-simo nvel do fator B aninhado sob
o i-simo nvel do fator A; k(ij) o efeito aleatrio do k-simo nvel do fator C aninhado
sob o j-simo nvel do fator B (e do i-simo nvel do fator A); (ijk)m o erro aleatrio
associado a cada observao, aninhado sob os nveis A, B e C.
As suposies acerca do modelo nas quais A, B e C aleatrios so que o erro
tem distribuio Normal com mdia 0 e varincia 2 , alm disso, temos que os erros so
mutuamente independentes. Com isso, obtemos, k(ij) N (0, 2 ). Agora, para o efeito
i , assumimos que tem distribuio Normal com mdia zero e varincia 2 , e temos que
os efeitos so mutuamente independentes. Assim, i N (0, 2 ). Temos tambm, para o
2
efeito j(i) , assumimos que tem distribuio Normal com mdia zero e varincia ( ), e
2
temos que os efeitos so mutuamente independentes. Assim, j(i) N (0, ( ) ). E por fim,
para o efeito k(ij) , assumimos que tem distribuio Normal com mdia zero e varincia
2 2
( ) , e temos que os efeitos so mutuamente independentes. Assim, k(ij) N (0, ( ) ).
2
H0 : ( ) = 0
H : 2
1 ( ) 6= 0
2
H0 : ( ) = 0
H : 2
1 ( ) 6= 0
Captulo 2. Fundamentao Terica 15
Segue que,
a X
b X
c X
n a X
b X
c X
n
2
(yijkl i j(i) k(ij) )2
X X
Z= (ijk)l =
i=1 j=1 k=1 l=1 i=1 j=1 k=1 l=1
b P
c P
n
Z
(yijkl i j(i) k(ij) )(1) = 0
P
i
=2 (II)
j=1 k=1 l=1
c P
n
Z
(yijkl i j(i) k(ij) )(1) = 0
P
j(i)
=2 (III)
k=1 l=1
n
Z
(yijkl i j(i) k(ij) )(1) = 0
P
k(ij)
=2 (IV)
l=1
b
P b P
P c
bcn + bcni + cn j(i) + a k(ij) = yi...
j=1 j=1 k=1
a
P a P
P b a P
P b P
c
abcn + bcn i + cn j(i) + n k(ij) = y....
i=1 i=1 j=1 i=1 j=1 k=1
b
P b P
P c
bcn + bcni + cn j(i) + a k(ij) = yi...
j=1 j=1 k=1 (2.2)
c
P
cn + cni + cnj(i) + ab k(ij) = yij..
k=1
n + ni + nj(i) + nk(ij) = yijk.
abcn = y....
bcn + bcni = yi...
(2.3)
cn + cni + cnj(i) = yij..
n + ni + nj(i) + nk(ij) = yijk.
y....
= = y....
abcn
(2)
bcn + bcni = yi...
bcni = yi... bcn
yi...
i = bcn
i = yi... y....
(3)
cn + cni + cnj(i) = yij..
cnj(i) = yij.. cn cni
yij..
j(i) = KL
i
j(i) = yij.. y.... (yi... y.... )
(4)
c + ci + cj(i) + ck(ij) = yijk.
ck(ij) = yijk. c ci cj(i)
yijk.
k(ij) = L
i j(i)
k(ij) = yijk. y.... (yi... y.... ) (yij.. yi... )
= y.... , i = yi... y.... , j(i) = yij.. yi... , k(ij) = yijk. yij.. (2.4)
e
ijkl = yijkl yijk.
yijkl = yijk.
A soma de quadrados total pode ser dividida em seus componentes aditivos, como
pode-se observar abaixo
a P
b P
c P
n a P
b P
c P
n
(yijkl y.... )2 = [(yi... y.... ) + (yij.. yi... ) + (yijk. yij.. )+
P P
i=1 j=1 k=1 l=1 i=1 j=1 k=1 l=1
+(yijkl yijk. )]2
Simbolicamente,
SST = SSA + SSB(A) + SSC(B(A)) + SSE
Para obter a variao residual, calcula-se por diferena, ou seja,
Resumindo esse procedimento em uma tabela de Anlise de varincia (Tabela 2), temos:
Captulo 2. Fundamentao Terica 19
onde,
2
y....
C= abcn
a P
b P
c P
n
2
C)
P
SQtotal = (yijkl
i=1 j=1 k=1 l=1
a
1 P 2
SQA = bcn (yi... C)
i=1
a b
1 P P 2
SQB(A) = cn (yij.. C) SQA
i=1 j=1
a P b P c
SQC(B(A)) = n1 2
C) SQB(A) SQA
P
(yijk.
i=1 j=1 k=1
a P b P c Pn a P b P c
2
n1 2
P P
SQRes = yijkl yijk.
i=1 j=1 k=1 l=1 i=1 j=1 k=1
SQA SQB(A) SQC(B(A)) SQRes
QMA = (a1) , QMB(A) = a(b1) , QMC(B(A)) = ab(c1) , QMRes = abc(n1)
para se encontrar a E(QM ) que torna mais simples e menos dispendioso esta tarefa. Pelo
mtodo prtico modificado, apresenta o seguinte algoritmo de Hicks:
4. Cobrir a(s) coluna(s) correspondente(s) ao(s) ndice(s) do(s) fator(es) para encontrar
a E(QM), multiplicando-se os efeitos na linha, considerando somente os fatores com
o mesmo ndice;
2 = Q4 = QMRes
Q3 Q4
C2 = L
Q2 Q3
B2 = KL
Q1 Q2
A2 = JKL
2.1.1.5 Razo - F
( )
i) Sob H0 : 2 = 0,
Captulo 2. Fundamentao Terica 22
( )
O QMA um estimador no viciado para 2 e que independentemente de H0
verifica-se que o QMB(A) tambm um estimador no viciado para 2 . Logo, pode-se
( )
deduzir que uma estatstica apropriada para contrastar as hipteses H0 : 2 = 0
( ) QMA
vs H1 : 2 > 0 a quela que compara QMA com QMB(A) , isto , FA = QM B(A)
F[(a1);a(b1);] a estatstica FA segue uma distribuio F com (a-1) graus de liberdade
( )
do numerador e a(b-1) graus de liberdade do denominador. Ento, se H0 : 2 = 0
for verdadeiro, tanto o numerador quanto o denominador de FA so estimadores no
( )
viciados para 2 , porm, se H0 : 2 = 0 for falso, a esperana matemtica do QMA
( )
ser maior que QMB(A) . Deste modo, rejeita-se H0 : 2 = 0, quando o valor de FA
for maior que o valor da distribuio de F com (a-1) e [a(b-1)] graus de liberdade e
nvel de significncia .
()
ii) Sob H0 : 2 = 0
()
O QMB(A) um estimador no viciado para 2 e independentemente de H0
verifica-se que o QMC(B)(A) tambm um estimador no viciado para 2 . Deste
()
modo, a estatstica apropriada para contrastar as hipteses H0 : 2 = 0 vs
()
H1 : 2 > 0 a quela que compara QMB(A) com QMC(B(A)) , isto , FB(A) =
QMB(A)
QMC(B(A))
F[a(b1);ab(c1);] ,a estatstica FB(A) segue uma distribuio F com [a(b-
1)] graus de liberdade do numerador e [ab(c-1)] graus de liberdade do denominador.
()
Ento, se H0 : 2 = 0 for verdadeiro, tanto o numerador quanto o denominador
()
de FB(A) so estimadores no viciados para 2 , porm, se H0 : 2 = 0 for falso, a
esperana matemtica do QMB(A) ser maior que QMC(B(A)) . Deste modo, rejeita-se
()
H0 : 2 = 0, quando o valor de FB(A) for maior que o valor da distribuio de F
com [a(b-1)] e [ab(c-1)] graus de liberdade e nvel de significncia .
()
iii) Sob H0 : 2 = 0, o QMC(B)(A) um estimador no viciado para 2 e indepen-
()
dentemente de H0 verifica-se que o QMRes tambm um estimador no vici-
ado para 2 . Deste modo, a estatstica apropriada para contrastar as hipteses
() ()
H0 : 2 = 0 vs H1 : 2 > 0 a quela que compara QMC(B(A)) com QMRes ,
QMC(B(A))
isto , FC(B(A)) = QM Res
F[ab(c1);abc(n1);] , a estatstica FC(B(A)) segue uma
distribuio F com [ab(c-1)] graus de liberdade do numerador e [abc(n-1)] graus de
()
liberdade do denominador. Ento, se H0 : 2 = 0 for verdadeiro, tanto o numerador
quanto o denominador de FC(B(A)) so estimadores no viciados para 2 , porm,
()
se H0 : 2 = 0 for falso, a esperana matemtica do QMC(B(A)) ser maior que
QMRes . Deste modo, rejeita-se H0 : 2 = 0, quando o valor de FC(B(A)) for maior
que o valor da distribuio de F com [ab(c 1)] e [abc(n 1)] graus de liberdade e
nvel de significncia . Na Tabela 4 tem-se um resumo destes testes.
Captulo 2. Fundamentao Terica 23
Tabela 4 Razo-F para o teste da hiptese nula para o modelo aleatrio de trs fatores
aninhados
ei
zi = q , i = 1, 2, ..., n
b2 (1hii )
i
muitas das tcnicas de diagnstico utilizadas na regresso linear so, tambm, aplicveis
aos mesmos.
Um outra alternativa o uso do grfico meio-normal com envelope simulado
(MORAL, 2013) bastante til para a verificao da qualidade do ajuste. Essa tcnica,
relativamente simples, para verificao da adequao do ajuste de um determinado modelo
a um conjunto de observaes, proposta por Atkinson (1985), consiste em se plotarem os
valores absolutos ordenados de uma determinada medida de diagnstico (diferentes tipos
de resduos, distncia de Cook, medida de leverage etc.) versus as estatsticas de ordem
esperadas da distribuio meio-normal.
25
3 Material e mtodos
em que, yijkl a l-sima observao do k-simo nvel do fator lote dentro do j-simo
nvel do fator gentipo (e do i-simo nvel do fator fornecedor); a mdia geral; i o
efeito aleatrio do i-simo nvel do fator fornecedor; j(i) o efeito aleatrio do j-simo
nvel do fator gentipo aninhado sob o i-simo nvel do fator fornecedor; k(ij) o efeito
aleatrio do k-simo nvel do fator lote aninhado sob o j-simo nvel do fator gentipo (e
do i-simo nvel do fator fornecedor); (ijk)m o erro aleatrio associado a cada observao
yijkl , aninhado sob os nveis fornecedor, gentipo e lote.
As hipteses a serem testadas nesse trabalho so:
Tabela 8 Anlise da varincia para o modelo aleatrio em trs estgios, com as variveis
resposta comprimento de fibra (COMP), percentagem de fibra (PF) e resistncia
da fibra (RF).
C. V G.L. SQ QM F p-valor
Forn 3 23,63 7,87 1,67 0,1754
COMP Gen(forn) 12 108,19 9,01 1,92 0, 0369
lotes(f orn gen) 32 363,82 11,36 2,42 0, 0002
Erro 144 677,80 4,70
Total 191 1173,46
Forn 3 10,36 3,45 0,84 0,47
PF Gen(forn) 12 471,58 39,29 9,56 <, 0001
lotes(f orn gen) 32 251,82 7,86 1,91 0, 0053
Erro 144 591,89 4,11
Total 191 1325,66
Forn 3 77,12 25,70 5,01 0, 0025
RF Gen(forn) 12 129,50 10,79 2,11 0, 019
lotes(f orn gen) 32 124,10 3,87 0,76 0,82
Erro 144 738,25 5,12
Total 191 1068,97
C. V E(QM) E.C.V.
Forn 2 + 4lotes(f
2 2 2
orngen) + 12gen(f orn) + 48(f orn) -0,023
Comp Gen(forn) 2 + 4lotes(f
2 2
orngen) + 12gen(f orn) -0,196
lotes(f orn gen) 2 + 4lotes(f
2
orngen) 1,665
Erro 2 4,707
Forn 2 + 4lotes(f
2 2 2
orngen) + 12gen(f orn) + 48(f orn) -0,746
PF Gen(forn) 2 + 4lotes(f
2 2
orngen) + 12gen(f orn) 2.619
lotes(f orn gen) 2 + 4lotes(f
2
orngen) 0,939
Erro 2 4,110
Forn 2 + 4lotes(f
2 2 2
orngen) + 12gen(f orn) + 48(f orn) 0,310
2 2 2
Res Gen(forn) + 4lotes(f orngen) + 12gen(f orn) 0,576
lotes(f orn gen) 2 + 4lotes(f
2
orngen) -0,312
Erro 2 5,126
2
3
2
1
Resduos estudentizados
Resduos estudentizados
Resduos estudentizados
1
0
0
1
1
2
2
26 28 30 32 34 40 41 42 43 44 45 46 29 30 31 32 33 34
Figura 2 Grficos dos resduos estudentizados versus valores ajustados para a varivel
resposta comprimento de fibra (a), percentagem de fibra (b) e resistncia da
fibra (c), respectivamente
4
4
2
2
0
Resduos
Resduos
Resduos
0
0
2
2
2
4
4
4
3 2 1 0 1 2 3 3 2 1 0 1 2 3 3 2 1 0 1 2 3
Figura 3 Grficos dos quantis normais para a varivel resposta comprimento de fibra
(a), percentagem de fibra (b) e resistncia da fibra (c), respectivamente
Tabela 10 Estatstica Shapiro Wilks (W) com os respectivos valores de p das variveis
comprimento da fibra, percentagem de fibra e resistncia da fibra.
Points out of envelope: 3 ( 1.56 %) Points out of envelope: 37 ( 19.27 %) Points out of envelope: 10 ( 5.21 %)
3
3
3
Resduos
Resduos
Resduos
2
2
1
1
1
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0
Figura 4 Grficos envelope simulado para a varivel resposta comprimento de fibra (a),
percentagem de fibra (b) e resistncia da fibra (c), respectivamente
33
4 Concluso
Referncias
SEARLE, S. R. Linear models. new york: J. Wiley & Sons, 1971. Citado na pgina 21.