Você está na página 1de 16

Aula 03 - DIC

Tulio Gentil

IF Goiano

Estatı́stica Experimental

28 de Fevereiro de 2023

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 1 / 31

Delineamento Inteiramente Casualizado (DIC)

O DIC é o mais simples dos delineamentos.


Os tratamentos se distribuem ao acaso em todas as unidades
experimentais e o número de repetições por unidade de tratamento
pode ser igual ou diferente.
Considera apenas dois dos princı́pios básicos da experimentação: a
repetição e a casualização.
O DIC é muito utilizado em técnicas de trabalho em laboratório,
ensaios de vegetação e em experimentos com animais.
Para sua aplicação, há necessidade que o meio atue uniformemente
em todas as unidades experimentais e que estas sejam facilmente
identificadas para receber o tratamento.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 2 / 31


Delineamento Inteiramente Casualizado
Experimento em um vinhedo
Dois experimentos em DIC com quatro repetições de um tratamento
(linhas amarelas) e de um controle (linhas azuis), sendo um em um
vinhedo pequeno (A) e outro em um vinhedo médio (C).
Note que os exemplos considera uma linha de bordadura entre as
linhas.
Em alguns casos o mesmo tratamento ocupa parcelas vizinhas.
Os croquis para os ensaios mostrados em A e C são exibidos em B e
D, respectivamente.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 3 / 31

Delineamento Inteiramente Casualizado (DIC)


Exemplo
Suponha que desejamos comparar a produtividade de quatro variedades de
milho, para tanto vamos utilizar cinco repetições de cada variedade.

Quantas são as parcelas? 20.


Planejamento: Como ficaria um possı́vel croqui do experimento?

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 4 / 31


Delineamento Inteiramente Casualizado (DIC)

Exemplo
Em um estudo do efeito da glicose na liberação de insulina, 12
espécies de tecido pancreático idênticas foram subdivididas em três
grupos de 4 espécies cada uma.
Três nı́veis (baixo - tratamento 1, médio - tratamento 2 e alto -
tratamento 3) de concentrações de glicose foram aleatoriamente
designados aos três grupos.
Cada espécie dentro de cada grupo foi tratado com o nı́vel de
concentração de glicose sorteado a eles.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 5 / 31

Delineamento Inteiramente Casualizado (DIC)

A tabela a seguir mostra a quantidade de insulina liberada pelos tecidos


pancreáticos.

Trat. Repetições rj Total Média Variância

T1 1,59 1,73 3,64 1,97 4 8,93 2,23 0,91


T2 3,36 4,01 3,49 2,89 4 13,75 3,44 0,21
T3 3,96 4,82 3,87 5,39 4 18,00 4,50 0,54
Total 12 40,68

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 6 / 31


Delineamento Inteiramente Casualizado (DIC)
Repetições
Tratamento 1 2 3 ··· j ··· r Total Média
1 y11 y12 y13 · · · · · · ··· y1r y1+ y 1+
2 y21 y22 y23 · · · · · · ··· y2r y2+ y 2+
3 y31 y32 y33 · · · · · · ··· y3r y3+ y 3+
.. .. .. .. .. .. .. .. ..
. . . . . ··· . . . .
.. .. .. .. .. .. .. ..
i . . . . yij . . . .
.. .. .. .. .. .. .. .. .. ..
. . . . . . . . . .
k yk1 yk2 yk3 ··· ···
ykr yk+ ··· y k+
N=rk y++ y ++
r1 + r2 + · · · + rk = N; caso r1 = r2 = · · · = rk = r então N = rk.
yi+ e y i+ denotam o total e a média do i-ésimo tratamento,
respectivamente.
y++ e y ++ denotam o total geral e a média geral, respectivamente.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 7 / 31

Modelo matemático do DIC


O modelo associado ao DIC com efeitos fixos é

yij = µ + τi + eij , onde

yij é a observação na unidade experimental que estabeleceu o i-ésimo


tratamento na j-ésima repetição;
µ é a média geral comum a todas as observações definidas como
Pk
i=1 ri µi
µ= ,
N
com µi a média populacional do i-ésimo tratamento;
τi é o efeito do i-ésimo tratamento e mede o afastamento da média
µi em relação a µ, i.e., τi = µi − µ;
eij é um erro casual não observável.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 8 / 31


Suposições associadas ao modelo e hipóteses estatı́sticas

As suposições usualmente associas aos componentes do modelo do DIC


são que eij são v.a. i.i.d. N(0, σ 2 ). Como yij são funções lineares em
termos de eij , temos:
E (yij ) = µ + τi = µi ;
Var (yij ) = σ 2 ;
yij são normalmente distribuı́das e independentes yij ≃ N(µi , σ 2 ).
A hipótese geral é:

H0 : τ1 = τ2 = · · · = τk = 0,

ou seja, vamos testar a não existência de efeito do fator (tratamento).

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 9 / 31

Partição da soma de Quadrados


Podemos identificar os seguintes desvios:
yij − y ++ , desvio de uma observação em relação a média amostral
geral;
yij − y i+ , desvio de uma observação em relação a média do seu grupo
ou do i-ésimo tratamento;
y i+ − y ++ , desvio da média do i-ésimo tratamento em relação a
média amostral geral.
Observe que

(yij − y ++ ) = (yij − y i+ ) + (y i+ − y ++ ).

Então

X ri
k X X ri
k X k
X
2 2
(yij − y ++ ) = (yij − y i+ ) + ri (y i+ − y ++ )2
i=1 j=1 i=1 j=1 i=1

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 10 / 31


Partição da soma de Quadrados

O termo
ri
k X
X
SQT = (yij − y ++ )2
i=1 j=1

é denominado a Soma de Quadrados Total. O número de graus de


liberdade associado à SQT é kr − 1 ou N − 1.
O termo
ri
k X
X
SQR = (yij − y i+ )2
i=1 j=1

é denominado a Soma de Quadrados Residual e é uma medida de


homogeneidade interna dos tratamentos. O número de graus de
liberdade associado à SQR é kr − k ou N − k.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 11 / 31

Partição da soma de Quadrados

A componente
k
X
SQTr = ri (y i+ − y ++ )2
i=1

é denominada Soma de Quadrados entre Tratamentos. O número


de graus de liberdade associado à SQTr é k − 1.
Com esta notação podemos escrever

SQT = SQR + SQTr.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 12 / 31


Quadrados médios

O Quadrado Médio Residual é definido por


SQR
QMR = .
N−k
O Quadrado Médio entre Tratamentos é definido por
SQTr
QMR = .
k−1

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 13 / 31

Estatı́stica e região crı́tica do teste

A estatı́stica para o teste é

QMTr
Fc = .
QMR
Fc deve ser próximo de 1 se H0 for verdadeira, enquanto que valores
grandes dessa estatı́stica são uma indicação de que H0 é falsa.
Fc tem, sob H0 , distribuição F-Snedecor com k − 1 e N − k graus de
liberdade. Resumidamente

Fc ≃ F(k−1,N−k) , sob H0 .

Rejeitamos H0 para o nı́vel de significância α se

Fc > F(k−1,N−k,α) .

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 14 / 31


Quadro da análise de variância (ANOVA)

Fonte de variação g.l. SQ QM Fc


QMTr
Tratamentos (entre) k −1 SQTr QMTr Fc =
QMR
Resı́duo (dentro dos trat.) N −k SQR QMR
Total N −1 SQT

Pode-se mostrar que:


E (QMR) = σ 2 , ou seja, QMR é um estimador não viesado da
variância σ 2 ;
r Pk
E (QMTr ) = σ 2 + τi , ou seja, QMTr é um estimador não
k − 1 i=1
viesado da variância σ 2 se a hipótese H0 : τ1 = τ2 = · · · = τk = 0, é
verdadeira.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 15 / 31

Detalhes dos cálculos


(y++ )2
1 Calcule a correção para a média: CM = ;
N
2 Calcule a Soma de Quadrados Totais:
ri
k X
X
SQT = yij 2 − CM;
i=1 j=1

3 Calcule a Soma de Quadrados entre Tratamentos:


fi 2
X yi+
SQTr = − CM;
ri
i=1

4 Calcule a Soma de Quadrados Residual: SQR = SQT − SQTr ;


5 Calcule os Quadrados Médios entre Tratamentos e o Quadrado Médio
SQR SQTr
Residual: QMR = , QMTr = ;
N −k k −1
QMTr
6 Calcule Fc para tratamentos Fc = ;
QMR
Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 16 / 31
Exemplo 1

A tabela a seguir mostra a quantidade de insulina liberada pelos tecidos


pancreáticos.

Trat. Repetições rj Total Média Variância

T1 1,59 1,73 3,64 1,97 4 8,93 2,23 0,91


T2 3,36 4,01 3,49 2,89 4 13,75 3,44 0,21
T3 3,96 4,82 3,87 5,39 4 18,00 4,50 0,54
Total 12 40,68

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 17 / 31

Exemplo 1
Desejemos testar a hipótese nula:

H 0 : µ1 = µ2 = µ3

H1 : µi ̸= µj para pelo menos um par i ̸= j.


Os cálculos para montar o quadro da ANOVA são:
Temos k = 3, r = 4 e N = 3 × 4 = 12.
Graus de liberdade:

Total = N − 1 = 11, Trat = k − 1 = 2, Residuo = N − k = 9

CM = 137, 91
SQT = 15, 28, SQTr = 10, 30, SQR = 4, 98
QMTr = 5, 15, QMR = 0, 55
Fc = 9, 31

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 18 / 31


Exemplo 1

Quadro da ANOVA para insulina liberada


Fonte de variação g.l. SQ QM Fc
Tratamentos (entre) 2 10,30 5,15 9,31
Resı́duo (dentro dos trat.) 9 4,98 0,55
Total 11 15,28

F(2,9,0.05) = 4, 257 e F(2,9,0.01) = 8, 022. O valor Fc = 9, 31 é maior


do que estes valores tabelados, então rejeitamos a hipótese nula H0
para α = 0, 01 e α = 0, 05.
Concluı́mos que, para um nı́vel de significância de α = 0, 01, a
quantidade de insulina liberada é diferente para pelo menos dois nı́veis
de glicose.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 19 / 31

Exemplo 2

Exemplo
Em um experimento em que se mediu o peso corporal (kg), 19 porcos
foram distribuı́dos aleatoriamente a 4 grupos. Cada grupo foi alimentado
com dietas diferentes. Deseja-se testar se os pesos dos porcos são os
mesmos para as 4 dietas.

Desejemos testar a hipótese nula:

H0 : µ 1 = µ 2 = µ 3 = µ 4

H1 : µi ̸= µj para pelo menos um par i ̸= j.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 20 / 31


Exemplo 2

As observações obtidas foram


Tratamento Repetições
1 2 3 4 5
Dieta 1 60,8 57,7 65,0 58,6 61,5
Dieta 2 68,7 67,7 74,0 66,3 69,9
Dieta 3 202,6 102,1 100,2 96,5 *
Dieta 4 87,9 84,2 83,1 85,7 90,3

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 21 / 31

Exemplo 2

Temos um experimento desbalanceado com número de repetições desigual


para os tratamentos.
Os cálculos para montar o quadro da ANOVA são:
Graus de liberdade:

Total = N − 1 = 18, Trat = k − 1 = 3, Residuo = N − k = 15

CM = 115736, 44
SQT = 4325, 75, SQTr = 4202, 07, SQR = 123, 67
QMTr = 1400, 69, QMR = 8, 24
Fc = 169, 89

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 22 / 31


Exemplo 2

Quadro da ANOVA para variável peso


Fonte de variação g.l. SQ QM Fc
Tratamentos (entre) 3 4202,07 1400,69 169,89
Resı́duo (dentro dos trat.) 15 123,67 8,24
Total 18 4325,75

F(3,15,0.05) = 3, 287 e F(3,15,0.01) = 5, 417. O valor Fc = 169, 89 é


maior do que estes valores tabelados, então rejeitamos a hipótese nula
H0 para α = 0, 01 e α = 0, 05.
Concluı́mos que, para um nı́vel de significância de α = 0, 01,o peso é
diferente para pelo menos dois nı́veis de glicose.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 23 / 31

Estimadores de mı́nimos quadrados

Mostraremos os estimadores dos termos do modelo matemático do DIC

yij = µ + τi + eij ,

os quais são obtidos minimizando-se a expressão do erro deste modelo


ri
k X
X
(yij − ŷij )2 ,
i=1 j=1

Pk
em relação a µ e τi , i = 1, 2, · · · , k, sujeito a restrição i=1 ri τi = 0.
Obtemos os estimadores de µ, τi e µi , dados por

µ̂ = y ++ , τ̂i = y i+ − y ++ , µ̂i = µ̂ − τ̂i = y i+ , i = 1, 2, · · · , k.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 24 / 31


Intervalos de Confiança
Para construir um intervalo de confiança para a média de cada
tratamento, devemos notar que a estatı́stica:
y i+ − µi
r ≃ t(N−k) ,
QMR
ri
i.e., tem distribuição t-Student com N − k graus de liberdade. Um
intervalo de confiança para µi com um coeficiente de confiança 1 − α é
dado pela expressão
r
QMRes
IC (µi ; 1 − α) = y i+ ± t( α2 ,N−k) ,
r
sendo t( α2 ,N−k) o quantil de ordem 1 − α2 da distribuição t-Student com
N − k graus de liberdade, os mesmos graus de liberdade do resı́duo da
ANOVA.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 25 / 31

Exemplo 3
A tabela a seguir mostra a quantidade de insulina liberada pelos tecidos
pancreáticos.
Trat. Repetições rj Total Média Variância

T1 1,59 1,73 3,64 1,97 4 8,93 2,23 0,91


T2 3,36 4,01 3,49 2,89 4 13,75 3,44 0,21
T3 3,96 4,82 3,87 5,39 4 18,00 4,50 0,54
Total 12 40,68
Temos:
y 1+ = 2, 23, y 2+ = 3, 44, y 3+ = 4, 50, y ++ = 3, 39
r
QMR
= 0, 372, t(0.025,9) = 2, 262
r
Assim,
r
0, 553
IC (µi ; 95%) = y i+ ± 2, 262 = y i+ ± 0, 841.
4
Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 26 / 31
Exemplo 3

Nı́vel baixo Nı́vel médio Nı́vel alto


yi
de glicose de glicose de glicose
2,23 3,44 4,50
IC (µi , 95%) (1,389;3,071) (2,599;4,281) (3,659;5,341)

Como exercı́cio obtenha a tabela acima para o Exemplo 2.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 27 / 31

Coeficientes de determinação e de variação

Definição
O coeficiente de determinação para o modelo do DIC

yij = µ + τi + eij ,

é definido como
SQTr
R2 = × 100%.
SQT

Pode ser verificado que 0 ≤ R 2 ≤ 100;


R 2 = 100% quando toda variabilidade nas observações está sendo
explicada pelo modelo matemático do DIC.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 28 / 31


Coeficientes de determinação e de variação

Definição
O coeficiente de variação para o modelo do DIC

yij = µ + τi + eij ,

é definido como √
QMR
CV = × 100%.
y ++

O coeficiente de variação compara a variabilidade entre as unidades


experimentais de experimentos envolvendo diferentes unidades de
medidas e/ou tamanhos de parcelas.
O coeficiente de variação expressa o desvio padrão por unidade
experimental como uma porcentagem da média geral do experimento.

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 29 / 31

Exemplo 4
A tabela a seguir mostra a quantidade de insulina liberada pelos tecidos
pancreáticos.
Trat. Repetições rj Total Média Variância

T1 1,59 1,73 3,64 1,97 4 8,93 2,23 0,91


T2 3,36 4,01 3,49 2,89 4 13,75 3,44 0,21
T3 3,96 4,82 3,87 5,39 4 18,00 4,50 0,54
Total 12 40,68
Aqui temos:
SQT = 15, 28, SQTr = 10, 30
R 2 = 67, 4%, CV = 21, 94%
Concluı́mos que 67,4% da variabilidade que existe nas observações
deste experimento em torno de seu valor médio é explicada pelo
modelo matemático do DIC e este experimento apresenta um
coeficiente de variação de aproximadamente 22%.
Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 30 / 31
Obrigado pela atenção!

Tulio Gentil (IF Goiano) Aula 03 Estatı́stica Experimental 31 / 31

Você também pode gostar