Escolar Documentos
Profissional Documentos
Cultura Documentos
1
1 Definição de conceitos:
1.1 Unidade experimental (UE)
É a menor unidade de um experimento na qual é aplicado um tratamento, em
experimentos de campo as unidades experimentais são denominadas parcelas. As
parcelas irão depender no número de tratamentos e o número de repetições dos
tratamentos.
A unidade experimental, experimentação animal é representada geralmente por
um indivíduo (ser humano ou animal). Quando uma resposta for medida em grupo
(mesma baia), como por exemplo, o consumo total da baia, um animal será a unidade
experimental para medidas individuais de peso, mas a baia será a unidade experimental
para medidas de consumo e de conversão alimentar, pois não será possível ter acesso ao
consumo e conversão individuais.
1.2 Tratamento
Tratamento é qualquer procedimento ou conjunto de procedimentos cujo efeito
deverá ser avaliado e comparado com outros
1.3 Experimento
No método científico (mais especificamente no método experimental), uma
experiência científica ou experimento consiste na montagem de uma estratégia
concreta a partir da qual se organizam diversas ações observáveis direta ou
indiretamente, de forma a provar a plausibilidade ou falsidade de uma dada hipótese ou
de forma a estabelecer relações de causa/efeito entre fenômenos.
A experiência científica é uma das pedras angulares da abordagem empirista ao
conhecimento humano.
1.4 Experimentador
Agente que planeja, executa e analisa as informações obtidas no experimento.
2
importante que o pesquisador pese, meça ou observe cada unidade sem saber a que
grupo pertence essa unidade.
Isto evita a tendenciosidade. Nessa fase do experimento, o pesquisador ou
experimentador não pode trabalhar sozinho – precisa trabalhar com outro técnico.
Experimentos duplamente cegos - São os experimentos feitos com pessoas, em
que se recomendam ainda outros cuidados.
1. Não se deve informar à pessoa (unidade experimental) o grupo para o qual foi
designada;
2. Devem ser mantidos alheios ao resultado do sorteio a todos os profissionais
envolvidos no trato dessas pessoas, para não afetar o moral delas;
O pesquisador que faz as observações ou medições deve fazê- lo sem saber a que
grupo pertence à pessoa que examina.
3
Se os dados não satisfazem as suposições feitas pelas técnicas tradicionais
(exemplo normalidade), métodos não paramétricos de inferência estatística devem ser
usados.
4
2 Princípios Básicos da Experimentação
Os princípios básicos da experimentação são:
• Repetição (n amostral)
• Casualização (repetições ao acaso)
• Uniformidade da unidade experimental (repetições homogêneas)
• Uniformidade de meio (controle do ambiente e do tempo)
• Uniformidade de aplicação do tratamento (intervenções padronizadas)
2.1 Repetição
Tratamento 1 Tratamento 2
Animal 1
Animal 2
Animal 3
Média X1 X2
Variância S1 2 S2 2
2.2 Casualização
Tem o objetivo de validar a estimativa da variância dentro do grupo experimental
Quando uma determinada variável representa fator de variação que influi no resultado,
essa influência pode interferir na variância intra tratamento. Se for necessário utilizar
5
mais de um ambiente ou períodos diferentes, os fatores ambiente e tempo devem ser
removidos através da análise estatística. Para isso, deve haver repetição de todos os
tratamentos em cada ambiente ou tempo.
6
3 Estatística comparativa (contraste)
Exemplo:
Dosagem de Anticorpos
⇒ soro de 11 bovinos inoculados com a mesma carga patogênica
A hipótese é substituir o título in vivo pelo ensaio (ELISA).
dif =
∑ dif =
850
= 77,2727
11 11
7
IC = dif ± tα , gl × (dif )
S
n
(∑ dif i )
2
n
S 2( dif ) =
11
= = 40.561,8182
n −1 10
S = 40.561,8182 = 201,3996
201,3996
IC = 77,2727 ± t 5%,10 × (na tabela, t = 2,228)
11
dms ( ? )
IC = 77,2727 ± 135,2937
IC ⇒ de -58,02 a 212,57
É o valor que o desvio tem que superar para ser significativo. A importância do
dms é saber, com antecedência, o valor abaixo do qual as médias obtidas seriam
consideradas não significativamente diferentes quando comparam-se mais de dois
grupos.
⇒ Se o módulo da média for maior que o dms (? ) à o IC não inclui o ZERO
Pareamento
8
Nos casos de pareamento, os desvios internos são calculados (diferença para cada
repetição) e o controle de variância é maior. O pareamento apresenta alta eficiência.
Exemplo:
Transplante isolado de rim e duplo rim + pâncreas. Avaliação de um ano após em
relação a triglicérides (indivíduos do sexo masculino, com 35 a 50 anos, 15 pacientes
por grupo).
S12 S22
IC = X D − X I ± tα , gl × +
n1 n2
9
3255,49 4721,21
IC = 146,07 − 96,73 ± t 5%, 28 × + (t = 2,048)
dms 15 15
Conclusão:
O IC não inclui o ZERO. Logo, o transplante duplo não apresenta taxa de
triglicérides semelhante ao (é diferente do) isolado (p< 0,05). Foi significativo, embora
o IC seja muito amplo, sugerindo que a amostra foi insuficiente (n=15). Entretanto, o
resultado sendo significativo poderia ser publicado sem problemas pois, mesmo com o
erro superestimado, a diferença entre as médias não foi mascarada.
O problema seria se o resultado fosse não significativo com uma amostra
pequena. Poderia significar que seria possível a diferença existir mas ter sido mascarada
pela super-estimativa do erro.
Precisão do experimento
A precisão do experimento é dada pelo coeficiente de variação da amostra (deve
envolver os 30 resultados):
Do exemplo anterior:
Grupo isolado Grupo duplo Médias (geral)
Média 96,73 146,07 121,40
Variância 3255,50 4721,21 3988,3526
S 57,06 68,71 63,1534
CV 52,01
S 63,1534
CV = × 100 = × 100 = 52,01 %
X geral 121,40
96,73 + 146,07
X (geral ) = = 121,40
2
S12 + S 22
S 2( média) = = 3988,3526
2
à ou usando o S, já que ambas amostras apresentam o mesmo n
S1 + S 2
⇒ S( média) = = 63,1534
2
⇒ O CV alto encontrado pode ser devido a uma amostra inadequada.
Como houve diferença significativa, pode-se confiar, mesmo tendo encontrado CV alto.
Uma adequação amostral e conseqüente redução no CV aumentariam a capacidade do
teste, comprovando uma diferença ainda maior.
10
Se não tivesse sido encontrada a diferença, nesse caso poderia-se pensar na
possibilidade do resultado ser diferente se o CV fosse menor.
?
S
X ± tα ,gl ×
n
erro de 5% da média (121,4 × 5/100) = 6,07 ⇒ variação à ?
S
∆ = tα , gl ×
n
63,1534
6,07 = 2,048 ×
n
129,3382
n= = 21,31∴ n = 454 pessoas
6,07
para erro de 10% da média (121,4 × 10/100) ⇒ ? = 12,14
à n = 114 pessoas
ANOVA
∑X −
2 i
30 pacientes i
n
2
Stotal =
gl
à grupos
à erro
Toda fonte de variação não percebida e não descontada na variação total, vai ser
atribuída ao erro. O erro sendo superestimado, fica mais difícil estabelecer as diferenças
entre os grupos.
11
DELINEAMENTO INTEIRAMENTE CASUALIZADO
(∑ X ) 2
∑X −
2 i
i
2
Stotal = n
gl
n
Grupos (g-1) 1 SQg =
∑g i
2
−
(∑ X ) i
2
Fator de
SQtotal = ∑ X i2 −
(∑ X ) i
2
SQgrupos = ∑g 2
i
−
(∑ X )i
2
correção
n r n
Para o exemplo anterior dos transplantes simples e duplos:
QMe QMe
dms = t5 %,28 × +
r1 r2
12
Nesse caso, como os QMe e r também são coincidentes, pode ser simplificado como
abaixo:
2 × 3988,35
dms = 2,048 × = 47,23
15
X D − X I = 49,34 ⇒ o módulo da diferenç a das médias > dms
O teste t foi utilizado, em vez do F, pois é muito sensível. Porém, t só deve ser
utilizado quando é recomendado. O teste t só pode ser utilizado até para 5
grupos e se a estabilidade é alta. Se há instabilidade, deve ser utilizado outro
teste.
Situação experimental
Tratamentos:
a) Ração tradicional à base de milho e soja
b) 95% da ração tradicional + 5% de farelo de trigo
c) 95% da ração tradicional + 5% de farelo de cacau
Linhagem das aves: mesma linhagem
Resposta: produção de ovos em % (ovos produzidos por total de galinhas) ⇒ numérica
contínua de fluxo descontinuado (se a avaliação for longa; mas se for avaliada,
como nesse caso, em períodos curtos pode ser classificada como continuada);
estabilidade não conhecida mas na avicultura as respostas são muito instáveis;
distribuição normal.
O total de ovos produzido no galinheiro a cada dia é dividido pelo total de galinhas
do galinheiro ×100.
Unidade experimental: galinheiro com 40 galinhas, 15 galinheiros no mesmo galpão
Cada galinheiro é uma unidade experimental. Três grupos (trataemtnos) com 5
galinheiros cada.
Início do ensaio: 32 semanas + 8 semanas de adaptação
Tempo de avaliação: durante um mês (contagem diária)
Repetições: 5 repetições / tratamento
Delineamento: inteiramente casualizado
Desenho do estudo
r A B C
1 72,4 71,8 66,8
2 74,8 67,8 64,2
3 70,1 72,1 67,2
4 75,5 70,1 62,7
5 68,1 66,6 68,9
Total 360,9 348,4 329,8
média 72,18 69,68 65,96
13
Só há variação entre os grupos (hipótese do estudo) e entre os indivíduos dentro
dos grupos (intra-grupo). Nesse caso será feito o sorteio dos tratamentos entre
os grupos.
TOTAL
GRUPOS
g A2 g 2B g C2 360,9 2 348,4 2 329,8 2 (72,4 + ... + 68,9 )2
SQ grupos = + + − FC = + + −
5 5 5 5 5 5 15
SQ grupos = 97,96
ERRO
14
QMe = 87,069/12 = 7,2558
DMS
2QMe
dms = t5%, gl ×
5
2 × 7,2558
dms = 2,179 × = 3,41
5
X A − X B = 2,5 à menor que dms ⇒ IC inclui ZERO, A = B
X B − X C = 3,72 à maior que dms ⇒ IC não inclui ZERO, B ? C
X A − X C = 6,22 à maior que dms ⇒ IC não inclui ZERO, A ? C
Tratamento Médias
A 72,18 A
Consideradas iguais
B 69,68 A
C 65,96 B
Médias seguidas de letras distintas
diferem pelo teste t (p<0,05)
15
4 DELINEAMENTO EM BLOCOS CASUALIZADOS
Situação experimental
Tratamento: 4 dietas com diferentes níveis de proteína
Resposta: ganho de peso em kg aos 90 dias
Cálculo amostral: 5 repetições para cada grupo experimental (para cada tratamento)
Local: os grupos serão tratados no mesmo local
Animal: suínos machos desmamados com peso uniforme
Granja fornece: à 10 animais na 1a . entrega de animais
à 8 animais, 15 dias após a primeira entrega
à 8 animais 15 dias após a segunda entrega
Classificação da variável: numérica (quantitativa), contínua, fluxo descontinuado (por
que a idade foi definida), instabilidade não é muito alta. Podem ser feitos:
ANOVA (teste de média), análise de regressão.
Desenho do estudo:
1a . entrada: 8 animais (escolher, pois não é possível usar 10)à 2 animais por
dieta (sortear)
2a . entrada: 8 animais à 2 animais por dieta (sortear)
3a . entrada: 8 animais (poderia usar 4, pelo cálculo amostral) à 2 animais por
dieta (sortear)
Fornecimento / Entradas D1 D2 D3 D4
BLOCO 2 9 10 11 12
2 Entrada ⇒ 8 animais à usar 8
a
13 14 15 16
BLOCO 3 17 18 19 20
3a Entrada ⇒ 8 animais (4 seriam
suficientes para completar n)à usar 8
21 22 23 24
Cada entrada é um estrato, sendo que os animais foram sorteados por dieta em
cada bloco, sendo portanto 3 sorteios. Cada estrato (bloco) recebe todos os
tratamentos. Cada entrada tem condição ambiental diferente, mas essa
diferença ambiental afetará igualmente todos os tratamentos, pois todos os
tratamentos são distribuídos com igual chance para os animais de cada bloco.
São testadas as diferenças entre as médias dos pesos obtidos por cada dieta,
através de todos os blocos.
16
Quando o desenho é de delineamento em blocos casualizados, há o efeito das entradas
(blocos) no quadro da ANOVA, mesmo que supostamente haja a mesma condição de
efeito. Isso, porque foi feito um sorteio para cada bloco.
Quando o ambiente pode não ser uniforme como, por exemplo, um galpão com 3 áreas
não uniformes. Esses blocos formados devem ser considerados na ANOVA.
Se um bloco for perdido (água contaminada, por exemplo) ele pode ser repetido caso o
fator tempo não acarrete uma influência no resultado.
Há dois casos de blocagem: tempo e espaço físico. Mas há casos em que pode-
se blocar o animal.
Exemplo
Tratamento: 3 diluentes
Material: sêmen
Resposta: % de motilidade
⇒ quantitativa (pode ser qualitativa em alguns casos em que a avaliação é
subjetiva)
⇒ instável
17
No caso de respostas instáveis, é desejável blocar o animal. Por exemplo: motilidade de
sêmen do mesmo animal, divididos em 3 alíquotas para testar 3 diferentes diluentes e
seu efeito sobre a motilidade.
Alíquotas iguais de uma mesma coleta de cada animal são sorteadas para cada
tratamento. Pode-se assim reduzir o número de animais necessários para o
experimento. Dessa forma, o animal é controlado, pois tira-se uma repetição
para cada tratamento, por exemplo, com 5 animais poderia-se concluir o
experimento com 15 repetições. Não podem ser retiradas 2 amostras de um
mesmo animal e dividi-la em outras 3 alíquotas, pois isso seria uma réplica.
Teria que pegar outro animal. Mesmo ejaculados diferentes de um mesmo
animal não é indicado, pois a estatística é para indivíduos diferentes. Embora
nesse caso em que a resposta é muito instável pode ser considerada a
possibilidade de utilizar 2 ejaculados de um mesmo animal. Na possibilidade de
usar vários ejaculados de cada animal, pode-se fazer a média das alíquotas de
cada tratamento para representar cada animal. Mas não justifica pegar 2
amostras por animal, pois seria feita a média das duas (para as alíquotas de
cada tratamento). Como animal já está sendo controlado e o CV seria muito
baixo, pois há alta precisão experimental com apenas 1 amostra por animal
(variação do indivíduo seria controlada e a comparação dos 3 diluentes seria
feita em alíquotas homogêneas), não há porque pegar 2 amostras. Da mesma
forma, poderiam ser blocados leite, queijo, produtos de supermercado dos quais
seriam retiradas alíquotas.
De volta ao experimento de 4 dietas em 24 porcos desmamados:
⇒ O valor do gl do erro não deve ser inferior a 10, senão o valor tabelado
aumenta muito.
Experimento:
Amostra: Sêmen resfriado a 4º C mantidos por 36 horas, em 4 alíquotas para cada um
de 5 animais
Tratamentos: gema, leite, coco e citrato
Resposta: % de motilidade
18
DESENHO DO ESTUDO
Jumento gema leite coco citrato TOTAL
1 80 76 77 65 298
2 72 65 60 50 247
3 63 55 53 48 219
4 83 75 73 64 295
5 76 70 69 57 272
TOTAL 374 341 332 284 1331
Nesse caso não pode haver 2 repetições dentro de um mesmo bloco, pois o bloco
é o animal. Se houvesse mais de uma repetição no mesmo bloco seria réplica.
Quando o espaço físico é blocado, é possível ter mais de uma repetição por
bloco.
SQtotal = 80 + ... + 57
2 2
−
(1331)2
20
SQtotal = 90.571 − 88.578,05 = 1.992,95
19
SQ ANIMAL
298 2 247 2 219 2 2952 272 2 (1331)
2
a2 a2 a 2 a2 a2
SQanimal = 1 + 2 + 3 + 4 + 5 − FC = + + + + −
4 4 4 4 4 4 4 4 4 4 20
SQ DILUENTE
d12 d 22 d 32 d 42 3742 3412 3322 2842 (1331)2
SQdiluente = + + + − FC = + + + −
5 5 5 5 5 5 5 5 20
SQdiluente = 89.407,40 − 88 .578,05 = 829,35
SQ ERRO
Obtido pela diferença:
SQe = SQt – SQa – SQd = 45,90
QMe (S2 )
SQe 45,9
QMe = = = 3,825
gl 12
CV
S 3,825
CV = × 100 = × 100 = 2,94 ⇒ tamanho do erro experimental (muito bom, abaixo
X geral 66 ,55
de 5%)
A média geral pode ser a média das médias dos quatro tratamentos ou 1.331/20.
A variável apresenta grande instabilidade, porém o delineamento em bloco
utilizando alíquotas permitiu que o ensaio obtivesse uma alta precisão
experimental (CV = 2,94). A comparação será feita com alta confiança. Se o
resultado for igual é porque é igual mesmo. Se o CV fosse alto, um resultado de
igualdade não teria confiança, pois a estimativa seria feita com o erro
superestimado.
CV muito baixo, deveria adotar o teste de Tuckey, portanto vamos usar o t para
seguir uma seqüência didática até o tópico “escolha de testes”.
DMS (teste t)
2QMe
dms = t5%,12 ×
r
20
2 × 3,825
dms = 2,179 × = 2,70% ⇒ diferença menor que 2,7% não é
5
significativa.
Uma diferença entre duas médias que seja menor que a dms é considerada uma
diferença casual, aleatória. Uma diferença superior indica que há um efeito
significativo do diluente na motilidade do sêmen.
QUADRO DE COMPARAÇÃO
diluente média Classif.
Gema 74,8 A
Leite 68,4 B
Coco 66,4 B
Citrato 56,8 C
Médias seguidas de letras distintas
diferem pelo teste t (p < 0,05).
⇒ quando é diferente, p<
21
5 DELINEAMENTO EM QUADRADO LATINO
Situação experimental:
Resposta: quantidade de aflatoxina em cinco produtos à base de milho
Tratamentos: cinco métodos de detecção de aflotoxina
• Há 7 laboratoristas
• Cada laboratorista faz um exame por dia
Blocos foram formados nas linhas e colunas. O sorteio dos métodos pode ser
feito com sorteio sistematizado, de forma que não haja repetição de métodos por
laboratorista ou produto.
Sorteio sistematizado
Distribuição de métodos
C1 C2 C3 C4 C5
L1 A B C D E
L2 E A B C D
L3 D E A B C
L4 C D E A B
L5 B C D E A
22
Sorteio de linhas (L4, L3, L2, L1, L5 )
P1 P2 P3 P4 P5
L4 C D E A B
L3 D E A B C
L2 E A B C D
L1 A B C D E
L5 B C D E A
VARIAÇÕES NO DELINEAMENTO
E se fosse possível que o laboratorista pudesse fazer mais de um teste por dia? Dois
exames por dia, por exemplo?
QUADRADO LATINO 5 × 5
C1 C2 C3 C4 C5
L1 A B C D E
L1 E A B C D
L2 D E A B C
L2 C D E A B
L3 B C D E A
23
QUADRO DE ANÁLISE DE VARIÂNCIA
Fonte de Variação gl
Total (n-1) 24
laboratorista 2
produto 4
método 4
Erro (variação intra-grupo) 14
Se fossem 4 métodos a serem testados, usaríamos 4 laboratoristas
QUADRADO LATINO 4 X 4
C1 C2 C3 C4
L1 A B C D
L2 D A B C
L3 C D A B
L4 B C D A
⇒ 16 unidades experimentais
24
Agora esse experimento pode ser realizado com confiabilidade aceitável.
Poderiam ser utilizados novos 4 laboratoristas, mas se os mesmos 4
laboratoristas puderem fazer o segundo quadrado latino é melhor para gl. Com 4
novos laboratoristas haveria 6 gl para laboratorista e 15 gl para o erro, ainda
confiável.
Situação Experimental
Ensaio de competição de 5 variedades de cana-de-açúcar (variação de fertilidade no
terreno em declive) Declive
25
É possível afirmar que a variação entre as colunas é maior do entre as linhas. Significa
que o solo varia mais no sentido “horizontal” do que no “vertical”, considerando o
esquema do quadrado latino.
A variação entre linhas ou entre colunas também poderia ser verificada da mesma forma
em que é verificada para as variedades, mas nesse estudo, o objetivo não é esse. No caso
de um galpão onde são realizados vários experimentos pode ser interessante verificar a
variação dos locais em seu interior.
Nesse experimento, mesmo que não seja encontrada diferenças entre colunas e/ou
linhas, a estrutura de quadrado latino deve ser seguida, pois o sorteio já foi realizado de
forma que alterar o delineamento posteriormente ao sorteio implica em alteração dos
resultados.
QMe (S2 , erro experimental) (obs. resultados 1000 vezes maior que os apresentados na
aula)
SQe 34.114,72
QMe = = = 2.842,893
gl 12
CV
S 2.842,893
CV = × 100 = × 100 = 11,332%
X geral 470 ,52
(na aula o valor encontrado foi 0,36%) ⇒ extremamente confiável, tornando o
teste muito sensível para detectar igualdade entre médias.
26
O quadrado latino é um delineamento que apresenta um alto controle de
variação.
DMS (teste t)
2 × 2,84 2 × 2,84
dms = t5%, 12 × = 2,179 × = 2,32 ⇒ resultado apresentado na
5 5
aula
2 × 2.842,893 5.685,787
dms = t5%,12 × = 2,179 × = 2,179 × 33,72 = 73,480
5 5
QUADRO DE COMPARAÇÃO
variedades média Classif. Classif. (aula)
C 604,8 A A
A 492,6 B B
B 440,8 BC C
D 413,4 C D
E 401,0 C E
Médias seguidas de letras distintas diferem pelo teste t
(p < 0,05).
(diferenças menores do que dms são atribuídas ao
erro aleatório)
Se gl for menor que 10, não há confiabilidade. O experimento deve ser criticado e
sugere-se
Detalhes do experimento:
Devem ser blocados os laboratoristas e os produtos. Os métodos são o objetivo do
experimento.
27
Laboratorista: Às vezes não é necessário usar todas as pessoas disponíveis. Usar
4 laboratoristas fazendo 2 exames por dia (3 gl) é mais eficiente do que 8, pois
aumenta gl (6 gl) para os laboratoristas, reduzindo assim os gl do erro.
Métodos: sorteio sistematizado.
Produto à base de milho: O produto é um lote. Só podem ser retiradas 4
alíquotas de cada produto (lote), uma repetição para cada método. Não podem
ser usadas réplicas. Deve usar 4 produtos num quadrado e 4 em outro.
O sorteio sistematizado deve ser feito novamente para o segundo quadrado latino.
Sempre que possível, o sorteio deve ser independente. O objetivo do delineamento é
controlar as fontes de variação. No caso de usar só um laboratorista não haveria o
fator de variação do laboratorista, mas ele teria qua fazer 4 experimentos em um único
dia. Se ele fizesse 2 exames por dia, o dia já seria um fator de variação que teria que
ser blocado. Na necessidade de blocar o dia, é necessário que todos os experimentos
sejam realizados num dia.
A estratégia de blocar apresenta vantagem, pois é muito mais confiável blocar uma
possível fonte de variação do que supor que a variação não existe ao confiar num teste
de concordância. A variação interexaminadores (a maior variação existente) é anulada
pelo delineamento.
28
Observa-se variação entre os laboratoristas, entre produtos e entre os
quadrados.
QUADRO DE ANÁLISE DE VARIÂNCIA
Fonte de Variação gl SQ QM
Total (n-1) 31 11.331,87
Repetição do 1 10,125
delineamento Quadrados Latinos
Laboratoristas 3 709,125
delineamento
Produtos [(4-1)+(4-1)] 6 1.167,25
Métodos 3 5.681,625
Erro (variação intra-grupo) 18 3.763,75 209,0972
A soma de quadrados total é realizada para o ensaio como um todo. No livro, aparece
para Produtos gl = 7, mas não aparece 1 gl para Quadrados latinos. É preferível listar
separadamente para não confundir, pois laboratoristas e produtos fazer parte da fonte de
variação do delineamento, mas o delineamento é repetido, surgindo a nova fonte de
variação que é a repetição do delineamento. Métodos são o objeto de estudo.
SQ Total
SQQL =
( 4.400 )2 + (4.418 )2 (8.818 )2
− = 10,125
16 32
SQ Laboratóristas
Totais de Laboratoristas
1 = 1152+1083
2 = 1084+1076
3 = 1072+1103
4 = 1092+1156
SQlaboratório =
(1152 + 1083)2 + (1084 + 1076)2 + ... +
(1092 + 1156)2 − FC = 709,125
8 8 8
SQ Produto
Os produtos que estão no primeiro quadrado latino não são os mesmos dos que
estão no segundo quadrado.
SQproduto =
(1.072) (1.104 )
2
+
2
+ ... +
(1.077) (1.144)
2
+
2
− FC = 1.167, 25
4 4 4 4
29
SQ Método
Métodos:
A = 276+272+240+264+264+252+275+269 = 2.112
B = 2.302
C = 2.085
D = 2.319
SQmétodo =
(2.112 ) + ... + (2.319 )
2 2
− FC = 5.681,625
8
SQ ERRO
QMe (S2 )
SQe 3. 763,75
QMe = = = 209,0972
gl 18
CV
S 209,0972
CV = × 100 = ×100 = 5,25%
X geral 275, 5625
DMS (teste t)
2 × 209,0972
dms = t 5%,18 × = 15,19 ⇒ r no denominador é o número sobre o qual
8
foram calculadas as médias as serem
comparadas.
QUADRO DE COMPARAÇÃO
MÉTODO média MÉTODO média Classif.
1 264,00 4 289,875 a
2 287,75 2 287,75 a
3 260,625 1 264,00 b
4 289,875 3 260,625 b
Médias seguidas de letras distintas diferem pelo teste t (p < 0,05). [a = 0,05 é o
mesmo que (p < 0,05)]
30
INTERAÇÃO ENTRE FATORES
Até agora estudamos tratamentos com apenas um fator. Porém na experimentação
muitas vezes vários fatores são estudados ao mesmo tempo. Por exemplo, no estudo de
dietas, pode ser interessante estudar o efeito de níveis diferentes de proteína combinado
a diferentes níveis calóricos, definindo qual é a melhor combinação.
O mais comum é estudar a interação entre 2, 3 ou até 4 fatores. A interação de mais
fatores tornam a interpretação mais complexa.
Arranjo Fatorial
Situação experimental:
Estudo: dieta com 3 níveis de proteína e com 2 níveis de energia (caloria).
Resposta: ganho de peso
Repetições: 6 repetições por tratamento à 30 unidades experimentais
ARRANJO FATORIAL 3 × 2
E1
P1
E2
E1
P2 6 tratamentos
E2
E1
P3
E2
31
Exemplo: situação experimental
Qualidade de ovos em relação ao armazenamento em 2 temperaturas (4o C e 18o C)
combinado à utilização de 2 tipos de embalagem (papelão e filme PVC) e medida nos
tempos de estocagem de 5, 10, 15, 20 dias.
32
4 repetições × 16 tratamentos ⇒ n= 64 à gl do erro = 48
É possível estimar o cálculo amostral através dos gl. É uma forma prática com
fundamentação estatística, mas quando a resposta é muito instável, é melhor calcular
através do desvio-padrão da resposta. Às vezes 10 gl não é suficiente para variáveis
instáveis.
Situação experimental:
Um pesquisador estudou o efeito de vitamina B12 (0 e 50mg) e antibiótico (0, 250mg)
em fêmeas de Pastor Alemão da desmama à puberdade. Delineamento inteiramente
casualizado.
Resposta: ganho de peso médio diário (em gramas) da genitália
Experimento
Antibiótico 0 250
Resposta
Vitamina 0 50 0 50
1 1,30 1,19 1,05 1,56
2 1,08 1,26 1,05 1,55
3 1,19 1,21 1,00 1,52
4 1,19 1,22 0,98 1,53
Total 4,76 4,88 4,08 6,16
Média 1,19 1,22 1,02 1,54
⇒ Fatorial 2 × 2
SQ TOTAL
33
SQ ANTIBIÓTICO
SQ A =
(9,64 )2 + (10,24 )2
− FC = 0,02
8
SQ VITAMINA
SQV =
(8,84) + (11,04 )
2 2
− FC = 0,30
8
SQTRAT =
(4,76)2 + ... + (6,16)2 − FC = 0,57
4
SQ A × V
SQA×V = SQtrat − SQant − SQvit
SQ ERRO
Obtido pela diferença:
SQe = SQT – SQA – SQV– SQA × V = 0,03
QMe (S2 )
SQe 0,03
QMe = = = 0,0025
gl 12
CV
S 0,0025
CV = ×100 = ×100 = 4,03%
X geral 1,24
DMS (teste t)
2 × 0,0025
dms = t5%,12 × = 0,072
4
Antibiótico
Média
Vitamina 0 250 dif geral
0 1,19 aA 1,02 bB 0,17 1,10
50 1,22 bA 1,54 aA -0,32 1,38
dif -0,03 -0,52
Média geral 1,20 1,28
Médias seguidas de letras distintas, minúsculas na linha e maiúsculas na coluna,
diferem pelo teste t (p < 0,05)
(as médias não têm valor nesse caso, pois são utilizadas só quando não há
interação entre os fatores.)
34
Exemplo com letras caracterizando ausência de interação (nesse caso, não são
apresentadas as letras dentro do quadro:
0 250
0 aB bB B
50 aA bA A
a b
1,60
250
antibiótico
1,54
1,4
0
1,22 antibiótico
1,2
1,1
0 vitamina
Ração enriquecida com 2 concentrações de cálcio e três de fósforo Deseja-se saber qual
a combinação de concentração desses nutrientes leva ao maior ganho de peso em
frangos de corte.
Ca (2 e 4,5%) P (0,2; 0,5 e 0,8%) ⇒ (2 × 3)
Resposta: peso aos 45 dias em kg
Galpão com 6 lotes de 200 frangos
4 galpões em diferentes localizações
Unidade experimental: peso médio de 20 frangos
Delineamento:
Blocos casualizados, utilizando 4 galpões (blocos) com 6 repetições em cada bloco.
Cada lote receberá um tratamento. Como cada lote tem 200 frangos, a medida será
realizada só em 20 frangos cuja média é a unidade experimental.
35
QUADRO DE ANÁLISE DE VARIÂNCIA
Fonte de Variação gl SQ QM
Total (n-1) 23 12,0696
Galpão 3 0,8646
Cálcio (Ca) 1 0,121
Fósforo (P) 2 6,086
Ca × P 2 4,585
Erro 15 0,4129 0,0275
QUADRO DE COMPARAÇÃO
Fósforo
Cálcio 0,2 0,5 3,28
2 1,4 cB 2,65 b B 3,28 aA
4,5 1,95 bA 3,05 a A 1,9 bB
Médias seguidas de letras distintas, minúsculas
na linha e maiúsculas na coluna, diferem pelo
teste t (p < 0,05)
36
Interação entre fatores (continuação)
Os tratamentos estatísticos, quando há interação entre fatores, estão combinados de
forma em que todos os níveis de um fator estão presentes em todos os níveis de outro
fator.
Situação experimental
Carga parasitária de esquistossomose no volume globular em coelhos aos 7, 14 e 21 dias
pós infecção.
Tratamentos:
• Ausência de carga (controle) ⇒ 7, 14 e 21 dias
• Carga de 103 ⇒ 7, 14 e 21 dias
• Carga de 106 ⇒ 7, 14 e 21 dias
Resposta: volume globular (fluxo continuado, medido aos 7, 14 e 21 dias)
Unidades experimentais: 15 Coelhos (grupo homogêneo)
Há interação entre fatores, pois queremos estudar 3 cargas em 3 dias para cada fator. A
interação é 3 × 3, mas diferentemente do arranjo fatorial, cada animal gera 3
informações. Nesse caso, um animal foi alocado ao tratamento (carga do parasita)
através de sorteio. Porém, as avaliações nos dias 7, 14 e 21 são realizadas num mesmo
animal. O fator carga é subdividido, sendo que cada unidade experimental gera 3
resultados. Quando dentro de um fator várias respostas são geradas, configura-se um
tipo de arranjo em parcelas subdivididas (split plot). Esse ensaio apresenta um
delineamento inteiramente casualizado com carga na parcela e tempo na subparcela. É
comum que o tempo, num experimento, seja subparcela num arrajno em parcela
subdividida. Porém deve-se estar atento porque nem sempre esse é o caso.
É necessário que a resposta seja de fluxo continuado. Se o animal tiver que ser
sacrificado, não é possível reutilizar a parcela. Daí, torna-se necessário usar o arranjo
fatorial.
Exemplo:
Experimento para verificar produção de matéria seca em variedades de
sorgo nas 4 estações do ano. A variedade de sorgo será a parcela. As
respostas para cada estação do ano serão medidas em cada variedade.
37
Situação experimental
O sêmen é estocado em uma temperatura constante e quando é descongelado, há um
tempo do retorno à condição de utilização. Sêmen eqüino em três tempos de estocagem
(12, 24 e 48 hs) × velocidade de retorno (A, B).
O ejaculado de um animal é dividida em 3 amostras (A1, A2 e A3). As 3 amostras serão
sorteadas para tempo de estocagem T12, T24 e T48. Cada uma das amostras será
dividida em 2 alíquotas, as quais serão sorteadas para as velocidades de retorno (VA e
VB). Esse procedimento é realizado em todas as repetições do experimento (animais).
Alíquota 1
Amostra 1 (sorteado p/ Vel B)
(sorteado p/ 48hs) Alíquota 1
(sorteado p/ Vel A)
Alíquota 1
Animal ⇒ 1 ejaculado Amostra 2 (sorteado p/ Vel A)
(1 repetição = 1 animal) (sorteado p/ 12 hs) Alíquota 1
(sorteado p/ Vel B)
Alíquota 1
Amostra 3 (sorteado p/ Vel A)
(sorteado p/ 24 hs) Alíquota 1
(sorteado p/ Vel B)
Situação experimental
Estudar 5 anestésicos em cães. Há limitação para obtenção de animais uniformes e
espaço no hospital.
Resposta: freqüência cardíaca em 3 tempos (fluxo continuado).
38
Repetições: 5 cães (serão utilizados apenas 5 cães)
Arranjo fatorial: 5 × 3 = 15 (5 anestésicos em 3 tempos)
Erros a e b
Erro a ⇒ variação individual atribuída à parcela
Erro b ⇒ variação individual atribuída à subparcela
Na comparação das médias, ora é utilizado o erro a, ora o erro b e outras vezes os dois
erros são utilizados com ponderação. Portanto as análises com dms serão realizadas três
vezes: a, b e ponderada.
O valor da resposta de cada uma das 5 combinações do tratamento com o anestésico B,
medida aos 10 minutos (B-10) é uma subparcela. Os valores dessas 5 subparcelas
apresentam variação individual. Essa variação que ocorre dentro de uma mesma
subparcela será chamada de erro b: erro da subparcela. O mesmo ocorre com as
combinações B-20, B-30, A-10, A-20, A-30 e assim por diante, gerando também uma
39
variação individual para essas subparcelas. A média dessas variações individuais das
subparcelas vai gerar o erro b.
Quando é considerado o resultado de cada anestésico, esse é a soma das suas respectivas
subparcelas, gerando o resultado da parcela. A soma de B-10, B-20 e B-30 nas 5
repetições resulta na resposta da parcela B. Os resultados de cada uma das 5 parcelas
também apresentam variação. A média das variações das parcelas é chamada de erro
a.
Da mesma forma que no arranjo fatorial, o arranjo em parcelas subdivididas
tem o objetivo de avaliar qual a melhor combinação de tratamentos. Pela forma
de condução do experimento, quando um fator está incluído no outro,
configura-se uma forma específica de arranjo fatorial denominada parcela
subdividida.
Não é raro o pesquisador dividir um experimento cuja resposta é avaliada por
tempo. Isso gera um prejuízo devido ao efeito do tamanho amostral.
Considerando esse experimento como exemplo, há 75 repetições. Quando o
experimento é dividido em 3 ensaios, um para cada um dos tempos de
avaliação, cada experimento resultante teria n = 25. Outra limitação da divisão
é que no estudo dividido não podem ser feitas comparações entre os tempos, ao
contrário do ensaio completo no qual pode-se avaliar a evolução da resposta
nos 3 tempos, inferindo a partir das comparações entre resultados obtidos nos
diferentes tempos. A divisão do estudo leva a duas perdas: informação e
precisão experimental.
Exemplo:
Suplementação na dieta de frangos com duas concentrações de Cálcio, e outra de
Fósforo com três níveis de concentração. A resposta será medida em 45 e 90
dias.
As parcelas são o arranjo fatorial 2 × 3, mais um terceiro fator (tempo) que é a
subparcela. As subparcelas são os tempos de avaliação para cada parcela (2 × 3
× 2).
No caso do animal for abatido (resposta descontinuada) o mesmo estudo deverá
ser reconfigurado apenas em arranjo fatorial, havendo necessidade de dobrar a
amostra para avaliar o fator tempo.
Ca P Tempo
45d
0,2
90d
45d
2,0 0,5
90d
45d
0,8
90d
45d
0,2
90d
45d
4,5 0,5
90d
45d
0,8
90d
40
Nesse caso, há um arranjo fatorial na parcela composta por 2 fatores, mais um
terceiro fator na subparcela. Se a resposta não fosse continuada, caso o animal
tivesse que ser abatido, não seria parcela subdividida, mas somente arranjo
fatorial. Haveria dessa forma necessidade de compensar o tamanho amostral
aumentando o número de repetições.
Continuação da situação experimental anterior, porém com tempos de estocagem de
12, 24, 36.
O sêmen é estocado em uma temperatura constante e quando é descongelado, há
um tempo do retorno à condição de utilização. Sêmen eqüino em três tempos de
estocagem (12, 24 e 36 hs) × velocidade de retorno (A, B).
O ejaculado de um animal é dividida em 3 amostras (A1, A2 e A3). As 3
amostras serão sorteadas para tempo de estocagem T12, T24 e T36. Cada uma
das amostras será dividida em 2 alíquotas, as quais serão sorteadas para as
velocidades de retorno (VA e VB). Esse procedimento é realizado em todas as
repetições do experimento (animais).
Resposta: porcentagem de defeitos no acrossoma.
Blocos: os animais são blocados
Repetições: 10 animais produzindo 60 alíquotas de sêmen
41
Quando se tem tempo 12 e velocidade A, dentro dessa parcela 12 e desse mesmo
nível do fator de subparcela (A), a variação entre 8, 3, 10, ...,13, 4) é a variação
individual entre subparcelas, ou erro b. A parcela é composta pelos valores das
subparcelas. Quando é observado o valor total da parcela do nível 12, esse é
formado pela soma de 10 parcelas (8+12=20; 3+6=9; ...; 13+17=30; 4+9=13),
a variação individual entre essas parcelas é denominada erro a, ou variação
atribuída à parcela.
tempo de estocagem = parcela à erro a = variação entre estocagens
velocidade = subparcela à erro b = variação entre
velocidades
⇒ 30 parcelas e 60 subparcelas
SQ parcelas =
( 20 )2 + (25 )2 ... + (29 )2 (794 )2
− = 1.496,7333
2 60
Total de subparcelas na parcela
42
SQ animal
SQanimal =
(80 )2 + (57 )2 + ... + (63 )2 (794 )2
− = 566,7333
6 60
Total de repetições por animal
SQ tempo
SQtempo =
(177 ) + (251) + (366) (794)
2 2 2
−
2
= 907,0333
20 60
Total de repetições por tempo de estocagem
SQ erroa
22,9667
⇒ QMe a = = 1,2759
18
SQ velocidade
SQvelocidade =
V A2 VB2
+ − FC =
(311) + (483) − FC = 493,0667
2 2
30 30 30
Total de repetições por velocidade
SQ interação
43
Tratamentos à fatorial 2 × 3 = 6
T12A = 68 T24A = 95 T36A = 148
T12B = 109 T24B = 156 T36B = 218
SQtratamento =
(68)2 + (109 )2 + ... + (218)2 − FC = 1.422,1333
10
Total de repetições por tratamento
SQ errob
64,8999
⇒ QMe a = = 2,4037
27
Comparação de médias
Tempos Média
Velocidades 12 24 36 velocides
A 6,8 9,5 14,8 10,37
B 10,9 15,6 21,8 16,10
Média tempos 8,85 12,55 18,30
QM para erros:
QMea = 1,2759 (com 18 gl)
QMeb = 2,4037 (com 27 gl)
CV:
QM errob
CV = × 100 à média geral: X = G = 794 = 13,23
X 60 60
2,4037
CV = × 100 = 11,72%
13,23
44
dms
parcela à tempo de estocagem
subparcela à velocidade de retorno
1a.comparação:
S/P
níveis da subparcela / fixando a parcela
2a.comparação: P/S
1. S/P
2. P/S
45
QMea + (b − 1)QMeb
QMe ponderado = ⇒ b = número de
b
níveis do fator da
subparcela
ta × QMea + tb × (b − 1) × QMeb
t ponderado = ⇒ ta à t 5%, gl erro a
QMea + (b − 1) × QMeb
⇒ tb à t 5%, gl erro b
1. S/P
P/S
2.
dms para tempo/velocidade
1,2729 + (2 − 1) × 2, 4037
QMe ponderado = = 1,8398
2
2,101 × 1,2729 + 2, 052 × (2 − 1) × 2, 4037
t ponderado = = 2,0690
1, 2729 + (2 − 1)× 2,4037
2 × 1,8398
dms = 2,0690 × = 1,26
10
Comparação de médias
Tempos Média
Velocidades 12 24 36 velocidades
A 6,8 a A 9,5 b A 14,8 c A 10,37
B 10,9 a B 15,6 b B 21,8 c B 16,10
Média tempos 8,85 12,55 18,30
46
Comparação relatadas através das médias, nas margens da tabela
Tempos Média
Velocidades 12 24 36 velocidades
A 10,37 A
B 16,10 B
Média tempos 8,85 a 12,55 b 18,30 c
Vel A
Vel B
47
ASSOCIAÇÃO DE VARIÁVEIS QUANTITATIVAS
• Correlação de Pearson
• Regressão linear
Correlação
A correlação de Pearson mede a associação entre respostas independentes (variáveis
quantitativas). Para que a correlação seja utilizada, é pré-requisito que haja variação em
ambas as respostas. Se não houver variação em uma das respostas, a correlação será não
significativa.
(∑ x)(∑ y )
Soma de produtos
de X e Y
∑ xy − n ⇒ r(x, y) =
SPXY
r( x, y ) = SQ X × SQY
( x)2 ( y )2
∑ x2 − ∑ ∑ y 2 − ∑
Numerador Numerador
n n da S2X da S2Y
Exemplo:
48
Sx = 823 Sy = 759 Sxy = 52.135
Sx 2 = 56.541 Sy2 = 48.147
Aplicando-se a fórmula:
823 × 759
52.135 −
r(x, y) = 12
823
2
759 2
− −
12 12
56 .541 48. 147
⇒ r(x,y) = 68,8%
(1 + r )
IC (x,y) Z = 1 log e
2 (1 − r )
1
SZ =
n −3
49
1 1
SZ = = SZ = desvio Z = 0,33
12 − 3 9
O intervalo será:
IC = X ± 1,96 × S Z
Z2 = 1,497
0,191 1 1,497
Z
r
0,187 0,688 0,904
Exercício
Altura de filhos:
meninos (x) meninas (y) x ×y x2 y2
1 71 69 4.899 5.041 4.761
2 68 64 4.352 4.624 4.096
3 66 65 4.290 4.356 4.225
4 67 63 4.221 4.489 3.969
5 70 65 4.550 4.900 4.225
6 71 62 4.402 5.041 3.844
7 70 65 4.550 4.900 4.225
8 73 64 4.672 5.329 4.096
9 72 66 4.752 5.184 4.356
10 65 59 3.835 4.225 3.481
11 66 62 4.092 4.356 3.844
Total 759 704 48.615 52.445 45.122
( )2 576.081 495.616
1. Calcular r(x,y)
50
2. Avaliar se há significância pelo valor tabelado
759 × 704
48.615 − 48.615 − 48 .576 39 39
r(x, y) = 11 = = = = 0,55805
576.081 495.616 74 × 66 4.884 69,8856
52.445 − 11 45 .122 − 11
Cálculo do IC
(1 + 0,558 ) 1 1,558 1
= 2 log e (3,525 ) =
1,26
Z = 1 log e = log e = 0,629
2 (1 − 0,588 ) 2 0,442 2
1 à 1 1 1
SZ = SZ = = = = 0,353 SZ = desvio Z = 0,33
n −3 11 − 3 8 2,83
Z1 = - 0,063 ⇒ r1 = -0,063
Z2 = + 1,321 ⇒ r2 = +0,86
Aula 18 – 15/05
Após o estudo de delineamentos, estudamos estudos de associação de variáveis
qualitativas. Nos delineamentos os estudos de associação são para resposta
qualitativa em relação a tratamentos, para as quais pode ser feita contagem
(binomial ou multinomial). Pode ser feiro estudo de associação com grupos
experimentais com variável qualitativa (freqüência de prenhez resultante de
determinado tratamento). Para respostas qualitativas dicotômicas (binomiais),
pode-se fazer a contagem de indivíduos positivos e negativos. A contagem de
freqüências também pode ser feita para variáveis qualitativas multinomiais
(categóricas ordinais). Os estudos de associação pode ser feito para comparar
tratamentos ou levantamentos, sendo que para esses últimos as exigências
amostrais são maiores.
O índice de afastamento do ?2 é um estudo para verificar se a distribuição da
freqüência entre dois grupos. Para o ?2 as respostas são qualitativas para o
estudo de dispersão de freqüências entre dois grupos. É um tópico da estatística
não-paramétrica.
51
Correlação linear simples (Pearson)
Quando deseja-se verificar a associação entre variáveis quantitativas, não
dependentes, com o objetivo de conhecer tendências de respostas, estudos de
associação podem ser feitos com variáveis quantitativas, sendo que as duas
variáveis são respostas e não uma ssociação entre tratamento e resposta. Nesse
caso é realizada a correlação de Pearson(r). A correlação verifica a associação
entre resposta avaliada e outra resposta. As variáveis são independentes, ou
seja, alterar uma variável não implica na resposta de alteração na outra.
r+ r-
Teste de significância:
H0 : correlação = 0
H1 : não H0
Força de associação:
Acima de 75% é alta a correlação
Abaixo de 75% é fraca a associação
52
composição das variáveis é a mesma, o que muda é a quantidade (dose, concentração,
peso, etc). É um estudo em que uma variável varia em função da outra. Uma variável
pode ser determinada em função da outra, com relação de causa e efeito. A análise de
regressão pode ser realizada em todos os delineamentos, em tratamentos simples ou
quando há combinação de fatores.
Exemplo:
Tratamento àNíveis de fibra na dieta (7, 9, 11, e 13%) ⇒ variável
independente
Resposta à Ganho de peso do animal ⇒ variável dependente
O ganho de peso depende do nível de fibras, mas o nível de fibras não depende
do ganho de peso.
a
Y = a + bX
53
e Y é maior. O a, muitas vezes não tem valor biológico, mas o mais importante na
regressão é saber a taxa de variação de Y em relação a b.
A cada uma unidade da variável independente (X), b é a quantidade de unidades que
varia na variável dependente (Y). A grande vantagem da regressão é poder estimar
qualquer valor para Y, dentro do intervalo, a partir de valores de X. A extrapolação, ou
inferência de valores fora do intervalo estudados, deve ser vista com cautela, desde que
haja respaldo teórico sobre o comportamento das variáveis e até mesmo evitada, pois a
função linear pode não se manter constante para valores de X fora do intervalo. O
melhor é fazer um planejamento adequado para evitar extrapolação.
Após a regressão deve-se verificar se b (inclinação) é significativamente diferente de
zero ou se ela afasta de zero aleatoriamente. Esta verificação é realizada através de uma
dms. A inclinação zero (horizontal) significa que não há associação. Os níveis de
tratamento devem ter pelo menos 4 pontos diferentes, pois um dos pontos é perdido nos
graus de liberdade. Se há apenas 3 níveis de variação, a associação será sempre linear
com 2 pontos e portanto, nesse caso, há estatísticos que recomendam o teste de médias
em vez da regressão.
Se for o caso de verificar se três coeficientes de regressão são iguais, deve ser feito o
teste t entre eles.
54
Se fosse feito o quadro da ANOVA:
ei = Y OBSERVADOi – Yi e1
Desvios de cada
e2 ponto em relação
Sei =S(Y OBSERVADOi – Yi )= ZERO e3 à equação
Sei2 ? ZERO e4
Sei2 = S (Y OBSERVADOi – Yi)2
Sei2 = S [Y OBSERVADOi – (a + bXi)]2
55
∂ ∑ e i2
a ,b
∑ X × ∑Y
∑ XY − n à SPXY àsoma de produtos X e Y
b=
(∑ X )2 SQ X àsoma de quadrados de X
∑X
2
−
n
Situação experimental:
5 bodes Saanem
à estudo do aumento de temperatura na bolsa escrotal após insulação com tecido de lã
por 5 dias. As avaliações, em várias respostas medidas no ejaculado, são realizadas a
partir de 7 dias.
Resposta: frutose medida em mg/100ml aos 7, 14, 21 e 28 dias.
Delineamento: blocos casualizados
56
Y = a + bX à estimar uma
Bodes X (dias) Y (frutose) XY X2 função nesse modelo
1 7 531 3.717 49
Y = variável dependente ⇒ frutose
2 7 502 3.514 49
3 7 562 3.934 49
X = variável independente ⇒ número de
4 7 525 3.675 49
dias
5 7 498 3.486 49 n = 20
1 14 430 6.020 196
∑ xy − ∑ n ∑
x× y
⇒ SPXY
2 14 390 5.460 196
b=
( x) SQ X
3 14 450 6.300 196
∑x − ∑
2
2
4 14 404 5.656 196
− (− 15,68)×
7 .163 350
a=
2 28 160 4.480 784
Aula 19 – 17/05
Continuação do exemplo dos bodes...
A equação da regressão foi obtida: Y = 632,86 – 15,68X. Deve ser verificado então se a
equação pode ser utilizada para explicar a quantidade de frutose em relação aos dias de
avaliação após a insulação da bolsa escrotal.
No quadro da ANOVA os gl e a SQ para tratamento são colocados entre parênteses
porque são desdobrados, indo uma parte para o coeficiente e o restante para os desvios
da regressão.
Os desvios da regressão (falta de ajuste) são a diferença entre o valor estimado e o
valor médio do grupo.
57
O erro experimental é a variação entre os indivíduos (variação individual), ou seja, as
repetições dentro do mesmo grupo de tratamento.
Se esse modelo é adequado para explicar a quantidade de frutose em relação aos dias de
avaliação, grande parte da SQ será atribuída à regressão. Se o modelo não for adequado,
uma pequena fração da SQ será atribuída à regressão e uma parte maior ficará para os
desvios da regressão.
(7.163)2
SQtotal = (531) + (430 ) + ... + (200 ) − = 315 .558,55
2 2 2
20
Soma de quadrados de blocos (bodes) à [S(total de cada bloco)2 / num. de unidades] -FC
58
(1.414 )2 + (1.370 )2 + ... + (1.338)2 (7.163)2
SQbodes = − = 8.492,80
4 20
Como o tratamento é quantitativo, a SQtratamentos deve ser desdobrada. Foi feito o ajuste
para a equação de regressão. Será calculada a parcela da SQtratamentos que será atribuída à
regressão, sendo o restante referente aos desvios da regressão (falta de ajuste).
SQregr = ∑ Yˆi 2 −
(∑ Yˆ )i
2
(∑ X )× (∑ Y ) 2
(SP( ) ) 2 ∑ XY −
⇒ SQregr = XY
à n
SQregr =
SQ X (∑ X ) 2
∑X2 − n
ou
⇒ SQregr = b × SP( XY ) à
SQregr = b × ∑ XY −
(∑ X )× (∑ Y )
n
350 × 7.163
SQregr = −15,68 × 106 .148 − = 301.071,69
(= 301.070,87)
20
à na aula
É possível, antes mesmo de aplicar o teste, já definir que o modelo é bom, pois a
maior parte das SQ de tratamento está na regressão e somente uma pequena
fração restante será atribuída aos desvios.
Coeficiente de Variação
59
S 474, 5 à S2 = QMe = SQe/gl
CV = ×100 = × 100 = 6, 08%
X GERAL 358 ,15
QM fonte_ testada
Fcal =
QM erro 5%, gl da fonte testada, e gl do erro
301. 070,87
Fcal = = 634 ,5 ⇒ Ftab (dms)= 5%; 1; 12 = 4,7472
474,5
à no MS Excel: “=INVF(0,05;1;12)”
60
Teste para significância dos desvios (deve ser não significativo)
O desvio da regressão deve ser não seignificativo, porque se for significativo
quer dizer que a soma de quadrados dos desvios é relevante e outros modelos de
regressão devem ser testados para verificar se algum outro modelo é capaz de
incorporar essa soma de quadrados de desvios nesse modelo.
H0 : desvios da regressão = 0
H1 : não H0
150 ,44
Fcal = = 0,32 ⇒ Ftab = 5%; 2; 12 = 3,88
474,5
SQregressã o
R2 =
SQtotal
301. 070,87
no exemplo à R2 = × 100 = 95,5%
315 .558,55
SQregressã o
R2 = à R2 = r
SQtratamen tos
61
301 .070,87
no exemplo à R2 = × 100 = 99,9%
301 .371,75
b ± t a, gl × S(b)
QMerro
b ± tα , gl ×
SQx
474,5
− 15,68 ± 2,179 × ⇒ -17,04 a -14,32 mg/100ml
1 .225
(redução)
pares de observações (diferente da situação anterior que tem grupo experimental). Pode
ser feita quando há uma observação dependente em relação a outra independente.
Peso ao nascer (x) e peso à desmama de 6 bezerros da raça guzerá (em kgs).
X Y XY X2 Y2
25,3 48,4 1.225 640 2.343
26,8 49,7 1.332 718 2.470
26,5 49,2 1.304 702 2.421
27,4 50,0 1.370 751 2.500
27,9 50,6 1.412 778 2.560
25,9 48,7 1.261 671 2.372
S 159,8 296,6 7.903,35 4.260,56 14.665
média
62
∑ xy − ∑ n ∑
x× y
b=
( x)
∑x − ∑
2
2
296,6 × 159,8
7.903,45 −
b= 6 = 0,8221kg
4.260,76 −
(159,8)2
6
a = y −bx
296 ,6 159,8
a= − 0,8221 ×
6 6
a = 27
Y = 27 + 0,8221X
H0 : ß = 0
H1 : ß? 0
QM
Fcal = fonte_ testada
QMdesv _ regr
3,29
Fcal = = 117 ,5
0,028
Coeficiente de determinação
SQregressã o
R2 =
SQtotal
3,29
R2 = × 100 = 96,7 %
3,40
63
Escolha de testes de hipóteses e tipos de erro
Estudo de testes estatísticos. Até agora, somente foi utilizado o teste t de Student, apesar de
não ser o mais adequado para todas as situações. Todo teste de hipóteses apresenta 2
hipóteses:
• H0 à X tratamento1 = X tratamento2
• H1 à não H0
O teste bilateral iniclui a diferença sendo uma maior ou menor que a outra. Quando o teste
de hipótese tem como H1 como: X tratamento1 > X tratamento2 ou X tratamento1 <
X tratamento2 ; o teste é denominado unilateral
Realidade
H0 verdadeira H1 falsa
Aceitar H0 Decisão correta Erro tipo II ou ß
Rejeitar H0 Erro tipo I ou a Decisão correta
ß a
ß a
64
Teste F de Fisher
• H0 à os tratamentos são iguais
• H1 à existe pelo menos um tratamento diferente dos demais
6 repetições × 2 tratamentos
Fontes de variação gl SQ QM Fcalculado No. 3 gl
Total 11 SQtotal 17
Tratamento 1 SQtratamento SQtrat QM trat 2
QM trat =
gltrat QM erro
erro 10 SQerro SQerro 15
QM erro =
glerro
Ftab(a, gl trat , gl erro)
t= F
Contraste = comparação
Y=1m1 – 1m2 ⇒ contraste Sci = zero
S ci = 1 – 1 = zero
S ci . cj = zero
Teste t (Student)
m1 − m 2
tcal =
2QMe
r
⇒ Favorece erro tipo I ou a (aumenta erro tipo I, diminui erro
tipo II)
⇒ Pouco conservador
⇒ Uso: para respostas muito instáveis (CV > 30%); t = 4.
65
Teste Student Newman Keuls (SNK)
Devido à preocupação em reduzir a taxa de erro tipo I, foi proposto esse teste. No teste t, a
dms não considera as distâncias entre as médias à medida em que o número de tratamentos
aumenta. Quando há maior distância entre as médias, o teste SNK determina dms maior
para que seja mais exigente para determinar as diferenças.
1 1 2QMe
dms (SNK ) = qα nn '× V (Y ) = qα nn'× ×
2 2 r
QMe
dms (SNK ) = qα nn '× n à número de médias envolvidas na
r
comparação
n’ à gl de liberdade do erro
V(Y) = m1 – m2
S12 S 22 QMe QMe 2QMe
V (Y ) = + = + =
r r r r r
Exemplo
QMe
Trat1 dms 5 = q0, 05 5,12 ×
r
QMe
Trat2 dms 4 = q0 ,05 4,12 ×
r
Trat3 QMe
dms 3 = q 0, 05 3,12 ×
r
Trat4 QMe
dms 2 = q0 ,05 2,12 ×
r
Trat5
Teste de Tuckey
Preocupado com o trabalho de calcular várias dms, Tuckey passou a utilizar somente a dms
dos extremos, tornando o teste muito mais exigente, principalmente para as médias
adjacentes e mais próximas. A tabela de distribuição é a mesma de SNK.
QMe
dms (Tuckey ) = qα nn '×
r
n à número de tratamentos
n’ à gl do erro
⇒ Favorece erro tipo II ou ß (aumenta erro tipo II, diminui erro
tipo I)
⇒
⇒ Uso: CV < 15%
66
Teste de Duncan
O teste t exagera no erro tipo I, enquanto SNK e Tukey exageram no erro tipo II. Duncan
pegou o procedimento do SNK (várias dms) e usou uma distribuição de probabilidade
menos exigente. É mais rigoroso que teste t (controla mais o erro tipo I) e não erra tanto
no erro tipo II quanto o SNK e Tukey.
QMe
dms (Duncan ) = qα nn '×
r
Teste de Dunnett
Trat1 = controle
2.QMe
dms (Dunnett ) = D × à tabela A12
r
Trat2
n à gl do tratamento
n’ à gl do erro
Trat3
Trat4
Trat5
67
Teste de Scheffé
2.QMe
dms (Scheffé) = (t − 1).F .
r
Onde:
t = n° de tratamentos
F = F tabelado com n graus de liberdade do erro e n’ graus de liberdade da fonte testada
QMe = Quadrado Médio do erro na análise de variância
r = n° de repetições por tratamento
68