Você está na página 1de 61

Interpretação de dados

Ivani de Oliveira Negrão Lopes


Maria Cristina Neves de Oliveira

Londrina-PR
Março, 2018
Tópicos abordados

1 Introdução

2 Fundamentos da Estatı́stica Experimental

3 Interpretação de dados

4 Considerações finais
1 Introdução

2 Fundamentos da Estatı́stica Experimental

3 Interpretação de dados

4 Considerações finais
Most scientists “can’t replicate studies by
their peers”
http://www.bbc.com/news/science-environment-39054778

Science Needs a Solution for the


Temptation of Positive Results
Na ciência, resultados positivos são ‘tentação’ e
reprodutibilidade é desafio
Aaron E. Carroll, NYT
Tradução: http://www1.folha.uol.com.br/ciencia
A crise da reprodutibilidade
Bayer pharmaceuticals(2011): conduziu experimentos tentando reproduzir dados de 67
trabalhos da literatura (47 envolvendo câncer), obtendo resultados coincidentes com os
reportados originalmente em apenas 25% dos casos;
https://www.nature.com/articles/nrd3439-c1

Empresa de biotecnologia Amgen (2012): tentou reproduzir os resultados de 53


estudos, referências na proposição de novas estratégias para o tratamento de câncer,
mas conseguiram chegar às mesmas conclusões dos autores em apenas 11% dos casos;
https://www.nature.com/articles/483531a

Trabalho colaborativo mundialmente (2015): reportou que apenas 30-50% de 100


experimentos publicados em 2008 em três das maiores revistas de psicologia tiveram
seus resultados replicados em concordância com as conclusões originais, a depender do
critério usado para definir “similar”.
http://science.sciencemag.org/content/349/6251/aac4716.full
...
Por que?

Acredita-se que fraudes são raras. Mas:


Frequentemente, o que se vê na literatura é a “melhor” versão do que ocorreu;
Prevalece a cultura da valorização do impacto da descoberta em detrimento de sua
relevância e ou sua confirmação;
O interesse por resultados nulos, ou resultados diferentes dos esperados, é quase
inexistente;
Falta de transparência - dados precisam ser disponibilizados para facilitar a inspeção por
outros pesquisadores;
A mı́dia divulga novas descobertas, frequentemente exagerando sua importância e
seus benefı́cios, ao invés de promover uma análise crı́tica do resultado no contexto de
descobertas anteriores;
Ignora-se, ao menos inconsientemente, a relação entre conflitos de interesse financeiro e
viés na pesquisa;
...
“Sem saber se a literatura cientı́fica foi construı́da sob
base sólida ou areia, estamos desperdiçando
simultâneamente tempo e dinheiro”

Prof Malcolm Macleod, Neurocientista, Edinburgh, Escócia


https://www.nature.com/news/no-publication-without-confirmation-1.21509
A produção agrı́cola é uma atividade empı́rica com
caracterı́sticas únicas:
Incertezas na produção, principalmente devido a:
▸ condições climáticas;
▸ pragas e doenças;
▸ histórico de diversificação de culturas;
▸ histórico do manejo dos solos;
Alta variabilidade entre:
▸ zonas climáticas;
▸ regiões;
▸ fazendas;
▸ produtores;
▸ adoção de tecnologias de produção;

Foto: ION Lopes


ION Lopes & MCN Oliveira Interpretação de dados 8 / 61
A ciência agrı́cola é uma parceira
do produtor na busca contı́nua de
respostas a questões importantes
que interferem na sustentabilidade
da produção agrı́cola.

Foto: ION Lopes


ION Lopes & MCN Oliveira Interpretação de dados 9 / 61
1 Introdução

2 Fundamentos da Estatı́stica Experimental

3 Interpretação de dados

4 Considerações finais
Experimentação agrı́cola
Experimentação: Investigação planejada a fim de se obter fatos
novos ou de se confirmar/negar resultados de experimentos prévios
[6].

SE: conhecimento novo é resultado de cuidadosa análise e


interpretação de dados,

ENTÃO: é fundamental que se invista tempo no planejamento


experimental de modo a maximizar o volume de informação obtida e
reduzir o dispêndio de recursos.

A qualidade dos dados é um pré-requisito para que as análises


estatı́sticas produzam resultados úteis.

ION Lopes & MCN Oliveira Interpretação de dados 11 / 61


Tipos de experimentos quanto ao propósito [6]
1 Preliminar: grandes quantidades de tratamentos são testadas
em busca de direções para futuros trabalhos; geralmente a
maioria dos tratamentos aparecem apenas uma vez;
Inspeção individual - sem finalidade de comparações.
2 Avaliação/Inspeção/Confirmação: as respostas mensu-
radas/observadas de diferentes tratamentos são comparadas
usando um número de observações que dê uma segurança
aceitável de que diferenças significativas serão detectadas;
Todos vs Todos.
3 Demonstrativo: compara um tratamento novo com trata-
mento padrão.
Novo vs Padrão.

ION Lopes & MCN Oliveira Interpretação de dados 12 / 61


Princı́pios da experimentação

1 Repetição: torna possı́vel a estimação do erro experimental;


2 Casualização: garante que as estimativas são estatı́stica-
mente válidas;
3 Controle local: reduz o erro experimental, quando as unidades
experimentais são heterogêneas.

ION Lopes & MCN Oliveira Interpretação de dados 13 / 61


Sobre o erro experimental
Inerente à variação no material experimental ou à qualquer
falta de uniformidade nas condições de condução do experi-
mento;
Não pode ser eliminado, mas deve ser reduzido:
▸ identificando fontes de heterogeneidade no material experimental;
▸ acomodando fontes de desuniformidade por meio de blocos;
▸ adotando um número de repetições adequado;
▸ uniformizando critérios adotados em cada etapa com a equipe.

Requisito à aplicação de testes de significância e à estimação


de intervalos de confianças;
A precisão e a sensibilidade são inversamente proporcionais à
variância da média: σx̄ 2 = σ 2 /n. À medida que n cresce, σx̄2
diminui;

Erro Padrão da Média (EPM) σx̄ = σx̄2 .
ION Lopes & MCN Oliveira Interpretação de dados 14 / 61
Tratamentos

O processo/material cujo efeito se deseja medir. Pode conter:

apenas uma fonte de variação: genótipo, doses de um defen-


sivo/adubo, sistema de plantio, etc.;
Sorteio considera apenas a homogeneidade das parcelas.

duas ou mais fontes de variação: genótipo x espaçamento;


genótipo x espaçamento x densidade, etc..
Exemplos: experimentos fatoriais, experimentos em parcelas
subdivididas (split-plot) e experimentos faixas (strip-plot).
Sorteio considera a homogeneidade das parcelas, a facilidade de
aleatorização das combinações das fontes de variação e a precisão
desejada nas estimativas dos efeitos.

ION Lopes & MCN Oliveira Interpretação de dados 15 / 61


Delineamentos experimentais
Delineamento Inteiramente Casualizado (DIC)
Tab. 1: Análise de variância (Anava)
Modelo estatı́stico:
FV GL
yij = µ + τi + eij , em que: Tratamentos 3
Erro 12
yij = dado observado na Total 15
parcela ij;
µ = média do experimento;
τi = efeito do tratamento i;
eij = erro experimental na
parcela ij, eij ∼ N(0, σ 2 ).

Fig. 1: Sorteio DIC

ION Lopes & MCN Oliveira Interpretação de dados 16 / 61


Delineamentos experimentais
Delineamento em Blocos Casualizados (DBC) Tab. 2: Anava

FV GL
Modelo estatı́stico: Tratamentos 3
Blocos 3
yij = µ + τi + βj + eij , em que: Erro 9
yij = dado observado na parcela ij; Total 15
µ = média do experimento;
τi = efeito do tratamento i;
βj = efeito do bloco j;
eij = erro experimental na parcela ij,
eij ∼ N(0, σ 2 ).

Fig. 2: Sorteio DBC

ION Lopes & MCN Oliveira Interpretação de dados 17 / 61


Experimento fatorial
Tab. 3: Anava fatorial

FV GL
Bloco 3
Genótipo (G) 1
Espaçamento (E) 1
GxE 1
Erro 9
Total 15
Fig. 3: Sorteio fatorial DBC.

Erro padrão para comparar quaisquer duas médias: 2σ 2 /n
No exemplo:
● Comparações no fatorial G × E , n =r =4
● Comparações de nı́veis de G , n =r ×nE = 8
● Comparações de nı́veis de E , n =r ×nG = 8
ION Lopes & MCN Oliveira Interpretação de dados 18 / 61
Experimento parcelas subdivididas

Tab. 4: Anava parcelas subdivididas

FV GL
Bloco 4−1=3
Espaçamento (E) 2−1=1
Erro (a) 3×1=3
Parcela 4×2−1=7
Genótipo (G) 2−1=1
GxE 1×1=1
Erro (b) 2×3×1=6
Subparcela 2×4×1=8
Total 2 × 2 × 4 − 1 = 15
Sorteio parcelas subdivi-
Fig. 4:
Erros padrões para comparar: didas DBC.

dois nı́veis de E: 2Ea /rnG , n=rnG

dois nı́veis de G: 2Eb /rnE , n=rnE

dois nı́veis de G dentro de um nı́vel de E: 2Eb /r , n=r

dois nı́veis de E dentro de um nı́vel de G: 2[(nG − 1)Eb + Ea ]/rnG , n=rnG
ION Lopes & MCN Oliveira Interpretação de dados 19 / 61
Experimento em faixas
Cada fator é casualizado em uma direção do bloco, sim-
bolicamente denominadas faixas horizontais e verticais.

Tab. 5: Anava

FV GL
Bloco 4−1=3
Densidade (D) 2−1=1
Erro (a) 3×1=3
Espaçamento (E) 2−1=1
Erro (b) 3×1=3
DxE 1×1=1
Erro (c) 3×1×1=3
Total 3 × 2 × 2 × 4 − 1 = 15

Erros padrões para comparar:



nı́veis de D: 2Ea /rnD

nı́veis de E: 2Eb /rnE

nı́veis de D dentro de E: 2[(nE − 1)Ec + Ea ]/rnD

nı́veis de E dentro de D: 2[(nD − 1)Ec + Eb ]/rnE Fig. 5: Sorteio faixas
ION Lopes & MCN Oliveira Interpretação de dados 20 / 61
LEMBRE-SE!
O erro padrão da média, utilizado na com-
paração de médias, pode variar para diferentes
comparações dentro de um experimento, a
depender do delineamento. Portanto, essa
variação pode, por exemplo, levar à conclusão
de que uma diferença de 180 kg ha−1 (e não
uma diferença de 200 kg ha−1 ) entre as médias
dois tratamentos é significativa.
1 Introdução

2 Fundamentos da Estatı́stica Experimental

3 Interpretação de dados

4 Considerações finais
Regras gerais ao interpretar dados
Interpretar dados de pesquisa é contar uma história com inı́cio, meio e
fim. Por isso, lembre-se de informar:
▸ a motivação do trabalho;
▸ as principais hipóteses agronômicas investigadas;
▸ o delineamento experimental, inclusive a caracterização da parcela;
▸ tratos agronômicos;
▸ variáveis observadas/aferidas para fins de teste de significância de hipóteses
estatı́sticas;
▸ metodologias envolvidas nas analises estatı́sticas dos dados, inclusive análises
de adequação dos modelos adotados;
▸ estatı́sticas úteis à compreensão dos dados - escolha um formato de apre-
sentação que esteja de acordo com o foco da discussão (tabelas, gráficos ou
informe diretamente no texto).

Discussões de resultados estatı́sticos devem se limitada ao que o(s)


modelo(s), estatı́sticas ou testes adotado(s) permitem concluir;
Inferências agronômicas, mesmo fundamentadas nas análises estatı́sticas,
devem levar em consideração o escopo do estudo.

ION Lopes & MCN Oliveira Interpretação de dados 23 / 61


Análise descritiva
Estatı́sticas descritivas e gráficos são particularmente úteis para se construir uma
visão geral experimento - não há preocupação com comparações ou significância
de efeitos.
Observe que:
a moda depende de frequências;

a mediana depende de posição


- 50% da massa de dados é
inferior à mediana e os demais
50% são superiores a ela;
a média depende de todos
os dados e, por isso, ela é
um valor tı́pico apenas de
distribuições simétricas;
MTCs são iguais apenas em
distribuições simétricas;
Fig. 6: Medidas de tendência central (MTC). Adaptado a média da distribuição as-
de wikipedia/lognormal simétrica é um valor atı́pico da
distribuição simétrica;
quanto maior a variância, mais
dispersa será a massa de dados
no eixo-x.
ION Lopes & MCN Oliveira Interpretação de dados 24 / 61
Análise para fins de inferências
Envolve testes de significância de hipóteses estatı́sticas formuladas
nos parâmetros dos modelos adotados. Testes devem ser escolhidos
paralelamente à construção das hipóteses, na fase de planejamento
do experimento.

Hipóteses estatı́sticas

H0 : afirmação a respeito de estatı́sticas que descrevem


uma variável resposta.
H1 : negação de H0 , o que pode ser assumido quando H0
é rejeitada.

ION Lopes & MCN Oliveira Interpretação de dados 25 / 61


Erros de decisão

Verdade desconhecida
Decisão baseada nos dados
H0 é verdadeira H0 é falsa
Erro tipo II
Aceitar H0 OK β é probabilidade de
se cometer esse erro
Erro tipo I
Rejeitar H0 α (significância, p) OK1
é probabilidade de
se cometer esse erro

Exemplos de possı́veis consequências desses erros:


Erro tipo I - recomendar um tratamento ineficaz, ou de eficácia inferior.
Erro tipo II - deixar de recomender um tratamento com eficácia diferenciada.

1
A probabilidade de se rejeitar H0 falsa é chamada de poder do teste.
ION Lopes & MCN Oliveira Interpretação de dados 26 / 61
Sobre testes estatı́sticos de significância
Testes estatı́sticos fornecem evidências quantitativas para a
verificação da incompatibilidade entre um conjunto de dados e um
modelo proposto.
A área abaixo da curva indica probali-
dades e seu total é igual a 1;

Valores extremos são menos


prováveis. Na figura ao lado, por
exemplo, a probabilidade da variável
X assumir um valor abaixo -1,96 ou
acima de 1,96 é 0,05 ou 5%;

Regiões de significância e de con-


fiança são estabelecidos pelo
pesquisador, em geral em observância
à valores adotados por seus pares;

Testes estatı́sticos são construı́dos


a partir de um conjunto de pressu-
Fig. 7: Exemplo distribuição nor-
posições e da hipótese H0 .
mal.
Análise de adequação de modelos
São pré-requitos à validade de resultados obtivos por meio de
modelos anava, e de testes de comparações múltiplas:

Aditividade do modelo;
Os blocos influenciaram os tratamentos uniformemente?

Homogeneidade de variância ou homocedásticidade;


A variância dos resı́duos pode ser assumida constante para os diferentes
tratamentos?

Independência de resı́duos;
Há efeito que não foi explicado pelo modelo?

Normalidade de resı́duos;
As estimativas são viciadas/tendenciosas?

O não atendimento dessas pressuposições pode indicar a presença de


outliers ou inadequação do modelo ajustado.
ION Lopes & MCN Oliveira Interpretação de dados 28 / 61
Tab. 6: Dados-exemplos de produtividade de soja cultivada sob quatro
tratamentos, em cinco blocos. Valores observados (Prod), estimados
(Pred) e resı́duo (Erro).
Tratamento Bloco Prod (y ) Pred (ŷ ) Erro=y − ŷ
1 1 5272 4578 694
1 2 4330 4277 53
1 3 4446 4728 -282
1 4 4590 4609 -19
1 5 3639 4085 -446
2 1 3477 3400 77
2 2 3324 3099 225
2 3 3605 3550 54
2 4 3270 3431 -161
2 5 2713 2907 -195
3 1 4765 5397 -632
3 2 5699 5097 602
3 3 5305 5547 -242
3 4 5395 5429 -34
3 5 5211 4905 306
4 1 4173 4312 -139
4 2 3132 4011 -880
4 3 4931 4462 469
4 4 4558 4343 214
4 5 4154 3819 334
Média - 4299 4299 0

ION Lopes & MCN Oliveira Interpretação de dados 29 / 61


Interpretação anava
Anava tem como resultado a partição da variação total dos dados entre os
fatores fixos e aleatórios considerados no modelo.

Tab. 7: Exemplo anava

FV GL SQ QM F Pr > F
Bloco 4 1.127.254 281.813 1,14 0,3852
Tratamento 3 10.157.997 3.385.999 13,66 0,0004
Resı́duo 12 2.974.120 247.843 - -
Total 19 14259371 - - -
CV= 11,6% R2 =79,1% Média Geral=4299,4

1 H0 : µ1 = µ2 = ... = µ4 e H1 : µi ≠ µi ′ , i, i ′ = 1, ..., 4 para algum i e i ′ tal que i ≠ i ′ ;

R2 = SQ mod = Tratamento = 79, 1% indica a proporção da variância total que é


SQ SQ +SQ
Bloco
2
Total SQTotal
devida ao efeito de bloco e de tratamento;
3 A significância exata (Pr > F) associada ao efeito de tratamento é igual a 0,0004.
Ou seja, o risco de se rejeitar incorretamente a hipótese H0 (Tratamento) é próximo a
zero.
4 H0 deve ser rejeitada, mas H1 não permite a identificação de quantas médias diferem
entre si e nem quais são essas médias.

ION Lopes & MCN Oliveira Interpretação de dados 30 / 61


Interpretação anava. Continuação...
Para o exemplo:
σ̂ 2 = 247.843 é uma estimativa da variância residual

σ̂x̄ = 247.843
5
= 222, 64 é uma estimativa do EPM de um tratamento

σ̂d = 2 × 247.843
5
= 315 é uma estimativa do EP da diferença entre duas médias

Diferença Mı́nima Significativa (DMS)


A DMS = tα σ̂d , em que tα é o α-percentil da distribuição t com GL igual ao
GL do resı́duo, só deve ser usada para testar diferenças estabelecidas na fase de
planejamento do experimento, isto é, antes de se conhecer os dados. Caso todas
as comparações entre duas médias sejam igualmente importantes, um teste de
comparações múltiplas deve ser escolhido, também na fase de planejamento.

ION Lopes & MCN Oliveira Interpretação de dados 31 / 61


Testes de Comparações Múltiplas (TCM)
TCM são aplicados quando há evidências pelo teste F de que há diferenças sig-
nificativas entre pares de médias e quando todas as comparações são igualmente
importantes. Uma classificação devida à Hsu (1996) [4] categoriza os TCMs de
acordo com:
Tipo de comparação aplicada;
▸ Comparações entre todos os pares de médias;
▸ Comparações entre a média de um controle e todas as demais
médias.
Força da inferência
▸ Relacionada à maneira como o TCM controla a taxa de erro de
decisão. A maior parte dos TCMs controlam o erro tipo I. Leia:
Madden (1982) [5], Furtado (1999) [3] e Borges (2003) [2].

ION Lopes & MCN Oliveira Interpretação de dados 32 / 61


TCM. Continuação...
No exemplo, há quatro médias a serem comparadas. Assumindo que todas as
comparações são igualmente importantes, há m =4(4 − 1)/2=6 pares de médias
distintos a serem comparadas. Isto é, há seis hipóteses a serem testadas.

2 3 4
1 H0(1) : µ1 = µ2 H0(2) : µ1 = µ3 H0(3) : µ1 = µ4
2 - H0(4) : µ2 = µ3 H0(5) : µ2 = µ4
3 - - H0(6) : µ3 = µ4

1 O controle da taxa de erro tipo I pode ser feito por comparação/hipótese


(TEC) ou por famı́lia de hipóteses (TEE);
2 A real quantidade de H0 s que são verdadeiras (ou falsas) é desconhecida;
3 TCMs se divergem principalmente pelo modo como controlam a taxa de
erro tipo I;

ION Lopes & MCN Oliveira Interpretação de dados 33 / 61


Orientações gerais quanto à TCM
1 TCMs que controlam apenas a TEC, devem ser evitados quando há mais
de três médias e todas as comparações são igualmente importantes;

2 Alguns TCMs controlam bem a TEE apenas quando H0 é verdadeira


para todas as comparações, como por exemplo no caso em que o teste F
é não significativo;

3 Alguns TCMs controlam bem a TEE mesmo quando H0 é verdadeira


apenas parcialmente. Isto é, H0 não é verdadeira para todas as com-
parações. Esses TCMs visam assegurar que a Máxima Taxa de Erro
por Experimento (MTEE) é menor que α/m, em que m é o número de
hipóteses/comparações.

ION Lopes & MCN Oliveira Interpretação de dados 34 / 61


Caracterı́sticas de alguns TCM
Tab. 8: Tab. Alguns TCM para comparações par-a-par

Teste Controle de erro


t-student TEC
Duncan TEC
Student-Newman-Keuls (SNK) TEE
Tukey2 MTEE
Bonferroni MTEE
Sidak MTEE
Scheffé MTEE

1 Se uma diferença é não significativa, ambas médias recebem um identifi-


cador comum, em geral letras.
2 A escolha de um TCM deve ser orientada pelas hipóteses estabelecidas
no planejamento e pelos custos atribuı́veis aos erros tipo I e tipo II;
3 Estudos com dados simulados mostraram que os testes de Tukey, Scheffé
e SNK apresentaram excelentes proteções contra o erro tipo I por experi-
mento [7, 8].
2
Mais poderoso que Bonferroni, Sidak e Scheffé [5]
2 ION Lopes & MCN Oliveira
Mais poderoso que Bonferroni, Sidak e Scheffé [5]de dados
Interpretação 35 / 61
Caracterı́sticas de alguns TCM ...

Tab. 9: Algumas opções de testes de significância para contrastes

Teste Controle de erro


t-student TEC
Dunnett TEC
Bonferroni TEE
Sidak MTEE
Scheffé MTEE

1 Essa classe de TCMs é preferı́vel quando apenas algumas comparações


possuem interpretação de interesse;
2 Todos os contrastes de interesse devem ser estabelecidos na fase do
planejamento experimental.

ION Lopes & MCN Oliveira Interpretação de dados 36 / 61


Interpretação de resultados de TCM

Tab. 10: Resultado do teste de Tukey Evidência de diferenças entre


para o exemplo
os tratamentos:

Tratamento Média 3 e 4;
3 5275 A
1 4455 A B
4 4190 B C 3 e 2;
2 3278 C
DMS = 934,76 qtab =4, 20 1 e 2;
Médias seguidas de mesma letra não diferem entre
si, de acordo com o teste de Tukey (p ≤ 0, 05)

A DMS apresentada na tabela é dada por:


DMS =4, 20× σ̂x̄ =4, 20×222, 64=934, 76.
Portanto, para que uma diferença d =300 nesse experimento fosse significativa
pelo teste de Tukey (p ≤ 0, 05), o erro padrão deveria ser inferior a 71, 4.

ION Lopes & MCN Oliveira Interpretação de dados 37 / 61


Interpretação de resultados de TCM

Tab. 11: Resultado do teste de Duncan As regiões crı́ticas são variáveis.


para o exemplo Para t tratamentos, são calcu-
ladas t − 1 DMS.
Tratamento Média
3 5275 A
1 4455 B Nº de Médias DMS
4 4190 B 2 686,0
2 3278 C 3 718,1
Médias seguidas de mesma letra não diferem entre 4 737,5
si, de acordo com o teste de Ducan (p ≤ 0, 05)

Mesmo considerando um teste menos conservador, as DMS são bastante


elevadas. Um exame cauteloso nos dados pode indicar possı́veis causas da alta
variabilidade.

ION Lopes & MCN Oliveira Interpretação de dados 38 / 61


Interpretação de resultados de TCM
Tab. 12: Um exemplo de interpretação de TCMs em um
experimento com 18 tratamentos e quatro repetições

Tratamento Média Duncan Tukey


Trat17 3250 A A
Trat18 3167 AB A √
Trat16 3015 A BC AB DMS Tukey=527,8;
Trat11 3006 A BC AB
Trat8 2961 BC ABC √
DMS Duncan=variável;
Trat10 2853 BC D ABCD
Trat13 2782 CD E ABC DE √
Trat14 2738 CD E F AB C DE O teste de Duncan detectou
Trat15 2723 CD E F AB C DE mais diferenças significativas do
Trat7 2620 DE F BC DE que o teste de Tukey;
Trat9 2609 DE F BC DE
Trat12 2558 DE FG BC DE √
Seriam todas essas difer-
Trat6 2502 E FG BC DE F enças significativas legı́timas?
Trat5 2441 FG C DE F
Trat3 2433 FG DE F
Trat2 2281 GH E F
Trat4 2258 GH E F
Trat1 2024 H F

ION Lopes & MCN Oliveira Interpretação de dados 39 / 61


Interpretação de resultados de TCM
Tab. 13: DMS variável para o teste de
Duncan com 18 médias.
Observe que:

Nº Médias DMS γ γ é a TEE do teste de Duncan, dada por:
2 289 0,050 γ = 1 − (1 − α)k−1 , em que α = 0, 05 é
3 304 0,098 a probabilidade do erro tipo I por hipótese
4 313 0,143 e k (k = 2, ..., 18) é o número de médias
5 321 0,185 consideradas em cada hipótese;
6 326 0,226
7 330 0,265 √
A significância (γ ) com que a hipótese de
8 334 0,302
igualdade entre k médias (k = 2, ..., 18) foi
9 337 0,337
testada, variou entre 5,0% e 58,2%.
10 339 0,370

11 342 0,401
12 344 0,431 A força da inferência fornecida pelo teste de
13 345 0,460 Duncan reduz à medida que a quantidades de
14 347 0,487 médias aumenta;
15 348 0,512
16 349 0,537
17 350 0,560
18 351 0,582

ION Lopes & MCN Oliveira Interpretação de dados 40 / 61


Alternativas aos TCMs

Em experimentos com grande número de tratamentos, a interpretação de


resultados de TCMs pode se tornar confusa, visto que podem surgir dezenas de
grupos. Nesses casos, uma alternativa é o critério de agrupamento de Scott &
Knott (1974) [9] ou uma modificação proposta por Bhering (2008) [1].
Importante lembrar que:
SK é um algoritmo de agrupamento particional para a análise de variância e não um
TCM;
Em cada etapa, o algoritmo encontra a partição que maximiza a variância entre os
grupos. Essa variância é então comparada à variância residual (estimador de máxima
verosimilhança da variância residual) e testada pelo teste de Chi-quadrado com nı́vel
α de significância e v graus de liberdade, em que v é grau de liberdade do resı́duo;
Não há controle de taxa de erro por experimento. No entanto, estudos com dados
simulados indicam que a taxa de erro tipo I real obtida pelo teste de SK é muito
próxima aos valores obtidos pelo teste de Tukey, quando há grande quantidade de
tratamentos.

ION Lopes & MCN Oliveira Interpretação de dados 41 / 61


Interpretação de interações

Fig. 8: Possı́veis resultados de interações entre dois fatores A e B. Adaptado de [6]


ION Lopes & MCN Oliveira Interpretação de dados 42 / 61
Interpretação de interações
Tab. 14: Anova experimento fatorial 9×4 Tab. 15: Porcentagem de sementes
boas, por genótipo
FV GL F Pr > F
Bloco 4 2,9 0,0233 Genótipo Médiaa
Genotipo (G) 8 4,4 <0,0001 1 75,0 AB
Percevejo (P) 3 89,4 <0,0001 2 74,0 AB
GP 24 0,92 0,5743 3 71,5 B
Erro 140 - - 4 69,7 B
Dados: CB Hoffman-Campo
5 73,6 B
6 66,3 B
7 84,8 A
Não houve interação significativa entre os 8 68,6 B
fatores genótipo e percevejo; 9 73,5 B
Os fatores simples podem ser interpretados
diretamente;
Tab. 16: Porcentagem de sementes
σ̂ 2=125, 02; nG =5×4=20; nP =5×9=45
boas, por população de percevejos
σ̂x̄G =2, 5; qtab=4, 46; DMSG =11, 1
Pop. percevejos Médiaa
σ̂x̄P =1, 7; qtab=3, 68; DMSP =6, 1 0 95,7 A
4 80,8 B
8 70,0 C
16 58,7 D
a
Médias seguidas de letras iguais não diferem entre si (Tukey, p<0,05)
ION Lopes & MCN Oliveira Interpretação de dados 43 / 61
Interpretação de interações
Tab. 17: Anova GP/P
Embora a interação tenha sido não
Pop. percevejo F Pr > F significativa, considerando-se todos
0 1,80 0,0814 os nı́veis de GP, o desdobramento da
2 1,40 0,2009 interação pode revelar interação em
3 1,78 0,0863 nı́veis especı́ficos. O desdobramento
4 2,21 0,0304 GP/P mostrou que há diferenças
significativas entre as médias de ao
menos dois genótipos quando expostos
Tab. 18: Porcentagem de sementes boas de
a 16 percevejos/parcela.
nove genótipos dentro de diferentes pop.
percevejos
Nº de percevejos
Genótipo
0 4 8 16 n=5
7 98,3 A 87,3 A 80,1 A 73,4 A
2 97,7 A 81,6 A 69,9 AB 58,4 AB σ̂x̄G /P =5
9 96,9 A 80,7 A 68,9 AB 56,5 AB
qtab =4, 46
5 95,6 A 79,3 A 68,3 AB 54,9 AB
1 94,3 A 79,0 A 67,0 AB 53,6 AB DMSG /P =22, 3
3 94,3 A 78,2 A 66,8 AB 51,3 AB
4 91,7 A 72,2 A 61,5 AB 51,0 B
6 83,7 A 70,9 A 61,4 AB 50,4 B
8 78,8 A 68,5 A 56,5 B 48,9 B

ION Lopes & MCN Oliveira Interpretação de dados 44 / 61


Interpretação de interações
A resposta dos genótipos à popu-
laçãoes crescentes de percevejo é
mais informativa se for explorada
a natureza quantitativa do fator
percevejo.

Para o exemplo, a relação SB×Pop.


percevejos foi melhor descrita pelo
modelo de regressão assintótico
[10]. Tal modelo permitiu comparar
as respostas dos genótipos por meio
das taxas de variação das curvas.
Observe que a curva do genótipo
7 apresentou a menor taxa, o que
pode estar indicando uma maior
tolerância desse genótipo a maiores
Fig. 9: Porcentagem de sementes boas de nove genóti-
infestações de percevejos.
pos expostos a diferentes pop. percevejos

ION Lopes & MCN Oliveira Interpretação de dados 45 / 61


Interpretação de interações
Tab. 19: Anova experimento Visto que as interações AB, AC e ABC
fatorial 21×2×3 são significativas, a interpretação direta de
um efeito simples pode não ser válida na
presença dessas interações;
FV GL F Pr > F
A 20 164,8 <0,0001
B 1 1,4 0,2452
C 2 5,0 0,0073 A falta de significância da interação BC,
AB 20 3,6 <0,0001 pode estar indicando que a significância
AC 40 7,4 <0,0001 da interação ABC pode ser explicada pela
BC 2 0,9 0,4288 significância das interações AB e AC;
ABC 40 3,2 <0,0001
Dados: CV Godoy

Duas alternativas são igualmente aceitáveis:


▸ Desdobrar a interação ABC - mais detalhada;

▸ Desdobrar a interação AB e AC;

ION Lopes & MCN Oliveira Interpretação de dados 46 / 61


Tab. 20: Comparação de médias resultante da interação AB.

A B
▷ σ̂ 2 foi estimado com
1 2
diferentes valores de n.
16 a 123,9 A b 60,6 A
Para:
14 a 96,9 A a 66,7 A
7 a 67,1 AB b 35,7 ABC ● nı́veis de B
5 a 50,5 BC a 45,3 AB dentro de um nı́vel de
1 a 34,5 BCD a 22,7 BCDE A, n = 2×4 = 8;
3 a 26,8 BCD a 21,1 BCDE ● nı́veis de A
9 a 21,8 CDE a 16,3 CDEF dentro de um nı́vel de
17 b 19,1 DEF a 37,4 ABC B, n = 21×4 = 84;
10 a 17,7 DEFG a 30,0 ABCD
▷ Observe que dentro
21 b 16,2 DEFGH a 40,6 ABC
11 a 14,1 DEFGH a 11,3 EFG
de B1 :
4 a 9,6 EFGH a 11,7 DEFG
15 a 7,3 FGHI a 7,7 FG ● x̄16 − x̄7 = 56, 8,
2 a 6,9 GHI a 5,2 G não é significante;
12 a 6,6 HI a 4,9 G ● x̄20 − x̄18 = 0, 5, é
6 a 3,5 I b 1,5 H significante;
19 b 2,9 I a 6,7 FG
20 a 0,6 J a 0,3 I Por que?
8 a 0,3 JK a 0,2 I
13 a 0,2 K a 0,3 I
18 a 0,1 K a 0,2 I
Médias seguidas de mesma letra maiúscula na vertical ou por letra minúscula
na horizontal não diferem entre si (Tukey, p ≤ 0, 05).
ION Lopes & MCN Oliveira Interpretação de dados 47 / 61
Interpretação de interações

Tab. 21: Anova conjunta de um experimento em parcelas subdivididas

Fatore de variação σ̂x̄ GLFator GLDen Pr > F


Local (L) 60 1 18,3 <0,0001
Bloco(L) - 6 18,3 0,9935
Densidade (D) 84 3 18,3 0,2897
LD 120 3 18,3 0,0392
Genótipo (G) 106 7 165,8 <0,0001
LG 151 7 165,8 <0,0001
GD 219 21 165,7 0,0611
LGD 320 21 165,7 <0,0001
Dados: GF Vilela & JSS Foloni

1 Graus de liberdade ajustados pela fórmula de Satterthwaite;


2 A parcela foi definida pela densidade e a subparcela pelo
genótipo;
3 Os efeitos de todas as interações foram significativos.

ION Lopes & MCN Oliveira Interpretação de dados 48 / 61


Principal hipótese agronômica
A produtividade da cultura da soja depende da densidade de plantio, do genótipo escolhido e
das caracterı́sticas do local de plantio.

Hipóteses estatı́sticas testadas para verificação da hipótese agronômica


H0(1) ∶ µL1 = µL2 (Interpretada por meio das interações!)
H0(2) ∶ µD1 = µD2 = µD3 = µD4 (Interpretada por meio das interações!)
H0(3) ∶ µG 1 = µG 2 = ... = µG 8 (Interpretada por meio das interações!)
H0(4) ∶ µLD11 = µLD12 = ... = µLD24 (Rejeitada!)
Portanto: ao menos uma densidade de plantio alterou significativamente produtivi-
dade média entre locais.
H0(5) ∶ µLG 11 = µLG 12 = ... = µLG 28 (Rejeitada!)
Portanto: a produtividade de ao menos um genótipo foi significativamente diferentes
entre locais.
H0(6) ∶ µGD11 = µGD12 = ... = µGD84 (Rejeitada!)
Portanto: a densidade de plantio alterou significativamente a produtividade média de
ao menos um genótipo.
H0(7) ∶ µLGD111 = µLGD112 = ... = µLGD284 ; (Rejeitada!)
Portanto: a produtividade de ao menos um genótipo, em ao menos uma densidade de
plantio, foi significativamente diferentes entre locais.

Em quais nı́veis desses fatores ocorreram as diferenças significativas?


ION Lopes & MCN Oliveira Interpretação de dados 49 / 61
A interpretação de experimentos envolvendo mais de um fator é sempre mais simples quando se
inicia o exame dos resultados a partir de um painel gráfico.

Fig. 10: Produtividade média de oito genótipos de soja em diferentes densidades de semeadura,
em dois locais. Letras indicam os resultados das comparações entre médias de densidades para
cada genótipo, em cada local (Tukey, p ≤ 0, 05)).
ION Lopes & MCN Oliveira Interpretação de dados 50 / 61
Principais padrões observados no painel
A caracterı́stica de cada local foi o fator que mais influenciou a produtividade da soja
no experimento;
A produtividade média no local L1 foi tipicamente superior ao local L2;
A resposta dos genótipos à densidade depende fortemente das caracterı́sticas do local;

Dentro de cada local, o fator que mais influenciou a produtividade foi o genótipo;
A densidade de semeadura foi um fator crı́tico na produtividade de diferentes genóti-
pos em cada local;
Se a densidade cresce de D1 à D4, pode-se dizer que as maiores densidades favore-
ceram o aumento de produtividade dos genótipos G2 e G7 no local L1, no qual se
obteve produtividades tipicamente maiores. Contrariamente, as maiores densidades
reduziram significativamente a produtividade desses genótipos no local L2, no qual se
obteve produtividades tipicamente menores que em L1;
Não é possı́vel inferir que a densidade do plantio sempre aumentará ou reduzirá a
produtividade. Essa estratégia pode ser eficiente para aumentar significativamente
a produtividade da soja, porém em observância às caracterı́sticas de cada local e de
cada genótipo.

ION Lopes & MCN Oliveira Interpretação de dados 51 / 61


Tab. 22: Produtividade média de oito genótipos de soja em quatro densidades de semeadura
em dois locais.
Densidade Média
Local Genótipo
D1 D2 D3 D4 (D/G)
1 AB 4558 ab B *4190 b AB 4979 abc A 5421 ab 4787 b
2 B 2837 d AB *3573 bc A 4165 bcd A 4559 bc 3784 c
3 A *3417 bcd A *3386 bc A *3846 bcd A 4329 bc 3744 c
4 A *3680 abcd A *4158 b A 4304 bcd A 3598 cd 3935 c
L1 5 A *4212 abc A 4075 bc AB 3698 d B *2821 d *3701 c
6 A *3218 cd A *2864 c A *3751 cd A *3529 cd *3341 c
7 B 4591 ab A 6255 a A 6008 a A 5884 a 5684 a
8 A 4845 a A 4324 b A 5094 ab A 4694 abc 4740 b
Média B 3920 b AB 4103 ab A 4481 a A 4354 a A 4214
1 A 2881 b A *3587 a A 3713 a A 3228 ab 3352 ab
2 A 4286 a B *2915 a B 2983 a B 2831 ab 3254 ab
3 A *2663 b A *3162 a A *3147 a A 2737 b 2927 b
4 A *3280 ab A *3434 a A 3038 a A *3545 ab 3324 ab
L2 5 AB *3602 ab AB 3106 a B 2633 a A 4093 a *3358 ab
6 A *2975 ab A *2925 a A *3069 a A *3008 ab *2994 b
7 A 3758 ab A 4064 a A 3674 a A 3367 ab 3716 a
8 A 3233 ab A 3257 a A 3225 a A 3445 ab 3290 ab
Média A 3335 a A 3306 a A 3185 a A 3282 a B 3277
1 A 3720 ab A 3889 b A 4346 ab A 4324 ab 4070 b
2 A 3559 ab A 3244 bc A 3574 bcd A 3695 bc 3518 cd
3 A 3041 b A 3274 bc A 3497 bcd A 3533 bc 3336 cd
4 A 3480 ab A 3796 b A 3671 bcd A 3572 bc 3630 bc
Média 5 A 3907 ab A 3591 bc A 3165 d A 3457 bc 3530 cd
(G/D) 6 A 3096 b A 2895 c A 3410 cd A 3269 c 3167 d
7 B 4174 a A 5159 a AB 4841 a AB 4630 a 4701 a
8 A 4039 a A 3791 b A 4159 abc A 4070 abc 4015 b
Média A 3627 A 3705 A 3833 A 3819 3746
*Genótipos que diferiram significativamente entre locais. Letras maiúsculas na horizontal indicam os resultados de
comparações entre densidades para cada cultivar em cada local; letras minúsculas na vertical indicam os resultados das
comparações entre cultivares em cada densidade, em cada local. Interpretação semelhante se aplica às médias marginais.
Letras iguais indicam médias que não diferiram entre si (Tukey, p ≤ 0, 05).
ION Lopes & MCN Oliveira Interpretação de dados 52 / 61
Por último, disculta os detalhes - do mais geral para o mais especı́fico
Devido a forte interação dos fatores densidade de plantio e genótipo com o local nesse
estudo, as discussões de interações duplas podem ser de pouco valor prático. No
entanto, pode-se dizer:
▸ A produtividade média do genótipo G7 foi significativamente maior, na média
dos dois locais, em todas as densidade de plantio e na média das quatro
densidades;
▸ O manejo na densidade de plantio afetou significativamente a produtividade
apenas do genótipo G7, na médias dos dois locais;
▸ No local L1, considerando a média das densidades, os cultivares foram separa-
dos em três grupos de produtividade: G7 (a), G1 e G8 (b) e demais (c);
▸ No local L2, considerando a média das densidades, os genótipos G2 a G6 e
G8, obtiveram as produtividades mais altas (a) embora tenham sido os menos
produtivos no local L1;
▸ ...

Em média, os genótipos G5 e G6 foram os mais sensı́veis à variação de local;


...
Não basta relatar os resultados, uma vez que eles estão expostos na figura e na tabela, procure

interpretar agronomicamente os resultados obtidos; considere as caracterı́sticas dos solos, as

condições edafoclimáticas e todos os demais aspectos relevantes e possivelmente contrastantes

entre os dois locais.


ION Lopes & MCN Oliveira Interpretação de dados 53 / 61
1 Introdução

2 Fundamentos da Estatı́stica Experimental

3 Interpretação de dados

4 Considerações finais
Considerações finais
A interpretação agronômica deve ser fundamentada na interpretação
estatı́stica. No entanto, a relevância agronômica de um estudo depende
das evidências de reproducibilidade dos resultados obtidos, e das perspec-
tivas que o conhecimento gerado oferece;

Um estudo não visa apresentar uma conclusão definitiva para a hipótese


cientı́fica e sim acrescentar conhecimento ao problema sob investigação;

Portanto, se o teste estatı́stico indicou que não há evidência quantitativa


de que os tratamentos possuem efeitos diferentes, dedique um tempo
para entender se houve uma razão biológica para tal conclusão ou se
ocorreu a interferência de outros fatores não controlados no experimento;

Um planejamento experimental adequado, junto a um estatı́stico, pode


reduzir problemas adversos, normalmente inerentes a caracterı́sticas
especı́ficas do problema agronômico em estudo.

ION Lopes & MCN Oliveira Interpretação de dados 55 / 61


“A ciência avança por corroboração - quando pesquisadores verificam os
resultados uns dos outros. A ciência avança mais rápido quando as pessoas
desperdiçam menos tempo seguindo falsas direções”.

Challenges in irreproducible research


Desafios da pesquisa irreprodutı́vel
https://www.nature.com/collections/prbfkwmwvz

ION Lopes & MCN Oliveira Interpretação de dados 56 / 61


Referências I
[1] L. L. Bhering, C. D. Cruz, E. S. De Vasconcelos, A. Ferreira, and M. F. R. De Resende.
Alternative methodology for Scott-Knott test.
Crop Breeding and Applied Biotechnology, 8(1):9–16, 2008.
[2] L. C. Borges and D. F. Ferreira.
Poder e taxas de erro tipo I dos testes scott-knott, tukey e student-newman-keuls sob
distribuições normal e não normais dos resı́duos.
Revista de Matemática e Estatı́stica (Online), 21(1):67–83, 2003.
[3] D. F. Ferreira., J. A. Muniz, and L. H. de Aquino.
Comparações múltiplas em experimentos com grande número de tratamentos - utilização
do teste de scott-knott.
Ciência e Agrotecnologia, 23(3):745–752, 1999.
[4] J. C. Hsu.
Multiple Comparisons: Theory and Methods.
Chapman & Hall, London, UK, 1st edition, 1996.
[5] L. V. Madden, Knoke J. K., and R. Louie.
Considerations for the use of multiple comparison procedures in phytopathological investi-
gations.
The american Phytopathological Society, 72(8):1015–1017, 1982.

ION Lopes & MCN Oliveira Interpretação de dados 57 / 61


Referências II

[6] J. H. T. Robert G. D. Steel.


Principles and Procedures of Statistics.
McGraw-Hill Book Company, New York, Toronto, London, 1st edition, 1960.
[7] C. S. G. and S. M. R.
A monte carlo study of five pairwise multiple comparison procedures.
Agronomy Journal, 63:940–945, 1971.
[8] C. S. G. and S. M. R.
An evaluation of ten pairwise multiple comparison procedures by monte carlo methods.
American Statistical Association, 68:66–74, 1973.
[9] A. J. Scott and M. Knott.
A cluster analysis method for grouping means in the analysis of variance.
Biometrics, 30(3):507–512, 1974.
[10] W. . L. . Stevens.
Asymptotic regression.
7(3):247–267, 1951.

ION Lopes & MCN Oliveira Interpretação de dados 58 / 61


Obrigada!
ivani.negrao@embrapa.br
Anexo: Precisão, sensibilidade e poder de um teste

Considerando que: VP: Verdadeiro Positivo


Aceitar H0 : Positivo FP: Falso Positivo
Rejeitar H0 : Negativo FN: Falso Negativo
VN: Verdadeiro Negativo

voltar

ION Lopes & MCN Oliveira Interpretação de dados 61 / 61

Você também pode gostar